其他
统计计量 | 显著性水平究竟是何方神圣?
本文来源:量化研究方法
原文链接:https://towardsdatascience.com/statistical-significance-hypothesis-testing-the-normal-curve-and-p-values-93274fa32687
备择假设:本大学学生的平均睡眠时间低于全国大学生的平均睡眠时间
零假设:本大学学生的平均睡眠时间不低于全国大学生的平均睡眠时间
68%的数据与均值的偏差在± 1个标准差之内
95%的数据与均值的偏差在± 2个标准差之内
99.7%的数据与均值的偏差在± 3个标准差之内
假设检验:用来检验理论的一种技术
正态分布:假设检验中数据的近似表示
p值:如果原假设为真,则出现至少与观测值一样极端的结果的概率
根据国家睡眠基金会的数据,全国的学生平均每晚睡眠7.02小时
在本校对202名学生的调查中,平均每晚睡眠时间为6.90小时,标准差为0.84小时
备择假设是,本校学生的平均睡眠时间低于全国大学生的平均睡眠时间
使用α=0.05,这意味着当p值小于0.05时,结果是显著的
# Calculate the results
z_score = (6.90 - 7.02) / (0.84 / sqrt(202))
p_value = pnorm(z_score)
# Print our results
sprintf('The p-value is %0:5f for a z-score of %0.5f.', p_value, z_score)
"The p-value is 0.02116 for a z-score of -2.03038."
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
欢迎扫描👇二维码添加关注