查看原文
其他

何国飞——例说大数据在独立性检验中的重要性

​何国飞 邹生书数学 2022-08-05
请点击上方蓝色字体“邹生书数学”,订阅本微信公众号;请点击右上角的“”,发送给朋友或分享到朋友圈。

公众号“邹生书数学”创建于2018年8月28日。    

开号宗旨:为热爱学习和研究的高中数学教师和教研员搭建学习交流平台,提升教学能力,促进专业发展。本公众号致力传播数学文化,发表教研成果,交流教学经验,探讨数学问题,展示解题方法,分享教学资源,为服务高中教学作贡献。

邹生书,男,1962年12月出生,本科学历,理学士学位,中学数学高级教师,黄石市高中数学骨干教师。主要从事高中数学教学、高中数学解题研究和探究性学习等。从2007年8月到2018年8月,在《数学通讯》《数学通报》《数学教学》《中学数学》《中学数学教学》等,二十多种学术期刊上发表解题和探究性学习文章300余篇。


公众号“邹生书数学”诚请高中数学教师、教研员和热爱数学的朋友不吝赐稿。来稿请注明真实姓名、工作单位和联系方式,一般只接受word文档格式的电子稿件,文稿请认真审查,防止错漏,确保无误,文责自负。

本公众号对优秀作者和名师一般会附上“作者简介”,以让广大读者更好地了解作者的研究成果和方向,以便进一步学习作者的相关数学思想或解题方法。

投稿邮箱:zoushengshu@163.com;

商务联系:13297228197。

例说大数据在独立性检验中的重要性

广东省云浮市新兴县惠能中学   何国飞


【摘要】独立性检验中变量的相关程度并不是一个常量,它是动态的,它依赖于样本容量的大小,一般来说,样本容量越大,变量的相关程度也越大。

【关键词】独立性检验  相关程度  样本容量   动态 


独立性检验的结论必须要有大数据支撑,即样本容量要够大(一般要求不少于100),所下的结论才更科学,如果样本容量较少,会影响我们的判断.对此,笔者以案例进行说明。

1.直观看,变量相关程度高,公式算,相关程度低

例1假如治疗某种疾病现有两种新药A和B,我们通过抽样数据得到它们的疗效如表1、表2所示,你如何比较两种新药的疗效?


从两个表中可以看出,服用A药后治愈为30%,而服用B药治愈为10%,从经验上看我们能判断出新药A比新药B的疗效好.但是,如果从K2的公式算,结果却不一样,因为

kA<kB,于是又得到相反的结论,新药B比新药A的疗效好.

为什么会出现这种现象呢?是因为A药的样本太少.如果增大样本容量,情况就会完全不同.

一般来说,在大数据下,服用A药后治愈的百分率都是一个稳定的值(这个值也就是它的概率),将抽样容量扩大5倍,为100,得表3,


2.直观看,变量相关程度低,增大数据,相关程度高

例2  为了调查某学校男女生在购买食物时是否看营养说明,抽取了男、女生各20个,共40个样本,得到表4.从数据来看,购买食物时读营养说明,男生比女生少1个,差异较少,我们认为“读营养说明与性别的相关程度”不大.从计算的结果来看,也支持了这个结论,

一般来说,在大数据下,男生或女生在购买食物时读营养说明的百分率会稳定在某个常数.

比如,男女生各抽取400个,共800个样本,并且继续维持表4的比率,即给表4中的每个数乘20,得到表5,那么,


3.变量的相关程度是动态的,它随样本容量的增大而增大

一般来说,在大数据下,变量的占比会稳定在某个常数.为了维持变量的比率不变,即将表6中每一个数扩大n倍,得到数据表7,

因此,变量的相关程度是动态的,它随样本容量的增大而增大.在少数据面前,变量的相关程度是很低的,但是,在大数据下,却有很大的相关性.

【作者简介】何国飞,中学数学高级教师,1964年生,1983年毕业于肇庆师范专科学校,1989年毕业于广东教育学院数学教育本科专业(脱产进修),曾任新兴县第一中学数学科组长,新兴县教育局教研室中学数学教研员,县直属中学副校长,现调到新兴县教师发展中心工作。在《中学数学教学参考》《中学数学教学研究》等刊物发表多篇文章.


邹生书数学

2021年第4季度

最受读者欢迎的49篇解题文章

49.刘耀忠——例析圆锥曲线几何意义的应用

48.高考热点——分段函数中的等高线问题

47.张成凯——圆锥曲线四点共圆问题命题背景研究——由2021年新高考1卷21题所想

45.杨 俊——对抛物线内接三角形外接圆半径最小值问题的深度研究

44.新教材一道易错零点问题的纠错分析

43.庞 鑫——精细解析巧构函数比较大小的“巧”从何而来

42.刘耀忠——例析与双曲线渐近线有关的九种问题

41.刘耀忠——四点向量定理与斯坦纳定理在解题中的应用

40.庞 鑫——例谈构造法求数列通项公式

39.刘耀忠——清华测试立体几何题解法及溯源

38.彭光焰——数学教学中培养学生立体发散思维的实践

37.邹生书——含绝对值的对数不等式的四种解法

36.邹生书——构造函数解三个实数比大小压轴选择题

35.刘耀忠:向量法——不在坐标轴上的点的处理策略

34.彭光焰——谈三角公式应用的教学与学生能力的培养

33.刘耀忠——利用反函数解一类指对方程与不等式问题

32.贺凤梅——直线与圆最值问题的五种求解策略

31.邹生书:一题多构殊途同归   不等式与方程齐飞

30.王安平——反函数法再解“指对不等式”恒成立问题

29.解答一道令人蒙圈的含参分段复合函数零点试题

28.赵志岗——七大途径破解导数中的“指对不等式”

27.张成凯 王文彬:放缩法在数列压轴题中的考查形式举例

26.刘海涛——八省联考数列题的多解、溯源及通法总结

25.邹生书——过定点直线的7个经典问题与解答

24.彭光焰——巧构造   妙解题

23.刘耀忠——九校联考第21题一题多解

22.邓启龙  刘锐  洪一平——2021年数学通讯第11期问题解答

21.邹生书——高考和模拟考中的斐波那契数列问题解析

20.贺凤梅——2019年全国卷I第16题的8种解法

19.刘耀忠——对二次函数拟合问题的一点思考

18.张丽花——例析数列和不等式的两种类型及证明方法

17.邓启龙——由Nesbitt不等式引发的探究

16.洪一平——2021年温州市摇篮杯高一数学竞赛试题逐题解析

16.洪一平——2021年温州市摇篮杯高一数学竞赛试题逐题解析(修正版)

15.彭光焰——追求简单自然的解法

14.胡全勇:一道网红题的多种解法探索

13.张甜甜:一道课本数列例题及变式的多视角求解

12.2022届湖北重点高中联考压轴题解法荟萃

11.贺凤梅:一道求最小值问题的8种解法

10.高振宁:2020年新高考山东卷数学第21题解法研究

9.彭光焰:一道上海竞赛题的五个角度十二种解法

8.邵苏阳——由百校联考圆锥曲线压轴题引发关于三点共线证明之思考

7.余铁青——巧用变更主元法  简解高考数学题

6.邹生书——椭圆参数方程详解2021年全国中学生数学奥林匹克竞赛一试第11题

5.余铁青 邱志权——2021届“结构不良问题”模拟试题归类赏析与命题趋势思考

4.邓启龙——三角形中与角有关的几个等式

3.杨 俊等——实数比大小压轴选择题解法研讨

2.邓启龙——2020年全国Ⅲ卷理科数学第23题的探究与推广

1.杨 俊——加权将军饮马问题的多种解法

公众号邹生书数学

邹生书数学2021年第三季度最受读者欢迎的46篇解题文章

邹生书数学2021年第二季度最受读者欢迎的56篇解题文章

2021年第一季度最受读者欢迎的51篇数学解题文章

2020年9月至2020年12月最受读者欢迎的51篇数学解题文章

20191018—20200618最受读者欢迎的70篇文章链接

20191018—20200424最受读者欢迎的101篇文章链接

投稿邮箱:zoushengshu@163.com;

商务联系:13297228197。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存