何国飞——例说大数据在独立性检验中的重要性
公众号“邹生书数学”创建于2018年8月28日。
开号宗旨:为热爱学习和研究的高中数学教师和教研员搭建学习交流平台,提升教学能力,促进专业发展。本公众号致力传播数学文化,发表教研成果,交流教学经验,探讨数学问题,展示解题方法,分享教学资源,为服务高中教学作贡献。
邹生书,男,1962年12月出生,本科学历,理学士学位,中学数学高级教师,黄石市高中数学骨干教师。主要从事高中数学教学、高中数学解题研究和探究性学习等。从2007年8月到2018年8月,在《数学通讯》《数学通报》《数学教学》《中学数学》《中学数学教学》等,二十多种学术期刊上发表解题和探究性学习文章300余篇。
公众号“邹生书数学”诚请高中数学教师、教研员和热爱数学的朋友不吝赐稿。来稿请注明真实姓名、工作单位和联系方式,一般只接受word文档格式的电子稿件,文稿请认真审查,防止错漏,确保无误,文责自负。
本公众号对优秀作者和名师一般会附上“作者简介”,以让广大读者更好地了解作者的研究成果和方向,以便进一步学习作者的相关数学思想或解题方法。
投稿邮箱:zoushengshu@163.com;
商务联系:13297228197。
例说大数据在独立性检验中的重要性
广东省云浮市新兴县惠能中学 何国飞
【摘要】独立性检验中变量的相关程度并不是一个常量,它是动态的,它依赖于样本容量的大小,一般来说,样本容量越大,变量的相关程度也越大。
【关键词】独立性检验 相关程度 样本容量 动态
独立性检验的结论必须要有大数据支撑,即样本容量要够大(一般要求不少于100),所下的结论才更科学,如果样本容量较少,会影响我们的判断.对此,笔者以案例进行说明。
1.直观看,变量相关程度高,公式算,相关程度低
例1假如治疗某种疾病现有两种新药A和B,我们通过抽样数据得到它们的疗效如表1、表2所示,你如何比较两种新药的疗效?
从两个表中可以看出,服用A药后治愈为30%,而服用B药治愈为10%,从经验上看我们能判断出新药A比新药B的疗效好.但是,如果从K2的公式算,结果却不一样,因为
kA<kB,于是又得到相反的结论,新药B比新药A的疗效好.
为什么会出现这种现象呢?是因为A药的样本太少.如果增大样本容量,情况就会完全不同.
一般来说,在大数据下,服用A药后治愈的百分率都是一个稳定的值(这个值也就是它的概率),将抽样容量扩大5倍,为100,得表3,
2.直观看,变量相关程度低,增大数据,相关程度高
例2 为了调查某学校男女生在购买食物时是否看营养说明,抽取了男、女生各20个,共40个样本,得到表4.从数据来看,购买食物时读营养说明,男生比女生少1个,差异较少,我们认为“读营养说明与性别的相关程度”不大.从计算的结果来看,也支持了这个结论,
一般来说,在大数据下,男生或女生在购买食物时读营养说明的百分率会稳定在某个常数.
比如,男女生各抽取400个,共800个样本,并且继续维持表4的比率,即给表4中的每个数乘20,得到表5,那么,
3.变量的相关程度是动态的,它随样本容量的增大而增大
一般来说,在大数据下,变量的占比会稳定在某个常数.为了维持变量的比率不变,即将表6中每一个数扩大n倍,得到数据表7,
因此,变量的相关程度是动态的,它随样本容量的增大而增大.在少数据面前,变量的相关程度是很低的,但是,在大数据下,却有很大的相关性.
【作者简介】何国飞,中学数学高级教师,1964年生,1983年毕业于肇庆师范专科学校,1989年毕业于广东教育学院数学教育本科专业(脱产进修),曾任新兴县第一中学数学科组长,新兴县教育局教研室中学数学教研员,县直属中学副校长,现调到新兴县教师发展中心工作。在《中学数学教学参考》《中学数学教学研究》等刊物发表多篇文章.
邹生书数学
2021年第4季度
最受读者欢迎的49篇解题文章
47.张成凯——圆锥曲线四点共圆问题命题背景研究——由2021年新高考1卷21题所想
45.杨 俊——对抛物线内接三角形外接圆半径最小值问题的深度研究
22.邓启龙 刘锐 洪一平——2021年数学通讯第11期问题解答
16.洪一平——2021年温州市摇篮杯高一数学竞赛试题逐题解析
16.洪一平——2021年温州市摇篮杯高一数学竞赛试题逐题解析(修正版)
8.邵苏阳——由百校联考圆锥曲线压轴题引发关于三点共线证明之思考
6.邹生书——椭圆参数方程详解2021年全国中学生数学奥林匹克竞赛一试第11题
5.余铁青 邱志权——2021届“结构不良问题”模拟试题归类赏析与命题趋势思考
2.邓启龙——2020年全国Ⅲ卷理科数学第23题的探究与推广
公众号邹生书数学
2020年9月至2020年12月最受读者欢迎的51篇数学解题文章
20191018—20200618最受读者欢迎的70篇文章链接
20191018—20200424最受读者欢迎的101篇文章链接
投稿邮箱:zoushengshu@163.com;
商务联系:13297228197。