2020年高考数学卷中,还有这些流行病与统计学知识点!
2020年7月10日下午17:00,随着北京地区最后一场地理科目考试结束, 2020年全国普通高考正式落下帷幕。受此次新冠病毒肺炎疫情影响,2020年高考备受关注,报考考生数量继2008年峰值后再创历史新高,达到了1071万。由于疫情原因,学校延迟开学,高三学子无法按时返回学校正常学习,3月31日国家教育部宣布将高考延期一个月,为考生们争取了更多的备考时间。
每年的高考题目,或多或少都会引入当年发生的重大热点事件,今年的高考也不例外,“新冠肺炎”的话题在各科的考试题目中以不同的形式出现,除了大家热议的高考语文作文题目外,全国多套数学卷中也多次以“新冠肺炎疫情”为背景,将流行病学和卫生统计学的概念和知识渗透其中,今天小咖就为大家来盘点一下,在2020年高考数学卷中,那些被cue到的流行病与统计学知识点。
题1
全国II卷理科数学第3题
在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单配货,由于订单量大幅增加,导致订单积压,为解决困难,许多志愿者踊跃报名参加配货工作。已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05。志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者:
A.10名
B.18名
C.24名
D.32名
解析:B
这一题以“新冠肺炎防控期间超市订单积压”的问题为出发点,要求考生解决“至少需要多少志愿者能够帮忙完成订单配合任务”,看上去它只是一个“需求解决型”的问题,但实际上命题人在题目中暗藏玄机。
我们再仔细看一下题干中的说明,有2处都明显提到“概率”这个词:“预计第二天的新订单超过1600份的概率为0.05”、“第二天完成积压订单及当日订单的配货的概率不小于0.95”。
看到“0.05”和“0.95”是不是会感到特别亲切呢,我们在进行假设检验时常常设定检验标准α=0.05,检验结果P值常常要和0.05进行比较,计算区间估计值常常是95%的可信区间,其实这些都是用到了统计学中的一个非常重要的基本概念--“概率”。
概率反映的是事件发生可能性的大小,用P表示,当P=1时表示事件必然发生,当P=0时表示事件不可能发生。我们在进行假设检验时,其中一个很重要的思想就是“小概率事件”,通常我们定义发生概率P≤0.05的事件为小概率事件,即可以认为该事件发生的可能性很小,几乎为零。
再回到本题题目中,“预计第二天的新订单超过1600份的概率为0.05”,意思就是说第二天新订单超过1600份的概率很小,基本上不可能超过1600份,即可以假定新订单最大量为1600份;“第二天完成积压订单及当日订单的配货的概率不小于0.95”,意思就是说第二天基本能够保证将积压订单及当日订单的配货任务全部完成。所以不要为0.05和0.95所误导,理解了这两句话真正隐藏的含义,才是本题解题的关键所在。
有了上面的理论基础,我们假设需要志愿者x名,则志愿者每天可以完成的订单配货量为50x,加上超市自身每天能完成1200份订单配货,故每天可完成的订单总量为1200+50x。又已知积压订单500份,第二天新订单最大量为1600份,故第二天待处理的订单最大量为500+1600=2100份。因此,要确保第二天能够处理全部订单,则方程式为1200+50x ≥ 2100,可以求出x≥18人,答案选B。
题2
全国III卷理科数学第4题
A.60
B.63
C.66
D.69
解析:C
在流行病学研究中进行疾病病因分析时,当结局变量为最常见的二分类变量时,我们常常选用Logistic回归分析方法,Logistic回归模型的函数为:
其中,Z=β0+β1X1+...+βmXm,β0为截距项,β1、…、βm为回归系数。
从Logistic回归模型的函数可以看出,Logistic回归模型是一个概率型非线性回归模型,当Z从-∞到+∞之间变化时,P在区间[0,1]之间变化,图像如图1所示。
图1. Logistic回归模型函数图形
本题题目以“某地区新冠肺炎累计确诊病例数随时间的变化关系”为背景,引出“有学者根据公布数据建立了新冠肺炎累计确诊病例数的Logistic回归模型”,小咖也根据国家卫健委官方公布的数据,绘制了新冠肺炎疫情1月14日至3月14日这2个月来全国累计确诊病例的变化趋势,如图2所示(注:2月12日因湖北省对既往疑似病例开展了排查并对诊断结果进行了订正,对新就诊患者按照新的诊断分类进行诊断,故当日报告的确诊病例数量较前一日激增)。可以看出,新冠肺炎累计确诊病例图形的确与Logistic回归模型的函数图形非常相似,适宜建立累计确诊病例数随时间变化的Logistic回归模型。
图2、全国新冠肺炎累计确诊病例数
题3
全国新高考I卷数学第6题
基本再生数R0与世代间隔T是新冠肺炎的流行病学基本参数。基本再生数指一个感染者传染的平均人数,世代间隔指相邻两代间传染所需的平均时间。在新冠肺炎疫情初始阶段,可以用指数模型I(t)=ert:描述累计感染病例数I(t)随时间t (单位:天)的变化规律,指数增长率r与R0、T近似满足R0=1+rT,有学者基于已有数据估计出R0=3.28。据此,在新冠肺炎疫情初始阶段,累计感染病例数增加1倍需要的时间约为(In2≈0.69)
A.1.2天
B.1.8天
C.2.5天
D.3.5天
解析:B
在这个题目中命题人引入了在流行病动力学领域中一个非常重要的参数:“基本再生数R0”,它是指在自然条件下,即在没有任何干预措施的情况下,病毒在一个全部是易感人群的环境中自由传播,由一个患者或病毒携带者平均可以传染的人数。
在疫情爆发初期,R0通常>1,正如题目中所估计的R0=3.28,表示平均一个患者可以传染3.28人,说明疫情早期在未采取有效防控措施时,病毒的传播性还是很强的。当R0<1时,即一个患者传染的人数不到1个人时,此时病毒就不太可能再传播起来了,我们采取各种防控措施,目的就是为了努力让R0降到1以下,因此R0可以作为疫情防控的一个重要的参考指标。
在上一个题目中,建立累计确诊病例数随时间的变化关系模型时采用的是Logistic回归模型,而在这一个题目中,关注的是疫情初始阶段累计确诊病例数随时间的变化关系,采用的是指数模型。对于流行病学研究中的时间序列数据,指数模型也是经常用到的分析方法,指数模型的函数图如图3所示。
图3、以e为底的指数模型函数图形
以图2为基础,我们可以看到,在新冠肺炎疫情初始阶段,确诊病例迅速增加,从1月14日至2月7日,累计确诊病例数随时间的变化图形与指数模型的函数图形非常相似,如图4所示。因此我们可以基于指数函数,估算在新冠肺炎疫情初始阶段累计感染病例数增加1倍需要的时间。
图4、疫情初始阶段全国新冠肺炎累计确诊病例数
首先根据题目中给出的指数增长率r与基本再生数R0、世代间隔T的关系式:R0=1+rT,已知R0=3.28,T=6,可以求出指数增长率r =0.38。然后根据题目中给出的累计感染病例数I(t) 随时间t变化的指数模型I(t)=ert,当累计感染病例数增加1倍,即I(t)=2时,带入到指数模型中得出方程式2=e0.38t,可以求出t=1.8天,答案选B。
“生于非典,考于新冠,天降大任,注定不凡”,在这不个平凡的2020年,祝愿所有在学海中乘风破浪的考生们,都能如愿考上自己心仪的大学,未来已来,后浪可期!
更多阅读
关注医咖会,及时获取最新统计教程
点击左下角“阅读原文”,查看全部免费统计教程。或者使用电脑打开网址:http://www.mediecogroup.com/,分类查看全部统计教程。
快加小咖个人微信(xys2019ykh),拉你进统计讨论群和众多热爱研究的小伙伴们一起交流学习。