高中数学《4.3.1 一元线性回归模型》微课精讲+知识点+教案课件+习题
知识点:
线性回归方程
这个直线方程
视频教学:
练习:
1.根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系, 这种方法称为()。
A.回归分析
B.相关分析
C.假设分析
D.散点图
2.在回归分析中,( )可以用描述因变量如何依赖自变量和误差项的方程来表示。
A.样本回归线
B.回归模型
C.估计方程
D.经验方程
3.
在一元线性回归方程 y1=B0+B1x1 中,模型参数 B1 表示()。
A.当 x=O 时,y 的期望值
B.当 x 变动 1 个单位时,y 的变化总量
C.当 y 变动 1 个单位时,x 的平均变化量
D.当 x 变动 1 个单位时,y 的平均变化量
4.
从回归方程 y=6.2-0.8x 可以得出( )。
A.x 每增加 1 个单位,y 增加 0.8 个单位
B.x 每增加 1 个单位,y 减少 0.8 个单位
C.x 每增加 l 个单位,y 平均增加 0.8 个单位
D.x 每增加 l 个单位,y 平均减少 0.8 个单位
5.一元线性回归模型拟合效果的测度方法是()。
A.相关系数
B.决定系数
C.方差系数
D.基尼系数
6.下列决定系数的取值中,说明回归模型拟合效果最好的是()。
A.0.983
B.0.125
C.0.764
D.0.836
7.
关于 y1=B0+B1x1 这个式子说法正确的有()。
A 这是 y 对 x 的一元线性回归方程
B.式中 B0、B1 是两个未知常数
C.B1 表示直线在 y 轴上的截距
D.B0 为直线的斜率
E.B0,B1 一旦确定这条直线也就唯一确定了
8.
一般情况下,使用估计的回归方程之前,需要对模型进行的检验有( )。
A.分析回归系数的经济含义是否合理
B.分析变量之间相关的方向
C.分析估计的模型对数据的拟合效果如何
D.分析变量之间相关的程度
E.对模型进行假设检验
课件:
教案:
【学习目标】
1.通过回归直线方程及相关关系的学习,体会数学建模与直观想象的素养。
2.借助回归直线方程的求法,培养数学运算的素养。
【学习重难点】
1.了解变量间的相关关系。(易混点)
2.会根据散点图判断数据是否具有相关关系。(重点)
3.了解最小二乘法的思想,会求回归直线方程,掌握回归方程的性质。(重点、难点)
【学习过程】
一、新知初探
1.相关关系
如果两个变量之间确实有一定的关系,但没有达到可以互相决定的程度,它们之间的关系带有一定的随机性,像这样两个变量之间的关系,统计学上都称为相关关系。
2.线性相关
(1)散点图
一般地,如果收集到了变量x和变量y的n对数据(简称为成对数据),如下表所示。
序号i | 1 | 2 | 3 | … | n |
变量x | x1 | x2 | x3 | … | xn |
变量y | y1 | y2 | y3 | … | yn |
则在平面直角坐标系xOy中描出点(xi,yi),i=1,2,3,…,n,就可以得到这n对数据的散点图。
(2)线性相关:如果由变量的成对数据、散点图或直观经验可知,变量x与变量y之间的关系可以近似地用一次函数来刻画,则称x与y线性相关。
(3)正相关和负相关
若x与y线性相关,如果一个变量增大,另一个变量大体上也增大,则称这两个变量正相关;如果一个变量增大,另一个变量大体上减少,则称这两个变量负相关。
3.回归直线方程
(1)一般地,已知变量x与y的n对成对数据(xi,yi),i=1,2,3,…,n。任意给定一个一次函数y=bx+a,对每一个已知的xi,由直线方程可以得到一个估计值^i=bxi+a,
如果一次函数^=^x+^能使取得最小值,则^=^x+^称为y关于x的回归直线方程(对应的直线称为回归直线)。因为是使得平方和最小,所以其中涉及的方法称为最小二乘法。
^=--^-。
-=1n(x1+x2+…+xn)=1n∑ni=1xi;
-=1n(y1+y2+…+yn)=1n∑ni=1yi。
4.回归直线方程:^=^x+^的性质
(1)回归直线一定过点(-,-)。
(2)回归系数^的实际意义
①^是回归方程的斜率;
②当x增大一个单位时,^增大。
二、初试身手
1.思考辨析(正确的打“√”,错误的打“×”)
(1)相关关系是两个变量之间的一种确定的关系。 ( )
(2)回归直线方程一定过样本中心点。 ( )
(3)选取一组数据的部分点得到的回归方程与由整组数据得到的回归方程一定相同。 ( )
(4)根据回归直线方程得到的结论一定是可靠的。 ( )
2.下列两个变量具有正相关关系的是( )
A.正方形的面积与边长
B.吸烟与健康
C.数学成绩与物理成绩
D.汽车的重量与汽车每消耗1 L汽油所行驶的平均路程
3.已知x与y之间的一组数据。
x | 0 | 1 | 2 | 3 |
y | 1 | 3 | 5 | 7 |
若y与x线性相关,则y与x的回归直线^=^x+^必过点( )
A.(2,2) B.(1.5,0)
C.(1,2) D.(1.5,4)
4.已知回归直线的斜率的估计值是1.23,且过定点(4,5),则线性回归方程是________。
三、合作探究
类型1 | 变量间相关关系的判断 |
【例1】(1)下列关系中,属于相关关系的是________。(填序号)
①扇形的半径与面积之间的关系;
②农作物的产量与施肥量之间的关系;
③出租车费与行驶的里程;
④降雪量与交通事故的发生率之间的关系。
(2)某种产品的广告费支出x与销售额y之间有如下对应数据(单位:百万元)。
x | 2 | 4 | 5 | 6 | 8 |
y | 30 | 40 | 60 | 50 | 70 |
①画出散点图;
②从散点图中判断销售金额与广告费支出成什么样的关系?
类型2 | 求回归直线方程 |
【例2】下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对应数据。
x | 3 | 4 | 5 | 6 |
y | 2.5 | 3 | 4 | 4.5 |
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程^=^x+^;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)
类型3 | 回归直线方程的性质及应用 |
【例3】(多选题)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为^=0.85x-85.71,则下列结论中正确的是( )
A.y与x具有正的线性相关关系
B.回归直线过样本点中心(-,-)
C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kg
D.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg
【学习小结】
1.相关关系和函数关系的异同点
(1)相同点:两者均是指两个变量的关系。
(2)不同点:函数关系是一种确定的关系,而相关关系是一种非确定的关系。
2.判断变量之间有无相关关系,一种简便可行的方法就是绘制散点图。根据散点图,可以很容易看出两个变量是否具有相关关系,是不是线性相关,是正相关还是负相关。
3.回归方程必过点(-,-)。利用回归方程,我们可以进行估计和预测,若回归方程为^=^x+^,则在x=x0处的估计值为^0=^x0+^。
【精炼反馈】
1.以下四个散点图中,两个变量的关系适合用线性回归模型刻画的是( )
① ② ③ ④
A.①② B.①③
C.②③ D.③④
2.由变量x与y相对应的一组数据(1,y1),(5,y2),(7,y3),(13,y4),(19,y5)得到的线性回归方程为^=2x+45,则-=( )
A.135 B.90
C.67 D.63
3.工人工资y(元)与劳动生产率x(千元)的相关关系的回归方程为^=50+80x,下列判断正确的是( )
A.劳动生产率为1 000元时,工人工资为130元
B.劳动生产率提高1 000元时,工人工资平均提高80元
C.劳动生产率提高1 000元时,工人工资平均提高130元
D.当月工资为250元时,劳动生产率为2 000元
4.某地区近10年居民的年收入x与年支出y之间的关系大致符合^=0.8x+0.1(单位:亿元),预计今年该地区居民收入为15亿元,则今年支出估计是________亿元。
5.由某种设备的使用年限xi(年)与所支出的维修费yi(万元)的数据资料算得如下结果,∑5i=1x2i=90,∑5i=1xiyi=112,∑5i=1xi=20,∑5i=1yi=25.
(1)求所支出的维修费y对使用年限x的线性回归方程^=^x+^;
(2)①判断变量x与y之间是正相关还是负相关;
②当使用年限为8年时,试估计支出的维修费是多少?
【学习目标】
1.通过学习相关系数,培养数学运算的素养。
2.借助非线性回归方程的学习,提升数据分析和数学建模的素养。
【学习重难点】
1.了解两个变量间的线性相关系数r,并能利用公式求相关系数r。(重点)
2.能利用相关系数r判断两个变量线性相关程度的大小,从而判断回归直线方程拟合的效果。(重点)
3.掌握非线性回归转化为线性回归的方法,会求非线性回归方程,并作出预测。(难点)
【学习过程】
一、新知初探
1.相关系数
(1)定义:统计学里一般用
来衡量y与x的线性相关性强弱,这里的r称为线性相关系数(简称为相关系数)。
(2)性质
①|r|≤1,且y与x正相关的充要条件是r>0,y与x负相关的充要条件是r<0;
②|r|越小,说明两个变量之间的线性相关性越弱,也就是得出的回归直线方程越没有价值,即方程越不能反映真实的情况;|r|越大,说明两个变量之间的线性相关性越强,也就是得出的回归直线方程越有价值;
③|r|=1的充要条件是成对数据构成的点都在回归直线上。
2.非线性回归方程
如果具有相关关系的两个变量x,y不是线性相关关系,那么称为非线性相关关系,所得到的方程称为非线性回归方程(也简称为回归方程)。
二、初试身手
1.思考辨析(正确的打“√”,错误的打“×”)
(1)若相关系数为0,则说明两变量x,y之间没任何关系。 ( )
(2)两个变量相关系数越大,说明它们的相关性越强。 ( )
(3)求回归方程时,最好用相关系数判断一下,两变量相关性的强弱。
( )
(4)非线性回归方程可借助线性回归方程求得。 ( )
2.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r如下表:
甲 | 乙 | 丙 | 丁 | |
r | 0.82 | 0.78 | 0.69 | 0.85 |
则哪位同学的试验结果体现A,B两变量有更强的线性相关性( )
A.甲 B.乙
C.丙 D.丁
3.在一项调查中有两个变量x和y,下图是由这两个变量近8年来的取值数据得到的散点图,那么适宜作为y关于x的回归方程的函数类型是( )
A.y=a+bx B.y=c+dx
C.y=m+nx2 D.y=p+qcx(q>0)
4.在一次试验中,测得(x,y)的四组值分别为(1,2),(2,0),(4,-4),(-1,6),则y与x的相关系数为________。
三、合作探究
类型1 | 相关系数的性质 |
【例1】(1)在一组数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若这组样本数据的相关系数为-1,则所有的样本点(xi,yi)(i=1,2,…,n)满足的方程可以是( )
A.y=-12x+1 B.y=x-1
C.y=x+1 D.y=-x2
(2)设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线方程的回归系数为^,回归截距是^,那么必有( )
A.^与r的符号相同 B.^与r的符号相同
C.^与r的符号相反 D.^与r的符号相同
类型2 | 相关系数的计算及应用 |
【例2】假设关于某种设备的使用年限x(单位:年)与所支出的维修费用y(单位:万元)有如下统计资料:
x | 2 | 3 | 4 | 5 | 6 |
y | 2.2 | 3.8 | 5.5 | 6.5 | 7.0 |
已知∑5i=1x2i=90,∑5i=1y2i≈140.8,∑5i=1xiyi=112.3,79≈8.9,2≈1.4.
(1)计算y与x之间的相关系数(精确到0.001),并求出回归直线方程;
(2)根据回归方程,预测假设使用年限为10年时,维修费用约是多少万元?
类型3 | 非线性回归方程 |
【例3】某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成。每件产品的非原料成本y(元)与生产该产品的数量x(千件)有关,经统计得到如下数据:
x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
y | 112 | 61 | 44.5 | 35 | 30.5 | 28 | 25 | 24 |
根据以上数据,绘制了散点图。
观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型y=a+bx和指数函数模型y=cedx分别对两个变量的关系进行拟合。已求得用指数函数模型拟合的回归方程为:
^=96.54e-0.2x,ln y与x的相关系数r1=-0.94.
参考数据\a\vs4\al\co1(其中ui=\f(1xi)):
∑8i=1uiyi | - | -2 | ∑8i=1u2i | ∑8i=1yi | ∑8i=1y2i | 0.61×6 185.5 | e-2 |
183.4 | 0.34 | 0.115 | 1.53 | 360 | 22 385.5 | 61.4 | 0.135 |
(1)用反比例函数模型求y关于x的回归方程;
(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本;
(3)该企业采取订单生产模式(根据订单数量进行生产,即产品全部售出)。根据市场调研数据,若该产品单价定为100元,则签订9千件订单的概率为0.8,签订10千件订单的概率为0.2;若单价定为90元,则签订10千件订单的概率为0.3,签订11千件订单的概率为0.7.已知每件产品的原料成本为10元,根据(2)的结果,企业要想获得更高利润,产品单价应选择100元还是90元,请说明理由。
参考公式:对于一组数据(u1,υ1),(u2,υ2),…,(un,υn),其回归直线υ=α+βu的斜率和截距的最小二乘估计分别为:^=∑ni=1)-)-)∑ni=1)u-),^=--^,
相关系数r=∑ni=1)-)-)\b\lc\(\rc\ni=1)u-))2))\b\lc\(\rc\ni=1)υ-))2))
【学习小结】
1.判断变量的相关性通常有两种方式:一是散点图,二是相关系数r,前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱。
2.只有当两变量间呈线性相关关系时,才可以求回归系数,得到回归直线方程^=^x+^;若两变量间的关系不是线性相关关系,应观察分析其散点图,找出拟合函数,通过变量代换把非线性回归问题转化为线性回归问题。
【精炼反馈】
1.两个变量之间的线性相关程度越低,其线性相关系数的数值( )
A.越接近于-1 B.越接近于0
C.越接近于1 D.越小
2.如图所示,给出了样本容量均为7的A,B两组样本数据的散点图,已知A组样本数据的相关系数为r1,B组数据的相关系数为r2,则( )
A.r1=r2 B.r1<r2
C.r1>r2 D.无法判定
3.对于线性相关系数r,叙述正确的是( )
A.r∈(-∞,+∞),且r越大,相关程度越大
B.r∈(-∞,+∞),且|r|越大,相关程度越大
C.r∈[-1,1],且r越大,相关程度越大
D.r∈[-1,1],且|r|越大,相关程度越大
4.若回归直线方程中的回归系数^=0,则相关系数r=________。
5.根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示。
(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);
(2)求y关于x的回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量y约为多少?
附:相关系数公式r=xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\r(\o(∑,\s\up8(n),\s\do6(i=1)) xi-\o(x,\s\up6(-))2)\r(\o(∑,\s\up8(n),\s\do6(i=1)) yi-\o(y,\s\up6(-))2))=∑ni=1)-)-)\o(∑ni=1)x-))2ni=1)y-))2,
参考数据:0.3≈0.55,0.9≈0.95.
回归方程^=^x+^中斜率和截距的最小二乘估计公式分别为:
^=xi-\o(x,\s\up6(-))yi-\o(y,\s\up6(-)),\o(∑,\s\up8(n),\s\do6(i=1)) xi-\o(x,\s\up6(-))2)=∑ni=1)-)-)∑ni=1)x-),^=--^-.
图文来自网络,版权归原作者,如有不妥,告知即删