高中数学北师大版选修12第一章《统计案例》第2课时 回归分析的应用精品学案.docx
- 文档编号:27034747
- 上传时间:2023-06-26
- 格式:DOCX
- 页数:17
- 大小:149.17KB
高中数学北师大版选修12第一章《统计案例》第2课时 回归分析的应用精品学案.docx
《高中数学北师大版选修12第一章《统计案例》第2课时 回归分析的应用精品学案.docx》由会员分享,可在线阅读,更多相关《高中数学北师大版选修12第一章《统计案例》第2课时 回归分析的应用精品学案.docx(17页珍藏版)》请在冰豆网上搜索。
高中数学北师大版选修12第一章《统计案例》第2课时回归分析的应用精品学案
第2课时 回归分析的应用
1.根据线性回归方程,对相关结论进行预测.
2.理解从散点图进行非线性回归分析的意义,掌握如何将非线性回归问题转化为线性回归问题的方法.
3.了解在解决实际问题的过程中寻找更好的模型的方法.
重点:
根据线性回归方程,对相关结论进行预测,探究非线性模型通过变换转化为线性回归模型的方法.
难点:
了解常用函数的图像特点,选择不同的模型建模,并通过相关指数对不同的模型进行比较.
有关法律规定:
香烟盒上必须印上“吸烟有害健康”的警示语,那么吸烟和健康之间有因果关系吗?
每一个吸烟者的健康问题都是由吸烟引起的吗?
你认为“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法对吗?
要回答这个问题,我们先来一起学习本节的知识吧!
问题1:
相关系数的概念及相关系数r的性质
相关系数r用来描述线性相关关系的强弱,且样本相关系数
r==
=.
r有如下性质:
(1)|r|≤ 1 ;
(2)|r|越接近于1,误差Q越小,x,y的线性相关程度越 强 ;
(3)|r|越接近于0,误差Q越大,x,y的线性相关程度越 弱 ;
(4)当r>0时,称两个变量 正相关 ;当r<0时,称两个变量 负相关 ;当r=0时,称两个变量线性 不相关 .
问题2:
在回归分析中,通过模型计算预测变量的值时,应注意的问题.
(1)回归方程只适用于我们 所研究的样本的总体 ;
(2)我们所建立的回归方程一般都有 时间性 ;
(3)样本取值的范围会影响回归方程的 适用范围 ;
(4)不能期望回归方程得到的预测值就是预测变量的 精确值 .
问题3:
几种能转化为线性回归模型的非线性回归模型
(1)幂函数曲线y=axb
作变换u=lny,v=lnx,c=lna,得线性函数 u=c+bv .
(2)指数曲线y=aebx
作变换u=lny,c=lna,得线性函数 u=c+bx .
(3)倒指数曲线y=a
作变换u=lny,c=lna,v=,得线性函数 u=c+bv .
(4)对数曲线y=a+blnx
作变换u=y,v=lnx,得线性函数 u=a+bv .
问题4:
非线性回归问题进行回归分析的方法
(1)若问题中已给出经验公式,这时可以将解释变量进行 交换(换元) ,将变量的 非线性关系 转化为 线性 关系,将问题化为 线性回归分析 问题来解决.
(2)若问题中没有给出经验公式,需要我们画出已知数据的 散点图 ,通过与各种函数(如指数函数、对数函数、幂函数等)的图像 作比较 ,选择一种与这些散点拟合得最好的函数,然后采用适当的 变量交换 ,将问题化为 线性回归分析 问题来解决.
从以下几个方面认识相关关系:
(1)相关关系与函数关系不同.函数关系中的两个变量间是一种确定性关系;相关关系是一种非确定性关系.
(2)函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.
相关关系在现实生活中大量存在,从某种意义上讲,函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.因此研究相关关系,不仅可以使我们处理更为广泛的数学应用问题,还可以使我们对函数关系的认识上升到一个新的高度.
一般情况下,在尚未断定两个变量之间是否具有线性相关关系的情况下,应先进行相关性检验,在确认其具有线性相关关系后,再求其回归直线方程;由部分数据得到的回归直线,可以对两个变量间的线性相关关系进行估计,这实际上是将非确定性的相关关系问题转化成确定性的函数关系问题进行研究.由于回归直线将部分观测值所反映的规律性进行了延伸,它在情况预测、资料补充等方面有着广泛的应用.
1.下列两个变量之间的关系不是函数关系的是( ).
A.角度和它的余弦值
B.正方形的边长和面积
C.正n边形的边数和各内角度数之和
D.人的年龄和身高
【解析】函数关系就是一种变量之间的确定性的关系,A,B,C三项都是函数关系,它们的函数表达式分别为f(θ)=cosθ,g(a)=a2,h(n)=nπ-2π.D项不是函数关系,对于年龄确定的人群,仍可以有不同的身高,故选D.
【答案】D
2.为了表示n个点与相应直线在整体上接近程度,我们常用( )表示.
A.(yi-y) B.(yi-)
C.(yi-y)2D.(yi-)2
【解析】由回归直线方程y=a+bx,可知y为一个量的估计量,而yi为它的实际值,在最小二乘法中[yi-(a+bx)]2,即(yi-y)2,故选C.
【答案】C
3.在一次实验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则y与x之间的回归直线方程为 .
【解析】因为A,B,C,D四点都在直线y=x+1上,故填y=x+1.
【答案】y=x+1
4.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:
船员人数=9.1+0.006×吨位.
(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?
(2)估计最小的船的船员数和最大的船的船员数.
【解析】
(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,即船员平均相差6人.
(2)9.1+0.006×192=10.252,估计最小的船的船员数为10.
9.1+0.006×3246=28.576,估计最大的船的船员数为28.
利用公式,确定回归直线方程
某5名学生的数学和化学成绩如下表:
学生
学科
A
B
C
D
E
数学成绩(x)
88
76
73
66
63
化学成绩(y)
78
65
71
64
61
(1)画出散点图;
(2)求化学成绩(y)对数学成绩(x)的回归直线方程.
【方法指导】熟记公式,根据表格计算公式中所需的各种数据.
【解析】
(1)散点图(略).
(2)=73.2,=67.8,xiyi=25054,=27174,
所以b==≈0.625.
a=-b=67.8-0.625×73.2=22.05.
所以y对x的回归直线方程为y=0.625x+22.05.
【小结】利用公式求解时应注意以下几点:
①求b时应先求出,,xiyi,,再由a=-b求a的值,并写出回归直线方程.②线性回归方程中的截距a和斜率b都是通过样本估计而来,存在着误差,这种误差可能导致预测结果的偏差.③回归直线方程y=a+bx中的b表示x增加1个单位时y的变化量为b,而a是不随x的变化而变化的量.④可以利用回归直线方程y=a+bx预测在x取某一个值时,y的估计值.
根据回归直线方程,对结果进行分析或预测
从某大学中随机选取8名女大学生,其身高和体重数据如下表:
编号
1
2
3
4
5
6
7
8
身高/cm
165
165
157
170
175
165
155
170
体重/kg
48
57
50
54
64
61
43
59
求根据女大学生的身高预测体重的回归方程,并预测一名身高为172cm的女大学生的体重.
【方法指导】可以计算出r≈0.798.这表明体重与身高有较强的线性相关关系,从而可以建立身高和体重的线性回归方程,根据身高和体重的线性回归方程,由身高预测体重.
【解析】由于问题中要求根据身高预测体重,因此选取身高为自变量x,体重为因变量y.作出散点图(如图).
从图中可以看出,样本点呈条状分布,身高和体重有较强的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系,根据公式,可以得到b≈0.848,a≈-85.712.于是得到回归方程y=0.848x-85.712.
因此,对于身高172cm的女大学生,由回归方程可以预测其体重为y=0.848×172-85.712=60.144kg.
【小结】解析中b=0.848是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.848kg,这表明体重与身高具有正的线性相关关系.尽管身高172cm的女大学生的体重不一定是60.144kg,但一般可以认为她的体重接近60.144kg.
可线性化的非线性回归问题
一只红铃虫的产卵数y和温度x之间的7组观测数据列于下表:
温度x/℃
21
23
25
27
29
32
35
产卵数y/个
7
11
21
24
66
115
325
试建立y与x之间的回归方程,并预测温度为28℃时产卵数目.
【方法指导】作出散点图(或根据已知的散点图)分析欲采用较为恰当的拟合曲线,用换元法转化成线性关系再进行回归分析.
【解析】选择变量,画散点图.
在散点图中,根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线y=c1的周围,其中c1和c2是待定参数.即问题变为如何估计待定参数c1和c2.我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.这样,就可以利用线性回归模型来建立y和x之间的非线性回归方程了.
由已知表的数据可以得到变换后的样本数据表(下表):
x
21
23
25
27
29
32
35
z
1.946
3.398
3.045
3.178
4.190
4.745
5.784
下图给出了表中数据的散点图.从图中可以看出,变换后的样本点分布在一条直线附近,因此可以用线性回归方程来拟合.
由表中的数据得到线性回归方程z=0.242x-2.884.
相关系数r≈0.953.
因此红铃虫的产卵数对温度的非线性回归方程为y=e0.242x-2.884.
当x=28℃时,y≈49.
预测当气温为28℃时,产卵数为49个.
综上所述,在本题中指数函数模型比一元线性模型、二次函数模型有更好的拟合效果.
【小结】对于给定的样本点(x1,y1),(x2,y2),…,(xn,yn),其中a和b都是未知参数.应先根据散点图或利用相关系数r判断两变量间是否存在线性相关关系,若两变量线性相关性显著,采用例1的方法进行线性回归分析;若两变量线性相关性不显著,则可采用例2的方法和步骤进行拟合效果分析.
在某种产品表面进行腐蚀线实验,得到腐蚀深度y与腐蚀时间t之间对应的一组数据:
时间t(s)
5
10
15
20
30
40
50
60
70
90
120
深度y(μm)
6
10
10
13
16
17
19
23
25
29
46
试求腐蚀深度y对时间t的回归直线方程.
【解析】经计算可得相关系数r≈0.982,所以可以认为y与t之间有较强的线性相关关系.
≈46.36,≈19.45,=36750,=5422,tiyi=13910.
b==≈0.3.
a=-b=19.45-0.3×46.36≈5.542.
故所求的回归直线方程为y=0.3t+5.542.
一机器可以按各种不同的速度运转,其生产物件有一些会有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:
转/秒),用y表示每小时生产的有缺点物件个数,现观测得到(x,y)的4组观测值为(8,5),(12,8),(14,9),(16,11).
(1)假定y与x之间有线性相关关系,求y对x的回归直线方程;
(2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒.(精确到1转/秒)
【解析】
(1)设回归直线方程为y=bx+a,=12.5,=8.25,=660,xiyi=438.
于是b===,a=-b=8.25-×12.5=-×=-.
故所求的回归直线方程为y=x-.
(2)由y=x-≤10,得x≤≈15,
即机器速度不得超过15转/秒.
为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:
天数x/天
1
2
3
4
5
6
繁殖个数y/个
6
12
25
49
95
190
(1)用天数x作解释变量,繁殖个数y作预测变量,作出这些数据的散点图;
(2)建立解释变量x与预测变量y之间的回归方程.
【解析】
(1)所作散点图如图所示.
(2)由散点图看出样本点分析在一条指数函数y=c1的周围,于是令z=lny,则x、z数据如下表格,
x
1
2
3
4
5
6
z
1.79
2.48
3.22
3.89
4.55
5.25
由计算器得z=0.69x+1.112,r≈0.9999,则有y=e0.69x+1.112.
1.给定x与y的一组样本数据,求得相关系数r=-0.990,
则( ).
A.y与x不相关 B.y与x非线性相关
C.y与x正相关D.y与x负相关
【解析】因为r<0,故选D.
【答案】D
2.下列两个变量之间的关系不是函数关系的是( ).
A.角度和它的正切值
B.人的右手一柞长和身高
C.正方体的棱长和表面积
D.真空中自由落体运动物体的下落距离和下落时间
【解析】由正切函数y=tanx知A是函数关系;人的右手一柞长和身高不是确定的关系,故B不是函数关系;设正方体的棱长为a,则它的表面积S=6a2,C是函数关系;由物理知识知,自由落体运动物体的下落距离h和下落时间t满足h=gt2(t>0),D是函数关系.
【答案】B
3.已知回归直线的方程为y=2-2.5x,则当x=25时,y的估计值是 .
【解析】将x=25代入方程得y=2-2.5×25=-60.5.
【答案】-60.5
4.某市统计1994~2004年在校中学生每年高考考入大学的百分比,把农村、县镇、城市分开统计,为了便于计算,把1994年编号为0,1995年编号为1,…,2004年编号为10,如果把每年考入大学的百分比作为统计变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线,城市:
y=9.50+2.54x;县镇:
y=6.76+2.32x;农村:
y=1.80+0.42x.
(1)对于农村学生来讲,系数等于0.42意味着什么?
(2)在这一阶段,哪里的大学入学率增长最快?
【解析】
(1)对于农村学生来讲,系数等于0.42意味着1994~2004年在校中学生每年高考考入大学的百分比逐年增加0.42.
(2)在这一阶段,城市的大学入学率增长最快.
(2011年·山东卷)某产品的广告费用x(万元)与销售额y(万元)的统计数据如下表:
广告费用x(万元)
4
2
3
5
销售额y(万元)
49
26
39
54
根据上表可得回归方程y=bx+a中的b为9.4,据此模型预测广告费用为6万元时销售额为( ).
A.63.6万元B.65.5万元
C.67.7万元D.72.0万元
【解析】由表可计算==,==42,因为点(,42)在回归直线y=bx+a上,且b为9.4,所以42=9.4×+a,解得a=9.1,故回归方程为y=9.4x+9.1,将x=6代入方程得y=65.5,选B.
【答案】B
1.观察两个变量(存在线性相关关系)的数据如下:
x
-10
-6.99
-5.01
-2.98
3.98
5
7.99
8.01
y
-9
-7
-5
-3
4.01
4.99
7
8
则两变量间的线性回归方程为( ).
A.y=x+1 B.y=x
C.y=2x+D.y=x+1
【解析】由于线性回归方程一定经过样本点的中心(,),所以本题只需求出,,然后代入所给选项进行检验,即可得到答案.由表中数据可得=0,=0,只有B项中的方程过点(0,0),故选B.
【答案】B
2.在以下四个散点图中(如图所示),适用于作线性回归的散点图为( ).
A.①②B.①③
C.②③D.③④
【解析】①表示正相关,③表示负相关.
【答案】B
3.若线性回归方程y=a+bx中,b=0,则相关系数r= .
【解析】由b==0,得(xi-)(yi-)=0,所以r==0.
【答案】0
4.某种产品的广告费用支出x(万元)与销售额y(万元)之间有如下的对应数据:
x(万元)
2
4
5
6
8
y(万元)
30
40
60
50
70
(1)求相关系数和回归直线方程;
(2)据此预测广告费用支出为10万元时销售收入y的值.
【解析】
(1)=(2+4+5+6+8)=5,=(30+40+60+50+70)=50,=22+42+52+62+82=145,=302+402+602+502+702=13500,xiyi=1380,r=≈0.919,即两变量间有很强的线性相关关系.
b==6.5,a=-b=50-6.5×5=17.5,故回归直线方程为y=6.5x+17.5.
(2)当x=10时,预测y的值为y=10×6.5+17.5=82.5.
5.已知对一组观测值(xi,yi)作出散点图后,确定其具有线性相关关系.若对于y=bx+a,求得b=0.51,=61.75,=38.14,则回归直线方程为( ).
A.y=0.51x+6.65B.y=6.65x+0.51
C.y=0.51x+42.30D.y=42.30x+0.51
【解析】y=bx+a过点(,),∴a=-b=38.14-0.51×61.75≈6.65,∴y=0.51x+6.65.
【答案】A
6.炼钢时钢水的含碳量与冶炼时间是( ).
A.确定性关系B.相关关系
C.函数关系D.无任何关系
【解析】解答本题的关键是弄清相关关系的定义及相关关系与函数关系的区别.
【答案】B
7.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的线性相关关系,现取8组观测值,计算得xi=52,yi=228,=478,xiyi=1849,则y与x的回归直线方程是 .(精确到小数点后两位数)
【解析】根据给出的数据可先求=xi=6.5,=yi=28.5,然后代入公式b==≈2.62,从而a=-bx=28.5-2.62×6.5=11.47,所以回归直线方程y=11.47+2.62x.
【答案】y=11.47+2.62x
8.在彩电显影中,由经验可知形成染料光学密度y与析出银的光学密度x的公式为y=A(b<0),现测得试验数据如下:
xi
0.05
0.06
0.25
0.31
0.07
0.10
0.38
0.43
0.14
0.20
0.47
yi
0.10
0.14
1.00
1.12
0.23
0.37
1.19
1.25
0.59
0.79
1.29
试求y对x的回归方程.
【解析】由题意知,对于给定的公式y=A(b<0)两边取自然对数,得lny=lnA+.
与线性回归方程相对照可以看出,只要令u=,v=lny,a=lnA,就有v=a+bu.这是v对u的线性回归方程,对此再套用相关系数公式,求回归系数a和b.
题目中所给的数据由变量置换u=,v=lny,变为如下所示的数据:
ui
20.000
16.667
4.000
3.226
14.286
10.000
vi
-2.303
-1.966
0
0.113
-1.470
-0.994
ui
2.632
2.326
7.143
5.000
2.128
vi
0.174
0.223
-0.528
-0.236
0.255
可以求出|r|≈0.998.
可知u与v具有很强的线性相关关系.
再求出b≈-0.146,a≈0.548,所以v=0.548-0.146u,
把u和v置换回来,得lny=0.548-,
所以y==e0.548·≈1.73,
所以y对x的回归方程为y=1.73.
9.一唱片公司预测支出费用x(十万元)与唱片销售量y(千张)之间的关系,从其所发行的唱片中随机抽选了10千张,得到如下的资料:
xi=28,=303.4,yi=75,=598.5,xiyi=237,则y与x的相关系数r的绝对值为 .
【解析】根据公式,得相关系数
r=
==0.3,
所以|r|=0.3.
【答案】0.3
10.测得某国10对父子身高(单位:
英寸)如下:
父亲身高(x)
60
62
64
65
66
67
68
70
72
74
儿子身高(y)
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
(1)对变量y与x进行相关性检验;
(2)如果y与x之间具有线性相关关系,求回归方程;
(3)如果父亲的身高为73英寸,估计儿子的身高.
【解析】
(1)=66.8,=67.01,=4462.24,=44974,=4490.3401,=44941.93,xiyi=44842.4,
r=
=
=≈0.98,所以y与x之间具有很强的线性相关关系.
(2)设回归方程为y=bx+a.由b===≈0.4646,
a=-b=67.01-0.4646×66.8≈35.97.故所求的回归方程为y=0.4646x+35.97.
(3)当x=73时,y=0.4646×73+35.97≈69.9,所以当父亲的身高为73英寸时,估计儿子的身高为69.9英寸.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计案例 高中数学北师大版选修12第一章统计案例第2课时 回归分析的应用精品学案 高中数学 北师大 选修 12 第一章 统计 案例 课时 回归 分析 应用 精品