湘教版高中数学选修12第4章44一元线性回归案例.docx
- 文档编号:25577777
- 上传时间:2023-06-09
- 格式:DOCX
- 页数:15
- 大小:107.40KB
湘教版高中数学选修12第4章44一元线性回归案例.docx
《湘教版高中数学选修12第4章44一元线性回归案例.docx》由会员分享,可在线阅读,更多相关《湘教版高中数学选修12第4章44一元线性回归案例.docx(15页珍藏版)》请在冰豆网上搜索。
湘教版高中数学选修12第4章44一元线性回归案例
4.4
一元线性回归案例
[读教材·填要点]
1.相关系数
(1)定义:
样本量是n的成对观测数据用(x1,y1),(x2,y2),…,(xn,yn)表示,用表示数据x1,x2,…,xn,用表示数据y1,y2,…,yn,用与分别表示和的均值,用sx表示的标准差,用sy表示的标准差,再引入
sxy=-.
当sxsy≠0时,称rxy=为和的相关系数.
①当rxy>0,我们称和正相关;
②当rxy<0,我们称和负相关;
③当rxy=0,我们称和不相关.
(2)性质:
①rxy总在区间[-1,1]中取值;
②当rxy越接近于1时,x增加,y也倾向于增加,这时数据(x1,y1),(x2,y2),…,(xn,yn),分散在一条上升的直线附近;
③当rxy越接近于-1时,x增加,y倾向于减少,这时数据(x1,y1),(x2,y2),…,(xn,yn),分散在一条减少的直线附近.
2.一元线性回归
(1)回归直线方程:
l:
y=bx+a,其中b=,a=-b.
(2)一元线性回归模型:
若样本量n的成对观测数据(x1,y1),(x2,y2),…,(xn,yn)中yi和xi满足关系:
yi=bxi+a+ei,i=1,2,…,n,其中e1,e2,…,en表示随机误差,则称该模型为一元线性回归模型.
[小问题·大思维]
1.|rxy|越接近1,及越接近于0,表示两个变量x与y之间线性相关程度如何?
提示:
|rxy|越接近1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|rxy|越接近0,表明两个变量的线性相关程度越弱,通常|rxy|>0.8时,认为有很强的相关关系.
2.在一元线性回归模型中,变量y由变量x唯一确定吗?
提示:
不唯一.y值由x和随机误差e共同确定,即自变量x只能解释部分y的变化.
3.随机误差e产生的主要原因有哪些?
提示:
随机误差e产生的主要原因有:
(1)所用的确定性函数不恰当引起的误差;
(2)忽略了某些因素的影响;
(3)存在观测误差.
4.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?
为什么?
提示:
不一定是真实值.利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.
相关性检验
在某种产品表面进行腐蚀性刻线实验,得到腐蚀深度Y与腐蚀时间X之间相应的一组观察值,如下表:
X(s)
5
10
15
20
30
40
50
60
70
90
120
Y(μm)
6
10
10
13
16
17
19
23
25
29
46
用散点图及相关系数两种方法判断X与Y的相关性.
[自主解答]
(1)作出如图所示的散点图.
从散点图可看出腐蚀深度Y(μm)与腐蚀时间X(s)之间存在着较强的线性相关关系.
(2)相关系数rxy=,其中
sxy=-=362.562.
sx≈34.5158,
sy≈10.6971.
∴rxy=≈0.98.
显然|rxy|>0.8,所以腐蚀深度Y与腐蚀时间X之间有很强的线性相关关系.
判断两个变量X和Y线性相关的方法:
(1)画出散点图,呈条状分布,则X与Y线性相关.
(2)用公式求出相关系数,据其判断X与Y的相关性.
如果|rxy|>0.8,则有很强的线性相关关系.
1.要分析学生初中升学的数学成绩对高中一年级数学学习有什么影响,在高中一年级学生中随机抽选10名学生,分析他们入学的数学成绩(x)和高中一年级期末数学考试成绩(y)(如表):
编号
1
2
3
4
5
6
7
8
9
10
x
63
67
45
88
81
71
52
99
58
76
y
65
78
52
82
92
89
73
98
56
75
用散点图及相关系数两种方法判断x与y的相关性.
解:
(1)入学成绩(x)与高一期末考试成绩(y)两组变量的散点图(如图),从散点图看,这两组变量具有线性相关关系.
(2)因为=70,=76,
sxy=189.4,sx=15.729,sy=14.339.
由rxy=,得rxy≈0.8398>0.8.
所以x与y有较强的线性关系.
线性回归分析
为了研究某种细菌在特定环境下随时间变化的系列情况,得如下实验数据:
天数t(天)
3
4
5
6
7
繁殖个数y(千个)
2.5
3
4
4.5
6
(1)求y关于t的线性回归方程;
(2)利用
(1)中的回归方程,预测t=8时,细菌繁殖个数.
[自主解答]
(1)由表中数据得=5,=4,yi=108.5,
则Sty=-t=1.7,S=2.
∴b==0.85,a=-b=-0.25,
∴回归方程式为y=0.85t-0.25.
(2)将t=8代入
(1)的回归方程中得
y=0.85×8-0.25=6.55.
故预测t=8时,细菌繁殖个数为6.55千个.
进行线性回归分析的关键是画出样本点的散点图,确定出变量具有线性相关关系,再求出回归直线方程.如果x,y的线性相关关系具有统计意义,就可以用线性回归方程来作预测和控制.
2.某饮料店的日销售收入y(单位:
百元)与当天平均气温x(单位:
摄氏度)之间有下列数据:
x
-2
-1
0
1
2
y
5
4
2
2
1
甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:
①y=-x+2.8,②y=-x+3,③y=-1.2x+2.6.其中正确的是( )
A.① B.② C.③ D.①③
解析:
回归方程y=bx+a表示的直线必过点(,),即必过点(0,2.8),而给出的三个线性回归方程中,只有①表示的直线过点(0,2.8),故正确的是①.
答案:
A
一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得数据如下:
零件数x(个)
10
20
30
40
50
60
70
80
90
100
加工时间y(分)
62
68
75
81
89
95
102
108
115
122
(1)y与x是否具有线性相关关系?
(2)如果y与x具有线性相关关系,求回归直线方程.
[巧思]
(1)利用相关系数rxy判断;
(2)利用最小二乘法求得a,b的值,进而求得回归方程.
[妙解]
(1)列出下表,并用科学计算器进行计算.
i
1
2
3
4
5
6
7
8
9
10
xi
10
20
30
40
50
60
70
80
90
100
yi
62
68
75
81
89
95
102
108
115
122
xiyi
620
1360
2250
3240
4450
5700
7140
8640
10350
12200
于是rxy=
=≈0.9998.
所以y与x具有线性相关关系.
(2)设所求的回归直线方程为y=bx+a,
那么由上表可得b=≈0.668,
a=-b=91.7-0.668×55≈54.96,
即所求的回归直线方程为y=0.668x+54.96.
1.在对两个变量x,y进行线性回归分析时,有下列步骤:
①对所求出的回归直线方程作出解释;
②收集数据(xi,yi),i=1,2,…,n;
③求线性回归方程;
④求相关系数;
⑤根据所搜集的数据绘制散点图.
如果根据可行性要求能够作出变量x,y具有线性相关的结论,则在下列操作顺序中正确的是( )
A.①②⑤③④ B.③②④⑤①
C.②④③①⑤D.②⑤④③①
解析:
对两个变量进行回归分析时,首先收集数据(xi,yi),i=1,2,…,n;根据所搜集的数据绘制散点图.观察散点图的形状,判断线性相关关系的强弱,求相关系数,写出线性回归方程,最后依据所求出的回归直线方程作出解释;故正确顺序是②⑤④③①,故选D.
答案:
D
2.已知变量x和y满足关系y=-0.1x+1,变量y与z正相关.下列结论中正确的是( )
A.x与y正相关,x与z负相关
B.x与y正相关,x与z正相关
C.x与y负相关,x与z负相关
D.x与y负相关,x与z正相关
解析:
因为y=-0.1x+1的斜率小于0,故x与y负相关.因为y与z正相关,
故x与z负相关.
答案:
C
3.相关变量x,y的样本数据如下表:
x
1
2
3
4
5
y
2
2
3
5
6
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为y=1.1x+a,则a=( )
A.0.1 B.0.2
C.0.3D.0.4
解析:
∵回归直线经过样本中心点(,),且由题意得(,)=(3,3.6),
∴3.6=1.1×3+a,∴a=0.3.
答案:
C
4.在关于两个变量的回归分析中,作散点图的目的是________________________.
答案:
观察两个变量之间是否存在线性相关关系
5.某服装厂的产品产量x(万件)与单位成本y(元/件)之间的回归直线方程是y=52.15-19.5x,当产量每增加一万件时,单位成本下降________元.
解析:
由回归系数的意义得下降19.5元.
答案:
19.5
6.在一段时间内,分5次测得某种商品的价格x(万元)和需求量y(t)之间的一组数据为:
1
2
3
4
5
价格x
1.4
1.6
1.8
2
2.2
需求量y
12
10
7
5
3
已知iyi=62,=16.6.
(1)画出散点图;
(2)求出y对x的回归方程;
(3)如价格定为1.9万元,预测需求量大约是多少?
(精确到0.01t).
解:
(1)散点图如下图所示:
(2)因为=×9=1.8,=×37=7.4,
iyi=62,=16.6,
sxy=-=12.4-13.32=-0.92.
所以b===-11.5,
a=-b=7.4+11.5×1.8=28.1,
故y对x的回归方程为y=28.1-11.5x.
(3)y=28.1-11.5×1.9=6.25(t).
一、选择题
1.下表是x与y之间的一组数据,则y关于x的线性回归方程必过( )
x
0
1
2
3
y
1
3
5
7
A.点(2,2) B.点(1.5,2)
C.点(1,2)D.点(1.5,4)
解析:
===1.5,==4,
∴线性回归方程必过点(1.5,4).
答案:
D
2.已知变量x与y正相关,且由观测数据算得样本平均数=3,=3.5,则由该观测数据算得的线性回归方程可能为( )
A.y=0.4x+2.3B.y=2x-2.4
C.y=-2x+9.5D.y=-0.3x+4.4
解析:
依题意知,相应的回归直线的斜率应为正,排除C、D.且直线必过点(3,3.5)代入A、B得A正确.
答案:
A
3.某咖啡厅为了了解热饮的销售量y(个)与气温x(℃)之间的关系,随机统计了某4天的销售量与气温,并制作了对照表:
气温(℃)
18
13
10
-1
销售量(个)
24
34
38
64
由表中数据,得线性回归方程y=-2x+a.当气温为-4℃时,预测销售量约为( )
A.68B.66
C.72D.70
解析:
∵=(18+13+10-1)=10,=(24+34+38+64)=40,
∴40=-2×10+a,∴a=60,
当x=-4时,y=-2×(-4)+60=68.
答案:
A
4.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:
收入x(万元)
8.2
8.6
10.0
11.3
11.9
支出y(万元)
6.2
7.5
8.0
8.5
9.8
根据上表可得回归直线方程y=bx+a,其中b=0.76,a=-b.据此估计,该社区一户年收入为15万元家庭的年支出为( )
A.11.4万元B.11.8万元
C.12.0万元D.12.2万元
解析:
由题意知,==10,
==8,
∴a=8-0.76×10=0.4,
∴当x=15时,y=0.76×15+0.4=11.8(万元).
答案:
B
二、填空题
5.调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:
万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:
y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.
解析:
以x+1代x,得y=0.254(x+1)+0.321,与y=0.254x+0.321相减可得,年饮食支出平均增加0.254万元.
答案:
0.254
6.下表是某厂1~4月份用水量(单位:
百吨)的一组数据,
月份x
1
2
3
4
用水量y
4.5
4
3
2.5
由某散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y=-0.7x+a,则a=________.
解析:
=2.5,=3.5,b=-0.7,∴a=3.5+0.7×2.5=5.25.
答案:
5.25
7.已知回归直线的斜率的估计值为1.23.样本点的中心为(4,5),则回归直线方程是________________.
解析:
由斜率的估计值为1.23,且回归直线一定经过样本点的中心(4,5),
可得y-5=1.23(x-4),即y=1.23x+0.08.
答案:
y=1.23x+0.08
8.在研究硝酸钠的可溶性程度时,观察它在不同温度的水中的溶解度,得观测结果如下:
温度(x)
0
10
20
50
70
溶解度(y)
66.7
76.0
85.0
112.3
128.0
由此,得到回归直线的斜率是________.
解析:
根据sxy=-,及b=,得b=0.8809.
答案:
0.8809
三、解答题
9.在关于人体的脂肪含量(百分比)和年龄关系研究中,研究人员获得了如下一组数据:
年龄x
22
26
38
41
45
48
50
53
54
56
57
脂肪含量y
9.4
17.8
21.2
24.9
26.5
27.1
28.2
29.4
30.2
31.4
32.6
(1)画出散点图;
(2)求y与x之间的回归方程;
(3)预测39岁的人脂肪含量.(保留四位有效数字)
解:
(1)画出散点图.
(2)由散点图可以看出y与x之间有较强的线性相关关系,
可算得=i≈44.5455,
=i≈25.3364,iyi=13205,=23224,
∴b=≈0.5657,a=-b≈0.1370.
∴y与x之间的线性回归方程为y=0.5657x+0.1370.
(3)当x=39时,y=0.5657×39+0.1370≈22.20,
∴39岁的人的脂肪含量约为22.20%.
10.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:
年份
2013
2014
2015
2016
2017
时间代号t
1
2
3
4
5
储蓄存款y(千亿元)
5
6
7
8
10
(1)求y关于t的回归方程=t+;
(2)用所求回归方程预测该地区2018年(t=6)的人民币储蓄存款.
附:
回归方程=t+中,=,=-,
解:
(1)列表计算如下:
i
ti
yi
t
tiyi
1
1
5
1
5
2
2
6
4
12
3
3
7
9
21
4
4
8
16
32
5
5
10
25
50
∑
15
36
55
120
这里n=5,=I==3,=i==7.2.
又ltt=-n2=55-5×32=10,
lty=iyi-n=120-5×3×7.2=12,
从而===1.2,=-=7.2-1.2×3=3.6,
故所求回归方程为=1.2t+3.6.
(2)将t=6代入回归方程可预测该地区2018年的人民币储蓄存款为=1.2×6+3.6=10.8(千亿元).
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 湘教版高中数学选修12第4章 44 一元线性回归案例 湘教版 高中数学 选修 12 一元 线性 回归 案例