线性回归方程及应用.docx
- 文档编号:25734147
- 上传时间:2023-06-12
- 格式:DOCX
- 页数:22
- 大小:96.84KB
线性回归方程及应用.docx
《线性回归方程及应用.docx》由会员分享,可在线阅读,更多相关《线性回归方程及应用.docx(22页珍藏版)》请在冰豆网上搜索。
线性回归方程及应用
18、统计
18.4线性回归方程及应用
【知识网络】
1.能通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系。
2.了解线性回归的方法;了解用最小二乘法研究两个变量的线性相关问题的思想方法;会根据给出
的线性回归方程系数公式建立线性回归方程(不要求记忆系数公式)。
【典型例题】
[例1]
(1)为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为11、12,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值为s与t,那么下列说法正确的是
()
A.直线11和12一定有公共点(s,t)B.直线11和12相交,但交点不一定是(s,t)
C.必有直线11//|2D.直线11和12必定重合
(2)工人工资(元)依劳动生产率(千元)变化的回归方程为y?
=50+80x,下列判断正确的是
()
A.劳动生产率为1000元时,工资为130元
B.劳动生产率提高1000元时,工资提高80元
C.劳动生产率提高1000元时,工资提高130元
D.当月工资250元时,劳动生产率为2000元
(3)下列命题:
1任何两个变量都具有相关关系;
2圆的周长与该圆的半径具有相关关系;
3某商品的需求与该商品的价格是一种非确定性关系;
4根据散点图求得的回归直线方程可能是没有意义的;
5两个变量间的相关关系可以通过回归直线,把非确定性问题转化为确定性问题进行研究。
X你春鸟教肓
g»vr«***
其中正确的命题为()
A.①③④B。
②④⑤C。
③④⑤D。
②③⑤
(4)一家保险公司调查其总公司营业部的加班程度,收集了10周中每周加班工作时间y(小时)与
签发新保单数目x的数据如下表,则用最小二乘法估计求出的线性回归方程是。
x
825
215
1070
550
480
920
1350
325
670
1215
y
3.5
1.0
4.0
2.0
1.0
3.0
4.5
1.5
3.0
5.0
(5)上题中,若该公司预计下周签发新保单1000张,则需要加班的时间是
[例2]已知10只狗的血球体积及红血球的测量值如下:
X
45
42
46
48
42
35
58
40
39
50
y
6.53
6.30
9.25
7.50
6.99
5.90
9.49
6.20
6.55
7.72
其中x(血球体积,mm),y(血红球数,百万)
1画出上表的散点图;
2求出回归直线并且画出图形。
[例3]要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选
10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩(如下表):
学生编号
1
2
3
4
5
6
7
8
9
10
入学成绩x
63
67
45
88
81
71
52
99
58
76
咼一期末成绩y
65
78
52
82
92
89
73
98
56
75
(1)计算入学成绩(x)与高一期末考试成绩(y)的相关关系;
(2)若某学生入学数学成绩80分,试估计他高一期末数学考试成绩.
[例4]下表是采集的商品零售额(万元)与商品流通费率的一组数据:
商品零售额
9.5
11.5
13.5
15.5
17.5
19.5
21.5
23.5
25.5
27.5
商品流通费率
6.0
4.6
4.0
3.2
2.8
2.5
2.4
2.3
2.2
2.1
(1)将商品零售额作为横坐标,商品流通费率作为纵坐标,在平面直角坐标系内作出散点图;
(2)商品零售额与商品流通费率具有线性相关关系吗?
如果商品零售额是20万元,那么能否预测此时流通费率是多少呢?
【课内练习】
1.下列两个变量之间的关系哪个不是函数关系()
A.角度和它的余弦值B。
正方形边长和面积
C.正n边形的边数和它的内角和D。
人的年龄和身高
2.下列变量之间的关系是函数关系的是()
A.已知二次函数y二ax2bxc,其中a,c是已知常数,取b为自变量,因变量是这个函数
的判别式-b2-4ac
B.光照时间和果树的亩产量
C.降雪量和交通事故发生率
Jr科g*«-■»«
D.每亩用肥料量和粮食亩产量
3.下列命题叙述正确的是()
A•任何两个变量都可以用一元线性回归关系进行合理的描述
B•只能采用最小二乘法对一元线性回归模型进行参数估计
C.对于一个样本,用最小二乘法估计得到的一元线性回归方程参数估计值是唯一的
D.任何两个相关关系的变量经过变换后都可以化为一元线性回归关系
4.设线性回归直线方程y=ab>?
现将y的单位由cm变为m,x的单位由ms变为s,则在新的线性回归直线方程y=a”,b”x中,()
A.b=0.1bB.b=bC.b=10bD.b=100b
5.若施肥量x与水稻产量y的线性回归直线方程#=2505^?
,当施肥量为80Kg时,预计水稻产量为.
6.某保险公司收集了10周中工作的加班时间y与签订新保单数目x,用最小二乘法求出线性回归方程为?
=0.12+0.0036)?
.若公司预签订新保单1000张,估计需加班小时.
7.如果你想作一个反对抽烟的电视公益广告的播放次数与看电视的中学生戒烟率的数据散点图,作
为x轴的变量应为。
&给出施化肥量对水稻产量影响的试验数据:
施化肥量x
15
20
25
30
35
40
45
水稻产量y
330
345
365
405
445
450
455
试求出回归直线方程-
9•在某种产品表面进行腐蚀刻线试验,得到腐蚀深度y与腐蚀时间x之间相应的一组观察值如下表:
x
5
10
15
20
30
40
50
60
70
90
120
y
6
10
10
13
16
17
19
23
25
29
467
求腐蚀深度y对腐蚀时间x的回归直线方程,并解释回归系数的意义.
10•某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病的人数如下表所示:
年份
该年新发病的人数
1996年
2400
1997年
2491
1998年
2586
1999年
2684
该地区这种
如果不加控制,仍按这个趋势发展下去,请预测从2000年初到2003年底的四年里,病的新发病人数总共多少?
18、统计
18.4线性回归方程及应用
A组
1.设有一个直线回归方程为\?
=3-2X,则变量x增加一个单位时()
A.y平均增加2个单位B。
y平均增加3个单位
C.y平均减少2个单位D。
y平均减少3个单位
2.回归直线方程的系数a,b的最小二乘法估计使函数Q(a,b)最小,Q函数指
()
nn
2
A.E(yj_a—bXi)B。
£-bxi
i4iA
2
C.yi—a—bXjD。
(yi—a—bXi)
3.对于给定的两个变量的统计数据,下列说法正确的是()
A.都可以分析出两个变量的关系
B.都可以用一条直线近似表示两者关系来估计总体的均值
C.都可以作出散点图
D.都可以用确定的表达式表示两者的关系
4.某种机器购置后运营年限x与当年增加利润y的统计分析知具备线性相关关系,回归方种为
7=10.47-1.3?
,估计这种机器使用年最合算。
5.给出下列关系:
1正方体的体积与棱长
2角的度数和它的正弦值
3单产为常数时,土地面积和总产量
4日照时间与棉花亩产量
5体重与身高
其中属于函数关系的有。
6.—台机器可以按各种不同的速度运转,其生产的物
速度(转/秒)
每小时生产有冋题物件数
8
5
12
8
14
9
16
11
件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,左面表格中的数据是几次试验的结果.那么当速度为10(转/秒)时,是否可以预知每小时生产有问题物件数呢?
若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?
7.假设儿子身长与父亲身长适合一元线性回归模型,观察了10对英国父子身长(英寸)如下:
父亲身长(x)
60
62
64
65
66
67
68
70
72
74
儿子身长(y)
63.6
65.2
66
65.5
66.9
67.1
67.4
68.3
70.1
70
试建立y关于x的回归方程.
8我们知道营业税税收总额y与社会消费品零售总额x有关•为能从社会消费品零售总额去预测营
业税税收总额,需要了解两者的关系.现收集如下11组全国相关数据(单位:
亿元)
年份
社会消费品零售总额x
社会消费品零售总额x
1994
16264.7
680.2
1995
20620.0
869.4
1996
24774.1
1065.4
1997
27298.9
1353.4
1998
29152.5
1608.0
1999
31134.7
1696.5
2000
34152.6
1885.7
2001
37595.2
2084.7
2002
42027.1
2467.6
2003
47602.1
2868.9
2004
53950.1
3583.5
(1)画出营业税税收总额y与社会消费品零售总额x间散点图;
(2用最小二乘法求营业税税收总额y与社会消费品零售总额x之间线性回归直线方程.
⑶试估计2005年社会消费品零售总额增长在12%〜14%,营业税税收总额y大致会增长多少?
18、统计
18.4线性回归方程及应用
A.点散布特征为从左下角到右上角区域
B.点散布在某带形区域内
C.点散布在某圆形区域内
D.点散布特征为从左上角到右下角区域内
着鸟教肓
bvvr-m*
3.某考察团对全国10大声调进行职工人均平均工资x与居民人均消费y进行统计调查,y与x具有
相关关系,回归方程为?
=0.66?
4562(单位:
千元)。
若某城市居民消费水平为7.675,估计
该城市消费额占人均工资收入的百分比为()
A.66%B。
72.3%C。
67.3%D。
83%
4.下列关系中:
1吸烟有害健康
2粮食产量与施肥量
3乌鸦叫,没好兆
4名师出高徒
不具有相关关系的是。
5.现有一个身高预测体重的回归方程;体重预测值=4(磅/英寸)身高-130磅.期中体重和身高分
别以磅和英寸为单位。
如果将它们分别以kg、cm的单位(1英寸〜2.5cm,1磅~0.45kg).回归方程应该是.
6.一个工厂在某年某月产品的总成本y(万元)与该月产量(万件)之间有如下数据:
X
1.08
1.12
1.19
1.28
1.36
1.48
1.59
1.68
1.80
1.87
1.98
2.07
Y
2.25
2.37
2.40
2.55
2.64
2.75
2.92
3.03
3.14
3.26
3.36
3.50
⑴画出散点图;
(2)最小二乘法求月产品的总成本y(万元)与该月产量x(万件)之间线性回归直线方程.
n_n_2
7.试证明:
①工(Xj-x)2'X:
-nx;
i±izi
n__n
②'(Xi—x)(yi-小"XiW—nxy。
i±i=1
8下栏的表格是某省20个县城2007年的一份统计资料,其中Xi表示第i个县城在2007年建成的新住宅面积(单位:
103m2),yi表示第i个县城在2007年的家具销售量(万元)。
县城编号
Xi
yi
县城编号
Xi
yi
1
121
360
11
387
602
2
118
260
12
270
540
3
271
440
13
218
414
4
190
400
14
342
590
5
75
360
15
173
492
6
263
500
16
370
660
7
334
580
17
170
360
8
368
560
18
205
410
9
305
505
19
339
680
10
210
480
20
283
594
若此县城在2008年预计新建成的住宅面积为350X103m2,则可以大体估计出此县城当年可销售家具多少万元?
参考答案
18.4线性回归方程及应用
【典型例题】
[例1]
(1)A.提示:
线性回归直线方程为y?
=a+bx,而a=y-bx,即a=t-bs,t=a+bs.「.(s,t)在
回归直线上,即直线ll和12必有公共点(S,t)。
(2)B.提示:
回归直线斜率为80,所以x每增加1,y?
增加80,即劳动生产率提高1千元时,工
资提咼80兀。
(3)C.
_彳1010_
(4)旷O.11810.003585x。
提示:
“伉甘%―心1297860,
_10__
y=2.85,二(Xj-x)(y,_y)=4653。
id
_1
②x(45424648423558403950)=45.50,
10
1
y(6.536.309.527.506.995.909.496.206.558.72)=7.37
10
n
迟Xi
b十
乞Xj
\=±
形如下:
%-nxy
=0.13,a=y—bx=1.29,所以所求回归直线的方程为0.13x+1.29.图
2—2
—nx
y儿
10"*.-
一—一十
一5—亠一
■*****
303540455055x
[例3]
(1)从入学成绩(x)与高一期末考试成绩(y)两组变量的散点图看,这两组变量尚具有线性关系.
__10__10_10_
—————2—2
通过计算知x=70,y=76,、(Xi-x)(yi-y)=1894,'(x-x)=2474,'(y-y)=2056,
i=1
所以b=0.76556,a二勺—bl=22.41067,
(2)若某学生入学数学成绩为80分,
绩预测值为84分.
[例4]
(1)散点图如图所示.
(2)散点图显示出商品流通费率和
的变化关系并不是直线型,而是一条递减
型•两者之间不具有线性相关关系.
但经济理论和实际经验都可说明,流
于商品零售额,体现着经营的规模效益,
合一个以商品销售额为自变量(X),流通费
1
(Y)的双曲线回归模型:
Y^-ab—,
X
中的a和b两个参数,令-=X•,是上述模型转换为线性模型:
=abX,这样我们就可以运用X
线性回归的知识加以解决了.
将转化后的有关数据列表如下:
i」i4
因此所求的线性回归方程是?
=22.41067+0.76556x;
代入上式可求得,y:
、84分,即这个学生高一期末数学成
15
21
*.零售额
*—■—■
27
商品零售额X(万元)
商品流通费率Y
X
9.5
6.0
0.105
11.5
4.6
0.087
13.5
4.0
0.074
15.5
3.2
0.065
17.5
2.8
0.057
19.5
2.5
0.051
21.5
2.4
0.047
23.5
2.3
0.043
商品零售额
的双曲线
通费率决定
因此可以拟
率为因变量
为了求模型
25.5
2.2
0.039
27.5
2.1
0.036
合计
32.1
0.604
1代入公式得:
a--0.4377,b=60.4,从而线性回归方程为^=「0.437760.4X••将X■回
X
60.4
代得W=「0.4377•
X
于是当X=20(万元)时,W=2.5823(%)
【课内练习】
1•D。
2.A。
提示:
依据函数的定义即可。
3.C。
提示:
只要样本数据确定,那么所求的参数就是唯一的
4.D。
5.5.650Kg.
6.3.73.
7.播放次数。
i
1
2
3
4
5
6
7
Xi
15
20
25
30
35
40
45
yi
330
345
365
405
445
450
455
Xiyi
4950
6900
9125
12150
15575
18000
20475
777
x=30,y=399.3,迟x=7000,迟引=1132725,送Xiw=87175
ii=1i=1
&表中的数据进行具体计算,列成以下表格
b
:
4.75,
a=399.3—4.7530:
257
从而得回归直线方程是?
=4.75x257.
510—214
9.由表中数据经计算可得x,y,由线性回归公式得:
^0.304,^5.36,故y对x的回归
1111
直线方程为y=0.304x5.36。
回归系数b=0.304的意义是:
腐蚀时间x每增加一个单位,深度y平均增加0.304个单位.
10.思路一、从新发病的增长率入手
(2491-2400)/2400=3.792%;
(2586-2491)/2491=3.814%;
(2684-2586)/2586=3.790%.
1996年到1997年新发病的增长率为
1997年到1998年新发病的增长率为
1998年到1999年新发病的增长率为
由此可见,新发病的增长率基本一致,取其平均数为3.799%,以此作为以后新发病增长率的预
测,即2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4,不难算得约等于11795(人).
思路二、从数据处理来考察
因为2491/2400=1.038、2586/2491=1.038、2684/2586=1.038,可见连续两年新发病人数的比值近似于一个常数1.038,以此作为以后的预测,即
2684(1+3.799%)+2684(1+3.799%)2+2684(1+3.799%)3+2684(1+3.799%)4=11795(人).
思路三、利用回归分析
x轴上表示年份,y轴上表示新发病的人数,将表格中的四组数据描点(图略)•观察这些点的位置,它们的分布大致在一条直线附近,所以尝试用直线进行拟合.
1n
设回归直线方程为*=abx,则由相关数据计算得:
x-1',x=1997.5,
n7
-1n
yyi=2540.25,
ni=1
n
二xiyi-nxyb=;-94.7,a二y-bx=-186623,
'片2_n(x)2
i=1
所以回归直线方程为
?
-18662394.7x,从而
y总二-186623494.7(2000200120022003)11676(人),即为所求.
18、统计
18.4线性回归方程及应用
2.A。
3.Co
4.8。
5.①②③。
6.用x表示机器速度,y表示每小时生产有问题物件数,那么4个样本数据为:
(8,5)、
8)、(14,9)、(16,11),则x=12.5,y=8.25.于是回归直线的斜率为
n
Xiyi-nxy
彳255—-
a--出255二0.7286,b=y-ax二-0.8571,所以所求的回归直线方程为
寸2-235
xi-x
i4
y=0.7286x-0.8571。
根据公式7-0.7286x-0.8571,要使y乞10,则就需要
0.7286X-0.857仁10,x乞14.9031,即机器的旋转速度不能超过14.9013转/秒.
7.7=0.4646x35.98。
&营业税税收总额y与社会消费品零售总额x间散点图
(2)利用计算器可以计算算出:
11
E=33142.9,y=1883.03,/=1.339061010,
i4
11
'XW=768406464
i1
11
、'XiYi-11x-y__
于是b=吕.0.07658,a=了-bX二-705.01•
2-2
、X-11x
i4
所以所求的线性回归直线方程是7--705.01■0.07658?
。
60424~61503,估计
(3)社会消费品零售总额增长在12%〜14%,即社会消费品零售总额在
2005年营业税税收总额大致在3992~4005亿元,增长9.5%〜11.8%。
1.A。
2.D。
3.D。
4.③
5.体重预测值=0.72(kg/cm)身高—58.5kg。
6.画出散点图:
2
•系列1
利用计算器,可以计算得:
__1212
——2
x=1.5417,y=2.8475,'x=29.808,'Xj%=54.243.
i壬iT
12
Xiyi-12x-y__
于是b二岂1.215,aJ-bX-0.974
122-2
二X-12x
i1
_n_n
_x、y-yXinxy
iz1i=1
n__n
②7(Xi-x)(yi-w)=—Xiyi
i4iz!
n____n
Xyi_x(ny)_y(nx)nxy=、托y-nxy。
i1y
8.
下:
散点图如
由于家具销售量与新住宅落成的面积间呈现出明显的线性趋势,所以我们可以用回归直线去描述它•由已知数据可以算出:
nnnnn
'X,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 方程 应用