应用回归分析第2章课后习题参考答案讲解.docx
- 文档编号:629086
- 上传时间:2022-10-11
- 格式:DOCX
- 页数:14
- 大小:314.15KB
应用回归分析第2章课后习题参考答案讲解.docx
《应用回归分析第2章课后习题参考答案讲解.docx》由会员分享,可在线阅读,更多相关《应用回归分析第2章课后习题参考答案讲解.docx(14页珍藏版)》请在冰豆网上搜索。
应用回归分析第2章课后习题参考答案讲解
第二章一元线性回归分析
思考与练习参考答案
2.1一元线性回归有哪些基本假定?
答:
假设1、解释变量X是确定性变量,Y是随机变量;
假设2、随机误差项ε具有零均值、同方差和不序列相关性:
E(εi)=0i=1,2,…,n
Var(εi)=2i=1,2,…,n
Cov(εi,εj)=0i≠ji,j=1,2,…,n
假设3、随机误差项ε与解释变量X之间不相关:
Cov(Xi,εi)=0i=1,2,…,n
假设4、ε服从零均值、同方差、零协方差的正态分布
εi~N(0,2)i=1,2,…,n
2.2考虑过原点的线性回归模型
Yi=β1Xi+εii=1,2,…,n
误差εi(i=1,2,…,n)仍满足基本假定。
求β1的最小二乘估计
解:
得:
2.3证明(2.27式),ei=0,eiXi=0。
证明:
其中:
即:
ei=0,eiXi=0
2.4回归方程E(Y)=β0+β1X的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?
给出证明。
答:
由于εi~N(0,2)i=1,2,…,n
所以Yi=β0+β1Xi+εi~N(β0+β1Xi,2)
最大似然函数:
使得Ln(L)最大的,就是β0,β1的最大似然估计值。
同时发现使得Ln(L)最大就是使得下式最小,
上式恰好就是最小二乘估计的目标函数相同。
值得注意的是:
最大似然估计是在εi~N(0,2)的假设下求得,最小二乘估计则不要求分布假设。
所以在εi~N(0,2)的条件下,参数β0,β1的最小二乘估计与最大似然估计等价。
2.5证明是β0的无偏估计。
证明:
2.6证明
证明:
2.7证明平方和分解公式:
SST=SSE+SSR
证明:
2.8验证三种检验的关系,即验证:
(1);
(2)
证明:
(1)
(2)
2.9验证(2.63)式:
证明:
其中:
2.10用第9题证明是2的无偏估计量
证明:
2.11验证决定系数与F值之间的关系式
证明:
2.14为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y(万元)和广告费用x(万元),数据见表2.6,要求用手工计算:
表2.6
月份
1
2
3
4
5
X
1
2
3
4
5
Y
10
10
20
20
40
(1)画散点图(略)
(2)X与Y是否大致呈线性关系?
答:
从散点图看,X与Y大致呈线性关系。
(3)用最小二乘法估计求出回归方程。
计算表
X
Y
1
10
4
100
20
6
(-14)2
(-4)2
2
10
1
100
10
13
(-7)2
(3)2
3
20
0
0
0
20
0
0
4
20
1
0
0
27
72
72
5
40
4
400
40
34
142
(-6)2
和15
100
和Lxx=10
Lyy=600
和Lxy=70
和100
SSR=490
SSE=110
均3
均20
均20
回归方程为:
(4)求回归标准误差
先求SSR(Qe)见计算表。
所以
(5)给出的置信度为95%的区间估计;
由于(1-)的置信度下,的置信区间是
查表可得
所以的95%的区间估计为:
(7—3.182*1.915,7+3.182*1.915),即(0.906,13.094)。
所以的95%的区间估计为:
(-1-3.182*6.351,-1+3.182*6.351),
即(-21.211,19.211)。
的置信区间包含0,表示不显著。
(6)计算x和y的决定系数
说明回归方程的拟合优度高。
(7)对回归方程作方差分析
方差分析表
方差来源
平方和
自由度
均方
F值
SSR
490
1
490
13.364
SSE
110
3
36.667
SST
600
4
F值=13.364>F0.05(1,3)=10.13(当n=1,n=8时,α=0.05查表得对应的值为10.13),所以拒绝原假设,说明回归方程显著。
(8)做回归系数β1的显著性检验H0:
β1=0
t值=3.656>t0.05/2(3)=3.182,所以拒绝原假设,说明x对Y有显著的影响。
(8)做相关系数R的显著性检验
R值=0.904>R0.05(3)=0.878,所以接受原假设,说明x和Y有显著的线性关系。
(9)对回归方程作残差图并作相应的分析
残差图(略).从残差图上看出,残差是围绕e=0在一个固定的带子里随机波动,基本满足模型的假设ei~N(0,2),但由于样本量太少,所以误差较大.
(10)求广告费用为4.2万元时,销售收入将达到多少?
并给出置信度为95%的置信区间.
解:
当X0=4.2时,
所以广告费用为4.2万元时,销售收入将达到28.4万元.
由于置信度为1-α时,Y0估计值的置信区间为:
所以求得Y0的95%的置信区间为:
[6.05932,50.74068]
预测误差较大.
2.15一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。
经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x为每周新签发的保单数目,y为每周加班工作时间(小时)。
见表2.7。
表2..7
周序号
1
2
3
4
5
6
7
8
9
10
X
825
215
1070
550
480
920
1350
325
670
1215
Y
3.5
1.0
4.0
2.0
1.0
3.0
4.5
1.5
3.0
5.0
1、画散点图
2、由散点图可以看出,x与y之间大致呈线性关系。
3、用最小二乘法求出回归系数
由表可知:
回归方程为:
4、求回归标准误差
由方差分析表可以得到:
SSE=1.843
故回归标准误差,=0.48。
5、给出回归系数的置信度为95%的区间估计
由回归系数显著性检验表可以看出,当置信度为95%时:
的预测区间为[-0.701,0.937],的预测区间为[0.003,0.005].
的置信区间包含0,表示不拒绝为零的假设。
6、决定系数
由模型概要表得到决定系数为0.9接近于1,说明模型的拟合优度高。
7.对回归方程作方差分析
由方差分析表可知:
F值=72.396>5.32(当n=1,n=8时,查表得对应的值为5.32)
P值0,所以拒绝原假设,说明回归方程显著。
8、对的显著性检验
从上面回归系数显著性检验表可以得到的t统计量为t=8.509,所对应的p值近似为0,通过t检验。
说明每周签发的新保单数目x对每周加班工作时间y有显著的影响。
9.做相关系数显著性检验
相关系数达到0.949,说明x与y显著线性相关。
10、对回归方程作残差图并作相应分析
从残差图上看出,残差是围绕e=0随即波动,满足模型的基本假设。
11、该公司预计下一周签发新保单X0=1000张,需要的加班时间是多少?
当x=1000张时,小时
12、给出Y0的置信水平为95%的预测区间
通过SPSS运算得到Y0的置信水平为95%的预测区间为:
(2.5195,4.8870)。
13给出E(Y0)的置信水平为95%的预测区间
通过SPSS运算得到Y0的置信水平为95%的预测区间为:
(3.284,4.123)。
2.16表是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元).
序号
y
x
序号
y
x
序号
y
x
1
19583
3346
18
20816
3059
35
19538
2642
2
20263
3114
19
18095
2967
36
20460
3124
3
20325
3554
20
20939
3285
37
21419
2752
4
26800
4542
21
22644
3914
38
25160
3429
5
29470
4669
22
24624
4517
39
22482
3947
6
26610
4888
23
27186
4349
40
20969
2509
7
30678
5710
24
33990
5020
41
27224
5440
8
27170
5536
25
23382
3594
42
25892
4042
9
25853
4168
26
20627
2821
43
22644
3402
10
24500
3547
27
22795
3366
44
24640
2829
11
24274
3159
28
21570
2920
45
22341
2297
12
27170
3621
29
22080
2980
46
25610
2932
13
30168
3782
30
22250
3731
47
26015
3705
14
26525
4247
31
20940
2853
48
25788
4123
15
27360
3982
32
21800
2533
49
29132
3608
16
21690
3568
33
22934
2729
50
41480
8349
17
21974
3155
34
18443
2305
51
25845
3766
解答:
(1)绘制y对x的散点图,可以用直线回归描述两者之间的关系吗?
由上图可以看出y与x的散点分布大致呈直线趋势。
(2)建立y对x的线性回归。
利用SPSS进行y和x的线性回归,输出结果如下:
表1模型概要
R
R2
调整后的R2
随机误差项的标准差估计值
0.835
0.697
0.691
2323.25589
表2方差分析表
模型
平方和
自由度
和平均
F值
P值
1
回归平方和
6.089E8
1
6.089E8
112.811
.000a
残差平方和
2.645E8
49
5397517.938
总平方和
8.734E8
50
表3系数表
模型
非标准化系数
标准化系数
t值
P值
B
标准差
回归系数
1
常数
12112.629
1197.768
10.113
.000
对学生的人均经费投入
3.314
.312
.835
10.621
.000
1)由表1可知,x与y决定系数为,说明模型的拟合效果一般。
x与y线性相关系数R=0.835,说明x与y有较显著的线性关系。
2)由表2(方差分析表中)看
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 回归 分析 课后 习题 参考答案 讲解
![提示](https://static.bdocx.com/images/bang_tan.gif)