实验五多重共线性检验参考案例.docx
- 文档编号:6956900
- 上传时间:2023-01-13
- 格式:DOCX
- 页数:18
- 大小:372.68KB
实验五多重共线性检验参考案例.docx
《实验五多重共线性检验参考案例.docx》由会员分享,可在线阅读,更多相关《实验五多重共线性检验参考案例.docx(18页珍藏版)》请在冰豆网上搜索。
实验五多重共线性检验参考案例
实验五多重共线性检验
实验时间:
姓名:
学号:
成绩:
【实验目的】
1、掌握多元线性回归模型的估计、检验和预测;
2、掌握多重共线性问题的检验方法
3、掌握多重共线性问题的修正方法
【实验内容】
1、数据的读取和编辑;
2、多元回归模型的估计、检验、预测;
3、多重共线性问题的检验
4、多重共线性问题的修正
【实验背景】
为了评价报账最低工资(负收入税)政策的可行性,兰德公司进行了一项研究,以评价劳动供给(平均工作小时数)对小时工资提高的反应,词研究中的数据取自6000户男户主收入低于15000美元的一个国民样本,这些数据分成39个人口组,并放在表1中,由于4个人口组中的某些变量确实,所以只给出了35个组的数据,用于分析的各个变量的定义如下:
Y表示该年度平均工作小时数;X1表示平均小时工资(美元);X2表示配偶平均收入(美元);X3表示其他家庭成员的平均收入(美元);X4表示年均非劳动收入(美元);X5表示平均家庭资产拥有量;X6表示被调查者的平均年龄;X7表示平均赡养人数;X8表示平均受教育年限。
为随机干扰项,考虑一下回归模型:
(1)将该年度平均工作小时数Y对X进行回归,并对模型进行简单分析;
(2)计算各变量之间的相关系数矩阵,利用相关系数法分析变量间是否具有多重共线性;
(3)利用逐步回归方法检验并修正回归模型,最后再对模型进行经济意义检验、统计检验。
表5
观测组
Y
X1
X2
X3
X4
X5
X6
X7
X8
1
2157
2.905
1121
291
380
7250
38.5
2.34
10.5
2
2174
2.97
1128
301
398
7744
39.3
2.335
10.5
3
2062
2.35
1214
326
185
3068
40.1
2.851
8.9
4
2111
2.511
1203
49
117
1632
22.4
1.159
11.5
5
2134
2.791
1013
594
730
12710
57.7
1.229
8.8
6
2185
3.04
1135
287
382
776
38.6
2.602
10.7
7
2210
3.222
1100
295
474
9338
39
2.187
112
8
2105
2.495
1180
310
255
4730
39.9
2.616
9.3
9
2267
2.838
1298
252
431
8317
38.9
2.024
11.1
10
2205
2.356
885
264
373
6489
38.8
2.662
9.5
11
2121
2.922
1251
328
312
5907
39.8
2.287
10.3
12
2109
2.499
1207
347
271
5069
39.7
3.193
8.9
13
2108
2.796
1036
300
259
4614
38.2
2.4
9.2
14
2047
2.453
1213
397
139
1987
40.3
2.545
9.1
15
2174
3.582
1141
414
498
10239
40
2.064
11.7
16
2067
2.909
1805
290
239
4439
39.1
2.301
10.5
17
2159
2.511
1075
289
308
5621
39.3
2.486
9.5
18
2257
2.516
1093
176
392
7293
37.9
2.042
10.1
19
1985
1.423
553
381
146
1866
40.6
3.833
6.6
20
2184
3.636
1091
291
560
11240
39.1
2.328
11.6
21
2084
2.983
1327
331
296
5653
39.8
2.208
10.2
22
2051
2.573
1197
279
172
2806
40
2.362
9.1
23
2127
3.263
1226
314
408
8042
39.5
2.259
10.8
24
2102
3.234
1188
414
352
7557
39.8
2.019
10.7
25
2098
2.28
973
364
272
4400
40.6
2.661
8.4
26
2042
2.304
1085
328
140
1739
41.8
2.444
8.2
27
2181
2.912
1072
304
383
9340
39
2.337
10.2
28
2186
3.015
1122
30
352
7292
37.2
2.046
10.9
29
2188
3.01
990
366
374
7325
38.4
2.847
10.6
30
2077
1.901
350
209
95
1370
37.4
4.158
8.2
31
2196
3.009
947
294
342
6888
37.5
3.047
10.6
32
2093
1.899
342
311
120
1425
37.5
4.512
8.1
33
2173
2.959
1116
296
387
7625
39.2
2.342
10.5
34
2179
2.959
1116
296
387
7625
39.2
2.342
10.5
35
2200
2.98
1126
204
393
7885
39.2
2.341
10.6
【实验过程】
一、利用Eviews软件建立年度平均工作小时数y的回归模型。
(一)首先创建Workfile(命令窗口输入CreateU,再输入35个样本观测值),其次输入数据Y,X1,X2,X3,X4,X5,X6,X7,X8(命令窗口DataYX1X2X3X4X5X6X7X8)将上述表格中的数据复制粘贴到数据窗口中。
(二)进行OLS回归
命令窗口输入命令LSYCX1X2X3X4X5X6X7X8
从表中可以看到,模型可能存在多重共线性。
因为拟合优度较高,F统计量对应的P值小于1%,说明回归方程是显着地,回归系数X3,X4,X6,X7在10%的水平下显着,其他回归系数的t统计量对应的P值大于0.1,是不显着变量,说明解释变量可能存在多重共线性。
二、多重共线性的检验
1、简单相关系数法
这种方法只适用于只有两个解释变量的情况。
当这两个解释变量相关系数的绝对值很大时,认为这两个解释变量存在共线性。
操作:
Quick→Groupstatistics→Correlations→对话框→x1x2x3x4x5x6x7x8→ok,得到关于上述8个变量之间的相关系数矩阵。
从上表结果可以看出,有几个解释变量,如x1和x4之间,x1和x5之间,x3和x6之间简单县官系数都在0.7以上,x4和x5的相关系数在0.9以上,说明这些变量之间都具有很强的相关性,存在多重共线性。
二、多重共线性的修正方法
(一)逐步回归法
逐步回归法的“逐步”指的是使用回归分析方法建立模型时,一次只能引入一个解释变量,进行一次引入称为“一步”,这样逐步进行下去,直到最后得到的模型达到“最优”(模型中没有不显着的变量)。
1、找出最简单的回归形式(对每个自变量与因变量y进行回归)
从而决定解释变量的重要程度,为解释变量排序,即分别作作y对x1,x2,x3,x4,x5,x6,x7,x8的一元回归,结果如下:
一元回归结果(被解释变量为y)
解释变量
X1
X2
X3
X4
X5
X6
X7
X8
参数估计值
77.369
0.031
-0.191
0.319
0.014
-1.137
-33.953
0.893
T统计量
3.836
0.710
-1.724
5.311
4.780
-0.450
-2.113
1.426
修正R2
0.287
-0.015
0.055
0.445
0.391
-0.024
0.094
0.029
根据R2的大小排序,课间解释变量的重要性程度依次为:
x4,x5,x1,x7,x3,x8,x6,x2;
2、以x4为基础,进行逐步回归,依次引入变量x5,x1,x7,x3,x8,x6,x2
加入新变量的回归结果
(一)
解释变量
X1
X2
X3
X4
X5
X6
X7
X8
R2
x4,x5
0.276
0.002
0.429
t值
1.795
0.303
x4,x1
21.726
0.268
0.440
t值
0.867
3.164
x4,x7
0.324
1.999
0.428
t值
1.537
0.136
x4,x3
-0.367
0.399
0.719
t值
-5.763
8.887
x4,x8
0.309
0.343
0.436
t值
4.977
0.700
x4,x6
0.451
-8.168
0.677
t值
8.516
-4.969
x4,x2
-0.009
0.6323
0.429
t值
-0.283
5.158
经过比较,新加入x3的方程其R2=0.719改进最大,从0.445增加到0.719,而且各参数经济合理,t检验显着,选择保留x3,以此x4,x3两变量为基础,再进行逐步回归,加入x5,x1,x7,,x8,x6,x2
3、以x4,x3为基础,加入x5,x1,x7,x8,x6,x2
加入新变量的回归结果
(一)
解释变量
X1
X2
X3
X4
X5
X6
X7
X8
R2
x4,x3,x5
-0.368
423
-0.001
0.710
t值
-5.666
3.756
-0.228
x4,x3,x1
-6.077
-0.372
0.415
0.711
t值
-0.325
-2.262
6.258
x4,x3,x7
-0.398
0.454
19.082
0.439
t值
-6.254
8.644
1.849
x4,x3,x8
-0.364
0.395
0.127
0.711
t值
-5.611
8.403
0.359
x4,x3,x6
-0.257
0.433
-3.540
0.731
t值
-2.735
8.864
-1.566
x4,x3,x2
-0.024
-0.374
0.411
0.719
t值
-1.023
-5.844
8.861
-经比较,新加入x7的方程,其拟合优度R2=0.739有所改进,从0.719增至0.789,而且各参数经济意义合理,t检验显着,所以选择保留x7.
(4)在x4,x3,x7的基础上,逐步加入x5,x1,x8,x6,x2
加入新变量的回归结果
(一)
解释变量
X1
X2
X3
X4
X5
X6
X7
X8
R2
x4,x3,x7,x5
-0.398
0.469
-0.007
19.006
0.730
t值
-6.139
4.201
-0.146
1.811
x4,x3,x7,x1
5.826
-0.394
0.443
20.236
0.731
t值
0.304
-5.999
6.730
1.816
x4,x3,x7,x8
-0.395
0.450
18.985
0.109
0.731
t值
-6.087
8.236
1.812
0.319
x4,x3,x7,x6
-0.271
0.502
-4.213
21.864
0.761
t值
-3.056
8.980
-1.955
2.191
x4,x3,x7,x2
0.009
-0.340
0.458
21.951
0.731
t值
0.289
-6.156
8.350
1.520
经比较,新加入x6的方程,其R2=0.761有所改进,从0.739增至0.761,而其各参数经济意义合理,t检验显着,所以选择保留x6.再依次加入变量x5,x1,x8,x2进行回归,发现回归结果R2都没有改进,而且各变量的t检验不显着,从而说明加入任何一个变量都无法对模型有任何改善,所以应予以剔除。
最后修正严重多重共线性后的回归结果如下图
回归方程为
t值33.7428.956-3.0722.211-1.958
p值(0.000)(0.000)(0.005)(0.035)(0.060)
R2=0.789F=28.082D.W.=1.638
从回归估计结果可以看出,x4,x3都通过了1%的显着性检验,x7通过5%的显着性检验,x6通过10%的显着性检验,说明模型参数显着,而且拟合优度为0.789,F统计量也很大,说明整体回归线性关系显着。
经济意义说明:
在其他条件不变的情况下,其他家庭成员的平均收入x3每上涨1美元,则年度工作时数平均减少0.27小时;年均非劳动收入x4每上涨1美元,则年均工作时数平均增加0.50小时;被调查者的平均年龄x6每增加1年,则年度工作时数平均减少4.21小时;平均赡养人数增加1人,则年度工作时数平均增加21.86小时。
三、利用软件直接实现逐步回归,主要有有进有出法、单项逐步回归法。
方法:
菜单Quick——EstimateEquation——在方法中选择逐步最小二乘方法STEPLS
注意Method中的选项。
在第一个设定框内输入:
yc;在第二个设定框输入解释变量:
X1x2x3x4x5x6x7x8如图:
然后,可以利用Option来控制逐步回归具体采用的方法。
在SelectionMethod中选择具体的逐步回归方法,如有进有出法(Stepwise),单项逐步回归法(Uni-directiona),程序终止准则区StoppingCriteria中选择p-value,并将其p值定为0.05,其余采用默认设置,如图
后向有进有出逐步回归设定(选择Backwards)
单项逐步回归设定
具体回归结果如下:
1、后向有进有出逐步回归设定
2、单项逐步回归结果
具体回归结果和上述最终回归结果的数据一样。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 多重 线性 检验 参考 案例