逐步回归与虚拟变量回归.docx
- 文档编号:12156006
- 上传时间:2023-04-17
- 格式:DOCX
- 页数:26
- 大小:322.09KB
逐步回归与虚拟变量回归.docx
《逐步回归与虚拟变量回归.docx》由会员分享,可在线阅读,更多相关《逐步回归与虚拟变量回归.docx(26页珍藏版)》请在冰豆网上搜索。
逐步回归与虚拟变量回归
逐步回归与虚拟变量回归(第三章)
试验目的:
通过上机试验,使学生掌握逐步回归与虚拟变量回归的基本原理,熟悉逐步回归与虚拟变量回归的处理方法。
一、课本p122页第16题。
1、计算各个变量之间的相关系数,分析多重共线性的可能类型。
方法:
选择Y,X1,X2,X3,X4,X5数据,点“view/correlations”得到相关系数矩阵,如下图:
结论:
各解释变量相互之间的相关系数很高,证实存在严重的多重共线性。
多重共线性的可能类型:
根据上下图三表格可得:
(1)
,X2与x1,x3,x4,x4,x5有较高的相关系数,可能存在多重共线性,可以剔除X1,X3,X4,X5,用X2来代替X1,X3,X4,X4,并建立模型若多重共线性,再做相应处理。
(模型一)
(2)
,上述中X1与X3,X4,X5也有较高的相关系数,可能存在多重共线性,可以用X1来代替X3,X4,X45,来建立模型。
(模型二)
2、根据逐步回归原来,建立我国钢产量预测模型。
对模型估计如下:
模型二:
引入X2,X1,模型中的各变量的符号系数正确,T检验也都显著,拟合优度也高,也消除多重共线性,所以选择模型二。
1、自相关检验。
DependentVariable:
Y
Method:
LeastSquares
Date:
11/29/09Time:
16:
25
Sample:
19781997
Includedobservations:
20
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-297.9093
101.7488
-2.927891
0.0094
X1
0.429333
0.117656
3.649042
0.0020
X2
0.474934
0.112997
4.203053
0.0006
R-squared
0.997280
Meandependentvar
5153.450
AdjustedR-squared
0.996960
S.D.dependentvar
2512.131
S.E.ofregression
138.5145
Akaikeinfocriterion
12.83731
Sumsquaredresid
326166.6
Schwarzcriterion
12.98667
Loglikelihood
-125.3731
F-statistic
3116.268
Durbin-Watsonstat
0.695770
Prob(F-statistic)
0.000000
模型中DW=0.695770,n=20,k=2,查DW检验表,得
,
,认为存在自相关。
(1)残差图分析:
结论:
存在着周期变动,表明存在自相关。
(2)偏相关系数分析:
在方程窗口中,点击View/ResidualTest/CorrelogramQ-statistics,得到:
结论:
第一期PAC值大于0.5,说明存在一介自相关。
(3)BG检验
在方程窗口中,点击View/ResidualTest/SerialCorrelationLMTest,并选择滞后期为3,得到:
Breusch-GodfreySerialCorrelationLMTest:
F-statistic
5.325047
Probability
0.011703
Obs*R-squared
10.65893
Probability
0.013721
TestEquation:
DependentVariable:
RESID
Method:
LeastSquares
Date:
11/29/09Time:
16:
44
Presamplemissingvaluelaggedresidualssettozero.
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
36.68954
78.68634
0.466276
0.6482
X1
-0.078614
0.091343
-0.860650
0.4039
X2
0.077361
0.087634
0.882781
0.3923
RESID(-1)
0.750910
0.253882
2.957708
0.0104
RESID(-2)
-0.195769
0.310485
-0.630527
0.5385
RESID(-3)
-0.307688
0.256109
-1.201396
0.2495
R-squared
0.532946
Meandependentvar
-1.00E-12
AdjustedR-squared
0.366141
S.D.dependentvar
131.0216
S.E.ofregression
104.3132
Akaikeinfocriterion
12.37600
Sumsquaredresid
152337.3
Schwarzcriterion
12.67472
Loglikelihood
-117.7600
F-statistic
3.195028
Durbin-Watsonstat
1.858214
Prob(F-statistic)
0.039361
结论:
滞后期为4,临界概率P=0.013721表明存在自相关。
因为e(-1)的t检验显著,说明存在一介自相关。
在方程窗口中点击Estimate的按钮,并输入:
YCX1X2AR
(1),得到:
DependentVariable:
Y
Method:
LeastSquares
Date:
11/29/09Time:
16:
54
Sample(adjusted):
19791997
Includedobservations:
19afteradjustments
Convergenceachievedafter10iterations
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-218.3416
165.5403
-1.318964
0.2070
X1
0.525347
0.121153
4.336244
0.0006
X2
0.366507
0.118573
3.090981
0.0075
AR
(1)
0.579819
0.187809
3.087283
0.0075
R-squared
0.998579
Meandependentvar
5308.474
AdjustedR-squared
0.998295
S.D.dependentvar
2480.737
S.E.ofregression
102.4313
Akaikeinfocriterion
12.28093
Sumsquaredresid
157382.5
Schwarzcriterion
12.47975
Loglikelihood
-112.6688
F-statistic
3514.228
Durbin-Watsonstat
1.637252
Prob(F-statistic)
0.000000
InvertedARRoots
.58
结论:
AR
(1)的T检验显著,进一步检查模型不存在自相关。
模型为:
t=(4.336244)(3.090981)(3.087283)
SE=102.4313DW=1.637252
2、异方差性检验
在方程窗口中点击:
View\ResidualTest\WhiteHeteroskedasticity.得到:
WhiteHeteroskedasticityTest:
F-statistic
0.704344
Probability
0.630305
Obs*R-squared
4.049985
Probability
0.542242
TestEquation:
DependentVariable:
RESID^2
Method:
LeastSquares
Date:
11/29/09Time:
17:
07
Sample:
19791997
Includedobservations:
19
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
-73504.34
64246.54
-1.144098
0.2732
X1
96.79652
142.1960
0.680726
0.5080
X1^2
-0.057576
0.100352
-0.573741
0.5759
X1*X2
0.105091
0.190526
0.551585
0.5906
X2
-73.65534
130.4776
-0.564506
0.5820
X2^2
-0.048929
0.090759
-0.539113
0.5989
R-squared
0.213157
Meandependentvar
8283.289
AdjustedR-squared
-0.089475
S.D.dependentvar
16161.23
S.E.ofregression
16868.76
Akaikeinfocriterion
22.55640
Sumsquaredresid
3.70E+09
Schwarzcriterion
22.85465
Loglikelihood
-208.2858
F-statistic
0.704344
Durbin-Watsonstat
2.369668
Prob(F-statistic)
0.630305
结论:
取显著水平a=0.05,
认为不存在异方差。
3、模型预测检验
在方程窗口中点击Forecast(或Resids)按钮,可以得到Y在样本期的模型预测值。
设预测变量名为YF。
命令如下:
GENRER=(1-YF/Y)*100计算相对误差
SHOWYYFER显示误差
PLOTYYF绘制拟合预测图
YF图如下:
显示误差,如下图:
绘制拟合预测图,如下:
结论:
根据图显示的计算结果,所建立的模型能如实反映我国钢铁预测模型。
二、在统计学教材中,采用了方差分析方法分析了不同班次对劳动效率的影响,其样本数据为
早班中班晚班
344939
374740
355142
334839
335041
355142
365140
试采用虚拟解释变量回归的方法对上述数据进行方差分析。
1、设置虚拟变量
D1:
{
D2:
{
从数据可知,该模型是加法。
模型方程:
Eviews中,输入相关数据后,在命令窗口输入:
LSYCD1D2得到:
DependentVariable:
Y
Method:
LeastSquares
Date:
12/01/09Time:
17:
27
Sample:
121
Includedobservations:
21
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
40.42857
0.555329
72.80115
0.0000
D1
-5.714286
0.785353
-7.276069
0.0000
D2
9.142857
0.785353
11.64171
0.0000
R-squared
0.952909
Meandependentvar
41.57143
AdjustedR-squared
0.947676
S.D.dependentvar
6.423172
S.E.ofregression
1.469262
Akaikeinfocriterion
3.738961
Sumsquaredresid
38.85714
Schwarzcriterion
3.888178
Loglikelihood
-36.25909
F-statistic
182.1176
Durbin-Watsonstat
2.331933
Prob(F-statistic)
0.000000
回归结果:
t=(72.80115)(-7.276069)(11.64171)
F=182.1176DW=2.331933
从回归结果可知:
模型拟合优度高,F检验显著,T检验也显著。
经过SPSS得到上述方差分析如上图。
三、表中给出1965—1970年美国制造业利润和销售额的季度数据。
假定利润不仅与销售额有关,而且和季度因素有关。
要求:
(1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量?
(2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量?
(3)如果认为上述两种情况都存在,又应当如何引入虚拟变量?
(4)对上述三种情况分别估计利润模型,进行对比分析。
年份季度
利润(Y)
销售额(X)
年份季度
利润(Y)
销售额(X)
1965-1
10503
114862
1968-1
12539
148862
2
12092
123968
2
14849
153913
3
10834
123545
3
13203
155727
4
12201
131917
4
14947
168409
1966-1
12245
129911
1969-1
14151
162781
2
14001
140976
2
15949
176057
3
12213
137828
3
14024
172419
4
12820
145465
4
14315
183327
1967-1
11349
136989
1970-1
12381
170415
2
12615
145126
2
13991
181313
3
11014
141536
3
12174
176712
4
12730
151776
4
10985
180370
1、如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量,估计利润模型,进行对比分析。
(1)为了更好研究四个季度的季节性影响,引入三个虚拟变量:
:
{
取得利润模型:
系数
分别反映了1、2、3、4季度对利润的平均影响程度,根据这些系数的t检验可以判断季节因素对利润是否有显著影响。
如图:
Eviews中,输入相关数据后,在命令窗口输入:
LSYCXD1D2D3得到:
DependentVariable:
Y
Method:
LeastSquares
Date:
12/01/09Time:
14:
07
Sample:
1965Q11970Q4
Includedobservations:
24
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
6910.449
1922.350
3.594792
0.0019
X
0.038008
0.011670
3.256914
0.0041
D1
-187.7317
660.1218
-0.284390
0.7792
D2
1169.320
637.0766
1.835446
0.0821
D3
-417.1182
640.8333
-0.650900
0.5229
R-squared
0.517642
Meandependentvar
12838.54
AdjustedR-squared
0.416093
S.D.dependentvar
1433.284
S.E.ofregression
1095.227
Akaikeinfocriterion
17.01836
Sumsquaredresid
22790932
Schwarzcriterion
17.26379
Loglikelihood
-199.2204
F-statistic
5.097454
Durbin-Watsonstat
0.396350
Prob(F-statistic)
0.005810
估计方程模型:
t=(3.594792)(3.256914)(-0.284390)(1.835446)(-0.650900)
回归方程表明:
第二季度的T检验效果显著,也就是说第二季度的销售额对利润的有显著影响。
销售额每增加1美元,则平均增加约3.8美分。
第一季度的平均利润是6722.7美元,而第二季度的平均利润提高了1169.32美元。
由于其他季度的影响不显著,所以只引入第二季度虚拟变量D2,得到如下回归方程:
t=(3.966130)(3.634023)(2.755062)
DependentVariable:
Y
Method:
LeastSquares
Date:
12/01/09Time:
14:
30
Sample:
1965Q11970Q4
Includedobservations:
24
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
6547.934
1650.963
3.966130
0.0007
X
0.039067
0.010750
3.634023
0.0016
D2
1369.099
496.9396
2.755062
0.0119
R-squared
0.506786
Meandependentvar
12838.54
AdjustedR-squared
0.459814
S.D.dependentvar
1433.284
S.E.ofregression
1053.426
Akaikeinfocriterion
16.87395
Sumsquaredresid
23303846
Schwarzcriterion
17.02121
Loglikelihood
-199.4874
F-statistic
10.78895
Durbin-Watsonstat
0.481660
Prob(F-statistic)
0.000598
(2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量?
如果是季度影响使利润对销售额的变化发生变异,应该乘法模型引入虚拟变量,如下方程模型:
Eviews中,输入相关数据后,在命令窗口输入:
LSYCXD1*XD2*XD3*X得到:
DependentVariable:
Y
Method:
LeastSquares
Date:
12/01/09Time:
14:
52
Sample:
1965Q11970Q4
Includedobservations:
24
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
7014.757
1782.932
3.934394
0.0009
X
0.037068
0.011322
3.273896
0.0040
XD1
-0.000933
0.004302
-0.216776
0.8307
XD2
0.007910
0.004018
1.968541
0.0638
XD3
-0.002385
0.004074
-0.585290
0.5652
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 逐步回归 虚拟 变量 回归