经济计量学的各种检验-北大光华王志刚.pptx
- 文档编号:30796150
- 上传时间:2023-10-09
- 格式:PPTX
- 页数:60
- 大小:265.42KB
经济计量学的各种检验-北大光华王志刚.pptx
《经济计量学的各种检验-北大光华王志刚.pptx》由会员分享,可在线阅读,更多相关《经济计量学的各种检验-北大光华王志刚.pptx(60页珍藏版)》请在冰豆网上搜索。
经济计量学的几种检验,王志刚2003.6,多重共线性,.Multicollinearityarisesbecausewehaveputintoomanyvariablesthatmeasurethesamething.Asthedegreeofmulticollinearityincreases,theregressionmodelestimatesofthecoefficientsbecomeunstableandthestandarderrorsforthecoefficientscangetwildlyinflated.Measure:
vif,tol=1/vif,conditionindex;etc.,多重共线性的后果,1.存在完全多重共线性时,参数的估计值无法确定,而且估计值的方差变为无穷大.2.存在不完全多重共线性时,可以估计参数值,但是数值不稳定,而且方差很大.3.多重共线性会降低预测的精度,甚至失效,增大零假设接受的可能性(t值变小).,多重共线性的检测方法
(1)样本可决系数法,如果样本的可决系数R-square比较大,且回归系数几乎没有统计上的显著性,则可认为存在多重共线性。
Theil提出了一个指标:
多重共线性效应系数,Theiltestresults,Sas结果:
结果表明有多重共线性。
多重共线性检测方法
(2)辅助回归检验法,若存在多重共线性,则至少有一个解释变量可精确或近似地表示为其余皆是变量的线性组合。
相应的检验统计量为:
辅助回归检验结果,Sas结果:
Klein经验法则:
若存在一个i,使得R(i)-squareR-square,则认为多重共线性严重;本例中x1,x3有多重共线性。
多重共线性检验方法(3)样本相关系数检验法,FGtestresults,fg=20.488013401p=0.0001344625;拒绝零假设,认为存在多重共线性。
具体那些变量之间存在多重共线性,除了上面提到的辅助回归的方法外,还有以下提到的条件数检验和方差膨胀因子法。
多重共线性检验方法:
(4)特征值分析法所用的检验统计指标,;为第k各自变量和其余自变量回归的可决系数.VIF10,有多重共线性;TOL=1/VIF;条件指数:
条件数:
;C20,共线性严重.,多重共线性的检验和补救,例一:
进口总额和三个自变量之间回归;Sas结果如下:
PearsonCorrelationCoefficients,N=11Prob|r|underH0:
Rho=0x1x2x3x11.000000.025850.99726GDP0.9399.0001x20.025851.000000.03567存蓄量0.93990.9171x30.997260.035671.00000总消费.00010.9171从上面可以看出x1和x3线性相关严重.,多重共线性的检验和补救,
(2)回归结果:
ParameterEstimatesParameterStandardVarianceVariableDFEstimateErrortValuePr|t|InflationIntercept1-10.127991.21216-8.36.00010x11-0.051400.07028-0.730.4883185.99747x210.586950.094626.200.00041.01891x310.286850.102212.810.0263186.11002发现x1的系数为负,和现实经济意义不符,出现原因就是x1和x3之间的线性相关.,补救措施,增加样本;岭回归或主分量回归;至少去掉一个具有多重共线性的变量;对具有多重共线性的变量进行变换.对所有变量做滞后差分变换(一般是一阶差分),问题是损失观测值,可能有自相关.采用人均形式的变量(例如在生产函数估计中)在缺乏有效信息时,对系数关系进行限制,变为有约束回归(Klein,Goldberger,1955),可以降低样本方差和估计系数的标准差,但不一定是无偏的(除非这种限制是正确的).对具有多重共线性的变量,设法找出其因果关系,并建立模型和原方程构成联立方程组.,岭回归,岭回归估计:
K=0,b(k)=b即为OLSE;K的选取:
即使b(k)的均方误差比b的均方误差小.,岭迹图,岭回归结果,Obs_MODEL__TYPE__DEPVAR__RIDGE_k_PCOMIT__RMSE_Interceptx1x2x3y1MODEL1PARMSy0.48887-10.1280-0.0510.586950.287-12MODEL1RIDGEVIFy0.00方差膨胀因子185.9971.01891186.11013MODEL1RIDGEy0.000.48887-10.1280-0.0510.586950.28714MODEL1RIDGEVIFy0.018.5990.981928.604-15MODEL1RIDGEy0.010.55323-9.18050.0460.598860.14416MODEL1RIDGEVIFy0.022.8580.962192.859-17MODEL1RIDGEy0.020.57016-8.92770.0570.595420.127-18MODEL1RIDGEVIFy0.031.5020.943451.502-19MODEL1RIDGEy0.030.57959-8.73370.0610.590800.120-110MODEL1RIDGEVIFy0.040.9790.925320.979-111MODEL1RIDGEy0.040.58745-8.55830.0640.585910.116-1,主分量回归,主分量回归是将具有多重相关的变量集综合得出少数几个互不相关的主分量.两步:
(1)找出自变量集的主分量,建立y与互不相关的前几个主分量的回归式.
(2)将回归式还原为原自变量结果.详见,方开泰;,主分量回归结果,Obs_MODEL__TYPE__DEPVAR__PCOMIT__RMSE_Interceptx1x2x3y1MODEL1PARMSy0.48887-10.1280-0.051400.586950.2868512MODEL1IPCVIFy10.250831.000850.2503813MODEL1IPCy10.55001-9.13010.072780.609220.1062614MODEL1IPCVIFy20.249560.000950.24971-15MODEL1IPCy21.05206-7.74580.073810.082690.10735-1,主分量回归结果,由输出结果看到在删去第三个主分量(pcomit=1)后的主分量回归方程:
Y=-9.1301+0.07278x1+0.60922x2+0.10626x3;该方程的系数都有意义,且回归系数的方差膨胀因子均小于1.1;主分量回归方程的均方根误差(_RMSE=0.55)比普通OLS方程的均方根误差(_RMSE=0.48887)有所增大但不多。
Sas程序,dataex01;inputx1x2x3y;labelx1=国内生产总值;labelx2=存储量;labelx3=消费量;labely=进口总额;cards;149.34.2108.115.9161.24.1114.816.4171.53.1123.219.0175.53.1126.919.1180.81.1132.118.8190.72.2137.720.4202.12.114622.7212.45.6154.126.5226.15.0162.328.1231.95.1164.327.6239.00.7167.626.3;run;,proccorrdata=ex01;varx1-x3;run;*岭回归*;procregdata=ex01outest=ex012graphicsoutvif;modely=x1-x3/ridge=0.0to0.1by0.01;plot/ridgeplot;run;procprintdata=ex012;run;*主分量回归法*;procregdata=ex01outest=ex103;modely=x1-x3/pcomit=1,2outvif;*pcomit表示删去最后面的1或2个主分量,用前面m-1或m-2各主分量进行回归*;run;procprintdata=ex103;run;,Sas程序,/*theiltest*/;procregdata=ex01;equation3:
modely=x1x2;equation2:
modely=x1x3;equation1:
modely=x2x3;run;/*r-.9473;r3s=0.9828*/;datatheil;rsq=0.9919;r1s=0.9913;r2s=0.9473;r3s=0.9828;theil=rsq-(3*rsq-(r1s+r2s+r3s);puttheil=;run;/*辅助回归检验法*/;procregdata=ex01;equation3:
modelx3=x1x2;equation2:
modelx2=x1x3;equation1:
modelx1=x2x3;run;,/*FGtest*/;proccorrdata=ex01outp=corrnosimple;varx1-x3;run;procprintdata=corr;run;title计算相关矩阵的行列式;prociml;R=1.0000.0260.997,0.02610.036,0.91520.63061;d=det(R);printd;run;/*d=0.081371*/;title计算检验统计量及其p值;datafg;n=11;p=3;d=0.081371;fg=-(n-1-1/6*(2*p+5)*log(d);df=p(p-1)/2;p=1-probchi(fg,df);putfg=p=;run;/*fg=20.488013401p=0.0001344625,拒绝零假设*/;,异方差的检验和补救,OLSEunbiased,inefficient;t,Ftestinvalid;forecastaccuracydecreased.Ifthemodeliswell-fitted,thereshouldbenopatterntotheresidualsplottedagainstthefittedvalues.Ifthevarianceoftheresidualsisnon-constant,thentheresidualvarianceissaidtobeheteroscedastic.,异方差的检测,Therearegraphicalandnon-graphicalmethodsfordetectingheteroscedasticity.Acommonlyusedgraphicalmethodistoplottheresidualsversusfitted(predicted)values.Example:
grade:
educatedyears;potexp:
workingyears;exp2=potexp2;union:
dummyvariable.,收入方程回归的结果,DependentVariable:
LNWAGEAnalysisofVarianceSumofMeanSourceDFSquaresSquareFValuePrFModel412.422363.1055914.06|t|Intercept10.595110.283492.100.0384GRADE10.083540.020094.16.0001POTEXP10.050270.014143.560.0006EXP21-0.000561720.00028785-1.950.0540UNION10.165930.124451.330.1856,图示法检测,利用残差平和对因变量的预测值做散点图如右图所示:
残差变化不大,因此认为没有异方差存在.,怀特检验,Sas程序结果:
AnalysisofVariancSumofMeanSourceDFSquaresSquareFValuePrFModel121.188810.099070.880.5731Error879.830780.11300CorrectedTotal9911.01958RootMSE0.33615R-Square0.1079DependentMean0.20989AdjR-Sq-0.0152CoeffVar160.15281ParameterStandardVariableDFEstimateErrortValuePr|t|Intercept1-0.077670.98580-0.080.9374GRADE1-0.012200.12502-0.100.9225POTEXP10.077840.071881.080.2819EXP21-0.003990.00409-0.970.3325UNION10.648790.861600.750.4535grade210.002200.004250.520.6065exp41-3.34378E-70.00000151-0.220.8256exp310.000061700.000141920.430.6648gx210.000116830.000111021.050.2955gp1-0.003750.00494-0.760.4498gu1-0.051370.04430-1.160.2494pu10.001930.060610.030.9746eu1-0.000221850.00126-0.180.8605,残差项平方对所有一阶,二阶及交叉项回归.1.由左边的结果可知:
故同方差的假设未被拒绝.2.Procregdata=aa;Modely=x/spec;Run;可得到相同的结果。
布罗施-帕甘/戈弗雷检验怀特检验的特例,
(1)OLS残差额et和一个估计的干扰误差
(2)用OLS将对选中的解释变量进行回归,并计算解释平方和(ESS);(3)在零假设下,有(4)一个更简单且渐进等价的做法是直接利用残差平方对选中的解释变量进行回归.在零假设(同方差)下,DependentVariable:
rsqSumofMeanSourceDFSquaresSquareFValuePrFModel121.188810.099070.880.5731Error879.830780.11300CorrectedTotal9911.01958RootMSE0.33615R-Square0.1079DependentMean0.20989AdjR-Sq-0.0152,BPGtestresults
(1),BPGtestresults
(2),DependentVariable:
rsqadjustAnalysisofVarianceSumofMeanSourceDFSquaresSquareFValuePrFModel310.704153.568051.430.2386Error96239.411162.49387CorrectedTotal99250.11531RootMSE1.57920R-Square0.0428DependentMean0.99997AdjR-Sq0.0129CoeffVar157.92443ESS=10.70415,BPGtestresults(3),*ESS=5.35FModel30.471600.157201.430.2386Error9610.547980.10987RootMSE0.33147R-Square0.0428,戈德菲尔德-匡特(Goldfeld-Quandt)检验,按potexp的值将数据从小到大进行排列.取前后个35个观测值分别回归.c=30;回归的主要结果:
RSS1=6.39573;RSS2=7.2517;RSS2/RSS1=1.13;而;该比值不显著,不能拒绝同方差的原假设;去掉的中间观测值的个数要适中,否则会降低功效,一般取观测值个数的1/3.,补救措施-已知方差的形式,1.广义最小二乘法(GLS);请参考讲义中的例子;2.模型变换法,适用于函数型异方差;已知方差的函数形式;3.加权最小二乘法(WLS);实质上是一种模型变换法;具体参见讲义中的例子;采用面板数据,增加信息量.,未知方差的形式,Furnival(1961)提出了一种拟合指数进行不断的修正,最后找出最佳的权重(使得该指数值最小).,处理盲点-robustregression,1.迭代加权最小二乘法(IRLS),Neter提出了2中加权函数,HuberandBisquare,但是不易操作.SASv8中常使用ProcNLIN迭代.2.非参数回归.ProcLoess.3.SASv9.0中有一个过程ProcrobustregStata中有一个比较好的命令:
rreg直接进行鲁棒回归(robust),采用迭代过程.,序列相关性(serialcorrelation),OLSEunbiased,butinefficientanditsstandarderrorestimatorsareinvalid;BLUEoftheGauss-MarkovTheoremnolongerholds.Thevarianceformulasfortheleastsquaresestimatorsareincorrect.AR,MA,orARMAformsofserialcorrelation.TaketheAR
(1)forinstance:
Dw检验需要注意的地方,假定了残差是服从正态分布,而且是同方差;自变量是外生的,如果包含了内生滞后变量,就需要用修正的dh检验(procautoreg).只适用于一阶自相关,对高阶或非线性自相关不适用.样本容量至少为15.,自相关检验的标准,德宾和沃森根据显著水平,n,k,确定了二个临界值du(上界),dl(下界);然后进行比较;
(1)ddu,不拒绝零假设;(3)dl2,负自相关;d=2,无自相关;,Eg:
Icecreamdemand(Hildreth,Lu(1960),Cons:
consumptionoficecreamperhead(pints);Income:
averagefamilyincomeperweek($);Price:
priceoficecream(perpint);Temp:
averagetemperature(inFahrenheit);Data:
30four-weeklyobsfromMarch1951to11July1953;,残差的散点图,回归结果,ParameterEstimatesParameterStandardVariableDFEstimateErrortValuePr|t|Intercept10.197320.270220.730.4718price1-1.044410.83436-1.250.2218income10.003310.001172.820.0090temp10.003460.000445557.76.0001Durbin-WatsonD1.021NumberofObservations301stOrderAutocorrelation0.330,1.DWtest,查表可得:
在0.05的显著水平上,dl=1.21(N=30,k=3);du=1.65;直接在回归的语句中加上一个dw选项;Dw=1.021dl=1.21;故有一阶正的自相关;,2.当回归元严格外生时-AR
(1)序列相关的检验,1.yt对做xt1,xt2,xtk回归,得到残差t.2.进行回归:
t对t-1,采用t检验.注意:
采用t检验时,必须假定:
t=t-1+et种的误差项et服从同方差的假定,否则采用稳健的检验统计量(robust).,3.当回归元非严格外生时-AR
(1)序列相关的检验步骤,当解释变量非严格外生时,会有一个或多个解释变量和ut-1相关,t检验和dw检验失效.例如含滞后因变量一种解决办法:
dh检验统计量(Durbin,1970).另一种更一般的方法,无论有多少个非严格外生变量都有效:
1.yt对做xt1,xt2,xtk回归,得到残差t.2.进行回归:
t对xt1,xt2,xtk,t-1(包含截距项),采用t检验.(同样可以采取稳健性t检验),4.高阶的BG(Breusch-Godfrey检验)AR(P)序列相关检验,假设干扰项:
零假设:
所有自回归系数为零;检验步骤:
(拉格朗日乘数检验)
(1)yt对做xt1,xt2,xtk回归,得到残差t.
(2)辅助回归(3),Breusch-Goldfrey(BG)test,P=1;(一般从低阶开始探测直到10左右,如果没有什么显著的结果,就认为扰动项不存在序列相关).e(t)e(t-1),OLSN*R-square=29*0.15=4.35;因此拒绝零假设,认为有自相关;且显著一阶正相关;ParameterEstimatesParameterStandardVariableDFEstimateErrortValuePr|t|resid10.384540.170292.260.0319,补救方法,1.已知rho时,采用广义差分变换.2.未知rho时,先求相关系数,然后进行广义差分.求相关系数的方法有:
(1)Cochrane-Orcutt迭代方法;
(2)Hildreth-Lu.(3)Durbin2step.,对严格外生回归元的序列相关的校正AR
(1)模型-可行的广义最小二乘法(FGLS),采用估计的相关系数值回归方程:
FGLS步骤:
1.yt对做xt1,xt2,xtk回归,得到残差t.2.t=t-1+et,求出相关系数的估计值3.对上面的方程进行回归.常见的标准误,t统计量和F统计量都是渐进正确的.采用相关系数估计值的代价是FGLS有限样本性质较差,可能不是无偏的(数据弱相关时),但仍然是一致的.尽管FGLS不是无偏的,不是BLUE,但是当序列相关的AR
(1)模型成立时,比OLS更渐进有效,区分科克伦-奥克特(Cochrane-Orcutt)和普莱斯-温斯登(Paris-Winsten)估计,Co估计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济 计量学 各种 检验 北大 光华 王志刚