面板数据分析案例.docx
- 文档编号:25594050
- 上传时间:2023-06-10
- 格式:DOCX
- 页数:12
- 大小:83.04KB
面板数据分析案例.docx
《面板数据分析案例.docx》由会员分享,可在线阅读,更多相关《面板数据分析案例.docx(12页珍藏版)》请在冰豆网上搜索。
面板数据分析案例
面板数据分析案例
一、打开数据
禾U用stata软件打开数据gurnfeld.dta,得到有关
第一步,声明截面变量和时间变量。
命令为:
tssetcompanyyear或xtsetcompanyyear
第二步,进行样本的描述性统计。
首先我们看看样本的大体分布情况,命令为:
xtdes
company:
1,2,...,10n=10
year:
1935,1936,...,1954T=20
Delta(year)=1year
Span(year)=20periods
(company*yearuniquelyidentifieseachobservation)
DistributionofTi:
min5%25%50%75%95%max
20202020202020
Freq.PercentCum.|Pattern
+
10100.00100.00|111
+
10100.00|XXXXXXXXXXXXXXXXXXXX
接下来,我们列示出样本中主要变量的基本统计量,命令为:
xtsum
xtsuminvestmvaluekstock
我们发现统计结果是按照”整体"、"组间"和"组"三个层次进行的。
当然,你也可以采用sum命令来得到基本统计量,而且在写论文时,所需列示的结果并不要求像上面那么详细,此时sum命令反而更实用。
第三歩,面板数据模型回归分析。
我们先做固定效应模型,命令为:
R-sq:
within=0.4117between=0.8078overall=0.7388
corr(u_i,Xb)=0.6955
Obspergroup:
min=20
avg=20.0
max=20
F(2,188)=65.78
Prob>F=0.0000
mvalue|
+
Coef.
Std.Err.
tP>|t|
[95%Conf.Interval]
invest|
2.856166
.3075147
9.291
0.000
2.249543
3.462789
kstock|
-.5078673
.1403662
-3.62
0.000
-.7847625
-.2309721
_cons|
+
804.9802
32.43177
24.82
0.000
741.0033
868.9571
sigma_u
|905.81517
sigma_e
|268.73329
rho|.!
91910377
(fractionofvarianeedueto
u_i)
Ftestthatallu_i=0:
F(9,188)=
113.76
Prob>F=
0.0000
结果的前两行列示了模型的类别(本例中为固定效应模型)、截面变量、以及估计中使用的样
本数目和个体的数目。
第3行到第5行列示了模型的拟合优度,分为组、组间和样本总体三个层次。
第6行和第7行分别列示了针对参数联合检验的F统计量和相应的P值,本例中
分别为65.78和0.0000,表明参数整体上相当显著。
第8-11行列示了解释变量的估计系数、
标准差、t统计量和相应的P值以及95%勺置信区间,这和我们在进行截面回归是得到的结果是一样的。
最后四行列示了固定效应模型中个体效应和隨机干扰项的方差估计值(分别为
sigma_u和sigma_e),二者之间的关系(rho)。
最后一行给出了检验固定效应是否显著的F
统计量和相应的P值,本例中固定效应非常显著。
估计随机效应模型的命令为:
xtregmvalueinvestkstock,re
mvalue|
+
Coef.
Std.Err.
zP>|z|[95%Conf.Interval]
invest|
3.113429
.3076132
10.120.000
2.510519
3.71634
kstock|
-.578422
.1424721
-4.060.000
-.8576622
-.2991819
_cons|
+
786.9048
182.1715
4.320.000
429.8553
1143.954
sigma_u
|546.52144
sigma_e
|268.73329
rho|.80529268
(fractionofvarianeedueto
u_i)
第四歩,模型的筛选和检验。
这是模型设定过程中最为关键同时也是最难的一歩,主要涉及使用【混合效应】混合OLS
模型(最小二乘估计)、固定效应模型还是随机效应模型,更进一歩还可能包括序列相关和异
方差的检验等问题。
在这方面功力的提髙需要大量的实践经验和对理论的深入理解。
1)检验个体效应的显著性。
对于固定效应模型而言,回归结果中最后一行汇报的F统计量
便在于检验所有的个体效应整体上是否显著。
在我们的例子中,上而的检验结果表明固定效
应模型优于混合的OLS模型。
下面我们说明如何检验随机效应是否显著,命令为:
若模型检验下面没有F检验,就输入xttestO
注明:
通过豪斯曼检验,使用固定效应/随机效应
BreuschandPaganLagrangianmultipliertestforrandomeffects
mvalue[company,t]=Xb+u[company]+e[company,t]
Estimatedresults:
|Varsd=sqrt(Var)
+
mvalue|17278311314.47
e|72217.58268.7333
u|298685.7546.5214
Test:
Var(u)=0
chibar2(01)=772.32
Prob>chibar2=0.0000
检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS
模型,至于固定效应模型和随机效应模型何者更佳,则要采用Hausman检验来确定。
2)hausman检验。
具体步骤为:
step1:
估计固定效应模型模型,存储估计结果;
step2:
估计随机效应模型,存储估计结果;
step3:
进行Hausman检验
quixtregmvalueinvestkstock,fe/*step1*/
.eststorefe
.quixtregmvalueinvestkstock,re/*step2*/
.eststorere
.hausmanfe/*step3*/
这里qui的作用在于不把估计结果输出到屏幕上,eststore的作用在十把估计结果存储
到名称为fe的临时性文件中。
输出结果为:
—Coefficients—
|(b)(B)(b-B)sqrt(diag(V_b-V_B))
|fereDiffereneeS.E.
+
invest|2.8561663.113429-.2572636
kstock|-.5078673-.578422.0705548.
b=consistentunderHoandHa;obtainedfromxtreg
B=inconsistentunderHa,efficientunderHo;obtainedfromxtreg
Test:
Ho:
differeneeincoefficientsnotsystematic
chi2
(2)=(b-B)'[(V_b-V_B)A(-1)](b-B)=2366.62
Prob>chi2=0.0000
(V_b-V_Bisnotpositivedefinite)
我们注意到输出结果的最后一行提示说固定效应模型和随机效模型的参数估计方差的差是
-个非正定矩阵,因此sqrt(diag(V_b-V_B))一项全为缺失值。
这是在进行Hausman检验过
程中经常遇到的问题,有时我们还会得到负的chi2值。
产生这些情况的原因可能有多种,
但一个主要的原因是我们的模型设定有问题,导致hausman检验的基本假设得不到满足。
这时,我们最好先对模型的设定进行分析,看看是否有遗漏变量的问题,或者某些变量是非
平稳的等等。
在确定模型的设定没有问题的情况再进行检验,如果仍然拒绝原假设或是出现
上面的问题,那么我们就认为随机效应模型的基本假设(个体效应与解释变量不相关)得不
到满足。
此时,需要采用工具变量法或是使用固定效应模型。
在本例中,如果抛开sqrt(diag(V_b-V_B))一项全为缺失值这一问题,从检验的P值为零这一结果来看,随机效
应模型的假设无法满足,所以采用同定效应模型是比较合适的。
对于采用stata9.0或以上版本的读者而言,使用Hausman命令中新增的sigmaless和
sigmamore两个选项可以大大降低上述chi2值为负的情况出现的次数。
着下面的例子:
hausmanfe,sigmaless
—Coefficients—
|(b)(B)(b-B)sqrt(diag(V_b-V_B))
|fereDiffereneeS.E.
一+
invest|2.8561663.113429-.2572636.0803747
kstock|-.5078673-.578422.0705548.0283398
b=consistentunderHoandHa;obtainedfromxtreg
B=inconsistentunderHa,efficientunderHo;obtainedfromxtreg
Test:
Ho:
differeneeincoefficientsnotsystematic
chi2
(2)=(b-B)'[(V_b-V_B)A(-1)](b-B)
=16.58
Prob>chi2=0.0003
以及
hausmanfe,sigmamore
—Coefficients—
|(b)(B)(b-B)sqrt(diag(V_b-V_B))
|fereDiffereneeS.E.
+
invest|2.8561663.113429-.2572636.0832959
kstock|-.5078673-.578422.0705548.0293698
b=consistentunderHoandHa;obtainedfromxtreg
B=inconsistentunderHa,efficientunderHo;obtainedfromxtreg
Test:
Ho:
differeneeincoefficientsnotsystematic
chi2
(2)=(b-B)'[(V_b-V_B)A(-1)](b-B)
=15.44
Prob>chi2=0.0004
时间固定效应
如果希望进一歩在上述模型中加入时间效应,需要定义T-1个时间虚拟变量:
tabyear,gen(dumt)
dropdumt1
这里,为样本中标示时间的变量,选项gen(dumt)的作用在于产生T个年度虛拟变量,第
二条命令的作用在于去掉第一个虛拟变量以避免共线性。
若在固定效应模型中加入时间虚拟变量,则估计命令为:
xtregmvalueinvestkstockdumt*,fe
若估计随机效应模型,命令为:
xtregmvalueinvestkstockdumt*,re
无论估计哪一个模型,检验时间效应的命令均为
testdumt2=dumt3=dumt4=dumt5=dumt6==0
这里我们假设T=6,所以有5个时间虚拟变量序列相关和截面相关检验对于固定效应模型,我们可以采用前面介绍的基于差分估计量的检验方法来检验序列相关是否存在,命令为:
xtserialmvalueinvestkstock
输出结果为:
WooldridgetestforautocorrelationinpaneldataHO:
nofirstorderautocorrelation
F(1,9)=5.698
Prob>F=0.0408
可见,我们在5%的显著水平上拒绝了不存在序列相关的原假设,考虑到本例中样本的时间
跨度为20年,这个结论还是比较合理的。
对于随机效应模型,我们可以采用xttest1命令进行检验,命令为:
quixtregmvalueinvestkstock,re
xttest1
输出结果为:
Testsfortheerrorcomponentmodel:
mvalue[company,t]=Xb+u[company]+v[company,t]v[company,t]=lambdav[company,(t-1)]+e[company,t]
Estimatedresults:
|Varsd=sqrt(Var)
+
e|72217.58268.73329
u|298685.7546.52144
Tests:
RandomEffects,TwoSided:
ALM(Var(u)=O)=634.29Pr>chi2
(1)=0.0000
RandomEffects,OneSided:
ALM(Var(u)=0)=25.19Pr>N(0,1)=0.0000
SerialCorrelation:
=13.91Pr>chi2
(1)=0.0002
ALM(lambda=0)
JointTest:
LM(Var(u)=0,lambda=0)=786.24Pr>chi2
(2)=0.0000
该命令是针对随机效应模型的,汇报了7个统计量,用于检验随机效应(单尾和双尾)、
序列相关以及二者的联合显著性。
检验结果表明存在随机效应和序列相关,而且对随机效应
和序列相关的联合检验也非常显著。
许多面板数据都是针对国家或公司的,因此截面间往往会存在相关性,我们可以利用
xttest2命令来检验固定效应模型中截面间的相关性是否显著。
请参考Greene(2000,第601页),检验的命令为:
对于该命令的理论解释部分
quixtregmvalueinvestkstock,fe
xttest2
输出结果为:
Correlationmatrixofresiduals:
e1
e2
e3
e4
e5e
6e7
e8
__e9
__e10
__e1
1.0000
__e2
0.3746
1.0000
__e3
0.6064
0.4337
1.0000
__e4
0.8056
0.1370
0.5072
1.0000
__e5
-0.1700
-0.5253
0.1597
-0.0227
1.0000
__e6
-0.0799
-0.4317
0.3103
0.0086
0.9428
1.0000
__e7
0.2392
-0.4190
0.3872
0.2967
0.5548
0.6132
1.0000
__e8
0.2090
-0.1227
0.6950
0.3424
0.7438
0.7888
0.5264
1.0000
__e9
0.1894
-0.2176
0.5794
0.2217
0.7218
0.7961
0.4753
0.8615
1.0000
e10
0.6661
0.4116
0.1157
0.3515
-0.5425
-0.4422
0.0208
-0.4282
-0.37801.0000
Breusch-PaganLMtestofindependenee:
chi2(45)=211.075,Pr=0.0000
Basedon20completeobservationsoverpanelunits
可见,不同公司的经营行为存在显著的相关性。
对于固定效应模型而言,我们还可以检验截面异方差性,命令为
xttest3
输出结果为:
ModifiedWaldtestforgroupwiseheteroscedasticityinfixedeffectregressionmodel
HO:
sigma(i)A2=sigmaA2foralli
chi2(10)=7.4e+06
Prob>chi2=0.0000
最后总结
检验步骤
指令
显著性判断
固定效应与混合效应
xtregmvalueinvestkstock,fe
若显著,固定效应
随机效应与混合效应
xtregmvalueinvestkstock,rexttest0
若显著,随机效应
固定效应与随机效应
Hausman检验
「若显著,采用固定效应
固定效应序列相关
xtserial
若显著,存在序列相关
随机效应序列相关
quixtregmvalueinvestkstock,rexttestl
若显著,存在序列相关
固定效应截面相关
quixtregmvalueinvestkstock,fe
xttest2
右显者,存在截面相关
固定效应异方差检验
Xttest3
若显著,存在异方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据 分析 案例