STATA面板大数据模型操作命令.docx
- 文档编号:29948003
- 上传时间:2023-08-03
- 格式:DOCX
- 页数:14
- 大小:273.02KB
STATA面板大数据模型操作命令.docx
《STATA面板大数据模型操作命令.docx》由会员分享,可在线阅读,更多相关《STATA面板大数据模型操作命令.docx(14页珍藏版)》请在冰豆网上搜索。
STATA面板大数据模型操作命令
STATA面板数据模型估计命令一览表
一、静态面板数据的STATA处理命令
固定效应模型
随机效应模型
(一)数据处理
输入数据
●tssetcodeyear该命令是将数据定义为“面板”形式
●xtdes该命令是了解面板数据结构
●summarizesqcpiunemgse5ln各变量的描述性统计(统计分析)
●genlag_y=L.y///////产生一个滞后一期的新变量
genF_y=F.y///////产生一个超前项的新变量
genD_y=D.y///////产生一个一阶差分的新变量
genD2_y=D2.y///////产生一个二阶差分的新变量
(二)模型的筛选和检验
●1、检验个体效应(混合效应还是固定效应)(原假设:
使用OLS混合模型)
●xtregsqcpiunemgse5ln,fe
对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。
在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。
●2、检验时间效应(混合效应还是随机效应)(检验方法:
LM统计量)
(原假设:
使用OLS混合模型)
●quixtregsqcpiunemgse5ln,re(加上“qui”之后第一幅图将不会呈现)
xttest0
可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。
可见,随机效应模型也优于混合OLS模型。
●3、检验固定效应模型or随机效应模型(检验方法:
Hausman检验)
原假设:
使用随机效应模型(个体效应与解释变量无关)
通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。
但是无法明确区分FEorRE的优劣,这需要进行接下来的检验,如下:
Step1:
估计固定效应模型,存储估计结果
Step2:
估计随机效应模型,存储估计结果
Step3:
进行Hausman检验
●quixtregsqcpiunemgse5ln,fe
eststorefe
quixtregsqcpiunemgse5ln,re
eststorere
hausmanfe(或者更优的是hausmanfe,sigmamore/sigmaless)
可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。
此时,需要采用工具变量法和是使用固定效应模型。
(三)静态面板数据模型估计
●1、固定效应模型估计
●xtregsqcpiunemgse5ln,fe(如下图所示)
其中选项fe表明我们采用的是固定效应模型,表头部分的前两行呈现了模型的估计方法、界面变量的名称(id)、以及估计中使用的样本数目和个体的数目。
第3行到第5行列示了模型的拟合优度、分为组内、组间和样本总体三个层面,通常情况下,关注的是组内(within),第6行和第7行分别列示了针对模型中所有非常数变量执行联合检验得到的F统计量和相应的P值,可以看出,参数整体上相当显著。
需要注意的是,表中最后一行列示了检验固定效应是否显著的F统计量和相应的P值。
显然,本例中固定效应非常显著。
●2、随机效应模型估计
若假设本例的样本是从一个很大的母体中随机抽取的,且
与解释变量均不相关,则我们可以将
视为随机干扰项的一部分。
此时,设定随机效应模型更为合适。
●xtregsqcpiunemgse5ln,re(如下图所示)
●3、时间固定效应(以上分析主要针对的是个体效应)
如果希望进一步在上述模型中加入时间效应,可以采用时间虚拟变量来实现。
首先,我们需要定义一下T-1个时间虚拟变量。
●tabyear,gen(dumt)(tab命令用于列示变量year的组类别,选项gen(dumt)用于生产一个以dumt开头的年度虚拟变量)
dropdumt1(作用在于去掉第一个虚拟变量以避免完全共线性)
若在固定效应模型中加入时间虚拟变量,则估计模型的命令为:
●xtregsqcpiunemgse5lndumt*,fe
(四)异方差和自相关检验
●1、异方差检验(组间异方差)本节主要针对的是固定效应模型进行处理
(1)检验
原假设:
同方差需要检验模型中是否存在组间异方差,需要使用xttest3命令。
●quixtregsqcpiunemgse5ln,fe
xttest3
显然,原假设被拒绝。
此时,需要进一步以获得参数的GLS估计量,命令为xtgls:
●xtglssqcpiunemgse5ln,panels(heteroskedastic)
其中,组间异方差通过panels()选项来设定。
上述结果是采用两步获得,即,先采用OLS估计不考虑异方差的模型,进而利用其残差计算。
。
。
,并最终得到FGLS估计量。
●2、序列相关检验
对于T较大的面板而言,
往往无法完全反映时序相关性,此时
便可能存在序列相关,在多数情况下被设定为AR
(1)过程。
原假设:
序列不存在相关性。
(1)FE模型的序列相关检验
对于固定效应模型,可以采用Wooldridge检验法,命令为xtserial:
●xtserialsqcpiunemgse5ln
可以发现,这里的P=0.0000,我们可以在1%的显著性水平下爱拒绝不存在序列相关的原假设。
考虑到样本,该检验的最后一步是用
对
进行OLS回归,因此,输入以下命令得到
。
检验该值是否显著异于-0.5,因为在原假设下(不相关)
,可见本例中不相等,拒绝原假设,说明存在序列相关。
●matliste(b)
(2)RE模型的序列相关检验
对于RE模型,可以采用xttest1命令来执行检验:
●quixtregsqcpiunemgse5lndumt*,re
xttest1
这里汇报了4个统计量,分别用于检验RE模型中随机效应(单尾和双尾)、序列相关以及二者的联合显著性,检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著。
(3)稳健型估计
上述结果表明,无论是FE还是RE模型,干扰项中都存在显著的序列相关。
为此,我们进一步采用xtregar命令来估计模型,首先考虑固定效应模型:
●xtregarsqcpiunemgse5lndumt*,felbi
●3、“异方差—序列相关”稳健型标准误
虽然上述估计方法在估计方差-协方差矩阵时考虑了异方差和序列相关的影响,但都未将两者联立在一起考虑,要获得“异方差-序列相关”稳健型标准误,只需在xtreg命令中附加vce(robust)或者vce(cluster)选项即可。
例如,对于FE模型,我们可以执行如下命令:
●xtregsqcpiunemgse5ln,fevce(robust)
与之前未经处理的估计结果相比,附加命令vce(robust)选项时的结果,虽然系数的估计值未发生变化,但此时得到的标准误明显增大了,致使得到的估计结果更加保守。
对于面板数据模型而言,STATA在计算所谓的“robust”标准误时,是以个体为单位调整标准误的。
因此,我们得到的“robust”标准误其实是同时调整了异方差和序列相关后的标准误。
换言之,上述结果与设定vce(cluster)选项的结果完全相同。
●4、截面相关检验原假设:
截面之间不存在着相关性
(1)FE模型检验
对于FE模型,可以利用xttest2命令来检验截面相关性:
●quixtregsqcpiunemgse5ln,fe
xttest2(该命令主要针对的是大T小N类型的面板数据,在本例中无法使用,故图标略去。
)
(2)RE模型检验
对于RE模型,可以利用xtcsd命令来检验截面相关性:
●quixtregsqcpiunemgse5ln,re
xtcsd,pesaran(下面命令是另一个检验指标)
xtcsd,frees
可以看出,两种不同的检验方法均显示面板数据存在着截面相关性。
●5、“异方差—序列相关—截面相关”稳健型标准误
(1)FE模型估计
对于FE模型,在确认上述存在着截面相关的情况下,我们可以采用Hoechle(2007)编写的xtscc命令获取DriscollandKraay(1998)提出的“异方差—序列相关—截面相关”稳健型标准误:
●xtsccsqcpiunemgse5ln,fe
这里,xtscc命令会自动选择的滞后阶数为2,系数估计值和Within-R2与xtreg,fe的结果完全相同,但标准误存在着较大差异。
可见,在本例中,截面相关对统计推断有较大的影响。
若读者有跟高的方法来确定自相关的滞后阶数,则可以通过lag()选项设定。
当然,在多数情况下,这很难做到。
不过我们可以通过附加lag(0)来估计仅考虑异方差和截面相关的稳健型标准误,命令如下:
●xtsccsqcpiunemgse5ln,felag(0)
(2)RE模型估计(略,待补充)
二、动态面板数据的STATA处理命令
(一)差分GMM
xtabondlnwicdlngdplanddocfirlnroadlnpopfina
xtabondlnwicdlngdplanddocfirlnroadlnpopfina,lag
(2)twostep
(二)系统GMM
xtdpdsyslnwicdlngdplanddocfirlnroadlnpopfina
xtdpdsyslnwicdlngdplanddocfirlnroadlnpopfina,twostep
(三)内生性检验
●estatsargan
(四)序列相关检验
●estatabond
三、门槛(门限回归)面板模型的STATA处理命令
xtthresy,thres(q)dthres(x)bs1(30)bs2(30)bs3(20)
各个门槛的置信区间图:
xttr_graph第一轮搜索第一个门槛
xttr_graph,m(22)第二轮搜索第二个门槛
xttr_graph,m(21)第二轮搜索第一个门槛
xttr_graph,m(3)
呈现估计结果:
localq1=e(rhat21)取出门槛值
localq2=e(rhat22)
gend1=(q<=’q1’)生成虚拟变量
gend2=(q>’q2’)
genxd1=x*d1
genxd2=x*d2
xtregyxxd1xd2,fe常规标准误
eststorefe
xtregyxxd1xd2,ferobust稳健型估计
eststorefe_robust
localm”fefe_robust”
esttab‘m’,mtitle(‘m’)nogaps(r2r2_wNF)///star(*0.1**0.05***0.01)
1.检验:
是否存在门槛效应
混合面板:
regislfrlfr2hcopenpsratpgr,vce(clustersf)
固定效应、随机效应模型
xtregislfrlfr2hcopenpsratpgr,fe
eststorefe
xtregislfrlfr2hcopenpsratpgr,re
eststorere
hausmanfe
两步系统GMM模型
xtdpdsysrltplf1naiefdopewig,lags
(1)maxldep
(2)twostepartests
(2)
注:
rlt为被解释变量,“plf1naiefdopewig”为解释变量和控制变量;
maxldep
(2)表示使用被解释变量的两个滞后值为工具变量;pre()表示以某一个变量为前定解释变量;endogenous()表示以某一个变量为内生解释变量。
自相关检验:
estatabond
萨甘检验:
estatsargan
差分GMM模型
Xtabondrltplf1naiefdopewig,lags
(1)twostepartests
(2)
内生:
该解释变量的取值是(一定程度上)由模型决定的。
内生变量将违背解释变量与误差项不相关的经典假设,因而内生性问题是计量模型的大敌,可能造成系数估计值的非一致性和偏误;
外生:
该解释变量的取值是(完全)由模型以外的因素决定的。
外生解释变量与误差项完全无关,不论是当期,还是滞后期。
前定:
该解释变量的取值与当期误差项无关,但可能与滞后期误差项相关。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- STATA 面板 数据模型 操作 命令