书签分享收藏举报版权申诉 / 11

立即下载加入VIP,免费下载

当前位置：首页 > 人文社科 > 视频讲堂 > 面板数据分析.docx

面板数据分析.docx

文档编号：10891027
上传时间：2023-02-23
格式：DOCX
页数：11
大小：22.02KB

面板数据分析.docx

《面板数据分析.docx》由会员分享，可在线阅读，更多相关《面板数据分析.docx（11页珍藏版）》请在冰豆网上搜索。

面板数据分析.docx

面板数据分析

步骤一：

分析数据的平稳性〔单位根检验〕

按照正规程序，面板数据模型在回归前需检验数据的平稳性。

李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进展回归，尽管有较高的R平方，但其结果是没有任何实际意义的。

这种情况称为称为虚假回归或伪回归〔spuriousregression〕。

他认为平稳的真正含义是：

一个时间序列剔除了不变的均值〔可视为截距〕和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。

因此单位根检验时有三种检验模式：

既有趋势又有截距、只有截距、以上都无。

因此为了防止伪回归，确保估计结果的有效性，我们必须对各面板序列的平稳性进展检验。

而检验数据平稳性最常用的方法就是单位根检验。

首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和〔或〕截距项，从而为进一步的单位根检验的检验模式做准备。

单位根检验方法的文献综述：

在非平稳的面板数据渐进过程中,LevinandLin（1993）很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进展检验的早期版本。

后来经过Levinetal.（2002）的改进,提出了检验面板单位根的LLC法。

Levinetal.（2002）指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度（时间序列介于25～250之间,截面数介于10～250之间）的面板单位根检验。

Imetal.（1997）还提出了检验面板单位根的IPS法,但Breitung（2000）发现IPS法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung法。

MaddalaandWu（1999）又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。

由上述综述可知，可以使用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5种方法进展面板单位根检验。

其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分别指Levin,Lin&Chut*统计量、Breitungt统计量、lmPesaran&ShinW统计量、ADF-FisherChi-square统计量、PP-FisherChi-square统计量、HadriZ统计量，并且Levin,Lin&Chut*统计量、Breitungt统计量的原假设为存在普通的单位根过程，lmPesaran&ShinW统计量、ADF-FisherChi-square统计量、PP-FisherChi-square统计量的原假设为存在有效的单位根过程，HadriZ统计量的检验原假设为不存在普通的单位根过程。

有时，为了方便，只采用两种面板数据单位根检验方法，即一样根单位根检验LLC〔Levin-Lin-Chu〕检验和不同根单位根检验Fisher-ADF检验〔注：

对普通序列〔非面板序

列〕的单位根检验方法则常用ADF检验〕，如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的，反之则不平稳。

如果我们以T〔trend〕代表序列含趋势项，以I〔intercept〕代表序列含截距项，T&I代表两项都含，N〔none〕代表两项都不含，则我们可以基于前面时序图得出的结论，在单位根检验中选择相应检验模式。

但基于时序图得出的结论毕竟是粗略的，严格来说，那些检验构造均需一一检验。

具体操作可以参照李子奈的说法：

ADF检验是通过三个模型来完成，首先从含有截距和趋势项的模型开场，再检验只含截距项的模型，最后检验二者都不含的模型。

并且认为，只有三个模型的检验结果都不能拒绝原假设时，我们才认为时间序列是非平稳的，而只要其中有一个模型的检验结果拒绝了零假设，就可认为时间序列是平稳的。

此外，单位根检验一般是先从水平〔level〕序列开场检验起，如果存在单位根，则对该序列进展一阶差分后继续检验，假设仍存在单位根，则进展二阶甚至高阶差分后检验，直至序列平稳为止。

我们记I（0）为零阶单整，I

（1）为一阶单整，依次类推，I（N）为N阶单整。

步骤二：

协整检验或模型修正

情况一：

如果基于单位根检验的结果发现变量之间是同阶单整的，则我们可以进展协整检验。

协整检验是考察变量间长期均衡关系的方法。

所谓的协整是指假设两个或多个非平稳的变量序列，其*个线性组合后的序列呈平稳性。

此时我们称这些变量序列间有协整关系存在。

因此协整的要求或前提是同阶单整。

但也有如下的宽限说法：

如果变量个数多于两个，即解释变量个数多于一个，被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。

另当解释变量的单整阶数高于被解释变量的单整阶数时，则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。

如果只含有两个解释变量，则两个变量的单整阶数应该一样。

也就是说，单整阶数不同的两个或以上的非平稳序列如果一起进展协整检验，必然有*些低阶单整的，即波动相对高阶序列的波动甚微弱〔有可能波动幅度也不同〕的序列，对协整结果的影响不大，因此包不包含的重要性不大。

而相对处于最高阶序列，由于其波动较大，对回归残差的平稳性带来极大的影响，所以如果协整是包含有*些高阶单整序列的话〔但如果所有变量都是阶数一样的高阶，此时也被称作同阶单整，这样的话另当别论〕，一定不能将其纳入协整检验。

协整检验方法的文献综述：

（1）Kao（1999）、KaoandChiang（2000）利用推广的DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。

（2）Pedron（1999）在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。

和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。

（3）Larssonetal（2001）开展了基于Johansen（1995）向量自回归的似然检验的面板协整检验方法，这种检验的方法是检验变量存在共同的协整的秩。

我们主要采用的是Pedroni、Kao、Johansen的方法。

通过了协整检验，说明变量之间存在着长期稳定的均衡关系，其方程回归残差是平稳的。

因此可以在此根底上直接对原方程进展回归，此时的回归结果是较准确的。

这时，我们或许还想进一步对面板数据做格兰杰因果检验〔因果检验的前提是变量协整〕。

但如果变量之间不是协整〔即非同阶单整〕的话，是不能进展格兰杰因果检验的，不过此时可以先对数据进展处理。

引用*晓峒的原话，“如果y和*不同阶，不能做格兰杰因果检验，但可通过差分序列或其他处理得到同阶单整序列，并且要看它们此时有无经济意义。

〞

下面简要介绍一下因果检验的含义：

这里的因果关系是从统计角度而言的，即是通过概率或者分布函数的角度表达出来的：

在所有其它事件的发生情况固定不变的条件下，如果一个事件*的发生与不发生对于另一个事件Y的发生的概率〔如果通过事件定义了随机变量则也可以说分布函数〕有影响，并且这两个事件在时间上又有先后顺序〔A前B后〕，则我们便可以说*是Y的原因。

考虑最简单的形式，Granger检验是运用F-统计量来检验*的滞后值是否显著影响Y〔在统计的意义下，且已经综合考虑了Y的滞后值；如果影响不显著，则称*不是Y的“Granger原因〞〔Grangercause〕；如果影响显著，则称*是Y的“Granger原因〞。

同样，这也可以用于检验Y是*的“原因〞，检验Y的滞后值是否影响*〔已经考虑了*的滞后对*自身的影响〕。

Eviews好似没有在POOL窗口中提供Grangercausalitytest，而只有unitroottest和cointegrationtest。

说明Eviews是无法对面板数据序列做格兰杰检验的，格兰杰检验只能针对序列组做。

也就是说格兰杰因果检验在Eviews中是针对普通的序列对（pairwise）而言的。

你如果想对面板数据中的*些合成序列做因果检验的话，不妨先导出相关序列到一个组中（POOL窗口中的Proc/MakeGroup），再来试试。

情况二：

如果如果基于单位根检验的结果发现变量之间是非同阶单整的，即面板数据中有些序列平稳而有些序列不平稳，此时不能进展协整检验与直接对原序列进展回归。

但此时也不要着急，我们可以在保持变量经济意义的前提下，对我们前面提出的模型进展修正，以消除数据不平稳对回归造成的不利影响。

如差分*些序列，将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。

此时的研究转向新的模型，但要保证模型具有经济意义。

因此一般不要对原序列进展二阶差分，因为对变动数据或增长率数据再进展差分，我们不好对其冠以经济解释。

难道你称其为变动率的变动率？

步骤三：

面板模型的选择与回归

面板数据模型的选择通常有三种形式：

一种是混合估计模型〔PooledRegressionModel〕。

如果从时间上看，不同个体之间不存在显著性差异；从截面上看，不同截面之间也不存在显著性差异，则就可以直接把面板数据混合在一起用普通最小二乘法〔OLS〕估计参数。

一种是固定效应模型〔Fi*edEffectsRegressionModel〕。

如果对于不同的截面或不同的时间序列，模型的截距不同，则可以采用在模型中添加虚拟变量的方法估计回归参数。

一种是随机效应模型〔RandomEffectsRegressionModel〕。

如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应，并且这两个随机误差项都服从正态分布，则固定效应模型就变成了随机效应模型。

在面板数据模型形式的选择方法上，我们经常采用F检验决定选用混合模型还是固定效应模型，然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。

检验完毕后，我们也就知道该选用哪种模型了，然后我们就开场回归：

在回归的时候，权数可以选择按截面加权〔cross-sectionweights〕的方式，对于横截面个数大于时序个数的情况更应如此，表示允许不同的截面存在异方差现象。

估计方法采用PCSE〔PanelCorrectedStandardErrors，面板校正标准误〕方法。

Beck和Katz（1995）引入的PCSE估计方法是面板数据模型估计方法的一个创新，可以有效的处理复杂的面板误差构造，如同步相关，异方差，序列相关等，在样本量不够大时尤为有用。

单位根检验、协整检验和格兰杰因果关系检验三者之间的关系

实证检验步骤：

先做单位根检验，看变量序列是否平稳序列，假设平稳，可构造回归模型等经典计量经济学模型；假设非平稳，进展差分，当进展到第i次差分时序列平稳，则服从i阶单整〔注意趋势、截距不同情况选择，根据P值和原假设判定〕。

假设所有检验序列均服从同阶单整，可构造VAR模型，做协整检验〔注意滞后期的选择〕，判断模型内部变量间是否存在协整关系，即是否存在长期均衡关系。

协整检验的原假设就是，变量回归后的残差是平稳序列。

如假设残差是平稳序列，说明存在协整关系，如果残差序列有单位根，则协整关系不存在。

如果有协整关系，则可以构造VEC模型或者进展Granger因果检验，检验变量之间“谁引起谁变化〞，即因果关系。

一、讨论一1、单位根检验是序列的平稳性检验，如果不检验序列的平稳性直接OLS容易导致伪回归。

2、当检验的数据是平稳的〔即不存在单位根〕，要想进一步考察变量的因果联系，可以采用格兰杰因果检验，但要做格兰杰检验的前提是数据必须是平稳的，否则不能做。

3、当检验的数据是非平稳〔即存在单位根〕，并且各个序列是同阶单整〔协整检验的前提〕，想进一步确定变量之间是否存在协整关系，可以进展协整检验，协整检验主要有EG两步法和JJ检验A、EG两步法是基于回归残差的检验，可以通过建立OLS模型检验其残差平稳性B、JJ检验是基于回归系数的检验，前提是建立VAR模型〔即模型符合ADL模式〕4、当变量之间存在协整关系时，可以建立ECM进一步考察短期关系，Eviews这里还提供了一个Wald－Granger检验，但此时的格兰杰已经不是因果关系检验，而是变量外生性检验，请注意识别

二、讨论二1、格兰杰检验只能用于平稳序列！

这是格兰杰检验的前提，而其因果关系并非我们通常理解的因与果的关系，而是说*的前期变化能有效地解释y的变化，所以称其为“格兰杰原因〞。

2、非平稳序列很可能出现伪回归，协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归，即检验变量之间是否存在稳定的关系。

所以，非平稳序列的因果关系检验就是协整检验。

3、平稳性检验有3个作用：

1〕检验平稳性，假设平稳，做格兰杰检验，非平稳，作协正检验。

2〕协整检验中要用到每个序列的单整阶数。

3〕判断时间学列的数据生成过程。

三、讨论三其实很多人存在误解。

有如下几点，需要澄清：

第一，格兰杰因果检验是检验统计上的时间先后顺序，并不表示而这真正存在因果关系，是否呈因果关系需要根据理论、经历和模型来判定。

第二，格兰杰因果检验的变量应是平稳的，如果单位根检验发现两个变量是不稳定的，则，不能直接进展格兰杰因果检验，所以，很多人对不平稳的变量进展格兰杰因果检验，这是错误的。

第三，协整结果仅表示变量间存在长期均衡关系，则，到底是先做格兰杰还是先做协整呢？

因为变量不平稳才需要协整，所以，首先因对变量进展差分，平稳后，可以用差分项进展格兰杰因果检验，来判定变量变化的先后时序，之后，进展协整，看变量是否存在长期均衡。

第四，长期均衡并不意味着分析的完毕，还应考虑短期波动，要做误差修正检验。

首先建立工作文件。

在翻开工作文件窗口的根底上，点击EViwes主功能菜单上的Objects键，选NewObject功能，从而翻开NewObject〔新对象〕选择窗。

在TypeofObject选择区选择Pool〔合并数据库〕，并在NameofObject选择区为混合数据库起名Pool01〔初始显示为Untitled〕。

〔2〕定义序列名并输入数据。

在新建的混合数据库〔Pool〕窗口的工具栏中点击Sheet键〔第2种路径是，点击View键，选Spreadsheet（stackeddata）功能〕，从而翻开SeriesList〔列写序列名〕窗口，定义时间序列变量Y"和*.点击OK键，从而翻开混合数据库〔Pool〕窗口，〔点击Edit+-键，使EViwes处于可编辑状态〕输入数据。

补充：

点击Order+-键，还可以变换为以时间为序的阵列式排列。

工作文件也可以以合并数据〔Pooldata〕和非合并数据的形式用复制和粘贴的方法建立。

〔3〕估计模型

点击Estimation键，随后弹出PooledEstimation〔混合估计〕对话窗。

用EViwes可以估计固定效应模型〔包括个体固定效应模型、时刻固定效应模型和时刻个体固定效应模型3种〕、随机效应模型、带有AR

（1）参数的模型、截面不同回归系数也不同的面板数据模型。

用EViwes可以选择普通最小二乘法、加权最小二乘法〔以截面模型的方差为权〕、似不相关回归法估计模型参数。

补充：

在这一块内容里面，eviews6.0和eviews5.1的界面还是存在明显差异的，前者的界面是左右排列，后者的界面是上下排列，而且里面的选项形式也不太一样。

5.1软件里面通过选择截距项来确定模型的类型，而6.0的里面是通过选择estimationmethod来选择模型的类型

固定效应模型

在面板数据散点图中，如果对于不同的截面或不同的时间序列，模型的截距是不同的，则可以采用在模型中加虚拟变量的方法估计回归参数，称此种模型为固定效应模型〔fi*edeffectsregressionmodel〕。

固定效应模型分为3种类型，即个体固定效应模型〔entityfi*edeffectsregressionmodel〕、时刻固定效应模型〔timefi*edeffectsregressionmodel〕和时刻个体固定效应模型〔timeandentityfi*edeffectsregressionmodel〕。

个体固定效应模型。

个体固定效应模型就是对于不同的个体有不同截距的模型。

如果对于不同的时间序列〔个体〕截距是不同的，但是对于不同的横截面，模型的截距没有显著性变化，则就应该建立个体固定效应模型。

时刻固定效应模型。

时刻固定效应模型就是对于不同的截面〔时刻点〕有不同截距的模型。

如果确知对于不同的截面，模型的截距显著不同，但是对于不同的时间序列〔个体〕截距是一样的，则应该建立时刻固定效应模型。

时刻个体固定效应模型。

时刻个体固定效应模型就是对于不同的截面〔时刻点〕、不同的时间序列〔个体〕都有不同截距的模型。

如果确知对于不同的截面、不同的时间序列〔个体〕模型的截距都显著地不一样，则应该建立时刻个体效应模型。

随机效应模型

在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。

也可以通过对误差项的分解来描述这种信息的缺失。

yit=a+b1*it+eit

其中误差项在时间上和截面上都是相关的，用3个分量表示如下：

eit=ui+vt+wit

其中ui~N（0,su2）表示截面随机误差分量；vt~N（0,sv2）表示时间随机误差分量；wit~N（0,sw2）表示混和随机误差分量。

同时还假定ui，vt，wit之间互不相关，各自分别不存在截面自相关、时间自相关和混和自相关。

上述模型称为随机效应模型。

随机效应模型和固定效应模型比较，相当于把固定效应模型中的截距项看成两个随机变量。

一个是截面随机误差项〔ui〕，一个是时间随机误差项〔vt〕。

如果这两个随机误差项都服从正态分布，对模型估计时就能够节省自由度，因为此条件下只需要估计两个随机误差项的均值和方差。

假定固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应，而且对均值的离差分别是ui和vt，固定效应模型就变成了随机效应模型。

补充：

如果仅以样本自身效应为条件进展研究，宜选择固定效应模型；如果欲以样本对总体效应进展推论，则应采用随机效应模型。

应用VAR模型时的15个注意点（笔记）

向量自回归〔VAR,VectorAutoregression〕常用于预测相互联系的时间序列系统以及分析随机扰动对变量系统的动态影响。

VAR方法通过把系统中每一个内生变量,作为系统中所有内生变量的滞后值的函数来构造模型，从而回避了构造化模型的要求。

Engle和Granger〔1987a〕指出两个或多个非平稳时间序列的线性组合可能是平稳的。

假设这样一种平稳的或的线性组合存在，这些非平稳〔有单位根〕时间序列之间被认为是具有协整关系的。

这种平稳的线性组合被称为协整方程且可被解释为变量之间的长期均衡关系。

VAR模型对于相互联系的时间序列变量系统是有效的预测模型，同时，向量自回归模型也被频繁地用于分析不同类型的随机误差项对系统变量的动态影响。

如果变量之间不仅存在滞后影响，而不存在同期影响关系，则适合建立VAR模型，因为VAR模型实际上是把当期关系隐含到了随机扰动项之中。

注意点：

1、单位根检验是序列的平稳性检验，如果不检验序列的平稳性直接OLS容易导致伪回归。

2、当检验的数据是平稳的〔即不存在单位根〕，要想进一步考察变量的因果联系，可以采用格兰杰因果检验，但要做格兰杰检验的前提是数据必须是平稳的，否则不能做。

3、当检验的数据是非平稳〔即存在单位根〕，并且各个序列是同阶单整〔协整检验的前提〕，想进一步确定变量之间是否存在协整关系，可以进展协整检验，协整检验主要有EG两步法

和JJ检验

A、EG两步法是基于回归残差的检验，可以通过建立OLS模型检验其残差平稳性

B、JJ检验是基于回归系数的检验，前提是建立VAR模型〔即模型符合ADL模式〕

4、当变量之间存在协整关系时，可以建立ECM进一步考察短期关系，Eviews这里还提供了一个Wald－Granger检验，但此时的格兰杰已经不是因果关系检验，而是变量外生性检验，请注意识别。

5、格兰杰检验只能用于平稳序列！

这是格兰杰检验的前提，而其因果关系并非我们通常理解的因与果的关系，而是说*的前期变化能有效地解释y的变化，所以称其为“格兰杰原因〞。

6、非平稳序列很可能出现伪回归，协整的意义就是检验它们的回归方程所描述的因果关系是否是伪回归，即检验变量之间是否存在稳定的关系。

所以，非平稳序列的因果关系检验就是协整检验。

7、平稳性检验有3个作用：

1〕检验平稳性，假设平稳，做格兰杰检验，非平稳，作协正检验。

2〕协整检验中要用到每个序列的单整阶数。

3〕判断时间学列的数据生成过程。

ADF检验：

1view---unitroottest,出现对话框，默认的选项为变量的原阶序列检验平稳性，确认后，假设ADF检验的P值小于0.5，拒绝原假设，说明序列是平稳的，假设P值大于0.5，承受原假设，说明序列是非平稳的；2重复刚刚的步骤，view---unitroottest,出现对话框，选择1stdifference,即对变量的一阶差分序列做平稳性检验，和第一步中的检验标准一样，假设P值小于0.5，说明是一阶平稳，假设P值大于0.5，则继续进展二阶差分序列的平稳性检验。

先做单位根检验，看变量序列是否平稳序列，假设平稳，可构造回归模型等经典计量经济学模型；假设非平稳，进展差分，当进展到第i次差分时序列平稳，则服从i阶单整〔注意趋势、截距不同情况选择，根据P值和原假设判定〕。

假设所有检验序列均服从同阶单整，可构造VAR模型，做协整检验〔注意滞后期的选择〕，判断模型内部变量间是否存在协整关系，即是否存在长期均衡关系。

如果有，则可以构造VEC模型或者进展Granger因果检验，检验变量之间“谁引起谁变化〞，即因果关系。

第一，格兰杰因果检验是检验统计上的时间先后顺序，并不表示而这真正存在因果关系，是否呈因果关系需要根据理论、经历和模型来判定。

第二，格兰杰因果检验的变量应是平稳的，如果单位根检验发现两个变量是不稳定的，则，不能直接进展格兰杰因果检验，所以，很多人对不平稳的变量进展格兰杰因果检验，这是错误的。

第三，协整结果仅表示变量间存在长期均衡关系，则，到底是先做格兰杰还是先做协整呢？

因为变量不平稳才需要协整，所以，首先因对变量进展差分，平稳后，可以用差分项进展格兰杰因果检验，来判定变量变化的先后时序，之后，进展协整，看变量是否存在长期均衡。

第四，长期均衡并不意味着分析的完毕，还应考虑短期波动，要做误差修正检验。

8.单位根检验是检验数据的平稳性，或是说单整阶数。

9.协整是说两个或多个变量之间具有长期的稳定关系。

但变量间协整的必要条件是它们之间是同阶单整，也就是说在进展协整检验之前必须进展单位根检验。