面板数据的F检验固定效应检验.docx
- 文档编号:26059070
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:23
- 大小:28.81KB
面板数据的F检验固定效应检验.docx
《面板数据的F检验固定效应检验.docx》由会员分享,可在线阅读,更多相关《面板数据的F检验固定效应检验.docx(23页珍藏版)》请在冰豆网上搜索。
面板数据的F检验固定效应检验
标准化工作室编码[XX968T-XX89628-XJ668-XT689N]
面板数据的F检验固定效应检验
面板数据模型(PANELDATA)F检验,固定效应检验
1.面板数据定义。
时间序列数据或截面数据都是一维数据。
例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。
面板数据(paneldata)也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)。
面板数据是同时在时间和截面空间上取得的二维数据。
面板数据示意图见图1。
面板数据从横截面(crosssection)上看,是由若干个体(entity,unit,individual)在某一时刻构成的截面观测值,从纵剖面(longitudinalsection)上看是一个时间序列。
面板数据用双下标变量表示。
例如
yit,i=1,2,…,N;t=1,2,…,T
N表示面板数据中含有N个个体。
T表示时间序列的最大长度。
若固定t不变,yi.,(i=1,2,…,N)是横截面上的N个随机变量;若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。
图1N=7,T=50的面板数据示意图
例如1990-2000年30个省份的农业总产值数据。
固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。
面板数据由30个个体组成。
共有330个观测值。
对于面板数据yit,i=1,2,…,N;t=1,2,…,T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balancedpaneldata)。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。
注意:
EViwes、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例1(file:
panel02):
1996-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1和表2。
数据是7年的,每一年都有15个数据,共105组观测值。
人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。
人均消费和收入的面板数据从纵剖面观察分别见图2和图3。
从横截面观察分别见图4和图5。
横截面数据散点图的表现与观测值顺序有关。
图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
表11999-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费数据(不变价格)
地区人均消费
1996
1997
1998
1999
2000
2001
2002
CP-AH(安徽)
CP-BJ(北京)
CP-FJ(福建)
CP-HB(河北)
CP-HLJ(黑龙江)
CP-JL(吉林)
CP-JS(江苏)
CP-JX(江西)
CP-LN(辽宁)
CP-NMG(内蒙古)
CP-SD(山东)
CP-SH(上海)
CP-SX(山西)
CP-TJ(天津)
CP-ZJ(浙江)
资料来源:
《中国统计年鉴》1997-2003。
表21999-2002年中国东北、华北、华东15个省级地区的居民家庭人均收入数据(不变价格)
地区人均收入
1996
1997
1998
1999
2000
2001
2002
IP-AH(安徽)
IP-BJ(北京)
IP-FJ(福建)
IP-HB(河北)
IP-HLJ(黑龙江)
IP-JL(吉林)
IP-JS(江苏)
IP-JX(江西)
IP-LN(辽宁)
IP-NMG(内蒙古)
IP-SD(山东)
IP-SH(上海)
IP-SX(山西)
IP-TJ(天津)
IP-ZJ(浙江)
资料来源:
《中国统计年鉴》1997-2003。
图215个省级地区的人均消费序列(纵剖面)图315个省级地区的人均收入序列(file:
4panel02)
图415个省级地区的人均消费散点图图515个省级地区的人均收入散点图(7个横截面叠加)
(每条连线表示同一年度15个地区的消费值)(每条连线表示同一年度15个地区的收入值)
用CP表示消费,IP表示收入。
AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
15个地区7年人均消费对收入的面板数据散点图见图6和图7。
图6中每一种符号代表一个省级地区的7个观测点组成的时间序列。
相当于观察15个时间序列。
图7中每一种符号代表一个年度的截面散点图(共7个截面)。
相当于观察7个截面散点图的叠加。
图6用15个时间序列表示的人均消费对收入的面板数据
图7用7个截面表示的人均消费对收入的面板数据(7个截面叠加)
为了观察得更清楚一些,图8给出北京和内蒙古1996-2002年消费对收入散点图。
从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。
内蒙古2002年的收入与消费规模还不如北京市1996年的大。
图9给出该15个省级地区1996和2002年的消费对收入散点图。
可见6年之后15个地区的消费和收入都有了相应的提高。
图8北京和内蒙古1996-2002年消费对收入时序图图91996和2002年15个地区的消费对收入散点图
2.面板数据的估计。
用面板数据建立的模型通常有3种。
即混合估计模型、固定效应模型和随机效应模型。
混合估计模型。
如果从时间上看,不同个体之间不存在显着性差异;从截面上看,不同截面之间也不存在显着性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。
如果从时间和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型,
yit=a+b1xit+eit,i=1,2,…,N;t=1,2,…,T
(1)
a和b1不随i,t变化。
称模型
(1)为混合估计模型。
以例1中15个地区1996和2002年数据建立关于消费的混合估计模型,得结果如下:
图10
EViwes估计方法:
在打开工作文件窗口的基础上,点击主功能菜单中的Objects键,选NewObject功能,从而打开NewObject(新对象)选择窗。
在TypeofObject选择区选择Pool(混合数据库),点击OK键,从而打开Pool(混合数据)窗口。
在窗口中输入15个地区标识AH(安徽)、BJ(北京)、…、ZJ(浙江)。
工具栏中点击Sheet键,从而打开SeriesList(列写序列名)窗口,定义变量CP和IP,点击OK键,Pool(混合或合并数据库)窗口显示面板数据。
在Pool窗口的工具栏中点击Estimate键,打开PooledEstimation(混合估计)窗口如下图。
图11
在DependentVariable(相依变量)选择窗填入CP;在Commoncoefficients(系数相同)选择窗填入IP;Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击Noweighting。
点击PooledEstimation(混合估计)窗口中的OK键。
得输出结果如图10。
相应表达式是
=+IPit
R2=,SSEr=4824588,(103)=
15个省级地区的人均支出平均占收入的76%。
如果从时间和截面上看模型截距都为零,就可以建立不含截距项的(a=0)的混合估计模型。
以二变量模型为例,建立混合估计模型如下,
yit=b1xit+eit,i=1,2,…,N;t=1,2,…,T
(2)
对于本例,因为上式中的截距项有显着性(t=>(103)=),所以建立截距项为零的混合估计模型是不合适的。
EViwes估计方法:
在PooledEstimation(混合估计)对话框中Intercept(截距项)选择窗中选None,其余选项同上。
固定效应模型。
在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixedeffectsregressionmodel)。
固定效应模型分为3种类型,即个体固定效应模型(entityfixedeffectsregressionmodel)、时刻固定效应模型(timefixedeffectsregressionmodel)和时刻个体固定效应模型(timeandentityfixedeffectsregressionmodel)。
下面分别介绍。
(1)个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显着性变化,那么就应该建立个体固定效应模型,表示如下,
yit=b1xit+g1W1+g2W2+…+gNWN+eit,t=1,2,…,T(3)
其中
Wi=
eit,i=1,2,…,N;t=1,2,…,T,表示随机误差项。
yit,xit,i=1,2,…,N;t=1,2,…,T分别表示被解释变量和解释变量。
模型(3)或者表示为
y1t=g1+b1x1t+e1t,i=1(对于第1个个体,或时间序列),t=1,2,…,T
y2t=g2+b1x2t+e2t,i=2(对于第2个个体,或时间序列),t=1,2,…,T
…
yNt=gN+b1xNt+eNt,i=N(对于第N个个体,或时间序列),t=1,2,…,T
写成矩阵形式,
y1=(1x1)+e1=g1+x1b+e1
…
yN=(1xN)+eN=gN+xNb+eN
上式中yi,gi,ei,xi都是N′1阶列向量。
b为标量。
当模型中含有k个解释变量时,b为k′1阶列向量。
进一步写成矩阵形式,
=+b+
上式中的元素1,0都是T′1阶列向量。
面板数据模型用OLS方法估计时应满足如下5个假定条件:
(1)E(eit|xi1,xi2,…,xiT,ai)=0。
以xi1,xi2,…,xiT,ai为条件的eit的期望等于零。
(2)(xi1,xi2,…,xiT),(yi1,yi2,…,yiT),i=1,2,…,N分别来自于同一个联合分布总体,并相互独立。
(3)(xit,eit)具有非零的有限值4阶矩。
(4)解释变量之间不存在完全共线性。
(5)Cov(eiteis|xit,xis,ai)=0,t1s。
在固定效应模型中随机误差项eit在时间上是非自相关的。
其中xit代表一个或多个解释变量。
对模型
(1)进行OLS估计,全部参数估计量都是无偏的和一致的。
模型的自由度是NT–1–N。
当模型含有k个解释变量,且N很大,相对较小时,因为模型中含有k+N个被估参数,一般软件执行OLS运算很困难。
在计量经济学软件中是采用一种特殊处理方式进行OLS估计。
估计原理是,先用每个变量减其组内均值,把数据中心化(entity-demeaned),然后用变换的数据先估计个体固定效应模型的回归系数(不包括截距项),然后利用组内均值等式计算截距项。
这种方法计算起来速度快。
具体分3步如下。
(1)首先把变量中心化(entity-demeaned)。
仍以单解释变量模型(3)为例,则有
=gi+b1+,i=1,2,…,N(4)
其中=,=,=,i=1,2,…,N。
公式
(1)、(4)相减得,
(yit-)=b1(xit-)+(eit-)(5)
令(yit-)=,(xit-)=,(eit-)=,上式写为
=b1+(6)
用OLS法估计
(1)、(6)式中的b1,结果是一样的,但是用(6)式估计,可以减少被估参数个数。
(2)用OLS法估计回归参数(不包括截距项,即固定效应)。
在k个解释变量条件下,把用向量形式表示,则利用中心化数据,按OLS法估计公式计算个体固定效应模型中回归参数估计量的方差协方差矩阵估计式如下,
()=(')-1(7)
其中=,是相对于的残差向量。
(3)计算回归模型截距项,即固定效应参数gi。
=-(8)
以例1(file:
panel02)为例得到的个体固定效应模型估计结果如下:
注意:
个体固定效应模型的EViwes输出结果中没有公共截距项。
图12
EViwes估计方法:
在EViwes的PooledEstimation对话框中Intercept选项中选Fixedeffects。
其余选项同上。
注意:
(1)个体固定效应模型的EViwes输出结果中没有公共截距项。
(2)EViwes输出结果中没有给出描述个体效应的截距项相应的标准差和t值。
不认为截距项是模型中的重要参数。
(3)当对个体固定效应模型选择加权估计时,输出结果将给出加权估计和非加权估计两种统计量评价结果。
(4)输出结果的联立方程组形式可以通过点击View选Representations功能获得。
(5)点击View选WaldCoefficientTests…功能可以对模型的斜率进行Wald检验。
(6)点击View选Residuals/Table,Graphs,CovarianceMatrix,CorrelationMatrix功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差序列的相关系数矩阵。
(7)点击Procs选MakeModel功能,将会出现估计结果的联立方程形式,进一步点击Solve键,在随后出现的对话框中可以进行动态和静态预测。
输出结果的方程形式是
=安徽+x1t=+x1t
=北京+x2t=+x2t
…
=浙江+x15t=+x15t
R2=,SSEr=2270386,(88)=
从结果看,北京、上海、浙江是消费函数截距(自发消费)最大的3个地区。
相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过F检验来完成。
原假设H0:
不同个体的模型截距项相同(建立混合估计模型)。
备择假设H1:
不同个体的模型截距项不同(建立个体固定效应模型)。
F统计量定义为:
F==(9)
其中SSEr,SSEu分别表示约束模型(混合估计模型)和非约束模型(个体固定效应模型)的残差平方和。
非约束模型比约束模型多了N-1个被估参数。
(混合估计模型给出公共截距项。
)
注意:
当模型中含有k个解释变量时,F统计量的分母自由度是NT-N-k。
用上例计算,已知SSEr=4824588,SSEu=2270386,
F====
(14,89)=
因为F=>(14,89)=,所以,拒绝原假设。
结论是应该建立个体固定效应模型。
(2)时刻固定效应模型。
时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。
如果确知对于不同的截面,模型的截距显着不同,但是对于不同的时间序列(个体)截距是相同的,那么应该建立时刻固定效应模型,表示如下,
yit=b1xit+a1+a2D2+…+aTDT+eit,i=1,2,…,N(10)
其中
Dt=
eit,i=1,2,…,N;t=1,2,…,T,表示随机误差项。
yit,xit,i=1,2,…,N;t=1,2,…,T分别表示被解释变量和解释变量。
模型(10)也可表示为
yi1=a1+b1xi1+ei1,t=1,(对于第1个截面),i=1,2,…,N
yi2=(a1+a2)+b1xi2+ei2,t=2,(对于第2个截面),i=1,2,…,N
…
yiT=(a1+aT)+b1xiT+eiT,t=T,(对于第T个截面),i=1,2,…,N
如果满足上述模型假定条件,对模型
(2)进行OLS估计,全部参数估计量都具有无偏性和一致性。
模型的自由度是NT–T-1。
图13
EViwes估计方法:
在PooledEstimation(混合估计)窗口中的DependentVariable(相依变量)选择窗填入CP;在Commoncoefficients(系数相同)选择窗填入IP和虚拟变量D1997,D1998,D1999,D2000,D2001,D2002;在Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗点击Common;在Weighting(权数)选择窗点击Noweighting。
点击PooledEstimation(混合估计)窗口中的OK键。
以例1为例得到的时刻固定效应模型估计结果如下:
=1996+xi1=+xi1
=1997+xi2=++xi2
…
=2002+xi7=+xi7
R2=,SSEr=4028843,(97)=
相对于混合估计模型来说,是否有必要建立时刻固定效应模型可以通过F检验来完成。
H0:
对于不同横截面模型截距项相同(建立混合估计模型)。
H1:
对于不同横截面模型的截距项不同(建立时刻固定效应模型)。
F统计量定义为:
F==(11)
其中SSEr,SSEu分别表示约束模型(混合估计模型的)和非约束模型(时刻固定效应模型的)的残差平方和。
非约束模型比约束模型多了T-1个被估参数。
注意:
当模型中含有k个解释变量时,F统计量的分母自由度是NT-T-k。
用上例计算,已知SSEr=4824588,SSEu=4028843,
F====
(6,87)=
因为F=>(14,89)=,拒绝原假设,结论是应该建立时刻固定效应模型。
(3)时刻个体固定效应模型。
时刻个体固定效应模型就是对于不同的截面(时刻点)、不同的时间序列(个体)都有不同截距的模型。
如果确知对于不同的截面、不同的时间序列(个体)模型的截距都显着地不相同,那么应该建立时刻个体效应模型,表示如下,
yit=b1xit+a1+a2D2+…+aTDT+g1W1+g2W2+…+gNWN+eit,i=1,2,…,N,t=1,2,…,T
(12)
其中虚拟变量
Dt=(注意不是从1开始)
Wi=(注意是从1开始)
eit,i=1,2,…,N;t=1,2,…,T,表示随机误差项。
yit,xit,(i=1,2,…,N;t=1,2,…,T)分别表示被解释变量和解释变量。
模型也可表示为
y11=a1+g1+b1x11+e11,t=1,i=1(对于第1个截面、第1个个体)
y21=a1+g2+b1x21+e21,t=1,i=2(对于第1个截面、第2个个体)
…
yN1=a1+gN+b1xN1+eN1,t=1,i=N(对于第1个截面、第N个个体)
y12=(a1+a2)+g1+b1x12+e12,t=2,i=1(对于第2个截面、第1个个体)
y22=(a1+a2)+g2+b1x22+e22,t=2,i=2(对于第2个截面、第2个个体)
…
yN2=(a1+a2)+gN+b1xN2+eN2,t=2,i=N(对于第2个截面、第N个个体)
…
y1T=(a1+aT)+g1+b1x12+e1T,t=T,i=1(对于第T个截面、第1个个体)
y2T=(a1+aT)+g2+b1x22+e2T,t=T,i=2(对于第T个截面、第2个个体)
…
yNT=(a1+aT)+gN+b1xNT+eNT,t=T,i=N(对于第T个截面、第N个个体)
如果满足上述模型假定条件,对模型(12)进行OLS估计,全部参数估计量都是无偏的和一致的。
模型的自由度是NT–N–T。
注意:
当模型中含有k个解释变量时,F统计量的分母自由度是NT–N-T-k+1。
以例1为例得到的截面、时刻固定效应模型估计结果如下:
图14
EViwes估计方法:
在PooledEstimation(混合估计)窗口中的DependentVariable(相依变量)选择窗填入CP;在Commoncoefficients(系数相同)选择窗填入IP和虚拟变量D1997,D1998,D1999,D2000,D2001,D2002;在Crosssectionspecificcoefficients(截面系数不同)选择窗保持空白;在Intercept(截距项)选择窗中选Fixedeffects;在Weighting(权数)选择窗点击Noweighting。
点击PooledEstimation(混合估计)窗口中的OK键。
注意:
(1)对于第1个截面(t=1)EViwes输出结果中把(a1+gi),(i=1,2,…,N)估计在一起。
(2)对于第2,…,T个截面(t=1)EViwes输出结果中分别把(a1+at),(t=2,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 面板 数据 检验 固定 效应