342面板数据的F检验固定效应检验zj.docx
- 文档编号:25499345
- 上传时间:2023-06-09
- 格式:DOCX
- 页数:20
- 大小:23.52KB
342面板数据的F检验固定效应检验zj.docx
《342面板数据的F检验固定效应检验zj.docx》由会员分享,可在线阅读,更多相关《342面板数据的F检验固定效应检验zj.docx(20页珍藏版)》请在冰豆网上搜索。
342面板数据的F检验固定效应检验zj
面板数据模型()检验,固定效应检验
.面板数据定义。
进度序列数据或截面数据都是一维数据。
例如进度序列数据是变量按进度得到的数据。
截面数据是变量在截面空间上的数据。
面板数据()也称进度序列截面数据()或混合数据()。
面板数据是同时在进度和截面空间上取得的二维数据。
面板数据示意图见图。
面板数据从横截面()上看,是由若干个体(,,)在某一时刻构成的截面观测值,从纵剖面()上看是一个进度序列。
.
面板数据用双下标变量表示。
例如
,,…,;,,…,
表示面板数据中含有个个体。
表示进度序列的最大长度。
若固定不变,.,(,,…,)是横截面上的个随机变量。
若固定不变,.,(,,…,)是纵剖面上的一个进度序列(个体)。
.
图 ,的面板数据示意图
例如年个省份的农业总产值数据。
固定在某一年份上,它是由个农业总产总值数字组成的截面数据。
固定在某一省份上,它是由年农业总产值数据组成的一个进度序列。
面板数据由个个体组成。
共有个观测值。
.
对于面板数据,,,…,;,,…,来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据()。
若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据()。
.
注意:
、、既允许用平衡面板数据也允许用非平衡面板数据估计模型。
例():
年中国东北、华北、华东个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表和表。
数据是年的,每一年都有个数据,共组观测值。
.
人均消费和收入两个面板数据都是平衡面板数据,各有个个体。
人均消费和收入的面板数据从纵剖面观察分别见图和图。
从横截面观察分别见图和图。
横截面数据散点图的表现与观测值顺序有关。
图和图中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。
.
表 年中国东北、华北、华东个省级地区的居民家庭人均消费数据(不变价格)
地区人均消费
(安徽)
(北京)
(福建)
(河北)
(黑龙江)
(吉林)
(江苏)
(江西)
(辽宁)
(内蒙古)
(山东)
(上海)
(山西)
(天津)
(浙江)
资料来源:
《中国统计年鉴》。
表 年中国东北、华北、华东个省级地区的居民家庭人均收入数据(不变价格)
地区人均收入
(安徽)
(北京)
(福建)
(河北)
(黑龙江)
(吉林)
(江苏)
(江西)
(辽宁)
(内蒙古)
(山东)
(上海)
(山西)
(天津)
(浙江)
资料来源:
《中国统计年鉴》。
图 个省级地区的人均消费序列(纵剖面)图 个省级地区的人均收入序列()
图 个省级地区的人均消费散点图 图 个省级地区的人均收入散点图(个横截面叠加)
(每条连线表示同一年度个地区的消费值) (每条连线表示同一年度个地区的收入值)
用表示消费,表示收入。
,,,,,,,,,,,,,分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。
.
个地区年人均消费对收入的面板数据散点图见图和图。
图中每一种符号代表一个省级地区的个观测点组成的进度序列。
相当于观察个进度序列。
图中每一种符号代表一个年度的截面散点图(共个截面)。
相当于观察个截面散点图的叠加。
.
图 用个进度序列表示的人均消费对收入的面板数据
图 用个截面表示的人均消费对收入的面板数据(个截面叠加)
为了观察得更清楚一些,图给出北京和内蒙古年消费对收入散点图。
从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。
内蒙古年的收入与消费规模还不如北京市年的大。
图给出该个省级地区和年的消费对收入散点图。
可见年之后个地区的消费和收入都有了相应的提高。
.
图 北京和内蒙古年消费对收入时序图 图 和年个地区的消费对收入散点图
.面板数据的估计。
用面板数据建立的模型通常有种。
即混合估计模型、固定效应模型和随机效应模型。
混合估计模型。
如果从进度上看,不同个体之间不存在显著性差异。
从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法()估计参数。
.
如果从进度和截面看模型截距都不为零,且是一个相同的常数,以二变量模型为例,则建立如下模型,
, ,,…,;,,…, ()
和不随,变化。
称模型()为混合估计模型。
以例中个地区和年数据建立关于消费的混合估计模型,得结果如下:
图
估计方法:
在打开工作文件窗口的基础上,点击主功能菜单中的键,选功能,从而打开(新对象)选择窗。
在选择区选择(混合数据库),点击键,从而打开(混合数据)窗口。
在窗口中输入个地区标识(安徽)、(北京)、…、(浙江)。
工具栏中点击键,从而打开(列写序列名)窗口,定义变量?
和?
,点击键,(混合或合并数据库)窗口显示面板数据。
在窗口的工具栏中点击键,打开(混合估计)窗口如下图。
.
图
在(相依变量)选择窗填入?
。
在(系数相同)选择窗填入?
。
(截面系数不同)选择窗保持空白。
在(截距项)选择窗点击。
在(权数)选择窗点击。
点击(混合估计)窗口中的键。
得输出结果如图。
相应表达式是.
() () ,,()
个省级地区的人均支出平均占收入的。
如果从进度和截面上看模型截距都为零,就可以建立不含截距项的()的混合估计模型。
以二变量模型为例,建立混合估计模型如下,.
, ,,…,;,,…, ().
对于本例,因为上式中的截距项有显著性(>()),所以建立截距项为零的混合估计模型是不合适的。
.
估计方法:
在(混合估计)对话框中(截距项)选择窗中选,其余选项同上。
固定效应模型。
在面板数据散点图中,如果对于不同的截面或不同的进度序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型()。
.
固定效应模型分为种类型,即个体固定效应模型()、时刻固定效应模型()和时刻个体固定效应模型()。
下面分别推荐。
.
()个体固定效应模型。
个体固定效应模型就是对于不同的个体有不同截距的模型。
如果对于不同的进度序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型,表示如下,.
… , ,,…, ()
其中
,,…,;,,…,,表示随机误差项。
,,,…,;,,…,分别表示被解释变量和解释变量。
.
模型()或者表示为
, (对于第个个体,或进度序列),,,…,
, (对于第个个体,或进度序列),,,…,
…
, (对于第个个体,或进度序列),,,…,
写成矩阵形式,
( )
…
( )
上式中,,,都是´阶列向量。
为标量。
当模型中含有个解释变量时,为´阶列向量。
进一步写成矩阵形式,
上式中的元素,都是´阶列向量。
面板数据模型用方法估计时应满足如下个假定条件:
()(,,…,,)。
以,,…,,为条件的的期望等于零。
()(,,…,),(,,…,),,,…,分别来自于同一个联合分布总体,并相互独立。
.
()(,)具有非零的有限值阶矩。
()解释变量之间不存在完全共线性。
()(,),¹。
在固定效应模型中随机误差项在进度上是非自相关的。
其中代表一个或多个解释变量。
.
对模型()进行估计,全部参数估计量都是无偏的和一致的。
模型的自由度是––。
当模型含有个解释变量,且很大,相对较小时,因为模型中含有个被估参数,一般软件执行运算很困难。
在计量经济学软件中是采用一种特殊处理方式进行估计。
.
估计原理是,先用每个变量减其组内均值,把数据中心化(),然后用变换的数据先估计个体固定效应模型的回归系数(不包括截距项),然后利用组内均值等式计算截距项。
这种方法计算起来速度快。
具体分步如下。
.
()第一步把变量中心化()。
仍以单解释变量模型()为例,则有
, ,,…, ()
其中,,, ,,…,。
公式()、()相减得,
()()() ().
令(),(),(),上式写为
()
用法估计()、()式中的,结果是一样的,但是用()式估计,可以减少被估参数个数。
()用法估计回归参数(不包括截距项,即固定效应)。
在个解释变量条件下,把用向量形式表示,则利用中心化数据,按法估计公式计算个体固定效应模型中回归参数估计量的方差协方差矩阵估计式如下,.
()(') ().
其中,是相对于的残差向量。
()计算回归模型截距项,即固定效应参数。
()
以例()为例得到的个体固定效应模型估计结果如下:
注意:
个体固定效应模型的输出结果中没有公共截距项。
图
估计方法:
在的对话框中选项中选。
其余选项同上。
注意:
()个体固定效应模型的输出结果中没有公共截距项。
()输出结果中没有给出描述个体效应的截距项相应的标准差和值。
不认为截距项是模型中的重要参数。
()当对个体固定效应模型选择加权估计时,输出结果将给出加权估计和非加权估计两种统计量评价结果。
()输出结果的联立方程组形式可以通过点击选功能获得。
()点击选…功能可以对模型的斜率进行检验。
()点击选,,,功能可以分别得到按个体计算的残差序列表,残差序列图,残差序列的方差协方差矩阵,残差序列的相关系数矩阵。
.
()点击选功能,将会出现估计结果的联立方程形式,进一步点击键,在随后出现的对话框中可以进行动态和静态预测。
.
输出结果的方程形式是
安徽
()
北京
… ()
浙江
()
,()
从结果看,北京、上海、浙江是消费函数截距(自发消费)最大的个地区。
相对于混合估计模型来说,是否有必要建立个体固定效应模型可以通过检验来完成。
原假设:
不同个体的模型截距项相同(建立混合估计模型)。
备择假设:
不同个体的模型截距项不同(建立个体固定效应模型)。
统计量定义为:
()
其中,分别表示约束模型(混合估计模型)和非约束模型(个体固定效应模型)的残差平方和。
非约束模型比约束模型多了个被估参数。
.
(混合估计模型给出公共截距项。
)
注意:
当模型中含有个解释变量时,统计量的分母自由度是。
用上例计算,已知,,
(,)
因为>(,),所以,拒绝原假设。
结论是应该建立个体固定效应模型。
()时刻固定效应模型。
时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。
如果确知对于不同的截面,模型的截距显著不同,但是对于不同的进度序列(个体)截距是相同的,那么应该建立时刻固定效应模型,表示如下,.
…, ,,…, ()
其中
,,…,;,,…,,表示随机误差项。
,,,…,;,,…,分别表示被解释变量和解释变量。
模型()也可表示为.
, ,(对于第个截面),,,…,
(), ,(对于第个截面),,,…,
…
(), ,(对于第个截面),,,…,
如果满足上述模型假定条件,对模型()进行估计,全部参数估计量都具有无偏性和一致性。
模型的自由度是–。
.
图
估计方法:
在(混合估计)窗口中的(相依变量)选择窗填入?
。
在(系数相同)选择窗填入?
和虚拟变量,,,,,。
在(截面系数不同)选择窗保持空白。
在(截距项)选择窗点击。
在(权数)选择窗点击。
点击(混合估计)窗口中的键。
.
以例为例得到的时刻固定效应模型估计结果如下:
() ()
() () ()
…
() () ()
,()
相对于混合估计模型来说,是否有必要建立时刻固定效应模型可以通过检验来完成。
:
对于不同横截面模型截距项相同(建立混合估计模型)。
:
对于不同横截面模型的截距项不同(建立时刻固定效应模型)。
统计量定义为:
()
其中,分别表示约束模型(混合估计模型的)和非约束模型(时刻固定效应模型的)的残差平方和。
非约束模型比约束模型多了个被估参数。
.
注意:
当模型中含有个解释变量时,统计量的分母自由度是。
用上例计算,已知,,
(,)
因为>(,),拒绝原假设,结论是应该建立时刻固定效应模型。
()时刻个体固定效应模型。
时刻个体固定效应模型就是对于不同的截面(时刻点)、不同的进度序列(个体)都有不同截距的模型。
如果确知对于不同的截面、不同的进度序列(个体)模型的截距都显著地不相同,那么应该建立时刻个体效应模型,表示如下,.
……,,…,,,…,
()
其中虚拟变量
(注意不是从开始)
(注意是从开始)
,,…,;,,…,,表示随机误差项。
,(,,…,;,,…,)分别表示被解释变量和解释变量。
模型也可表示为.
, ,(对于第个截面、第个个体)
, ,(对于第个截面、第个个体)
…
, ,(对于第个截面、第个个体)
(), ,(对于第个截面、第个个体)
(), ,(对于第个截面、第个个体)
…
() , ,(对于第个截面、第个个体)
…
(), ,(对于第个截面、第个个体)
(), ,(对于第个截面、第个个体)
…
(), ,(对于第个截面、第个个体)
如果满足上述模型假定条件,对模型()进行估计,全部参数估计量都是无偏的和一致的。
模型的自由度是––。
注意:
当模型中含有个解释变量时,统计量的分母自由度是–。
.
以例为例得到的截面、时刻固定效应模型估计结果如下:
图
估计方法:
在(混合估计)窗口中的(相依变量)选择窗填入?
。
在(系数相同)选择窗填入?
和虚拟变量,,,,,。
在(截面系数不同)选择窗保持空白。
在(截距项)选择窗中选。
在(权数)选择窗点击。
点击(混合估计)窗口中的键。
.
注意:
()对于第个截面()输出结果中把(),(,,…,)估计在一起。
()对于第,…,个截面()输出结果中分别把(),(,…,)估计在一起。
输出结果如下:
, (年安徽省)
, (年北京市)
…
, (年安徽省)
, (年北京市)
…
(),(年浙江省)
,()
相对于混合估计模型来说,是否有必要建立时刻个体固定效应模型可以通过检验来完成。
:
对于不同横截面,不同序列,模型截距项都相同(建立混合估计模型)。
:
不同横截面,不同序列,模型截距项各不相同(建立时刻个体固定效应模型)。
统计量定义为:
()
其中,分别表示约束模型(混合估计模型的)和非约束模型(时刻个体固定效应模型的)的残差平方和。
非约束模型比约束模型多了个被估参数。
.
注意:
当模型中含有个解释变量时,统计量的分母自由度是。
用上例计算,已知,,
(,)
因为>(,),拒绝原假设,结论是应该建立时刻个体固定效应模型。
()随机效应模型
在固定效应模型中采用虚拟变量的原因是解释被解释变量的信息不够完整。
也可以通过对误差项的分解来描述这种信息的缺失。
.
()
其中误差项在进度上和截面上都是相关的,用个分量表示如下。
()
其中(,)表示截面随机误差分量。
(,)表示进度随机误差分量。
(,)表示混和随机误差分量。
同时还假定,,之间互不相关,各自分别不存在截面自相关、进度自相关和混和自相关。
上述模型称为随机效应模型。
.
随机效应模型和固定效应模型比较,相当于把固定效应模型中的截距项看成两个随机变量。
一个是截面随机误差项(),一个是进度随机误差项()。
如果这两个随机误差项都服从正态分布,对模型估计时就能够节省自由度,因为此条件下只需要估计两个随机误差项的均值和方差。
.
假定固定效应模型中的截距项包括了截面随机误差项和进度随机误差项的平均效应,而且对均值的离差分别是和,固定效应模型就变成了随机效应模型。
.
为了容易理解,先假定模型中只存在截面随机误差项,不存在进度随机误差分量(),
() ()
截面随机误差项是属于第个个体的随机波动分量,并在整个进度范围(,…,)保持不变。
随机误差项,应满足如下条件:
.
(),
()
(),
(),
(),包括所有的,,。
(),¹,¹
(),¹
因为根据上式有
所以这种随机效应模型又称为误差分量模型()。
有结论,
()(),
()式,(),也可以写成()。
服从正态分布的截距项的均值效应被包含在回归函数的常数项中。
.
()(),
()[()()][()], ¹
令
(,,…)'
则
(')
(´)(´)(´)'
其中(´)是(´)阶单位阵,(´)是(´)阶列向量。
因为第期与期观测值是相互独立的,所以个观测值所对应的随机误差项的方差与协方差矩阵是.
Ä´Ä
其中´表示由(´)阶列向量为元素构成的单位阵,其中每一个元素或都是(´)阶列向量。
Ä表示科罗内克积()。
其运算规则是.
´Ä
检验个体随机效应的原假设与检验统计量是
:
。
(混合估计模型)
:
¹。
(个体随机效应模型)
其中表示由个体随机效应模型计算的残差平方和。
表示由混合估计模型计算的残差平方和。
统计量服从个自由度的分布。
.
可以对随机效应模型进行广义最小二乘估计。
以观测值方差的倒数为权。
为了求权数,必须采用两阶段最小二乘法估计。
因为各随机误差分量的方差一般是未知的,第一阶段用普通最小二乘估计法对混合数据进行估计(采用固定效应模型)。
用估计的残差计算随机误差分量的方差。
第二步用这些估计的方差计算参数的广义最小二乘估计值。
如果随机误差分量服从的是正态分布,模型的参数还可以用极大似然法估计。
.
仍以例为例给出随机效应模型估计结果如下:
图
注意:
随机效应模型输出结果中含有公共截距项。
图
以例为例,用个体随机效应模型和混合模型计算的统计量的值是
´()
()
因为>(),所以拒绝原假设,结论是应该建立个体随机效应模型。
假定截面截距和进度截距都是随机的。
分别服从均值为和,方差为和的正态分布。
随机误差项将由部分组成,并有方差。
.
()()()()
当和都等于零,随机效应模型退化为固定效应模型。
随机效应模型和固定效应模型哪一个更好些?
实际是各有优缺点。
随机效应模型的好处是节省自
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 342 面板 数据 检验 固定 效应 zj