第三讲 内生性专题 高级计量经济学及Stata应用课件.pptx
- 文档编号:1220365
- 上传时间:2022-10-19
- 格式:PPTX
- 页数:123
- 大小:1.16MB
第三讲 内生性专题 高级计量经济学及Stata应用课件.pptx
《第三讲 内生性专题 高级计量经济学及Stata应用课件.pptx》由会员分享,可在线阅读,更多相关《第三讲 内生性专题 高级计量经济学及Stata应用课件.pptx(123页珍藏版)》请在冰豆网上搜索。
22001199-0-70-718-18,陈强计量及Stata应用(c),2014,1,1,高级计量经济学及Stata应用第三讲内生性专题,陈强山东大学经济学院,2019-07-18,陈强计量及Stata应用(c)2014,2,内生性专题,IV2SLSGMM随机实验与自然实验双重差分法倾向得分匹配,例:
农产品市场均衡模型,令供给等于需要可得:
2019-07-18,陈强计量及Stata应用(c)2014,3,需求函数还是供给函数?
2019-07-18,陈强计量及Stata应用(c)2014,4,联立方程偏差,求解联立方程可得:
故解释变量与扰动项相关,得不到一致估计,称为“联立方程偏差”(simultaneitybias)或“内生性偏差”(endogenietybias)。
2019-07-18,陈强计量及Stata应用(c)2014,5,2019-07-18,陈强计量及Stata应用(c)2014,6,内生变量,在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”(endogenousvariables)。
如果我们能够将内生变量分成两部分,一部分与扰动项相关,而另一部分与扰动项不相关,则有希望用与扰动项不相关的那一部分得到一致估计。
对内生变量的这种分离可以借助于另外一个“工具变量”(InstrumentalVariable,IV)来实现。
工具变量的思想,假设存在某个因素(变量)使得供给曲线经常移动,而需求曲线基本不动。
此时,可以估计需求曲线。
这个使供给曲线移动的变量就是工具变量。
2019-07-18,陈强计量及Stata应用(c)2014,7,气温作为工具变量,假设影响供给方程扰动项的因素可以分解为两部分,即可观测的气温x与不可观测的其他因素:
气温为前定变量,与两个扰动项都不相关。
气温的变化使得供给函数沿着需求函数移动,故可估计出需求函数。
2019-07-18,陈强计量及Stata应用(c)2014,8,2019-07-18,陈强计量及Stata应用(c)2014,9,工具变量的定义,一个有效(valid)的工具变量应满足以下两个条件:
相关性:
工具变量与内生解释变量相关外生性:
工具变量与扰动项不相关。
也被称为“排他性约束”(exclusionrestriction),因为外生性意味着,工具变量影响被解释变量的唯一渠道是通过与其相关的内生解释变量,它排除了所有其他的可能影响渠道。
2019-07-18,陈强计量及Stata应用(c)2014,10,气温满足工具变量的定义,气温满足工具变量的两个条件:
相关性:
气温影响供给,而供给影响价格(需求方程中的内生解释变量),故气温与价格相关外生性:
气温为前定变量,故与扰动项不相关。
二阶段最小二乘法,传统的工具变量法通过“二阶段最小二乘法”(TwoStageLeastSquare,简记2SLS或TSLS)来实现。
第一阶段回归:
用内生解释变量p对工具变量回归x,得到拟合值。
第二阶段回归:
用被解释变量q对第一阶段回归的拟合值进行回归。
2019-07-18,陈强计量及Stata应用(c)2014,11,2019-07-18,陈强计量及Stata应用(c)2014,12,2SLS的原理,第一阶段回归的拟合值为工具变量的线性函数,故也是外生的(因为工具变量是外生的)。
因此,在第二阶段回归中,第一阶段回归的拟合值与扰动项不相关,故可得到一致估计。
2SLS的实质是把内生解释变量分成两部分,即由工具变量所造成的外生部分,以及与扰动项相关的其余部分。
把被解释变量对此外生部分进行回归,即得到一致估计。
例:
宏观模型中的消费函数,其中,Y,C,I,G分别代表国民收入、总消费、总投资、政府净支出与净出口。
第一个方程为消费方程,第二个方程为国民收入恒等式。
可以证明,如果单独对消费方程进行OLS估计,将得到不一致的估计。
2019-07-18,陈强计量及Stata应用(c)2014,13,2019-07-18,陈强计量及Stata应用(c)2014,14,多个内生变量与多个工具变量,可识别的阶条件(必要条件):
不可识别(unidentified):
工具变量个数小于内生解释变量个数恰好识别(justorexactlyidentified):
工具变量个数等于内生解释变量个数过度识别(overidentified):
工具变量个数大于内生解释变量个数,2019-07-18,陈强计量及Stata应用(c)2014,15,弱工具变量,如果工具变量与内生解释变量仅微弱相关,将导致工具变量法估计量的渐近方差变得很大。
由于工具变量中仅包含很少与解释变量有关的信息,利用这部分信息进行的工具变量法估计就很不准确,即使样本容量很大也很难收敛到真实的参数值。
这种工具变量称为“弱工具变量”(weakinstruments)。
弱工具变量的后果类似于样本容量过小,会导致的小样本性质变得很差,而的大样本分布也可能离正态分布相去甚远,致使统计推断失效。
2019-07-18,陈强计量及Stata应用(c)2014,16,弱工具变量的检验,在第一阶段回归中,检验所有工具变量的联合显著性,得到F统计量。
经验规则:
如果F10,则存在弱工具变量;反之,则不存在弱工具变量。
弱工具变量的解决方法:
(1)寻找强工具变量;
(2)如果工具变量足够多,可舍弃弱工具变量。
(3)使用有限信息最大似然估计(LimitedInformationMaximumLikelihoodEstimation,简记LIML),2019-07-18,陈强计量及Stata应用(c)2014,17,工具变量的外生性,在恰好识别的情况下,无法检验工具变量的外生性。
只能进行定性讨论或依赖于专家的意见。
定性讨论:
如果工具变量是外生的,则其对被解释变量发生影响的唯一渠道就是通过内生变量,除此以外别无其他渠道。
此条件被称为“排他性约束”(exclusionrestriction)。
在实践中,需要找出工具变量影响被解释变量的所有其他可能渠道,然后一一排除,才能比较信服地说明工具变量的外生性。
2019-07-18,陈强计量及Stata应用(c)2014,18,过度识别检验,在过度识别的情况下,则可进行“过度识别检验”(overidentificationtest)。
此检验的大前提(maintainedhypothesis)是该模型至少是恰好识别的,即有效工具变量至少与内生解释变量一样多。
在此大前提下,过度识别检验的原假设为“所有工具变量都是外生的”。
过度识别检验的步骤,把2SLS的残差对工具变量及外生解释变量进行回归,检验工具变量的系数是否联合为0。
记此辅助回归的拟合优度为R2。
Sargan统计量:
其中,m为工具变量个数,r为内生解释变量个数如果恰好识别,则m-r=0(自由度为0),无定义,故无法使用“过度识别检验”。
2019-07-18,陈强计量及Stata应用(c)2014,19,2019-07-18,陈强计量及Stata应用(c)2014,20,对解释变量内生性的检验,究竟该用OLS还是工具变量法?
“豪斯曼检验”(Hausmanspecificationtest)的原假设为“所有解释变量均为外生变量”。
如果原假设成立,则OLS比工具变量法更有效。
此时使用IV,虽然是一致估计量,但“无病用药”,反而增大估计量方差。
反之,如果存在内生解释变量,则OLS不一致,而IV是一致的。
豪斯曼检验的原理,如果原假设成立,则OLS与IV都一致,即在大样本下与都收敛于真实的参数值,因此依概率收敛于0。
反之,如果不成立,则IV一致而OLS不一致,故不会收敛于0。
如果二者距离很大,则倾向于拒绝原假设。
以二次型度量此距离可得:
2019-07-18,陈强计量及Stata应用(c)2014,21,矩估计,传统的矩估计(MethodofMoments,MM)假设随机变量,其中为待估参数。
因为有两个待估参数,故须使用两个总体矩条件(populationmomentconditions):
一阶原点矩:
二阶原点矩:
2019-07-18,陈强计量及Stata应用(c)2014,22,矩估计的求解,用对应的样本矩(samplemoments)替代总体矩条件可得以下联立方程组,求解可得:
矩估计的缺点:
更高阶矩可能也包含有用信息,但被弃而不用。
广义矩估计(GMM)可弥补此缺点。
2019-07-18,陈强计量及Stata应用(c)2014,23,IV法作为矩估计,假设最后一个解释变量为内生变量,其工具变量为w:
记工具向量为,其中外生解释变量为自己的工具变量(符合工具变量的定义)。
2019-07-18,陈强计量及Stata应用(c)2014,24,总体与样本矩条件,“总体矩条件”或“正交条件”(orthogonalitycondition):
以样本矩代替上总体矩,即得到IV估计量:
2019-07-18,陈强计量及Stata应用(c)2014,25,OLS也是IV矩估计,如果所有解释变量都是前定变量,则可以将自己作为自己的工具变量。
因此,X=Z。
2019-07-18,陈强计量及Stata应用(c)2014,26,2019-07-18,陈强计量及Stata应用(c)2014,27,IV矩估计的局限性,传统的IV矩估计仅适用于恰好识别的情形。
在过度识别情况下,则一般使用2SLS。
在球型扰动项(同方差、无自相关)的情况下,2SLS是最有效率的。
如果存在异方差或自相关,则存在更有效率的方法,即广义矩估计。
矩条件的再考察,与总体矩条件相对应的样本矩条件为:
将上式看成联立方程组,则未知数共有K个,而方程个数为L个(的维度)。
如果LK,为过度识别,无解;此时传统的矩估计法行不通。
2019-07-18,陈强计量及Stata应用(c)2014,28,广义矩估计的定义,脑筋急转弯:
虽然无法找到使得但总可以让向量尽可能地接近0。
定义最小化的目标函数为,,,其中,为根据数据估计的“权重矩阵”(weightingmatrix)。
所得估计量就是广义矩估计(GeneralizedMethodofMoments,GMM)。
2019-07-18,陈强计量及Stata应用(c)2014,29,2019-07-18,陈强计量及Stata应用(c)2014,30,广义矩估计的优点,可选择最优权重矩阵,使得估计量的渐近方差最小;称为“最优GMM”(optimalGMM)。
但需要先估计最优权重矩阵。
两步最优GMM:
(1)进行2SLS估计(2SLS也是一致估计),得到残差,估计最优权重矩阵;
(2)使用此最优权重矩阵进行GMM估计。
迭代GMM:
使用GMM残差,估计最优权重矩阵;重复以上步骤,直至收敛。
2019-07-18,陈强计量及Stata应用(c)2014,31,GMM与2SLS,在同方差情况下,GMM=2SLS。
在恰好识别情况下,GMM=2SLS。
在异方差、过度识别情况下,GMM比2SLS更有效率。
GMM的过度识别检验,在恰好识别的情况下,GMM的目标函数=0。
在过度识别的情况下,如果所有过度识别约束都成立,则目标函数J应该离0不远。
如果J大于0很多,则可倾向于认为某些过度识别约束不成立。
在原假设“所有矩条件均成立”的情况下,目标函数本身就是检验统计量:
在同方差的情况下,J统计量等于Sargan统计量。
2019-07-18,陈强计量及Stata应用(c)2014,32,2019-07-18,陈强计量及Stata应用(c)2014,33,如何获得工具变量,寻找工具变量可大致分两步:
列出与内生解释变量相关的尽可能多的变量的清单(这一步较容易);从这一清单中剔除与扰动项相关的变量(使用exclusionrestriction的逻辑)。
2019-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三讲 内生性专题 高级计量经济学及Stata应用课件 第三 生性 专题 高级 计量 经济学 Stata 应用 课件