内生性问题及其处理.docx
- 文档编号:23769347
- 上传时间:2023-05-20
- 格式:DOCX
- 页数:9
- 大小:20.75KB
内生性问题及其处理.docx
《内生性问题及其处理.docx》由会员分享,可在线阅读,更多相关《内生性问题及其处理.docx(9页珍藏版)》请在冰豆网上搜索。
内生性问题及其处理
内生性问题及其处理
《计量经济学》专题四内生性问题及其处理本专题共四讲第一讲内生性问题概述第二讲工具变量第三讲双重差分第四讲断点回归
《计量经济学》第一讲内生性问题概述主讲:
王岳龙?
内生性的定义和后果?
内生性的表现形式?
内生性的解决方法
内生性问题概述1.内生性的定义和后果yi?
?
0?
?
1xi?
?
i?
OLS1?
pcov(yi,xi)var(xi)?
?
1?
cov(xi,?
ivar(xi))ifcov(xi,?
i)?
0则x被称为内生变量so?
OLS1?
?
1则β1估计有偏且不一致
2.内生性的表现形式lnyi?
?
0?
?
1edui?
?
2malei?
?
3birthi?
?
i以mincer方程,如何准确估计教育回报率为例遗漏重要相关解释变量+与核心解释变量edu和因变量lny同时相关的不可观测因素ability因无法量化而被控制,从而出现在随机干扰项中,从而导致cov(edu,ξ)≠0。
类似的还有遗漏edu,这种错误设定函数形式也是遗漏重要解释变量的特殊形式。
特别的,真实模型是yi?
?
0?
?
1x1i?
?
2x2i?
?
i但是却错误的估计yi?
?
0?
?
1x1i?
?
i?
?
1?
?
1?
?
2cov(x1,x2var(x1))
注意上述遗漏变量偏误公式只成立于二元回归,如果是更多元回归,遗漏一个重要解释变量导致核心变量系数的偏差方向情况则很复杂。
如何确定是否遗漏重要解释变量?
在控制了最重要的控制变量后,随着逐步加入其他控制变量,核心变量的系数和显著性不再发生明显变化,说明此时遗漏变量的风险就很小了。
(JosephGAltonjietal,2005)
反响因果(联立性偏误)+现实生活中,个人的教育决策往往要综合考虑收入y和学费fee、年纪age等因素,相当于估计如下联立方程:
①lnyi?
?
0?
?
1edui?
?
2malei?
?
3birthi?
ui②edui?
?
0?
?
1lnyi?
?
2lnfeei?
?
3agei?
vi将①式代入②式,则edu=f(male,birth,fee,age,u,v)所以cov(edu,u)≠0,edu就是内生变量
解释变量测量误差+假定变量x1实际观测到的值是x1*,则测量误差e1=x1-x1*,假设E(e1)=0所以实际估计的模型是yi?
?
0?
?
1x1?
u?
?
1e1如果cov(x1*,e1)=0,这是最常见的测量误差情形,则cov(x1,e1)=E(x1e1)=E(x1*e1)+E(e21)=δ2e
选择题:
下面哪个不是造成内生性的原因()A.遗漏重要解释变量C.被解释变量测量误差B.解释变量测量误差D.反向因果
3.内生性的解决方法为了准确估计edu的系数,只需满足E(ξ|edu,male,birth)=E(ξ|male,birth)上式称为条件独立假设(CIA),比通常的E(ξ|edu,male,birth)=0外生性条件要弱。
如何理解CIA?
假设个人是否上学和上几年学都是由自己的能力和家庭条件内生决定的,而这两个变量也同时影响收入,假设性别male和出生地birth能很好的度量能力和家庭条件,所以再控制住male和birth的前提下,相当于把影响收入的能力和家庭条件从随机干扰项中提取出来,这样edu就和影响收入的不可观测因素不相关,此时edu仿佛是随机决定的,从而不具有内生性。
+解决方案:
RCT(随机受控实验)一个人是否上学不是由个人根据能力和家庭条件等个体特征内生决定,而是以抽签和抛硬币等随机方式决定。
核心思想:
不同于以往的控制,不要求把所有其他影响收入因素都控制住,只要求干预(上学)分配是随机的,这样原因变量(是否上学)与其他任何变量(可观测和不可观测的)不相关,从而不存在遗漏变量和反向因果的内生性。
随机化的关键在于可以使原因变量外的其他因素(家庭条件、能力、性格等)能够平衡,从而消除了选择偏差,处理组(上学的人)和参考组(没有上学的人)之间具有可比性。
生物医学实验概念,如今广泛应用在社会科学政策评价。
+简单原理edu由随机方式决定,可以通过检验证明它与可观测因素male和birth在理论上无关。
所以此时估计mincer方程可以不放入male和birth等控制变量。
因为根据计量理论,引入跟核心变量无关的控制变量不会影响估计的无偏和一致性,只可能使得估计精度提高,改善估计有效性。
此时模型变为lnyi=β0+β1edui+ξi那么β1=E(lnyi|edui=1)-E(lnyi|edui=0)(差分估计)通过估计edui=γ0+γ1malei+γ2birthi然后利用F检验H0:
γ1=γ2=0来验证是否随机这一过程相当于检验male、birth等可观测变量在组间均值差异是否显著,所以又称变量平衡性测试。
如果不拒绝原假设H0,则可以认为edu是随机分配的。
RCT能简单准确识别因果关系的同时也存在局限之处:
+1.拿人做实验很多情况有违社会伦理道德+2.费时费力,且耗资巨大+3.霍桑效应与一般均衡效应等导致的外部有效性问题实际生活中大量存在反应个体选择的观测数据(各种微观调查数据、宏观年鉴数据),如何避免内生性,准确识别因果关系,必须借助于并非为了实验目的而发生的外部冲击,使得当事人仿佛是随机的被分在了处理组或者控制组,这种政策冲击我们称之为准自然实验,下面介绍的工具变量、双重差分和断点回归就是其具体应用。
《计量经济学》第二讲工具变量(IV)主讲:
王岳龙?
工具变量的含义和计量原理?
怎么样寻找好的工具变量?
上机操作
工具变量1.工具变量的含义和计量原理
(1)例:
农产品市场模型
这种偏差为“联立方程偏差”(simultaneitybias)或“内生变量偏差”(endogeneitybias)
如能将内生变量分成两部分,一部分与扰动项相关,另一部分与扰动项不相关,可用与扰动项不相关的那部分得到一致估计。
这种分离常借助另一“工具变量”来实现。
假设存在某个因素使得供给曲线移动,而需求曲线保持不变,则可以估计出需求曲线,如图所示:
这个使得供给曲线移动的变量就是工具变量。
+
(2)计量原理?
IV1?
pcov(q,x)cov(p,x)?
?
1?
cov(u,x)cov(p,x)?
?
1一致性条件+外生性:
要求工具变量与误差项不相关,即cov(u,x)=0不可直接检验,只能靠逻辑论证,为了保证外生性,一般选取独立于经济系统之外的自然、地理、历史等因素。
一致性条件+相关性:
要求工具变量与内生变量高度相关,即cov(p,x)≠0可检验,一般要求第一阶段F>10,此时对应的估计偏差大约为OLS估计偏差的1/9,否则会导致IV估计方差变得很大,称为弱工具问题。
但是也不是越大越好,太大如好几十甚至上百,可能就不会很外生。
所以外生性和相关性通常是存在tradeoff,这更加大了寻找IV的难度。
说明:
本讲考虑到本科生的接受程度,都只考虑了一个内生变量和一个工具变量的恰好识别问题,所以此时F等于对应工具变量估计标准误的平方。
(3)步骤:
2SLS
注意:
最好不要手动回归,因为第二步估计用到第一步估计的拟合值,所以标准误需要对自由度进行调整,情况比较复杂,好在目前各种主流计量软件会自动帮忙我们处理这个问题。
选择题:
下面哪些是对工具变量的要求()A.有效性C.外生性B.相关性D.无偏性
2.如何选择一个好的工具变量+基本步骤第一步相关性我们可以通过第一阶段F检验来判断,最大问题是第二步外生性,因为误差项ξ不可观测,考虑到因变量y也受其影响,所以实际应用中从候选工具变量z与因变量y的相关性入手。
实际应用中第二步外生性也转变为排他性约束即工具变量z有且只有通过内生变量x影响y这一点目前主要也是靠逻辑推理,借助相关文献来论证。
如果发现z有通过其他可观测渠道w影响y,可以在原来模型中将w控制住,类似OLS回归中的条件均值独立假设,控制变量的引入只是使得工具变量近似随机,满足外生性假设E(ξ|z,w)=E(ξ|w),其本身系数通常不具有因果效应。
工具变量原理示意图如下:
+
+
+
《计量经济学》第三讲双重差分(DID)主讲:
王岳龙?
双重差分的思想?
双重差分的计量原理?
双重差分的注意事项?
上机操作
双重差分(DID)1.双重差分的思想+举例假设有两个经济社会各方面发展状况差不多的地区A和B,唯一不同的是A在2009年开通了地铁,而B没有通地铁,假设在通地铁前的2005-2008年两地房价年均增长率都是10%,2009年-2013年A地区房价年均增长率是15%,B地区同期房价年均增长率为12%,那么地铁开通对A地区房价上涨的影响程度是多少?
+研究思路如果合理,那么很容易算出地铁开通对房价上涨的影响就是15%-12%=3%。
特别地,如果2009年前A、B两地的房价增长率不同,分别是11%和10%,那么A地区如果没有修地铁,之后的房价增长率到底是12%+1%=13%还是12%*1.1=13.2%,则对应房价上涨的贡献率分别是2%和1.8%,到底以上哪个结果是靠谱的?
2、双重差分的计量原理将开通地铁地区A看成处理(实验)组(treat=1),未开通地铁地区B视为参考(控制)组(treat=0),开通地铁后的2009-2013年记为处理后(post=1),之前的2005-2008年记为处理前(post=0),则可以通过如下模型估计地铁开通对房价带来的处理效应。
模型设定如下:
yit=β0+β1treati+β2postt+β3(treati*postt)处理前处理后前后差分处理组参考组组间差分β0+β1β0β1β0+β1+β2+β3β0+β2β1+β3β2+β3β2β3
yit=β0+β1treati+β2postt+β3(treati*postt)处理前处理后前后差分处理组参考组组间差分β0+β1β0β1β0+β1+β2+β3β0+β2β1+β3β2+β3β2β3特别地,如果只有前后两期,又可写成:
Δyi=β0+β1treati?
3?
[E(ytreat,after)?
E(ytreat,before)]?
[E(ycontrol,after)?
E(ycontrol,before)]所谓双重差分,首先对处理组和控制组进行组内前后差分,对于处理组有Δyit=β2+β3,此时包含地铁开通对房价影响的处理效应和时间效应(即便没有处理,房价y也会随着时间变化的自然增长趋势)
对于控制组有Δyit=β2,此时只有时间效应最后,处理组和控制组组间再差分Δ2yit=β3,此时只有处理效应。
其中β1是事前组间差异,β2是时间效应。
所以关键在于处理组和控制组时间效应相同能抵消(β2相同),也就是所谓的事前平行趋势假设,只有处理前两组的y有着相同的增长率,我们才有可能相信在没有外界干扰的情况下,处理后两组y继续保持相同的增长率,从而推算出处理组如果在没有接受处理情况时的反事实。
双重差分原理示意图通过处理组在处理前的样本点作关于参考组事后的平行线,从而找到处理组事后如果没有接受处理时候的反事实。
3.双重差分的注意事项
(1)最重要的前提假设是事前平行趋势,可以通过画出处理组和参考组在事前各年关于y的均值变化图。
如下图所示双重差分估计的事前平行趋势图
+也可以通过估计下列模型yit?
?
0?
?
1treati?
?
2postt?
?
3treati*year2005t?
?
4treati*year2006t?
?
5treati*year2007t?
?
6treati*year2008t然后利用F检验H0:
β3=β4=β5=β6=0的联合显著性,如果不拒绝原假设,则说明事前平行趋势满足
+
(2)基于准自然实验的双重差分,不同于基于随机受控实验的差分估计,不要求处理组和参考组是随机决定的,可以由与y及其相关的一些因素来决定,只要不与Δy相关即可,也就是说它是关于Δy而不是y的条件均值独立即E(Δy0|treat=1,x)=E(Δy0|treat=0,x),比OLS的识别假设E(y0|treat=1,x)=E(y0|treat=0,x)要松的多,这也是其如今应用广泛的重要原因。
等价于之前的E(ξ|treat,x)=E(ξ|x),因为这里treat只有0和1两个值
+(3)为了满足事前平行趋势和条件均值独立假设,可以在回归中尽可能的加入一些影响处理组选择的控制变量x。
+(4)双重差分解决内生性的关键在于,可以通过差分将一些同时影响处理组选择和因变量的不随时间变化的不可观测因素消除,从而很大程度上避免遗漏变量偏差。
+(5)其本质在于能找到两个维度的外生冲击所带来的变化来识别因果效应,不一定有交互项,目前已经有很多变形和扩展。
《计量经济学》第四讲断点回归(RD)主讲:
王岳龙?
断点回归的思想?
断点回归的计量原理?
断点回归的注意事项?
上机操作
断点回归(RD)1.断点回归思想+例子:
大学教育的回报率这是在讨论因果关系。
而识别因果关系需要其他影响结果的因素保持一致,只有原因变量变化从而导致结果也发生变化,显然只简单比较上没有上大学是远远不够的。
+研究思路能力是决定学历和收入的非常重要因素,两部分人的能力差异是非常大的,所以把他们之间的收入差异全部归因于是否上大学肯定是不合适的。
那我们是不是可以只比较分数线上下一两分的人,认为他们在各方面(可观测变量如之前的学习成绩和不可观测变量如能力)都没有系统差异。
+分类如果考上500分一定保证你上大学,这个称之为精确断点。
但是现实生活中更多可能因为单科受限、身体缺陷等某些原因,导致超过了学校的录取分数线仍然没有被录取,这时候500分就是模糊断点,超过500分不一定保证你一定上大学,但是一定显著提高了你上大学的概率。
2.断点回归的计量原理对于明确断点,高考分数x是分组变量(驱动变量),500分数线用断点c表示,由于超过500分一定上了大学,所以有处理变量D=1ifx≥c,反之D=0,实际选取500分上下一定分数作为研究样本的,称为带宽h,此时计量模型如下:
yi=β0+β1Di+β2(xi-c)+β3(xi-c)2+β4(xi-c)*Di+β5(xi-c)2*Di(c-h≤xi≤c+h)β1就是我们关注的系数,分组变量x减去断点c是为了将断点标准化为0,在处理动态断点时尤其有用。
比较RCT的计量模型yi=β0+β1Di,明确断点回归多了许多变量,特别是分组变量及其平方项,以及与处理变量的交互项等
选择正确多项式拟合的重要性(一般到二次就可以了,最高不要超过四次)
对于模糊断点,由于超过500分也不一定能上大学,因此此时分组变量高考分数x与是否上大学的处理变量D脱钩,但是由于上了500分还是能显著提高上大学概率,因此此时我们可以用z=1ifx≥c(反之z=0),做最后实际有没有上大学的处理变量D(实际上大学D=1,反之D=0)的工具变量。
同样估计下列模型:
yi=β0+β1Di+β2(xi-c)+β3(xi-c)2+β4(xi-c)*Di+β5(xi-c)2*Di(ch≤不x同i≤c之+h处)在于上式中D及其交互项(xi-c)*D、(xi-c)2*D是内生变量,这里用z及相应交互项(xi-c)*z、(xi-c)2*z作IV进行2SLS估计,同样β1就是我们关注的系数。
为什么合理?
3.断点回归的注意事项+1.最重要的识别假设是断点是外生的,不能被人为操纵,可以通过画出分组变量的直方图,检查其分布,重点看断点两侧分布是否连续。
+2.为了验证确实是处理变量变化造成的跳跃,可以对一些影响y的控制变量w也进行断点回归,如果不显著,则支持了断点回归的结果,这个类似RCT里面的变量平衡性测试,也间接验证了断点确定的随机性。
+3.断点回归的参数估计方法高度依赖于样本区间和模型形式,所以在实际应用中应该对多项式的函数形式和带宽进行灵活设置,以保证结果稳健性。
最重要的识别假设是断点是外生的,不能被人为操纵,可以通过画出分组变量的直方图,检查其分布,重点看断点两侧分布是否连续。
为了验证确实是处理变量变化造成的跳跃,可以对一些影响y的控制变量w也进行断点回归,如果不显著,则支持了断点回归的结果,这个类似RCT里面的变量平衡性测试,也间接验证了断点确定的随机性。
断点回归的参数估计方法高度依赖于样本区间和模型形式,所以在实际应用中应该对多项式的函数形式和带宽进行灵活设置,以保证结果稳健性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生性 问题 及其 处理