解决厂商生产函数估计中的内生性问题从参数估计到非参数估计.docx
- 文档编号:27991748
- 上传时间:2023-07-07
- 格式:DOCX
- 页数:22
- 大小:54.55KB
解决厂商生产函数估计中的内生性问题从参数估计到非参数估计.docx
《解决厂商生产函数估计中的内生性问题从参数估计到非参数估计.docx》由会员分享,可在线阅读,更多相关《解决厂商生产函数估计中的内生性问题从参数估计到非参数估计.docx(22页珍藏版)》请在冰豆网上搜索。
解决厂商生产函数估计中的内生性问题从参数估计到非参数估计
解决厂商生产函数估计中的内生性问题:
从参数估计到非参数估计
第1组计量经济学理论与方法(文章字数:
9400)
1解决厂商生产函数估计中的内生性问题:
从参数估计到非参数估计
摘要生产函数估计中的内生性起源于联立性偏差,导致OLS估计有偏非一致。
随着经济计量理论的发展、计算机运算速度的提高和数据多样性及可得性加强,先后出现了多种解决方法,工具变量,代理变量,固定效应模型,随机效应模型等等。
这些方法的发展脉络表现出相互关联的两个特征,其一,模型设定的假设逐渐放松,其二,在估计中越来越多的采用半参数或非参数估计法,用经验估计替代原先的设定。
本文在梳理厂商生产函数各种估计方法的基础上,重点介绍了Olley和Pakes采用半参数估计的代理变量法及其发展。
本文通过对我国某一制造行业的经验分析发现,非参数估计结果具有较高的稳健性,但是要求有较大的样本量和更多的变量。
关键词厂商生产函数内生性非参数估计
引言
生产函数是厂商理论的重要内容。
早在1890年,马歇尔在他的著作《经济学原理》中已经提出了生产函数理论。
对生产函数的估计一直是经济计量领域中的重要组成部分。
随着学科的交叉发展,生产函数以及与生产函数相关的理论已经广泛的应用到各种学科和研究领域,因此生产函数的估计具有重要的理论价值和实践意义。
内生性(endogeneity)是估计厂商生产函数需要解决的一个重要问题。
厂商理论中,生产函数是厂商实现利润最大化的联立方程组中的一个结构式,所以经济学家所观察到的厂商投入决策并不是一个外生变量,而是由厂商最优化目标所决定的内生的结果。
在单方程背景下,
2厂商所做的投入决策是一个内生变量,它与不可观测的遗漏变量(omittedvariable)相关,因此导致结构式生产函数的OLS和ML估计有偏非一致。
随着经济计量理论的发展、计算机运算速度的提高和数据多样性及可得性加强,先后出现了多种解决方法,工具变量,代理变量,固定效应模型,随机效应模型等等。
这些方法的发展脉络表现出相互联系的两个特征,其一,模型设定的假设逐渐放松,如参数恒定假设与随机变量服从某一分布假设,其二,在估计中对不可观测变量越来越多的采用非参数估计法,用经验核估计(kernelestimation)替代原先的分布假设。
较早的随机前沿模型(stochasticfrontiermodel)都是事先假定不可观测变量(技术效率)服从某种参数分布,如指数分布或者半正态分布,将不可观测变量显性化(observable)。
在Park等(1994)随机前沿模型中,不可观测变量的分布密度是未知的,他们用半参数估计得到斜率的有效估计值。
Olley和Pakes(1996)将不可观测的变量用可观测变量的函数关系来表示,即构成了模型的非参数部分,与生产函数的确定性部分构成局部线性模型,采用Robinson(1988)两步法估计斜率。
他们的模型建立在厂商行为模型基础上,在估计上还处理了样本的选择性偏差,其理论基础和估计方法都具有一定前沿性。
Ackerberg等(2007)对该方法进行了发展。
本文首先回顾了厂商理论中内生性产生的原因和早期的解决方法,然后对当前解决生产函数中内生性问题的各种方法进行比较,第三部分介绍Olley等的估计方法,并结合Ackerberg等对模型的发展和中国实际情况,扩展了Olley模型,第四部分以中国制造企业(毛纺织业)的数据为例,进行估计,并对结果进行稳健性建议,最后给出评论和进一步研究的方向。
1李玉红,女,1976年12月生,经济学博士,助理研究员,中国社会科学院数量经济与技术经济研究所。
2在很多文献中,不可观测变量被认为是与厂商技术、效率或管理能力有关的变量。
1
第1组计量经济学理论与方法(文章字数:
9400)
一、厂商理论和内生性问题的回顾
对微观生产函数的研究继承了经典的厂商生产理论。
早在20世纪40年代,Marschak和
1944)已经在生产理论和微观经济计量方面做出了里程碑式的贡献。
他们从讨论Andrews(
经济变量之间因果性关系开始,区分了经济学家和农田实验者(experimenter)的不同,区别最大的就是实验者可以控制投入到土地中的要素的数量,而经济学家却不能控制厂商的投入决策。
对于经济学家而言,他们只能观测到厂商的投入产出行为而不能进行控制,因此他们所观察到的厂商的投入决策并不是一个外生变量,而是由厂商最优化目标所决定的内生的结果。
这样,农田实验者的生产函数可以用传统的OLS估计得到无偏一致估计量,而经济学家对厂商生产函数的估计就存在联立性问题(simultaneity),传统OLS估计就是有偏而非一致。
在Marschak和Andrews(简称M.A.)的模型中,假设有两种投入x和x,产出为y,12农田实验者的生产函数为,
(1)yxx,,(,)12
但是对经济学家而言,他们只能观察到厂商的投入产出,而无法控制其中的投入决策,这样厂商的投入和产出并不像试验者的生产方程那样简单,其投入决策由利润最大化规律所决定。
用p表示对应的x的价格。
其边际生产率方程为,
,,yxpp110
(2)
,,yxpp220
如果引入随机因素,M.A.的模型就变为,
yxx,,,(,,)12
,,yxpp(,)(3),,110
,,yxpp(,),,220
其中,和,分别是厂商生产函数和边际生产率条件,和分别是函数中的随机,,,,,,,
扰动项。
厂商之间的异质性归结为技术知识、意愿、努力程度以及运气等因素的不同,这些因素用技术效率(technicalefficiency)表示;边际生产率条件中的随机变量和,则是因为,,,各种厂商投入和产出价格的不同,以及经济效率(economicefficiency)的不同,即厂商选择最优投入组合的能力、意愿或者运气的差异。
估计结构方程组(3)就能够得到厂商的生产函数。
但是,很多情况下研究者感兴趣的仅仅是简化式生产函数,而且由于投入和产出价格不容易得到,所以人们更喜欢估计生产函数,而不是联立方程组。
如果在估计生产函数过程中,简单的把投入要素作为外生变量,显然是有问题的,如果投入要素与相关,那么OLS估计量有偏非一致。
因此,需要对联立方程,
3组中误差项做一些设定。
Hoch(1958)对方程组的扰动项关系做了分类,在极端的情况下,生产函数扰动项和要素
3需要说明的是,引入随机扰动项的意义很大。
如果没有随机扰动项,在利润最大化条件成立的情况下,上面的联立方程组将只有一组解,就是说,所有厂商的投入和产出数量都是相同的。
这显然与现实不符,因为即使在生产相同产品的细分行业内,企业之间的规模都有很大的不同,很少看到某一个行业内部所有企业的投入决策和产出数量完全一致。
不一致说明厂商之间的生产函数是不同的,而这并不是研究者所要得到的结果。
如果引入随机扰动项,就可以解释这一难题。
Nerlove(1966)认为,厂商之所以选择不同的投入产出组合,一方面是他们面对不同的产品需求曲线和投入供给曲线,另一方面,即使面对相同的需求和供给曲线,厂商管理能力的差异决定了相同的投入组合会有不同的产出水平。
2
第1组计量经济学理论与方法(文章字数:
9400)需求扰动项不相关,此时生产函数不存在联立性问题;如果生产函数中的扰动项影响了投入要素的需求,那么投入要素的估计量非一致。
Mundlak和Hock(1965)从只有一种投入的生产函数设定入手,把影响投入要素内生性的扰动项分为三种情况,一种是完全转移(completely
4transmitted),,此时LS估计量不一致,IV估计量一致;一种是没有转移,y,f[x(,,u),,]
,即,此时LS估计量一致,IV估计量非一致;最后是一般情况,y,f(x,,)cov(,)0x,,
随即扰动项部分转移(partiallytransmitted),,此时LS和IV估计y,f[x(,,u),(,,,)]112
量都不一致,系数真实值比LS估计量小但比IV估计量大。
Zellner,Kmenta和Dreze(1966)在Marschak和Andrews传统设定的基础上,提出了一套备选的设定和估计方法。
他们认为,厂商最大化的是其期望利润,同时他们把扰动项作了具体分类,由于假设生产函数中的扰动项与投入需求的扰动项不相关,所以LS估计是一致估计量。
他们还在文中给出了系数的ML估计量和贝叶思(Bayesian)分析。
20世纪70年代以前,对厂商生产函数的各种特征和估计方法的理论研究比较多,由于缺乏微观数据的支持,经验研究相对较少,而且大部分研究集中在农业领域(Tintner,1944;Griliches,1957;Mundlak,1961)。
70年代以后,尤其是80年代以来,政府逐渐放开了厂商统计数据,对单方程厂商生产函数的热情逐渐复苏,由联立方程所产生的内生性成为结构式生产函数估计所必需解决的难题。
二、简化式生产函数中内生性的解决方法
对于一个两投入厂商生产模型,假设生产函数为Cobb-Douglas形式,Hicks中性技术,函数一般形式为,
i=1,?
N;t=1,?
T(4)ylk,,,,,,,,,,,,,,itititlititkitititit0
其中,下标i表示观测对象,下标t表示时间。
y、l和k分别是产出、劳动和资本变量的对数形式,这是可观测的变量,系数为相应变量的产出弹性。
不可观测的变量有两类,,
第一类是时不变变量(timeinvarying)和,也称为固定效应变量,是观测对象的个体特,,,iti
征(individualspecific)变量,对于同一对象不随时间变化;为时间特征(timespecific)变量,,t
在同一时点上不随个体变化。
第二类不可观测变量称为时变(timevarying)变量,它随个体,it
25和时间同时变化。
为随机扰动项,期望为0,方差为。
为简化模型,忽略了其他控制,,itit
变量。
式(4)是一个变系数(varyingcoefficient)模型,投入要素的系数以及扰动项的方差都随着观测对象和时间的变化而变化。
尽管这种设定与现实最为相符,但是待估参数个数超过了样本数,所以无法估计。
为了估计这个模型,需要对模型做一些假定,假设所有观测对象同质,扰动项同方差,这样,式(4)变为,
4是生产函数中的随机扰动项,u是一阶条件中的随机扰动项。
5很多文献称之为生产率冲击,即厂商的技术和效率,包括管理能力等对厂商已知但是研究者未知的变量。
3
第1组计量经济学理论与方法(文章字数:
9400)
(5)ylk,,,,,,,,,,,,,,itlitkitititit0
这种情况下,劳动和资本的产出弹性不随观测对象和时间变化,待估参数个数大为减少,模型估计成为可能。
特殊情况下,如果N为1,模型就变为时间序列模型;如果T为1,模型就成为横截面数据模型。
(一)固定效应模型。
综列数据(PanelData)能够解决第一类不可观测变量引起的问题。
如果和与投入,,it要素相关,那么差分法、LSDV或组内估计量(withinestimator)都能够得到投入系数的一致
6估计量。
在随机前沿分析中,随机生产模型通常设定为,
ylk,,,,,,,,,,itlitkitiit0
其中,是生产函数随机前沿面,是个体效应,代表厂商i的技,,,,,,,lk,i0litkitit
术效率,它通常在前沿面的下方,与前沿面的距离度量了厂商技术无效的程度(inefficiency),因此为负值。
如果个体效应与投入要素相关,那么固定效应模型可以估计出个体效应。
但是,如果投入要素与第二类不可观测变量存在相关性,这通常是现实情况,那么固定效应模型就无能为力,否则估计结果会有两个问题,首先,如果投入要素存在度量误差,固定效应估计量可能比OLS估计量还要差。
Griliches和Hausman(1986)发现,当要素的序列相
7关程度高于度量误差时,差分会降低解释变量的信号噪音比。
这样得到的估计量比OLS估计量的偏差还大。
另外,在实践中固定效应估计量表现差强人意,资本系数通常偏低,投入弹性之和明显小于OLS方法,平衡综列数据与非平衡综列数据得到的估计值有很大差异。
(二)随机效应模型。
8如果个体效应与投入不相关,可以假定个体效应服从某种分布,如半正态分布或指数分布。
这样,通过极大似然估计,可以得到感兴趣的参数估计值,从而得到个体效应的估计值(SchimitandSickles,1984)。
然而,事先假定个体效应服从某种分布具有一定的缺点,这也是参数模型共有的缺陷。
如果模型设定正确,那么参数估计值以的速度收敛,然而一旦模型设定错误,参数估计n
量就不可能完全有效,在很多情况下甚至是非一致的。
因此为参数估计和检验所强加严格假设的代价相当大。
随着非参数估计的发展,密度估计开始应用到随机前沿模型中,Park和Simar(1994)提出在不给定个体效应分布情况下,得到随机前沿模型中斜率的有效半参数估计量。
(三)工具变量法。
在生产函数估计中,理论上的工具变量有投入要素的价格或者要素的滞后变量。
在完全竞争条件下,厂商是价格接受者,厂商决策不能影响价格,而价格和要素之间存在相关性,使得价格成为要素投入的工具变量。
但在实际选择中,有一定的局限性,首先,厂商并不经
6当然,这些方法有一定的局限,即不可观测变量的个数不能超过一个。
Mundlak(1961)讨论了如何分离生产函数中管理因素的影响。
如果扰动项中只有管理因素是唯一影响投入需求的不可观测变量,而厂商的管理能力在短期内不变,那么对前后两期的数据进行差分,就可以过滤管理变量,从而得到其他投入要素和管理系数的一致估计量。
如果扰动项中有不止一个类似于管理的变量,就很难区分管理和其他不可观测变量。
7由变量真实方差引起的解释变量的方差与由度量误差引起的解释变量的方差之比。
8通常情况下,模型假设个体效应与回归元不相关。
随机效应可以估计出回归元系数部分,但是不能得到个体效应估计值。
4
第1组计量经济学理论与方法(文章字数:
9400)常报告投入的价格,所能得到的通常是劳动平均价格,而且完全竞争市场这个条件很难满足,如劳动力的同质性,因此工资中可能包含了研究者所观测不到的劳动质量因素。
如果高质量的劳动者报酬也高,那么工资就会与包括在中的质量因素相关,从而破坏了成为工具变,
量的条件。
其次,经济计量估计要求要素价格有一定的变动(variation),而且这种变动不是因为投入质量的不同,而是由于外生的要素市场条件的差异。
但同一时期内厂商之间的投入要素价格并不会有很大的差异,这就使得估计比较困难。
要素滞后变量也是可选的工具变量。
Blundell和Bond(1998)提供了一种采用工具变量的估计方法。
他们假设服从AR
(1),过程,前后两个时点进行广义差分,消去了,然后根据投入要素滞后值与当期随机扰动,
项不相关假设,得到一组过度识别的矩条件(momentcondition)。
采用广义矩估计(GMM)能够得到一致估计量。
这种方法对综列数据的时间维度有比较高的要求,如果滞后期为1,那么至少需要满足T不小于3。
(四)代理变量法。
解决内生性问题的另外一个思路是寻找代理变量,即找到与高度相关的可观测变量,
或者某种函数关系来表示,使其显性化。
随机前沿领域中的Cornwell等(1990)放松个,
体效应不随时间变动的假设,使个体效应成为时间的二次函数,然后使用ML方法估计斜率。
这种方法需要事先设定的分布,因此设定是否正确影响着估计量的有效性。
Olley和Pakes用投资函数的反函数来表示,构造出局部线性模型,,
ylk,,,,,,,,,,,,,itlitkitit0
局部线性模型是半参数模型的一个特例,其中,是用其他变量表示的函数,是模型,
的非参数部分。
OP采用Robinson(1988)两步法估计出参数部分的斜率和非参数部分。
可用的代理变量还有中间投入(LevinsohnandPetrin,2003),劳动需求的一阶条件(Biesebroeck,2003)等等。
Ackerberg等(2007)对这些方法进行了比较和扩展。
无论是随机效应模型还是代理变量法,非参数估计已经成为放松分布假设的一种有力工具加入其中。
就理论基础和估计方法而言,OP法都具有较高的价值,然而,这种方法也并非没有代价,首先,非参数估计要求较大的样本量,因此不适合小样本估计,其次,对投资数据为正的要求,损失了很多观测值。
三、OP对内生性的解决方法及其扩展
(一)模型设定。
9OP生产函数的理论基础来自于Ericson和Pakes(1995,简称EP)的行业动态模型,
10是该模型的一个经验分析。
OP模型的关键在于厂商的决策与有关。
假设厂商的生产率,
指数服从外生一阶马尔科夫过程。
厂商的目标函数是最大化未来净现金流贴现值的期望,,
11假设存在马尔科夫完美纳什均衡,在均衡状态,利润函数和值函数都依赖于市场结构和要
12素价格,厂商Bellman方程记为,
,,,,,(6),,,,,,,,,,V,,Kmax,sup,,,Kci,EV,,KJ,,tttttttt,1t,1t,1ti,0,t,
9对理论模型感兴趣的读者请参考,,的文献。
10国内对这一模型的综述见金剑等(2006)。
11厂商退出决策和投资决策依赖于对未来市场结构分布的预感,由这种预感所产生的投资、进入和退出决策反过来生成了未来市场结构的实现。
EP证明了存在马尔科夫完美纳什均衡(厂商对未来市场结构分布的感知与厂商决策所生成的实际市场结构分布相一致)。
12在给定时期,这些状态变量对各厂商都相同,为简化符号忽略掉它们。
5
第1组计量经济学理论与方法(文章字数:
9400)
是当期所得利润,是当期投资的成本,是未来现金流的贴现因子,是当,,,,,,,ciJttt期所能获得的信息。
对Bellman方程的求解得出两个决策,第一,退出决策。
厂商比较清算收益和继续营业的预期收益。
如果厂商生产率低于某个水平,继续营业得到的收益低,,t
于清算收益,那么厂商选择退出,当期得到,未来收益为零;第二,投资决策。
如果厂,
商生产率高于,厂商会继续营业,根据状态变量确定最优投资水平i,得到不低于的,,t
期望收益。
这两个决策表示为:
1if,,,,,K,ttt(7),,,t0otherwise,
(8),,i,i,,Ktttt
和由马尔科夫完美纳什均衡决定,依赖于决定均衡行为的所有参数。
假设在给定,itt
时点,只有一个未观测到的状态变量影响了厂商行为;Pakes(1994)证明,在给定所有,
观测到的状态变量的条件下,投资是生产率的严格单调增函数(至少在某个已知子集内)。
在投资为正的情况下,投资函数对生产率的反函数为,
(9),,,,,i,ktttt
这样就可以用投资函数的反函数作为代理函数,将观测不到的生产率用可观测变量的函数来表示,
(10)yliku,,,,,,,,itlititttit
其中,。
,,,,,i,k,,,,k,,i,kittt0kitititit
(二)估计步骤。
1(可变要素系数的估计。
式(10)是一个局部线性模型,是模型中的非参数部分。
Robinson(1988)给出了,,,,
局部线性模型中线性部分系数的估计方法,即采用两步法估计劳动系数。
具体步骤为:
第一,给定i和k情况下,对半参数模型求条件期望,就有
EyikElikik,,,,,,,(11),,,,,,itititlitititititit
将式(10)减式(11)得到,
yEyiklEliku,,,,,,,(12),,,,,,ititititlititititit
ˆˆ,,,,第二,分别求y和l的经验条件期望Eyi,k和Eli,k,以代替真实条件期望,令
ˆˆˆˆˆˆ,,,,,,y,y,Eyi,k,l,l,Eli,k,m,m,Emi,k。
ˆˆˆ第三,将经验条件期望带入(12),用对回归,得到。
Robinson证明,半参数模型y,ll
6
第1组计量经济学理论与方法(文章字数:
9400)中有限维度参数可以在通常的收敛速度下估计得到。
n
2(非参数部分的估计。
从式(4.18)可以导出,非参数部分,在得到的一致估计量之后,,,,,,Eylik,,,,,,l
ˆˆˆ可以用核估计方法得到。
,,,,Eylik,,,,,l
3(估计生存概率。
厂商的生存概率或得分倾向(propensityscore)为,
PkJPkk,,,,,,,,,1,,,,,,,,,,,,ttt,,,111ttttttt,,,,,11111(13)
,,kikP,,,,,,,,,,,,t,1ttttttt,1
ˆ可见,生存概率可以表达为投资和资本的函数。
可以通过Probit模型或者非参数估Pt
计得到。
4(资本系数的估计。
在生产函数中,资本通过两种渠道影响了产出,一方面作为投入要素直接对产出作出贡献,另一方面通过投资函数传导,间接影响了产出。
为了得到资本系数的一致估计量,必须区分两种不同的作用机制。
T+1期,的期望及生产函数分别为,,
(14)EEgPik,,,,,,,,,1,,,,,,,,,,,,,,,t,1ttttttttt,,,111t+1
(15),,y,,l,,m,,k,gP,,,,k,,,,t,1lt,1mt,1kt,1ttktt,1t,1
生产函数中,是期望的冲击,它是厂商预料不到的变化,因此与要素投入不相,,t,1t,1
关。
在得到,和的估计之后,代入式(15)就得到,,Pltt
ˆˆˆ(16)ylkgPk,,,,,,,,,,,,,,,tltktttkttt,,,,,11111
对这个非线性模型有两种估计方法,第一是将用多项式展开,S是展开的最高阶项,,g,
S,mSmjˆˆ数,,用非线性最小二乘估计得到资本系数的估计值。
,,,,g,,,,,,kP,,mjtktt00j,,m
o第二种方法是用非参数方法搜索资本系数,给定初始值,就有,k
oˆˆˆylkgPk,,,,,,,,,,,,,,,,,,,,11111tltktttkttt
ˆ搜索不同的取值,使得残差平方和最小的值就是。
,kk
(三)模型扩展。
OP假设劳动是是可变要素,能够随时调整,因此并不是状态变量,并不影响生产率,从而没有进入投资函数。
Ackerberg等(2007)认为,只有资本作为状态变量的假设过于严格。
对于中国来讲,很多企业尤其是国有企业调整劳动的成本很高,企业在需求旺盛的时候固然
7
第1组计量经济学理论与方法(文章字数:
9400)可以招聘到职工,但是在需求不足情况下不能随时解雇职工,因此就业存在一定的粘性,并不完全是可变要素。
尤其是在中国国有大中型企业内,职工的工作相对稳定,流动性较弱。
在外资和私营企业,劳动合同法的存在也并不能使得企业随意解雇职工。
因此,企业投资决策并非只看资本而不顾及劳动。
ˆ假设劳动和资本都是状态变量,估计过程类似于OP,但是第一步只能得到,而劳,,,,动和资本系数最后同时估计。
扩展后的模型变为,
(17)ylkglkPu,,,,,,,,,,,,,,,,,,tltkttltktttt,,,,,101111
四、经验分析—以毛纺织业为例
(一)模型设定
13本节模型以式(5)为基础,但是投入要素中加入了中间投入变量,产出用总产出表示。
在微观层面,三投入的结构更能解释投入和产出的关系。
模型以投资和所有要素投入作为状态变量,这是一个最一般化的设定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 解决 厂商 生产 函数 估计 中的 生性 问题 参数估计