1、认识农村居民收入差距现状并研究引致收入差距的因素,对缩小收入差距的政策制定有重要意义。本文以2004 年内蒙古和甘肃两省的横断面数据为基础,测算农村居民人均纯收入的不平等程度,在此基础上利用不平等分解研究领域较新的回归分解方法,分析引致农村居民收入不平等的因素及其贡献度。1 文献综述1 1 中国农村收入差距的既有研究围绕中国农村收入分配问题,在国内外已有很多研究。谢伏瞻分析了中国农村居民家庭的收入分配格局在农村经济体制改革以后发生的重大变化,认为农村剩余劳动力从传统农业中转移出来,促进了农村生产力的流动和重组,导致农村产业结构的演化与升级,而生产力水平和产业结构的变动,在提高农村居民收入总水平
2、的同时,也引起了不同地区之间、不同家户之间收入差距的扩大1。对于农村收入不平等的状况,Wan 等人指出,自20 世纪70年代末以来,中国农村收入分配不平等有不断恶化的趋势,这种趋势将对中国经济和社会发展产生严重后果,并且如果这种收入分配不平等持续恶化,将影响社会和政治的稳定2。从农村内部居民收入分配的Gini 系数从1981年的0 25 上升到了2002 年的0 383,在20 年时间里,增长超过50%,已逼近国际公认警戒线0 4。在收入差距的影响方面,不断扩大的农户内部收入差距会诱致各种负面效应,比如它会引致农村贫困问题的加剧4,并且削弱农户收入的增长1,5。关于农村收入差距的因素,已有研究
3、主要分为外部环境因素和家庭自身因素两方面。外部环境因素主要有地理区位因素、政治因素、市场条件等,这种外部环境差距造成了农村居民内部的收入差距,谢伏瞻分析得出农户家户所处的地理环境和自然条件对农民收入的影响具有重要意义1,万广华以乡镇企业为地区因素的代理变量,得出其是显著的构成区域间不平等的因素。从家庭自身因素方面来看,主要涉及了收入决定要素中的物质资本、政治资本、人力资本和社会网络资本等因素6。在物质资本方面,许庆等发现家庭联产承包责任制所引起的上地细碎化是农户间收入差距扩大的一个原因7。谢伏瞻提出农民家户对生产要素占有的多寡也是造成分配差距的重要原因1,但是高梦滔和姚洋分析得出,物质资本,包
4、括土地,对于农户收入的差距没有显著影响8。在人力资本方面,大量的文献通过的中国农村农户收入差距的分析发现,教育等主要的人力资本变量对于收入差距具有重要的影响6,8 10。在社会网络资本方面,赵剑治研究了关系对收入差距的贡献及在地区之间的差异,结果发现,社会网络对中国农村居民间的收入差距贡献达到12 1% 13 4%11。在政治资本方面,Morduch 和Sicular 年发现党员和干部等政治因素对于农户收入的决定具有正的效应,并对于农村家庭收入不平等的贡献为正12。1 2 收入不平等的测量及不平等的分解模型收入不平等的测量方法主要有变差系数法、相对平均偏差法、Gini 系数、Theil 指数法
5、、对数方差法等。不平等指标的选择主要由常用性决定,也与可分解情况有关系。Gini 系数、Theil 指数、Atkinson 指数等是比较常用的指标。从收入差距的分解方法来看,己有的文献对于收入差距的研究主要集中于从实证角度分析收入不平等的决定因素。总体来看主要有以下几类:( 1) 用半参数和非参数方法来分析收入差距的决定、基于人群特征而对于收入差距的分解以及基于收入决定方程的分解。( 2) 通过人群特征对收入差距的原因进行分解的方法,主依据研究者的目标变量对总体样本进行分组,然后再估计组内收入差距和组间收入差距来分该目标因素对于收入差距的影响。Morduch 和Sicular 指出这种方法主存
6、在的缺陷12: 这种方法无法对一些连续变量的贡献作分解,当需要对某几个目标变量行考察时,人群的分组数量将会呈几何级数上涨,这样无法处理解释变量和被解释变量之间的联立内生性问题,因为这种方法先验的认为目标变量是外变量,当对样本进行分组后该变量并不记入收入决定方程。( 3) 基于收入决定方程而对收入差距进行分解。这是近年来比较流行的分解方法,但是基于收入决定方程,不同的学者又有不同的分解方法。与其他几种方法相比,Shorrock 年提出的夏普里值( Shapley Value) 分解法13有比较优势。这种方法的好处在于它适用于任何收入决定函数和任何度量收入差距的指标,并且能够很好处理常数项和残差项
7、对收入差距的贡献的问题14。1 3 文献评述已有研究对农村收入不平等的分解的角度是多样的,模型的选择也是多样的。不过Wan14对各种分解方法进行研究之后,认为基于收入决定函数的夏普里值过程的回归分解方法是有效的并且受限较少的模型。经过比较,基于收入决定函数的夏普里值过程的回归分解方法,是本文将选择的分析方法。采用的不平等指标为常用的Gini 系数、Theil 指数、Atkinson 指数。涉及到收入决定函数拟合方面,目前已有文献涉及了收入决定因素方方面面,但是就单个文献本身而言,或多或少地在某些因素上未加考虑,对收入函数的影响因素的涵盖是不够全面的,在收入决定模型中可能存在遗漏变量偏误等问题。
8、因此,本文整合了已有文献中相关的方面,对各方面因素都加以考虑。本文将对已有文献中涵盖的微观方面的各因素系统地进行考虑,并控制区位因素,进行回归分解和比较。2 数据来源、方法及变量2 1 数据来源及处理数据来源于世界银行联合中国国家统计局农调队于2004 年在甘肃、内蒙古两省做的农户家计调查数据。数据以国家统计局农调队每年具体进行的入户调查获得,调查样本采取分层随机抽样。调查选取了甘肃和内蒙古两省7 个县( 或县级行政区域) 、15 个乡( 或乡级行政区域) ,每个乡抽取100 户农户,共1 500 户农户。在选取农户时,根据该地区的经济发展状况、农户收入的主要来源等基本情况,将农户大致分为最低
9、收入家庭、低收入边缘家庭、中等收入家庭和富裕家庭4 类,然后,在每一类中进行随机抽样,使样本覆盖不同收入状况的家庭,尤其是最低收入家庭。此次调查得到的1 500 份数据均为有效研究数据。本文以家庭为基本样本单位,部分数据不能直接获取,而是通过进一步计算得到。具体在变量描述中详细给出。2 2 不平等指标选取、回归方法和分解方法选择2 2 1 指标选择不同的不平等指标包括Gini 系数、变异系数平方、阿肯森( Atkinson) 系数、泰尔指数等。对应于不同的福利函数,并且赋予洛伦兹曲线的不同部分以不同的权数6。由于不同的不平等指标会给出不同的测量结果,而产生不同的分解结果。为保持稳健性,将常用的
10、不平等指标进行分解并进行对比是比较可行的。本文选取了Gini 系数、泰尔指数和阿肯森指数来衡量不平等状况。2 2 2 回归方法使用的软件为Stata10 0 版。采用对数线性模型拟合收入决定函数,使用最小二乘估计法( OLS) 估计系数。通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。在系数估计中,采用了异方差稳健的标准误。2 2 3 分解方法在分解方法选择上,本文采用基于收入决定方程的夏普里值分解方法。由Shorrocks 发展的基于回归的夏普里值( Shapley Value) 方法13进行收入差距
11、分解包含两个步骤: 第一,首先设定一个收入决定方程,并估计出各个自变量的系数; 第二,将收入差距的计算指标运用到该方程的两端,从而得出各自变量对于收入差距指标的贡献度。在收入差距的形成过程中,一个因素对于收入差距的贡献主要取决于两个方面: 一是该因素与收入差距的相关系数,即该因素对于收入的偏效应,在给定该因素的分布下,系数越大,该因素对收入差距的贡献越大; 二是该因素自身的分布状况,在给定该因素对收入的相关系数不变的情况下,它的分布越不平均,那么该变量对于收入差距的贡献也更大,反之亦然。极端地讲,当一个因素的对收入的偏效应接近于0 或者它的分布完全平等时,那么该因素对于收入差距的贡献为零11,
12、这就是基于回归分析的收入差距分解方法的基本原理。2 3 变量描述本文涉及的变量的名称及定义如表1 所示。需要说明的是,本文的应变量为家庭人均收入的对数,呈正态分布。人均收入指家庭总收入与家庭人口数的比值,其中家庭总收入包括了工资性收入、家庭经营收入、财产性收入、转移性收入。模型自变量包括已有文献涉及的社会网络资本、物质资本、人力资本、家庭特征、地区特征五大方面因素。社会网络资本中,人情收入指城市亲友赠送收入和亲友赠送收入之和,人情支出指赠送农村亲友和赠送城市亲友的支出之和。物质资本方面,土地面积为人均土地面积,0 5 ( 期初土地面积+ 期末土地面积) /家庭人口。人力资本方面,平均年龄为家庭
13、平均年龄,其中1 = 6 岁及以下,2= 7 15,3 = 16 18,4 = 19 22,5 = 23 25,6= 26 30,7= 31 40,8= 41 50,9= 51 60,10 = 60 以上; 平均教育取家庭劳动力的平均受教育年数,将教育程度替换为受教育年限并以各教育水平劳动力人数进行加权平均; 培训比为受过专业培训的劳动力人数占家庭劳动力总数之比。家庭特征方面,家庭人口为在家居住6个月以上的常住人口; 男劳动力比为家庭男劳动力占家庭劳动力总数之比; 非农劳动力为家庭非农劳动力占就业劳动力总数之比。表1 收入决定方程的估计结果3 收入决定模型和实证结果分析3 1 收入决定方程收入
14、函数的回归方程为Y = F( X,) ,为了应用夏普里值分解,首先需确定收入决定方程。根据假设,将社会网络资本、实物资本、人力资本、家庭特征、地域固定效应的变量或者代理变量引入收入决定函数,如下:Lnyij = 0 + 1SCij + 2OCij + 3HCij + 4FCij + nFix + ( 1)在( 1) 式中,下标i 表示家庭,j 表示地域。上式中LnY 指对家庭人均收入的对数,SC 是家庭的社会网络资本,OC 是家庭的实物资本,HC 是家庭劳动力的人力资本,FC 是样本家庭的特征,R 是地域的固定效应。对于模型设定,使用的回归方程是半对数模型,没有使用其他模型主要是基于以下几点原
15、因: 考虑到OLS回归对于残差项正态分布的要求,我们在对收入的原值和对数值进行了分布检验,发现取了对数之后,收入的分布更趋近于正态分布,这也很正常,因为如收入这样都为正值的数据,常常符合对数正态分布。样本收入对数的分布图如图1 所示。考虑到收入决定方程的半对数模型在以往的文献中被普遍应用,同时,在有些涉及到收入方程的模型中,也对各种收入方程的形式进行了比较,结果显示半对数模型或者优于其他模型,或者与其他模型没有显著的拟合优度差异12。考虑到分解过程中对于常数项的处理问题,如果使用完全线性模型,那么常数项对于收入差距的贡献将变得比较难以处理,而常数项对收入差距是否具有贡献是存在争议的,而如果用半
16、对数模型,则在待分解的方程中,常数项将转化为一个常数乘积项,对收入差距的贡献没有影响,因此,使用半对数模型也可以回避常数项是否对收入差距有贡献的争议。另外,对于自变量的线性设定,没有包括平方项,虽然在以往文献中没有提及,但是为了避免模型设定偏误,本文已经对二次项进行了检验,如年龄的平方、教育的平方,在模型中其二次项的系数为0 的假设在10% 的显著性水平未能通过检验,在此不纳入二次项。因为在收入决定方程中选用了半对数模型,在分解时如果仍使用收入的对数作为因变量来分解会造成对收入变量分布的扭曲,所以待分解的收入决定方程需对两边取指数,待分解的方程如下:在上式中exp(是一个常数项,当运用收入差距
17、的相关指标时,它能够从方程中去掉而不会对结果产生任何影响12。对于残差应的影响,采用通用性的方法,对于任何度量不平等的指标都能够使用。残差的作用可以表述为此方程中的变量所不能解释的收入差距部分。本文采用残差的影响与总的收入差距的比率来表示没有被解释的收入差距部分,而1 减去这个比率就是得到解释的收入差距的部分,它反映了模型中全部变量对于收入差距的解释程度14。3 2 收入决定模型的回归结果及解释对回归模型,本文只做了一个模型,即将所有变量纳入回归,对于平均年龄的二次项以及平均教育的二次项,本文检验,年龄平方项和平均教育的平方项系数不为0 的假设在10%的显著性水平下未通过检验。采用的对数线性模
18、型也是基于利用收入对数正态分布的性质,以及以往研究的经验证实。表3 是对1 481 户家计调查数据的样本回归结果,整个收入决定模型在1%显著性水平下通过了检验。从社会网络资本中的变量来看,作为社会网络资本的两个代理变量人情收入和人情支出,其系数均为正,且分别在10%和1%显著性水平下通过检验,社会网络资本对收入具有正相应。作为物质资本的主要变量人均土地面积,系数为正,在1%显著性水平下通过检验。人力资本方面,平均年龄和平均受教育水平的系数为正,在5%和1%显著性水平下通过检验,其对收入具有正效应,但是劳动力人口中受培训比,系数为负,在5%显著性水平下通过检验,其对收入具有负效应。家庭特征中,家
19、庭人口数的系数为负,在1%显著性水平下通过检验,家庭人口对人均收入具有负效应; 男劳动力和非农劳动力比系数为正,分别在1% 和10% 显著性水平下通过检验,对人均收入具有正效应。这里的自变量系数解释为其他自变量保持不变情况下,某自变量增加某一单位,家庭人均收入增加( 相对应系数 100%) 。比如家庭劳动力的平均受教育年限增加一年,家庭人均收入增加4 27%。但是这些比例并不是直观的,因此在回归中,本文同时添加了标准化回归系数beta 的报告,从各自变量对平均收入的影响来,对人居收入增加促进作用从大到小的因素分别为平均教育、男劳动力比、人均土地面积、平均年龄、人情支出、非农劳动力、人情收入,而
20、家庭人口数和受培训比对人均收入增加具有的负效应。教育等人力资本因素在人均收入增加方面的作用十分重要,这与高梦滔和姚洋8、陆铭、陈钊和万广华10的研究是一致的。男劳动力比在人均收入方面的重要影响,说明男性的劳动力收入对于家庭收入的影响非常大,人均土地面积作为物质资本的影响也比较大,说明土地作为农村具名农业经营的资本对增加人均收入具有正效应。人情支出、非农劳动力比和人情收入的影响相对弱一些,但是都对人均收入增加有正效应。回归解释了农村居民人均收入的影响因素,但是,这些因素对收入差距的贡献是需要进一步通过收入不平等的分解来获取的。4 收入不平等及分解结果4 1 收入不平等的衡量指标选择衡量收入不平等
21、的指标有多种,本文在收入差距的分解方面,采用的三个常用的收入差距衡量指标,包括Gini系数、Theil 指数、Atkinson 指数。运用样本数据,测算出样本总体的Gini 系数为0 366 5,Theil 指数为0 226 7,Atkinson 指数为0 201 3。4 2 回归分解的结果我们用残差影响与总收入差距的比率来表示没有被解释的收入差距部分,而“1 减这个比率就表示得到解释的收入差距部分”反映了这个模型起作用的程度。 表2列示了收入差距程度和收入决定函数解释的比例情况。表2 收入差距和被解释比例表3 列示了采用夏普里值进行分解后的结果,每个变量的贡献度为该变量在对应的收入差距度量指
22、标下对于该不平等测量指数的贡献,按照影响所选收入不平等指标的变量贡献度进行了排名。所选取的3 个指标下,各变量的相对贡献度排序是一样的,贡献度水平也相近。由此可见,所选取的变量在收入差距中贡献的相对水平是稳定的。下面,本文就收入差距的分解结果进行分析。表3 收入差距分解结果区域因素是影响农村收入差距最大的因素。在3 个不平等指标中,以县域作为变量的区位因素相对贡献均最大,在38% 43%之间。收入差距来源家庭因素和环境因素两部分,相对而言,后者较难度量,在已有的大多数研究中,这种环境因素是以“地区虚拟变量”作为代理变量的。地区虚拟变量不仅反映了地理上的差异,也捕捉到了由地理位置所带来的政策、市
23、场整合程度等方面的差异9。地区之间尤其在农村地区,地理环境、政策、市场整合等方面是有显著差异的,也由此而导致了“地理因素”对地区间差距的显著作用。非农劳动力对农村居民收入差距具有重要影响。在3 个不平等衡量指标中,相对贡献均在20% 左右。这个结果和水平与谢伏瞻等人的研究结果是一致的,农村产业结构的演变改变了劳动力的配置,非农产业的农户比重的变化使农户家庭收入来源变化,也引起了农户之间的收入差距,但是这个结果是短期而言的,因为,城市化进程为农村人口提供向非农业转移和就业的机会,非农就业在现阶段虽然带来了农村内部收入差距的扩大,但是随着经济会缩小城乡差距和农村居民内部收入差距。培训比对农村居民收
24、入差距的贡献也比较重要。在3 个不平等衡量指标中,相对贡献均在15% 以上。农村劳动力的培训包括提高非农就业能力的技术培训和提高农业生产技能的生产技能培训。培训可以提高农户的非农就业水平或者农业的专业生产能力,从而使农户的生产能力和生产结构上形成差异。高梦滔和姚洋利用广义差分方法去除农户异质性以后,发现教育和在职培训体现出的人力资本是拉大农户收入差距的主要原因之一,但是从样本总体来看,农村劳动力受正式培训的比例是非常低的,平均只有0 078。男劳动力比重对三个不平等系数的相对贡献度都在14%以上。这说明性别在收入回报的差距是明显的。研究结果与赵剑治对中西部不平等指数的分解类似,但是赵剑治研究结
25、果11中变量的贡献度总体为5%左右,但是值得一提的是,在分地区的分解中,中西部地区相比东部地区而言,男劳动力比重对不平等系数的贡献度都高出了2%左右。这表明,男劳动力比重对不平等的贡献,经济不发达地区比经济发达地区更大。家庭平均年龄对三个不平等系数的相对贡献度在3 6% 3 9%之间。平均年龄在一定程度上反映了家庭的结构,年轻或者成熟的家庭倾向有更多的收入,而年龄老化的家庭收入能力则比较低下。但是这个结果和Morduch 和Sicular12、赵剑治11等对年龄的度量结果是不一致的。Morduch 和Sicular 的研究结果中,劳动力平均年龄的相对贡献度只有0 42%12,赵剑治得出的结果是
26、0 2%11。这可能和变量的差异有关,因为Morduch 和Sicular、赵剑治采用的是劳动力的平均年龄,用于度量劳动力经验,而认为岁年龄的增加劳动经验增加的同时也伴随着体能的下降。而本文选取的是家庭人口的平均年龄。另外,可能的解释是,年轻的家庭人口年龄,可能意味着家庭比较年经,他们从事的生产经营活动会与年龄比较大的家庭有所差异,而往往年经的家庭更多从事非农产业,而获得更多的收入。家庭人口对三个不平等系数的相对贡献度在3 4% 3 5%之间。家庭规模与收入差距的关系并不是那么明确的。一方面,家庭规模可能与劳动力人数和家庭总收入有正向关系,但是,对人均收入有反向关系。从本文前面给出的收入决定方
27、程估计中,可以看到家庭人口的系数是为负的,家庭人口对收入的净效益为负。赵剑治的研究结果也有相似之处,他认为家庭大小和人口负担率已经出现了趋同的现象11。而Wan 对截面数据的分析证实,农户间家庭大小和人口负担率的不平等对于收入差距的影响在不断减小4。教育程度上的差异对于收入差距的作用非常小,对三个不平等系数的相对贡献度只有1 3% 左右。在Morduch和Sicular 的研究结果中,对Gini 系数的分解后教育对于中国农村家庭间的收入差距的贡献达到16 9%12,而在赵剑治的研究结果中,教育对Gini 系数、Athinson 指数和GE 系数的相对贡献基本都在18%以上11,田士超和陆铭对上
28、海的收入差距分解中,发现劳动力平均受教育年限对Gini 系数,GE 系数的相对贡献最大,在20% 以上9。而在本样本的分解结果中,教育对收入差距的贡献很小。这可能与西部地区教育水平普遍比较低有关系,在本样本中,样本家庭平均受教育水平的均值为6 55,也就是小学文化程度,标准差为2 61,教育水平普遍比较低,因此,教育在收入差距的贡献上较小。在赵剑治对中西部和东部地区收入差距分解结果11中,虽然中西部地区教育对收入差距的贡献在13% 左右,但是与东部地区的教育对收入差距的相对贡献度为25% 30% 左右相比,也可以看到,这种地区差距的显著性。而西部地区与中西部的平均水平相比,也是相差甚远的。因此
29、,在西部地区,普遍的低水平教育解释了在西部地区,教育对收入差距的贡献并不如全国或者更广范围的研究结果那么大。人情收入和人情支出作为社会网络资本的代理变量,对收入差距的贡献度都非常小,分别为0 011 和0 005左右。在赵剑治的研究结果中,在中西部地区,人情支出比对收入差距的贡献为2 7% ,而且其着重研究了社会网络对收入差距的贡献度,将亲友数和人情支出比作为社会网络的变量,总体贡献度达12 9%11,而本文的人情收支的贡献度则比较小,另外,也是由于无法获得亲友数以及其他可以代替的社会网络资本的变量而采取的变量设定。这也是与社会网络资本难以衡量有一定关系的。对于人均土地面积,分解结果发现其对于
30、Gini 系数、Theil 指数、Atkinson 指数的贡献度都只有0 001%。在赵剑治对Gini 系数、Atkinson 指数和GE 系数的分解中,人均土地面积对不平等的贡献度小于1%,在中西部地区对Atkinson 指数和GE0 的贡献为负11。而高梦滔和姚洋的研究结果表明,物质资本,包括土地,对于农户收入的差距没有显著影响8。本文中,可以得出,土地对于收入差距的贡献并不明显,甚至能够缓解收入差距。这与“非农就业比”很高的贡献度是相一致的。由于家庭非农就业的比例的提高,农业收入的比重降低,而农业收入主要来自土地上的产值,如果人均土地越少的家庭反而更多地外出打工,从而获得更高的人均收入。此外,同一地区的人均土地面积在很大程度上是相一致的。虽然本文采取的是期初和期末家庭实