基尼系数分解的研究统计研究.docx
- 文档编号:27086841
- 上传时间:2023-06-26
- 格式:DOCX
- 页数:11
- 大小:21.13KB
基尼系数分解的研究统计研究.docx
《基尼系数分解的研究统计研究.docx》由会员分享,可在线阅读,更多相关《基尼系数分解的研究统计研究.docx(11页珍藏版)》请在冰豆网上搜索。
基尼系数分解的研究统计研究
资料范本
本资料为word版本,可以直接编辑和打印,感谢您的下载
基尼系数分解的研究——统计研究
地点:
__________________
时间:
__________________
说明:
本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时请详细阅读内容
基尼系数分解的研究
摘要:
对基尼系数的分解可以帮助我们从不同的角度来分析影响总体收入不平等的各类因素及其贡献,为改善收入不平等提供政策建议。
本文在文献梳理的基础上总结了基尼系数的不同分解方法,包括按收入来源分解、按群组分解、按增量分解及Shapley值法等。
在此基础上,我们也探索了一些新的分解方法,并解释了部分分解方法内在的联系以及各自的优缺点。
关键词:
基尼系数分解;收入;群组;增量
中图分类号:
F222文献标识码:
A
一、引言
收入不平等的研究由来已久,在多种衡量收入不平等的指标中,基尼系数是最重要的也是应用最广泛的。
我们不仅可以利用基尼系数测度收入不平等的程度,还可以通过分解基尼系数来分析影响收入不平等的各种因素及其贡献。
例如,按照收入来源分解基尼系数可以帮助我们判断何种收入来源对总体收入不平等的影响最大;而按照城乡两群体分解基尼系数有助于我们研判城镇化发展的一般趋势以及我国目前城乡之间、城镇内部及农村内部的不平等对总体收入不平等的影响,这些研究对于收入分配政策的制定意义重大。
有关基尼系数分解方法的研究最早可以追溯到Bhattacharya和Mahalanobis[1],其后Shorrocks[2]、Lamber和Aronson[3]等不断挖掘分解基尼系数的新方法,在该领域进行了有益的探索和创新并取得了丰硕的成果。
但是,通过对中外文献的梳理和回顾,我们发现基尼系数不同的分解方法散见于各类文献中,缺少对这些方法内在联系的探讨,尚未发现相关文献对此类研究进行系统的梳理和归纳,并且对一些疑难问题(如按群体分解中的交叉项等)的研究还不够深入。
根据我们掌握的材料以及自己的研究,基尼系数的分解不仅可以按不同收入来源分解和按不同群体分解,而且可以既按收入来源又按群体分解,并且还可以对基尼系数的增量进行分解。
另外,除了上述方法,通过引入Shapley值法,可以分析包括不同群体和收入以外其他影响收入不平等的变量。
本文将梳理上述各类分解方法,分析这些方法之间的内在联系以及优缺点,同时我们还将提出自己的一些相关研究成果以达到抛砖引玉的目的。
二、各类基尼系数分解方法
(一)按群体分解
按群体分解基尼系数可分为两群体分解和多群体分解两种方法,采用该方法分解基尼系数相对来说比较困难。
Pyatt[4]运用博弈论对基尼系数按不同的收入阶层进行了划分。
其后Mookherjee和Shorrocks[5]、Lambert和Aronson[3]等也都尝试了各种新的方法。
1.按两群体分解及交叉项的数值特征
按两群体分解基尼系数的方法大多是基于矩阵和协方差,推导过程相对较复杂,这里我们提出了一种相对简单的分解方法。
假设将总体的个单位分为两个群体,、、分别代表第一个群体的收入比重、人口比重以及第一个群体内部的基尼系数;相应的,、、分别代表第二个群体的收入比重、人口比重以及第二个群体内部的基尼系数;代表两个群体之间的基尼系数(下同)。
同时,假定两个群体居民收入之间不存在交叠部分。
则总体基尼系数可以分解为:
(1)
其中,,
具体推导如下:
假设第一个群体内有个单位(),第二个群体内有个单位()。
令:
,,,
显然:
,
那么,总体基尼系数可以表示为:
进一步可以得到:
(2)
两个群体之间的基尼系数为:
(3)第一个群体内部的基尼系数为:
因此有:
(4)
同理有:
(5)
根据式
(2)、(3)、(4)和(5),我们可以得到:
((6),同式
(1))
当两个群体居民的收入存在交叠部分时,例如部分高收入群体中居民的平均收入比部分低收入群体中居民的平均收入低时,式(6)就变为式(7):
(7)
式(7)中>0,很多国内外文献所引用的按两群体分解基尼系数的表达式为:
(8)
式(8)中,、和分别是第一个群体居民、第二个群体居民及全体居民的平均收入(下同)。
其实就是两群体之间居民收入的基尼系数。
我们可以将总收入表示为:
,那么这两个群体的收入比重分别为:
。
假设第一个群体居民的平均收入高于第二个群体,根据式(3)得到:
(9)
在不同的社会中,由于和的大小不同,通常取两者差值的绝对值。
显然,
虽然式(7)与式(8)的表达形式不同,但二者经过转换后完全相同。
而式(7)更能直观地显示出两个群体内部的基尼系数及群体间基尼系数对总体基尼系数的贡献率。
很多学者在按两群体分解基尼系数时往往会忽略交叉项,导致最终的计算结果偏低,因此我们有必要对的数值特征进行分析,以便更准确地计算总体基尼系数。
早期对于的影响及其数值特征的研究并不多,它通常被称为残差项或收入交叉项。
的数学表达式最早由Lambert和Decoster[7]给出:
(10)这里,和分别表示第一个群体居民和第二个群体居民的收入分布函数。
在已知两个群体居民收入分布函数的条件下,就可以计算出。
图1两群体人口比重的变化对的影响
图2两群体收入之比的变化对的影响
根据我们的研究,占全体居民收入基尼系数的比重随着第一个群体人口比重的上升呈现先上升后下降的趋势(图
(1))。
同样,当两个群体居民平均收入之比从0.1:
1变为4.3:
1时,的变化仍是先上升后下降(图
(2)),只是形态有所不同。
当两个群体居民平均收入之比为1:
1时,达到最大值,几乎占到全体居民收入基尼系数的一半,而当两群体居民平均收入之比越来越大时,占全体居民收入基尼系数的比重越来越低。
如果两群体人口相等,两群体居民的收入分布即和相同,那么占全体居民收入基尼系数的50%。
如果总体基尼系数按城乡居民来分解,在城镇居民与农村居民收入服从某种统计分布的情况下,城镇居民和农村居民收入发生交叉的程度与城乡居民收入之比以及城乡人口的比重密切相关。
Milanovic[8]的测算结果表明1993年全球的基尼系数为0.578,其中为0.068。
2.按多群体分解及分组数对基尼系数测算的影响
上面我们介绍了按两群体分解基尼系数的方法,但是在实际的研究中,往往需要将总体分为多个群体进行分析,例如按照东、中、西部或不同省份来分解基尼系数。
因此,我们有必要介绍按照多群体分解基尼系数的方法。
假设总体分为个群体(),表示第个群体内部的基尼系数,表示不同群体之间的基尼系数;第个群体的收入占总收入的比重为,第个群体的人口占全体人口的比重为(下同)。
则总体基尼系数可以分解为(Mookherjee和Shorrocks[5]):
(11)
其中,为调整项,只有两个群体时,它就是。
它的大小取决于各个分组之间收入分布的重叠程度,只有当各分组之间的收入分布完全不重叠时,该项才会等于零。
基尼系数测算的准确性在很大程度上受限于分组数的多少,由于忽略了组内的基尼系数,分组数越少,测算的误差就越大,总体基尼系数被低估的程度就越高。
目前按群体分解法测算我国居民总体基尼系数的最大问题就是缺乏原始的住户调查数据,统计年鉴仅公布了有限的分组数,导致计算的结果存在偏差。
这里我们将根据式(11)研究分组数对基尼系数测算准确程度的影响。
当所有居民的收入按照从低到高排序分组(个组)时,就等于零,那么全体居民收入的基尼系数为:
(12)
如果所有居民的收入按从低到高排序,并且按人口平均分成两组,组间居民收入的基尼系数为:
(13)
如果按人口平均分成四组,组间居民收入的基尼系数为:
(14)
如果按人口平均分成八组,组间居民收入的基尼系数为:
(15)
如果按人口平均分成(为正整数)组,组间居民收入的基尼系数为:
(16)
不难证明,、、
因此有:
(17)
式(17)表明如果按人口平均分组,当分组数增加1倍时,相应的全体居民基尼系数的增加数至少以2的负1次方衰减,即随分组数的增加全体居民基尼系数也会增加,但是增幅呈收敛态势。
如果我们设定可接受的测算误差,就可以确定分组数的下限。
例如:
样本为16等分组,基尼系数的计算误差一定小于1/24;32等分组,计算误差一定小于1/25;64等分组,计算误差一定小于1/26;128等分组,计算误差一定小于1/27。
这些误差结果都是理论上的极限值,实际的误差会大大小于这些误差的上限。
利用安徽省和四川省住户调查数据,我们发现如果分组数达到20组或以上,则最终的误差小于1%。
3.其他多群体分解法
无论是两群体分解还是多群体分解,都会由于不同群体居民收入的重叠而产生交叉项,使得最终计算结果出现偏误。
鉴于此,很多学者提出了新的分解方法来解决由于交叉项的存在而导致的基尼系数被低估的问题。
程永宏[9]针对现有分解方法的缺陷推导出了一个新的基尼系数分解公式,他假设将总体个单位分为个群体(),总体基尼系数可以分解为:
(18)
其中,()表示第()个群体的单位数;表示第个群体与第个群体的单位数之和占全体单位数的比重;表示第个群体与第个群体的收入之和占总收入的比重;、、分别表示第个群体、第个群体及全体居民的总收入。
程永宏将定义为群间相对不平等指标,它的计算公式为:
(19)
式(19)中,表示第个群体和第个群体合并后的平均收入。
第个群体的最高收入为,最低收入为0;、分别表示第个群体和第个群体的收入分布函数;为第个群体和第个群体的群间绝对不平等指标。
上述分解方法能够克服由于群体间收入重叠所带来的基尼系数被低估的问题,但是该方法需要拟合不同群体居民的收入分布函数,在数据不足的情况下其计算结果就可能存在偏误。
例如在计算我国城乡之间收入的基尼系数时,由于统计年鉴中农村和城镇样本分组太少,为数有限的分组很难保证农村和城镇居民收入分布函数拟合的可靠程度。
根据上述方法,1990年城乡之间不平等对全国不平等的贡献率仅为22.24%,该结果与目前相关研究的发现出入较大。
洪兴建[12]也对此方法提出了质疑,他认为在该分解方法中,总体不平等和群内不平等造成的福利损失都用基尼系数来测度,而群间不平等造成的福利损失却用一个新的指标测度,在目前没有证据表明和具有相同社会福利函数的情况下,将两者测度的福利损失直接相加是不妥的,而且相加后不应等于基尼系数测度的总体福利损失。
基于此,他提出了避免群体间居民收入重叠问题的新分解方法。
假设第()()个单位的收入为(),为第个群体的平均收入,则总体基尼系数可分解为:
(20)
在式(20)中,表示第个群体同第个群体相比而言的相对不平等,。
总体的收入不平等被分解成各个群体内部的不平等和每个子群与其他子群相比的群间不平等两部分。
对比式(11),其实该分解方法中的第二部分包含了群体间的不平等以及交叉项两部分,因此,该方法不能单独反映出群体间不平等这一重要因素在总体收入不平等中的贡献,最好能够结合式(11)共同使用。
(二)按收入来源和群体分解
1.按收入来源分解
居民的收入来源多样,例如按《中国统计年鉴》的分类,居民收入包括工资性收入、经营净收入、财产性收入、转移性收入等,各种收入在不同阶层居民中所占的比重不同。
对基尼系数按照收入来源进行分解,有助于我们分析这些收入来源对总体收入不平等所起的作用以及各自的贡献率。
假设总体有()个单位且拥有()项收入来源(下同),那么第个单位的第项收入为,总体基尼系数可以分解为:
(21)
在式(21)中,为第种收入的集中系数,由于它在计算时是按照总收入的从低到高排序,而不是按照该种收入来源自身的排序,因此也称为伪基尼系数(Pseudo-GiniCoefficient)。
当时,表明第种收入来源的不平等会扩大总体的收入不平等程度;反之,当时,表明第种收入来源的不平等会缩小总体的收入不平等程度。
相应的,我们可以将式(21)以每种收入的实际基尼系数来表达。
将第种收入按照其本身顺序从低到高进行排序,那么的实际排序为,则总体基尼系数可转化为:
(22)
其中,称为第种收入与总收入的基尼相关系数(GiniCorrelationCoefficient)。
上述方法虽然可以帮助我们分析不同性质收入对总体收入不平等的影响,但该方法要求所用数据为个体微观数据,而《中国统计年鉴》中提供的收入数据大多为组群内的收入数据。
为了解决这个问题,戴平生[13]等探索了一种新的组数据中基尼系数按收入来源分解的方法。
假设总体个单位()可以分为个组,共有项收入来源。
令表示总收入按从低到高排序后第个群体的累积人口份额。
则基尼系数按收入来源分解的计算公式为:
(23)
其中,表示第个群体的第种收入占总收入的比重;和分别代表按照总量排序和按照分量排序时的权数,。
2.按收入来源和群体分解
Mussard[14]在总结各类分解公式的基础上,将基尼系数分解的收入来源分解法和群组分解法结合起来进行了多重分解,从而可以观察这两种因素对总体收入不平等的影响。
令表示第个群体中第个单位的第种收入,同理,表示第个群体中第个单位的第种收入,表示第个群体中第个单位的第种收入。
那么,基尼系数同时按收入来源和群组分解的表达式为:
(24)
其中,是人群分组内部对收入差异的贡献;是人群分组间际差异对总的收入差异的贡献;为第种收入来源对第个群体收入差异的贡献;为第个群体与第个群体之间的基尼系数;为第种收入来源在第个群体与第个群体之间差异的权重;是两者之间的超变密度(TensityofTransvariation)。
(三)增量分解法
上述的分解方法都是基于同一时点的不同收入或群组对总体基尼系数进行分解,这些分解方法无法反映出收入不平等在不同年份的变化情况,而对不同年份的基尼系数变化值进行分解可以帮助我们进一步分析引起收入差距变化的原因。
这里我们提供一种两群体之间基尼系数增量分解的方法:
(25)其中,,分别表示两个群体居民的总收入;表示两个群体居民人均收入的比值。
假设上升为,第一个群体的人口比重由上升到,相应的两群体间基尼系数由变为了,那么两群体间基尼系数的变化值可以分解为:
(26)
式(26)表明两群体间基尼系数的变化值可以分为三个部分:
(1)表示两群体人均收入比变化(从到)对两群体间基尼系数的贡献。
(2)表示第一个群体人口变化(从到)对两群体间基尼系数的贡献。
(3)表示第一个群体人口的变化和两群体人均收入比变化的交集对两群体间基尼系数的贡献,该数值通常较小。
式(26)中的增量分解法只适用于按两群体分解基尼系数的特殊情况,对于更为一般的多群体分解,洪兴建[13]在前人研究的基础上提出了新的分解方法。
分别以、、表示收入水平向量、位次向量和人口份额向量,则S基尼系数可以记为。
相应的,、、分别表示第期的收入水平向量、位次向量和人口份额向量。
表示基期,表示报告期。
令(为大于1的参数)表示第个群体的相对收入权数,它取决于相对应的排序和人口份额,因此可以记为。
那么基尼系数的变化值可以分解为:
(27)
式(27)也将基尼系数的变动分为了三个部分:
(1)表示当收入位次和人口保持不变时,收入水平变动对基尼系数增量的贡献。
(2)表示由收入增长导致的收入次位的变动对基尼系数增量的贡献。
(3)表示当收入水平和收入位次保持不变时,群体人口比重变动对基尼系数增量的贡献。
可以看出,按照式(27)分解,来源于收入和人口两个因素。
我们采用式(27)分别探讨了人口及收入变动对的影响,结果显示收入变动的贡献与采用式(26)计算的一致,但是群体人口比重变动对基尼系数增量的贡献包含了式(26)中的后两项:
虽然一项数值较小,但是不能全部归为人口变动的影响。
另外,我们认为和应该都纳入收入变动的影响,因为收入位次变动的根本原因是收入变化导致的。
除此之外,还有学者从不同收入来源的角度对总体基尼系数进行了动态分解。
其公式为:
(28)
其中,,分别表示第项收入占报告期和基期总收入的比重和集中度(伪基尼系数)的变化额。
总收入基尼系数的变化可以分解成三部分:
一是由各项收入结构变化引起的结构效应;二是由各项收入集中度变化引起的集中效应;三是由两者共同变化引起的综合效应。
(四)Shapley值法
上述三种分解方法都只涉及到收入和人口变量,可以直接写出基尼系数对收入或群组的分解公式,但是在现实生活中,影响收入不平等的因素还有很多,例如教育、环境、基础设施等,由于这些因素无法量化,导致其对收入不平等的影响不能直接通过公式得以表达。
为了解决这个问题,Chantreuil和Trannoy[15]将原本用于解决多人合作对策问题的一种数学方法─Shapley值法引入了收入差异的收入构成分解。
Shorrocks[2]认为该分解符合自然分解的原理,可以不用考虑模型的复杂性、要素的数量和类型等问题而应用到所有形式有关收入分配的分析,为分解收入不平等提供了一个标准框架。
在此基础上,Shorrocks拓展了Shapley值,使得收入差异不仅可以从收入来源进行分析,还可以从群体角度来分析。
Wan[16]进一步把Shapley值与传统的回归模型结合,将指标变量和其他决定因素(如人力资本、家庭特征等)联系起来。
Wan认为该方法的优点在于它对回归模型没有约束,可以控制各种变量,其计算结果也更加准确,适用于各类衡量收入不平等的指标。
三、结束语
对总体基尼系数进行分解可以帮助我们研究不同收入来源、不同群组对总体收入不平等的影响。
本文通过文献回顾梳理了四种基本的基尼系数分解方法并分析了各种分解方法的内在联系。
同时,我们还提出了自己的一些修改研究以达到抛砖引玉的目的。
对基尼系数分解方法的探讨有利于探索我国居民的收入不平等。
例如,我们可以利用群体分解法测算我国城乡之间、区域之间、产业之间及行业之间基尼系数的大小,明确三大产业及不同行业特别是一些垄断行业对我国总体收入不平等的作用;利用增量分解法,我们可以研判城镇化发展的一般趋势及城乡人口和收入变动对城乡之间基尼系数的影响,为加快新型城镇化进程奠定理论基础。
收入不平等是目前全社会关注的热点问题,基尼系数分解方法的研究还将有助于我们了解导致我国收入不平等的关键因素,为今后收入分配政策的制定提供科学的依据。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系数 分解 研究 统计