325安徽农民工外出就业地选择行为及其影响因素.docx
- 文档编号:30691932
- 上传时间:2023-08-19
- 格式:DOCX
- 页数:15
- 大小:137.62KB
325安徽农民工外出就业地选择行为及其影响因素.docx
《325安徽农民工外出就业地选择行为及其影响因素.docx》由会员分享,可在线阅读,更多相关《325安徽农民工外出就业地选择行为及其影响因素.docx(15页珍藏版)》请在冰豆网上搜索。
325安徽农民工外出就业地选择行为及其影响因素
安徽农民工外出就业地选择行为及其影响因素
国家统计局安徽调查总队张尚豪、王淳勇、汪有华
摘要:
农村劳动力转移是我国推进工业化、城镇化战略必须面对的重大课题,也是逐步消除城乡二元体制结构的必由之路。
近年来,农民工外出务工已经成为农村劳动力转移的主要形式和根本动力。
本文利用安徽农民工监测调查基础数据,运用回归分析和数据挖掘技术进行统计建模,从微观视角分析和识别农民工就业地选择行为,研究了农民工家庭结构、年龄、受教育程度、外出从业期间的收入支出状况、技能培训、外出方式、从事行业、工作福利、劳动强度以及外出从业经验和稳定性等诸多因素对农民工外出就业地选择的影响。
研究发现,农民工就业地的消费水平、从事的行业、收入、家庭负担、外出就业的方式和经历、年龄、是否提供住宿的便利条件等等因素对农民工就业地选择的影响是非常大的。
在当前户籍制度改革背景下,本文的研究结论,对制定和完善人口迁移相关政策,合理引导人口流动,有序推进农业转移人口市民化,具有一定的现实意义。
关键词:
农民工就业选择多分类Logit回归关联分析
1引言
1.1研究背景
城镇化、工业化进程必然伴随着人口由乡村向城镇的集中。
改革开放以来,数以亿计的农民工由乡村到城镇、由农业到非农产业,实现了空间的转移、就业的转换;释放出巨大的“人口红利”,成为推动中国经济增长的重要动力。
农民工大规模大范围“候鸟式”迁徙流动,成为中国经济社会大转型的重要标志性特征之一。
根据国家统计局抽样调查结果,2013年全国农民工总量26894万人,其中,外出农民工16610万人;在外出农民工中,7739万人跨省流动,8871万人省内流动,分别占外出农民工的46.6%和53.4%。
东部地区外出农民工以省内流动为主,中西部地区外出农民工以跨省流动为主。
2013年安徽外出农民工总量为1287.5万人,其中到省外务工农民工942.5万人,占全省外出农民工总量的73.2%。
安徽出省农民工的80%集中流向长三角地区。
农民工跨区域、大规模流动,使农村“三留守”等一系列社会矛盾凸显。
当前,农村劳动力转移已经出现新的趋势性特征,一是农民工就业的稳定性不断增强,农民工在就业地点和行业的选择上更加理性,二是农民工代际轮换特征明显,新生代农民工已经成为外出农民工的主体。
但由于城乡二元体制、区域政策分割以及其他因素的制约,大量农民工无法真正实现“农民”向“市民”的身份转变,市民化进程严重滞后,加大了农民工社会保障、培训管理等工作的难度,阻碍了新生代农民工群体“人口红利”向高技能“人才红利”的升级,已经成为中国经济转型发展的重要体制负担。
历史经验表明,就业是人口流动和迁徙的根本动力。
农民工流动的群体特征,都是在数以亿计的农民工个体就业地选择行为的聚集和扩散的结果,因此,农民工外出就业地选择行为背后,一定存在可以解释的行为特征和经济社会逻辑。
分析和识别农民工外出就业地选择的行为特征和影响因素,对于把握农民工迁徙行为的内在逻辑,进而为合理引导人口流动,有序推进农业转移人口市民化,推进新型城镇化健康发展,提供有益借鉴。
1.2文献综述
近年来,诸多学者在农民工就业问题研究中,提供了许多扎实而又颇具价值的研究成果。
目前国内在这方面的研究主要集中在就业动机和就业影响因素(杨竹、陈鹏,2009;程名望等,2006;王春超,2011)等方面。
从研究方法看,既有纯理论的研究(林竹等,2011),也有基于问卷调查的计量模型研究(白南生、李靖,2008)。
从研究的侧重点来看,现有研究成果对农民工就业-收入问题的关注度很高,对农民工就业的流向问题关注程度较少。
相对于农民工个人的就业决策行为,农民工外出就业地选择显然具有一种“集体行动的逻辑”。
农民工群体的就业地选择行为不仅仅对农民工个人和家庭产生影响,对于区域经济社会的协调发展,尤其是农民工输入地与输入地的影响也不容忽视。
相比以往对农民工流动积极方面的较多关注,农民工大规模跨区域流动的宏观效应,尤其是对中西部地区的不利影响,已开始引起理论和实践上的较多反思。
有学者认为农民工大规模外出务工尽管带来了可观的劳务收入,但也导致农民工输出地区实际经济增长率低于其潜在经济增长率,间接证明了农民工大规模出省务工对于农民工流出地区的经济增长具有一定抑制作用。
因此,在参考已有研究成果的基础上,本文从微观层面出发,对目前仍未引起较高关注的农民工就业地选择的“集体行动的逻辑”进行研究,利用国家调查系统严谨而详实的农民工监测调查数据,从农民工家庭结构、年龄、受教育程度、外出从业期间的收入支出状况、技能培训、外出方式、从事行业、工作福利、劳动强度以及外出从业经验和稳定性等诸多因素,对农民工群体就业地选择行为进行刻画,分析影响农民工群体就业地选择的关键因素,解读这种群体选择的宏观意义,并提出相应的政策建议。
2数据来源、样本特征与研究设计
2.1数据来源
本文使用的数据全部来自国家统计局制定,国家统计局安徽调查总队在全省31个县(市、区)组织开展的农民工监测调查。
农民工监测调查是国家专项统计调查项目,采取以省为总体,分层、多阶段PPS抽样随机抽选调查样本户,由调查员定期(季度、年度)跟踪收集农民工数量、流向、结构、就业、收支、生活、社会保障及创业等相关信息,为开展农民工问题的针对性研究提供了高质量的数据基础。
尽管研究数据集只是安徽省的调查数据,但调查的人次、户数已经远超一般性的学术论文,数据的全面性、可靠性也较强。
尽管在某些特征上难以称得上大数据,但这一数据集于大数据4V特征的某些方面是类似的。
在当前难以取得更大规模、更多变量的农民工调查数据的前提下,本文基于常规统计调查基础数据进行数据挖掘的研究方法,不失为是常规统计调查数据利用方式的补充和有益尝试。
2.2数据预处理
本文研究数据集为2013年安徽省农民工监测调查年报数据,原调查问卷共包括7个表,125项指标,涉及农村家庭4497户,15413人(包括新老调查户在内),其中外出务工者3354人(1人外出地区为国外,研究中剔除)。
由于问卷设计的全面性和农民工个体的情况差异,原始数据集的价值密度不高,为了确保数据的完整性、一致性,本文花费了大量时间用于数据清洗、加工和准备。
经过对原始数据集的筛选、提取、加工、计算,在确保尽可能多的保留有用信息的前提下,得到一个包含19个变量,3353条记录的安徽农民工外出就业情况的数据集。
本文以农民工外出就业地为因变量,将外出地分为三种情况:
乡外县内,县外省内和省外。
自变量则包括了农民工家庭结构、年龄、受教育程度、收入支出状况、技能培训、外出方式、从事行业、工作福利、劳动强度以及外出从业经验和稳定性等方面的因素。
为了便于研究,在对数据进行探索性分析的同时,对原始数据进行了相应的分析粒度(granularity)转换。
变量的选取及其含义见表1。
表1农民工就业地选择行为及影响因素一览表
变量名
变量标签
变量值说明
wp
外出就业地
1=县外乡内,2=县外省内,3=省外
fs
家庭规模
实际调查出的家庭总人口
fr
抚养系数
根据计算的抚养系数分5组:
1=0,2=(0,0.5],3=(0.5,1],4=(1,2],5=2+
um
家庭不健康成员数
根据原始数据集计算得出。
age
年龄
分八组,1=16-19,2=20-24,3=25-29,4=30-34,5=35-39,6=40-44,7=45-49,8=50+
sex
性别
1=男,2=女
hea
健康状况
1=健康,2=基本健康,3=不健康但生活能自理
edu
受教育程度
1=未上过学,2=小学,3=初中,4=高中,5=大学专科,6=大学本科,7=研究生
mar
婚姻状况
1=未婚,2=有配偶,3=离婚,4=丧偶,5=其他
inc
外出就业月收入
根据原始调查数据计算的实际月工资。
1=1000元及以下,2=(1000,1500],3=(1500,2000],4=(2000,2500],5=(2500,3000],6=(3000,3500],7=(3500,4000],8=(4000,4500],9=(4500,5000],10=5000+
exp
外出就业月消费支出
根据原始调查数据计算的实际月生活消费支出,用来度量在务工地的消费支出负担。
1=500元及以下,2=(500,1000],3=(1000,1500],4=(1500,2000],5=(2000,2500],6=2500+。
out
外出就业年限
1=无外出从业经验;2=2年以内经验,3=5年以下(不含5年),4=满5年不满10年,5=满10年不满15年,6=满15年不满20年,7=超过20年
tra
是否接受过非农技能培训
1=是,2=否
way
外出方式
1=政府(单位)组织,2=中介组织介绍,3=亲朋好友介绍,4=自发,5=其他
ind
外出就业行业
1=制造业,2=建筑业,3=居民服务、修理和其他服务业,4=批发和零售业,5=住宿和餐饮业,6=交通运输、仓储和邮政业,7=其他行业
wi
劳动强度(月工时数)
根据原数据集计算得出后,分7组。
food
提供免费伙食或补贴
1=提供,2=部分提供,3=不提供
lod
是否提供免费住宿
1=提供,2=部分提供,3=不提供
job
更换工作次数
注:
抚养系数=家庭被抚养人口(0-14岁和65岁以上人口)与15-64岁人口的比例。
为了提高变量选取的效果,有必要对变量进行探索性数据分析。
首先对农民工外出就业地与各影响因素,进行概览分析。
用R软件批量绘制各变量的取值分布图,并标识出取值最多的选项所占比例。
图1农民工外出就业地及影响因素变量特征图
从上图可以看出各变量数据的大致分布情况,可以发现部分变量的取值偏度很大,可以考虑在建立模型中将这些区分度不高的变量剔除。
同时为进一步定性分析各影响因素对农民工就业地选择的影响,对变量做进一步的交叉列联表和分组分析(见表2)。
从对数据的定性分析中,大致可以得出如下结论:
一是在省外就业的农民工家庭规模更大,抚养系数也明显高于在省内就业的农民工,平均的家庭不健康成员数也高与另外两组,这意味着该组农民工家庭负担较为沉重。
二是农民工就业地选择与年龄的相关度很高,年龄越小的农民工的就业地距离越远,越倾向于在省外就业。
表2不同就业地点选择影响因素的数据探索性分析
外出地
外出地点=1
外出地点=2
外出地点=3
全部
均值
标准差
均值
标准差
均值
标准差
均值
标准差
fs
4.19
.053
4.39
.056
4.81
.029
4.63
.023
fr
1.97
.040
1.98
.044
2.23
.021
2.14
.017
um
.10
.014
.11
.016
.12
.008
.12
.006
age
4.95
.086
4.45
.095
4.05
.042
4.28
.036
sex
1.36
.019
1.33
.021
1.34
.010
1.34
.008
hea
1.04
.010
1.04
.009
1.02
.003
1.02
.003
edu
3.11
.033
3.21
.040
3.02
.015
3.07
.013
mar
1.85
.019
1.74
.023
1.75
.011
1.77
.009
inc
4.40
.084
4.85
.091
5.31
.038
5.07
.033
exp
1.82
.037
2.34
.045
2.42
.021
2.29
.018
out
3.27
.065
3.19
.074
3.36
.031
3.32
.026
tra
1.74
.018
1.73
.020
1.72
.010
1.72
.008
way
3.66
.031
3.57
.034
3.46
.013
3.52
.012
ind
3.20
.080
3.42
.092
2.78
.042
2.96
.035
wi
3.41
.048
3.61
.050
3.84
.025
3.72
.021
food
2.50
.028
2.39
.031
2.39
.015
2.41
.012
lod
2.52
.033
2.27
.041
2.18
.020
2.25
.016
job
.16
.021
.13
.019
.20
.014
.18
.011
分组
人数
617
18.40%
520
15.50%
2216
66.10%
3353
100%
三是在务工地的选择上,男性比女性的迁徙距离更远,更倾向于在省外或县外省内就业。
被调查农民工中共有男性2197人,女性1156人;务工地=1、2、3的男性分别占18.0%、15.7%和66.2%,务工地=1、2、3的女性分别占19.1%、15.1%和65.8%(见图2)。
四是省外就业的农民工健康程度更高,但劳动强度(或者工作满勤率)更高。
五是具有小学和初中教育程度的农民工更倾向于到省外务工。
到省外务工的农民工中具有初中教育程度的占71.7%,而务工地=1、2两组的农民工中具有初中教育程度的分别为66.1%和61.3%。
五是未婚农民工更倾向于到省外务工。
69.8%的未婚农民工选择到省外就业,这一比例比有配偶农民工高了5个百分点。
六是到省外就业的农民工工资水平和消费水平均明显高于另外两组。
七是务工地选择行为也随着年龄变化而有所差异。
初次外出的农民工一般先选择省内就业,具有一定工作经验后更倾向于到距离更远的地方就业,但随着就业年限延长,农民工又倾向于返乡,这反映了农民工务工行为的代际轮换特征。
八是非农就业培训也是影响农民工外出就业地选择的一个影响因素,但由于培训的覆盖面不高,其影响程度有限。
只有28.3%的到省外就业的农民工接受过非农技能培训。
九是从就业方式来看,到省外务工首要依靠亲朋好友介绍(占53.1%),其次靠自发(40.5%);而务工地=1、2两组的农民工首要就业方式则为自发(分别为54.3%和46.9%)。
这反映出关系网络对于农民工就业的重要影响。
图2不同年龄和性别农民工务工地选择的差异
十是不同就业地的农民工就业行业存在明显差异。
就业地=3的农民工前三位就业行业排序为制造业(35.6%)、建筑业(24.1%)、批发零售业(9.8%);就业地=2的农民工前三位就业行业排序为建筑业(31.7%)、制造业(18.1%)、其他行业(16.0);就业地=2的农民工前三位就业行业排序为建筑业(32.4%)、制造业(19.6%)、其他行业(11.8)。
十一在省外就业的农民工享受雇主在餐饮和住宿方面的福利要好于其他两组,显然工作福利水平也是影响农民工就业地选择的一个重要的影响因素。
3模型的建立
3.1关联规则模型
实际中我们经常会碰到较多的变量之间的关系辨识问题,与传统的列联表方法相比,数据挖掘中的关联规则算法的效果更优。
如何从为数众多的变量中快捷地选出关联性最强的两组或更多组变量是关联规则算法的核心。
由于本文运用的数据集中外出就业地=3的比重较大,同时也是我们重点关注的一类群体,因此运用Apriori算法,利用R软件建立关联规则模型,以期能够识别这一类群体的就业特征。
Apriori算法的结构形式是“lhs=>rhs,表示由lhs可以推断出rhs,其中lhs可以是一个条件,也可以是多个条件。
一般来说,对通过分析得到的规则的度量主要是三个指标:
支持度、可信度、提升度。
支持度是指同时满足lhs和rhs的人占总案例个数的比例,置信度表示同时满足条件lhs和rhs的案例个数占满足条件rhs的案例个数的比例。
可以用下列式子表示:
提升度(lift)是衡量使用这条规则能不能给推算带来提升。
可以用下面式子表示:
基于这一算法,本文编写了R语言代码先获得一个关联规则,并对关联规则进行可视化。
但建模过程中发现有些规则是冗余的,需要增加一个去除冗余的函数。
图3展示了得到了6条规则。
通过观察这6条规则,会发现一些有用的结论。
比如外出就业地区=3的人一般都是4口之家,人均月支出额都在500元-1000元之间,教育程度为初中,外出方式基本上是亲朋好友介绍,且外出就业时间不长。
3.2随机森林模型
为了进一步提升对农民工外出就业地选择问题的认识,本文在关联规则建模的同时,用随机森林算法进行建模,以便于对结论进行验证。
通过先建立模型,再依次增加节点所选变量个数,对模型进行优化,最后得出一个节点所选变量=5的随机森林模型。
通过模型可以得出,模型总的预测误差为27.53%。
结果也展示最终模型的预测结果同训练集实际结果之间的差别情况。
从中可以看出,最终模型对外出地区=3的类别预测结果要远好于外出地区=1、2的两个类别。
一个可能的原因在于,由于省内区域发展水平的差异性相对较小,加上交通条件相对便利,外出地区=1和=2两类农民工的务工地选择行为差异并不是很大造成的。
表3随机森林模型预测结果
1
2
3
class.error
1
249
15
353
0.596434
2
75
65
380
0.875
3
74
26
2116
0.045126
图3对于规则的可视化
图4所展示的内容说明了该数据集的三个类别,三个类别均出现交叉,并且在部分区域,三个类别的交叉情况还较为严重,这同时也解释了模型预测精度较低的原因。
图4随机森林模型的可视化
但随机森林模型本身还是能说明一些问题。
通过模型我们可以计算出各自变量对于模型判别效果的重要程度。
见下表。
变量
MeanDecreaseAccurary
MeanDecreaseGini
值
排序
值
排序
exp
57.97
1
138.92
5
ind
39.86
2
158.54
4
inc
36.52
3
199.13
1
fs
31.96
4
133.88
7
way
31.16
5
90.02
8
out
26.62
6
161.87
3
age
23.88
7
163.03
2
lod
23.76
8
65.36
12
wi
22.67
9
136.52
6
food
21.65
10
71.77
11
fr
21.22
11
88.64
9
edu
21.08
12
85.41
10
mar
12.3
13
35.91
15
job
9.45
14
37.41
13
um
8.99
15
26.17
17
tra
8.53
16
36.58
14
hea
5.51
17
9.45
18
sex
-6.01
18
32.37
16
4研究结论与不足
从上面的模型可以看出,当地的消费水平、从事的行业、收入、家庭负担、外出就业的方式和经历、年龄、是否提供住宿的便利条件等等因素对农民工就业地选择的影响是非常大的。
其余的变量的影响并不是很大。
尤其需要关注的是农民工健康状况、性别、是否接受培训、家庭的不健康成员数、工作的稳定性、婚姻状况、教育水平等几个指标的影响偏小的原因。
深入分析后发现,这些影响较小的指标可分成两种类型,一类如健康状况、工作稳定性、家庭不健康成员数,其样本的分布是高度有偏的,大多数农民工这几项指标没有太大分别;另一类如性别、教育水平等,说明不同类别之间的差异并不明显。
并不是说这两类变量对农民工就业地选择的影响比较小,这也是模型局限性的表现之一。
例如,身体不健康的农民一般不会是外出农民工,所以也无法进入这个数据集。
因此,建模只是一种工具,更重要的是如何利用模型对经济社会现象做出科学的解读。
鉴于农民工到省外就业群体的独特性,应该进一步把外出地区=1、2两个类型的样本进行合并,并适当剔除一些类别间差异不大的变量,再行建模,将有助于提升模型的质量。
5政策建议
本文的研究结论对做好农民工市民化工作,尤其是对中西部地区吸引农民工回流具有一定的政策借鉴意义。
5.1做好社会保障体系改革工作。
不断完善农民工社会保障政策支持力度,尽可能将农民工社会保障逐步纳入当地城镇社会保障体系,切实减轻农民工生活压力和负担。
5.2拓宽当地农民工收入来源,增加就业岗位。
中西部地区要继续保持经济较快发展的态势,特别是注重发展制造业和服务业,创造出更多的适合农民工在当地转移就业的岗位,增加农民工收入,增强这一群体融入城市的能力。
5.3出台农民工住房补贴政策。
为符合一定条件的农民工,特别是新生代农民工提供各种形式的房租补贴、廉租房供给或购房优惠政策,加速农民工市民化进程。
5.4加快城乡统一的劳动力资源市场体系建设。
打破劳动力资源市场分割、信息封锁,为农民工就业提供充分而及时的就业信息。
参考文献:
1.杨竹、陈鹏:
转型期农民工外出就业动机及代际差异.农村经济,2009.09
2.程名望、史清华、徐剑侠:
中国农村劳动力转移动因与障碍的一种解释.经济研究,2002.04
3.王春超:
收入差异、流动性与地区就业集聚.中国农村观察,2005.01
4.杨肖丽、景再方:
农民工职业类型与迁移距离的关系研究.农业技术经济.2010.11
5.王春超:
农民工流动就业决策行为的影响因素.华中师范大学学报(人文社会科学版),2011.03
6.白南生、李靖:
农民工就业流动性研究.管理世界,2008.07
7.常伟:
农民工大规模外出的经济增长效应研究.中国人口.资源与环境,2013.10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 325 安徽农民工外出就业地选择行为及其影响因素 安徽 农民工 外出 就业 选择 行为 及其 影响 因素