基于多元线性回归的薪酬合理性分析.docx
- 文档编号:20149483
- 上传时间:2023-04-25
- 格式:DOCX
- 页数:24
- 大小:282.16KB
基于多元线性回归的薪酬合理性分析.docx
《基于多元线性回归的薪酬合理性分析.docx》由会员分享,可在线阅读,更多相关《基于多元线性回归的薪酬合理性分析.docx(24页珍藏版)》请在冰豆网上搜索。
基于多元线性回归的薪酬合理性分析
第六届大学生数学建模竞赛
承诺书
我们仔细阅读了昆明理工大学大学生数学建模竞赛的竞赛规则。
我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规则的。
如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。
如有违反竞赛规则的行为,我们将受到严肃处理。
我们的参赛报名序号为:
信自学院第5队
我们选择的题号是(A题/B题):
A
我们的参赛性质是(学院代表队/个人参赛队):
学院
参赛队员(打印并签名):
1.信息工程与自动化学院年级姓名签名
2.信息工程与自动化学院年级姓名签名
3.信息工程与自动化学院年级姓名签名
数学建模联络员(打印并签名):
签名
日期:
2011年05月23日
评阅编号(由组委会评阅前进行编号):
第六届大学生数学建模竞赛
评阅专用页
评阅编号(由组委会评阅前进行编号):
评阅记录(供评阅时使用):
评阅人
评分
备注
总分
基于多元线性回归的薪酬合理性分析
摘要
本文围绕学校工资制度合理性问题进行研究,以概率论数理统计理论为基础,通过多元线性回归分析方法,建立现有薪金模型:
分析了该学校教职工工资与可控因素的关系,并进一步考察了女工的待遇情况。
再次根据模型得出的科学合理地设计了新的高校薪金分配方案。
针对问题
(1):
建立多元线性回归模型,对数据表中的非数值数据引入虚拟变量,利用SPSS统计分析软件对回归系数及检验统计量进行求解,确定了日平均工资与各因素的关系,再运用逐步分析法,进一步说明了与哪些因素更加密切。
根据问上边已建立的多元回归模型,再利用SPSS软件进行性别与女性婚姻状况的单因素方差分析,画出单个因素的均值散点图,从而考察了性别和婚姻状况这两个单因素分别对女工收入的影响。
根据模型的特点,发现单因素线性回归模型没有考虑各因素之间的交互作用,故有必要引入交互变量,再次利用SPSS软件进行双因素方差分析,建立合理的含交互变量的回归模型,同时对模型进行误差分析。
针对问题
(2):
我们添加虚拟变量:
x9~科研成果,x10~职称,x11~课时,x12~地区因素,使用随机数来模拟某理工大学这些虚拟变量的数值,同时我们结合目前绩效工资改革,提出一种更合理的事业单位薪资计算模型。
关键词:
虚拟变量交互变量多元线性回归模型SPSS软件单、双因素方差分析逐步回归法均值散点图
一.问题重述
某地人事部门为研究大学教师的薪金与他们的资力、性别、教育程度及培训情况等因素之间的关系,要建立一个数学模型,分析人事策略的合理性,特别是考察女教师是否受到不公正的待遇,以及她们的婚姻状况是否会影响收入。
为此,从当地教师中随机选了一些进行观察,附表是90位教师的相关数据,现将表中数据的符号介绍如下:
Z~月薪(元);X1~工作时间(月);
X2~=1男性,X2=0~女性;X3=1~男性或单身女性,X3=0~已婚女性;
X4~学历(取值0~6,值越大表示学历越高);
X5=1~受雇于重点大学,X5=0~其它;
X6=1~受过培训的毕业生,X6=0~未受过培训的毕业生或受过培训的肄业生;
X7=1~已两年以上未从事教学工作,X7=0~其它。
请解决以下问题:
(1)建立数学模型,分析人事策略的合理性,特别是考察女教师是否受到不公正的待遇,以及她们的婚姻状况是否会影响收入。
(2)表中所列的数据指标是否全面、合理,结合目前全国正在进行的工资改革,请为某所重点理工大学拟定一份绩效工资分配方案。
(提示:
是否需要考虑教师的课时量、科研成果等,或者考虑大学排名用到的指标)
二.模型假设
(1).政府政策方针与企业的人力资源规划在一定时期内保持不变。
(2).假设员工收入仅与题中所给因素有关,不受其他因素影响。
(3).假设员工的待遇仅由收入这一单方面来考察。
(4).假设该企业提供的各项数据都真实可靠。
三.符号说明
四.问题分析
4.1对问题
(1)分析
4.1.1人事策略的合理性分析
由题意可知,本题是要求分析平均日工资与所给因素之间的关系,尤其要分析出与哪些关系更加密切。
平均日工资=性别、婚姻、学历、工龄等因素的线性组合。
由于部分变量是定性非数值型数据,于是采用引入虚拟变量的方法,建立基本的多元线性回归模型,利用SPSS统计分析软件对回归系数及检验统计量进行求解,从而确定日平均工资与各因素的线性关系。
进而对模型用逐步分析法加以修正,得出收入与哪些因素关系更加密切。
同时间接反映出现有薪资体系的利弊,,使这些因素在一定程度上指导事业单位工资制度的改革,营造更加合理人性化的社会。
4.1.2是否已婚对女性收入影响
本题是利用性别、婚姻状况单因素方差分析及它们与工龄和教育的双因素方差分析结果,再结合均值散点图,考察出性别和婚姻状况这两个单因素分别对女工收入的影响,从而分析出现有的人事策略是不是对女性存在性别歧视和她们的婚姻状况是不是会影响到收入。
4.2问题
(2)的求解
本题是模型改进及优化。
依据多元线性回归模型的特点,由于部分因素之间存在交互作用,故利用SPASS软件对各个因素进行两两双因素方差分析,进而引入交叉项,改进单因素方差分析的不合理之处,同时进行模型误差分析。
五.模型的建立及求解
5.1问题
(1)求解
5.1.1分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切。
(1)引入虚拟变量;
1、定义
设变量D表示某种属性,该属性有两种相互排斥的类型,即当属性存在时D取值为1;当属性不存在时D取值为0。
记为
(2)建立多元线性回归模型:
5.1.2模型的求解
利用Spss回归分析对模型进行求解,可得出回归系数及
,
,
结果。
表5.1.1模型概览表
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.891a
.794
.776
7.67175
a.预测变量:
(常量),经验,重点,工年龄,婚否,培训,性别,学历。
表5.1.2方差分析表
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
18606.697
7
2658.100
45.163
.000a
残差
4826.166
82
58.856
总计
23432.863
89
a.预测变量:
(常量),经验,重点,工年龄,婚否,培训,性别,学历。
b.因变量:
工资(元/天)
表5.1.3系数表
系数a
模型
非标准化系数
标准系数
B的95.0%置信区间
B
标准误差
试用版
t
Sig.
下限
上限
1
(常量)
37.586
1.847
20.354
.000
33.913
41.260
工年龄
.090
.007
.707
13.222
.000
.076
.103
性别
1.364
2.397
.042
.569
.571
-3.404
6.132
婚否
-.449
2.519
-.013
-.178
.859
-5.461
4.563
学历
5.347
1.394
.401
3.836
.000
2.574
8.120
重点
1.045
1.958
.032
.534
.595
-2.849
4.940
培训
2.564
4.092
.065
.627
.533
-5.576
10.705
经验
-.042
2.118
-.001
-.020
.984
-4.255
4.170
a.因变量:
工资(元/天)
由表5.1.1模型概览表可得出,
;从表5.12得出
,表明模型的线性关系在95%的置信水平下显著成立。
因此,该模型从整体上看是可用的,由系数表中的各项可以得到回归方程。
对模型中回归系数的初步解释如下,
的系数是0.090,说明在其他因素不变情况下,工龄增长一个月其月工资增长0.090元;
的系数是1.364大于0,说明在其他因素不变的情况下,男性员工要比女性员工的月工资多1.364元;
的系数为-0.449小于0,说明在其他因素相同的情况下,已婚女性工资要比未婚女性工资要低0.449元/天;
的系数均为正数,说明在其他因素相同的前提下,员工的学历越同高、受雇重点大学、参加过培训,他们对于学历较低、受雇于一般大学、没有参加过培训的工资相对要高。
的系数为-0.02小于0,说明在其他因素保持不变的条件下,管理部门的员工平均日工资要比技术的部门的员工平均年工资要低0.042元每天,管理部分员工比技术部门员工工资低,这个有存在的合理性。
以上就根据回归系数对各因素与平均日工资的关系进行了分析。
对模型的进一步讨论:
由表5.1.1可以看出相关系数
=0.794,可能存在多重共线性,为了进一步优化模型,使
接近于1,也就是更接近现实。
故须用逐步回归法(Stepwise)加以修正。
表5.1.4模型概览表
模型汇总
模型
R
R方
调整R方
标准估计的误差
1
.750a
.563
.558
10.79079
2
.889b
.790
.785
7.52288
3
.890c
.792
.785
7.52966
4
.891d
.793
.783
7.55296
5
.891e
.793
.781
7.59763
a.预测变量:
(常量),工龄。
b.预测变量:
(常量),工龄,学历。
c.预测变量:
(常量),工龄,学历,重点。
d.预测变量:
(常量),工龄,学历,重点,培训。
e.预测变量:
(常量),工龄,学历,重点,培训,经验。
表5.1.5Anovaf
模型
平方和
df
均方
F
Sig.
1
回归
13186.038
1
13186.038
113.242
.000a
残差
10246.824
88
116.441
总计
23432.863
89
2
回归
18509.211
2
9254.606
163.527
.000b
残差
4923.651
87
56.594
总计
23432.863
89
3
回归
18557.023
3
6185.674
109.103
.000c
残差
4875.839
86
56.696
总计
23432.863
89
4
回归
18583.846
4
4645.962
81.441
.000d
残差
4849.016
85
57.047
总计
23432.863
89
5
回归
18584.051
5
3716.810
64.389
.000e
残差
4848.811
84
57.724
总计
23432.863
89
a.预测变量:
(常量),工龄。
b.预测变量:
(常量),工龄,学历。
c.预测变量:
(常量),工龄,学历,重点。
d.预测变量:
(常量),工龄,学历,重点,培训。
e.预测变量:
(常量),工龄,学历,重点,培训,经验。
f.因变量:
工资(元/天)
表5.1.6系数a
由表5.1.4可得样本相关系数
,比前面所得回归方程的
要小,但这主要是由于解释变量减少引起的,这点从方程总体线性显著性检验的
远远大于
检验的临界值,且
可以看出来。
因此,该模型从整体上看其线性关系在95%的置信水平下是显著成立的,再由系数表得两个系数的显著性均为0.000,小于0.05,说明系数都通过了t检验。
于是由系数表中的各项可以得到简化后的回归方程:
由此分析出,对平均日工资影响比较密切的两个因素是员工的受教育程度和工龄,其中工龄影响尤为显著,其对收入的影响可由均值散点直观的看出,如图
图5.1.7学历对日均工资影响
从图中可以直观的看出,工龄对薪水影响最密切,呈现一定的线性关系。
5.1.3考察女工是否受到不公正待遇
通过对问题一的求解结果可知,受教育情况对员工的收入影响显著,所以在考虑性别对员工收入的影响时,先考察工龄、教育状况与性别的双因素对员工收入的影响。
结果见表5.2.1及表5.2.2
表5.2.1
主体间效应的检验
因变量:
工资(元/天)
源
III型平方和
df
均方
F
Sig.
模型
321679.639a
79
4071.894
123.420
.000
x2
3.559
1
3.559
.108
.749
x1
20610.728
70
294.439
8.925
.000
x2*x1
210.518
7
30.074
.912
.532
误差
362.913
11
32.992
总计
322042.552
90
a.R方=.999(调整R方=.991)
由表5.2.1知,
,从而可知工龄和性别的交叉因素对员工收入的影响可忽略。
表5.2.2
主体间效应的检验
因变量:
工资(元/天)
源
III型平方和
df
均方
F
Sig.
模型
307321.923a
8
38415.240
213.989
.000
x2
211.603
1
211.603
1.179
.281
x4
5166.872
4
1291.718
7.195
.000
x2*x4
745.583
2
372.792
2.077
.132
误差
14720.629
82
179.520
总计
322042.552
90
a.R方=.954(调整R方=.950)
表5.2.3
由表5.2.2可知,
,性别和教育这一交叉因素也可忽略。
可通过对模型中性别这一因素进行单因素方差分析来分析性别对女工是否受到不公正待遇。
分析结果如下,
由表5.2.3可得出,
大于
的检验临界值,
,显然性别通过了显著性检验。
又如下图
图5.2.4
可以看出,女工的平均日工资显然要比男性的平均日工资要低。
由此可得出女工受到了不公正待遇。
5.2.1女性婚姻状况对收入的影响
为考察这一问题,同样也是先考察工龄、教育状况与女性婚姻状况的交叉因素对员工收入的影响。
分析结果见表5.2.5及表5.2.6
表5.2.5
主体间效应的检验
因变量:
工资(元/天)
源
III型平方和
df
均方
F
Sig.
模型
321813.013a
80
4022.663
175.249
.000
x1
20625.303
70
294.647
12.836
.000
x3
123.470
1
123.470
5.379
.043
x1*x3
260.757
8
32.595
1.420
.296
误差
229.539
10
22.954
总计
322042.552
90
a.R方=.999(调整R方=.994)
由表5.2.5可知,
,工龄与女性婚姻状况这一交叉因素对员工收入的影响可忽略。
表5.2.6
主体间效应的检验
因变量:
工资(元/天)
源
III型平方和
df
均方
F
Sig.
模型
306831.147a
7
43833.021
239.172
.000
x3
188.231
1
188.231
1.027
.314
x4
5028.465
4
1257.116
6.859
.000
x3*x4
15.504
1
15.504
.085
.772
误差
15211.405
83
183.270
总计
322042.552
90
由表5.2.6可知,
,教育状况与女性婚姻这一交叉因素对员工收入的影响也可忽略。
进而可通过对女性婚姻状况这一因素进行单因素分析,考察女性婚姻状况是否影响其收入。
分析结果如表5.2.7所示
表5.2.7
ANOVA
工资(元/天)
平方和
df
均方
F
显著性
组间
2067.838
1
2067.838
8.517
.004
组内
21365.024
88
242.784
总数
23432.863
89
由表5.2.7可得出,
大于
的检验临界值,
,显然女性婚姻状况这一因素也通过了显著性检验。
如下图
图5.2.8
由上图可知,未婚女性平均日工资要比已婚女性平均日工资要低,由此可知,女性的婚姻状况会影响她们的收入。
X3=0为~已婚女性,日薪的平均值为51元左右,而x3=1~未婚男性或者女性日薪平均值为61元左右,很明显已婚女性的收入低于未婚男性或者女性,她们的婚姻状况影响收入。
5.1.4问题
(1)模型分析的结果
通过多元线性回归分析方法,建立现有薪金模型,通过以上对人事策略因子的分析和比较,得出以下结论:
(1)现有的人事策略不够合理,面对新一轮的绩效工资改革,我们需要完善大学教师薪金分配,激励优秀。
(2)在现有的薪金体制下,存在一定的性别和婚姻歧视,从我们的模型得出结论:
在其他因素相同或者接近的情况下,女性的日工资水平低于男性的,已婚女性的工资水平低于未婚女性或者男性。
因薪资概率方案应该考虑到现有体制中存在的弊端,我们将在问题
(2)中通过合理科学的模型,建立一种全面、合理、科学的工资分配方案。
5.3对问题
(2)求解
5.3.1模型的建立
(1)通过前边的分析,我们得出结论:
x2性别因素和x3是否已婚这两个因素影响薪金模型合理科学,同时考虑到向模型中加入其他对于高校薪金影响力较大的因素:
课时,职称,地区,科研成果等因素,我们把这四个因素和
因素一起求解分析,建立更加数学模型。
引入四个值的虚拟随机变量,讲四个因素数量化。
(2)使用Matlab生成随机数,来模拟某高校的教师科研情况
具体数量值见附件二.xls
5.3.2模型的求解
运用多元回归分析的方法建立模型:
我们直接用Matlab命令Stepwise求解,图5-1有三部分组成从上往下依次是:
StepwisePlot,StepwiseTable,StepwiseHistory
图5-1
从图中我们看到相关性系数R2=0.797706,接近0.8即自变量与应变量有较强的线性关系,x1,x4,x5,x6,x7,x9,x10,x11,x12的置信区间均包含原点,x1,x4,x5,x6,x7,x9,x10,x11,x12对应变量的影响比较显著。
拟合分析得到
的值为:
b=
39.3209
0.0901
4.9734
1.6540
3.8233
-0.2636
1.0270
-0.0166
0.0886
-1.0498
带入回归方程得到:
加入新的虚拟变量以后得到的回归方程:
接着就是利用检测量R,F,P的值判断改模型是否可用。
(1)判定系数R2的评价:
一般地,怕顶系数在0.8~1范围内,课判断回归自变量与因变量具有较强的线性相关性。
本例中R2为0.7481,表明线性相关性较强。
(2)F检验法:
当Fn>F1-α(k,n-k-1)时则拒绝原假设,即认为因变量y与自变量x1,x2,x3…xk之间显著地有线性相关关心;否则热为因变量y与自变量x1,x2,x3…xk之间线性相关关心不明显。
本例中Fn>F1-α(k,n-k-1),线性关系明显。
(3)P检验法:
若P<α(α为预订显著水平),则说明因变量y与自变量x1,x2,x3…xk之间有显著地线性想干关系。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 多元 线性 回归 薪酬 合理性 分析