职工工资数学建模.docx
- 文档编号:27304466
- 上传时间:2023-06-28
- 格式:DOCX
- 页数:34
- 大小:188.43KB
职工工资数学建模.docx
《职工工资数学建模.docx》由会员分享,可在线阅读,更多相关《职工工资数学建模.docx(34页珍藏版)》请在冰豆网上搜索。
职工工资数学建模
石油大学
课程设计
理学院(系)信息与计算科学专业2013级2班
题目职工的调薪问题
学生锦
指导老师党林立
2016年7月
《数学模型与数学实验》
课程设计任务书
题目
职工的调薪问题
学生
锦
学号
201301010220
专业班级
信息1302
设
计
容
与
要
求
一.问题的提出
(1)分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;
(2)考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;
(3)继续改进你的模型,并给出模型误差分析。
二.问题的分析
本题要求我们对企业员工的日工资进行分析,且分析日工资与其他影响因素之间的关系,同时指出那些因素对日工资影响较大。
我们先建立简单的多元线性回归模型,对日工资与各因素之间的关系进行粗略的分析,因考虑到后期工龄对模型的关系影响不大,故建立了多元非线性回归模型,使之更符合实际。
用主成分分析法对各个因素进行分析,并找出对日工资影响较大的几个。
其次删除对模型影响较小的因素,保留主要因素是模型得到简化,使之更易于计算也更符合实际应用。
三.模型建立
多元线性回归模型的建立与求解
多元线性回归模型建立
首先对题目所给数据进行量化,量化结果见附录
假设该企业员工工资何其影响因素满足多元线性关系,且各因素之间没有影响,由此建立多元线性回归模型得:
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)是待回归系数参量
。
起止时间
2016年6月20日至2016年7月20日
指导教师签名
年月日
系(教研室)主任签名
年月日
一、问题重述
1.1问题描述
职工工资可以说是人们最为关切、议论最多的部分,因此也常常是最受重视的部分。
一般说来,现代企业的工资具有补偿职能、激励职能、调节职能、效益职能。
科学合理的工资制度,是激励职工的劳动积极性,提高劳动效率的重要手段,正确运用工资的杠杆作用在调动员工积极性方面会起到事半功倍的效果。
此外,对于企业中的各种不同的“特殊职务族”,是否要制定和执行专门的倾斜与优惠政策,如对管理干部、高级专家、女工等,也是需要重点考虑的问题。
现随机抽取了某企业若干职工的相关数据,见附件Bdata.xls。
请建立适当的数学模型研究下列问题:
1.2问题提出
(1)分析平均日工资与其他因素之间的关系,尤其需要说明与哪些因素关系密切;
(2)考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入;
(3)继续改进你的模型,并给出模型误差分析。
二问题分析
本题要求我们对企业员工的日工资进行分析,且分析日工资与其他影响因素之间的关系,同时指出那些因素对日工资影响较大。
我们先建立简单的多元线性回归模型,对日工资与各因素之间的关系进行粗略的分析,因考虑到后期工龄对模型的关系影响不大,故建立了多元非线性回归模型,使之更符合实际。
用主成分分析法对各个因素进行分析,并找出对日工资影响较大的几个。
其次删除对模型影响较小的因素,保留主要因素是模型得到简化,使之更易于计算也更符合实际应用。
三、模型假设因素
1、本题所给数据能确实反映出该公司的工资的构成
2、所给数据有较高的可靠性及准确性
3、假设男性是否已婚对工资构成不产生影响
4、男性和女性的工资所获得的条件相同
5、男性不管是否已婚等同于女性已婚
四、主要符号说明
这里仅给出主要符号说明,其余符号在文中一一说明
五、问题一模型的建立与求解
5.1多元线性回归模型的建立与求解
5.1.1多元线性回归模型建立
首先对题目所给数据进行量化,量化结果见附录
假设该企业员工工资何其影响因素满足多元线性关系,且各因素之间没有影响,由此建立多元线性回归模型得:
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)是待回归系数参量
5.1.2模型求解
利用eviews软件对模型中工资与各个影响因素进行回归分析得如下结果
DependentVariable:
Y
Method:
LeastSquares
Date:
08/18/28Time:
16:
18
Sample:
190
Includedobservations:
90
Y=C
(1)+C
(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7
+C(9)*X8
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
37.14526
2.325447
15.97338
0.0000
C
(2)
0.087893
0.006701
13.11734
0.0000
C(3)
-0.156203
2.239736
-0.069742
0.9446
C(4)
-4.925091
6.531140
-0.754094
0.4530
C(5)
1.218269
2.045119
0.595696
0.5530
C(6)
1.608884
2.617405
0.614686
0.5405
C(7)
0.981923
2.701711
0.363445
0.7172
C(8)
24.63417
5.789966
4.254631
0.0001
C(9)
17.13245
6.680527
2.564536
0.0122
R-squared
0.796310
Meandependentvar
57.63333
AdjustedR-squared
0.776193
S.D.dependentvar
16.23594
S.E.ofregression
7.680945
Akaikeinfocriterion
7.010002
Sumsquaredresid
4778.750
Schwarzcriterion
7.259983
Loglikelihood
-306.4501
Durbin-Watsonstat
1.066961
由此可得出各系数的值如下表:
参量
参量估计
C
(1)
37.14526
C
(2)
0.087893
C(3)
-0.156203
C(4)
-4.925091
C(5)
1.218269
C(6)
1.608884
C(7)
0.981923
C(8)
24.63417
C(9)
17.13245
将结果带入模型得
5.1.3结论与检验
5.1.3.1对模型的检验
相关系数检验法
在模型中,相关系数的计算公式为:
此公式反映出了X与Y线性度的一个度量指标,其中r围为(0,1),r越接近1,则X与Y线性度越高。
由相关系数检验法计算得到
r=0.7762
可见r并不接近1,线性相关度并不高,因此,该企业职工工资与个因素之间并不是线性关系。
通过eviews得到实际值、拟合值、残差的走势图,从图中可以看出拟合值与实际值存在较大误差,因此该模型需要进一步的改进
5.3.1.2结论
该模型中,本文建立了多元线性回归模型,简单的给出了该企业工资与影响因素之间的关系。
由于未考虑到工龄后期对工资影响减小的因素,同时该模型优化拟合度只有0..7762,故该模型并不可靠,我们需要引入非线性量对模型进行改进。
5.2多元非线性回归模型的建立与求解
5.2.1模型建立
考虑到对于工龄非常大的时候,其对工资的影响程度会减小,因此建立工资关于各因素的多远非线性模型:
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量
5.2.2模型求解
利用eviews软件对模型中工资与各个影响因素进行回归分析得如下结果
DependentVariable:
Y
Method:
LeastSquares
Date:
08/18/28Time:
17:
58
Sample:
190
Includedobservations:
90
Y=C
(1)+C
(2)*X1+C(3)*X2+C(4)*X3+C(5)*X4+C(6)*X5+C(7)*X6+C(8)*X7
+C(9)*X8+C(10)*X1^2
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
29.69142
2.081745
14.26275
0.0000
C
(2)
0.222376
0.019167
11.60186
0.0000
C(3)
-2.458851
1.775009
-1.385261
0.1698
C(4)
-2.773818
5.101962
-0.543677
0.5882
C(5)
-0.436665
1.610987
-0.271054
0.7870
C(6)
1.932692
2.041714
0.946603
0.3467
C(7)
0.841216
2.107066
0.399236
0.6908
C(8)
19.61945
4.567470
4.295474
0.0000
C(9)
17.80518
5.210745
3.417012
0.0010
C(10)
-0.000320
4.39E-05
-7.292542
0.0000
R-squared
0.877646
Meandependentvar
57.63333
AdjustedR-squared
0.863882
S.D.dependentvar
16.23594
S.E.ofregression
5.990123
Akaikeinfocriterion
6.522540
Sumsquaredresid
2870.526
Schwarzcriterion
6.800297
Loglikelihood
-283.5143
Durbin-Watsonstat
1.583030
算法同模型一由此可得出各系数的值如下表:
参量
参量估计
C
(1)
29.69142
C
(2)
0.222376
C(3)
-2.458851
C(4)
-2.773818
C(5)
-0.436665
C(6)
1.932692
C(7)
0.841216
C(8)
19.61945
C(9)
17.80518
C(10)
-0.000320
将结果带入模型得到该公司员工工资与影响因素之间的关系为:
5.2.3结论与检验
5.2.3.1模型的检验
检验方法同模型一
本模型中r=0.8639,接近1,因此本模型满足非线性关系,比模型一更具有实际性和通用性,具有比较高的运用价值。
同样我们通过eviews得到实际值、拟合值、残差的走势图,从图中可以看出,模型的拟合优度值比较高,样本的拟合值与实际值基本吻合,模型具有较高的实用价值。
5.2.3.2结论
再次我们建立了多元非线性回归模型,给出了该企业员工的工资与其影响因素的非线性关系。
由于考虑到了工龄后期对模型的影响,使得模型的拟合优度达到了0.8639,因此模型二更具有实际应用价值和可靠性。
5.3企业职工工资影响因素主成分分析
5.3.1下表给出了影响该企业职工工资的8项变量指标。
(详见附录)
其中x1表示职工工龄(月),x2表示职工是否有过一线工作经历,
x3表示是否接受过培训,x4表示工作性质,
x5表示职工性别,x6表示职工婚姻状况,
x7、x8联合表示职工学历情况
序号
x1
x2
x3
x4
x5
x6
x7
x8
1
7
0
0
0
0
1
0
0
2
14
0
0
0
1
1
0
0
3
18
0
0
1
1
1
0
0
…
…
…
…
…
…
…
…
…
85
403
1
1
1
1
1
0
1
90
464
0
1
1
1
1
0
1
5.3.2将表中的原始数据按公式
做标准化处理,然后将它们代入相关系数公式计算,得到相关系数矩阵
X1
X2
X3
X4
X5
X6
X7
X8
X1
1.000000
0.151146
0.156321
0.098854
0.160389
0.009829
0.005996
0.180312
X2
0.151146
1.000000
0.255665
-0.053068
-0.104982
0.254374
0.094888
0.255223
X3
0.156321
0.255665
1.000000
0.423355
0.316025
0.095618
0.490436
0.802955
X4
0.098854
-0.053068
0.423355
1.000000
0.417621
0.229484
0.263066
0.346091
X5
0.160389
-0.104982
0.316025
0.417621
1.000000
0.409081
0.263066
0.161418
X6
0.009829
0.254374
0.095618
0.229484
0.409081
1.000000
0.034922
0.027420
X7
0.005996
0.094888
0.490436
0.263066
0.263066
0.034922
1.000000
-0.026333
X8
0.180312
0.255223
0.802955
0.346091
0.161418
0.027420
-0.026333
1.000000
5.3.3通过SPSS软件由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
2.674
33.428
33.428
2.674
33.428
33.428
2
1.350
16.876
50.304
1.350
16.876
50.304
3
1.149
14.357
64.661
1.149
14.357
64.661
4
1.013
12.669
77.330
1.013
12.669
77.330
5
.897
11.213
88.543
.897
11.213
88.543
6
.542
6.781
95.324
7
.330
4.123
99.448
8
.044
.552
100.000
提取方法:
主成份分析。
由此得到各个成分的贡献率与累计贡献率
影响因素
原变量
成份
特征值
贡献率%
累积贡献率%
工龄(月)
x1
1
2.674
33.428
33.428
学历
x7
2
1.350
16.876
50.304
x8
3
1.149
14.357
64.661
培训情况
X3
5
1.013
12.669
77.330
一线经历
X2
6
.897
11.213
88.543
性别
X5
7
.542
6.781
95.324
婚姻状况
X6
4
.330
4.123
99.448
工作性质
X4
8
.044
.552
100.000
5.3.4结果分析
由分析结果可得知在所有影响职工工资的因素中,工龄,学历,培训情况,一线经历对职工的工资影响比较大,尤其是工龄以及学历对工资的影响较大
六、问题二模型建立与求解
6.1问题分析
通过问题一的5.3的分析可以得出,影响该企业职工的工资的主要因素为工龄,学历,培训情况,一线经历。
因而我们在建立模型的时候可以排除次要因素的影响,是模型更具有实际操作性
6.2模型的建立
通过对之前的主成分分析,我们提出了对模型结果影响不大的工作性质,性别,婚姻状况几个因素,对模型进行一定的简单化处理,使得模型更加简易。
考虑到工龄,学历,培训情况,一线经历几个影响较大的因素,我们建立如下模型:
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)是待回归系数参量
此模型自变量较少,因此可以更好的运用于实际情况
6.3模型的求解
通过eviews软件对y,x1,x2,x3,x7,x8,x1^2进行回归分析可以得到各自变量系数的值,运行结果如下表:
DependentVariable:
Y
Method:
LeastSquares
Date:
08/19/10Time:
20:
34
Sample:
190
Includedobservations:
90
Y=C
(1)+C
(2)*X1+C(3)*X2+C(4)*X3+C(5)*X7+C(6)*X8+C(7)*X1^2
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
30.60164
1.519258
20.14248
0.0000
C
(2)
0.222447
0.018659
11.92158
0.0000
C(3)
-2.428197
1.545233
-1.571412
0.1199
C(4)
-1.686006
4.921521
-0.342578
0.7328
C(5)
19.14110
4.353868
4.396344
0.0000
C(6)
16.80218
4.937967
3.402651
0.0010
C(7)
-0.000320
4.29E-05
-7.444191
0.0000
R-squared
0.876059
Meandependentvar
57.63333
AdjustedR-squared
0.867099
S.D.dependentvar
16.23594
S.E.ofregression
5.918909
Akaikeinfocriterion
6.468768
Sumsquaredresid
2907.779
Schwarzcriterion
6.663197
Loglikelihood
-284.0945
Durbin-Watsonstat
1.651991
由表可得到各自变量系数的值如下:
参量
参量估计
C
(1)
30.60164
C
(2)
0.222447
C(3)
-2.428197
C(4)
-1.686006
C(5)
19.14110
C(6)
16.80218
C(7)
-0.000320
将结果带入模型得到该公司员工工资与影响因素之间的关系为:
6.4结论与检验
6.4.1模型检验
有运算结果可以得出P值除了个别外数值都接近于0或为0,因此P检验通过。
D.W值为1.65接近2
表中拟合优度R2=0.8761,接近于1,表明模型拟合优度较高。
各种分析表明,此模型具有较高的可行性与可靠性,同时也简化的影响因素,使得更加具有实用价值。
6.4.2考察女工是否受到不公正待遇,以及她们的婚姻状况是否影响其收入
我们利用模型选取一组x1,x2,x3,x4,x7,x8相近,且代表性别婚姻的x5,x6取不同值,检验输出值,与期望值的误差在可接受围。
计算结果如下,比较可知,性别对工资影响小,因此可以说明该企业女性职工并未受到不公平待遇。
而女性的婚姻已否对工资虽有一定的影响,但在误差允许围,可以忽略不计,因此,也可以认为,该企业女性职工的婚姻状况不影响其收入。
y
X1
X2
X3
X4
X5
X6
X7
X8
y’
37
38
0
0
0
0
1
0
0
41.7565
37
41
0
0
0
1
1
0
0
42.022
38
42
0
0
0
0
1
0
0
42.1105
42
42
0
0
1
1
1
0
0
42.1105
38
42
0
0
0
1
1
0
0
42.1105
38
42
0
0
1
0
1
0
0
42.1105
6.4.3结论
模型三种,本文根据问题一中的主成份分析,采用提出法将对影响不大的因素剔除,并利用回归法对模型进行分析。
这种简化的模型,在实际应用中,特别是当计算的工资个数非常多,耗资资源较多时,有着很大意义。
通过对数据的分析我们得出该企业女性职工并未受到不公平待遇且女性职工的婚姻状况不影响其收入的结论。
七、问题三模型的建立与求解
7.1问题分析
本文要求我们进一步改进模型,使得模型更加合理有效,为此我们利用模型二,采用逐步回归法,对模型二进行改进,检验及修正。
7.2模型的建立
7.2.1由第一问得模型二为:
其中C
(1)、C
(2)、C(3)、C(4)、C(5)、C(6)、C(7)、C(8)、C(9)、C(10)是待回归系数参量
首先我们对模型二所有变量做回归分析,回归结果如下:
DependentVariable:
Y
Method:
LeastSquares
Date:
08/20/10Time:
01:
50
Sample(adjusted):
189
Includedobservations:
89afteradjustments
Variable
Coefficient
Std.Error
t-Statistic
Prob.
C
(1)
29.89610
1.999
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 职工工资 数学 建模