应用统计案例库封面Word文档格式.docx
- 文档编号:15160971
- 上传时间:2022-10-28
- 格式:DOCX
- 页数:11
- 大小:179.36KB
应用统计案例库封面Word文档格式.docx
《应用统计案例库封面Word文档格式.docx》由会员分享,可在线阅读,更多相关《应用统计案例库封面Word文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
x3每一工业职工实现利税(元);
x4固定资产投资总额(万元);
x5职工人数(万人);
x6高等学校在校学生数/总人口(%);
x7全市科技成果(项);
x8居民消费价格指数(%)。
其中,x1为地区的经济发展水平的影响;
x2,x3反映职工创造产值方面的影响;
x4反映政府投资方面的影响;
x6为教育方面的影响;
x7为科技方面的影响;
x8为物价的影响。
具体数据来自长春市统计年鉴和吉林省统计年鉴。
表1.1经典回归所用数据
year
y
x1
x2
x3
x4
x5
x6
x7
x8
1991
2107
2003
2.4
2160.7
290749
134.2
0.007936
311
106.2
1992
2441
2678
3
3542.4
450808
138.9
0.008208
116
109.1
1993
3006
3636
5
4000.8
687673
134.8
0.00937
74
114.7
1994
4271
4618
6.6
5302.4
961008
136.7
0.01019
464
122.9
1995
5013
5455
5.3
5459.2
1086570
133.9
0.01064
231
115.9
1996
6370
6472
7.8
4886.9
1205555
131.9
0.010934
427
110.9
1997
7052
7224
7.6
5283.5
1060320
128.7
0.011261
245
104.2
1998
6722
8311
11.7
9809
1416535
105.1
0.011938
561
100.6
1999
7406
9922
18.1
18359
1944338
102.8
0.014322
522
98.6
2000
8138
11550
21.5
29350
2352422
96.9
0.018438
468
98.8
2001
9130
13219
27.2
35584
2850446
92.7
0.022105
498
102.3
2002
10518
14959
36.6
50975.6
3204576
116.9
0.027509
615
99.7
11310
17148
43.1
55457.1
3896440
114.9
0.032162
723
101
2004
12937
19629
56.8
55249.2
4599564
112
0.036046
637
104.1
2005
15109
20728
52.2
33939.4
6504218
99.2
0.039781
692
101.7
2006
18322
23677
61.7
49596.5
9504180
83.8
0.041664
694
101.3
二、分析过程
1.本文在最小二乘估计(OrdinaryLeastSquareEstimation,OLSE)[1]的基础上研究工资水平受哪些经济因素的影响,如何受这些经济因素的影响。
首先,做相关分析,在SAS环境中,求得相关系数,一方面可以得出职工平均工资(y)与当地经济发展水平(x1),工业职工创造产值(万元)(x2),每一工业职工实现利税(元)(x3),投资(万元)(x4),教育程度(x6),科技水平(x7)有较大的正相关关系;
与职工数量(x5)和物价水平存在负相关关系。
这是符合经济意义的,当教育程度,科技水平,当地经济发展水平越高时,职工平均工资越高;
而当职工数量越多,居民消费价格指数越高时,职工平均工资越低。
另一方面除居民消费价格指数与工资的相关性不大,其余变量与工资的相关性都较大。
至于变量之间的相关性,除x8与其他的变量的相关系数的绝对值在0.5左右,其余变量间的相关性都较大。
1.1普通最小二乘回归下的工资水平分析
在SAS环境[2]中,依据最小二乘理论,进行回归分析,考察工资如何受当地经济发展水平,投资,教育,科技发展水平的影响。
由方差分析表可知,F统计量的值为485.02,F检验的P值〈0001,说明模型总体拟和效果很好。
复决定系数R-Square为0.9982,调整的复决定系数AdjR-Sq为0.9961,说明该模型对原始数据的模拟效果很好。
通过方差分析表,证明长春市职工工资水平受地区生产总值,固定投资,教育等经济因素的影响。
由回归系数的参数估计及其回归系数的t检验表可知,自变量x2,x3,x7,x8的t检验的p值均>
0.05,这些变量不显著。
x2每一工业职工创造产值,x8职工数量与职工平均工资在经济意义上是有影响的,一般而言,职工数量越多,劳动力数量供大于求时,根据价值规律,职工工资会下降。
而现在回归结果不符合经济意义,出现这种情况,有可能是存在多重共线性的缘故。
根据回归诊断表知DW检验,DW=2.186,因此不存在序列相关。
根据学生化残差和库克距离公式,所有残差的绝对值均小于3,因此不存在异常值问题。
通过SAS软件得到共线性诊断结果,其中最大的特征值是7.94979,最小的特征值是0.00083761。
计算出的条件数最大的是97.42177,当条件数>
10时就存在较强的多重共线性,说明本文数据存在较强的多重共线性,从本文开头相关系数中也可以看出。
文中由于影响工资水平的各个经济变量也相互影响,因此存在多重共线性也是合理的.比如,经济繁荣时期,地区生产总值和每一职工创造产值都趋于增长;
而经济衰退时期,它们又同时趋于下降.
1.2工资水平的岭回归分析
处理多重共线性的方法有逐步回归,主成分回归,岭回归,偏最小二乘回归等方法.目前,岭回归是最有影响的一种新的估计方法.因此本文采用岭回归分析方法.
当出现多重共线性时,普通最小二乘回归将明显变坏,A.E.Hoerl(霍尔)在1962年首先提出一种改进最小二乘估计的方法,叫岭估计(RidgeEstimate),后来Hoerl和Kennard(肯纳德)于1970年给予了详细讨论.[1]
用岭回归方法解决多重共线性的问题,其实质是一种自变量选元的过程。
在SAS中应用岭回归消除多重共线性,进行自变量选元,岭迹图如图1:
图1岭迹图
岭回归系数表给出了当岭参数k取从0到1之间的不同值时,各个自变量的回归系数。
岭迹图1对此更直观的用图形表示出来。
从图1可以看出,x8的系数极小,一直很平稳的在0附近,因此x8很自然应该是被剔除的;
剔除x8后按同样的方法重新作岭回归。
依次将x3,x5,x2,x7剔除。
从整体上看,当k达到0.15—0.25之间时,各个系数已大体上趋于稳定,因此在这一区间上取一个k值作岭回归可能得到较好的效果。
最后,当仅剩下x1,x4,x6时,重新作岭回归。
用x1,x4,x6重新作岭回归,岭迹图如图2:
图2岭迹图
根据输出结果和岭迹图2,可以看出至此所有剩余变量的岭迹图都已经很好了。
当岭参数k为0.2时,所有变量的系数都已经基本稳定。
因此,取岭参数k=0.21,标准化后回归方程为:
可见,地区生产总值与固定资产投资对工资水平有几乎同样重要的作用,回归系数分别为0.36655和0.31704。
教育对工资水平也具有显著的正相关关系,其回归系数为0.24929,说明当地经济总量和投资对工资水平的影响较教育对工资的影响程度更大。
如果一个地方的经济发展水平高,那么该地的各种经济因素就相对较高,这样受经济因素影响较大的职工的平均工资水平相应会较高。
要提高长春市的职工工资水平,首先政府应致力于发展该地的经济,教育,增加投资,扩大吸引外资。
其次,还应注意收入分配制度的合理性,避免收入差距过大,实现公正,合理的收入分配制度。
调节过高收入,补贴较低收入。
另外,由于影响工资水平的因素是很复杂的,劳动生产率的高低、劳动力市场的供求关系以及影响劳动力市场的制度性因素等都会影响工资水平,本模型并没有包括这些因素,因此本模型仅供参考。
通过实际措施来提高工资水平时,除应考虑本模型中所考虑的因素外,还应该考虑物价,劳动生产率,劳动力供求,劳动力市场制度等因素。
2职工工资水平的分位数回归分析
2.1分位数回归模型
从理论上说,经典线性回归是拟合y的条件均值与自变量x之间的线性关系,而分位数回归是通过估计被解释变量(因变量)在0~1之间的不同分位数值,对特定分布的数据进行估计。
另外,最小二乘法与分位数回归的回归系数在解释含义上有所不同,最小二乘法估计式是自变量对因变量的平均边际效果,而分位数回归估计式则是自变量对因变量的某个特定分位数的边际效果。
最小二乘法只能提供一个平均数,而分位数回归却能提供许多不同分位数的估计结果。
对分位数回归而言,被解释变量y的г分位数函数Q()可以定义为(李育安,2006)[5]:
(3.1.1)
其中,0<
<
1代表在回归线或回归平面以下的数据占全体数据的百分比,分位函数的特点是,被解释变量y的分布中存在比例为的部分小于分位数函数Q(),而(1-)的部分大于分位数函数Q(),y的整个分布被分为两个部分[6]。
为了对分位数回归求解,首先定义概率函数:
(3.1.2)
其中,u为反映概率密度函数的参数,而则表示被解释变量y的样本点处于分位以下和分位以上时的概率密度函数关系,假设分位数回归模型为:
(3.1.3)
的分位数回归是寻求y在Q分位数下的绝对离差和最小,即:
(3.1.4)
为简单起见,在具体估计过程中可以假设u=1,则对于任何一个分位数回归而言,参数估计就是要使加权误差绝对值平方和最小(邢春冰,2006):
(3.1.5)
其中,表示被解释变量的向量,表示解释变量的向量,表示估计的分位数值,当在(0,1)上取不同的值时,就可以得到不同的参数估计值[7]。
运用分位数回归模型,我们就可以分析不同工资阶段下,工资水平如何受各个变量的影响。
本文建立如下计量模型:
(3.1.6)
其中,代表当
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 案例 封面