sas分析.docx
- 文档编号:1949473
- 上传时间:2022-10-25
- 格式:DOCX
- 页数:10
- 大小:214.80KB
sas分析.docx
《sas分析.docx》由会员分享,可在线阅读,更多相关《sas分析.docx(10页珍藏版)》请在冰豆网上搜索。
sas分析
SAS数据分析论文
关于1995-2010年城镇单位就业人员工资的分析
摘要:
利用SAS分析软件对城镇单位就业人员工资总额进行描述统计分析、单变量分析和回归性分析。
通过这几种数据分析我们可以从不同的角度来审视数据得到更多的有关研究对象的信息,对我们能够深入了解目标能起到积极作用,在这几个数据分析方法中尤为重要的是回归分析。
灵活运用此方法有助于我们对数据的理解。
研究步骤主要分为:
收集相关的数据,进行编程录入,然后做各项分析,通过分析结果得出结论,得到研究目标。
背景介绍:
在我国,将就业人员所属的单位主要分为国有单位,城镇单位以及其他类型的单位。
我国经济产业以国有单位为主,如银行业、保险业、石油化工、移动通信、电力行业、汽车、煤炭、钢铁等等。
在这些方面的发展上国家投入了大量的人力及物力来发展和建设。
城镇单位是指非国有的,具有地区代表的企业,由城镇根据当地的具体情况而建立的单位,如纺织业、渔业等等。
其他单位,主要包括私营单位,或合资企业,这些单位不由政府和单位进行过多的干涉,发展方向由企业的创建人设定,有很广泛的发展空间。
因为选择就业的单位不同,不同的企业类型有着不同的经营和管理模式,效益方面也存在很多差别,因为效益的不同,可能会对就业人员的工资情况也有着不同的影响,从而影响到就业人员的个人收入,和总体的工资总额。
因而,为了更好地了解不同的单位,是否会对工资总额带来较大的影响,作出以下分析
一、数据的选取及预处理:
本次分析是选取数据为1995-2010城镇单位就业人员工资总额。
数据来源于国家统计局网站中国年鉴2011。
首先运行SAS软件并在编辑器内编辑如下内容,y,x1,x2,x3,x4分别表示为年份,工资合计,国有单位工资总额,城镇单位工资总额,其他单位工资总额。
(单位:
亿元)
方法一:
(直接编辑内容)
Dataaa;
Inputy$x1$x2$x3$x4;
Cards;
19958255.86172.61210.6672.7
19969249.96893.31269.4801.7
19979602.47323.91283.9994.5
19989540.26934.61054.91550.7
199910155.97289.9995.81870.1
200010954.77744.9950.72259.1
200112205.48515.2898.52791.7
200213638.19138.0863.93636.2
200315329.69911.9867.14550.6
200417615.011038.2876.25700.6
200520627.112291.7906.47429.0
200624262.313920.6983.89357.9
200729471.516889.11108.111674.3
200835289.519487.91203.214598.4
200940288.221862.71273.317152.1
201047269.924886.41433.720949.7
;
Run;
Procprint;
Run;
点击运行后得到如下数据输出:
方法二:
从外部导入数据(excel数据导入方法)
二、数据分析
(一)描述统计分析:
图中,col1表示工资总额的合计,col2表示国有单位工资总额,col3表示城镇单位工资总额,col4表示其他单位的工资,其他图均如此
由上图分析可知:
共取用了16年的数据,工资总额合计,国有单位工资总额,城镇单位工资总额,其他单位的工资总额的均值分别为19609.69,11881.31,1073.72,6624.33。
说明国有单位的工资整体水平远远高于城镇单位及其他类型的单位,国有单位的工资总额是城镇单位的11倍,是其他单位的1.79倍。
就国有单位而言,工资总额的最小与最大值,相差18713.8亿元。
但就总体而言,居民收入差距大,生活水平,也存在很大差异,城镇单位作为地方的企业,应该采取有效措施,提高生产力,从而提高就业人员的收入总额,缩小总计差距
(二)单变量分析
1、工资总额合计:
由上两图分析合计工资总额可得到:
均值为19609.6875,标准差为12310.7890,偏态1.1484,其偏度为正,是较为分散的数据,称为右偏,有极大值。
峰度为0.2179,峰度为正,称为轻尾。
散点图表示,合计总计总额,在这16年间呈现稳步上升的局势,就业人员的收入在提升,生活水平也在提高
2、国有单位工资总额:
由上两图分析国有单位工资总额得到:
均值为11881.3063,标准差为5878.8265,偏态为1.1225,其偏度为正,是较为分散的数据,称为右偏,有极大值。
峰度为0.1350,峰度为正,称为轻尾。
散点图表明,1995-2010年的工资总额是呈现上升趋势的,但在1996和1977年间有小幅度波动,但在1997年后又呈现稳步增长且在2005年后幅度更大
3、城镇单位工资总额:
由上两图分析城镇单位工资总额得到:
均值为1073.7188,标准差为183.0557,偏态为0.4628,其偏度为正,是较为分散的数据,称为右偏,有极大值。
峰度为-1.0672,峰度为负。
散点图说明,城镇单位工资总额,有很大的波动,并未呈现稳定的趋势,在1995-1997三年间呈上升趋势,但在1997-2002年间呈现大幅度下降,2003-2010工资总额又呈现上升趋势,说明就业人员的生活水平,及收入情况也受到相应的影响,只是导致,均值远低于国有单位工资总额的均值。
4、其他单位工资总额:
由上两图分析其他单位工资总额得到:
均值为6624.3313,标准差为6379.3879,偏态为1.1043,其偏度为正,是较为分散的数据,称为右偏,有极大值。
峰度为0.1658,峰度为正,称为轻尾。
在这16年间呈现稳步上升的局势,就业人员的收入在提升,1995-1997三年间处于平稳的发展状态,2005年以后呈现迅猛上升的趋势,表明单位的效益好,未受到外界因素的影响。
(三)回归分析:
datasjfx.yiyuan;
inputyx1x2x3x4;
cards;
19958255.86172.61210.6672.7
19969249.96893.31269.4801.7
19979602.47323.91283.9994.5
19989540.26934.61054.91550.7
199910155.97289.9995.81870.1
200010954.77744.9950.72259.1
200112205.48515.2898.52791.7
200213638.19138.0863.93636.2
200315329.69911.9867.14550.6
200417615.011038.2876.25700.6
200520627.112291.7906.47429.0
200624262.313920.6983.89357.9
200729471.516889.11108.111674.3
200835289.519487.91203.214598.4
200940288.221862.71273.317152.1
201047269.924886.41433.720949.7
;
Procprint;
Run;
procregdata=sjfx.yiyuan;
modely=x1x2x3x4/selection=stepwiseslentry=0.10slstay=0.10icorrbcovbpr;
run;
运行结果:
(如图所示)
由上图分析可知:
回归平方和为:
337.03261,误差平方和为:
2.96739,总平方和为:
340.000。
三者的自由的分别为:
2、13、15。
回归平方和的均值为168.51631,误差平方和的均值为0.22826实际的F值=738.26,p<..0001,小于显著性水平。
观察Pr>|t|均小于a=0.05,所以回归系数是可靠的。
只有变量col2和col3进入了模型,其他不能进入参数估计部分表明拟合的回归方程为:
Y=2003.56742+.000090778col2-0.01104col3
从上图分析可知:
回归平方和为:
337.46775,误差平方和为:
2.53225,总平方和为:
340.000。
三者的自由的分别为:
4、11、15。
回归平方和的均值为:
84.36694,误差平方和的均值为:
0.23020实际的F值=366.49,p<..0001,小于显著性水平。
观察Pr>|t|均小于a=0.05,所以回归系数是可靠的。
参数估计部分表明拟合的回归方程为:
Y=2000.87862-0.00167col1+0.00304col2-0.00922col3-0.00124col4
三、总结:
数据分析研究的对象是数据,数据作为信息的载体,当然要分析数据中包含的主要信息,纪要分析数据的主要特征,也就是说,要研究数据的数字特征。
对于数据的数据特征,要分析数据的集中位置,分散程度,数据的分布是正态分布还是偏态的等。
对于多元数据,还要分析多元数据的各个分量之间的相关性等,此时我们所研究的均值,方差,相关系数,偏度与峰度也就显得尤为重要。
回归分析是应用及其广泛的数据分析之一,它基于观测变量之间的相关分析,一分析数据内在规律,并可用于预报,控制等问题。
通过对数据的回归分析,我们可以更好地了解数据所带有的信息,达到我们的研究目标。
而从以上的数据表明,工资总额受到了不同单位类型的影响。
国有单位作为隶属国家的企业,不仅涉及的领域广,而且,创造的经济效益也是其他单位无法比拟的,正是因为经济效益好,从而就业人员的工资总额也因此逐年的上涨,是城镇单位或是其他单位的几倍或更多。
或许就是因为这个原因,现在的就业人员,为了进入到国有企业的原因之一;城镇单位,作为属于地方的企业,在投资或涉及的领域上自然没有国有单位的领域广,因为各个城镇的情况不同,因而发展的方向自然也不同。
在所涉及的领域中,或因为技术,人员等方面的因素影响,经济效益自然也会被波及。
经济效益的好坏,影响着就业人员的工资额度,所以工资总额就相对较低;其他单位,不被政府过多干涉的单位领域,在于单位领导个人的发展眼光和市场的需求,与国有企业和城镇单位发展前景不同,灵活性较大,能够更好地满足市场需求,从而得到更高的经济效益,正是因为高的经济效益,所以就业人员的工资总额也会一直上涨。
这几年间,虽然我国经历了金融危机等因素的影响,但经济效益仍在稳步增长,说明我国的经济体制,适应了全球经济的发展。
不过,就我国具体现状而言,城镇单位就业人员的工资总额,虽然在逐步的上升,但仍低于国有单位很多,因此,我认为城镇企业应该采取相应的措施加快当地的经济发展,从而提高就业人员的的工资总额,减小与国有单位和其他单位之间的差距,提高就业人员的工作热情,提高工作效率,提升了就业人员的生活水平。
而且,我认为,提高城镇单位就业人员工资总额的同时,也在提升我国合计就业人员的工资总额,侧面表现了我国经济综合国力的提高,保持一定发展速度,降低贫富两极化的趋势。
四.附录:
1.数据来源:
(中国统计年鉴)
代码:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- sas 分析