统计学完整案例.docx
- 文档编号:26973798
- 上传时间:2023-06-24
- 格式:DOCX
- 页数:49
- 大小:348.10KB
统计学完整案例.docx
《统计学完整案例.docx》由会员分享,可在线阅读,更多相关《统计学完整案例.docx(49页珍藏版)》请在冰豆网上搜索。
统计学完整案例
2017-2018年度第二学期
计算机与数据科学学院
应用统计学期末考查
科学就业,理想人生
关于大学生就业现状及成因的统计研究
评分
2019年6月
随着时代的发展、社会环境的改变和国家对教育的重视,大学生已成为现在随处可见的大众教育中的一员。
当代大学生正处在国家国际化的大环境里,机遇和挑战并存,如何能使自己成为当代社会发展的弄潮儿,是每个面临毕业的大学生应该重点考虑的问题。
本报告通过问卷调查、数理统计等方法,对校不同年级在校大学生就业现状了解进行调研分析。
研究表明:
网路招聘是大学生了解就业的主要途径,是大学生就业中不可或缺的重要组成部分,但是存在方式结构不合理的问题,大学生就业问标题呈现多样性、独立性特点,学校教育对于大学生社会化的实现有现实意义。
通过此次调查了解大学生如何利用学校资源和网络道路了解就业,以及面临就业遇到的困难和关注方向因素有哪些,为解决大学生就业中存在的问题提出解决方案,为同学们选择更好的就业提供依据。
通过两个变量对比分析、变化趋势预测这些方法的研究得出,途径普遍就业工资,理想就业工资会影响学生们的就业状况。
第一章导论4
1.1选题背景与思路4
1.2研究目标与指导意义4
1.3统计过程各步骤概述4
1.4预计获得的研究成果(含预设结论)5
第二章统计报告准备工作6
2.1编写统计调查方案6
2.1.1调查总体概述6
2.1.2统计报告涉及的变量设计6
2.1.3抽样方法与数据搜集方法6
2.1.4详述在本次调查工作中控制抽样误差的方法7
2.2编写数据文件7
第三章统计分析过程及结论9
3.1统计分析9
3.1.1年级和就业途径两个品质变量的对比分析9
3.1.2途径普遍工资和就业理想最低工资的对比分析11
3.1.3大学生年级与理想就业工资之间的单因素方差分析13
3.2变量变动趋势预测分析14
3.2.1途径普遍工资和理想就业工资的相关回归分析14
3.2.2途径普遍工资的时间序列分析19
3.3多个变量的组合统计分析20
3.3.1多变量组合数据透视表20
3.3.2指数体系分析21
第四章课题结论、评述及建议24
附录一25
参考文献:
统计学(第六版)28
第一章导论
1.1选题背景与思路
当前大学毕业生一部分就业还是很不错的,这得益于这部分大学生自身综合素质高和所学技能过硬。
但还有一大部分大学生就业现状不容乐观,问题集中表现为,国家体制内就业难、一线大城市就业难和高薪酬就业难,甚至相当一部分学生认为工资比理想工资少,让大学生了解现状,科学就业。
1.2研究目标与指导意义
调查分析他们的了解就业的途径方式有那些,主要了解哪些内容,目前大学生就业现状如何,大学生社会就业环境如何,大学生应该如提高自身素质才能毕业后顺利就业,政府及各级部门如何改善就业环境为的大学生提供良好的发展环境,让大学生就业不再是难题。
了解大学对就业所持的态度、参与动机和阻碍因素等,并对大学生如何培养科学的就业观进行探究。
就业方式有多种,以前就业方式主要是宣传页和固定的招聘公司,熟人推荐,但科技的飞速发展,也给我们的生活带来了巨大的改变,现在的大学生就业方式已和过去有了很大的不同,网络多元化给大学生增加了很多了解途径,增加了很多新的方法,有网上招聘查看所有公司资料,公司环境,评价。
经过我们的调查就业的方式增多了,网路途径兴起后高居不下,我们做了调查分析。
时代的进步,在带给我们方便和享受的同时也使得我们和熟人,学校信任度越来越小,在快节奏的生活中我们迷失了自我。
我们当代的大学生应该合理的规划工作,科学就业。
1.3统计过程各步骤概述
统计大学生了解就业途径是什么,通过途径了解工作的普遍工资,理想就业工资,学校成绩情况和了解途径次数。
1.4预计获得的研究成果(含预设结论)
就业途经方式的选择影响大学生的就业工资。
学校推荐有利于造就科学、保障的
就业工作,满意度有影响。
年级会影响到理想就业工资。
专业学习成绩与现场招聘会、学校推荐关联极大。
工作后对熟人推荐岗位有影响。
第二章统计报告准备工作
2.1编写统计调查方案
2.1.1调查总体概述
(1)统计方法:
统计分组法
(2)数据调查方法:
普查、抽样调查
(3)调查总体范围:
河南城建学院学生
⑷调查总体包含的个体数量:
河南城建学院19838名学生
(5)调查对象的抽样率和样本数】:
样本数为100个,算出抽样率=0.504%;
2.1.2统计报告涉及的变量设计
1、按数据来源分:
(1)二手数据变量包括:
性别、年级、途径普遍工资、理想就业工资、学习成绩等级。
(2)调查数据变量包括:
就业途径方式、了解次数、满意程度。
2、按变量类型分:
(1)分类变量包括:
性别、就业途径方式
(2)顺序变量包括:
学习成绩等级、满意程度
(3)数值型变量包括:
年级、了解次数、途径普遍工资、理想就业工资
2.1.3抽样方法与数据搜集方法
1、选定的抽样方法简介及选择的原因:
先分层,再整群,再简单随机抽样2、详述抽样过程具体步骤:
采用简单随机抽样方式和多阶段抽样(最少两个阶
段,前后顺序自定)方式生成两组样本数据文件
2.1.4详述在本次调查工作中控制抽样误差的方法
在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。
由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。
2.2编写数据文件
部分截图
年级
就业途径
途径普遍工资
就业理想最低工资
大一
学校提供的推荐
2800
3500
大一
学校提供的推荐
学校提供的推
2900
3520
大一
荐
学校提供的推
3000
3540
大一
荐
学校提供的推
3100
3560
大一
荐
3100
3580
大一
熟人联系
3100
3600
大一
熟人联系
3100
3620
大一
熟人联系
3200
3640
大一
网路招聘
3200
3660
大一
网路招聘
3200
3680
大一
网路招聘
3200
3700
大一
熟人联系
3200
3720
大一
熟人联系
3300
3740
大一
熟人联系
3300
3760
大一
熟人联系
3300
3780
大一
熟人联系
3300
3800
大一
熟人联系
3800
3820
大一
熟人联系
3900
3840
大一
熟人联系
3900
3860
大一
熟人联系
3900
3880
未来工作
就业
途经
满
方向
学习成
了解
丿意、
清楚
绩等级
次数
程
方式
度
不太清楚
优秀
2
4
A
不清楚
优秀
2
6
A
无所谓
优秀
2
7
A
清楚
优秀
2
4
A
不太清楚
优秀
2
4
A
不太清楚
及格
1
1
C
清楚
及格
1
2
C
不太清楚
良好
1
2
D
不清楚
良好
5
10
B
清楚
良好
5
11
B
不清楚
良好
5
11
B
不清楚
中等
1
2
B
不太清楚
中等
1
3
C
清楚
中等
1
3
D
无所谓
中等
1
3
C
无所谓
中等
1
2
C
不太清楚
良好
1
3
B
清楚
良好
1
2
D
无所谓
良好
1
1
C
大一
熟人联系
4000
3900
不清楚
良好
1
1
C
大一
现场招聘会
4000
3920
不太清楚
良好
1
1
C
大一
现场招聘会
4000
3940
无所谓
优秀
3
1
B
大一
现场招聘会
4000
3960
清楚
优秀
3
2
B
大一
现场招聘会
4000
3980
无所谓
优秀
3
2
B
大二
现场招聘会
4000
4000
不清楚
优秀
3
2
B
第三章统计分析过程及结论
3.1统计分析
3.1.1年级和就业途径两个品质变量的对比分析
1、预设结论:
(1)在校大学生年级不同了解就业途径多少不同,进而面对就业压力不同
(2)在校大学生了解就业途径,网络招聘是最受欢迎的途径。
2、涉及的品质变量名称:
年级,就业途径
3、编制年级图表
A|B
C
D
E1
抽取某高檢在校大学生年级频率频数分
怖表
计数项:
年级
年圾
汇总
%
夫一
25
25
大二
25
25
大三
25
25
大四
25
25
总计
100
100
]计数项:
年级
1柱形图
:
30
=O__==
在校大学生主要了解就业途径图表
AB
C
D
E
L
抽取某高校在校犬学生了解就业途径频率频数分布表
2
计数项:
就业途径
3
就业途径
汇总
%
4
熟人联系
16
16
5
学校提供的推荐
5
5
iR
□
现场招聘会
11
11
1
人才市场
17
17
3
网路招聘
51
51
3
汇总
100
100
0
1
):
:
―O——':
:
:
―<
计数歧酰业谨径
柱形图
,昭[丄F某大学抽取大学生主要了解就业谨径柱形團
Q0(
4、年级与主要了解就业途径概括性度量情况表
项目
年级
主要了解就业途径
众数
无
网路招聘
众数率
0
51%
异众比率
100%
49%
从此表可看出
(1)某高校在校大学生主要了解就业途径属网路招聘最多,众数率为51%
(>33.4%),说明众数的代表性很好,说明对于此高校在校大学生面对就业从网路招聘了解最多,与预设结论基本一致。
2)此高校在校大学生主要了解就业途径中属网路招聘最多,众数率为51%(>33.4%),人才市场和熟人联系占的百分比也很高,说明在校大学生的主动了
解就业情况意识还不错。
3)二者相比,年级的集中程度较低,离散程度较高,而主要了解就业途径的
集中度较高,离散度较低
3.1.2途径普遍工资和就业理想最低工资的对比分析
1、预设结论:
(1)此校在校学生途径普遍工资呈现对称分布,没有显著的偏态特征;绝大多数学生途径普遍工资处于中心区域,集中程度较高;
(2)在校大学生就业理想最低工资呈左偏分布,绝大多数学生的了解就业途径意识很强。
2、涉及的变量名称:
途径普遍工资,就业理想最低工资
3、途径普遍工资和就业理想最低工资概括性度量情况表
项目
途径普遍工资
就业理想最低工资
中位数
4500
4532
下四分位数(精确算法)
4000
3980
上四分位数(精确算法)
2800
4980
极差(全距)
2500
1980
四分位差(内距)
1200
1000
由此表和计算可得数两组数据的四分位差率都远小于
50%故集中程度都较
4、编制途径普遍工资图表
A
B
1
途径普遍工资
人数1
2
(2500,3000]
3
3
(3000,3500]
13
4
(3500,4000]
10
51
(4000,4500]
45
6
(4500,5000]
24
7
(5000,5500]
5
8
合计
100
q
某高校在校大学生途径普遍工资图表
某高校在校大学生途径普遍工资直方图
编制就业理想最低工资图表
—
A
B
就业理想最低工资
人数
(3500,4000]
26
(40064500]
25
(4500,5000]
25
(5000,5500]
24
合计
100
貫方图
0I|IOIIIO
某高校在校大学生就业理想最低工资直方图
5、途径普遍工资和就业理想最低工资的概括性度量情况表
项目
途径普遍工资
就业理想最低工资
众数组
(4000,4500]
(3500,4000]
中位数所在组
(4000,4500]
(4500,5000]
平均数所在组
(4000,4500]
(4000,4500]
标准差
594.0751236
580.2298395
离散系数
0.138221294
0.129227136
从此表可以看出
(1)我校在校学生的途径普遍工资呈现对称分布,与预设结论完全相符。
(2)此高校在校大学生就业理想最低工资呈现右偏分布,与预设结论不相符,说明绝大多数学生有些理想化,有点不现实。
6、分别计算两个变量分组后的方差、标准差、离散系数,比较两个变量的离散程度,并给出结论。
我校在校学生的途径普遍工资比较集中,离散程度相比较于在校大学生就业理想最低工资低了很多,
7、对比两个变量的所有计算结果,给出统计结论,并回应预设结论。
如果和预设结论不一致,请尝试找出原因。
在校大学生就业理想最低工资的离散系数大于途径普遍工资,结合中心集中度的结论,说明我校大学生就业理想最低工资呈现高度集中。
3.1.3大学生年级与理想就业工资之间的单因素方差分析
1、从样本数据文件中选择关系密切的一个品质变量(作为因素自变量)和一个数值型变量(作为数据因变量),写出变量名称和预设结论。
要求:
所选的品质变量至少要有3个以上变量值。
变量名称:
年级理想就业工资
预设结论:
随着年级的增长,大学生认为的理想就业工资越来越高。
2、通过方差分析,运用F检验探讨二者的关系程度。
1、提出假设:
HO:
u1=u2=u3=u4即4个年级被调查的均值都相等,自变量对因变量没有显著影响,不同年级之间的理想就业工资没有显著差异。
H1:
u1、u2、u3、u4不全相等,即4个年级被调查的均值不全相等,自变量对因变量有显著影响,不同年级之间的理想就业工资有显著差异。
2、方差分析计算表
方差分析;
单因素方差分析
SIMARY
组
观®数
求和
平均
方苹
方卑分析
年异源
SS
df
MS
F
P-value
Fcrit
组间
31250000
3
10416667
2.276923
1.13E-57
2.699393
组内
2080000
96
21666.67
总计
33330000
99
3、取得统计结论,并总结预设结论的结果,如果分析结论与预设结论不一致,请
尝试找出原因。
因为F 预设结论相符。 进行关系强度分析。 计算关系强度系数: R2=SSA/SST 本例R2=93.75%即年级(自变量)对理想就业工资(因变量)的影响效应占总效应的93.75%,而其他因素(残差变量)所解释的比例占6.25%。 说明年级是影响理想就业工资的主要因素之一,但不一定是最主要因素。 3.2变量变动趋势预测分析 3.2.1途径普遍工资和理想就业工资的相关回归分析 1、从样本数据文件中选择涉及2个关系密切且有因果关系的数值型变量,写出预设结论和涉及的变量名。 预设结论: 途径普遍工资是理想就业工资的主要因素 变量名: 途径普遍工资理想就业工资 2、计算相关系数,探讨二者的关系程度。 r=0.85303 由散点图可以看出,R2=0.8530>0.5,故途径普遍工资和理想就业工资之间有极高的线性相关关系。 3、若r>=0.71,则做回归分析。 否则重新选择一组数值型变量。 r=0.85303>=0.71,做回归分析。 4、用最小二乘法得出回归方程,并解释回归系数的意义; 1鮎-(W =(100*1961320000-429800*449000)/(100*1882220000-429800*429800) =4490-0.9021*4298=612.77 y=612.77+0.9021x(其中: y为理想就业工资,x为途径普遍工资) 5、运用Excel“回归”输出回归分析结果,验证上述计算的准确性; SUMMARYOUTPUT 回归统计 Multiple 0.923596 RSquare 685303 Adjusted Q.85153 标准误差 223.5732 观测值 100 方年分析 df SS VIS F ? nificanceF 回归分析 1 28431474 28431474 568.8006 1.36E-42 残差 90 4898526 49984.96 总计 99 33330000 Coefficien-标准误差 tStat P-value Lower95%Upper95虾限95.0壮限95*01 Intercept 612.8988 1610952 3.73502 0.000315 287.2572 938.5404 287.2572 938,6404 XVariabl 0.902071 0.037823 23.849M 1.36E-42 6827012 0.97713 0.827012 0.97713 Y=0.902X+612.899 6、对每一个自变量原始值,做全部的点估计和置信区间估计,取得统计结论,并 总结分析结论。 如果分析结论与预设结论不一致,请尝试找出原因 口,号 途径普遍工资 理想就业工资 置信区间下 限 置信区间 上限 X Y YA Y-YA (X-Xa)a2 d u Y-d Y-u 1 2800 3500 3138.499 361.501 2244004 3129.4566 3148.0524 370.5434 351.9476 2 2900 3520 3228.699 291.301 1954404 3219.6566 3238.2524 300.3434 281.7476 3 3000 3540 3318.899 221.101 1684804 3309.8566 3328.4524 230.1434 211.5476 4 3100 3560 3409.099 150.901 1435204 3400.0566 3418.6524 159.9434 141.3476 5 3100 3580 3409.099 170.901 1435204 3400.0566 3418.6524 179.9434 161.3476 6 3100 3600 3409.099 190.901 1435204 3400.0566 3418.6524 199.9434 181.3476 7 3100 3620 3409.099 210.901 1435204 3400.0566 3418.6524 219.9434 201.3476 8 3200 3640 3499.299 140.701 1205604 3490.2566 3508.8524 149.7434 131.1476 9 3200 3660 3499.299 160.701 1205604 3490.2566 3508.8524 169.7434 151.1476 10 3200 3680 3499.299 180.701 1205604 3490.2566 3508.8524 189.7434 171.1476 11 3200 3700 3499.299 200.701 1205604 3490.2566 3508.8524 209.7434 191.1476 12 3200 3720 3499.299 220.701 1205604 3490.2566 3508.8524 229.7434 211.1476 13 3300 3740 3589.499 150.501 996004 3580.4566 3599.0524 159.5434 140.9476 14 3300 3760 3589.499 170.501 996004 3580.4566 3599.0524 179.5434 160.9476 15 3300 3780 3589.499 190.501 996004 3580.4566 3599.0524 199.5434 180.9476 16 3300 3800 3589.499 210.501 996004 3580.4566 3599.0524 219.5434 200.9476 17 3800 3820 4040.499 -220.499 248004 4031.4566 4050.0524 -211.457 -230.052 18 3900 3840 4130.699 -290.699 158404 4121.6566 4140.2524 -281.657 -300.252 19 3900 3860 4130.699 -27
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 完整 案例