大学生数学建模竞赛之大数据分析报告.docx
- 文档编号:25811229
- 上传时间:2023-06-15
- 格式:DOCX
- 页数:22
- 大小:391.42KB
大学生数学建模竞赛之大数据分析报告.docx
《大学生数学建模竞赛之大数据分析报告.docx》由会员分享,可在线阅读,更多相关《大学生数学建模竞赛之大数据分析报告.docx(22页珍藏版)》请在冰豆网上搜索。
大学生数学建模竞赛之大数据分析报告
某某学院第五届大学生数学建模竞赛
承诺书
我们仔细阅读了中国大学生数学建模竞赛的竞赛规如此.
我们完全明白,在竞赛开始后参赛队员不能以任何方式〔包括、电子、网上咨询等〕与队外的任何人〔包括指导教师〕研究、讨论与赛题有关的问题。
我们知道,抄袭别人的成果是违反竞赛规如此的,如果引用别人的成果或其他公开的资料〔包括网上查到的资料〕,必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。
我们X重承诺,严格遵守竞赛规如此,以保证竞赛的公正、公平性。
如有违反竞赛规如此的行为,我们将受到严肃处理。
所属院系〔请填写完整的全名〕:
能源工程学院
我们参赛选择的题号是〔C〕
参赛队员:
队员名
系别
学号
联系
是否队长
李泽辉
2011级电气
1105230116
否
X新江
2011级电气
1105230145
是
温新鹏
2011级电气
1105230146
否
日期:
2013年5月18日
一、问题重述
C题:
面试考核打分问题
某市统计局在公开招考面试环节中,组成一个六人专家小组,对51名应试者进展了面试考核,各位专家对每位面试者进展了打分〔见附表〕,请你运用数学建模方法解决如下问题:
〔1〕补齐表中缺失的数据,给出补缺的方法与理由,并给出录取顺序。
〔2〕六位专家中哪位专家打分比拟严格,哪位专家打分比拟宽松,并对六位专家的打分质量进展排序。
〔3〕作为人事部门主管,你认为哪些面试者应给予第二次面试的机会。
在今后的面试工作中,如何合理安排面试工作。
数据附表
序号
专家1
专家2
专家3
专家4
专家5
专家6
1
70
63
81
88
76
78
2
87
67
64
66
72
72
3
83
76
68
66
73
71
4
72
68
83
93
83
94
5
83
72
90
79
81
88
6
74
61
72
52
65
63
7
76
78
66
68
72
73
8
55
91
62
81
75
78
9
65
94
72
77
79
75
10
81
90
68
74
78
73
11
76
59
91
81
74
63
12
52
83
77
68
75
84
13
89
81
73
79
82
83
14
81
70
76
59
76
91
15
87
55
87
63
77
89
16
63
66
88
53
72
85
17
88
68
71
80
76
75
18
90
80
53
93
79
80
19
62
70
85
94
72
51
20
51
70
66
69
64
61
21
77
81
73
74
78
78
22
71
88
58
57
68
65
23
82
80
82
66
75
57
24
71
61
51
76
71
90
25
52
62
78
88
72
80
26
53
82
70
68
72
80
27
72
71
94
63
76
73
28
58
73
63
84
73
85
29
58
80
87
58
73
77
30
76
73
87
68
72
50
31
85
87
63
53
76
86
32
60
82
74
76
76
78
33
58
92
75
64
74
75
34
55
87
85
58
77
93
35
73
74
78
62
75
87
36
61
94
65
88
80
81
37
82
96
73
77
83
88
38
83
71
80
91
78
68
39
83
89
64
71
78
73
40
86
69
82
70
73
53
41
73
85
82
63
77
89
42
61
79
70
60
67
72
43
87
93
82
73
83
69
44
86
70
66
88
75
67
45
88
81
94
69
84
87
46
53
90
78
88
76
65
47
80
88
79
73
78
71
48
88
73
78
81
77
64
49
*
85
78
78
73
56
50
73
*
64
86
77
78
51
68
85
*
83
76
69
注:
*表示专家有事外出未给应聘者打分
二、问题分析
这个问题属于数类统计学随机性模型,可采用画图形、逻辑运算、数值运算等各种数学方法和计算机技术。
三、模型假设
专家意外情况导致的数据缺失是一种完全随机缺失。
专家打分公平公正公开,不受任何人际关系影响并且在整个过程中保持一致
用人单位对每一位专家打分的重视程度一样。
四、符号说明
〔i为1、2、3〕表示专家所打分数的的平均数;
给每位面试者的得分;
〔i为1、2、3、4、5、6〕表示各位专家所打分数的方差;
=
,
=
,
称为置信限;
四、模型建立
统计学的思想是对随机事件的现象进展统计分析,将随机性归纳于可能的规律性中。
而且也可以从差异中发现趋势。
因为该题有着统计学的本质特征:
数据的随机性,在该题我们将应用到统计中的统计数据分析和统计推断。
将经收集好数据进展分析,得出与推断内中的趋势。
均值插补
根据辅助信息数据将样本分为假如干组,使组内各单位的主要特征相似。
然后分别介绍各组目标变量的均值,将各组均值作为组内所有缺失数据项的替补值。
;
;
。
K-S检验法原理:
K-S检验是统计学中在对一组数据进展统计分析是所用到的一种方法。
它是将需要做统计分析的数据和另一组标准数据进展比照,求得它和标准数据之间的偏差的方法。
一般在K-S检验中,先计算需要做比拟的两组观察数据的累积分布函数,然后求这两个累积分布函数的差的绝对值中的最大值D。
最后通过查表以确定D值是否落在所要求对应的置信区间内。
假如D值落在了对应的置信区间内,说明被检测的数据满足要求。
反之亦然。
为了更直观的说明专家所给分值服从正态分布,本文运用MATLAB软件绘出了专家1、专家2、专家3相对应所给分值的直方频率图、Q-Q图〔见四、模型求解〕。
区间估计模型:
区间估计指对总体中的一维参数
,构造两个统计量:
=
和
=
,满足对于预先给定的很小的概率
,有
,这时,称区间
为
的置
信区间,称
为置信限,概率称为显著水平〔或置信度〕,
称为置信水平〔或置信概率〕。
方差:
方差是各个数据与平均数之差的平方的平均数。
在概率论和数理统计中,方差〔英文Variance〕用来度量随机变量和其数学期望〔即均值〕之间的偏离程度。
在许多实际问题中,研究随机变量和均值之间的偏离程度有着很重要的意义。
;
;
;
;
;
。
Q-Q图:
Q-Q图是一种散点图,对应于正态分布的Q-Q图,就[1]是由标准正态分布的分位数为横坐标,样本值为纵坐标的散点图.要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.用QQ图还可获得样本偏度和峰度的粗略信息.
Q-Q图可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进展检验的。
P-P图和Q-Q图的用途完全一样,只是检验方法存在差异。
由于P-P图和Q-Q图的用途完全一样,只是检验方法存在差异。
要利用QQ图鉴别样本数据是否近似于正态分布,只需看QQ图上的点是否近似地在一条直线附近,而且该直线的斜率为标准差,截距为均值.
用QQ图还可获得样本偏度和峰度的粗略信息.
五、模型求解
〔1〕补齐表中缺失的数据,给出补缺的方法与理由,并给出录取顺序。
1 补齐表中缺失的数据,给出补缺的方法与理由。
〔补齐后数据见附表〕
由SPSS软件求解:
局部数据,其中专家1第49号数据未得出用00表示,其他专家同理。
依次对专家1、2、3、4、5、6的其他数据进展分析,得出如下结果,如如下图所示:
专家1的频率分布直方图专家1的标准Q-Q图
专家2的频率分布直方图专家2的标准Q-Q图
专家3的频率分布直方图专家3的标准Q-Q图
专家4的频率分布直方图专家4的标准Q-Q图
专家5的频率分布直方图专家5的标准Q-Q图
专家6的频率分布直方图专家6的标准Q-Q图
如图表可知:
专家1的置信区间在[],均值7,修正后的均为均在置信区间内,所以可估计专家甲的缺失值为73。
同理得出专家2的置信区间在[7],均值7,修正后的均值均在置信区间内,所以估计专家乙的缺失值为78。
专家3的置信区间在[]均值修正后的均值均在置信区间内,所以估计专家丙的缺失值为75。
〔说明:
5%修整均值就是把排在最前面和最后面5%的数据都删掉,之后再计算的均值,这样就使得均值不容易受均值影响,更能代表〕
2 给出录取顺序
表一
序号
平均分
总分
45
83.8
503
37
83.2
499
4
82.2
493
5
82.2
493
13
81.2
487
43
81.2
487
18
79.2
475
38
78.5
471
36
78.2
469
41
78.2
469
47
78.2
469
10
77.3
464
9
77.0
462
21
76.8
461
48
76.8
461
15
76.3
458
17
76.3
458
39
76.3
458
51
76.0
456
1
76.0
456
50
76.0
456
34
75.8
455
14
75.5
453
44
75.3
452
31
75.0
450
46
75.0
450
27
74.8
449
35
74.8
449
32
74.3
446
11
74.0
444
49
73.8
443
8
73.7
442
23
73.7
442
12
73.2
439
33
73.0
438
3
72.8
437
28
72.7
436
19
72.3
434
7
72.2
433
29
72.2
433
40
72.2
433
25
72.0
432
2
71.3
428
16
71.2
427
30
71.0
426
26
70.8
425
24
70.0
420
42
68.2
409
22
67.8
407
6
64.5
387
20
63.5
381
(2)六位专家中哪位专家打分比拟严格,哪位专家打分比拟宽松,并对六位专家打分质量进展排序。
再根据SPSS软件中的方差可推断出,对于所有的应聘者,专家打分的均值可以作为衡量专家打分的一个重要标准,在均值一样时,专家打分方差越大说明打分越严格。
据图表中数据,我们可得出专家中依严格到不严格的顺序为:
专家1→专家4→专家6→专家2→专家3→专家5
(3)作为人事部门主管,你认为那些面试者应给予第二次面试机会。
在今后的面试工作中,如何合理安排面试工作。
因为专家评分标准不同,我们对面试者进展重新排名,先去掉6名专家中的最大值和最小值再求和,求平均数,表如下:
表二
序号
专家1
专家2
专家3
专家4
专家5
专家6
总分
平均数
45
88
81
84
87
340
85
4
72
83
93
83
331
5
83
79
81
88
331
37
82
77
83
88
330
18
90
80
79
80
329
13
81
79
82
83
325
43
87
82
73
83
325
41
73
85
82
77
317
15
87
87
63
77
314
36
65
88
80
81
314
38
83
71
80
78
312
78
31
85
63
76
86
310
47
80
79
73
78
310
48
73
78
81
77
309
21
77
74
78
78
307
34
87
85
58
77
307
46
78
88
76
65
307
10
81
74
78
73
306
50
73
78
77
78
306
1
70
81
76
78
305
39
83
71
78
73
305
32
74
76
76
78
304
76
9
72
77
79
75
303
12
83
77
68
75
303
14
81
70
76
76
303
23
80
82
66
75
303
51
75
83
76
69
303
17
71
80
76
75
302
49
73
78
78
73
302
35
73
74
78
75
300
75
44
86
70
75
67
298
8
62
81
75
78
296
74
11
76
81
74
63
294
40
69
82
70
73
294
28
73
63
84
73
293
25
62
78
72
80
292
73
27
72
71
76
73
292
73
26
70
68
72
80
290
7
76
68
72
73
289
19
62
70
85
72
289
30
76
73
68
72
289
3
76
68
73
71
288
72
29
80
58
73
77
288
72
33
75
64
74
75
288
72
16
63
66
72
85
286
24
71
61
76
71
279
2
67
66
72
72
277
42
61
70
67
72
270
22
71
58
68
65
262
6
61
72
65
63
261
20
66
69
64
61
260
65
1 将表二和表一进展比拟,假如以前二十名为录取资格,如此表二前二十名中且没在表一前二十名中出现的应聘者应给与第二次机会。
如此第37名,31名,34名,46名,50名应给与第二次机会。
2 在今后的面试工作中,应该这样安排面试工作:
如果第二次面试的专家小组只由其中的4位专家组成。
假如此项工作必须要求应聘者有较强的工作能力,如此应请专家1,专家4,专家6和专家2组成专家组。
假如要求很宽松,专家6、专家2、专家3、专家5组成。
假如要求较宽松,如此没有专家1和专家5,即专家4、专家6、专家2、专家3。
六、模型评价
此模型可有效提高面试效率,减少人才损失,灵活的挑选应聘者。
但均值插补会产生偏估计。
总分排序对某些应聘者有一定的不公平性。
七、参考献文
[2]SPSS13.0统计软件教程X晓〔东南大学〕c:
\iknow\docshare\data\cur_work\wenku.baidu\view\fbff0cebf8c75fbfc77db2ec.html
[4]缺失数据的处理方法〔均值插补法〕访问网址c:
\iknow\docshare\data\cur_work\wenku.baidu\view\51c30f0316fc700abb68fcfe.html
[5]数学建模与典型案例分析李志林,欧宜贵丛书名出版社:
化学工业2007-04-01
八、附录
补全后的数据表格
序号
专家1
专家2
专家3
专家4
专家5
专家6
1
70
63
81
88
76
78
2
87
67
64
66
72
72
3
83
76
68
66
73
71
4
72
68
83
93
83
94
5
83
72
90
79
81
88
6
74
61
72
52
65
63
7
76
78
66
68
72
73
8
55
91
62
81
75
78
9
65
94
72
77
79
75
10
81
90
68
74
78
73
11
76
59
91
81
74
63
12
52
83
77
68
75
84
13
89
81
73
79
82
83
14
81
70
76
59
76
91
15
87
55
87
63
77
89
16
63
66
88
53
72
85
17
88
68
71
80
76
75
18
90
80
53
93
79
80
19
62
70
85
94
72
51
20
51
70
66
69
64
61
21
77
81
73
74
78
78
22
71
88
58
57
68
65
23
82
80
82
66
75
57
24
71
61
51
76
71
90
25
52
62
78
88
72
80
26
53
82
70
68
72
80
27
72
71
94
63
76
73
28
58
73
63
84
73
85
29
58
80
87
58
73
77
30
76
73
87
68
72
50
31
85
87
63
53
76
86
32
60
82
74
76
76
78
33
58
92
75
64
74
75
34
55
87
85
58
77
93
35
73
74
78
62
75
87
36
61
94
65
88
80
81
37
82
96
73
77
83
88
38
83
71
80
91
78
68
39
83
89
64
71
78
73
40
86
69
82
70
73
53
41
73
85
82
63
77
89
42
61
79
70
60
67
72
43
87
93
82
73
83
69
44
86
70
66
88
75
67
45
88
81
94
69
84
87
46
53
90
78
88
76
65
47
80
88
79
73
78
71
48
88
73
78
81
77
64
49
73
85
78
78
73
56
50
73
78
64
86
77
78
51
68
85
75
83
76
69
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学生 数学 建模 竞赛 数据 分析 报告