实验六各国家和地区男子径赛记录数据的聚类分析.docx
- 文档编号:8441616
- 上传时间:2023-01-31
- 格式:DOCX
- 页数:12
- 大小:184.17KB
实验六各国家和地区男子径赛记录数据的聚类分析.docx
《实验六各国家和地区男子径赛记录数据的聚类分析.docx》由会员分享,可在线阅读,更多相关《实验六各国家和地区男子径赛记录数据的聚类分析.docx(12页珍藏版)》请在冰豆网上搜索。
实验六各国家和地区男子径赛记录数据的聚类分析
实验六各国家和地区男子径赛记录数据的聚类分析
一、实验目的
1.掌握如何使用SAS软件来进行聚类分析;
2.看懂和理解SAS输出的结果,并学会以此来作出分析;
3.对同一组数据使用五种系统聚类方法,学会对各种聚类效果的比较,获取重要经验;
二、实验内容
实验1下表中列出各国家和地区男子径赛记录的数据,试分别用类平均法、离差平方和法和k均值法进行聚类分析,聚类前先对各变量做标准化变换。
国家和地区
Alphabet
100米(秒)
200米(秒)
400米(秒)
800米(秒)
1500米(秒)
5000米(秒)
10000米(秒)
马拉松
阿根廷
a
10.39
20.81
46.84
1.81
3.7
14.04
29.36
137.72
澳大利亚
a
10.31
20.06
44.84
1.74
3.57
13.28
27.66
128.3
奥地利
a
10.44
20.81
46.82
1.79
3.6
13.26
27.72
135.9
比利时
b
10.34
20.68
45.04
1.73
3.6
13.22
27.45
129.95
百慕大
b
10.28
20.58
45.91
1.8
3.75
14.68
30.55
146.62
巴西
b
10.22
20.43
45.21
1.73
3.66
13.62
28.62
133.13
缅甸
b
10.64
21.52
48.3
1.8
3.85
14.45
30.28
139.95
加拿大
c
10.17
20.22
45.68
1.76
3.63
13.55
28.09
130.15
智利
c
10.34
20.8
46.2
1.79
3.71
13.61
29.3
134.03
中国
c
10.51
21.04
47.3
1.81
3.73
13.9
29.13
133.53
哥伦比亚
c
10.43
21.05
46.1
1.82
3.74
13.49
27.88
131.35
库克群岛
c
12.18
23.2
52.94
2.02
4.24
16.7
35.38
164.7
哥斯达黎
c
10.94
21.9
48.66
1.87
3.84
14.03
28.81
136.58
捷克斯洛
c
10.35
20.65
45.64
1.76
3.58
13.42
28.19
134.32
丹麦
d
10.56
20.52
45.89
1.78
3.61
13.5
28.11
130.78
多米尼加
d
10.14
20.65
46.8
1.82
3.82
14.91
31.45
154.12
芬兰
f
10.43
20.69
45.49
1.74
3.61
13.27
27.52
130.87
法国
f
10.11
20.38
45.28
1.73
3.57
13.34
27.97
132.3
德意志民
g
10.12
20.33
44.87
1.73
3.56
13.17
27.42
129.92
德意志联
g
10.16
20.37
44.5
1.73
3.53
13.21
27.61
132.23
大不列颠
g
10.11
20.21
44.93
1.7
3.51
13.01
27.51
129.13
希腊
g
10.22
20.71
46.56
1.78
3.64
14.59
28.45
134.6
危地马拉
g
10.98
21.82
48.4
1.89
3.8
14.16
30.11
139.33
匈牙利
h
10.26
20.62
46.02
1.77
3.62
13.49
28.44
132.58
印度
ii
10.6
21.42
45.73
1.76
3.73
13.77
28.81
131.98
印度尼西
i
10.59
21.49
47.8
1.84
3.92
14.73
30.79
148.83
以色列
i
10.61
20.96
46.3
1.79
3.56
13.32
27.81
132.35
爱尔兰
i
10.71
21
47.8
1.77
3.72
13.66
28.93
137.55
意大利
i
10.01
19.72
45.26
1.73
3.6
13.23
27.52
131.08
日本
j
10.34
20.81
45.86
1.79
3.64
13.41
27.72
128.63
肯尼亚
k
10.46
20.66
44.92
1.73
3.55
13.1
27.38
129.75
韩国
k
10.34
20.89
46.9
1.79
3.77
13.96
29.23
136.25
朝鲜人民
k
10.91
21.94
47.3
1.85
3.77
14.13
29.67
130.87
卢森堡
l
10.35
20.77
47.4
1.82
3.67
13.64
29.08
141.27
马来西亚
m
10.4
20.92
46.3
1.82
3.8
14.64
31.01
154.1
毛里求斯
m
11.19
22.45
47.7
1.88
3.83
15.06
31.77
152.23
墨西哥
m
10.42
21.3
46.1
1.8
3.65
13.46
27.95
129.2
荷兰
n
10.52
20.95
45.1
1.74
3.62
13.36
27.61
129.02
新西兰
n
10.51
20.88
46.1
1.74
3.54
13.21
27.7
128.98
挪威
n
10.55
21.16
46.71
1.76
3.62
13.34
27.69
131.48
巴布亚新
p
10.96
21.78
47.9
1.9
4.01
14.72
31.36
148.22
菲律宾
p
10.78
21.64
46.24
1.81
3.83
14.74
30.64
145.27
波兰
p
10.16
20.24
45.36
1.76
3.6
13.29
27.89
131.58
葡萄牙
p
10.53
21.17
46.7
1.79
3.62
13.13
27.38
128.65
罗马尼亚
r
10.41
20.98
45.87
1.76
3.64
13.25
27.67
132.5
新加坡
s
10.38
21.28
47.4
1.88
3.89
15.11
31.32
157.77
西班牙
s
10.42
20.77
45.98
1.76
3.55
13.31
27.73
131.57
瑞士
s
10.25
20.61
45.63
1.77
3.61
13.29
27.94
130.63
瑞典
s
10.37
20.46
45.78
1.78
3.55
13.22
27.91
131.2
台北
t
10.59
21.29
46.8
1.79
3.77
14.07
30.07
139.27
泰国
t
10.39
21.09
47.91
1.83
3.84
15.23
32.56
149.9
土耳其
t
10.71
21.43
47.6
1.79
3.67
13.56
28.58
131.5
美国
u
9.93
19.75
43.86
1.73
3.53
13.2
27.43
128.22
苏联
u
10.07
20
44.6
1.75
3.59
13.2
27.53
130.55
西萨摩亚
w
10.82
21.86
49
2.02
4.24
16.28
34.71
161.83
三、实验要求
1.完成三种系统聚类方法,比较其聚类效果;
2.能对试验结果进行合理分析.
四、实验内容
4.1完成三种系统聚类方法,比较其聚类效果
4.1.1导入数据集exec65
4.1.2类平均法聚类
procclusterdata=work.exec65method=avenosquarestd;
idnation;
proctreehorizontal;
idnation;
run;
答:
用类平均法聚类的话认为较合适的是聚成4类,但分成两类以上的话,库克群岛和西萨摩亚都会单聚1类,可知用类平均法的聚集效果一般。
4.1.3离差平方和法聚类
答:
用离差平方和法聚类认为较适合的是聚成4类,但库克群岛和西萨摩亚聚成1类,聚集效果尚可。
4.1.4k均值法聚类
初始凝聚点:
观测所归类及与最终凝聚点的距离:
聚类汇总:
各变量的类内均值及标准差:
答:
用k均值法聚类的话认为较合适的是聚成5类,但库克群岛和西萨摩亚都单成1类,聚集效果一般。
4.2对试验结果进行合理分析
从类平均、离差平方和、k均值三种聚类方法所得结果来看,类平均和离差平方和都聚成4类,k均值则是聚成5类。
而聚类情况则是类平均和k均值把库克群岛、西萨摩亚各自单成1类,离差平方和则是合成1类,相比较而言还是离差平方和法的聚集效果更好一些。
所以实验1对于各国家和地区男子径赛记录的数据用离差平方和法聚类效果更好,聚成4类,其中库克群岛和西萨摩亚聚单独成1类。
THANKS!
!
!
致力为企业和个人提供合同协议,策划案计划书,学习课件等等
打造全网一站式需求
欢迎您的下载,资料仅供参考
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 各国 地区 男子 径赛 记录 数据 聚类分析