主成分分析和聚类分析DOCWord文档下载推荐.docx
- 文档编号:20696131
- 上传时间:2023-01-25
- 格式:DOCX
- 页数:19
- 大小:116.15KB
主成分分析和聚类分析DOCWord文档下载推荐.docx
《主成分分析和聚类分析DOCWord文档下载推荐.docx》由会员分享,可在线阅读,更多相关《主成分分析和聚类分析DOCWord文档下载推荐.docx(19页珍藏版)》请在冰豆网上搜索。
并与
(1)的结果进行比较
【实验步骤】
(此部分主要包括实验过程、方法、结果、对结果的分析、结论等)
1
1)
相关矩阵
V2
V3
V4
V5
V6
V7
V8
V9
相关
1.000
.334
-.055
-.061
-.289
.199
.349
.319
-.023
.399
-.156
.711
.414
.835
.533
.497
.033
-.139
-.258
.698
.468
-.171
.313
.280
-.208
-.081
.417
.702
2)
表:
方差贡献率和累计贡献率
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
3.096
38.704
3.079
38.485
2
2.367
29.590
68.294
2.385
29.809
3
.920
11.500
79.794
4
.706
8.824
88.618
5
.498
6.231
94.848
6
.230
2.874
97.722
7
.131
1.635
99.357
8
.051
.643
100.000
提取方法:
主成份分析。
由上图可知,只有前两个成分的特征值大于1,所以只选择前两个主成分。
第一个主成分的方差贡献率是38.704%,第二个主成分的方差贡献率是29.590%,前两个主成分的方差占所有主成分方差的64.294%。
前两个主成分的累计贡献率为68.294%,选择前两个主成分即可代表绝大多数原来的变量。
最终聚类中心
聚类
8.79
8.48
10.38
47.05
31.14
70.37
8.82
7.07
6.76
12.80
9.14
16.73
16.96
16.31
17.29
10.21
18.56
1.88
1.78
3.09
13.63
11.51
24.20
2
每个聚类中的案例数
10.000
18.000
2.000
有效
30.000
缺失
.000
由上图可知,聚类2包含样本数最多,聚类3包含样本数最少。
通过K中心聚类分析,可以对我国各地区生活中的人均支出类别情况有一个基本的了解。
我们可以将不同地区的人均消费情况分为3类;
其中第二类包含的省市最多,有18个,其他两类包含城市较少。
通过分析结果也可知每个地区所属类别。
(2)
按最短距离法(最近邻居距离)对样本进行谱系聚类分析
聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
3.299
15
4.854
4.910
9
6.314
12
13
10.409
10
10.539
11.730
12.469
14
11
15.194
17.539
16
18.698
18
19.264
20.778
22.778
25.407
17
27.956
19
24
25
33.748
37.414
20
37.945
38.070
23
21
22
39.765
47.432
52.468
26
64.048
82.053
27
82.066
28
259.409
29
300.223
30
396.775
由聚类表可知聚类的具体过程。
以第一步为例,样品1和2合并为一类,距离系数为3.299,在“首次出现阶段集群”里显示为0,因此合并两项都是第一次出现,合并结果取15,即归为第15类。
群集成员
案例
3群集
1:
山西
2:
内蒙古
3:
吉林
4:
黑龙江
5:
河南
6:
甘肃
7:
青海
8:
河北
9:
陕西
10:
宁夏
11:
新疆
12:
湖北
13:
云南
14:
湖南
15:
安徽
16:
贵州
17:
辽宁
18:
四川
19:
山东
20:
江西
21:
福建
22:
广西
23:
海南
24:
天津
25:
江苏
26:
浙江
27:
北京
28:
西藏
29:
上海
30:
广东
集群成员表如图,当划分为3个类别时,各个地区所属类别。
与上一问所得结论有较大出入。
上图直观的反应了样品逐步合并的过程。
最长距离法(最远邻居距离)
12.276
15.294
17.559
27.077
28.855
40.887
49.520
67.778
68.931
86.817
102.216
160.503
219.108
333.013
459.195
821.706
846.540
3198.129
类平均距离法(组间平均距离)
8.593
13.512
17.549
21.704
24.981
32.350
32.651
40.437
47.824
68.645
74.041
74.824
110.184
126.926
134.045
197.455
453.036
489.847
1591.227
重心距离法
7.379
11.933
14.947
15.250
23.080
19.932
27.520
32.272
53.945
64.883
65.605
91.421
94.200
106.723
141.246
346.674
375.156
1368.518
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 聚类分析 DOC