聚类分析的SPSS应用Word格式文档下载.docx
- 文档编号:14944138
- 上传时间:2022-10-26
- 格式:DOCX
- 页数:17
- 大小:429.09KB
聚类分析的SPSS应用Word格式文档下载.docx
《聚类分析的SPSS应用Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《聚类分析的SPSS应用Word格式文档下载.docx(17页珍藏版)》请在冰豆网上搜索。
11171514
329640
1581
16770
3275.20
2
天津
41163
4170479
1820.50
1075
10564
1356.80
X
河北
16962
6205340
5470.20
6898
4945
3397.40
1—
山西
14123
5833752
2256.70
3375
4843
1613.40
5
內蒙古
20053
3433774
3363.20
2397
5800
1595.30
6
辽宁
21788
8176718
568960
4271
6926
343460
7
吉林
15720
2452M5
259430
2723
5710
1675.80
8
里龙江
16195
3868440
2236.00
3823
5141
1997.70
9
上海
57695
15760742
3900.00
1815
209444
3360.40
10
江苏
28814
16566820
10069.20
7550
9302
6623.20
11
浙江
31874
12982044
7590.20
4980
11161
5325.30
12
10055
4280265
353360
6110
4441
202940
13
21471
5411707
293180
3558
7326
270420
_14
江西
10798
3055214
268360
4339
4173
142800
15
山东
23794
13652526
11111.40
9309
7026
7122.50
16
河甫
13313
6791715
5904.70
9392
4632
3880.50
17
湖北
13296
4760823
3343.60
5693
5533
3412.00
18
11950
4779247
3175.70
6342
5498
2834.20
19
广东
28332
21794608
797340
9304
10829
911810
20
广西
10296
3425788
219870
4719
4330
1600800
21
海南
12654
818139
43290
836
4736
308.30
重庆
12457
3177166
2407.40
2808
5417
1403.60
_23
四川
10645
6075850
4412.90
8159
4501
3421.60
24
贯州
5787
2268157
1197.40
3757
3499
689.80
■■■IMi
■■■■CMB
222222
图4
可见,变量视图中设置的变量均列入数据视图中頂栏。
(注:
图4已经录入数据)以上是SPSS录入数据的基本操作,数据录入完成后开始两种聚类分析设宜和得岀结果。
二.系统聚类分析和K均值聚类分析
1•系统聚类分析
(1)在数据视图点击分析(Analyze)■-分类(Classify)--系统聚类(HirarchicalCluster)>
如下图5:
111
41
62(
58:
34:
81
描述统计
表(T)
比较均值辿1)
—股线性模型(G〉广兴线性模型
混合模型0)
相关©
回归迟)
对数线性模型(9>
款人□万居民消费水平社会消费品寒人元每人售总颔亿元
夂.
581
075
10664
;
898
375
!
397
■271
3434.60
C71Q
分类(日
窗酉步聚类(I)...
厨系统聚発(旦)…
157
165
129
42(
54
30!
136
67!
度量⑶
非参数檢验迥)预测①生存函数◎)
參重响应(U)
冏酸失值分析Q)…
參重归因Q)
也耐(旦)…
S判别©
)•••□最近邻元索迥)…
3360.40
5.30为2940?
704.201428.00
1309
7025
1392
3^毀|
图5进入如下图6界面:
回到我们的出发点,我们希望通过六项指标对全国冬省进行分类,那么分析的变量是这六项指标,分类标准是不同省份,即地区。
于是这两大类变量要进行不同归类,进行如下图7设置即可,把用于聚类的变量选入变量框(variables),把区分样本的标签变量(本例即为“地
图7
(2)接下来在分群(cluster)栏中选择聚类类型:
要进行R型聚类(变疑聚类)分析,应
指定“变量(variables)"
;
要进行Q型聚类(样品聚类),则指定“个案(case)”。
系统默认Q型聚类。
我们要将全国不同省份进行分类,很明显不同省份是不同的样品,对这些样品进行分类即样品聚类,所以进行Q型聚类,默认即可。
输出栏输出我们需要的项目,这里统汁疑和图都选择。
设置好后如下图&
图8
(3)单击"
方法(method)”按钮,展开系统聚类分析的方法选择对话框,即"
hierarchicalclusteranalysis:
method
度量标准(ClustermethodO下拉框中给出了可以选择的计算类间距离的方法,系统默认是组间均链锁法(between-groupslinkage)'
本例选择ward'
smethod;
度屋标准(measure)框中给出的是IT算样nil间距的方法,本例使用平方euclidean距离(squaredeuclideandistance),SPSS默认汁算欧氏距离平方。
在转换值(transformvalues)的标准化(standardize)框中选择是否对原始数据进行标准化处理,本例选择Zscores。
点击继续(continue)回到主对话框。
类间距离和样品间距的选择在这里没有赘述,详见我们组讲课内容)设置好后如下图9:
图9
(4)SPSS系统聚类分析默认输岀的分析结果有凝聚状态表(agglomerationschedule)和冰柱图(icicle)o
点击统计量(statistics)选中合并进程表(agglomerationschedule)o选择方案范围,最大聚类数设为4,最小聚类数设为2,点击继续(continue)回到主对话框,此时分析结果中就包含了凝聚状态表,如下图10:
图10
点击绘制树状图,冰柱图里选择所有聚类和方向垂直。
点击继续回到主对话框。
如下图11:
图11
(5)回到主对话框点击确立(0K),得到所有的分类结果。
结果以文档的形式导出,包括冰柱图.树状图,距离表。
2.K均值聚类分析
依然取上一个例子作为分类样本说明这个方法。
首先,如果原始变量取值差异较大,应先将原始数据进行标准化,以避免变量值差异较大对分类结果产生影响。
从下图12统讣表中我们可以看出各省六项指标数量级有较大差异,所以有必要进行标准化处理。
N
极小值
极犬值
均值
标准差
人均GDP元
30
18984.57
12351.335
财政收入万元
145607
5977535.70
5346237.923
固定资产投滾忆元
231.10
3526.3667
2747.59700
年齐总人□万人
281
4164.93
2729.834
居民消费水平元每人
2915
12909.67
37236.570
社会消费品零售总额亿元有效的N(列表袄态)
89.70
16008.00
3048.3733
3262.17745
图12
过程如卜:
选择分析(analyze)…描述统讣(descriptivesstatistics)■-描述(descriptives)进入主对话框,将需要标准化的变虽:
选入“变量(variables)"
框,然后勾选“将标准化得分另存为变量(savestandardizedvaluesasvariables)v点击确定(OK),标准化后的数
拯将岀现在原始数据表中。
以上步骤见一下图13:
)转换
分祈(A)
Statis-tics辑器
销(世)图形◎实用程序也)窗口世)m
表仃)
TI
K1描述6.
护元
财政U
比较均億廻)一股线性棋型@)广义线性模型混合棋型0)相笑©
社会注售总旱
)7
►
罔交叉表©
・・・
327
)3
41'
卜
E比率(B)...
135
>
?
3
62
@P-P图…
339
161
00(R)
W\Q-Q囹…
53
169
对数线性楔型
(2)神经网络
分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 SPSS 应用
![提示](https://static.bdocx.com/images/bang_tan.gif)