SPSS软件聚类分析过程图文解释与结果全面分析文档格式.docx
- 文档编号:16011720
- 上传时间:2022-11-17
- 格式:DOCX
- 页数:11
- 大小:518.35KB
SPSS软件聚类分析过程图文解释与结果全面分析文档格式.docx
《SPSS软件聚类分析过程图文解释与结果全面分析文档格式.docx》由会员分享,可在线阅读,更多相关《SPSS软件聚类分析过程图文解释与结果全面分析文档格式.docx(11页珍藏版)》请在冰豆网上搜索。
标准化方法解释:
None:
不进行标准化,这是系统默认值;
ZScores(Z-Scores,英文名又叫StandardizedPopulationData,是以标准差单位来表现的一组观察值):
标准化变换;
Range–1to1:
极差标准化变换(作用:
变换后的数据均值为0,极差为1,且|xij*|<
1,消去了量纲的影响;
在以后的分析计算中可以减少误差的产生。
);
Range0to1(极差正规化变换/规格化变换);
2.构造关系矩阵
在SPSS中如何选择测度(相似性统计量):
→Analyze→Classify→HierachicalClusterAnalysis→Method然后从对话框中进行如下选择
常用测度(选项说明):
Euclideandistance:
欧氏距离(二阶Minkowski距离),用途:
聚类分析中用得最广泛的距离;
SquaredEucideandistance:
平方欧氏距离;
Cosine:
夹角余弦(相似性测度;
Pearsoncorrelation:
皮尔逊相关系数;
3.选择聚类方法
SPSS中如何选择系统聚类法
常用系统聚类方法
a)Between-groupslinkage组间平均距离连接法
方法简述:
合并两类的结果使所有的两两项对之间的平均距离最小。
(项对的两成员分属不同类)特点:
非最大距离,也非最小距离
b)Within-groupslinkage组内平均连接法
两类合并为一类后,合并后的类中所有项之间的平均距离最小
C)Nearestneighbor最近邻法(最短距离法)
用两类之间最远点的距离代表两类之间的距离,也称之为完全连接法
d)Furthestneighbor最远邻法(最长距离法)
e)Centroidclustering重心聚类法
两类间的距离定义为两类重心之间的距离,对样品分类而言,每一类中心就是属于该类样品的均值
特点:
该距离随聚类地进行不断缩小。
该法的谱系树状图很难跟踪,且符号改变频繁,计算较烦。
f)Medianclustering中位数法
两类间的距离既不采用两类间的最近距离,也不采用最远距离,而采用介于两者间的距离
图形将出现递转,谱系树状图很难跟踪,因而这个方法几乎不被人们采用。
g)Ward’smethod离差平方和法
基于方差分析思想,如果分类合理,则同类样品间离差平方和应当较小,类与类间离差平方和应当较大
实际应用中分类效果较好,应用较广;
要求样品间的距离必须是欧氏距离。
谱系分类的确定
经过系统聚类法处理后,得到聚类树状谱系图,Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法,并提出了一些根据谱系图来分类的准则:
A.任何类都必须在临近各类中是突出的,即各类重心间距离必须极大
B.确定的类中,各类所包含的元素都不要过分地多
C.分类的数目必须符合实用目的
D.若采用几种不同的聚类方法处理,则在各自的聚类图中应发现相同的类
实例分析
SPSS19.0分析软件聚类分析
4.2聚类分析——系统聚类法
在数据编辑窗口的主菜单中选择“分析(A)”→“分类(F)”→“系统聚类(H)”(如图-4所示),
弹出“系统聚类分析”对话框,将“地区”变量选入“标注个案(C)”中,将其他变量选入“变量框”中,如图-5所示。
在“分群”单选框中选中“个案”,表示进行的是Q型聚类。
在“输出”复选框中选中“统计量”和“图”,表示要输出的结果包含以上两项。
单击“统计量(S)”按钮,在“系统聚类分析:
统计量”对话框中选择“合并进程表”、“相似性矩阵”,如图-6所示,表示输出结果将包括这两项内容。
单击“绘制(T)”按钮,在“系统聚类分析:
图”对话框中选择“树状图”、“冰柱”,如图-7所示,表示输出的结果将包括谱系聚类图(树状)以及冰柱图(垂直)。
单击“方法(M)”按钮,弹出“系统聚类分析:
方法”对话框,如下图-8所示。
“聚类方法(M)”选项条中可选项包括如图-9所示的几种方法,本例中选择“组间联接”:
“度量标准-区间(N)”选项条中可选项包括如图-10所示的几种度量方法,本例中选择“平方Euclidean距离”:
“转换值-标准化(S)”选项条中可选项包括如图-11所示的几种将原始数据标准化的方法,本例中选择“全局从0到1”:
冰柱图解释
聚类分析冰柱图形状类似于屋檐上垂下的冰柱,因此而得名。
横轴:
案例(Case)表示被聚类的对象或变量;
纵轴:
群集数(Numberofclusters)表示被聚成几类;
观察冰柱图应从最后一行开始。
举例如下:
当聚成6类时X4和X8和X6聚成一类,其他个案自成一类,用白板将6类一下挡上可以看出如图;
当聚成5类时X4和X8和X6和X2聚成一类,其他个案自成一类。
冰柱图的优点是不仅可以显示出不同类数时个案所属的分类结果,还能表现出聚类的过程步骤,生动形象;
缺点是不能表现出聚类过程中距离的大小。
若生成的树状图如下,看不清楚。
可点击右键导出文件,生成word文件,然后可以看出聚类过程。
导出的word文档中聚类过程如下:
可看出聚类过程为如下表所示:
分类过程统计表
连结顺序
连结元素
1
B
C
2
A
BC
3
E
F
4
EF
ABC
5
D
ABCEF
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 软件 聚类分析 过程 图文 解释 结果 全面 分析