华东理工大学应用统计学SPSS 实验报告五.docx
- 文档编号:30661441
- 上传时间:2023-08-19
- 格式:DOCX
- 页数:18
- 大小:27.53KB
华东理工大学应用统计学SPSS 实验报告五.docx
《华东理工大学应用统计学SPSS 实验报告五.docx》由会员分享,可在线阅读,更多相关《华东理工大学应用统计学SPSS 实验报告五.docx(18页珍藏版)》请在冰豆网上搜索。
华东理工大学应用统计学SPSS实验报告五
华东理工大学2009—20010学年第一学期
《应用统计学》实验报告5
班级学号姓名
开课学院商学院任课教师成绩
⏹实验内容:
实验5
5.1熟悉SPSS中聚类分析的距离选择功能
5.2熟悉SPSS中聚类分析的系统聚类功能
实验要求:
5.1选用例题6.2文件中的变量,完成系统聚类法的各种结果的比较分析
5.2对案例:
Crop’Pain连锁店,展开聚类分析讨论
教师评语:
教师签名:
年月日
实验报告:
5.1
点击Analyze-Classify-HierarchicalCluster,选用欧氏距离Euclideandistance---dij
(2)。
在Method中选择Euclideandistance---dij
(2)。
在plots里面点击dendrogram聚类图。
点击OK按妞。
Output中出现如下几张表
表一
CaseProcessingSummary(a,b)
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
21
100.0
0
.0
21
100.0
aEuclideanDistanceused
bSingleLinkage
分析:
表一中,cases表明实验是对样品进行分类的。
Valid下面的数据21表明有效数据共21组,占总数据的百分比为100%,而陪排除的无效数据(missing)为0,百分比为0%。
总数据为21组。
表二
AgglomerationSchedule
Stage
ClusterCombined
Coefficients
StageClusterFirstAppears
NextStage
Cluster1
Cluster2
Cluster1
Cluster2
1
17
19
1.000
0
0
2
2
17
18
1.000
1
0
8
3
12
13
1.000
0
0
10
4
8
9
1.000
0
0
5
5
7
8
1.000
0
4
11
6
5
6
1.000
0
0
14
7
1
2
1.000
0
0
16
8
17
20
1.414
2
0
12
9
11
15
1.414
0
0
10
10
11
12
1.414
9
3
13
11
7
10
1.414
5
0
20
12
17
21
2.000
8
0
17
13
11
14
2.000
10
0
19
14
4
5
2.000
0
6
15
15
3
4
2.000
0
14
16
16
1
3
2.000
7
15
18
17
16
17
2.236
0
12
18
18
1
16
2.236
16
17
19
19
1
11
2.236
18
13
20
20
1
7
2.236
19
11
0
分析:
表二中,coefficients下对应的数字为分类的系数,Nextstage表明被聚合成一类的数据,其下一步将会参与到哪个阶段的聚类当中,比如说Stage2所对应的nextstage为stage8,表明stage2中的数据或者数据会参与到第8阶段的聚合中,而由stage8可知,数据17缺确实与数据20进行了聚类。
表三
VerticalIcicle
Numberofclusters
Case
10
9
8
7
14
13
12
15
11
21
20
18
19
17
16
6
5
4
3
2
1
1
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
2
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
3
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
4
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
5
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
6
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
7
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
8
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
9
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
10
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
11
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
12
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
13
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
14
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
15
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
16
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
17
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
18
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
19
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
20
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
分析:
上表是表二的另一种表示,“X”型下面所对应的长度越长,表明数据越早被聚类。
表四
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingSingleLinkage
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
17
19
18
20
21
16
1
2
5
6
4
3
12
13
11
15
14
8
9
7
10
分析:
上图是本次实验的聚类图,用很简明直观的方法显示出了整个聚类的阶段过程,一目了然。
图中附带了刻度,也就是说越是靠前,刻度值越小的聚类,越先发生。
比如上图中,最先聚合的,就是以1为标准来进行分类的数据有17,18,19组,1、2组,5、6组等。
Method中还有Block---dij
(1),Euclideandistance---dij
(2),SquaredEuclideandistance,Chebychev---dij(∞),Minkowski---dij(q),Cosine---cij
(1),Pearsoncorrelation---cij
(2)等方法。
其所产生的图的类别虽然相同,但是由于计算点点之间的距离的方法不一样,因此所分类的阶段和先后顺序有差别。
不过,在本例中,采用闵氏距离和采用欧氏距离所得到的聚类是一样的。
5.2(对指标进行分类)
最短距离法:
对Crop’Pain连锁店除“餐管”以外的16个指标进行分类。
用最短距离法进行分类的时候,其步骤为点击Analyze-Classify-HierarchicalCluster-,在变量中,将16个指标全部选到里面,在cluster里面选择variables,也就是对指标进行分类,在plots里面选择dentrogram,在method中的measure距离测量方法中选择Pearson相关系数,在分类方法中选择nearestneighbor最短距离法进行分类。
点击ok按钮,出现如下几个图表:
表一CaseProcessingSummary(a)
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
60
100.0%
0
.0%
60
100.0%
aCorrelationbetweenVectorsofValuesused
分析:
表一中Valid下面N为60,表明有效样本有60个,missing下面为0表明没有无效样本,Total下面的N为60表明该实验共有60个样本。
Percent表明各类样本数占样本总数的百分比。
表二AgglomerationSchedule
Stage
ClusterCombined
Coefficients
StageClusterFirstAppears
NextStage
Cluster1
Cluster2
Cluster1
Cluster2
1
5
7
.982
0
0
2
2
5
8
.969
1
0
3
3
5
10
.962
2
0
5
4
1
2
.814
0
0
7
5
5
9
.773
3
0
6
6
3
5
.642
0
5
8
7
1
15
.597
4
0
10
8
3
6
.578
6
0
9
9
3
11
.465
8
0
10
10
1
3
.437
7
9
11
11
1
14
.338
10
0
12
12
1
16
.258
11
0
13
13
1
13
.171
12
0
14
14
1
12
.154
13
0
15
15
1
4
.139
14
0
0
分析:
表二中,coinfidents为二类间的相关系数,相关系数越大,表明两类间的距离越小。
分类是按照相关系数由大到小来进行的。
Clustercombined下面的2类分别是在各阶段被合并在一起的类。
Stageclusterfirstappears表是各阶段的分类对象在之前是在哪个阶段被分类的,nextstage表明各阶段分类后的一类,在下一次的哪个阶段会参与到分类当中。
表三VerticalIcicle
Numberofclusters
Case
雇员人数
餐馆数
非竞争餐
生活指数
非餐饮企
平均收入
P25
P55
TOTAL
P45
P35
P15
毛利
月租金
投资
店堂面积
1
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
2
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
3
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
4
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
5
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
6
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
7
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
8
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
9
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
10
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
11
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
12
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
13
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
14
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
15
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
分析:
表三中,各指标之间对应的“X”越多,表明其越早被聚类。
比如p15和p35之间的“X”是满格的,是在第一阶段被聚类的。
P45和p35的“X”差一个满格,则是第二阶段被聚类的,等等。
表四_
******HIERARCHICALCLUSTERANALYSIS******
DendrogramusingSingleLinkage
RescaledDistanceClusterCombine
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
P155
P357
P458
TOTAL10
P559
毛利3
P256
平均收入11
店堂面积1
投资2
月租金15
非餐饮企14
生活指数16
非竞争餐13
餐馆数12
雇员人数4
分析:
表四是聚类图,形象地表明了分类阶段的分布,比如说,相似系数最高的5,7,8,10四个指标在前3个阶段被分在了一类。
其次是指标1和2,再次是指标5和9(因此9和5,7,8,10被分在了一类)
最长距离法:
CaseProcessingSummary(a)
最长距离法
对Crop’Pain连锁店除“餐管”以外的16个指标进行分类。
用最短距离法进行分类的时候,其步骤为点击Analyze-Classif
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 华东理工大学应用统计学SPSS 实验报告五 华东理工大学 应用 统计学 SPSS 实验 报告