spss数据分析作业-中国区域经济类型的聚类和判别分析Word下载.docx
- 文档编号:15495339
- 上传时间:2022-11-02
- 格式:DOCX
- 页数:19
- 大小:166.21KB
spss数据分析作业-中国区域经济类型的聚类和判别分析Word下载.docx
《spss数据分析作业-中国区域经济类型的聚类和判别分析Word下载.docx》由会员分享,可在线阅读,更多相关《spss数据分析作业-中国区域经济类型的聚类和判别分析Word下载.docx(19页珍藏版)》请在冰豆网上搜索。
上述数据来源于《中国统计年鉴2014》,如表2.1所示。
选取33个省市作为聚类的变量。
表2.1数据收集
地区
国内生产总值(亿元)
总人口(万人)
在岗职工平均工资(元)
社会商品零售总额(亿元)
货物进出口总额(百万美元)
北京
21330.83
1333.4
103400
9638
415538.1
天津
15726.93
1016.66
73839
4738.7
160846.6
太原
2531.09
369.74
57771
1450.2
10671.05
呼和浩特
2894.05
237.88
50469
1256.1
2195
沈阳
7098.71
730.84
56590
3570.1
15800.29
长春
5342.43
754.55
56977
2217.5
20728.75
哈尔滨
5340.07
987.29
51554
3070.9
6807.96
上海
23567.7
1438.69
100623
9303.5
466622.3
南京
8820.75
648.72
77286
4167.2
57220.77
杭州
9206.16
715.76
70823
4201.5
67997.75
宁波
7610.28
583.78
70228
2992
104704.1
合肥
5157.97
712.81
59648
1666.8
20087
福州
5169.16
674.94
58838
3062.9
34663.17
厦门
3273.58
203.44
63062
1072.3
83553.11
南昌
3667.96
517.73
51848
1304.9
12226.43
济南
5770.6
621.61
62323
3087.6
10500.14
青岛
8692.1
780.64
62097
3361.7
79888.33
郑州
6776.99
937.8
49756
2913.6
46430.9
武汉
10069.48
827.31
60624
4369.3
26428.87
长沙
7824.81
671.41
61847
3162.1
12561.3
广州
16706.87
842.42
74246
7144.5
130589.8
深圳
16001.82
332.21
73492
4844
487765
南宁
3148.3
729.66
54330
1616.9
4814.1
海口
1091.7
165.31
50653
541.3
3400.9
重庆
14262.6
3375.2
56852
5710.7
95450.24
成都
10056.59
1210.74
63201
4468.9
55844.39
昆明
3712.99
550.5
58153
1905.9
29394.32
拉萨
347.45
52.73
72468
180.3
2076.29
西安
5492.64
815.29
54098
3093.9
24982.97
兰州
2000.94
374.67
54008
944.9
4556.49
西宁
1065.78
202.64
54914
414.1
1596.74
银川
1388.62
196
59080
382.5
4500
乌鲁木齐
2461.47
266.91
61617
1070
8284.58
表2.1数据收集这个数据我也没有哇,只有上面那个数据,没用的话删除了吧
省份
社会消费品零售总额(亿元)
货物进出口总额(亿元)
平均工资(元)
人均可支配收入(元)
居民消费水平(元)
北京
8375.1
42899581
93006
40321.0
33337
天津
4470.4
12850179
67773
32293.6
26261
河北
10516.7
5491157
41501
22580.3
11557
山西
5139.3
1579098
46407
22455.6
12078
内蒙古
5114.2
1199457
50723
25496.7
17168
辽宁
10581.4
11447819
45505
25578.2
20156
吉林
5426.4
2583174
42846
22274.6
13676
黑龙江
6251.2
3887909
40794
19597.0
12978
上海
8052.0
44126822
90908
43851.4
39223
江苏
20796.5
55080227
57177
32537.5
23585
浙江
15225.5
33578871
56571
37850.8
24771
安徽
6542.4
4551897
47806
23114.2
11618
福建
8275.3
16932090
48538
30816.4
17115
江西
4576.1
3674663
42473
21872.7
11910
山东
22294.8
26653153
46998
28264.1
16728
河南
12426.6
5995687
38301
22398.0
11782
湖北
10885.9
3638008
43899
22906.4
13912
湖南
9018.6
2517531
42726
23414.0
12920
广东
25453.9
109158144
53318
33090.0
23739
广西
5133.1
3282750
41391
23305.4
11710
海南
992.9
1498543
44971
22928.9
11712
重庆
4599.8
6869216
50006
25216.1
15270
四川
10561.4
6457466
47965
22367.6
12485
贵州
2366.2
829010
47364
20667.1
9541
云南
4004.6
2530356
42447
23235.5
11224
西藏
293.2
331941
57773
20023.4
6275
陕西
4999.5
2012806
47446
22858.4
13206
甘肃
2173.8
1023611
42833
18964.8
9616
青海
544.1
140274
51393
19498.5
12070
宁夏
610.5
321769
50476
21833.3
13537
新疆
2108.2
2756139
49064
19873.8
11401
3聚类分析
3
3.1聚类分析概述
聚类分析的基本思想认为所研究的样品或指标之间存在着程度不同的相似性,于是根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。
研究怎样对事物进行合理分类(归类)的统计方法称为聚类分析。
依据分类对象的不同可以把聚类分析再分成Q型聚类和R型聚类,Q型聚类是指对样品进行聚类,R型聚类是指对变量进行聚类。
聚类分析的基本原理是把某种性质相似的对象归于同一类,而不同类的之间则存在较大差异。
为此,首先要能刻画各个变量之间或者各个样本点之间的相似性。
Q聚类一般使用“距离”度量样本点之间的相似性,定义样本点之间的距离可以采用欧氏距离、明考夫斯基距离、马氏距离、兰氏距离等测度。
R聚类则使用“相似系数”作为变量相似性的度量。
定义各变量之间
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 数据 分析 作业 中国 区域经济 类型 判别分析