多元统计分析作业1.docx
- 文档编号:6957306
- 上传时间:2023-01-13
- 格式:DOCX
- 页数:22
- 大小:69.63KB
多元统计分析作业1.docx
《多元统计分析作业1.docx》由会员分享,可在线阅读,更多相关《多元统计分析作业1.docx(22页珍藏版)》请在冰豆网上搜索。
多元统计分析作业1
一、聚类分析
为了研究2010年全国各地区城镇居民家庭平均每人全年消费性支出的分布规律,根据抽样调查资料进行分类处理,共抽取31个省、市、自治区的样本,每个样本有7个指标:
食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信、教育文化娱乐服务。
这7个指标反映了平均每人生活消费的支出情况,其数据资料见下表1所示。
表1
各地区城镇居民家庭平均每人全年消费性支出(2010年)
单位:
元
地区
食品
衣着
居住
家庭设备用品及服务
医疗保健
交通和通信
教育文化娱乐服务
北京
6392.90
2087.91
1577.35
1377.77
1327.22
3420.91
2901.93
天津
5940.44
1567.58
1615.57
1119.93
1275.64
2454.38
1899.50
河北
3335.23
1225.94
1344.47
693.56
923.83
1398.35
1001.01
山西
3052.57
1205.89
1245.00
612.59
774.89
1340.90
1229.68
内蒙古
4211.48
2203.59
1384.45
948.87
1126.03
1768.65
1641.17
辽宁
4658.00
1586.81
1314.79
785.67
1079.81
1773.26
1495.90
吉林
3767.85
1570.68
1344.41
710.28
1171.25
1363.91
1244.56
黑龙江
3784.72
1608.37
1128.14
618.76
948.44
1191.31
1001.48
上海
7776.98
1794.06
2166.22
1800.19
1005.54
4076.46
3363.25
江苏
5243.14
1465.54
1234.05
1026.32
805.73
1935.07
2133.25
浙江
6118.46
1802.29
1418.00
916.16
1033.70
3437.15
2586.09
安徽
4369.63
1225.56
1229.64
678.75
737.05
1356.57
1479.75
福建
5790.72
1281.25
1606.27
972.24
617.36
2196.88
1786.00
江西
4195.38
1138.84
1109.82
854.60
524.22
1270.28
1179.89
山东
4205.88
1745.20
1408.64
915.00
885.79
2140.42
1401.77
河南
3575.75
1444.63
1080.10
866.72
941.32
1374.76
1137.16
湖北
4429.30
1415.68
1187.54
867.33
709.58
1205.48
1263.16
湖南
4322.09
1277.47
1182.33
903.81
776.85
1541.40
1418.85
广东
6746.62
1230.72
1925.21
1208.03
929.50
3419.74
2375.96
广西
4372.75
926.42
1166.85
853.59
625.45
1973.04
1243.71
海南
4895.96
636.14
1103.76
616.33
579.89
1805.11
1004.62
重庆
5012.56
1697.55
1275.96
1072.38
1021.48
1384.28
1408.02
四川
4779.60
1259.49
1126.65
876.34
661.03
1674.14
1224.73
贵州
4013.67
1102.41
890.75
673.33
546.84
1270.49
1254.56
云南
4593.49
1158.82
835.45
509.41
637.89
2039.67
1014.40
西藏
4847.58
1158.60
726.59
376.43
385.63
1230.94
477.95
陕西
4381.40
1428.20
1126.92
723.73
935.38
1194.77
1595.80
甘肃
3702.18
1255.69
910.34
597.72
828.57
1076.63
1136.70
青海
3784.81
1185.56
923.52
644.01
718.78
1116.56
908.07
宁夏
3768.09
1417.47
1181.71
716.22
890.05
1574.57
1286.20
新疆
3694.81
1513.42
898.38
669.87
708.16
1255.87
1012.37
定义变量及标签:
设:
X1:
地区
X2:
食品支出
X3:
衣着支出
X4:
居住支出
X5:
家庭设备用品及服务支出
X6:
医疗保健支出
X7:
交通和通信支出
X8:
教育文化娱乐服务支出
通过SPSS软件操作,得到如下输出结果见表2—表5所示。
表2
X1
X2
X3
X4
X5
X6
X7
X8
CLU3_1
北京
6392.90
2087.91
1577.35
1377.77
1327.22
3420.91
2901.93
1
天津
5940.44
1567.58
1615.57
1119.93
1275.64
2454.38
1899.50
1
河北
3335.23
1225.94
1344.47
693.56
923.83
1398.35
1001.01
2
山西
3052.57
1205.89
1245.00
612.59
774.89
1340.90
1229.68
2
内蒙古
4211.48
2203.59
1384.45
948.87
1126.03
1768.65
1641.17
3
辽宁
4658.00
1586.81
1314.79
785.67
1079.81
1773.26
1495.90
3
吉林
3767.85
1570.68
1344.41
710.28
1171.25
1363.91
1244.56
3
黑龙江
3784.72
1608.37
1128.14
618.76
948.44
1191.31
1001.48
2
上海
7776.98
1794.06
2166.22
1800.19
1005.54
4076.46
3363.25
1
江苏
5243.14
1465.54
1234.05
1026.32
805.73
1935.07
2133.25
3
浙江
6118.46
1802.29
1418.00
916.16
1033.70
3437.15
2586.09
1
安徽
4369.63
1225.56
1229.64
678.75
737.05
1356.57
1479.75
2
福建
5790.72
1281.25
1606.27
972.24
617.36
2196.88
1786.00
3
江西
4195.38
1138.84
1109.82
854.60
524.22
1270.28
1179.89
2
山东
4205.88
1745.20
1408.64
915.00
885.79
2140.42
1401.77
3
河南
3575.75
1444.63
1080.10
866.72
941.32
1374.76
1137.16
2
湖北
4429.30
1415.68
1187.54
867.33
709.58
1205.48
1263.16
2
湖南
4322.09
1277.47
1182.33
903.81
776.85
1541.40
1418.85
2
广东
6746.62
1230.72
1925.21
1208.03
929.50
3419.74
2375.96
1
广西
4372.75
926.42
1166.85
853.59
625.45
1973.04
1243.71
2
海南
4895.96
636.14
1103.76
616.33
579.89
1805.11
1004.62
2
重庆
5012.56
1697.55
1275.96
1072.38
1021.48
1384.28
1408.02
3
四川
4779.60
1259.49
1126.65
876.34
661.03
1674.14
1224.73
2
贵州
4013.67
1102.41
890.75
673.33
546.84
1270.49
1254.56
2
云南
4593.49
1158.82
835.45
509.41
637.89
2039.67
1014.40
2
西藏
4847.58
1158.60
726.59
376.43
385.63
1230.94
477.95
2
陕西
4381.40
1428.20
1126.92
723.73
935.38
1194.77
1595.80
2
甘肃
3702.18
1255.69
910.34
597.72
828.57
1076.63
1136.70
2
青海
3784.81
1185.56
923.52
644.01
718.78
1116.56
908.07
2
宁夏
3768.09
1417.47
1181.71
716.22
890.05
1574.57
1286.20
2
新疆
3694.81
1513.42
898.38
669.87
708.16
1255.87
1012.37
2
表3
CaseProcessingSummarya
Cases
Valid
Missing
Total
N
Percent
N
Percent
N
Percent
31
37.8%
51
62.2%
82
100.0%
a.SquaredEuclideanDistanceUndefinederror#14704-Cannotopentex
表4
AgglomerationSchedule
Stage
ClusterCombined
Coefficients
StageClusterFirstAppears
NextStage
Cluster1
Cluster2
Cluster1
Cluster2
1
28
29
.230
0
0
9
2
17
18
.504
0
0
4
3
16
30
.814
0
0
8
4
17
23
1.192
2
0
7
5
3
4
1.614
0
0
18
6
14
24
2.119
0
0
17
7
12
17
2.719
0
4
17
8
8
16
3.367
0
3
11
9
28
31
4.025
1
0
21
10
6
7
4.713
0
0
16
11
8
27
5.482
8
0
18
12
20
21
6.515
0
0
23
13
15
22
7.711
0
0
16
14
10
13
9.325
0
0
26
15
25
26
11.067
0
0
25
16
6
15
12.840
10
13
19
17
12
14
14.962
7
6
23
18
3
8
17.093
5
11
21
19
5
6
19.826
0
16
26
20
2
11
22.564
0
0
22
21
3
28
25.593
18
9
27
22
1
2
29.260
0
20
24
23
12
20
33.301
17
12
25
24
1
19
38.600
22
0
28
25
12
25
44.992
23
15
27
26
5
10
53.708
19
14
29
27
3
12
64.663
21
25
29
28
1
9
76.179
24
0
30
29
3
5
102.834
27
26
30
30
1
3
210.000
28
29
0
表4给出了聚类的凝聚过程情况。
表5ClusterMembership
Case
3Clusters
Case
3Clusters
1:
北京
1
17:
湖北
2
2:
天津
1
18:
湖南
2
3:
河北
2
19:
广东
1
4:
山西
2
20:
广西
2
5:
内蒙古
3
21:
海南
2
6:
辽宁
3
22:
重庆
3
7:
吉林
3
23:
四川
2
8:
黑龙江
2
24:
贵州
2
9:
上海
1
25:
云南
2
10:
江苏
3
26:
西藏
2
11:
浙江
1
27:
陕西
2
12:
安徽
2
28:
甘肃
2
13:
福建
3
29:
青海
2
14:
江西
2
30:
宁夏
2
15:
山东
3
31:
新疆
2
16:
河南
2
表5给出了样品聚为三类时的样品归类情况。
CASE0510152025
LabelNum+---------+---------+---------+---------+---------+
甘肃28-+
青海29-+
新疆31-+
河北3-+---+
山西4-+|
河南16-+|
宁夏30-+|
黑龙江8-++-------+
陕西27-+||
云南25-+-+||
西藏26-+|||
广西20-++-+|
海南21-+||
江西14-+-+|
贵州24-++-----------------------------------+
湖北17-+||
湖南18-+||
四川23-+||
安徽12-+||
江苏10-+-+||
福建13-+|||
辽宁6-++---------+|
吉林7-+||
山东15-+-+|
重庆22-+|
内蒙古5-+|
天津2-+|
浙江11-+-+|
北京1-++-+|
广东19---++-------------------------------------------+
上海9-----+
图1
图1是聚类全过程的树形图。
图2
第一类:
北京、天津、上海、浙江、广东
第二类:
河北、山西、黑龙江、安徽、江西、河南、湖南、湖北、广西、海南、四川、贵州、云南、西藏、陕西、甘肃、青海、宁夏、新疆
第三类:
内蒙古、辽宁、吉林、江苏、福建、山东、重庆
我们可以看到,归属于第一类的基本上属于一线发达省市,归属于第三类的大部分是二线较发达省市。
不过这其中也存在某些个别的省市在某一项消费性支出中较为突出,所以导致有些偏差,但可以理解。
二、判别分析
为了研究2010年全国各地区城镇居民家庭平均每人全年消费性支出的分布规律,根据抽样调查资料进行处理,共抽取31个省、市、自治区的样本,每个样本有7个指标。
用系统聚类分析将31个样品分为3类,其中有3个样品()属于孤立样品,未归属于已分的三类中,采用判别分析判定这三个样品的所属类别。
数据资料见下表5所示。
表6
各地区城镇居民家庭平均每人全年消费性支出
单位:
元
类别
序号
地区
食品
衣着
居住
家庭设备用品及服务
医疗保健
交通和通信
教育文化娱乐服务
一类
1
北京
6392.90
2087.91
1577.35
1377.77
1327.22
3420.91
2901.93
2
天津
5940.44
1567.58
1615.57
1119.93
1275.64
2454.38
1899.50
3
浙江
6118.46
1802.29
1418.00
916.16
1033.70
3437.15
2586.09
4
广东
6746.62
1230.72
1925.21
1208.03
929.50
3419.74
2375.96
二类
5
河北
3335.23
1225.94
1344.47
693.56
923.83
1398.35
1001.01
6
山西
3052.57
1205.89
1245.00
612.59
774.89
1340.90
1229.68
7
四川
4779.60
1259.49
1126.65
876.34
661.03
1674.14
1224.73
8
贵州
4013.67
1102.41
890.75
673.33
546.84
1270.49
1254.56
9
云南
4593.49
1158.82
835.45
509.41
637.89
2039.67
1014.40
10
西藏
4847.58
1158.60
726.59
376.43
385.63
1230.94
477.95
11
陕西
4381.40
1428.20
1126.92
723.73
935.38
1194.77
1595.80
12
甘肃
3702.18
1255.69
910.34
597.72
828.57
1076.63
1136.70
13
宁夏
3768.09
1417.47
1181.71
716.22
890.05
1574.57
1286.20
14
新疆
3694.81
1513.42
898.38
669.87
708.16
1255.87
1012.37
15
黑龙江
3784.72
1608.37
1128.14
618.76
948.44
1191.31
1001.48
16
安徽
4369.63
1225.56
1229.64
678.75
737.05
1356.57
1479.75
17
广西
4372.75
926.42
1166.85
853.59
625.45
1973.04
1243.71
18
海南
4895.96
636.14
1103.76
616.33
579.89
1805.11
1004.62
19
河南
3575.75
1444.63
1080.10
866.72
941.32
1374.76
1137.16
20
湖北
4429.30
1415.68
1187.54
867.33
709.58
1205.48
1263.16
21
湖南
4322.09
1277.47
1182.33
903.81
776.85
1541.40
1418.85
22
江西
4195.38
1138.84
1109.82
854.60
524.22
1270.28
1179.89
三类
23
吉林
3767.85
1570.68
1344.41
710.28
1171.25
1363.91
1244.56
24
内蒙古
4211.48
2203.59
1384.45
948.87
1126.03
1768.65
1641.17
25
江苏
5243.14
1465.54
1234.05
1026.32
805.73
1935.07
2133.25
26
福建
5790.72
1281.25
1606.27
972.24
617.36
2196.88
1786.00
27
山东
4205.88
1745.20
1408.64
915.00
885.79
2140.42
1401.77
28
重庆
5012.56
1697.55
1275.96
1072.38
1021.48
1384.28
1408.02
待判样品
29
上海
7776.98
1794.06
2166.22
1800.19
1005.54
4076.46
3363.25
30
青海
3784.81
1185.56
923.52
644.01
718.78
1116.56
908.07
31
辽宁
4658.00
1586.81
1314.79
785.67
1079.81
1773.26
1495.90
定义变量及标签,并建立一个分类变量,表示各样品的所属类别。
设:
X1:
地区
X2:
食品支出
X3:
衣着支出
X4:
居住支出
X5:
家庭设备用品及服务支出
X6:
医疗保健支出
X7:
交通和通信支出
X8:
教育文化娱乐服务支出
Type:
样品的所属类别
通过SPSS软件操作,得到如下输出结果见表7—表14所示。
表7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 作业
![提示](https://static.bdocx.com/images/bang_tan.gif)