用spss分析我国各省城镇居民消费水平差异.docx
- 文档编号:30811717
- 上传时间:2024-01-30
- 格式:DOCX
- 页数:12
- 大小:93.32KB
用spss分析我国各省城镇居民消费水平差异.docx
《用spss分析我国各省城镇居民消费水平差异.docx》由会员分享,可在线阅读,更多相关《用spss分析我国各省城镇居民消费水平差异.docx(12页珍藏版)》请在冰豆网上搜索。
用spss分析我国各省城镇居民消费水平差异分析
文章结构
1研究背景及意义 1
2研究方法 1
3数据来源与数据处理 1
4.实证分析 2
4.1因子分析 2
4.2聚类分析 7
5结论 11
1研究背景及意义
我国地域广阔,各省份的经济发展很不平衡,各省之间的居民消费水平差距较大。
经济快速发展的同时我国居民收入稳步增加,各省居民的消费支出也强劲增长,消费结构发生了巨大变化。
为了正确引导消费,进一步改善消费结构,提高我国城市居民的消费水平和生活的质量,有必要对全国各省居民消费结构之间的异同进行考察并做比较研究,以期发现经济水平和城市居民的消费水平之间的关系.
2研究方法
本文运用多元统计分析中的主成分分析方法和聚类分析方法,将描述各省份城镇居民全年现金消费支出的八个指标压缩成两个综合指标(称为主成分),这两个主成分保留了原始八个指标的绝大部分信息,在指标压缩的同时能够最大限度地反映出各省份城镇居民消费水平差异。
在综合因子基础上进行层次聚类分析,根据消费差异将全国31个省分为四类。
因子分析模型是根据变量间的相关性大小,把变量分组,利用同组内的变量之间相关性较高而不同组的变量之间相关性较低,每组变量代表一个基本结构,这个基本结构称为公共因子。
因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以通过下面的数学模型来表示:
X1=α11F1+α12F2+…+α1mFm+α1ε1,
X2=α21F1+α222+…+α2mFm+α2ε2,
…
Xp=αp1F1+αp2F2+…+αpmFm+αpεp,
其中:
x1,x2,x3,…,xp为p个原有变量,是均值为零、标准差为1的标准化变量;F1,F2,F3,…,Fm为m个因子变量,m小于p,表示成矩阵形式为
X=AF+αε,
其中:
F=(F1,F2,…,Fm)为因子变量或公共因子;ε=(ε1,ε2,…,εp)为特殊因子;F与ε均为不可观测的随机变量.A=(αij)p×m为因子载荷矩阵,αj称为第j个因子对第i个变量的载荷系数.在模型中,特殊因子起着残差的作用,被定义为彼此不相关且与公因子也不相关。
系统聚类分析的基本思想是认为所研究的样品(或指标)之间存在不同程度的相似性.把一些相似程度较大的样品(或指标)聚合为一类,把另外一些相似程度较大的样品(或指标)又聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有样品都聚合完毕,把不同的类型一一划分出来,形成一个由小到大的分类系统。
利用SPSS中的聚类分析,以层次分析法结果中的因子得分为基础,在聚类分析中采用离差平方和法及欧氏平方距离对综合因子得分进行最优分割,将31个省按城市居民消费水平的高低分成4类。
3数据来源与数据处理
2012年我国“分地区城镇居民家庭平均每人全年现金消费支出”,来自于中国统计年鉴全国31个省、直辖市和自治区(港、澳、台不在其中)的城镇居民年平均现金消费支出的97项主要指标(单位:
元),指标代码和指标名称列于表1,原始数据列于表2。
表1指标名称及代码
指标代码
指标名称
指标代码
指标名称
X1
食品
X5
交通通讯
X2
衣服
X6
文教娱乐
X3
居住
X7
医疗保险
X4
家庭设备
表2原始数据
地区
X1
X2
X3
X4
X5
X6
X7
上海
9655.6
2111.17
1790.48
1906.49
4563.8
3723.74
1016.65
北京
7535.29
2638.9
1970.94
1610.7
3781.51
3695.98
1658.37
广东
8258.44
1520.59
2099.75
1467.2
4176.66
2954.13
1048.28
浙江
7552.02
2109.58
1551.69
1161.39
4133.5
2996.59
1228.02
天津
7343.64
1881.43
1854.22
1151.16
3083.37
2254.22
1556.35
江苏
6658.37
1915.97
1437.08
1288.42
2689.51
3077.76
1058.11
内蒙古
5463.18
2730.23
1583.56
1242.64
2572.93
1971.78
1354.09
福建
7317.42
1634.21
1753.86
1254.71
2961.78
2104.83
773.22
辽宁
5809.39
2042.4
1433.28
1069.65
2323.29
1843.89
1309.62
山东
5201.32
2196.98
1572.35
1125.99
2370.23
1655.91
1005.25
重庆
6870.23
2228.76
1177.02
1196.03
1903.24
1470.64
1101.56
吉林
4635.27
2044.8
1594.14
871.46
1780.67
1642.7
1447.5
陕西
5550.71
1789.06
1322.22
986.82
1788.38
2078.52
1212.44
安徽
5814.92
1540.66
1396.97
811.23
1809.72
1932.74
1142.96
湖南
5441.63
1624.57
1301.6
1034.3
2084.15
1737.64
918.41
湖北
5837.93
1783.41
1371.15
978.26
1476.98
1651.92
1029.55
四川
6073.86
1651.14
1284.09
1097.93
1946.72
1587.43
772.75
广西
5552.56
1146.46
1377.26
1125.39
2088.64
1626.05
883.56
河南
4607.47
1885.99
1190.81
1145.42
1730.35
1525.33
1085.47
宁夏
4768.91
1875.7
1193.37
929.01
2110.41
1515.91
1063.09
海南
6556.1
864.96
1521.04
777.2
2004.34
1319.54
993.24
新疆
5238.89
2031.14
1166.59
950.17
1660.27
1280.81
1027.6
河北
4211.16
1541.99
1502.41
876.1
1723.75
1203.8
1047.28
黑龙江
4687.23
1806.92
1336.85
742.22
1462.61
1216.56
1180.67
甘肃
4602.33
1631.4
1287.93
833.15
1575.67
1388.21
1049.65
山西
3855.56
1529.47
1438.88
832.52
1672.29
1506.2
905.88
云南
5468.17
1759.89
973.76
634.09
2264.23
1434.3
939.13
江西
5071.61
1476.63
1173.91
966.23
1501.34
1487.3
670.71
青海
4667.34
1512.24
1232.39
923.7
1549.76
1097.21
906.14
贵州
4992.85
1399
1013.53
849.94
1891.03
1396
654.53
西藏
5517.69
1361.57
845.18
474.69
1387.45
550.48
467.23
4.实证分析
4.1因子分析
表3描述统计量
均值
标准差
分析N
食品
5832.8094
1299.82194
31
衣服
1782.8135
388.89271
31
居住
1411.2358
283.12264
31
家庭设备
1042.3939
283.24540
31
交通通讯
2260.2768
861.61451
31
文教娱乐
1836.3910
739.15111
31
医疗保险
1048.6229
253.74984
31
食品、衣服等七个消费支出指标的描述性统计量,可以看出,食品支出消费所占的比重最大,其次是交通通讯。
在所有的消费支出中,医疗保险支出所占比重最小。
表4KMO和Bartlett的检验
取样足够度的Kaiser-Meyer-Olkin度量。
.698
Bartlett的球形度检验
近似卡方
187.287
df
21
Sig.
.000
表5公因子方差
初始
提取
食品
1.000
.865
衣服
1.000
.780
居住
1.000
.706
家庭设备
1.000
.829
交通通讯
1.000
.911
文教娱乐
1.000
.902
医疗保险
1.000
.844
提取方法:
主成份分析。
通过SPSS软件得出Bartlett值为21,P值<0.05,可考虑进行因子分析;KMO值为0.698,接近1,适合进行因子分析。
变量的绝大部分信息(70%以上)都可以被因子解释,这些变量信息丢失较少,本次因子提取的总体效果理想。
表6解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
4.623
66.048
66.048
4.623
66.048
66.048
3.881
55.448
55.448
2
1.214
17.345
83.392
1.214
17.345
83.392
1.956
27.945
83.392
3
.563
8.042
91.435
4
.257
3.667
95.102
5
.148
2.109
97.211
6
.140
1.994
99.204
7
.056
.796
100.000
提取方法:
主成份分析。
第一个因子的特征根值为4.623,解释了原有8个变量总方差的55.448%,第二个因子的特征根值为1.214,解释了原有8个变量总方差的27.945,前两个因子的累计方差贡献率为83.392%,并且只有他们的取值大于1,说明前两个公因子基本上包含来全部变量的主要信息,选择前两个因子为主因子即可。
图1碎石图
碎石图横坐标为因子数目,纵坐标为特征根,可以看出第一个因子的特征值很高,对解释原油变量的贡献率极大,第二个以后的特征根值都很小,取值都小于1,说明他们对解释原有变量的共享率极小。
表7成份矩阵a
成份
1
2
文教娱乐
.944
-.101
交通通讯
.920
-.255
家庭设备
.902
-.120
居住
.840
-.008
食品
.823
-.434
医疗保险
.597
.698
衣服
.576
.670
提取方法:
主成份。
a.已提取了2个成份。
旋转前的因子载荷矩阵,从结果看,大部分因子解释性很好,但是仍有少部分指标解释能力较差。
如医疗保险和衣服在两个因子的载荷系数区别不大,因此接着采用因子旋转方法使得因子载荷系数向着0和1两极分化,使大的载荷更大,小的载荷更小,使结果更具有解释性。
表8旋转成份矩阵a
成份
1
2
交通通讯
.933
.203
食品
.930
.000
文教娱乐
.882
.351
家庭设备
.854
.315
居住
.747
.385
医疗保险
.202
.896
衣服
.197
.861
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在3次迭代后收敛。
旋转后因子载荷矩阵,因子载荷系数向着0和1两极分化,更有意义。
可以看出,第一个公因子主要反映了交通通讯、食品、文教娱乐、家庭设备和居住上有较大的载荷,说明第一个公因子主要反映这几方面的差异情况。
其中,差异大小排序依次为交通通讯>食品>文教娱乐>家庭设备>居住;第二个因子反映了在医疗保险和衣服上有较大的载荷,说明第二公因子主要反映医疗保险和衣服两方面的差异情况,其中医疗保险>衣服。
表9成份得分系数矩阵
成份
1
2
食品
.324
-.233
衣服
-.147
.546
居住
.164
.079
家庭设备
.219
.004
交通通讯
.274
-.093
文教娱乐
.220
.021
医疗保险
-.154
.569
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
构成得分。
根据表中的内容,可以写出以下因子得分函数:
F1=0.324*X1-0.147*X2+0.164*X3+0.219*X4+0.274*X5+0.220*X6-0.154*X7
F2=-0.233*X1+0.546*X2+0.079*X3+0.004*X4-0.093*X5+0.021*X6+0.569*X7
有了F1和F2的合理解释,可以将各省的相关数据代入因子模型中计算出各因子得分.同时,以各因子的方差贡献率占2个因子总方差贡献率的比重为权重加权汇总,得出各省的综合因子得分F,即F=0.55448F1+0.27945F2得到的各因子及综合因子的得分数值及排序见表.表中因子得分情况及其正负仅表示该城市与平均水平的相对位置。
表10因子及综合因子得分数值及排名
地区
F1
F1排名
F2
F2排名
F
F排名
上海
3.02862
1
-0.37344
21
1.57
1
北京
1.5295
3
2.31666
1
1.5
2
广东
2.37253
2
-0.78112
24
1.1
3
浙江
1.30964
4
0.4249
11
0.84
4
天津
0.75736
7
1.05422
4
0.71
5
江苏
0.85997
6
0.06022
14
0.49
6
内蒙古
-0.24202
15
2.10182
2
0.45
7
福建
1.25892
5
-1.06226
26
0.4
8
辽宁
-0.20651
14
0.9538
5
0.15
9
山东
-0.14855
12
0.62602
6
0.09
10
重庆
-0.18138
13
0.52346
8
0.05
11
吉林
-0.87617
29
1.57183
3
-0.05
12
陕西
-0.34483
17
0.45924
9
-0.06
13
安徽
-0.27165
16
-0.08056
18
-0.17
14
湖南
-0.11365
11
-0.4585
22
-0.19
15
湖北
-0.36402
18
0.02441
16
-0.2
16
四川
0.0731
10
-0.85478
25
-0.2
17
广西
0.19853
8
-1.20919
28
-0.23
18
河南
-0.67591
22
0.43522
10
-0.25
19
宁夏
-0.6658
21
0.29833
13
-0.29
20
海南
0.18502
9
-1.50236
30
-0.32
21
新疆
-0.79803
27
0.38729
12
-0.33
22
河北
-0.74658
26
0.01241
17
-0.41
23
黑龙江
-1.08771
31
0.57895
7
-0.44
24
甘肃
-0.83402
28
0.03426
15
-0.45
25
山西
-0.74158
24
-0.26244
19
-0.48
26
云南
-0.70268
23
-0.35135
20
-0.49
27
江西
-0.38569
19
-1.13609
27
-0.53
28
青海
-0.74245
25
-0.48647
23
-0.55
29
贵州
-0.45204
20
-1.35804
29
-0.63
30
西藏
-0.99194
30
-1.94644
31
-1.09
31
分析F1,上海、广东、北京具有较高的消费水平,公共因子得分为正的城市有10个城市,且都具有比较发达的经济发展水平,在经济发展到一定水平后,人们的消费理念也上升到了较高的层次。
黑龙江、西藏等经济欠发达的省份,居民的消费也会受到一定的制约。
居民在食品、交通通讯、家庭设备、居住和文教娱乐5个方面的消费水平与经济发展水平有密切的相关性。
分析F2,北京、内蒙古、吉林和天津等省市的消费水平高,西藏、海南、贵州和广西等地区消费水平低。
而上海、广东两个较为发达的省市排在第21、24位.这说明衣服和医疗保险等方面的消费水平与地区的经济水平虽然有一定的相关性,但也受其它因素的影响。
分析分析综合因子得分F,居民消费水平较高的是上海、北京、广东、浙江和天津等省市,较低的为西藏、贵州、青海和江西等省,得分为正的有11个省,说明各省城市居民消费水平发展不均衡。
4.2聚类分析
表11聚类表
阶
群集组合
系数
首次出现阶群集
下一阶
群集1
群集2
群集1
群集2
1
19
20
.003
0
0
17
2
16
25
.005
0
0
3
3
16
22
.010
2
0
9
4
7
15
.020
0
0
11
5
23
27
.033
0
0
17
6
3
9
.046
0
0
22
7
12
30
.060
0
0
13
8
10
28
.080
0
0
18
9
16
18
.104
3
0
18
10
2
14
.137
0
0
15
11
7
17
.173
4
0
21
12
6
8
.211
0
0
16
13
12
13
.249
7
0
23
14
1
21
.313
0
0
28
15
2
26
.380
10
0
25
16
5
6
.456
0
12
22
17
19
23
.534
1
5
20
18
10
16
.620
8
9
23
19
4
11
.725
0
0
24
20
19
29
.857
17
0
21
21
7
19
1.050
11
20
26
22
3
5
1.289
6
16
27
23
10
12
1.550
18
13
27
24
4
24
1.856
19
0
25
25
2
4
2.655
15
24
28
26
7
31
3.456
21
0
29
27
3
10
4.498
22
23
29
28
1
2
6.219
14
25
30
29
3
7
8.444
27
26
30
30
1
3
16.162
28
29
0
Spss首先给出了进行系统聚类分析过程表,第一列列出了聚类过程的步骤号,第二列和第三列列出了某一步骤中那些省市进行了合并,例如从结果中可以看出,19和20首先被合并在一起。
第四列列出每一步骤的聚类系数,这一数值表示被合并的两个类别之间的距离大小,第五列和第六列表示参与合并的省市在第几步中第一次出现,0代表该记录是第一次出现在聚类过程中,第七列表示在这一过程中合并的类别,下一次将在第几步中与其他类进行再一次合并。
得到以下结果:
表12群集成员
案例
4群集
1:
北京
1
2:
内蒙古
2
3:
吉林
3
4:
天津
2
5:
辽宁
3
6:
山东
3
7:
黑龙江
4
8:
重庆
3
9:
陕西
3
10:
河南
3
11:
浙江
2
12:
新疆
3
13:
宁夏
3
14:
江苏
2
15:
甘肃
4
16:
湖北
3
17:
河北
4
18:
安徽
3
19:
山西
4
20:
云南
4
21:
上海
1
22:
湖南
3
23:
青海
4
24:
广东
2
25:
四川
3
26:
福建
2
27:
江西
4
28:
广西
3
29:
贵州
4
30:
海南
3
31:
西藏
4
图2树状图
第一类:
北京、上海
第二类:
内蒙古、天津、浙江、江苏、广东、福建
第三类:
吉林、辽宁、山东、重庆、陕西、河南、新疆、宁夏、湖北、安徽、湖南、四川、广西、海南
第四类:
黑龙江、甘肃、河北、山西、云南、青海、江西、贵州、西藏
为了进一步分析4大类省市在各个消费领域支出的变化情况,计算各类省市在各个消费领域的平均支
出。
表134大类省市在各个消费领域支出情况
地区
X1
X2
X3
X4
X5
X6
X7
第一类
支出
8595.445
2375.035
1880.71
1758.595
4172
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 分析 我国 各省 城镇居民 消费水平 差异