多元统计分析课程论文.docx
- 文档编号:4391960
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:13
- 大小:24.09KB
多元统计分析课程论文.docx
《多元统计分析课程论文.docx》由会员分享,可在线阅读,更多相关《多元统计分析课程论文.docx(13页珍藏版)》请在冰豆网上搜索。
多元统计分析课程论文
《应用多元统计分析》期末论文
农村居民生活消费分析
——2014年我国农村居民消费分析
农村居民生活消费分析
——2014年我国农村居民消费分析
摘要:
本文综合了因子分析与聚类分析,先进行因子分析,再用因子分析的结果进行聚类分析。
在2014年农村居民消费结构的数据基础上,本文较多运用了31个省份的因子得分,计算出单因子情况下31个省份的得分和31个省份在八项消费产生的3个因子上的综合得分,再把该得分作为31个省份的属性,采用离差平方和(ward)方法进行聚类,最后将城市分为三层,对整体进行综合评价和说明。
关键词:
因子分析;聚类分析;综合评价
2014年我国农村居民消费分析
1、引言
由于我国国土辽阔,自然条件差异很大,经济发展极不平衡,一些地区、一些乡村、一些居民群体的生活目前与小康指标仍有差距,有的甚至还没有解决温饱问题。
我国现有65%的人口在农村,农村居民的生活问题是全面建设小康社会的主要问题。
因此,笔者就我国农村居民生活消费结构进行因子分析和聚类分析,以期对农村居民生活消费的问题作一研究,并以此寻求合理的解决思路。
二、因子分析法
2.1、统计思想
因子分析的基本思想是通过对变量相关系数矩阵内部结构的研究,找出能控制所以变量的少数几个随机变量去描述多个变量之间的相关关系,并依据相关性的大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。
每组代表一个基本结构,这个基本结构成为公共因子。
对于所研究的问题试图用最小个数的不可观测的所谓公共因子的线性函数与特殊因子之和来描述原来可观测的每一个变量。
2.2、因子的确定
利用2014年各地区农村居民家庭平均每人生活消费支出资料。
摘自《中国统计年鉴(2015)》做因子相关性分析得:
表一、相关矩阵表
相关矩阵a
食品
衣着
居住
家庭设备及服务
交通和通讯
文娱用品及服务
医疗保健
其他商品和服务
相关
食品
1.000
.669
.831
.789
.759
.356
.462
.818
衣着
.669
1.000
.760
.729
.871
.499
.722
.755
居住
.831
.760
1.000
.872
.814
.547
.645
.767
家庭设备及服务
.789
.729
.872
1.000
.764
.466
.516
.694
交通和通讯
.759
.871
.814
.764
1.000
.580
.698
.763
文娱用品及服务
.356
.499
.547
.466
.580
1.000
.691
.505
医疗保健
.462
.722
.645
.516
.698
.691
1.000
.613
其他商品和服务
.818
.755
.767
.694
.763
.505
.613
1.000
Sig.(单侧)
食品
.000
.000
.000
.000
.027
.005
.000
衣着
.000
.000
.000
.000
.003
.000
.000
居住
.000
.000
.000
.000
.001
.000
.000
家庭设备及服务
.000
.000
.000
.000
.005
.002
.000
交通和通讯
.000
.000
.000
.000
.000
.000
.000
文娱用品及服务
.027
.003
.001
.005
.000
.000
.002
医疗保健
.005
.000
.000
.002
.000
.000
.000
其他商品和服务
.000
.000
.000
.000
.000
.002
.000
a.行列式=.000
因子相关相关矩阵反映我国农村居民消费结构的各指标之间存在较高的相关性,而变量间存在较为明显的相关关系是应用因子分析提取主因子,并以此为依据构造评价体系的基础。
因此存在可以采用因子分析进行分析的可能。
2.3分析过程
共同度描述的是变量Xi(i=1,2,?
m)对m个因子的依赖程度,也就是用m个因子描述变量的有效性。
本文用因子分析法,选取特征值r>1的变量作为主因子并计算其共同度。
表二、公因子方差表
公因子方差
初始
提取
食品
1.000
.939
衣着
1.000
.961
居住
1.000
.941
家庭设备及服务
1.000
.948
交通和通讯
1.000
.929
文娱用品及服务
1.000
.997
医疗保健
1.000
.992
其他商品和服务
1.000
.958
提取方法:
主成份分析。
由表二可以看出,主因子对每个变量指标有很强的解释力。
表三、解释的总方差表
解释的总方差
成份
初始特征值
提取平方和载入
旋转平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
合计
方差的%
累积%
1
5.693
71.161
71.161
5.693
71.161
71.161
3.491
43.635
43.635
2
.930
11.627
82.789
.930
11.627
82.789
2.075
25.934
69.569
3
.479
5.991
88.780
.479
5.991
88.780
1.537
19.211
88.780
4
.339
4.235
93.015
5
.224
2.796
95.810
6
.156
1.952
97.763
7
.098
1.224
98.986
8
.081
1.014
100.000
提取方法:
主成份分析。
从衡量每个公因子Fi(i=1、2.....n)对m个变量解释能力的方差贡献率指标来看,累计方差贡献率达到88.78%,说明主因子对变量能够起到较好的概括作用,其中第一主因子起到了尤其重要的作用,其旋转后的方差贡献率达到43.635%。
因子载荷矩阵的元素ai代表了变量Xi与因子Fi线性联系的紧密程度,而第j列的因子载荷量a1、a2.....ai,则说明了第j个因子Fi与各变量的联系程度,在实际中,常常根据该列载荷中绝对值较大的载荷所对应的变量来说明这个因子的意义。
表四、旋转成分矩阵表
旋转成份矩阵a
成份
1
2
3
食品
.910
.261
.078
衣着
.539
.774
.173
居住
.820
.344
.331
家庭设备及服务
.861
.239
.252
交通和通讯
.641
.621
.284
文娱用品及服务
.232
.243
.925
医疗保健
.215
.738
.552
其他商品和服务
.714
.483
.213
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在5次迭代后收敛。
由表四可知:
第一主因子在食品、居住、家庭设备及服务、交通和通讯以及其他商品和服务等5个指标上的系数比较大,其主要反应的是生活消费水平的提高;第二主因子在衣着、医疗保健2个指标上的系数比较大,其主要反映的是日常生活中最基本的消费情况;第三主因子在文教娱乐用品及服务指标上的系数比较大,其主要反映的是生活消费水平进一步提高的情况。
3个主因子从不同的侧面反映了居民的生活质量,从整体来看,则反映了农村居民从生存型消费、数量型消费向发展型消费、质量型消费的发展方向。
第一主因子可以解释原始数据全部方差的71.161%,第二主因子可以解释原始数据全部方差的11.627%,第三主因子可以解释原始数据全部方差的5.991%。
由此看出,我国现阶段农村居民消费的刚性支出是维护基本生活的吃、必要的的交通、通讯和商品及服务。
因子得分是利用因子分析法对原始数据进行评价的依据。
以2014年各地区农村居民家庭平均每人生活消费支出资料为依据,我们得到因子得分系数矩阵和因子得分。
表五、成分得分系数矩阵表
成份得分系数矩阵
成份
1
2
3
食品
.461
-.258
-.141
衣着
-.160
.762
-.375
居住
.326
-.249
.140
家庭设备及服务
.432
-.390
.111
交通和通讯
.012
.360
-.119
文娱用品及服务
-.054
-.452
1.041
医疗保健
-.385
.644
.176
其他商品和服务
.162
.138
-.115
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法。
表六、因子得分表
地区
因子一
因子二
因子三
北京
1.81665
1.01811
0.38765
天津
1.78004
1.54079
-0.28405
河北
-0.27862
0.57007
-0.42938
山西
-1.00126
0.06344
0.49417
内蒙古
-0.81253
0.98161
1.79005
辽宁
-1.36031
0.6516
1.02536
吉林
-0.99219
0.38462
1.10577
黑龙江
-1.35833
0.83079
0.75777
上海
2.07075
1.62143
-0.69032
江苏
1.20223
0.23212
0.8953
浙江
1.45968
0.89256
1.28764
安徽
-0.1047
-0.23246
-0.30475
福建
1.5009
-0.92193
0.13763
江西
0.08184
-1.02688
-0.43173
山东
-0.41011
0.21327
-0.1464
河南
-0.71054
0.51714
-0.46178
湖北
0.00538
-0.50657
0.96649
湖南
0.25145
-1.11583
1.24554
广东
1.45502
-1.85175
0.49371
广西
-0.14494
-1.50262
-0.16197
海南
0.28848
-1.91973
-0.08903
重庆
0.15731
-0.64588
-0.2399
四川
0.29404
0.03987
-1.19174
贵州
-0.47928
-1.25891
-0.3303
云南
-0.67826
-0.91445
-0.43083
西藏
-0.08193
-0.29863
-3.4481
陕西
-0.87977
-0.14083
0.64863
甘肃
-0.78854
-0.533
-0.28667
青海
-0.70677
1.5633
-1.08221
宁夏
-0.59477
0.55555
0.08217
新疆
-0.98091
1.19321
-1.30874
以主因子对原始数据的贡献率为权数加权,得出个城市的综合得分F,即F=((F1*71.161+F2*11.627+F3*5.991)/88.78
表七、因子综合得分表
地区
综合得分
排名
北京
1.6156
2
天津
1.6094
3
河北
-0.1776
15
山西
-0.7609
29
内蒙古
-0.4019
20
辽宁
-0.9358
31
吉林
-0.6703
24
黑龙江
-0.9288
30
上海
1.8256
1
江苏
1.0545
6
浙江
1.3738
4
安徽
-0.1349
14
福建
1.0916
5
江西
-0.0980
13
山东
-0.3107
16
河南
-0.5330
22
湖北
0.0032
11
湖南
0.1395
9
广东
0.9571
7
广西
-0.3239
17
海南
-0.0262
12
重庆
0.0253
10
四川
0.1605
8
贵州
-0.5713
23
云南
-0.6925
26
西藏
-0.3375
18
陕西
-0.6798
25
甘肃
-0.7212
28
青海
-0.4348
21
宁夏
-0.3984
19
新疆
-0.7183
27
可以看出,第一主因子的前10位排名依次为上海、北京、天津、福建、浙江、广东、江苏、四川、海南、湖南;第二主因子的前10位排名依次为上海、青海、天津、新疆、北京、内蒙古、浙江、黑龙江、辽宁、河北;第三主因子前10位排名依次为内蒙古、浙江、湖南、吉林、辽宁、湖北、江苏、黑龙江、陕西、山西。
综合因子前10位排名与第一主因子大致相同,这就进一步说明,我国农村居民的整体消费水平由第一类地区的消费水平所决定。
考虑到不同地区的消费习惯和物价水平的影响,因子分析排名基本符合实际情况。
第二主因子的排名与第一主因子、第三主因子相差较大。
3、聚类分析法
3.1系统聚类法的思想
首先,将N个样品看成N类,然后将性质最近的两类合并成一个新类,我们得到N-1类,再从中找出最近的两类合并变成N-2类,如此下去,最后所有样品归为一类。
3.2系统聚类
离差平方和Ward方法的思想来源于方差分析,如果分类正确,同样品的离差平方和应当较小,类与类之间的离差平方和应当较大。
对表中综合因子得分运用统计分析软件SPSS进行聚类分析的WARD(离差平方和)法进行最优分割,把我国31个省、直辖市、自治区的农村居民生活消费情况归来为3大类。
图一、系统聚类图
表八、聚类图中数字代表的省市
地区
北京
天津
河北
山西
内蒙古
辽宁
序号
1
2
3
4
5
6
吉林
黑龙江
上海
江苏
浙江
安徽
7
8
9
10
11
12
福建
江西
山东
河南
湖北
湖南
13
14
15
16
17
18
广东
广西
海南
重庆
四川
贵州
19
20
21
22
23
24
云南
西藏
陕西
甘肃
青海
宁夏
25
26
27
28
29
30
新疆
31
由上图知第东部沿海地区农村居民在科技教育、居住、服务方面的消费普遍较高;西部、北部地区农村居民在科技教育、居住、服务方面的消费普遍较低,主要用于生存消费。
即:
第一、二类地区的生活水平较低,第三类地区的生活水平较高,整体差异悬殊较大。
4、影响农村居民消费因素
4.1、收入影响
农民收入增长缓慢,而且其收入绝大部分用于家庭生产经营、支付税费以及供子女受教育的学费开支,这从根本上限制了农村居民消费水平的提高和消费结构的改善,因此,增收问题是提高农村居民生活质量的核心问题。
4.2、消费环境影响
目前,我国农村居民的消费环境较差,明显制约农村居民消费结构的改善。
主要表现在:
①基础设施落后。
道路、供水供电、通讯等设施不能满足消费的需求,出现了“买车无路开,买手机无信号,买洗衣机没有自来水”的现象,严重制约了农村居民对家用电器等现代化工业产品的消费。
②市场上适应农村消费特点的消费品偏少,而且农村商品销售网络和服务体系严重滞后,如乡镇以下区域商品批发市场、零售网点少,假冒伪劣商品充斥农村市场,诸如送货上门、免费安装、售后服务等便民措施在农村市场难以得到保障,这些问题严重影响了农民的购买热情和消费心理。
③农村社会保障体系不健全,农村居民因防老、防病、育儿的储蓄心理较强,因而限制了消费需求的实现。
4.3、消费观念影响
多数农村居民的消费观念比较保守,仍停留在短缺经济时代的水平上,积累性消费特点突出,超前消费、贷款消费的意识不强,求实、求廉的购买动机明显,价格仍是选购商品时首先考虑的因素。
此外,农村居民消费的趋同性和从众心理显着,往往是同一区域内的一家农户买了某一种物品,其他农户就都买同一品牌、品种的商品。
这显然对消费领域的拓展和消费质量的提高有所限制。
五、参考文献
1、《我国农村居民生活消费实证研究》:
孙艳玲,讲师,成都信息工程学院信息统计系:
四川成都.
2、《基于因子分析的我国证券公司竞争力的研究》:
王晓芳,王学伟,西安交通大学经济与金融学院:
陕西西安.
3、《近年居民消费结构统计分析的研究》--关于因子分析和聚类分析的应用;吴栋,李乐夫,李阳子,清华大学经济管理学院:
北京.
4、《基于因子和聚类分析的县域经济发展研究》—以河南省18个县(市)为例王庆丰.党耀国.王丽敏,南京航空航天大学经济与管理学院,江苏.南京.中原工学院经济管理学院,河南郑州.
六、附录:
6-28农村居民分地区人均消费支出(2014年)
单位:
元
地区
消费
支出
食品烟酒
衣着
居住
生活用品
交通通信
教育文化
医疗保健
其他用品
及服务
娱乐
及服务
全国
8382.6
2814.0
510.4
1762.7
506.5
1012.6
859.5
753.9
163.0
北京
14535.1
4048.0
917.8
4360.7
994.6
1813.0
1097.3
1088.6
215.1
天津
13738.6
4314.4
1013.1
3200.4
891.0
1979.4
1041.4
979.7
319.2
河北
8248.0
2421.2
581.6
1858.5
508.0
1146.5
758.7
788.7
184.7
山西
6991.7
2054.3
539.7
1480.5
343.9
706.5
928.5
770.2
168.2
内蒙古
9972.2
3039.0
728.1
1675.7
427.9
1467.5
1318.0
1114.4
201.5
辽宁
7800.7
2210.9
531.7
1491.7
331.7
1049.7
1014.5
1026.4
144.2
吉林
8139.8
2411.2
552.6
1650.9
355.7
931.2
1042.2
1008.0
188.0
黑龙江
7830.0
2210.2
597.4
1602.1
348.0
966.2
984.2
992.1
129.7
上海
14820.1
5332.7
860.4
3615.7
689.5
1830.3
782.7
1330.3
378.3
江苏
11820.3
3711.9
758.9
2467.0
719.0
1788.5
1215.5
845.3
314.3
浙江
14497.8
4618.5
881.8
3302.1
746.6
2256.8
1355.3
1068.3
268.4
安徽
7980.8
2842.3
474.0
1686.0
498.7
811.7
735.1
778.8
154.1
福建
11055.9
4222.5
572.4
2607.8
642.7
1097.7
940.7
735.9
236.2
江西
7548.3
2755.1
380.6
1877.3
406.8
759.4
711.9
525.2
132.0
山东
7962.2
2464.5
489.3
1547.1
523.9
1225.8
801.4
776.4
133.8
河南
7277.2
2153.8
600.7
1542.6
505.9
859.6
757.8
731.4
125.4
湖北
8680.9
2724.1
495.7
1944.6
574.3
816.4
1010.2
907.3
208.3
湖南
9024.8
3095.2
468.0
1982.4
541.9
871.9
1112.1
771.4
181.9
广东
10043.2
3968.9
328.2
2238.8
599.7
1068.7
918.2
686.9
233.8
广西
6675.1
2462.9
208.6
1550.8
394.8
709.7
682.5
553.5
112.4
海南
7029.0
3037.2
247.9
1328.5
392.8
661.8
760.3
454.1
146.4
重庆
7982.6
3229.0
490.5
1294.2
569.4
780.4
805.1
677.0
137.1
四川
8301.1
3299.3
548.1
1486.5
629.8
884.9
599.8
723.7
129.1
贵州
5970.3
2223.5
341.6
1202.1
355.1
636.5
746.4
373.0
92.1
云南
6030.3
2145.9
267.2
1147.8
359.6
856.8
664.9
514.0
74.1
西藏
4822.1
2534.9
458.1
688.4
252.9
517.0
129.1
91.6
149.9
陕西
7252.4
2112.2
457.3
1627.0
444.2
690.5
900.6
883.7
136.8
甘肃
6147.8
2145.7
411.2
1079.8
383.4
730.4
753.4
546.2
97.7
青海
8235.1
2626.0
615.5
1416.3
487.5
1392.3
610.6
944.5
142.5
宁夏
7676.5
2296.0
602.0
1388.1
496.1
961.4
866.6
856.9
209.2
新疆
7365.3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 课程 论文