聚类分析与判别分析.docx
- 文档编号:5352780
- 上传时间:2022-12-15
- 格式:DOCX
- 页数:12
- 大小:94.75KB
聚类分析与判别分析.docx
《聚类分析与判别分析.docx》由会员分享,可在线阅读,更多相关《聚类分析与判别分析.docx(12页珍藏版)》请在冰豆网上搜索。
聚类分析与判别分析
利用聚类分析和判别分析对我国各省市经济发展状况的分析
统计081许建霞089114284
摘要:
转变经济发展方式是我国未来经济发展过程中一项重要而十分艰巨的任务,《中共中央关于制定国民经济和社会发展第十二个五年规划的建议》更是提出“十二五”时期要以加快转变经济发展方式为主线。
要实现这一转变,它与调整经济结构是高度相关、相辅相成的,其中,产业结构的转型升级更是经济发展方式转变的体现和依托。
当前我国经济发展方式粗放与面临着的诸多结构性矛盾,在很大程度上根源于我国经济发展过程中的“三个过度和一个缺失”,即:
经济增长过度依赖投资、全球分工中过度依赖加工制造环节和加工贸易、竞争战略过度依赖成本价格,而产业链和价值链中研发设计、营销、品牌和供应链管理等高端环节缺失。
要加快转变经济发展方式,就必须改变上述“三个过度和一个缺失”,促进产业结构转型升级,这也关系到当前战略性新兴产业发展是否能够摆脱过去发展模式,走出一条可持续发展的道路。
关键词:
聚类分析判别分析经济发展
一.研究背景
我国产业结构基本上分享了经济的增长效应,但协调效应、分配效应和就业效应不理想,环境效应问题比较突出,并且在总体上具有名义高度化较快而实际高度化不足的特征,我们必须紧紧抓住机遇,承担起历史使命,把加快经济发展方式转变作为深入贯彻落实科学发展观的重要目标和战略举措,毫不动摇地加快经济发展方式转变,不断提高经济发展质量和效益,不断提高我国经济的国际竞争力和抗风险能力,使我国发展质量越来越高、发展空间越来越大、发展道路越走越宽。
二.方法介绍
1.聚类分析方法介绍
聚类分析是从事物数量上的特征出发对事物进行分类,是事物分类学和多元统计技术结合的结果,是一种较为粗糙的,理论并非完善的分析方法,但是其使用简便,分类效果较好,其内容也在不断丰富中,是常用的数据探索性分析工具。
聚类分析(ClusterAnalysis)又称为集群分析,其分析的基本思想是依照事物的数值特征,来观察各样品之间的亲疏关系。
而样品之间的亲疏关系则是由样品之间的距离来衡量的,一旦样品之间的距离定义之后,则把距离近的样品归为一类。
聚类分析既可以对样品聚类,又可以对变量聚类,样品聚类也称为Q型聚类,变量聚类也称为R型聚类。
本文先采用样品聚类,然后再采用变量聚类。
2.判别分析方法介绍
费希尔判别的基本思想是投影。
将
组
元数据投影到某一个方向,使得投影后组与组之间尽可能地分开。
而衡量组与组之间是否分开的方法借助于一元方差分析的思想。
利用方差分析的思想来导出判别函数,这个函数可以是线性的,也可以是很一般的函数。
因线性判别函数在实际应用中最方便,本节仅讨论线性判别函数的导出。
设从总体
分别抽取
元样本如下:
。
令
为
维空间任一向量,
为
向量以
为法线方向上的投影。
上述
个组中的
元数据投影后为
每个总体的数据投影后均为一元数据。
对这
组一元数据进行一元方差分析,其组间平方和为:
其中
和
分别为
的样本均值和总体样本均值,并记
合并的组内平方和为
其中合并的组内离差阵
为
因此,若
个总体的均值有显著差异,则比值
,应充分大。
利用方差分析的思想,此问题化为求投影方向
,使
达极大值。
显然使
达极大的解
不唯一。
若
使
达极大,则
也使
达极大,故对
附加一约束条件,即选取
,使
。
因此,问题又化为求
使
在
条件下达极大。
三.聚类分析和判别分析具体应用
1.数据来源与指标变量选取
本文所采用的数据全部来自2010年中国统计年鉴,我们选取的十个指标,选取的指标有:
居民消费价格指数累计x1(上年同期=100),单位地区生产总值能耗x2(吨标准煤/万元),生活消费支出总计x3(元),农村人口比重x4(%),自然增长率x5(‰),2000年预期寿命x6(岁),自然保护区面积x7(万公顷),工业总产值x8(亿元),本、专科在校学生数x9(人),地区总产值x10(亿元)。
我们采用的数据如下表1。
表1各省市的各项指标值
地区
居民消费价格指数累计(上年同期=100)
单位地区生产总值能耗(吨标准煤/万元)
生活消费支出合计(元)
农村人口比重(%)
自然增长率
(‰)
2000年预期寿命(岁)
自然保护区面积(万公顷)
工业总产值(亿元)
本、专科在校学生数(人)
地区生产总值(亿元)
北京市
105.3
0.606
8847.81
15.00
3.50
76.10
13.4
11039.13
586685
12153.03
天津市
103.9
0.836
4192.60
21.99
2.60
74.91
15.4
13083.63
405968
7521.85
河北省
104.9
1.640
3067.89
57.00
6.50
72.54
56.7
24062.76
1060450
17235.48
山西省
104.8
2.364
3057.14
54.01
4.89
71.65
114.0
9249.98
547391
7358.31
内蒙古自治区
104.7
2.009
3396.10
46.60
3.96
69.87
1383.2
10699.44
351928
9740.25
辽宁省
104.7
1.439
3861.38
39.65
0.97
73.34
264.6
28152.73
852467
15212.49
吉林省
104.4
1.209
3510.34
46.68
1.95
73.10
224.0
10026.55
530975
7278.75
黑龙江省
105.5
1.214
3992.79
44.50
2.06
72.37
617.5
7301.60
708935
8587.00
上海市
104.7
0.727
9642.98
11.40
2.70
78.14
9.4
24091.26
512809
15046.45
江苏省
105.4
0.761
5332.19
44.40
2.56
73.91
56.5
73200.03
1653427
34457.30
浙江省
105.2
0.741
7493.89
42.10
4.63
74.70
25.7
41035.29
866496
22990.35
安徽省
105.3
1.017
3233.63
57.90
6.47
71.85
52.8
13312.59
877782
10062.82
福建省
104.9
0.811
4512.94
48.60
6.20
72.55
50.6
16762.82
606284
12236.53
江西省
104.8
0.880
2934.10
56.82
7.89
68.95
110.1
9783.96
793488
7655.18
山东省
104.2
1.072
4100.44
51.68
5.62
73.92
109.7
71209.42
1592974
33896.65
河南省
105.5
1.156
2996.19
62.30
4.99
71.54
75.2
27708.15
1368813
19480.46
湖北省
105.5
1.230
3033.37
54.00
3.48
71.08
99.3
15567.02
1249061
12961.10
湖南省
105.9
1.202
3303.88
56.80
6.11
70.66
112.1
13507.64
1016833
13059.69
广东省
105
0.684
4441.43
36.60
7.26
73.27
355.2
68275.77
1334089
39482.56
广西壮族自治区
106.5
1.057
2548.23
60.80
8.53
71.29
142.9
6880.04
528342
7759.16
海南省
106.6
0.850
2456.24
50.87
8.96
72.92
281.3
1057.45
142082
1654.21
重庆市
105.2
1.181
2458.54
48.41
3.70
71.73
90.1
6772.90
484199
6530.01
四川省
106.1
1.338
3384.59
61.30
2.72
71.20
873.9
18071.68
1035934
14151.28
贵州省
105
2.348
1888.12
70.11
6.96
65.96
95.3
3426.69
299072
3912.68
云南省
103.7
1.495
2217.61
66.00
6.08
65.49
284.1
5197.45
393601
6169.75
西藏自治区
104.9
1860.77
76.20
10.24
64.37
4140.3
51.60
30264
441.36
陕西省
105.3
1.172
3088.38
56.50
4.00
70.07
104.6
8470.40
893748
8169.80
甘肃省
106.8
1.864
2231.88
67.35
6.61
67.47
754.1
3770.38
361490
3387.56
青海省
108.8
2.689
2675.31
58.10
8.32
66.03
2182.2
1080.35
43782
1081.27
宁夏回族自治区
107.1
3.454
2782.18
53.90
9.68
70.17
50.7
1461.58
75564
1353.31
新疆维吾尔自治区
105.5
1.934
2459.08
60.15
10.56
67.41
2149.4
4001.12
241637
4277.05
数据来源:
2010年中国统计年鉴
2.聚类分析
2.1样品聚类
先对各省份进行样品聚类,笔者利用SAS9.1将这26个省份进行分类(除去西藏自治区、山东省、甘肃省、湖北省、浙江省),表2给出的是由Ward方法聚成4类时的分类结果。
表2由Ward方法聚成4类时的分类结果
CLUSTER
Province
CLUSNAME
Province
CLUSNAME
CLUSTER=4
江苏省
CL15
广东省
CL15
CLUSTER=3
北京市
CL22
上海市
CL22
CLUSTER=2
安徽省
CL5
湖南省
CL5
陕西省
CL5
吉林省
CL5
重庆市
CL5
河北省
CL5
河南省
CL5
黑龙江省
CL5
江西省
CL5
福建省
CL5
辽宁省
CL5
山西省
CL5
内蒙古自治区
CL5
四川省
CL5
天津市
CL5
CLUSTER=1
广西壮族自治区
CL4
海南省
CL4
贵州省
CL4
云南省
CL4
青海省
CL4
新疆维吾尔自治区
CL4
宁夏回族自治区
CL4
表2给出了四个类的具体省份,其中第四类包含江苏省、广东省,第三类包含北京市、上海市,第二类包含安徽省、湖南省、陕西省、吉林省、重庆市、河北省、河南省、黑龙江省、江西省、福建省、辽宁省、山西省、内蒙古自治区、四川省、天津市,第一类包含广西壮族自治区、海南省、甘肃省、新疆维、青海省、宁夏回族自治区。
第三类第四类属于经济发达的地区,第二类属于经济较发达的地区,第一类属于经济欠发达的中部和西部偏远地区。
2.2变量聚类
接下来对各质变进行变量聚类,笔者利用SAS9.1将这十个指标进行变量聚类,表3(A)和表3(B)给出了变量聚类的结果。
表3(A)偏斜主分量聚为6个类时的汇总结果
Cluster
Members
Variation
Explained
Explained
Eigenvalue
1
3
3
2.632067
0.9574
0.2466
2
3
3
2.752998
0.9677
0.2258
3
1
1
1
1
4
1
1
1
1
5
1
1
1
1
6
1
1
1
1
表3(B)偏斜主分量聚为6个类时的汇总结果
表3表明当变量被分裂为6类时,每一类的类分量所解释的方差都超过了95%,最小的类1解释的比例也达到了95.74%,此时迭代结束,也即分类结束。
分类结果是类1含有变量x3、x4、x6,类2含有变量x8、x9、x10,类3含有变量x7,类4含有变量x2,类5含有变量x1,类6含有变量x5。
3.判别分析
利用Fisher判别法对待判组待判组:
西藏自治区、山东省、甘肃省、湖北省、浙江省进行判别,得出的结果如下表4。
表4第一典型变量与第二典型变量之间的散点图
由第一典型变量与第二典型变量之间的散点图可以看到,浙江省和山东省均落到了第四类经济发达地区,甘肃省和西藏自治区落到了第一类经济欠发达地区,湖北省落到了第二类经济较发达地区。
四.结果分析及政策建议
针对以上的的聚类和判别结果,我们可以看出,经济发达地区和经济欠发达的地区还是存在很大差距的,由聚类的结果可以看出江苏省、广东省,北京市、上海市等地区是经济发达的地区,而广西壮族自治区、海南省、甘肃省、新疆维、青海省、宁夏回族自治区等地处于经济欠发达状态,为了能够促进经济的增长,各地区各部门应该针对本地区的地理形势及产业结构特点做出适时调整。
第一.国际金融危机冲击使2009年成为新世纪以来我国经济社会发展最为困难的一年,我们必须把保持经济平稳较快发展作为经济工作的首要任务,立即果断实施有力的宏观经济政策,保持经济平稳较快发展的总体态势。
国际金融危机没有根本改变世界经济中长期发展趋势,我们必须坚持对外开放的基本国策,推动经济全球化朝着均衡、普惠、共赢方向发展,拓展我国发展的外部空间。
必须把保持我国经济当前平稳较快发展和为长远发展营造良好条件有机结合起来,应对国际金融危机冲击的政策措施不仅要着力保持经济平稳较快发展,而且要努力从国际国内两个方面为我国经济长远发展营造良好条件。
我们立足扩大内需保增长,在扩大内需中增强经济发展协调性,加强保障和改善民生工作,通过深化改革开放增强经济社会发展活力,进一步营造我国发展的良好外部环境。
在全党全国共同努力下,我们在应对国际金融危机冲击、保持经济平稳较快发展方面取得明显成效,我国经济实现总体回升向好。
第二.加快经济发展方式转变是适应全球需求结构重大变化、增强我国经济抵御国际市场风险能力的必然要求,是提高可持续发展能力的必然要求,是在后国际金融危机时期国际竞争中抢占制高点、争创新优势的必然要求,是实现国民收入分配合理化、促进社会和谐稳定的必然要求,是适应实现全面建设小康社会奋斗目标新要求、满足人民群众过上更好生活新期待的必然要求。
我们只有加快经济发展方式转变,才能实现我们党对全国各族人民作出的庄严承诺,更好满足广大人民群众日益增长的物质文化需要。
第三.党的十七大提出了加快转变经济发展方式的战略任务,强调要促进经济增长由主要依靠投资、出口拉动向依靠消费、投资、出口协调拉动转变,由主要依靠第二产业带动向依靠第一、第二、第三产业协同带动转变,由主要依靠增加物质资源消耗向主要依靠科技进步、劳动者素质提高、管理创新转变。
国际金融危机使我国转变经济发展方式问题更加突显出来,国际金融危机对我国经济的冲击表面上是对经济增长速度的冲击,实质上是对经济发展方式的冲击。
综合判断国际国内经济形势,转变经济发展方式已刻不容缓。
我们必须见事早、行动快、积极应对,为我国加快转变经济发展方式、保持经济平稳较快发展增添推动力。
第四.加快推进经济社会协调发展,针对社会发展和民生领域的突出问题,大力推进以改善民生为重点的社会建设,加快提高教育现代化水平,加快实施扩大就业的发展战略,加快社会保障体系建设,加快发展面向民生的公益性社会服务,更好推进经济社会协调发展。
加快发展文化产业,在重视发展公益性文化事业的同时,坚持经济效益与社会效益相统一,深化文化体制改革,加快公共文化服务体系建设,加快发展经营性文化产业,加快开拓文化市场。
加快推进对外经济发展方式转变,坚持对外开放的基本国策,坚持互利共赢的开放战略,统筹好国内发展和对外开放,加快调整出口贸易结构,加快调整进口贸易结构,加快提高利用外资质量和水平,加快实施“走出去”战略,不断提高开放型经济水平。
第五.加快推进农业发展方式转变,坚持走中国特色农业现代化道路,加快构建粮食安全保障体系,加快构建现代农业产业体系,加快推进农业科技创新,加快推进农业经营体制机制创新,大幅提高农业综合生产能力,大幅降低农业生产经营成本,大幅增强农业可持续发展能力,全面提高农业现代化水平,扎实推进社会主义新农村建设。
加快推进生态文明建设,深入实施可持续发展战略,大力推进资源节约型、环境友好型社会建设,加快推进节能减排,加快污染防治,加快建立资源节约型技术体系和生产体系,加快实施生态工程,推动整个社会走上生产发展、生活富裕、生态良好的文明发展道路。
第六.加快推进经济结构调整,把调整经济结构作为转变经济发展方式的战略重点,按照优化需求结构、供给结构、要素投入结构的方向和基本要求,加快调整国民收入分配结构,加快调整城乡结构,加快推进城镇化,加快调整区域经济结构和国土开发空间结构,既着眼于化解过去积累的矛盾和问题,又为经济不断迈上新台阶、长期保持平稳较快发展创造条件。
加快推进产业结构调整,适应需求结构变化趋势,完善现代产业体系,加快推进传统产业技术改造,加快发展战略性新兴产业,加快发展服务业,促进三次产业在更高水平上协同发展,全面提升产业技术水平和国际竞争力。
加快推进自主创新,紧紧抓住新一轮世界科技革命带来的战略机遇,更加注重自主创新,加快提高自主创新能力,加快科技成果向现实生产力转化,加快科技体制改革,加快建设宏大的创新型科技人才队伍,谋求经济长远发展主动权、形成长期竞争优势,为加快经济发展方式转变提供强有力的科技支撑。
参考文献
[1]于秀林,任雪松.多元统计分析[M].北京:
中国统计出版社,1999.
[2]龚艳萍,吴岳红.统计分析方法在市场调研前期的应用[J].数理统计与管理,2003,(24).
[3]黄劲松.聚类分析在品牌市场定位研究中的应用[J].数理统计与管理,2005,
(1).
[4]王冉.《基于判别分析法的上市公司财务危机预测模型的研究》,《财经论坛》2009年第1期.
[5]RichardA.Johnson,DeanW.Wichern.《实用多元统计分析》.清华大学出版社.2004.
[6]国家统计局.《2010年中国统计年鉴》.中国统计出版社.2010.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 判别分析