基于聚类分析方法对陕西省各地市经济发展的统计分析毕业论文.docx
- 文档编号:8700707
- 上传时间:2023-02-01
- 格式:DOCX
- 页数:17
- 大小:1.14MB
基于聚类分析方法对陕西省各地市经济发展的统计分析毕业论文.docx
《基于聚类分析方法对陕西省各地市经济发展的统计分析毕业论文.docx》由会员分享,可在线阅读,更多相关《基于聚类分析方法对陕西省各地市经济发展的统计分析毕业论文.docx(17页珍藏版)》请在冰豆网上搜索。
基于聚类分析方法对陕西省各地市经济发展的统计分析毕业论文
---文档均为word文档,下载后可直接编辑使用亦可打印---
摘要
社会经济的发展决定着城市的影响力,城市影响力又是指一个城市与其他城市相比在国内竞争中所表现出来的综合能力的强弱,所具有的自身创造财富和推动地区、国家或世界创造更多社会财富的能力。
城市影响力综合反映了城市的生产能力、对外经济辐射能力和人才的吸引能力。
通过对陕西省各城市的综合经济实力、基础设施水平、资金融通能力、对外经济能力、管理水平、科技实力、教育与人口素质进行比较排名,主要采用聚类分析法,划分区域,得出陕西十座城市的社会经济的发展水平。
本文主要采用了系统聚类分析法和K均值法进行聚类分析。
关键词:
城市影响力;陕西省;城市;系统聚类分析;K均值聚类分析
Basedontheclusteringanalysismethodandstatisticanalysistotheshaanxiprovinceeconomicdevelopmentaroundthecity
Abstract
Thedevelopmentofsocialeconomydeterminestheinfluenceofthecity,cityinfluenceisreferstoacitycomparedwithothercitiesinthedomesticcompetitionisshownbythestrengthofthecomprehensiveability,havetheirowntocreatewealthandpromoteregional,national,ortheabilitytocreatemoresocialwealthintheworld.Cityinfluencereflectsthecomprehensiveproductioncapacityofthecity,foreigneconomicradiationabilityandtheabilitytoattracttalent.BasedonthecomprehensiveeconomicstrengthofeachcityinShanxiProvince,infrastructurelevel,financingability,foreigneconomicability,managementlevel,strengthofscienceandtechnology,educationandcomparerankingthequalityofthepopulation,mainlyUSEStheclusteringanalysismethod,dividedarea,concludedthatsocialandeconomicdevelopmentlevelof10citiesinshaanxiprovince.ThisarticlemainlyUSESthesystemclusteringanalysismethodandthek-meansmethodofclusteringanalysis.
Keywords:
urbaninfluence;Shaanxiprovince;City;Systemclusteringanalysis;K-meansclusteringanalysis
一、绪论
(一)课题背景及目的
陕西省是我国中部地区的重要省份,近年来经济发张程度较快,到2013年底,其国内生产总值已经达到了14451亿元,在全国各省市、自治区中位居第16位,位于内蒙古自治区和黑龙江之间。
由于各市资源拥有程度不一、区位条件不同、经济基础差别较大、国家政策等因素的影响,省内各地市间存在着明显的发展差异,经济发展程度很不均衡,如何准确地为陕西省各地市的经济发展程度定位,是一个关系到陕西省实施经济发展战略的重要问题。
我们使用多元统计分析中的系统聚类分析法和K均值聚类分析法,较系统、客观的反映陕西省各地市的经济发展情况,比较陕西省各地市的经济发展程度。
增速位居全国第一方阵,总量跻身中等发达省份行列。
初步测算,“十二五”期间,我省地区生产总值年均增长11%,保持了高于全国3个百分点以上的较快发展态势,经济增速继续位居全国第一方阵。
地区生产总值在2010年突破万亿元大关后,继续保持较快增长态势,2013年突破1.5万亿元,2015年突破1.8万亿元。
“十二五”期间年均增加1600多亿元,较“十一五”年均增量多360亿元。
在全国的位次,继“十一五”期间连续前移3位后,又于2012年超过黑龙江前移至16位,2015年有望再次实现赶超,跻身全国中等发达省份行列。
人均生产总值突破8000美元,达到中等收入国家水平。
2010年我省人均生产总值突破4000美元;“十二五”期间于2011年突破5000美元、2012年突破6000美元;2014年突破7000美元、约折合7640美元,是“十一五”末的1.7倍,首次超过全国平均水平,达到中等收入国家水平;初步测算,2015年突破8000美元。
人均GDP自2012年起稳居全国第14位。
投资总量超过规划目标,基础设施显著改善。
初步测算,“十二五”期间,我省全社会固定资产投资累计超过7.8万亿元,超过规划目标0.8万亿元,年均增长20.8%,总量是“十一五”时期的3倍。
其中,基础设施投资累计约1.6万亿元,约占投资总量的21%,一批基础设施项目建设稳步推进,西客专、西安地铁2号线南段等项目建成投用,引汉济渭、东庄水库建设取得突破进展,2014年全省高速公路里程4466公里、民用航线698条、铁路营业里程4924公里,分别较2010年增加1063公里、340条、474公里,“西安一日经济圈”半径逐年扩大。
工业投资累计约2.4万亿元,其中能源化工工业投资累计约1.3万亿元,分别约占投资总量的31%和17%,全球首套煤油气资源综合转化项目和国内首个煤电铝镁合金一体化项目建成投产,备受瞩目的三星闪存芯片项目如期量产,西部最大的智能终端生产基地中兴1500万部手机项目开工,大飞机、新舟系列客机和无人机项目同步推进。
(二)课题的相关原理
K-MEANS算法:
输入:
聚类个数k,以及包含n个数据对象的数据库。
输出:
满足方差最小标准的k个聚类。
处理流程:
(1) 从n个数据对象任意选择k个对象作为初始聚类中心;
(2) 循环(3)到(4)直到每个聚类不再发生变化为止
(3) 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;
(4) 重新计算每个(有变化)聚类的均值(中心对象)
k-means算法接受输入量k;然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:
同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。
聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
k-means算法的工作过程说明如下:
首先从n个数据对象任意选择k个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。
一般都采用均方差作为标准测度函数.k个聚类具有以下特点:
各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。
它是一种重要的人类行为;聚类与分类的不同在于,聚类所要求划分的类是未知的;聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
聚类分析的目标就是在相似的基础上收集数据来分类。
聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。
在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。
传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。
采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
从机器学习的角度讲,簇相当于隐藏模式。
聚类是搜索簇的无监督学习过程。
与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。
聚类是观察式学习,而不是示例式的学习。
从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。
而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。
聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。
二、陕西各地经济发展分析
(一)经济概览
陕西的人口从2005年的3690万增加到2014年的3775万,占全国总人口的比例为2.77%,省市人口排名在第16位和17位间波动,陕西的人口增长速度低于全国水平;陕西的国民生产总值从2005年的3676亿元增长到2014年的17690亿元,全国总产值占比从1.85%上升到2.58%,省市的总产值排名中从第21位上升到第16位;陕西的人均产值达到4.686万元,在省市排名中从在第23位上升到第14位;人均收入1.657万元从第27位上升到第21位;人均消费1.26万元,排名在第24位上升到第20位。
“十二五”期间,我省大力改善消费环境,全省消费品市场体系日趋完善,消费热点不断显现,消费规模持续扩大。
初步测算,“十二五”全省累计实现社会消费品零售总额2.59万亿元,是“十一五”时期的2.2倍,年均增长15.5%;2015年社会消费品零售总额约6570亿元,相当于“十一五”时期社会消费品零售累计总额的57%,在全国位次,由2010的第20位升至第17位。
初步测算,“十二五”期间,我省工业增加值年均增长12.6%,高于同期生产总值增速1.6个百分点;总量连续突破5000亿元、6000亿元和7000亿元,2015年实现工业增加值7700亿元,是“十一五”末的1.7倍。
工业增加值占地区生产总值的比重保持较高水平,2013年最高达到46.8%,2015年占比42.7%,发展水平从工业化中期进入工业化后期。
延长石油、陕煤化进入世界500强。
主要工业产品稳定增长,2014年,原煤52008.2万吨,是2010年的1.4倍;天然原油3767.8万吨,是2010年的1.2倍;天然气产量突破400亿立方米、达到410.11亿立方米,较2010年翻了近一番;发电量1600.88亿千瓦时,是2010年的1.5倍;水泥及钢材产量分别达到9083.49万吨和1683.92万吨,均为2010年的1.7倍。
图表12005-2014陕西经济概览
(二)人口结构
图表22005-2014陕西人口结构
2014年陕西的城镇人口从1373万增长到1984万,占全国城镇人口的2.77%,在省市排名中位于第17位;陕西的农村人口从2316万减少到1790万,占全国农村人口的2.94%,省市排名第15位;陕西的城镇人口比例从37.23%增长到52.57%,在省市城镇人口比例的排名中位于第18位,低于全国平均水平(54.77%)。
从人口结构的发展上看,陕西的城镇人口增长较快,城镇人口比例已经超过了农村人口。
城镇人口的大幅度增长,反映出工业化和城镇化的发展进程较快。
(三)产业结构的发展
图表32005-2014陕西产业发展
从2005年到2014年,陕西国民经济总产值的复合增长率为19.62%,高于全国的15.41%的水平。
其中第一产业的复合增长率为15.13%高于全国水平(10.88%);第二产业的复合增长率为22.32%高于全国水平(15.09%);第三产业的复合增长率为17.24%低于全国水平(16.95%),低于第二产业发展速度。
陕西的第一产业产值是全省产值的10.152%,占全国第一产业的2.68%,全国排名从第21位上升到第18位,省内产值占比略低于全国水平(10.3%);第二产业的产值占全省产值的54.12%,全国第二产业占比2.98%,全国排名从第19位上升到第13位,省内产业占比高于全国水平(45.7%);第三产业的产值占全省产值的35.72%,占全国的2.14%,全国排名从第22位上升到第19位。
无论从产业发展速度,还是产业的产值占比看,第二产业都是陕西经济发展的支柱。
第二产业的高速发展,还将保持一段时间。
第三产业的发展高峰要等到第二产业的发展减缓后,才能到来。
(四)第二产业的发展
图表42005-2014陕西第二产业发展
第二产业主要包括工业和建筑业。
陕西工业发展速度为22.79%,高于全国水平(14.62%),全国排名从第18位上升到第13位,;陕西建筑业的发展速度为19.85%高于全国的发展速度(19.43%),全国排名从第16位上升到第12位。
从2005年到2014年之间,陕西的建筑业发展速度低于工业发展速度。
在陕西的第二产业中,工业的比重约为84.47%,低于全国的平均水平(86.4%);而建筑业占比为16.28%高于全国水平(13.99%)。
建筑业占比较高,反映出陕西的城镇化建设较为活跃,同时会在土地政策下,带动财产性收入的增长。
(五)第三产业的发展
图表52005-2014陕西第三产业
从发展速度来看,陕西省的批发零售增速18.16%,略低于全国水平(18.29%);金融业增速26.26%略低于全国水平(26.7%)、房地产增速17.84%,低于全国水平(19.43%)、交通运输的增速12.69%高于全国水平(11.83%)、住宿餐饮的增速(18.99%)高于全国水平(12.04%);零售批发、金融、房地产、住宿餐饮业的增速超过全省第三产业增速,其余产业低于第三产业增速。
交通运输和住宿餐饮业增速较快反映出人口流动较为活跃。
从产业占比的角度看,批发零售(22.17%,19.4%)、房地产(8.15%,12.21%),金融业(10.12%,13.46%)交通运输(14.04%,11.99%)、餐饮住宿(5.75%,3.66%)的总占比为60.25%,低于全国水平(60.72%)。
批发零售、交通运输、餐饮住宿的占比高于全国水平,其余产业省内占比,略低于全国水平。
陕西的第三产业增速略低于全国水平,交通语速、住宿餐饮业的发展速度较快,占比较高,反映出陕西的人口流动比较活跃。
(六)人均收入
图表62005-2014陕西人均收入
陕西省的人均可支配收入在2014年达到了1.657万元,低于全国人均收入水平;人均收入排名从第27位上升到第21位;其中城镇人口的人均收入达到了24366元,低于全国水平,全国排名从第24位上升到第17位;农村人口的人均收入达到了7359元,低于全国水平,全国排名在第28位上升到第26位。
陕西省人均收入增速(14.97%)高于全国增速(13.4%),城镇人均收入增速(12.33%)高于全国的城镇人均收入增速(11.88%);农村人均收入增速(13.11%)高于全国的农村人均收入增速(11.57%)。
从2005年到2014年,农村人均可支配收入的增长略高于城镇人均收入的增长速度
从城镇人口的收入来源看,工资性收入占比为69.76%,高于全国水平(65.83%),经营性收入占比为2.015%,低于全国水平(8.29%);财产性收入占比为1.96%,低于全国水平(3.08%);转移性收入占比为25.01%高于全国水平(22.7%);劳动性收入占比为73.68%略低于全国水平(74.13%)。
经营性收入占比较低,说明第三产业的活跃度较低。
2014年城镇财产性收入大幅度上升,工资性收入和转移性收入则出现了下跌,原因可能是统计局改变统计方式造成的。
工资性收入下降,说明了就业人口比例下降;财产性收入的增加可以反映出由于城镇建设活跃,房屋的拆迁收入大幅度提高。
转移性收入的减少,则反映出城镇的社会福利保障水平较为薄弱,另一方面也反映出一部分劳动人口,因为失去工作而失去的福利。
从农村人均收入来源看,工资性收入占比为42.1%,高于全国水平(40.38%);经营性收入占比为45.10%,低于全国水平(48.54%);资产性收入占比2.72%,低于全国水平(3.022%);转移净收入占比8.72%,略高于全国水平(8.06%);劳动性收入占比87.2%高于全国水平(88.92%)。
工资性收入占比较高,说明农村人口参与工业化和城镇化建设的资源较多。
资产性收入占比呈下降趋势说明,有土地政策带来的地产开发高峰已过;转移性收入占比提升,说明农村社会福利保障水平在提高。
陕西收入的城乡比为4.08,高于全国水平(3.434),其中工资收入的差距为6.873,高于全国水平(5.642),高于陕西自己的城乡比;经营性收入为0.36,低于全国水平(0.594);财产性收入比为3.39,略低于全国水平(3.62);转移性收入比11.9略高于全国水平(11.49)。
从整体收入水平上看陕西的城乡差别较大,特别是体现在工资性收入和转移性收入方面。
这反映出农村人口在工业化和城镇化建设的过程中获利较少,同时福利保障水平较低。
(七)人均消费
图表72005-2014陕西人均消费
2014年,陕西城镇人口的人均消费为17542元;农村人口的人均消费为7252元。
人均消费的城乡比例3.126,低于人均收入的城乡比例(4.08),高于全国的人均消费城乡差距(2.93)。
在城镇消费中,陕西的日常消费包括烟酒、食品、衣着、生活用品等,占整个消费的52.61%略高于全国水平(52.26%),居住消费占比10.56%低于全国水平(11.58%);交通通信占比10.93%低于全国水平(13.77%);教育文化娱乐占比14。
029%,高于全国水平(12.498%);医疗占比8.23高于全国水平6.765%。
陕西的教育文化娱乐在消费支出中占比较高,反映出在收入增长较快的情况下,主动性消费的增长优先级较高
2014年,居住的消费出现大幅度的增长,对日常消费、教育文化娱乐消费支出起到了一直的左右从而抑制了其他消费的增长,这可能和统计局调整统计方法有关,不过也反映出如果住房费用增高,对其他消费产生的影响。
在农村消费中,日常生活占比为46.38%,低于全国水平52.18%;居住消费占比20.26%高于全国水平(18.03%);交通通信占比为9.39%低于全国水平(10.605%);教育文化娱乐占比为11.3%,高于全国水平(9.04%),医疗占比为10.43%,高于全国水平(7.656%)。
交通通信占比较低,说明人口流动的活跃性较小;教育文化娱乐占比较高,反映出在收入增长较快的情况下,主动性消费的优先级较高。
陕西城乡消费差距呈下降趋势。
(八)产值的分配
产值的分配反映出劳动和生产创造出的价值如何通过收入、支出等方式,在各个行业经行重新分配的过程,在这个过程中,价值的分配是否合理,最终会影响到经济的可持续发展。
图表82005-2014陕西产值分配
陕西省的消费产值比为30.13%,略低于全国水平(30.79%);陕西的收入产值比为39.43%低于全国水平45.69%,;陕西的消费收入比为76.197%,高于全国水平(67.56%)。
陕西的收入产值比较低,说明产值在本省的分配比例较低。
消费收入比较高,说明在收入增长较快的情况下,也带动了消费的快速增长,特别是教育文化娱乐产业的快速增长。
三、确定地区影响力的要素
(一)确定相关要素
通过以往大型报刊杂志发表的相关城市影响力排名的指标的分析,我们选取了人口、第一产业产值、第二产业产值、第三产业产值、财政收入、非公有制经济产值、全年城镇居民人均可支配收等共计20余个指标作为本次试验的变量要素
(二)搜集相关数据
通过登录各市统计局网站获取各市2013年经济发展公报,对其中的数据进行抄录、统计
(三)对数据进行整理
经过整理,我们得到如下数据:
四、运用SPSS软件进行分析
(一)系统聚类分析法进行聚类分析
我们首先使用SPSS中的利用系统聚类法进行聚类分析
进行相关的设置后,我们得到如下运行结果:
运行结果解释:
从树形图中看到,若将城市分为三类,则西安为一类,其余城市为一类;若城市分为两类,则分成西安和咸阳、宝鸡、榆林以及其余城市三类
(二)K-均值分析法进行聚类分析
我们这次使用SPSS中的利用K均值法进行聚类分析
进行相关的设置后,我们得到如下运行结果:
从上图看到本次聚类过程共经历2次迭代,在经历第二次迭代后,类中心的变化为0,从而停止迭代。
ClusterMembership
CaseNumber
城市
Cluster
Distance
1
西安
1
.000
2
延安
2
2630.874
3
榆林
3
2730.174
4
商洛
2
1709.252
5
安康
2
1633.964
6
汉中
2
1387.060
7
铜川
2
2682.809
8
渭南
3
3023.351
9
咸阳
3
1983.702
10
宝鸡
3
2182.631
上图中Cluster列出了各观测量所属的类别,Distance给出了观测量与所属类中心的距离
DistancesbetweenFinalClusterCenters
Cluster
1
2
3
1
20151.069
16145.805
2
20151.069
5440.482
3
16145.805
5440.482
综上述,我们看出10个城市被分为三类,省会西安独占鳌头,延安、商洛、安康、汉中、铜川紧接其后,其余城市在第三梯队。
五、结论
通过聚类分析及K均值聚类分析法对上述城市的影响力进行分析,我们可以得出如下结论:
西安市的综合实力领跑全省,作为中原地区的核心城市,具有经济、文化、地理、交通等优势,其次是宝鸡市、咸阳市、榆林市也具有较大的影响力,这些地区资源丰富,交通方面也有较强的优势,然后是渭南市、汉中市、延安市、安康市、商洛市、铜川市,其中铜川市远远落后其余同类城市,这主要与其人口基数较少有着直接的关系。
西安,作为陕西唯一的特大城市属于综合水平高而环境质量整理水平较低型城镇化城市。
西安的新型城镇化水平在全省领先,其中,西安中心城市集聚发展水平指数是全省平均水平的两倍多,也远超第2名咸阳。
由于中心城市强大的辐射和集聚效应,使得人口、资源、生产过度集中的同时,也给城市环境带来了巨大压力,空气质量达标率连续两年位居全省末位。
咸阳市新型城镇化水平仅次于西安市排第2位,属于以中心城市集聚发展引领为突出特征的相对均衡型城镇化。
一方面,咸阳的中心城市集聚发展水平排全省第2位,处于领先地位;另一方面,咸阳的四大方面综合指标没有明显落后的弱项。
在中心城市集聚发展水平中,人均GDP居各市首位。
宝鸡市具有中心城市集
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 聚类分析 方法 陕西省 各地 经济发展 统计分析 毕业论文