1、infrastructure level, financing ability, foreign economic ability, management level, stre-ngth of science and technology, education and compare ranking the quality of the po-pulation,mainly USES the clustering analysis method, divided area, concluded that soc-ial and economic development level of 10
2、 cities in shaanxi province. This article mainly USES the system clustering analysis method and the k-means method of clustering analysis.Key words: The influence ofcity;Shaanxi province;City; Hierachical Cluster ;the K-Means Cluster 目 录1 绪论 11.1课题背景及目的 11.2 课题的相关原理 12 确定城市影响力的要素 32.1确定相关要素 32.2搜集相关
3、数据 32.3对数据进行整理 33 运用SPSS软件进行分析 43.1 系统聚类分析法进行聚类分析 43.2 K-均值分析法进行聚类分析 54 结论 7参考文献 9 1 绪论1.1课题背景及目的陕西省是我国中部地区的重要省份,近年来经济发张程度较快,到2013年底,其国内生产总值已经达到了14451亿元,在全国各省市、自治区中位居第16位,位于内蒙古自治区和黑龙江之间。由于各市资源拥有程度不一、区位条件不同、经济基础差别较大、国家政策等因素的影响,省内各地市间存在着明显的发展差异,经济发展程度很不均衡,如何准确地为陕西省各地市的经济发展程度定位,是一个关系到陕西省实施经济发展战略的重要问题。我
4、们使用多元统计分析中的系统聚类分析法和K均值聚类分析法,较系统、客观的反映陕西省各地市的经济发展情况,比较陕西省各地市的经济发展程度1.2 课题的相关原理 K-MEANS算法:输入:聚类个数k,以及包含 n个数据对象的数据库。输出:满足方差最小标准的k个聚类。处理流程:(1) 从 n个数据对象任意选择 k 个对象作为初始聚类中心;(2) 循环(3)到(4)直到每个聚类不再发生变化为止(3) 根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象的距离;并根据最小距离重新对相应对象进行划分;(4) 重新计算每个(有变化)聚类的均值(中心对象)k-means 算法接受输入量 k ;然后将n
5、个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。k-means 算法的工作过程说明如下:首先从n个数据对象任意选择 k 个对象作为初始聚类中心;而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;然 后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);不断重复这一过程直到标准测度函数开始收敛为止。一般都采用均方差作为标准测度函数. k个聚类具有以下特点:各聚类本身尽可能的紧凑,而
6、各聚类之间尽可能的分开。聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为;聚类与分类的不同在于,聚类所要求划分的类是未知的;聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计
7、聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚
8、类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。2 确定城市影响力的要素2.1确定相关要素通过以往大型报刊杂志发表的相关城市影响力排名的指标的分析,我们选取了人口、第一产业产值、第二产业产值、第三产业产值、财政收入、非公有制经济产值、全年城镇居民人均可支配收等共计20余个指标作为本次试验的变量要素2.2搜集相关数据通过登录各市统计局网站获取各市2013年经济发展公报,对其中的数据进行抄录、统计2.3对数据进行整理经过整理,我们得到如下数据:3 运用SPSS软件进行分析3.1 系统聚类分析法进行聚类分析我们首先使用SPSS中的利用系统聚类法进行聚类分析进行相关的设置后,我们得到如下
9、运行结果:运行结果解释:从树形图中看到,若将城市分为三类,则西安为一类,其余城市为一类;若城市分为两类,则分成西安和咸阳、宝鸡、榆林以及其余城市三类3.2 K-均值分析法进行聚类分析我们这次使用SPSS中的利用K均值法进行聚类分析从上图看到本次聚类过程共经历2次迭代,在经历第二次迭代后,类中心的变化为0,从而停止迭代。Cluster MembershipCase Number城市ClusterDistance1西安 .0002延安 2630.8743榆林 2730.1744商洛 1709.2525安康 1633.9646汉中 1387.0607铜川 2682.8098渭南 3023.3519咸
10、阳 1983.70210宝鸡 2182.631上图中Cluster列出了各观测量所属的类别,Distance给出了观测量与所属类中心的距离Distances between Final Cluster Centers20151.06916145.8055440.482综上述,我们看出10个城市被分为三类,省会西安独占鳌头,延安、商洛、安康、汉中、铜川紧接其后,其余城市在第三梯队。4 结论通过聚类分析及K均值聚类分析法对上述城市的影响力进行分析,我们可以得出如下结论:西安市的综合实力领跑全省,作为中原地区的核心城市,具有经济、文化、地理、交通等优势,其次是宝鸡市、咸阳市、榆林市也具有较大的影响力
11、,这些地区资源丰富,交通方面也有较强的优势,然后是渭南市、汉中市、延安市、安康市、商洛市、铜川市,其中铜川市远远落后其余同类城市,这主要与其人口基数较少有着直接的关系。西安,作为陕西唯一的特大城市属于综合水平高而环境质量整理水平较低型城镇化城市。西安的新型城镇化水平在全省领先,其中,西安中心城市集聚发展水平指数是全省平均水平的两倍多,也远超第2名咸阳。由于中心城市强大的辐射和集聚效应,使得人口、资源、生产过度集中的同时,也给城市环境带来了巨大压力,空气质量达标率连续两年位居全省末位。咸阳市新型城镇化水平仅次于西安市排第2位,属于以中心城市集聚发展引领为突出特征的相对均衡型城镇化。一方面,咸阳的
12、中心城市集聚发展水平排全省第2位,处于领先地位;另一方面,咸阳的四大方面综合指标没有明显落后的弱项。在中心城市集聚发展水平中,人均GDP居各市首位。宝鸡市具有中心城市集聚引领和环境质量整理支撑型突出特征。宝鸡排位居前的主要还有城镇人均医院数排全省第3位。铜川和延安两市之间新型城镇化水平差别较大,主要体现在基础设施建设方面。榆林市具有单一中心城市集聚发展引领型特征。榆林市中心城市集聚发展水平不落后主要是中心城市的人均GDP、综合服务能力和城镇居民人均可支配收入支撑的结果。针对以上对陕西10个地市特点的分析,我们建议从以下方面来搞好陕西省的经济:1.经济发达地市要充分发挥其优势,西安作为全省的经济
13、中心要辐射全省;咸阳要进一步增强实力,以真正起到区域性中心城市的带动和辐射作用。2.在今后的经济发展中,如何从陕西省整体发展的角度协调各地市间的产业分工、制定互补的地市发展战略,充分考虑各地市现有的生产基础,突出各地市的产业特色,各展所长,协同发展,按照内在有机联系的,建立在分工与合作基础上的城市体系进行统一的布局和发展,将是本地市经济发展必须要考虑的因素。3.经济发展一般地市要加大在科技发展和城市基础设施建设方面的力度,增加这方面的投资和培养新的工业产业4.经济欠发达地市经济欠发达地市主要分布于陕北和汉中地区,本类地市各项主要经济指标均低于全省平均水平,这些地市要实现全面赶超,当务之急是加快基础设施建设,努力提高经济发展水平和经济实力。参考文献1 朱建平. 应用多元统计分析M. 北京: 科学出版社2008:1-192.2 于秀林,任雪松多元统计分析 M北京:中国统计出版社,1999:1-215.3 赵 静. 但 琦编.数学建模与数学实验(第二版)M北京:高等教育出版社,2003:1-167.4 陈超.邹滢 编著.SPSS 15.0中文版常用功能与应用实例精讲M.电子工业出版社.2009:1-173.