应用多元统计分析论文.docx
- 文档编号:25612351
- 上传时间:2023-06-10
- 格式:DOCX
- 页数:14
- 大小:38.30KB
应用多元统计分析论文.docx
《应用多元统计分析论文.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析论文.docx(14页珍藏版)》请在冰豆网上搜索。
应用多元统计分析论文
RevisedonNovember25,2020
应用多元统计分析论文
山东省十一城市综合实力统计分析
摘要:
本文根据中国城市经济发展研究中心提出的城市综合经济实力和区域的概念,并利用2009年各城市社会经济发展状况的截面数据,就山东省11市的经济数据进行分析。
首先建立了评价的指标体系,其次,分别采用主成分分析法和聚类分析法对山东省根据行政区域划分的11个市的综合经济实力进行了全面的评价和比较,并在此基础上提出了促进山东各市经济协调发展、共同进步的相关措施。
关键词:
城市经济主成分分析聚类分析
一、引言
在区域经济发展中,城市处于核心和龙头的地位,提高城镇化水平、加快城市化进程是解决当前和未来一系列问题的关键。
山东经济发展显示出不平衡的态势,鲁东的少数几个城市GDP几乎占据全省三分之二[1]。
很显然,山东省各市的城市化水平也存在显着差异,青岛、济南等的城市化水平始终走在全省乃至全国前列,泰安和滨州则相对落后。
随着黄河三角洲经济一体化进程的加快,山东作为沿海省份必须清楚的看到发展差异并找出差异形成的原因,通过核心城市的优先发展带动区域经济和社会的快速发展,是现实提出的急需解决的问题。
为此,本文在参阅相关文献的基础上,根据中国城市经济发展研究中心提出的城市综合经济实力以及区域的概念,根据区域的行政划分,从山东省11个市出发,利用2009年各城市社会经济发展状况的截面数据,首先建立了评价指标体系,其次,分别采用主成分分析法和聚类分析法对山东省11个市的综合经济实力进行了综合的评价和排位,并在此基础上提出了促进山东省各市经济协调发展、共同进步的相关措施。
面对区域差距带来的影响,山东省应该继续加大固定资产投资的力度,在制定区域发展策略时应该加强区域间的交流和合作,促进各地区优势互补,共同发展。
同时,也要积极鼓励引进外资和开拓国际市场,加快与国际经济的接轨和融合。
另外,还要继续扩大中心城市的规模,在积极建设环渤海产业带的同时,不断加强鲁西和鲁中产业带的建设,提高中心城市的综合竞争力,扩大其对周围地区的辐射和带动作用,最终逐步缩小区域差距,促进各地区和谐发展、共同繁荣。
城市综合经济实力是指城市所拥有的全部实力、潜力及其在国内外经济社会中的地位和影响力。
从此定义可以看出,评价城市综合实力应使用城市经济总量,它应该包括国内生产总值、固定资产状况、社会消费水平、外贸出口水平、交通运输能力、通讯设施状况、地方财政实力、人才科技状况及社会医疗保障水平等统计指标[2]。
二、山东省各地区的模型经济分析
本文选取了以下10项指标来构建评价体系。
X1:
人均生产总值(元);X2:
地区生产总值(亿元);X3:
财政收入占GDP的比重(%);X4:
第三产业产值比重(%);X5:
全社会固定资产投资总额(亿元);X6:
社会消费品零售总额(亿元);X7:
出口总额(亿元);X8:
货运总量(万吨)(铁路+公路+水运);X9:
每万人中科技人员数(人/万人);X10:
每万人医院卫生院床位数(个/万人)[1]。
本文以山东省11个市作为样本,选用上述10个评价指标,则评价样本矩阵为表1。
表1—11个市的变量矩阵
城市
X1
X2
X3
X4
X5
X6
X7
X8
X9
X10
青岛
60414
22536
济南
56771
济宁
43129
淄博
36829
16604
烟台
48236
潍坊
46936
10205
日照
30496
威海
32813
泰安
26076
东营
34244
14400
滨州
22053
3622
山东省统计局.山东省统计年鉴—2010[M].中国统计出版社
1、主成分分析法
主成分分析法是通过恰当的数学变换,使新变量主成分成为原变量的线性组合,并选取少数几个在变差总信息量中比例较大的主成分来分析事物的一种方法。
主成分在变差信息量中的比例越大,它在综合评价中的作用就越大[3]。
以两个指标来衡量
个样本的简单情况为例。
个样本之间的变量信息用离差平方和表示,则综合评价时的总变差为:
将原始指标数据进行标准化(这里标准化以后的变量均值为0,方差为1)。
由于原始数据有不同的含义,且量纲不同,这样经过标准化以后使数据集中每个变量的变化范围大体相同,这样再进行分析具有很强的客观性[3]。
标准化以后的数据用
,
,
…
表示(如表2)。
设有n个样本,p项指标,可得数据矩阵
表示n个样本,
表示p个指标,
表示第
个样本的第
项指标值。
用
法[3]对数据进行标准化变换:
式中
表2—原始数据标准化后的结果
Z01
Z02
Z03
Z04
Z05
Z06
Z07
Z08
Z09
Z10
对标准化后的数据进行主成分分析[1]
表3—特征根和方差贡献率表
TotalVarianceExplained(总方差解释)
Component(成份)
InitialEigenvalues
(初始特征值)
ExtractionSumsofSquaredLoadings
(提取平方和载入)
Total
(合计)
%ofVariance
(方差的%)
Cumulative%
(累计%)
Total
(合计)
%ofVariance
(方差的%)
Cumulative%
(累计%)
1
2
3
.772
4
.300
5
.211
6
.093
.929
7
.069
.690
8
.014
.136
9
.002
.018
10
.001
.008
从表3可以看出,前2个主成分的累计方差贡献率达到%(>85%),选择2个主成分已足够。
且经过主成分分析后,这2个主成分是相互独立的,这对分析带来很大的客观性。
表4—因子载荷阵
ComponentMatrixa
Component
1
2
VAR00001
.964
.095
VAR00002
.870
VAR00003
.933
.122
VAR00004
.431
.787
VAR00005
.980
VAR00006
.912
.259
VAR00007
.946
VAR00008
.847
.194
VAR00009
.868
VAR00010
.744
根据表4可得这2个主成分的表达式为;
Y1=*X1+*X2+*X3+*X4+*X5+*X6+*X7+*X8+*X9+*X10
Y2=*X1-*X2+*X3+*X4-*X5+*X6-*X7+*X8-*X9-*X10
从上述表达式可看出第2主成分在第4个指标上的系数相对较大,在第9个、第10个2个指标上的权重为负,其含义是有第三产业越大和只有较少的知识分子、较少的病床将获得较大的数值。
第2主成分排序,结果见表5.
表5
名次
主成分分析法
城市
1
青岛
2
济南
3
烟台
4
潍坊
5
济宁
6
淄博
7
日照
8
东营
9
威海
10
泰安
11
滨州
2、聚类分析法
聚类分析(ClusterAnalysis)就是分析如何对样品(或变量)进行量化分类的问题。
通常聚类分析分为Q型聚类和R型聚类。
Q型聚类是对样品进行分类处理,R型聚类是对变量进行分类处理[4]。
首先对数据进行正规化,计算公式为:
Xi'=(Xi-Xmin)/(Xmax-Xmin)
公式中Xi'为正规化后的值,Xi为原值,Xmax为最大值,Xmin为最小值。
进行正规化后,0≤Xi'≤1。
所有参与聚类分析的指标数据见下表。
表6—正规化后的变量
城市
青岛
1
1
1
1
1
1
1
济南
1
1
1
济宁
0
淄博
烟台
潍坊
0
0
日照
威海
泰安
0
0
东营
滨州
0
0
0
0
0
根据上表的数据,利用统计软件SPSS对山东的11个市进行聚类分析,得出如下结果(见表6)。
表6—11市的聚类分析结果
AgglomerationSchedule
Stage
阶
ClusterCombined
(群集组合)
Coefficients
(系数)
StageClusterFirstAppears
(首次出现阶群集)
NextStage
(下一阶)
Cluster1
(群集1)
Cluster2
(群集2)
Cluster1
(群集1)
Cluster2
(群集2)
1
8
10
.099
0
0
3
2
3
5
.187
0
0
5
3
7
8
.279
0
1
7
4
9
11
.413
0
0
8
5
3
4
.547
2
0
7
6
1
2
.765
0
0
10
7
3
7
.867
5
3
9
8
6
9
0
4
9
9
3
6
7
8
10
10
1
3
6
9
0
说明:
合并前从1~11依次表示青岛、济南、济宁、淄博、烟台、潍坊、日照、威海、泰安、东营、滨州。
11市经济区域划分聚类树状图
RescaledDistanceClusterCombine
CASE05
LabelNum+---------+---------+---------+---------+---------+
威海8─┬─┐
东营10─┘├─────┐
日照7───┘├───┐
济宁3─┬───┐││
烟台5─┘├───┘├───────────────────────────────────┐
淄博4─────┘││
泰安9───┬───────┐││
滨州11───┘├─┘│
潍坊6───────────┘│
青岛1───────┬─────────────────────────────────────────┘
济南2───────┘
从聚类分析的过程可得如下结论。
威海,东营同属北部地区,相似系数最大,最早聚合,明显为一类,然后两者聚为一类后又与东南地区的另一个城市日照聚为新的一类,这从侧面反映出了山东东部地区的经济存在很大程度上的相似性;济宁和烟台在发展上都应加强第三产业,发展程度也较相近,划为一类,两者在归为一类后于淄博合并成为新的一类;泰安,滨州的经济发展都比较落后,所面临的问题也最多,相似系数也比较大,因此归为一类;而潍坊最为特殊,从经济发展水平到产业结构等于其他城市差别有点大,难以成为一类;最后济南和青岛作为是对经济发展最好的两个城市归为一类。
三、模型分析和结果
评价一个地区的综合经济实力并进行比较,经济指标的选取非常重要,要有代表性地表现出城市的综合经济状况。
由于部分指标间有很强的相关性,因此在选取时不必选取过多的指标[5]。
通过比较、筛选,最后选取10个指标,获得了较准确满意的结果。
采取了两种评价分析模型,每种分析各有特色。
就单一评价分析来说,评价结果虽然有些差异,但综合来看呈现出一致性,较好的说明了山东地区间综合经济实力的排名。
综合起来看,相对发达和落后地区的差异还是比较大的,说明山东各市经济发展水平不平衡,需要采取相应政策和措施,实现全省各县市经济的快速、协调发展。
首先,济南作为省会城市,是山东省政治、经济、文化的中心。
青岛,华东地区重要的工业基地和对外贸易口岸,黄河三角洲东翼经济中心,排名第一。
这两个城市的得分远远高于其他城市,说明城市规模的大小和城市化程度的高低与经济增长有直接的关系。
济南经济实力非常雄厚,但企业盈利能力有待加强。
而青岛则是工业基地、加工基地和物资集散地,能大量吸引技术应用型人才,具有很大的发展潜力,在发展工业的同时还要更加重视第三产业的发展。
烟台,潍坊,济宁,淄博得分比较相近,存在问题却各异。
济宁要注意扶持农业的发展,利用其旅游资源带动第三产业的进步,采取多种手段吸引人才,要充分意识到人力资本对改善地区经济差距的作用;淄博除了注意调整产业结构和发展教育外,还要注意固定资产投资的回报问题;烟台要加大财政投入,加强基础设施建设,刺激消费,发展第三产业;潍坊企业盈利能力较差,有待加强。
威海,东营是环渤海地区发展比较好的城市,在发展经济的同时要分别注意增加财政投入、刺激消费和吸引人才。
日照土地产出率很低,这与该市本身人多地少有关,另外日照劳动生产率不高,说明还要进一步形成规模,以先进技术带动效率提升。
泰安,滨州的经济基础相对薄弱,要想全省均衡发展就必须以强带弱,支持省内欠发达地区发展,加大投资和政府间转移支付。
欠发达地区要充分利用资源、区位等优势,特别是劳动成本低的优势,承接发达地区的产业梯度转移,建成资源加工型和劳动密集型为主体的。
在此,我们再结合文中确定的经济实力判别原则将经济区域做如下分类(见表12)。
表12各市经济发展情况分类表
经济发展程度
地市级
特发达地区
青岛、济南
较发达地区
烟台,潍坊,济宁,淄博
正常发展地区
威海,东营,日照
欠发达地区
泰安,滨州
四、参考文献
[1]山东省统计局.山东省统计年鉴—2010[M].中国统计出版社
[2]欧向军.区域经济发展差异理论、方法与实证———山东省为例[M].经济科学出版社
[3]苏金明,傅荣华,周建斌,张莲花.统计软件SPSSforWindows实用指南[M].电子工业出版社
[4]朱建平.应用多元统计分析.科学出版社
[5]何晓群.现代统计分析方法与应用[M].中国人民大学出版社
学号
经济管理学院
学年论文
题目
山东省十一城市综合实力统计分析
专业班级
2009级统计学一班
学生姓名
崔泽利
指导教师
杨立勋
职称
教授
2012
年
3
月
22
日
经济管理学院学年论文成绩评定表
学院:
经济管理学院班级:
2009级统计学一班学生姓名:
崔泽利学号:
项目
分值
优秀
(100%>x≥90%)
良好
(90%>x≥80%)
中等
(80%>x≥70%)
及格
(70%>x≥60%)
不及格(x<60%)
评分
参考标准
参考标准
参考标准
参考标准
参考标准
写作态度
15
写作态度认真,研究作风科学严谨。
保证论文完成时间并按任务书中规定的进度开展各项工作
写作态度比较认真,研究作风严谨良好,能按期圆满完成任务书规定的任务
写作态度尚好,遵守组织纪律,保证论文时间,能按期完成各项工作
写作态度尚可,能遵守组织纪律,能按期完成任务
写作马虎,纪律涣散,工作作风不严谨,不能保证论文时间和进度
调查调研
20
调查调研方案可行,开展和取得的效果很好
调查调研方案可行,开展和取得的效果好
调查调研方案可行,开展和取得的效果较好
调查调研方案基本可行,取得了一定的效果
调查调研方案基本不可行
论证能力
30
论点鲜明,论据确凿,论文表现出对实际问题有很强的分析能力和概括能力,文章材料翔实可靠,说服力很强
论点正确,论据可靠,对实际问题有较强的分析能力和概括能力,文章材料比较翔实可靠,有一定的说服力
观点正确,论述有理有据,对实际问题有一定的分析能力,材料能说明观点
观点正确,对实际问题有一定的分析能力,材料基本能说明观点
基本观点有错误或主要材料不能说明观点
创新
10
有重大改进或独特见解,有一定实用价值
有较大改进或新颖的见解,实用性尚可
有一定改进或新的见解
有一定见解
观念陈旧
论文撰写质量及规范化
25
结构严谨,逻辑性强,层次清晰,语言准确,文字流畅,语言准确、生动,完全符合规范化要求,书写工整,用计算机打印成文
结构合理,符合逻辑,文章层次分明,语言准确,文字流畅,符合规范化要求,书写工整,用计算机打印成文
结构合理,层次较为分明,文理通顺,用词比较准确,达到规范化要求,书写比较工整,用计算机打印成文
结构基本合理,逻辑基本清楚,文字尚通顺,达到规范化要求
内容空泛,结构混乱,文字表达不清,错别字较多,达不到规范化要求
指导教师评定成绩:
指导教师签名:
年月日
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 论文