应用多元统计分析课程论文.docx
- 文档编号:80806
- 上传时间:2022-10-02
- 格式:DOCX
- 页数:13
- 大小:148.38KB
应用多元统计分析课程论文.docx
《应用多元统计分析课程论文.docx》由会员分享,可在线阅读,更多相关《应用多元统计分析课程论文.docx(13页珍藏版)》请在冰豆网上搜索。
安徽科技学院《应用多元统计分析》课程设计论文
《应用多元统计分析》课程论文
论文题目:
《江苏省各地区物流产业发展的综合评价》
姓名:
熊海帆
学院:
信息与网络工程学院
专业:
信息与计算科学
班级:
2013级1班
学号:
指导教师:
张家昕
2015年11月30日
安徽科技学院教务处
工厂搬迁对于一个企业来说,安全问题始终是第一位的,也是最基本的,过程中所涉及到的安全问题主要是人员的安全和设备拆装以及财产的安全。
各部门经理和所有员工一定要以安全为核心,开展各项工作,职责到人、分工明确。
摘要
现代意义上的物流管理出现在20世纪80年代,人们发现利用跨职能的流程管理的方式去观察,分析和解决企业经营中的问题非常有效,通过分析物料从原材料运到工厂,流经生产线上每个工作站,企业可以消除很多看似高效率却实际上降低了效率的局部优化行为。
物流产业的实质体现为技术密集和劳动密集相结合,是具有第三产业特征的跨地区、跨行业、跨部门特点的产业形式。
物流产业对经济增长,特别是区域经济增长和区域产业协作的推动,都有着不可替代的重大意义,在区域经济、产业布局研究过程中,都不能忽视物流产业在其中的基础保障作用。
本文在构建江苏省沿江地区物流产业发展综合指标体系的基础上,运用多元统计分析中的主成分分析方法,因子分析作为比较,判断本问题哪种方法更为适合,对江苏省沿江地区20个地市的物流发展现状进行了综合评价,为江苏省各地市物流产业主管部门制定相应政策提供一定的理论依据,旨在提高江苏省沿江地区整体物流发展水平。
【关键词】主成分分析;因子分析;物流产业;综合评价
一、引言
随着经济全球化持续发展、科学技术水平不断提高以及专业化分工进一步深化,经济的快速增长对物流业产生了巨大的需求,促使物流业以及与物流相关的交通运输、仓储配送和邮电通信业等都有较快的发展。
同时,作为经济增长的“加速器”物流业的快速发展将会改变国民经济增长方式,降低国民经济的运行成本,促进了经济的可持续发展。
物流对于经济增长的影响以及物流业与经济增长之间的关系已经成为物流领域的一个研究重点。
本文拟从主成分分析的角度出发,以江苏省数据为例来探讨哪些因素是物流发展的主要因素,对江苏省物流产业发展现状进行综合评价,从而为江苏省乃至全国的物流产业的发展提供一定的启示。
二、模型的建立
2.1主成分分析
主成分分析也称分量分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,由于多个变量之间往往存在着一定程度的相关性,因此从数学角度来看,这是一种降维处理技术。
以各个主成分为分量就得到一个更低维的随机向量。
因此通过主成分分析既可以降低维数又保留了原数据的大部分信息。
假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的数据矩阵
(1)
可是如此多的变量,我们如何从这么多变量的数据中抓住主要的变量作为指标呢?
要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。
为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。
那么,这些综合指标(即新变量)应如何选取呢?
显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好
如果记原来的变量指标为,,…,,它们的综合指标——新变量指标为,,…,(≤)。
则
(2)
在
(2)式中,系数由下列原则来决定:
(1)与(≠;,=1,2,…,相互无关);
(2)量。
是,,…,的一切线性组合中方差最大者;是与不相关的,,…,的所有线性组合中方差最大者;……;是与,,……都不相关的,,…,的所有线性组合中方差最大者。
这样决定的新变量指标,,…,分别称为原变量指标,,…,的第一,第二,…,第主成分。
其中,在总方差中占的比例最大,,,…,的方差依次递减。
在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上分析可以看出,找主成分就是确定原来变量(=1,2,…,)在诸主成分(=1,2,…,)上的载荷(=1,2,…,;=1,2,…,),从数学上容易知道,它们分别是,,…,的相关矩阵的m个较大的特征值所对应的特征向量。
主成分分析是社会经济问题中研究应用最多的多元统计方法之一,其原理是利用降维的思想,在保证原始数据信息损失最小的前提下,将原来指标重新组合成一组新的互相无关的几个综合指标,这几个综合指标是原始指标的线性组合。
并且保留了原始指标的主要信息,彼此间又互不相关,使复杂的问题简单化,抓住主要矛盾进行分析。
基本步骤为:
确定分析变量,收集数据;原始数据的标准化处理;由标准数据求协方差矩阵;求R的特征值、特征向量和主成分的方差贡献率;提取主成分;求主成分分值,计算综合分值。
2.1.1数据选取以及指标来源
根据上文主成分分析的基本原理,本文以江苏省为例,考虑到统计数据可获得性,本文选取“地区生产总值”作为物流需求规模影响指标;选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素。
具体选择的指标为:
:
地区生产总值,单位:
亿元;
:
第一产业产值,单位:
亿元;
:
第二产业产值单位:
亿元;
:
第三产业产值单位:
亿元;
:
公路里程,单位:
公里;
:
以及车辆拥有量,单位:
万辆;
其中,三大产业不仅考虑了区域经济总量,还考虑了江苏省经济结构对物流需求规模影响。
(具体的原始数据见表1所示)
表12013年江苏省各地区6项主要指标
地 区
江苏省区
3825.76
98.72
1694.96
2032.08
7581
63.85
江阴市
1713.19
32.21
1028.40
652.58
2347
14.47
常州市区
1919.42
44.11
1098.67
776.64
3859
29.56
常熟市
1230.70
26.93
691.77
512.00
3042
13.51
张家港市
1402.00
19.98
870.32
511.70
1452
11.52
太仓市
612.01
24.66
355.35
232.00
1168
6.41
南通市区
1144.90
41.32
652.70
450.88
3051
15.91
启东市
359.50
49.29
188.48
121.73
2639
4.30
如皋市
355.15
36.97
198.28
119.90
2997
4.31
海门市
415.00
33.43
247.97
133.60
2256
4.03
扬州市区
830.87
19.77
483.79
327.31
1898
9.59
仪征市
227.29
13.05
137.27
76.97
1457
1.90
江都市
402.08
32.63
228.04
141.41
2116
3.64
镇江市区
741.26
16.51
442.62
282.13
1476
7.73
丹阳市
502.21
29.38
285.37
187.46
1991
4.55
扬中市
213.48
7.56
125.84
80.08
958
1.82
句容市
215.12
21.60
119.25
74.27
2307
1.56
泰州市区
458.53
11.79
291.89
154.85
1045
4.77
靖江市
364.43
15.41
214.69
134.33
1182
3.38
泰兴市
337.07
27.01
193.23
116.83
1967
3.26
数据来源:
江苏省统计年鉴2013
2.1.2先用因子分析对数据处理
我们要考虑的是:
如何根据这些经济指标,对各个地区进行综合评价与排序?
因子分析也是一种降维,简化数据的技术。
它通过研究众多变量之间的内部依赖关系,探求观察数据中的基本结构,在研究江苏省沿江地区物流发展示所涉及的指标很多,过多的指标容易导致分析过程复杂化。
一个合适的做法就是从这些关系错综复杂的经济指标中提取少数几个主要因子,每个主要因子都能反映相互依赖的社会经济指标见共同作用,因此选取“公路里程以及民用汽车拥有量”作为物流供给的影响因素;选取“第一、第二、第三产业的产值”作为产业结构的影响因素,抓住这些主要因素就可以帮我们对复杂的物流发展问题进行深入分析,合理解释和正确评价。
2.1.3因子载荷的统计
对于因子模型:
我们可以得到与的协方差为
设因子载荷矩阵为,称第列元素的平方和,即
为公因子对的贡献,即表示同一公共因子对各变量所提供的方差贡献之总和,它是衡量每一个公共因子相对重要性的一个尺度。
三、模型求解
3.1以因子分析的结果进行主成分分析
(一)主要运算结果分析
变量共同反映每个变量对所提取的所有公共因子的依赖程度,此数值是因子载荷阵中每行的因子载荷的平方和,提取的因子个数不同,变量共同程度也不同。
从标准化数据出发,我们先计算这些指标的主成分,然后通过主成分的大小进行排序,对原始数据进行标准化处理。
计算特征值、方差贡献率以及各指标的相关系数矩阵。
利用SAS9.1.3软件对标准处理的数据进行处理。
特征值、方差贡献率的结果如表2所示,各指标的相关系数矩阵的特征值如表3所示,各地区的综合得分如表4所示,
表2方差分析表
主成分
初始特征值
提取的主成分载荷的平方和
特征值
方差贡献率%
累计方差贡献率%
特征值
方差贡献率%
累计方差贡献率%
1
5.4298
90.50
90.50
5.4298
90.50
90.50
2
0.4658
7.76
98.26
0.4658
7.76
98.26
3
0.0587
0.98
99.24
4
0.0361
0.60
99.84
5
0.0096
0.16
100.00
6
0
0
100.00
提取方法:
主成分法
提取主成分。
如表2所示,利用因子分析的结果进行主成分分析,提取前2个特征值的主成分,这两个主成分的累计方差贡献率达到98.26%,表明提取的前2个主成分可以基本反映全部6个指标所具有的信息,能在一定程度上说明区域物流产业发展的综合因素,从特征向量我们可以写出6个主成分的具体形式如下:
Prin1=0.x1+0.x2+0.x3+0.x4+0.x5+0.x6
Prin2=-0.x1+0.x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 多元 统计分析 课程 论文