每日读 Microsoft Word 文档.docx
- 文档编号:30724605
- 上传时间:2023-08-19
- 格式:DOCX
- 页数:28
- 大小:119KB
每日读 Microsoft Word 文档.docx
《每日读 Microsoft Word 文档.docx》由会员分享,可在线阅读,更多相关《每日读 Microsoft Word 文档.docx(28页珍藏版)》请在冰豆网上搜索。
每日读MicrosoftWord文档
陕西省各地区经济差异的多元统计分析
摘要
本文通过多元统计分析的方法,对陕西省各地区主要的经济指标进行因子分析和方差分析,进而可以得出陕西省12个城市的经济发展水平的差异,由因
子分析的结果可知,这12个城市的综合经济实力从大到小的排名依次为西安、榆林、咸阳、宝鸡、延安、渭南、汉中、安康、商洛、铜川、杨林。
由方差分析的结果可知,以西安为中心,根据地理位置将这11个城市划分为四个地区:
西安以东的地区(渭南)、西安以南的地区(商洛、汉中,安康)、西安以西的地区(宝鸡、杨林)、西安以北的地区(榆林、延安、咸阳、铜川)这四个地区的经济发展趋于稳定。
根据分析的结果我们可以为陕西省经济的稳步发展出一份薄力。
关键词经济指标:
因子分析方差分析
ThemultivariatestatisticalanalysisofShanxiregionaleconomicdisparities
Abstract
BymultivariatestatisticalanalysismethodShanxiregionofthemaineconomicindicatorsforfactoranalysisandanalysisofvariance.thuscanreach12citiesinShanxiProvinceinthelevelofeconomicdevelopment,rangingfromfactoranalysisoftheresults,This12citiesintheoveralleconomicstrengthofthesmallestorderoftherankingsXian,Yulin,Xianyang,Baoji,Yanan,Weinan,Hanzhong,Ankang,Shangluo,Tongchuan,Yanglin.Byanalysisofvariancetotheresults,withXianatthecenter,accordingtothislocation12citiesisdividedintofourareas:
theareatotheeastofShanxi(Weinan),intheareasouthofShanxi
(Hanzhong,Ankang,Shangluo)shanxiwestoftheregion(Baoji,Yanglin),theareatothenorthofShanxi(Yulin,Yanan,Xianyang,Tongchuan)Thefourareasofeconomicdevelopmenthasbecomestable.AccordingtotheresultsoftheanalysiswewillbeabletoShanxiissteadyeconomicdevelopmentofathinedge.
Keywords:
Economicindicators:
FactoranalysisAnalysisofvariance
第一页
1引言
那几年陕西省经济得到了快速发展,但发展中还是碰到了很多问题,各个城
市的经济水平还存在很大的差异,为了准确弄清楚陕西省主要的12个城市的经
济差异,我们利用因子分析对各个地区的综合经济实力进行比较分析,然后再利
用方差分析对各个地区的整体实力进行比较,为湖北今后的经济发展提供一些比
较科学的发展方案。
2分析方法介绍
2.1因子分析
因子分析模型是主成分分析的推广。
它也是利用降维的思想,由研究原始变
量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几
个综合因子的一种多变量统计分析方法。
相对于主成分分析,因子分析更倾向于
描述原始变量之间的相关关系;因此,因子分析的出发点是原始变量的相关剧增。
因子分析的思想始于1904年查尔斯·斯皮尔曼对学生考试成绩的研究。
近年来,
随着电子计算机的高速发展,人们将因子分析的理论成功地应用于心理学、医院、
气象、地质、经济学等各个领域,也使得因子分析的理论和方法更加丰富。
2.1.1基本思想
因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变
量之间相关性较高,而不同组的变量间的相关性则较低。
每组变量代表一个基本
结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。
对于
所研究的某一具体问题,原始变量就可以分解成两部分之和的形式,一部分是少
数几个不可测的所谓公共因子的线形函数,另一部分是与公共因子无关的特殊因
子。
2.1.2因子分析的模型
①查尔斯·斯皮尔曼提出因子分析时用到的例子
①一般因子分析模型;舍有n个样品,每个样品观察p个指标,这p个指标之间
第二页
间有较强的相关性(要求p个指标相关性较强的理由是很明确的,只有相关性较
强才能从原始变量中提取出“公共”因子)。
为了便于研究,并消除由于观测量
纲的差异及数量级不同所造成的影响,将样本观测数据进行标准化处理,使标准
化后的变量均值为0,方差为1。
2.1.3因子分析的步骤
①确定因子载荷:
主成分法、主轴因子法、最小二乘法、极大似然法、α因子提取法等。
由于这些方法求解因子载荷的出发点不同,所得的结果也不完全
相同,为此我们就本论文所用到的主成分法寻找公共因子的方法做详细介绍。
主成分寻找公共因子的方法如下:
假定从相关阵出发求解主成分,没有p个变量,
则我们可以找出p个主成分。
将所得的p个主成分按由大到小的顺序排列,记为
Y1,Y2,...YP,则主成分与原始变量之间存在如下关系式:
(1)
式中,
为随机向量X的相关矩阵的特征值所对应的特征向量的分量,因为特γ
征向量之间彼此正交,从X到Y的转换关系是可逆的,很容易得出由Y到X的
转换关系为:
(2)
式只保留前m我们对上面每一等个主成分而把后面的部分用
代替,则㈡式可
变为:
(3)
第三页
这个式子在形式上已经与因子模型相一致,且Y(i1,2,,m)之间相互独立,为
了把
转化成合适的公因子,现在要做的工作只是把主成分
变为方差为1的变L量。
为完成此变换,必须将
除以其标准差(即为特征根的平方根
。
于是,
令
,则(三)式变为:
(4)
这与因子模型完全一致,这样,就得到了载荷A矩阵和一组初始公因子(未旋
转)。
②因子旋转:
因子旋转分为正交旋转与斜交旋转,正交旋转由初始载荷矩阵A
左乘一正交阵而得到。
经过正交旋转而得到的新的公因子仍然保持彼此独立的性
质。
而斜交旋转则放弃了因子之间彼此独立这个限制,因而可能达到更为简洁的
形式,其实际意义也更容易解释。
但不论是正交旋转还是斜交旋转,都应当使新
的因子载荷系数要么尽可能地接近与零,要么尽可能地远离零。
③因子得分:
因子得分就是公共因子在每一个样品点上的得分。
根据因子得
分我们可以知道那个城市的经济发展水平要高,那个城市的经济发展水平要底。
2.2方差分析
方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平
方和
及其自由度
分别分解成相应的若干部分,然后求各相应部分的变异;
再用各部分的变异与组内(或误差)变异进行比较,得出统计量
值;最后根
据
值的大小确定
值,作出统计推断
方差分析的检验假设
为各样本来自均数相等的总体,
为各总体均数不
等或不全相等。
若不拒绝
时,可认为各样本均数间的差异是由于抽样误差所致,而不是由于处理因素的作用所致。
理论上,此时的组间变异与组内变异应相等,两者的比值即统计量
为1:
由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。
若拒绝
,接受
时,可认为各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。
此时的组间变异远大于组内变异,两者的比值即统计量
明显大于1。
在实际应用中,当统计量
值远大于1且大于某界值时,拒绝
接受
,即意味着各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。
方差分析的用途①两个或多个样本均数间的比较;②分析两个或多个因素间
第四页
的交互作用;③回归方程的线性假设检验;④多元线性回归分析中偏回归系数的
假设检验;⑤两样本的方差齐性检验等。
3问题分析
我们给出2003年陕西省12个城市的主要经济指标,借助这些指标体系对陕西省8个城市的经济差异作出分析。
然后以西安为中心,根据地理位置将这8个城市划分为四个地区:
西安以东的地区(渭南)、西安以南的地区(汉中、安康、商洛)、西安以西的地区(宝鸡)、西安以北的地区(榆林、延安、咸阳),用方差分析对这四个地区的经济进行分析比较。
4数据处理过程
表给出的是2003年陕西省8个城市的主要经济指标,为了得出它们的经济的差异,我用多元统计方法里面的因子分析和方差分析对这些数据进行处理。
表1陕西省12个城市的经济指标
西安宝鸡延安榆林咸阳长安
116621797136********005233276724145671257000
28043685065646530974079494735242
31177883628756891590261487407022
42439891413739612392268252712
547201318042500513450329236
6133449381474692308076145231924749001525809
775502164236026973051223
813299713139********108135********4921517867
96364596642615450102324766
106228215394188315700184********25293657
11169546829337842291104869323523407
12542.7929.6433.2667.3373.7634.3
134273330505228592389514535953241888
1474986176181181693072810125240
16651320011220523284297877
1734577969638016933105412301
1887516260506920891721873811
1949053172332418523499267703130
2044841364600399721139025127833120
21263328464838
续表
安康兴平汉中杨凌铜川商洛
114776385471510833273403603919001123200
2430071889044589200952882728627
3685275034293455511374619063329
41892119157207205362105
533345007791304282968
6138********491026481772512857711149358
72251175417118368282429
8138********979496462029622768611147595
941262903542185733603999
10176192180018406077213529127703186524
1134891258805703925665833425822
1214.7733.725.0611.576.0620.18
14691037639111346651004342
155514947416023151116
1619401549154976254215937
17539554415001524224801527
18285255986147008720400011000
1921144195265113320600176461704
20261281860044700146001320023732
21282320181942
注:
数据来源于《2004年中国统计年鉴》
其中1—地区生产总值(单位:
万元)2—地方财政一般预算内收入(单位:
万元)3—地方财政一般预算内支出(单位:
万元)4—当年合同外资金额(单
位:
万美元)5—环境污染治理投资额(单位:
万元)6—工业总产值(单位:
万元)7—建成区绿化覆盖面积(单位:
公顷)8—产品销售收入(单位:
万元)
9—邮政业务总量(单位:
万元)10—固定资产投资完成额(单位:
万元)11
—房地产开发投资完成额(单位:
万元)12—商品房屋销售面积(单位:
万平
方米)13—全年新增固定资产(单位:
万元)14—全年供水总量(单位:
万立
方米)15—年末实有铺装道路总面积(单位:
万平方米)16—园林绿地面积(单
位:
公顷)17—工业废水排放总量(单位:
万吨)18—液化石油气供气总量(单
位:
吨)19—高等学校学生数(单位:
人)20—各类专业技术人员(单位:
万
人)21—医院、卫生院数(单位:
个)
第六页
4.1因子分析的结果
由于经济指标太多,不利于我们进行问题的分析,因此我们需要对其进行
降维处理。
用
软件可得到上述经济指标的相关系数矩阵,除了少数指标之
间的相关性较低外,其他指标之间均有较强的相关性(全部大于0.3),故可以做
因子分析。
表2相关系数矩阵
athismatrixisnotdefinite
续表
1112131415161718192021
1.827.852.650.610.684.165.556.450.126.772.839
第七页
2.868.875.755.539.636-.022.653.340.285.836.723
3.881.903.790.509.709-.025.631.284.335.857.724
4.652.649.887.225.474-.114.540.194.176.982.543
5-.160.080.003.404-.078-.234.503.457-.196.322.164
6.676.560.171.623.368.475.284.287.070.395.555
7.729.717.460.337.756.472.518.482.102.592.750
8.609.417.100.484.229.536.137.163.047.305.410
9.588.758.290.784.582.055.632.505.233.505.690
10.772.737.992.158.520-.107.392-.028.195.930.572
111.000.826.718.331.587.186.477.093.435.759.545
13.718.6841.000.073.482-.095.310-.076.136.903.552
14.331.610.0731.000.260-.105.454.343-.068.313.591
15.587.638.482.2601.000.478.357.265.023.522.780
16.186.022-.095-.105.4781.000-.322-.112-.302-.065.349
17.477.611.310.454.357-.3221.000.629.375.524.319
18.093.126-.076.343.265-.112.6291.000.177.192.249
19.435.148.136-.068.023-.302.375.1771.000.229-.347
20.759.733.903.313.522-.065.524.192.2291.000.603
21.545.770.552.591.780.349.319.249-.347.6031.000
继续用
软件得到因子分析的结果,见下表:
表3总方差解释解释表
TotalVarianceExplained
第八页
Comp
onent
InitialEigenvalues
ExtractionSumsofSquaredLoadings
RotationSumsofSquaredLoading
Total
%of
Variance
Cumulati
ve%
Total
%of
Variance
Cumulati
ve%
Total
%of
Variance
Cumulati
ve%
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
11.135
2.861
2.386
1.582
1.131
.981
.396
.303
.144
.081
4.02E-016
3.82E-016
2.71E-016
1.83E-016
1.27E-016
1.67E-018
-1.68E-016
-2.44E-016
-2.84E-016
-9.76E-016
-3.31E-015
53.023
13.625
11.361
7.534
5.388
4.672
1.886
1.441
.685
.385
1.91E-015
1.82E-015
1.29E-0150
8.70E-016
6.04E-016
7.96E-018
-8.02E-016
-1.16E-015
-1.35E-015
-4.65E-015
-1.57E-014
53.023
66.648
78.009
85.543
90.931
95.603
97.489
98.930
99.615
100.000
100.000
100.000
100.000
100.000
100.000
100.000
100.000
100.000
100.000
100.000
100.000
11.135
2.861
2.386
1.582
1.131
53.023
13.625
11.361
7.534
5.388
53.023
66.648
78.009
85.543
90.931
7.751
3.903
3.276
2.515
1.649
36.911
18.588
15.600
11.978
7.853
36.911
55.499
71.099
83.077
90.931
ExtractionMethod:
PrincipalComponentAnalysis
从表中我们可以看到,当保留五个公共因子时,公共因子可以解释原始变量90.931%的方差,这样就把一个二十一维的问题降至五维。
同时
软件还给出了因子载荷矩阵,见下表:
表4因子分析的成分矩阵
ComponentMatrix(a)
Component
1
2
3
4
5
1
.967
.143
.004
-.002
.010
2
.965
-.117
.030
.085
-.014
3
.964
-.181
-.028
.094
.041
4
.790
-.469
.005
-.216
-.074
5
.195
-.020
.710
-.475
-.173
6
.672
.621
-.039
.196
-.303
7
.837
.322
-.095
.027
.310
8
.531
.637
-.137
.231
-.389
9
.806
.277
.326
.093
.061
10
.790
-.527
-.272
-.098
-.089
11
.876
-.053
-.278
.353
-.100
12
.909
-.041
-.044
-.003
-.096
13
.734
-.554
-.331
-.148
-.077
14
.571
.373
.455
-.108
-.365
15
.717
.144
-.265
-.152
.525
16
.123
.677
-.586
-.113
.215
17
.642
-.159
.603
.132
.185
18
.362
.225
.672
.050
.441
19
.207
-.329
.154
.862
.108
20
.864
-.384
-.048
-.121
-.120
21
.805
.254
-.137
-.460
.087
Undefinederror#11401-Cannotopentextfile"E:
\SPSS\en\windows\spss.err":
Nosuchfileordirecta5componentsextracted第十页
由上表可以写出特殊因子忽略不计时的因子模型,以第一行为例,有:
标准化地区生产总值≈0.967×fac1+0.143×fac2+0.004×fac3-0.002×fac4+0.010×fac5
此时所得未旋转的公因子实际意义不好解释,对公因子进行方差最大化旋转,得到其旋转矩阵:
表5旋转后因子成分矩阵
RotatedComponentMatrix(a)
Component
1
2
3
4
5
1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 每日读 Microsoft Word 文档 每日