因子分析主成分分析.docx
- 文档编号:5492681
- 上传时间:2022-12-17
- 格式:DOCX
- 页数:12
- 大小:135.17KB
因子分析主成分分析.docx
《因子分析主成分分析.docx》由会员分享,可在线阅读,更多相关《因子分析主成分分析.docx(12页珍藏版)》请在冰豆网上搜索。
因子分析主成分分析
《公共管理定量分析》实验报告
实验完成者
谭希荣
班级
2010公共事业管理2班
学号
20100710030231
实验时间
2013年5月8日
一、
实
验
名
称
因子分析、主成分分析
二、实验目的
学习利用SPSS进行因子分析、主成分分析
三、实验内容
1、(因子分析)对2008年重庆市40个区县经济发展基本情况进行分析,选择合适的分析变量,找出影响地区社会经济发展水平的主要因子,并对各地区发展水平进行综合评价或者对各地区经济发展状况进行分类。
2、(主成分分析)调查美国50个州7种犯罪率,这七种犯罪是:
murder(杀人罪),rape(强奸罪),robbery(抢劫罪),assault(斗殴罪),burglary(夜盗罪),larceny(偷盗罪),auto(汽车犯罪),很难直接从这七个变量出发来评价各州的治安和犯罪情况,试作主成份分析.说明选几个主成分合适,找出几个主成分,并按照第一、第二主成分分别对50个周进行排名,并解释之。
四、实验结果及分析
一、因子分析
基本操作:
1、选择Analyze→Data Reduction→Factor,打开Factor Analysis主对话框;选择变量X1~X8,单击向右箭头,将其选入到Variable框中;
2、分别点Descriptives按钮,选Coefficients复选框,输出相关系数;选中KMO and Bartlett’s test of sphericity复选框,检验因子分析的适用条件;点Rotation按钮,选Varimax复选框,选择方差最大化旋转方法;单击Scores按钮选Display factor score coefficient matrix,显示因子得分函数系数矩阵;选Save as variable;
结果如下:
分析:
由上图可知,KMO值为0.684,说明对数据做因子分析的效果一般。
分析:
由旋转后的因子载荷矩阵可知,公共因子F1在X1工业总产值(万元), X3建筑业总产值(万元),X4地方财政预算内收入(亿元),X5非农业人口(万人),X6公路货运量(万吨),X7城镇化率(%)上的载荷值比较大。
其中X1,X6反映区县工业发展规模,X3反映区县建筑业发展情况,X5,X7是反映各区县规模的指标。
因此F1为城镇规模及经济发展水平的公共因子。
公共因子F2在X8农村居民人均住房面积(平方米)的载荷值很大,是反映农村居民的住房条件,因此F2为城镇居民住房条件的公共因子。
公共因子F3在X2农业总产值(万元)的载荷值很大,而X2是反映各区县在农产业上的发展水平,因此F3为城镇农村经济水平的公共因子。
(三)计算因子得分
根据上面的特征根及累计贡献率表里的数据,计算因子得分。
公式即:
F=(52.806*F1+17.014*F2+15.731*F3)/85.551
得到下表:
区县
F1
F2
F3
F
渝中区
2.0085824
-4.611722
-1.487759
0.0490635
大渡口区
0.1498701
1.8816663
-1.892361
0.1187593
江北区
1.64237
-0.476049
-1.278366
0.6840075
沙坪坝区
1.7254144
0.8831068
-1.128461
1.0331334
九龙坡区
2.0235861
0.4443321
-1.137445
1.1282651
南岸区
1.2405791
1.6162233
-1.354465
0.8381123
北碚区
0.2811007
0.6698013
-0.862125
0.1481889
渝北区
2.108302
0.8531174
0.3984027
1.5442626
巴南区
0.7959491
0.4618641
0.5832678
0.6904002
万盛区
-0.591214
1.5481062
-1.321607
-0.30006
双桥区
-0.759264
-0.223325
-2.172893
-0.912615
涪陵区
1.1886477
-0.305687
1.2066198
0.8947657
长寿区
0.3383415
0.2594886
0.5552838
0.3625506
江津区
0.9586046
0.1656406
2.2570754
1.0396645
合川区
0.4681594
0.1615886
1.6708595
0.6283408
永川区
0.7814371
0.5108907
1.0632962
0.7794599
南川区
-0.52712
0.02489
0.2587358
-0.272837
綦江县
0.0608555
0.6262983
0.819511
0.3128088
潼南县
-0.451446
-0.82283
0.7436058
-0.30556
铜梁县
-0.402281
0.1021108
0.4183634
-0.151071
大足县
-0.323261
-0.052269
0.586983
-0.101993
荣昌县
-0.242523
-0.553114
0.6284929
-0.14413
璧山县
-0.307723
0.5929145
-0.242537
-0.116622
万州区
1.208766
-0.082082
1.5807293
1.0204439
梁平县
-0.820621
0.6699339
0.2797077
-0.321859
城口县
-1.174512
-0.746189
-0.914086
-1.041442
丰都县
-0.782163
-0.397765
0.0674657
-0.549487
垫江县
-0.518858
0.0621262
0.3842529
-0.237251
忠县
-0.665059
-0.194022
0.4639878
-0.363774
开县
-0.413475
0.2939536
1.1650703
0.017476
云阳县
-0.701102
-0.406246
0.508942
-0.419961
奉节县
-0.640789
-1.071816
0.4220999
-0.531067
巫山县
-0.849576
-0.808783
-0.32624
-0.745233
巫溪县
-1.150366
-0.229259
-0.489298
-0.845624
黔江区
-0.724426
-0.430677
-0.410488
-0.60828
武隆县
-0.996814
-0.185344
-0.432608
-0.731687
石柱县
-1.076066
0.6079976
-0.162321
-0.573129
秀山县
-0.995227
0.0091372
-0.319696
-0.671268
酉阳县
-0.98501
-0.258252
-0.053654
-0.669219
彭水县
-0.881669
-0.589757
-0.076341
-0.675533
分析:
结合40个区县在三个公共因子上的得分和综合得分,对重庆市这40个区县的社会经济发展水平进行评价。
在城镇规模及经济发展水平因子F1得分最高的依次是渝北区,九龙坡区,渝中区,沙坪坝区,江北区,其分数分别为2.11,2.02,2.01,1.73,1.64。
说明就城镇规模和经济发展水平而言,渝北区在重庆市这40各区县里是最好的,规模较大,经济发展也最好。
渝北区,九龙坡区,渝中区,沙坪坝区,江北区这几个个区县本来就属于重庆市1小时经济圈里,可想而知,经济发展各方面都应该是最好的。
在城镇居民住房条件因子F2得分最高的是大渡口区,南岸区,万盛区,沙坪坝区,渝北区,这些区县的农村居民人均住房条件比较好,其余的区县更应该加强住房方面建设。
而在城镇农村经济水平因子F3上得分最高的是江津区,合川区,万州区,涪陵区,开县,说明这些区县在农产业上发展较好,大力发展农业经济。
根据综合得分,分析各区县社会经济发展水平。
综合得分的前五名依次是渝北区,九龙坡区,江津区,沙坪坝区,万州区,得分最低的是武隆县,巫山县,巫溪县,双桥区,城口县。
结合前面的分析,可知渝北区,九龙坡区在整体的城镇规模和经济发展水平上较好,而那些周边区县的社会经济较差,在规模,农村经济发展水平以及居住方面的建设特别需要加强。
在本文中,渝中区由于农业产值指标值缺失,因此将它单独分析。
渝中区作为重庆市的经济实力最好的区县,是有目共睹的,只是在本文所选取的这几类指标未能更好体现出它的经济实力。
总的来说,要发展社会经济,要从各方面加强建设,不仅仅是经济反面,还有规模,基础设施,人民福利等等,做到协调可惜续发展才是最快最有效地措施。
二、主成分分析
按第一主成份排序的美国50个州(给出前5条和后5条):
按第二主成份排序的美国50个州(给出前5条和后5条):
结果分析。
从解释总方差表的输出结果可以看出,在最后一列累计贡献率中,前两个主成分的累计贡献率已达76.5%,前三个主成分的累计贡献率达86.9%,最终为100%。
因此可以考虑只取前面两个或三个主成分,它们能够很好地概括这组数据。
其中第一主成份分量的特征值为4.11496,其方差为2.87624,贡献率为4.11496/7=58.7851%,请注意七个主成份分量的特征值之和为7。
根据7个特征值和特征向量,我们可以写出由标准化变量所表达的
第一主成分为:
PRIN1=0.300279 murder + 0.431759 rape +0.396875 robbery +0.396652assault +
0.440157 burglary +0.357360arceny +0.295177auto
其中,murder等为标准化变量,即murder=(MURDER-7.444000000)/3.866768941。
各标准化指标murder等前的系数,与该主成分所对应的特征值之平方根的乘积是该主成分与该指标之间的相关系数,如PRIN1与MURDER 相关系数为0.300279 ×11496.4=0.609127。
第一主成分单独地说明整个原始数据标准变异的58.78%。
同样我们可以写出第二主成份为:
PRIN2=-0.629174muder-0.169435rape+0.042247robbery-0.343528asault+0.20334
1burglary+ 0.402319larceny+0.502421 auto
第二主成份为抢、盗罪(robbery,burglary,larceny和auto系数为正)与杀、淫罪(muder,rape和assault系数为负)的对比。
第一、第二主成份结合,可说明标准总变异的76.48%。
第一主成分对所有变量都有近似相等的载荷,因此可认为第一主成分是对所有犯罪率的总度量。
第二主成分在变量auto和larceny上有高的正载荷,而在变量murder和assault上有高的负载荷;在burglary上存在小的正载荷,而在rape上存在小的负载荷。
可以认为这个主成分是用于度量暴力犯罪在犯罪性质上占的比重。
第三主成分很难给出明显的解释。
在依PRIN1排序的结果表35.4中,排在前面的PRIN1值较小的州犯罪率较低,即北达科他NORTH DAKOTA(PRIN1= -3.96408)州犯罪率最低,PRIN1值较大的州,犯罪率较高,即内华达NEVADA(PRIN1= 5.26699)州犯罪率最高。
在依PRIN2排序的结果表35.5中,排在前面的PRIN2值较小州的暴力犯罪性质比重较大,即密西比比MISSISSIPPI(PRIN2= -2.54671)州的暴力犯罪性质比重最大,PRIN2值较大州的暴力犯罪性质比重较小,即麻萨诸塞MASSACHUSETTS(PRIN2= 2.63105)州的暴力犯罪性质比重最小。
结果分析。
可以看出,在最后一列累计贡献率中,前两个主成分的累计贡献率已达76.5%,前三个主成分的累计贡献率达86.9%,最终为100%。
因此可以考虑只取前面两个或三个主成分,它们能够很好地概括这组数据。
其中第一主成份分量的特征值为4.11496,其方差为2.87624,贡献率为4.11496/7=58.7851%,请注意七个主成份分量的特征值之和为7。
从表35.3中输出结果(d)中的7个特征值和特征向量,我们可以写出由标准化变量所表达的第一主成分为:
PRIN1=0.300279 murder + 0.431759 rape +0.396875 robbery +0.396652assault +
0.440157 burglary +0.357360arceny +0.295177auto
其中,murder等为标准化变量,即murder=(MURDER-7.444000000)/3.866768941。
各标准化指标murder等前的系数,与该主成分所对应的特征值之平方根的乘积是该主成分与该指标之间的相关系数,如PRIN1与MURDER 相关系数为0.300279 ×11496.4=0.609127。
第一主成分单独地说明整个原始数据标准变异的58.78%。
同样我们可以写出第二主成份为:
PRIN2=-0.629174muder-0.169435rape+0.042247robbery-0.343528asault+0.20334
1burglary+ 0.402319larceny+0.502421 auto
第二主成份为抢、盗罪(robbery,burglary,larceny和auto系数为正)与杀、淫罪(muder,rape和assault系数为负)的对比。
第一、第二主成份结合,可说明标准总变异的76.48%。
由于第一主成分对所有变量都有近似相等的载荷,因此可认为第一主成分是对所有犯罪率的总度量。
第二主成分在变量auto和larceny上有高的正载荷,而在变量murder和assault上有高的负载荷;在burglary上存在小的正载荷,而在rape上存在小的负载荷。
可以认为这个主成分是用于度量暴力犯罪在犯罪性质上占的比重。
第三主成分很难给出明显的解释。
在依PRIN1排序的结果表35.4中,排在前面的PRIN1值较小的州犯罪率较低,即北达科他NORTH DAKOTA(PRIN1= -3.96408)州犯罪率最低,PRIN1值较大的州,犯罪率较高,即内华达NEVADA(PRIN1= 5.26699)州犯罪率最高。
在依PRIN2排序的结果表35.5中,排在前面的PRIN2值较小州的暴力犯罪性质比重较大,即密西比比MISSISSIPPI(PRIN2= -2.54671)州的暴力犯罪性质比重最大,PRIN2值较大州的暴力犯罪性质比重较小,即麻萨诸塞MASSACHUSETTS(PRIN2= 2.63105)州的暴力犯罪性质比重最小。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 成分 分析