因子分析的步骤.docx
- 文档编号:24638472
- 上传时间:2023-05-29
- 格式:DOCX
- 页数:11
- 大小:66.63KB
因子分析的步骤.docx
《因子分析的步骤.docx》由会员分享,可在线阅读,更多相关《因子分析的步骤.docx(11页珍藏版)》请在冰豆网上搜索。
因子分析的步骤
因子分析的步骤
1、评价指标体系:
我国31个省市自治区2006年的6项主要经济指标数据:
人均GDP、财政收入、固定资产投资、年末总人口、居民消费水平、社会消费品零售总额
2、考察数据是否适合做因子分析
运用因子分析方法的前提是,变量之间存在线性的关系,这样才能够达到减少变量,方便分析的目的.通过变量的相关矩阵可知,大多数变量的相关系数大于0.3,具有较强的相关性。
相关矩阵
人均GDP
财政收入
固定资产投资
年末总人口
居民消费水平
社会消费品零售总额
相关
人均GDP
1.000
。
670
.362
-.091
.967
。
436
财政收入
.670
1。
000
。
832
.560
.693
。
924
固定资产投资
.362
.832
1。
000
。
783
.327
.932
年末总人口
-。
091
.560
.783
1。
000
—.066
。
771
居民消费水平
.967
。
693
.327
—。
066
1。
000
。
442
社会消费品零售总额
.436
.924
.932
。
771
.442
1.000
同时,对上述变量进行KMO测试度和Baetlett球体检验,见下表:
KMO和Bartlett的检验
取样足够度的Kaiser-Meyer—Olkin度量。
。
695
Bartlett的球形度检验
近似卡方
277。
025
df
15
Sig。
。
000
分析可知,Bartlett球形度检验统计量观测值为277.025,相应的概率P接近0。
如果显著性水平为0.05,由于概率P小于显著性水平0。
05,应拒绝原假设,认为相关矩阵与单位矩阵有显著差异。
同时,KMO值为0。
695,较好的达到了标准,可以运用因子分析的方法。
3、提取因子
根据原来变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征根.
公因子方差
初始
提取
人均GDP
1。
000
。
975
财政收入
1。
000
。
956
固定资产投资
1.000
.927
年末总人口
1.000
。
930
居民消费水平
1。
000
.974
社会消费品零售总额
1.000
。
972
提取方法:
主成份分析.
表中第3列是根据因子分析最终解计算出的变量共同度。
可以看出,变量的绝大部分信息可被因子分析,信息丢失较少。
因子提取的总体效果比较好。
解释的总方差
成份
初始特征值
提取平方和载入
合计
方差的%
累积%
合计
方差的%
累积%
1
3.963
66.052
66。
052
3.963
66.052
66。
052
2
1.771
29。
518
95。
570
1。
771
29。
518
95.570
3
。
128
2.128
97。
698
4
。
095
1.589
99。
287
5
。
026
.433
99.720
6
。
017
。
280
100.000
提取方法:
主成份分析。
看表的第2列,变量相关系数矩阵有2个特征根大于1,它们分别是:
3.963,1。
771。
它们一起解释了各省市综合发展情况的95.57%。
也就是说前2个因子集中体现了原始数据大部分的信息,因此,提取2个公共因子是合适的,能够比较全面的反映情况.同时可以参考碎石图来验证。
该图的横坐标为因子数目,纵坐标为特征根.曲线迅速下降,然后下降变得平缓,从第3个因子开始变成近似一条直线,特征根值小于1,解释原有的变量贡献小。
曲线变平开始的前一个点被认为是提取的最大因子数,即提取2个公因子。
第3个因子后面的这些散点像山脚下的碎石,可以舍去,不会损失太多信息.
4、因子的命名与解释
计算输出因子载荷矩阵,是用标准化的公因子近似表示标准化原始变量的系数矩阵,见下表:
成份矩阵a
成份
1
2
人均GDP
。
670
。
725
财政收入
.976
.055
固定资产投资
。
896
-.351
年末总人口
.633
—.728
居民消费水平
.674
。
721
社会消费品零售总额
。
950
—.263
提取方法:
主成份。
a.已提取了2个成份.
人均GDP=0.670F1+0。
725F2
财政收入=0。
976F1+0.055F2
固定资产投资=0.896F1—0.351F2
年末总人口=0。
633F1-0。
728F2
居民消费水平=0.674F1+0.721F2
社会消费品零售总额=0。
950F1—0。
263F2
旋转成份矩阵a
成份
1
2
人均GDP
.112
.981
财政收入
。
755
。
622
固定资产投资
.931
。
247
年末总人口
.941
-。
213
居民消费水平
。
117
。
980
社会消费品零售总额
。
922
.349
提取方法:
主成份.
旋转法:
具有Kaiser标准化的正交旋转法。
a.旋转在3次迭代后收敛.
根据因子正交旋转矩阵,将指标分成2个公共因子并命名:
第1个公共因子(经济水平):
年末总人口、固定资产投资、社会消费品零售总额、财政收入
第2个公共因子(消费水平):
人均GDP、居民消费水平
5、计算因子得分与综合评价得分及排序
成份得分系数矩阵
成份
1
2
人均GDP
—.105
.430
财政收入
。
180
。
171
固定资产投资
.300
—.026
年末总人口
。
372
—。
237
居民消费水平
—。
104
.429
社会消费品零售总额
。
281
。
022
提取方法:
主成份。
旋转法:
具有Kaiser标准化的正交旋转法.
构成得分.
F1=—0。
105X1+0.180X2+0。
300X3+0。
372X4-0。
104X5+0。
281X6
F2=0。
430X1+0.171X2-0.026X3—0.237X4+0。
429X5+0。
022X6
其中,X1、X2、X3、X4、X5、X6为各项指标经处理之后的标准化数据。
地区
F1
F1得分
F2
F2得分
广东
2.42045
1
0.89371
5
山东
2。
36315
2
0.00275
10
江苏
1。
96498
3
0.57532
6
河南
1。
29494
4
—0。
83424
29
浙江
0。
94065
5
1.11499
4
四川
0。
90321
6
-0。
85086
30
河北
0.77849
7
-0。
47185
20
辽宁
0.41769
8
0.20721
8
湖南
0。
35372
9
—0.56793
23
湖北
0。
34515
10
—0.456
19
安徽
0。
2825
11
-0.75666
28
广西
-0.14229
12
—0.6566
26
江西
-0.17689
13
-0。
64101
24
福建
—0。
19163
14
0。
28576
7
云南
—0。
19706
15
-0.70211
27
陕西
-0.25735
16
-0.5412
22
黑龙江
—0.267
17
—0。
26457
13
山西
-0.28441
18
—0.27036
15
内蒙古
-0。
45809
19
0.03908
9
重庆
-0.4654
20
-0.30599
16
吉林
—0.48134
21
-0.17487
11
贵州
—0.48478
22
—0。
85712
31
上海
—0。
54724
23
3。
46909
1
北京
—0。
64278
24
2。
63862
2
甘肃
-0.72284
25
—0.6434
25
新疆
-0。
77561
26
-0。
31232
17
天津
-1.12433
27
1。
44996
3
海南
-1。
16597
28
—0.26748
14
宁夏
-1.21413
29
-0.24283
12
青海
-1.21694
30
—0.34244
18
西藏
—1.24888
31
-0。
51664
21
6、因子综合评价得分
每个地区的因子得分计算方法是:
用每个公因子的方差贡献率做权数,对每个因子进行加权,然后加总得到每个地区的总因子得分,按总得分的多少进行排序,以反映各地区经济发展的差异
权数
0。
6911
0。
3089
因子贡献方差
66。
052
29。
518
95。
57(总方差)
地区
F1
F2
F
F得分
广东
2。
42045
0.89371
1。
94884
1
山东
2.36315
0。
00275
1。
634022
2
江苏
1.96498
0.57532
1.535714
3
浙江
0.94065
1。
11499
0.994504
4
上海
—0.54724
3.46909
0。
693404
5
河南
1。
29494
—0.83424
0。
637236
6
河北
0.77849
-0。
47185
0.39226
7
北京
—0。
64278
2。
63862
0。
370844
8
四川
0。
90321
-0。
85086
0.361378
9
辽宁
0。
41769
0.20721
0.352673
10
湖北
0.34515
-0。
456
0.097675
11
湖南
0。
35372
—0。
56793
0.069022
12
安徽
0.2825
—0。
75666
—0。
0385
13
福建
—0。
19163
0.28576
-0.04416
14
黑龙江
-0.267
-0。
26457
—0.26625
15
山西
—0。
28441
—0。
27036
—0.28007
16
广西
—0。
14229
-0。
6566
—0。
30116
17
内蒙古
—0.45809
0.03908
-0。
30451
18
江西
—0。
17689
—0.64101
-0。
32026
19
天津
-1。
12433
1.44996
-0.32913
20
陕西
—0.25735
-0.5412
-0.34503
21
云南
—0。
19706
—0。
70211
—0。
35307
22
吉林
—0.48134
—0。
17487
—0。
38667
23
重庆
—0.4654
—0。
30599
-0。
41616
24
贵州
—0.48478
—0。
85712
-0.5998
25
新疆
—0。
77561
-0。
31232
—0.6325
26
甘肃
—0.72284
-0。
6434
-0.6983
27
海南
—1.16597
-0。
26748
-0.88843
28
宁夏
—1.21413
-0.24283
-0。
9141
29
青海
—1.21694
-0。
34244
-0。
94681
30
西藏
—1.24888
—0.51664
-1。
02269
31
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 步骤