第七章 主成分分析he因子分析.docx
- 文档编号:11637276
- 上传时间:2023-03-29
- 格式:DOCX
- 页数:15
- 大小:325.54KB
第七章 主成分分析he因子分析.docx
《第七章 主成分分析he因子分析.docx》由会员分享,可在线阅读,更多相关《第七章 主成分分析he因子分析.docx(15页珍藏版)》请在冰豆网上搜索。
第七章主成分分析he因子分析
第七章主成分分析和因子分析实验报告
下表为2012年全国31个省、直辖市和自治区城镇居民家庭平均每人全年消费性支出的八个主要变量数据。
X1食品支出(元/人)X5家庭日用杂品(元/人)
X2衣着支出(元/人)X6交通通信(元/人)
X3居住支出(元/人)X7文教娱乐(元/人)
X4家庭设备及用品(元/人)X8医疗保健(元/人)
表7-12012年全国城镇居民平均每人全年消费性支出数据单位(元/人)
地区
X1
X2
X3
X4
X5
X6
X7
X8
北京
296.17
2638.90
1970.94
1610.70
604.57
3781.51
3695.98
1658.37
天津
564.76
1881.43
1854.22
1151.16
411.28
3083.37
2254.22
1556.35
河北
177.91
1541.99
1502.41
876.10
340.15
1723.75
1203.80
1047.28
山西
73.25
1529.47
1438.88
832.52
296.06
1672.29
1506.20
905.88
内蒙古
144.44
2730.23
1583.56
1242.64
446.86
2572.93
1971.78
1354.09
辽宁
474.35
2042.40
1433.28
1069.65
480.07
2323.29
1843.89
1309.62
吉林
208.16
2044.80
1594.14
871.46
419.61
1780.67
1642.70
1447.50
黑龙江
213.69
1806.92
1336.85
742.22
338.71
1462.61
1216.56
1180.67
上海
1011.40
2111.17
1790.48
1906.49
784.85
4563.80
3723.74
1016.65
江苏
542.92
1915.97
1437.08
1288.42
533.96
2689.51
3077.76
1058.11
浙江
949.22
2109.58
1551.69
1161.39
475.71
4133.50
2996.59
1228.02
安徽
268.20
1540.66
1396.97
811.23
244.31
1809.72
1932.74
1142.96
福建
1219.95
1634.21
1753.86
1254.71
535.75
2961.78
2104.83
773.22
江西
291.38
1476.63
1173.91
966.23
442.49
1501.34
1487.30
670.71
山东
384.33
2196.98
1572.35
1125.99
406.20
2370.23
1655.91
1005.25
河南
105.77
1885.99
1190.81
1145.42
395.96
1730.35
1525.33
1085.47
湖北
334.46
1783.41
1371.15
978.26
405.30
1476.98
1651.92
1029.55
湖南
272.49
1624.57
1301.60
1034.30
442.86
2084.15
1737.64
918.41
广东
792.27
1520.59
2099.75
1467.20
695.32
4176.66
2954.13
1048.28
广西
378.22
1146.46
1377.26
1125.39
369.54
2088.64
1626.05
883.56
海南
963.24
864.96
1521.04
777.20
420.37
2004.34
1319.54
993.24
重庆
266.13
2228.76
1177.02
1196.03
499.73
1903.24
1470.64
1101.56
四川
185.40
1651.14
1284.09
1097.93
482.16
1946.72
1587.43
772.75
贵州
99.05
1399.00
1013.53
849.94
401.78
1891.03
1396.00
654.53
云南
116.62
1759.89
973.76
634.09
274.62
2264.23
1434.30
939.13
西藏
50.96
1361.57
845.18
474.69
233.80
1387.45
550.48
467.23
陕西
116.03
1789.06
1322.22
986.82
447.07
1788.38
2078.52
1212.44
甘肃
88.24
1631.40
1287.93
833.15
338.12
1575.67
1388.21
1049.65
青海
112.87
1512.24
1232.39
923.70
327.76
1549.76
1097.21
906.14
宁夏
81.17
1875.70
1193.37
929.01
401.24
2110.41
1515.91
1063.09
新疆
115.34
2031.14
1166.59
950.17
466.46
1660.27
1280.81
1027.60
资料来源:
2013《中国统计年鉴》
根据上述八个指标,下面用spss17.0对全国各地区城镇居民消费构成进行主成分分析和因子分析。
一、软件操作
(一)操作步骤
1.定义变量,输入数据。
2.在SPSS窗口中选择Analyze/DimensionReduction/Factor,调出主成分分析主界面,并将变量X1至X8八个数据变量移入Variables框中,如图7-1所示。
图7-1因子分析主对话框
3.单击【Descriptives】按钮,展开描述统计量对话框。
(1)在“Statistics”中选择要输出的统计量:
UnivariateDescriptives输出单变量描述统计量和Initialsolution,输出初始因子分析结果。
(2)在“CorrelationMatrix”中,选择要输出的相关矩阵:
①Coefficients,输出原始变量间的相关系数矩阵;
②Significancelevels,输出显著性检验的P值;
③KMOandBartlett’stestofsohericity输出KMO测度和巴特利特球体检验。
图7-2选择描述统计量的子对话框
4.点击【Extraction】按钮,展开因子提取对话框。
(1)在Method(因子提取方法)参数框中,选择PrincipalComponents:
主成分法。
(2)在Analyze(分析矩阵)中,选择Correlationmatrix(分析矩阵)。
(3)在Extract栏中选择Numberoffactors(直接指定提取的因子个数),设定为3。
(4)在Display中选择Unrotatedfactorsolution,输出旋转前的因子分析结果。
单击Continue按钮,返回主界面。
图7-3因子提取主对话框
5.点击Rotation(旋转)按钮,在Method(旋转方法)中,选择Varimax,最大方差旋转项,在Display中选择Rotatedsolution,输出旋转后的结果。
单击Continue按钮,返回主界面。
图7-4旋转方法选择子对话框
6.点击Scores(因子得分)按钮,展开“FactorScores”因子得分对话框。
选择Saveasvariables,在Method中,选择Regression,回归法。
选择Displayfactorscorecoefficientmatrix,输出因子得分系数矩阵。
点击Continue,返回主界面。
图7-5因子得分选择项子对话框
7.点击Options按钮,在MissingValues(缺失值)中选择处理缺失值的方法,选择ExcludecasesListwise,有缺失值的观测量一律剔除。
在“Coefficentdisplayformat”中,选择因子载荷系数的输出方式,选择“Sortedbysize”,按绝对值大小排列。
如下图7-6所示。
图7-6选择输出项对话框
8.在主对话框中,单击【OK】按钮执行运行,输出结果如下。
(二)主要运行结果解释
1.单变量描述统计量(DescriptivesStatistics)
下表给出了单变量描述统计量的均值、标准差和参与计算的观测量数。
表7-2DescriptiveStatistics
Mean
Std.Deviation
AnalysisN
x1
351.5610
318.30794
31
x2
1782.8135
388.89271
31
x3
1411.2358
283.12264
31
x4
1042.3939
283.24540
31
x5
431.0539
118.55732
31
x6
2260.2768
861.61451
31
x7
1836.3910
739.15111
31
x8
1048.6229
253.74984
31
2.原始变量的相关矩阵(CorrelationMatrix)
表7-3CorrelationMatrix
x1
x2
x3
x4
x5
x6
x7
x8
Correlation
x1
1.000
-.063
.632
.537
.611
.706
.576
.070
x2
-.063
1.000
.305
.508
.383
.385
.470
.646
x3
.632
.305
1.000
.708
.641
.742
.736
.584
x4
.537
.508
.708
1.000
.900
.802
.857
.367
x5
.611
.383
.641
.900
1.000
.771
.787
.245
x6
.706
.385
.742
.802
.771
1.000
.890
.362
x7
.576
.470
.736
.857
.787
.890
1.000
.488
x8
.070
.646
.584
.367
.245
.362
.488
1.000
Sig.(1-tailed)
x1
.368
.000
.001
.000
.000
.000
.353
x2
.368
.047
.002
.017
.016
.004
.000
x3
.000
.047
.000
.000
.000
.000
.000
x4
.001
.002
.000
.000
.000
.000
.021
x5
.000
.017
.000
.000
.000
.000
.092
x6
.000
.016
.000
.000
.000
.000
.023
x7
.000
.004
.000
.000
.000
.000
.003
x8
.353
.000
.000
.021
.092
.023
.003
上表为8个原始变量的相关矩阵与单尾检验显著性检验。
可见多个变量之间相关系数较大,说明这些变量之间存在着较为显著的相关性,且其对应的Sig值普遍较小,根据以上分析,这些数据有进行因子分析的必要。
3.KMO检验法和巴特利特球形检验法(KMOandBartlettTestofSphericity)的检验结果。
表7-4KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.768
Bartlett'sTestofSphericity
Approx.Chi-Square
222.767
df
28
Sig.
.000
Bartlett球形检验统计量的Sig<0.01,认为各变量之间存在着显著的相关性。
一般,KMO大于0.9时效果最佳,0.7以上可以接受,0.5以下不宜作因子分析。
可见检验结果Sig<0.01且KMO>0.7,认为适合作因子分析。
4.总方差分解(TotalVarianceExplained)
表7-5TotalVarianceExplained
(1)在“Components”中,给出各因子的序号。
(2)在”InitialEigenvalues”中,给出了相关矩阵或协方差矩阵,其中:
Total:
给出各因子的特征值。
%ofvariance:
给出各因子所解释的方差占总方差的百分比。
Cumulative%:
给出各因子方差占总方差的累计百分比。
(3)在“ExtractionSumsofSquaredLoadings”中,给出提取若干因子后的特征值、方差百分比、累计方差百分比。
由于前三个特征值累计贡献率达到90.042%,根据累计贡献率大于85%的原则,本例提取前三个特征值。
5.旋转前的因子载荷矩阵(ComponentMatrix)
表7-6ComponentMatrixa
Component
1
2
3
x7
.936
.001
-.057
x4
.920
-.028
-.280
x6
.918
-.167
-.014
x5
.873
-.188
-.317
x3
.853
-.027
.409
x1
.675
-.596
.247
x2
.530
.738
-.283
x8
.545
.690
.430
ExtractionMethod:
PrincipalComponentAnalysis.
a.3componentsextracted.
6.表7-5给出旋转前的因子载荷矩阵,计算出相应的特征向量(用前初始因子载荷矩阵的列元素分别除以相应的特征根的平方根),见表7-6所示。
表7-7特征向量
第一特征向量
第二特征向量
第三特征向量
0.4150
0.0008
-0.0694
0.4079
-0.0233
-0.3408
0.4070
-0.1392
-0.0170
0.3870
-0.1567
-0.3858
0.3782
-0.0225
0.4978
0.2992
-0.4967
0.3006
0.2350
0.6150
-0.3445
0.2416
0.5750
0.5234
根据表7-6得到3个主成分的表达式:
Y1=0.2992X1+0.2350X2+0.3782X3+0.4079X4+0.3870X5+0.4070X6+0.4150X7
+0.2416X8
Y2=-0.4967X1+0.6150X2-0.0225X3-0.0233X4-0.1567X5-0.1392X6+0.0008X7
+0.5750X8
Y3=0.3006X1-0.3445X2+0.4978X3-0.3408X4-0.3858X5-0.0170X6-0.0694X7
+0.5234X8
7.旋转后的因子载荷矩阵(RotatedComponentMatrix)
表7-8RotatedComponentMatrixa
Component
1
2
3
x5
.890
.316
.080
x4
.885
.284
.247
x7
.753
.432
.354
x6
.730
.539
.219
x1
.424
.817
-.155
x3
.398
.728
.456
x8
.073
.220
.951
x2
.507
-.308
.744
ExtractionMethod:
PrincipalComponentAnalysis.
RotationMethod:
VarimaxwithKaiserNormalization.
a.Rotationconvergedin9iterations.
旋转后每个公因子上的载荷分配的更清晰,因子变量代表的变量相对集中,比未旋转时更容易解释各因子的意义。
载荷绝对值较大的因子与变量的关系更为密切,也更能代表这个变量。
8.因子得分矩阵(ComponentScoresCoefficientMatrix)
表7-9ComponentScoreCoefficientMatrix
Component
1
2
3
x1
-.086
.533
-.175
x2
.291
-.502
.336
x3
-.253
.515
.257
x4
.403
-.187
-.086
x5
.443
-.173
-.203
x6
.164
.136
-.034
x7
.194
.034
.045
x8
-.372
.251
.667
ExtractionMethod:
PrincipalComponentAnalysis.
RotationMethod:
VarimaxwithKaiserNormalization.
ComponentScores.
9.各样品的因子得分及综合得分
在DataView窗口的当前数据集中,文件中增加了4列FAC1-1(第一因子得分)、FAC2-1(第二因子得分)、FAC3-1(第三因子得分)和zf(综合得分)。
图7-7因子得分新变量
其中,zf(综合得分)=40.952%*FAC1-1+24.962%*FAC2-1+24.129%*FAC3-1
计算方法如下:
图7-8综合得分计算方法
最终全国各个省市综合得分如下表所示(保留两位小数)。
表7-10各省市综合得分情况
序号
FAC1_1
FAC2_1
FAC3_1
zf
序号
FAC1_1
FAC2_1
FAC3_1
zf
1
24.13
0.12
2.47
1.24
17
-0.32
-0.17
0.01
-0.17
2
-0.78
1.64
1.70
0.50
18
0.17
-0.30
-0.55
-0.14
3
-1.06
0.31
0.15
-0.32
19
1.32
2.02
-0.43
0.94
4
-0.93
0.00
-0.12
-0.41
20
-0.41
0.64
-0.96
-0.24
5
0.60
-1.05
1.80
0.42
21
-1.47
2.48
-1.10
-0.25
6
-0.01
0.09
0.77
0.21
22
0.80
-1.37
0.19
0.03
7
-0.94
0.19
1.60
0.05
23
0.61
-0.78
-0.97
-0.18
8
-1.16
-0.09
0.62
-0.35
24
0.15
-0.95
-1.49
-0.54
9
3.26
0.70
-0.66
1.35
25
-0.67
-0.79
-0.21
-0.52
10
1.15
0.02
-0.13
0.44
26
-0.92
-1.10
-1.78
-1.08
11
0.69
1.22
0.44
0.69
27
-0.14
-0.45
0.51
-0.05
12
-1.37
0.60
0.48
-0.30
28
-0.83
-0.32
0.13
-0.39
13
0.65
1.83
-1.27
0.41
29
-0.65
-0.43
-0.44
-0.48
14
0.25
-0.61
-1.43
-0.39
30
-0.07
-0.87
0.14
-0.21
15
0.22
-0.24
0.37
0.12
31
0.24
-1.29
0.02
-0.22
16
0.12
-1.02
0.15
-0.17
二、结果分析
根据各省市综合得分进行排名,得出全国消费能力排名表,如下表7-11所示。
表7-11综合得分排名
省份
排名
得分
省份
排名
得分
上海
1
1.35
四川
17
-0.18
北京
2
1.24
宁夏
18
-0.21
广东
3
0.94
新疆
19
-0.22
浙江
4
0.69
广西
20
-0.24
天津
5
0.5
海南
21
-0.25
江苏
6
0.44
安徽
22
-0.3
内蒙古
7
0.42
河北
23
-0.32
福建
8
0.41
黑龙江
24
-0.35
辽宁
9
0.21
甘肃
25
-0.39
山东
10
0.12
江西
26
-0.39
吉林
11
0.05
山西
27
-0.41
重庆
12
0.03
青海
28
-0.48
陕西
13
-0.05
云南
29
-0.52
湖南
14
-0.14
贵州
30
-0.54
河南
15
-0.17
西藏
31
-1.08
湖北
16
-0.17
从总得分结果来看,上海综合得分最高为1.35,其次北京、广东分数都较高,说明这些省份消费能力强,排在全国前列,即为通常所说北上广。
浙江、天津、江苏等消费能力也较强。
而西藏-1.08最低,贵州、云南、青海等地综合得分都较低,说明消费能力较弱。
其余省份处于全国消费能力一般水平,结果与实际各省经济情况相符
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章 主成分分析he因子分析 第七 成分 分析 he 因子分析