实验十三主成分分析和因子分析.docx
- 文档编号:4398174
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:14
- 大小:182.35KB
实验十三主成分分析和因子分析.docx
《实验十三主成分分析和因子分析.docx》由会员分享,可在线阅读,更多相关《实验十三主成分分析和因子分析.docx(14页珍藏版)》请在冰豆网上搜索。
实验十三主成分分析和因子分析
实验十三主成分分析和因子分析
实验目的:
掌握主成分分析和因子分析在SPSS中的实现方法。
实验工具:
SPSS分析工具菜单项。
知识准备:
我们在对某种现象进行描述时,总是要从不同的方面来说明,才能够对所描述对象有一个比较完整认识,而每一个方面往往就是一个变量,这样就会涉及到很多变量,给问题的分析增加难度。
另一方面,这些变量之间往往又存在一定程度的联系,有的甚至是非常密切的联系,这就使我们用来分析的数据所包含的信息在一定程度上有所重叠。
因子分析的目的就是使数据简化,即用较少的几个因子去表示具有相互关系的原始变量。
一、因子分析的基本原理
因子分析基本思想是从观测到的
个变量的相关性入手,将相关性较高的变量归为一类,认为这些相关性紧密的变量背后会有起主导作用的内在原因,或者说有某个内在原因使得这些变量的关系紧密。
如果共找出
(
)个这样的内在原因,我们说这
个变量有
个公共因子。
这样每个观察变量
都可以写成
个互不相关的公共因子
的线性组合的形式,即因子分析的数学模式。
其中
为公因子,可理解为原始变量共同具有的公共因素,或者说潜在变量,每个公因子至少要对两个原始变量起作用,否则将列入特殊因子。
为特殊因子,他们都是不可观测的随机变量,每个特殊因子只对对应的一个原始变量有作用。
用矩阵表示为:
。
二、因子分析的基本步骤
1.确定待研究的问题。
首先要明确这次研究的目的,在相关理论的指导下,结合以往研究结果,再根据研究者自己的判断,确定研究中应该包括哪些变量。
在选择变量时应注意所选变量必须是定距或定比变量;而样本量则应保持在变量个数的4~5倍以上。
2.建立相关系数矩阵,检查变量之间的相关性。
因子分析的目的就是用潜在变量来解释具有相关关系的原始变量。
所以变量之间必须具有较强的相关关系,才能适用于因子分析。
3.选择提取因子的方法。
提取因子的方法有主成分法、主因子法、最大似然法、最小二乘法、最小残差法等等,而一般常用的是主成分法和主因子法。
4.确定因子的个数。
常用的确定因子个数的方法有以下三种:
1)根据研究者的设计方案或有关经验或知识事先确定;2)变量共同度,即原始变量
对公因子依赖的程度,用因子载荷矩阵中第
行元素的平方和
表示,则有:
。
反映了公因子对
的影响,可以看成是公因子对
的方差贡献,即全部因子反映原始变量信息的百分比。
越接近于1,说明原始信息保留的越多。
根据对原始信息保留量的大小来确定因子个数。
3)因子的累计方差贡献率。
公因子
对向量
的贡献,用因子载荷矩阵中第
列元素的平方和
表示,则有:
。
反映了公因子
对各原始变量所提供的方差贡献的总和,是衡量公因子相对重要性的指标。
一般要求所提取的公因子的累计方差贡献率应在60%以上。
5.因子旋转。
得到初始因子载荷矩阵后,虽然它能反映因子与原始变量之间的关系,但是由于因子与很多变量都有关系,不便于对因子进行解释,这时就需要将因子载荷矩阵进行旋转。
因子旋转的方法有正交旋转和斜交旋转两类,一般用正交旋转比较多,即在因子载荷矩阵后乘以一个正交矩阵。
正交旋转不会影响每个变量的共同度,也不会影响所有公因子的累计方差贡献率,但是每个因子的方差贡献率会改变,最终达到某些变量在某个因子上的载荷较高,而在其它因子上的载荷却很低的目的,便于对每个因子的含义进行解释。
最常用的正交旋转法是“方差最大正交旋转”。
斜交旋转用于因子之间有相关关系的情况。
6.解释因子和命名。
通过因子旋转后,因子对哪些原始变量有显著的负荷就比较清楚了,这时可以根据这些变量所隐含的意义来对因子进行解释和命名。
实验背景:
公司老板在对应聘者进行面试时,从15个方面进行了打分,这15个方面分别是:
x1—申请书的形式;x2—外貌;x3—专业能力;x4—讨人喜欢;x5—自信心;x6—精明;x7—诚实;x8—推销能力;x9—经验;x10—积极性;x11—抱负;x12—理解能力;x13—潜力;x14—交际能力;x15—适应性。
下面是48名应聘者的得分情况。
试对变量进行因子分析,并对因子给出合理的解释。
应征者
x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12
x13
x14
x15
1
6
7
2
5
8
7
8
8
3
8
9
7
5
7
10
2
9
10
5
8
10
9
9
10
5
9
9
8
8
8
10
3
7
8
3
6
9
8
9
7
4
9
9
8
6
8
10
4
5
6
8
5
6
5
9
2
8
4
5
8
7
6
5
5
6
8
8
8
4
4
9
2
8
5
5
8
8
7
7
6
7
7
7
6
8
7
10
5
9
6
5
8
6
6
6
7
9
9
8
8
8
8
8
8
10
8
10
8
9
8
10
8
9
9
9
8
9
9
8
8
10
9
10
9
9
9
10
9
9
9
7
8
8
8
8
5
9
8
9
8
8
8
10
10
4
7
10
2
10
10
7
10
3
10
10
10
9
3
10
11
4
7
10
0
10
8
3
9
5
9
10
8
10
2
5
12
4
7
10
4
10
10
7
8
2
8
8
10
10
3
7
13
6
9
8
10
5
4
9
4
4
4
5
4
7
6
8
14
8
9
8
9
6
3
8
2
5
2
6
6
7
5
6
15
4
8
8
7
5
4
10
2
7
5
3
6
6
4
6
16
6
9
6
7
8
9
8
9
8
8
7
6
8
6
10
17
9
7
7
7
9
5
8
6
6
7
8
6
6
7
8
18
6
8
8
4
8
8
6
4
3
3
6
7
2
6
4
19
6
7
8
4
7
8
5
4
4
2
6
8
3
5
4
20
4
8
7
8
8
9
10
5
2
6
7
9
8
8
9
21
3
8
6
8
8
8
10
5
3
6
7
8
8
5
8
22
9
8
7
8
9
10
10
10
3
10
8
10
8
10
8
23
7
10
7
9
9
9
10
10
3
9
9
10
9
10
8
24
9
8
7
10
8
10
10
10
2
9
7
9
9
10
8
25
6
9
7
7
4
5
9
3
2
4
4
4
4
5
4
26
7
8
7
8
5
4
8
2
3
4
5
6
5
5
6
27
2
10
7
9
8
9
10
5
3
5
6
7
6
4
5
28
6
3
5
3
5
3
5
0
0
3
3
0
0
5
0
29
4
3
4
3
3
0
0
0
0
4
4
0
0
5
0
30
4
6
5
6
9
4
10
3
1
3
3
2
2
7
3
31
5
5
4
7
8
4
10
3
2
5
5
3
4
8
3
32
3
3
5
7
7
9
10
3
2
5
3
7
5
5
2
33
2
3
5
7
7
9
10
3
2
2
3
6
4
5
2
34
3
4
6
4
3
3
8
1
1
3
3
3
2
5
2
35
6
7
4
3
3
0
9
0
1
0
2
3
1
5
3
36
9
8
5
5
6
6
8
2
2
2
4
5
6
6
3
37
4
9
6
4
10
8
8
9
1
3
9
7
5
3
2
38
4
9
6
6
9
9
7
9
1
2
10
8
5
5
2
39
10
6
9
10
9
10
10
10
10
10
8
10
10
10
10
40
10
6
9
10
9
10
10
10
10
10
10
10
10
10
10
41
10
7
8
0
2
1
2
0
10
2
0
3
0
0
10
42
10
3
8
0
1
1
0
0
10
0
0
0
0
0
10
43
3
4
9
8
2
4
5
3
6
2
1
3
3
3
8
44
7
7
7
6
9
8
8
6
8
8
10
8
8
6
5
45
9
6
10
9
7
7
10
2
1
5
5
7
8
4
5
46
9
8
10
10
7
9
10
3
1
5
7
9
9
4
4
47
0
7
10
3
5
0
10
0
0
2
2
0
0
0
0
48
0
6
10
1
5
0
10
0
0
2
2
0
0
0
0
实验过程:
1)建立数据文件。
按要求定义各变量名,输入原始数据。
2)选择Analyze→DataReduction→Factor,选择x1-x15变量进入Variables(如图6)
图6
3)点击Descriptive,设置需要输出的描述统计量(如图7)。
图7
4)点击Extraction,对因子分析的方法、提取标准、显示结果等进行设置(如图8)。
图8
5)点击Rotation,设定因子旋转(如图9)。
图9
6)点击FactorScores,对因子得分进行设定(如图10)。
图10
结果说明:
申请书
自信心
精明
推销能力
积极性
抱负
理解能力
潜力
适应性
申请书
1.000
.098
.223
.270
.348
.288
.335
.366
.587
外貌
.237
.431
.371
.477
.341
.550
.506
.507
.384
专业能力
.043
.001
.077
.046
.094
.044
.198
.290
.140
讨人喜欢
.306
.302
.483
.347
.393
.347
.503
.606
.327
自信心
.098
1.000
.808
.816
.704
.842
.721
.672
.250
精明
.223
.808
1.000
.826
.698
.758
.883
.777
.416
诚实
-.106
.410
.356
.231
.280
.215
.386
.416
.003
推销能力
.270
.816
.826
1.000
.811
.860
.766
.735
.548
经验
.549
.015
.147
.233
.337
.195
.299
.348
.693
积极性
.348
.704
.698
.811
1.000
.780
.714
.788
.623
抱负
.288
.842
.758
.860
.780
1.000
.784
.769
.435
理解能力
.335
.721
.883
.766
.714
.784
1.000
.876
.528
潜力
.366
.672
.777
.735
.788
.769
.876
1.000
.574
交际能力
.468
.482
.527
.549
.613
.547
.549
.539
.396
适应性
.587
.250
.416
.548
.623
.435
.528
.574
1.000
上表是简化了的相关矩阵太大,由表中数据可知:
不少变量间相关性比较高,故可做因子分析。
KMOandBartlett'sTest
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy.
.784
Bartlett'sTestofSphericity
Approx.Chi-Square
648.300
df
105
Sig.
.000
上表显示的是KMO检验和巴特莱特球形检验的结果,一般KMO值越接近1表明各变量间的相关程度差别不大,这时适合做因子分析;巴特莱特球形检验用来检验变量之间的相关性,从本例来看,各变量间均具有较强的相关性,也适合做因子分析。
Communalities
Initial
Extraction
申请书
1.000
.732
外貌
1.000
.426
专业能力
1.000
.881
讨人喜欢
1.000
.873
自信心
1.000
.884
精明
1.000
.822
诚实
1.000
.850
推销能力
1.000
.893
经验
1.000
.781
积极性
1.000
.788
抱负
1.000
.879
理解能力
1.000
.852
潜力
1.000
.885
交际能力
1.000
.885
适应性
1.000
.795
ExtractionMethod:
PrincipalComponentAnalysis.
上表显示了按照设置的标准提取公因子后各变量中的信息被提取的程度,从表中可以看出除第二个变量外,信息量提取还是比较高的。
下表列出的是总的变量解释程度的说明。
按照设定的提取特征值大于1来提取,可以取前四个公因子,这四个公因子提取了原始信息的81.51%。
Compo
-nent
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
Total
%ofVariance
Cumulative%
1
7.500
49.997
49.997
7.500
49.997
49.997
2
2.057
13.711
63.708
2.057
13.711
63.708
3
1.462
9.749
73.456
1.462
9.749
73.456
4
1.208
8.054
81.510
1.208
8.054
81.510
5
.739
4.927
86.438
6
.490
3.268
89.706
7
.354
2.357
92.063
8
.310
2.070
94.133
9
.255
1.702
95.835
10
.198
1.322
97.157
11
.150
1.002
98.159
12
.092
.614
98.773
13
.085
.564
99.338
14
.064
.429
99.767
15
.035
.233
100.000
下图称为碎石图,是按主成分对应特征值从大到小顺序排列的,从另一方面来协助确定公因子的提取个数。
下表给出的是因子载荷矩阵,既因子表达式。
由表中数据可得如下因子表达式。
加*号说明是标准化后的值。
ComponentMatrixa
Component
1
2
3
4
申请书
.445
.617
.372
-.120
外貌
.583
-.049
-.019
.289
专业能力
.109
.339
-.502
.708
讨人喜欢
.616
-.181
.574
.364
自信心
.800
-.356
-.293
-.180
精明
.865
-.189
-.184
-.071
诚实
.433
-.577
.359
.448
推销能力
.882
-.056
-.244
-.231
经验
.365
.795
.100
.073
积极性
.864
.068
-.099
-.165
抱负
.873
-.097
-.254
-.208
理解能力
.907
-.033
-.136
.092
潜力
.912
.034
-.079
.213
交际能力
.710
-.114
.561
-.232
适应性
.646
.605
.104
-.025
a.4componentsextracted.
下表是因子得分系数矩阵,其实是进行主成分分子的最终结果。
按主成分表达式可表示如下:
RotatedComponentMatrixa
Component
1
2
3
4
申请书
.117
.829
.107
-.138
外貌
.437
.151
.401
.228
专业能力
.062
.128
.007
.928
讨人喜欢
.216
.245
.872
-.081
自信心
.918
-.102
.166
-.064
精明
.864
.097
.259
.005
诚实
.216
-.242
.863
.000
推销能力
.917
.207
.087
-.051
经验
.082
.852
-.051
.213
积极性
.797
.353
.161
-.049
抱负
.916
.163
.106
-.038
理解能力
.806
.256
.338
.147
潜力
.741
.328
.419
.228
交际能力
.436
.364
.538
-.522
适应性
.381
.798
.078
.086
a.Rotationconvergedin5iterations.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验十三 主成分分析和因子分析 实验 十三 成分 分析 因子分析