SPSS因子分析.docx
- 文档编号:30348662
- 上传时间:2023-08-13
- 格式:DOCX
- 页数:39
- 大小:93.09KB
SPSS因子分析.docx
《SPSS因子分析.docx》由会员分享,可在线阅读,更多相关《SPSS因子分析.docx(39页珍藏版)》请在冰豆网上搜索。
SPSS因子分析
第十一章因子分析
11.1主要功能
多元分析处理的是多指标的问题。
由于指标太多,使得分析的复杂性增加。
观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又让人陷入混乱不清。
由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。
调用DataReduction菜单的Factor过程命令项,可对多指标或多因素资料进行因子分析。
因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量,这与上一章的聚类分析不同),以较少的几个因子反映原资料的大部分信息。
11.2实例操作
[例11-1]下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。
X1
X2
X3
X4
X5
X6
X7
3.76
8.59
6.22
7.57
9.03
5.51
3.27
8.74
9.64
9.73
8.59
7.12
4.69
5.51
1.66
5.90
9.84
8.39
4.94
7.23
9.46
9.55
4.94
8.21
9.41
3.66
4.99
6.14
7.28
7.08
3.98
0.62
7.00
9.49
1.33
2.98
5.49
3.01
1.34
1.61
5.76
9.27
4.92
4.38
2.30
7.31
5.35
4.52
3.08
6.44
0.54
1.34
4.52
7.07
2.59
1.30
0.44
3.31
1.03
1.00
1.17
3.68
2.17
1.27
1.57
1.55
1.51
2.54
1.03
1.77
1.04
4.25
4.50
2.42
5.11
5.28
10.02
9.84
12.66
11.76
6.92
3.36
11.68
13.57
9.87
9.17
9.72
5.98
5.81
2.80
8.84
13.60
10.05
6.68
7.79
12.00
11.74
8.07
9.10
12.50
9.77
7.50
2.17
1.79
4.54
5.33
7.63
3.53
13.13
9.87
7.85
2.64
2.76
4.57
1.78
5.40
9.02
3.96
6.49
4.39
11.58
2.77
1.79
3.75
2.45
13.74
10.16
2.73
2.10
6.22
7.30
8.84
4.76
18.52
11.06
9.91
3.43
3.55
5.38
2.09
7.50
12.67
5.24
9.06
5.37
16.18
3.51
2.10
4.66
3.10
4.78
2.13
1.09
0.82
1.28
2.40
8.39
1.12
2.35
3.70
2.62
1.19
2.01
3.43
3.72
1.97
1.75
1.43
2.81
2.27
2.42
1.05
1.29
1.72
0.91
11.2.1数据准备
激活数据管理窗口,定义变量名:
分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入相应数值,建立数据库,结果见图11.1。
图11.1原始数据的输入
11.2.2统计分析
激活Statistics菜单选DataReduction的Factor...命令项,弹出FactorAnalysis对话框(图11.2)。
在对话框左侧的变量列表中选变量X1至X7,点击钮使之进入Variables框。
图11.2因子分析对话框
点击Descriptives...钮,弹出FactorAnalysis:
Descriptives对话框(图11.3),在Statistics中选Univariatedescriptives项要求输出各变量的均数与标准差,在CorrelationMatrix栏内选Coefficients项要求计算相关系数矩阵,并选KMOandBartlett’stestofsphericity项,要求对相关系数矩阵进行统计学检验。
点击Continue钮返回FactorAnalysis对话框。
图11.3描述性指标选择对话框
点击Extraction...钮,弹出FactorAnalysis:
Extraction对话框(图11.4),系统提供如下因子提取方法:
图11.4因子提取方法选择对话框
Principalcomponents:
主成分分析法;
Unweightedleastsquares:
未加权最小平方法;
Generalizedleastsquares:
综合最小平方法;
Maximumlikelihood:
极大似然估计法;
Principalaxisfactoring:
主轴因子法;
Alphafactoring:
α因子法;
Imagefactoring:
多元回归法。
本例选用Principalcomponents方法,之后点击Continue钮返回FactorAnalysis对话框。
点击Rotation...钮,弹出FactorAnalysis:
Rotation对话框(图11.5),系统有5种因子旋转方法可选:
图11.5因子旋转方法选择对话框
None:
不作因子旋转;
Varimax:
正交旋转;
Equamax:
全体旋转,对变量和因子均作旋转;
Quartimax:
四分旋转,对变量作旋转;
DirectOblimin:
斜交旋转。
旋转的目的是为了获得简单结构,以帮助我们解释因子。
本例选正交旋转法,之后点击Continue钮返回FactorAnalysis对话框。
点击Scores...钮,弹出弹出FactorAnalysis:
Scores对话框(图11.6),系统提供3种估计因子得分系数的方法,本例选Regression(回归因子得分),之后点击Continue钮返回FactorAnalysis对话框,再点击OK钮即完成分析。
图11.6估计因子分方法对话框
11.2.3结果解释
在输出结果窗口中将看到如下统计数据:
系统首先输出各变量的均数(Mean)与标准差(StdDev),并显示共有25例观察单位进入分析;接着输出相关系数矩阵(CorrelationMatrix),经Bartlett检验表明:
Bartlett值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy是用于比较观测相关系数值与偏相关系数值的一个指标,其值愈逼近1,表明对这些变量进行因子分析的效果愈好。
今KMO值=0.32122,偏小,意味着因子分析的结果可能不能接受。
Analysisnumber1Listwisedeletionofcaseswithmissingvalues
MeanStdDevLabel
X17.100002.32380
X24.773202.41779
X32.348801.66556
X49.152403.01405
X55.458403.27344
X67.167204.55817
X72.346001.61091
NumberofCases=25
CorrelationMatrix:
X1X2X3X4X5X6X7
X11.00000
X2.580261.00000
X3.20113.363791.00000
X4.90900.83725.436111.00000
X5.28347.16590-.70423.163281.00000
X6.28656.26119-.68058.20309.990201.00000
X7-.53321-.60846-.64918-.67758.42733.357321.00000
Kaiser-Meyer-OlkinMeasureofSamplingAdequacy=.32122
BartlettTestofSphericity=326.28484,Significance=.00000
使用主成分分析法得到2个因子,因子矩阵(FactorMatrix)如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。
如本例变量X7与第一因子的值为-0.88644,与第二因子的值为0.21921,可见其与第一因子更近,与第二因子更远。
或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。
在FinalStatistics一栏中显示各因子解释掉方差的比例,也称变量的共同度(Communality)。
共同度从0到1,0为因子不解释任何方差,1为所有方差均被因子解释掉。
一个因子越大地解释掉变量的方差,说明因子包含原有变量信息的量越多。
Extraction1foranalysis1,PrincipalComponentsAnalysis(PC)
PCextracted2factors.
FactorMatrix:
Factor1Factor2
X1.74646.48929
X2.79644.37219
X3.70890-.59727
X4.91054.38865
X5-.23424.96350
X6-.17715.97172
X7-.88644.21921
FinalStatistics:
VariableCommunality*FactorEigenvaluePctofVarCumPct
*
X1.79660*13.3951848.548.5
X2.77284*22.8063240.188.6
X3.85927*
X4.98014*
X5.98320*
X6.97561*
X7.83384*
下面显示经正交旋转后的因子负荷矩阵(RotatedFactorMatrix)和因子转换矩阵(FactorTransformationMatrix)。
旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。
VARIMAXrotation1forextraction1inanalysis1-KaiserNormalization.
VARIMAXconvergedin3iterations.
RotatedFactorMatrix:
Factor1Factor2
X1.87795.16064
X2.87848.03332
X3.42098-.82586
X4.99001.00414
X5.15872.97878
X6.21452.96415
X7-.73151.54656
FactorTransformationMatrix:
Factor1Factor2
Factor1.92135-.38873
Factor2.38873.92135
最后将第一因子的因子分用变量名fac_1、第二因子的因子分用变量名fac_2存入原始数据库中。
这些值既可用于模型诊断,又可用于进一步分析。
图11.7因子分的获得并存盘
第十二章可靠性分析
12.1主要功能
在精神卫生与社会医学研究中,经常需要借助量表来了解对象的某一特性。
如常用的症状自评量表(SCL-90)即用于评定对象精神病症状的表现形式与强度;又如生活事件量表(LES)即用于对精神刺激进行定性和定量分析。
在完成一份量表的编制工作后,或在准备将一份已有的量表作实际应用前,需要对量表的信度进行考核。
量表的使用是为了了解被测对象的某一特征,因而在编制一份量表时,所设立的一系列项目是为了体现量表需要测定的这一特征。
如果所设立的测定项目无法获得这一特征,则表示该量表可靠性差,即信度低。
所以,研究者有时需要了解量表中各测定项目之间的一致性(同质信度考核),有时需要将量表的测定项目按原编号的奇、偶数分半后,对各自的测定结果进行相关性检验(分半信度考核),等等,这就是量表的可靠性分析,亦即信度研究。
量表的可靠性分析可通过调用Reliability过程完成。
12.2实例操作
[例12.1]采用家庭环境量表(FES)研究30名女医师的家庭特征,测定结果按10个分量表的实际得分整理如下。
请以此资料对FES的信度作评价。
编号
No.
亲密度
FES1
情感表达
FES2
矛盾性
FES3
独立性
FES4
成功性
FES5
知识性
FES6
娱乐性
FES7
道德宗教观
FES8
组织性
FES9
控制性
FES10
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
2
4
4
4
4
4
5
3
5
5
3
3
2
2
1
5
5
3
6
5
2
2
4
2
5
4
4
4
5
3
4
2
3
3
3
2
4
1
2
3
4
3
2
3
3
2
4
3
3
3
3
3
5
2
5
2
2
6
5
3
5
1
2
3
4
1
6
4
5
2
3
2
0
3
4
3
3
3
6
2
2
2
3
4
3
2
5
5
2
3
7
4
5
7
5
5
4
7
5
6
4
4
3
4
5
4
5
4
5
4
4
3
5
5
3
5
6
4
4
4
8
5
5
7
5
3
6
5
7
7
5
4
4
4
7
6
6
5
6
5
4
6
4
6
4
7
4
5
4
4
6
1
3
2
3
4
3
3
3
3
4
4
3
4
4
4
3
3
3
3
3
5
5
3
5
5
4
4
5
4
3
1
2
6
4
7
4
5
3
3
3
2
6
4
2
4
3
3
5
6
1
4
5
3
2
3
5
3
6
3
4
6
5
6
5
4
5
7
6
5
6
4
5
6
6
6
4
5
4
5
4
5
5
5
7
6
3
6
4
7
5
6
3
4
6
5
6
6
6
4
4
4
7
5
4
4
4
3
4
6
5
5
3
4
7
4
4
5
5
4
6
2
2
3
3
2
3
3
3
2
2
2
2
3
4
2
2
2
3
3
3
3
4
3
3
2
2
5
2
1
12.2.1数据准备
激活数据管理窗口,定义变量名:
亲密度、情感表达、矛盾性、独立性、成功性、知识性、娱乐性、道德宗教观、组织性、控制性等十个分量表的变量名依次是FES1、FES2、FES3、FES4、FES5、FES6、FES7、FES8、FES9、FES10,输入原始数据。
12.2.2统计分析
激活Statistics菜单选Scale中的ReliabilityAnalysis...项,弹出ReliabilityAnalysis对话框(如图12.1示)。
从对话框左侧的变量列表中选fes1~fes10共十个变量,点击钮使之进入Items框。
点击Model处的下拉菜单,系统提供5种分析模型:
图12.1可靠性分析对话框
Alpha:
计算信度系数Cronbachα值;
Splithalf:
分半信度的分析;
Guttman:
真实可靠性的Guttman低界;
Parallel:
并行模型假定下的极大似然可靠性估计;
Strictparallel:
严格并行模型假定下的极大似然可靠性估计。
本例选用Alpha模型。
点击Statistics...钮,弹出ReliabilityAnalysis:
Statistics对话框(图12.2),该对话框内含如下选项:
图12.2可靠性分析的统计选项对话框
在Descriptivesfor栏中选Item、Scale、Scaleifitemdeleted项,以指定对各项目、测定得分情况和项目与量表总体特征关系进行描述性统计;
在Summaries处有四个选项:
Means、Variances、Covariances和Correlations,可分别要求系统计算在Descriptivesfor栏中指定对象的平均数、方差、协方差和相关系数,本例选Means、Variances和Correlations三项;
在Inter-Item处有Correlations和Covariances两项,前者可计算项目间的两两相关系数,后者可计算项目间的两两协方差值,本例选Correlations项;
在ANOVATable处有None、Ftest、Friedmanchi-square、Cochranchi-square四个选项,其意义分别是:
不作方差分析、作重复度量的方差分析、计算Friedman和Kendall谐和系数(适用于等级资料)、计算CohranQ值(适用于所有项目均为二分变量),本例选Ftest项;
此外,还有Hotelling’sT-square选项,可要求作项目间平均得分的相等性检验;Tukey’stestofadditivity选项,可要求作可加性的Tukey检验,本例仅选前一项。
在完成各选项的选择之后,点击Continue钮返回ReliabilityAnalysis对话框,再点击OK钮即完成分析。
12.2.3结果解释
在结果输出窗口中将看到如下统计数据:
首先计算各项目在30名被试中测定结果的均数与标准差。
然后输出项目间的两两相关系数矩阵,从中可见,第三项目(矛盾性)与第十项目(控制性)的相关程度最密切(r=0.5038)。
MeanStdDevCases
1.FES13.66671.268530.0
2.FES102.73331.014830.0
3.FES23.10001.125030.0
4.FES33.10001.470430.0
5.FES44.66671.093330.0
6.FES55.26671.257630.0
7.FES63.63331.033430.0
8.FES73.70001.557030.0
9.FES85.20001.030630.0
10.FES94.73331.112130.0
CorrelationMatrix
FES1FES10FES2FES3FES4FES5FES6FES7FES8FES9
FES11.0000
FES10-.23211.0000
FES2.1933.41681.0000
FES3.1849.5038.20221.0000
FES4.0414.2901-.2523.36461.0000
FES5.0360.3819-.0926.3953.46811.0000
FES6-.1754.3310.4183.0930-.0814-.02831.0000
FES7.2444-.0524-.1004-.0467.1823-.2043.07931.0000
FES8-.0791-.0132-.0476-.0137-.1224.1171-.0907-.21921.0000
FES9.0570.1487-.0606-.0675-.2741-.1446-.1180.1314.22871.0000
NofCases=30.0
接着显示对整个量表的统计分析结果。
该量表的平均得分为39.8000,标准差为4.8309;平均每个项目的得分为3.9800,极差为2.5333;各项目的方差平均为1.4634;项目间的相关系数范围为-0.2741—0.5038。
之后考查项目与量表得分的关系,方式是:
若将某一项目从量表中剔除,则量表的平均得分(ScaleMeanifItemDeleted)、方差(ScaleVarianceifItemDeleted)、每个项目得分与剩余各项目得分间的相关系数(CorrectedItem-TotalCorrelation)、以该项目为自变量所有其他项目为应变量建立回归方程的R2值(SquaredMultipleCorrelation)以及Cronbachα值(AlphaifItemDeleted)会是多少。
如本例在每个项目得分与剩余各项目得分间的相关系数中,第十项目(控制性)最大,为0.5009,表明该项目与其他各项目关系最密切。
又如R2值,第十项目(控制性)最大,为0.7345,表明其含义有73.45%可被其他项目解释掉,而第八项目(道德宗教观)最小,为0.1556,表明其含义仅有15.56%可被其他项目解释掉。
Nof
StatisticsforMeanVarianceStdDevVariables
Scale39.800023.33794.830910
ItemMeansMeanMinimumMaximumRangeMax/MinVariance
3.98002.73335.26672.53331.9268.84
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 因子分析