因子分析的SPSS实现文档格式.docx
- 文档编号:17040974
- 上传时间:2022-11-28
- 格式:DOCX
- 页数:17
- 大小:444.30KB
因子分析的SPSS实现文档格式.docx
《因子分析的SPSS实现文档格式.docx》由会员分享,可在线阅读,更多相关《因子分析的SPSS实现文档格式.docx(17页珍藏版)》请在冰豆网上搜索。
.879
10000m〔分〕
.891
马拉松〔分〕
.774
ExtractionMethod:
PrincipalponentAnalysis.
TotalVarianceExplained
ponent
InitialEigenvalues
ExtractionSumsofSquaredLoadings
Total
%ofVariance
Cumulative%
1
6.622
82.777
2
.878
10.970
93.747
3
.159
1.992
95.739
4
.124
1.551
97.289
5
.080
.999
98.288
6
.068
.850
99.137
7
.046
.580
99.717
8
.023
.283
100.000
ponentMatrixa
.817
.867
.915
.949
.959
.938
.944
.880
a.1ponentsextracted.
ponentScoreCoefficientMatrix
.123
.131
.138
.143
.145
.142
.133
PrincipalponentAnalysis.
ponentScores.
.531
.432
.233
.012
-.131
-.292
-.287
-.411
a.2ponentsextracted.
.605
.493
.265
.013
-.149
-.333
-.328
-.469
得到初始载荷矩阵与公因子后,为了解释方便往往需要对因子进展旋转,设置好其他选项后点击FactorAnalysis对话框下部的Rotation…按钮,进入Rotation对话框,在Method框架中可以看到SPSS给出了多种进展旋转的方法,系统默认为不旋转。
可以选择的旋转方法有Varimax〔方差最大正交旋转〕、DirectOblimin〔直接斜交旋转〕、Quartmax〔四次方最大正交旋转〕、Equamax〔平均正交旋转〕及Promax(斜交旋转),选中Varimax选项,此时,Display框架中Rotatedsolution选项处于活动状态,选中该选项以输出旋转结果。
点击Contunue→OK运行,除上面的结果外还可得到如下输出结果6.3:
输
由结果可以看到,旋转后公共因子解释原始数据的能力没有提高,但因子载荷矩阵及因子得分系数矩阵都发生了变化,因子载荷矩阵中的元素更倾向于0或者正负1。
有时为了公因子的实际意义更容易解释,往往需要放弃公因子之间互不相关的约束而进展斜交旋转,最常用的斜交旋转方法为Promax方法,对此例进展斜交旋转,可得到如下输出结果6.4:
输出结果6.4:
可以看到,与正交旋转不同,斜交旋转的输出结果中没有RotatedponentMatrix而代之以PatternMatrix和StructureMatrix,这里,PatternMatrix即是因子载荷矩阵,而StructureMatrix为公因子与原始变量的相关阵,也就是说,在斜交旋转中,因子载荷系数不再等于公因子与原始变量的相关系数。
上面三个表格存在如下关系:
StructureMatrix=PatternMatrix
CorrelationMatrix
为了得到因子得分值,进展如下操作:
在FactorAnalysis对话框,点击下方的Scores按钮,进入FactorScores〔因子得分〕对话框,选中Saveasvariables复选框,即把原始数据各样本点的因子得分值存为变量,可以看到系统默认用回归方法求因子得分系数〔Method框架中Regression选项被自动选中〕,保存此设置。
在此例中,我们还选中了Saveasvariables复选框,这一选项要求输出估计的因子得分值,该结果出现在数据窗口。
在数据窗口,我们可以看到在原始变量后面出现了三个新的变量,变量名分别为fac1_1,fac2_1,fac3_1。
这三个变量即为各个样品的第一公因子、第二公因子、第三公因子的得分。
我们在前面的分析中曾提过这些得分是经过标准化的,这一点可以用下面的方法简单的验证:
依次点选Analyze→DescriptiveStatistics→Descriptives…进入Descriptives对话框,选中fac1_1,fac2_1,fac3_1三个变量,点击OK按钮运行,可得到如下结果:
输出结果6.5:
可以看到,三个变量的标准差均为1〔此处由于舍入原因,变量的均值不绝对等于0而是有细微差异〕。
得到各个样品的因子得分后,我们就可以对样本点进展分析,如用因子得分值代替原始数据进展归类分析或是回归分析等。
同时,我们还可以在一X二维图上画出各数据点,描述各样本点之间的相关关系。
依次点选Graphs→Scatter…进入Scatterplot对话框,选择Simple按Define按扭,在弹出的SimpleScatterplot对话框中,分别选择fac1_1,fac2_1作为X轴与Y轴,点击OK交由程序运行,可得如下散点图:
输出结果6.6:
由此可以直观地描述原始数据的散布情况,为了研究需要,还可以很方便地输出第一因子与第三因子,第二因子与第三因子的散点图或同时生成三个因子的散点图,这只需选择不同的变量或图形类型即可,在此不在详述。
【例6.2】采用上一章的例子,继续对35个上市公司的八大评价指标进展分析。
按照因子分析的步骤:
第一步:
先计算因子载荷矩阵与特殊度。
实际上,上一章的分析过程已经完成了这一局部的工作,按主成分法提取公因子。
根据上一章的工作得到了如下结果〔此处,为了更充分提取原始变量信息,保存四个公因子〕:
当保存四个公因子时,公因子可以解释原始变量89.34%的方差,这样就把一个八维的问题降至四维,munalities表给出了共同度的信息,可以看到,公因子对每一个原始变量的解释能力都较强。
ponentMatrix是因子载荷矩阵,由此表可以写出特殊因子忽略不计时的因子模型,以第一行为例,有:
此时所得未旋转的公因子实际意义不好解释,对公因子进展方差最大化旋转:
第二步:
因子旋转。
在FactorAnalysis对话框中点击Rotation…按钮进入Rotation对话框,选中Varimax进展方差最大正交旋转,为便于得出结论,在FactorAnalysis点击Optons…按钮进入Options对话框,在CoefficientDisplayFormat框架中选中SortedbySize以使输出的载荷矩阵中各列按载荷系数大小排列,使在同一公因子上具有较高载荷的变量排在一起。
Continue继续,OK运行,可以得到如下旋转结果:
输出结果6.7:
RotatedponentMatrix是旋转后的因子载荷矩阵,可以看到,旋转后因子载荷矩阵产生了很大的变化,第一个公因子根本上反映了总资产周转率与流动资产周转率的信息,反映了净资产收益率与总资产报酬率的局部信息,同时在其他各个原始变量上的系数也为正值,大体可以解释为资产运营情况或是公司总体的运营情况,第二个因子主要集中了已获利息倍数、总资产报酬率及净资产收益率的信息,可以解释为公司的获利能力,第三个公因子主要集中了资本积累率与销售增长率的信息,可以解释为公司的开展能力,第四个公因子主要集中了资产负债率的信息,可以解释为公司的资本构造。
这样,经过旋转之后,各因子的意义变得比拟明确。
需要说明的是,在?
国有资本金效绩评价规那么?
中对这八个指标的解释也分为四局部,与通过因子分析的结论有相似之处也有区别,其对各指标的解释与归类为:
净资产收益率与总资产报酬率两指标反映财务效益状况,总资产周转率与流动资产周转率反映资产运营状况,资产负债率与已获利息倍数反映偿债能力状况,而销售增长率与资本积累率反映公司的开展能力状况。
由因子分析的结果来看,?
给出的指标体系有一定的合理性,而实际研究中,定量分析的结果也总是要与定性的分析结合起来才能得到合理可信的结论。
总起来说,?
规那么?
对八个指标的解释与单单通过因子分析得到的结论有很大相似,也说明此处因子分析的运用比拟合理。
第三步:
因子得分。
对原始八个指标提取公因子后,就可以通过分析少数几个公因子来对各上市公司进展比拟研究了。
在FactorAnalysis对话框中点击Scores…按钮进入FactorScores对话框,选中SaveAsVariables复选框输出因子得分值并存为变量,Continue继续,OK运行。
可以看到在数据窗口中多了四个变量fac1_1,fac2_1,fac3_1及fac4_1,这几个变量的值是各公司相应公因子的得分。
由上面的分析知,前两个公因子大约提取了原始变量72%的信息,可以作出前两个因子的散点图来描述各公司的散布情况。
按【例6.1】中的作图方法,对第一、第二个公因子作散点图,可以得到如下结果:
输出结果6.8:
由图可以看到,由于方正科技在第一公因子上的得分远高于其他公司〔4.21〕,可以说明方正科技的总体运营能力较强,而粤电力A在第二公因子上的得分远高于其他公司〔3.73〕,说明其获利能力较强,类似可以对根据其他各公司在散点图中的位置及第一、第二公因子的意义对各公司的运营能力进展比拟。
注意上面的散点图不易与各公司对应起来,对此可以画图时在SimpleScatterPlot对话框中选择公司简称进入SetMarkersBy…下的窗口,这样,各公司在散点图上就会以不同的颜色,不同的形状画出来,以使散点图的可读性更强。
因为第一个因子可以看作是公司的总体运营情况,所以可以通过比拟各公司在第一公因子上的得分来对各公司的运营情况加以分析。
为了比拟方便,可以对各数据按第一公因子的取值进展排序,方法如下:
Data→SortCases…进入SortCases对话框,选择排序变量为fac1_1,在SortOrder框架中选择Descending按降序排列,OK运行。
可以得到如下经过排序的结果。
行业
公司简称
fac1_1
fac2_1
fac3_1
fac4_1
信息技术业
方正科技
4.21
-0.34
-0.05
0.35
电力、煤气及水的生产和供给业
穗恒运A
1.73
-0.44
-1.19
-0.89
长城电脑
1.61
-0.45
0.59
-0.42
深南电A
1.19
1.44
-0.33
0.22
深能源A
0.74
0.05
1.40
-0.38
永鼎光缆
0.70
0.24
-0.26
-0.62
中兴通讯
0.23
0.79
1.86
宏图高科
0.45
-0.17
0.40
房地产业业
三木集团
0.16
-0.64
0.36
1.50
海星科技
0.15
-0.88
-0.93
粤电力A
0.06
3.73
-1.20
-0.36
清华同方
-0.25
4.11
-0.47
XX热电
-0.01
-0.68
0.11
华银电力
-0.13
-0.30
-0.24
惠天热电
-0.19
0.66
-0.54
0.25
房地产业
辽房天
-0.20
-0.98
0.60
寰岛实业
-0.22
-2.06
-0.87
-1.97
原水股份
0.48
-0.86
复华实业
-0.35
富龙热力
0.41
-0.70
XX经开
1.20
-0.59
倍特高新
-0.46
0.82
浦东金桥
-0.60
-0.32
-0.65
韶能股份
-0.53
0.44
1.23
-1.64
青鸟华光
0.78
兴业房产
-1.03
-0.67
0.51
新黄浦
0.01
-0.14
ST中福
-0.55
0.10
0.55
中关村
-0.69
0.67
金丰投资
-0.81
0.81
0.69
2.43
粤宏远A
-1.04
0.14
外高桥
-0.82
-0.48
渝开发A
-0.83
-0.90
-0.43
龙电股份
-0.84
1.30
1.60
中华企业
0.12
0.56
1.53
由此表可以看出,信息技术业的总体运营能力要高于电力、煤气及水的生产和供给业与房地产业,而电力、煤气及水的生产和供给业与房地产业的总体运营能力没有显著规律,在各个水平上的分布都有。
但是根据此表来判断各产业的总体运营能力的水平还是不太直观,可以尝试对第一公因子的得分值按取值大小进展分类并作出分类后的因子得分与各产业的列联表,不妨按
,
,fac1_1<
-0.5把第一因子得分分成四类。
SPSS软件可以完成上述分类并方便地生成列联表,方法如下:
Transform→Reocde→IntoDifferentVariables…进入RecodeIntoDifferentVariables对话框,在对话框子左侧列出了数据窗口中所有的变量名,选择fac1_1进入NumericVariable→OutputVariable下的窗口中,此时右侧的OutputVariable框架被击活。
在Name文本框中输出要生成的分类变量名,不妨设为Cat,Label处输入“因子得分分类〞作为Cat变量的标签,点击OldandNewValues…按钮进入OldandNewValues对话框设置分类规那么与生成的分类变量的值。
在OldValue框架中选中Range,在下侧的文本框中分别输入0.5和4.5,在NewValue中输入1,点击newValue框架下侧的Add按钮,此时Add右侧的窗口发生如下变化0.5thru4.5→1,这表示Cat变量对应第一因子得分从0.5到4.5的局部均被赋值为1,按此方法分别对其他各类赋值为2,3,4。
Continue继续,回到RecodeIntoDifferentVariables对话框,点击OutputVariable框架中的Change按钮,OK运行。
可以看到Cat变量已出现在数据窗口。
在VariableView窗口还可以对其取值设置标签以使其意义更明显,此处不再详述。
对Cat的取值设好标签后回到数据窗口,依次点选Analyze→DescriptiveStatistics→Crosstabs…进入Crosstabs对话框,分别选择产业与Cat作为行变量与列变量,OK运行,就可以输出如以下联表:
输出结果6.9:
由此表可以更清楚地看到,信息技术业总体运营能力普遍较高,在九家公司中有七家公司在第一公因子上的得分都在0以上,这或许与我国2000年信息技术业的蓬勃开展有关。
而房地产业总体运营能力普遍较差,在15家公司中有14家在第一公因子上的得分都小于0,这也反映了目前我国房地产业经营的不标准、不景气的状况。
而电力、煤气及水的生产和供给业的总体运营能力没有显著规律。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 SPSS 实现