主成分分析操作步骤.docx
- 文档编号:705544
- 上传时间:2022-10-12
- 格式:DOCX
- 页数:11
- 大小:613.80KB
主成分分析操作步骤.docx
《主成分分析操作步骤.docx》由会员分享,可在线阅读,更多相关《主成分分析操作步骤.docx(11页珍藏版)》请在冰豆网上搜索。
主成分分析操作步骤
主成分分析操作步骤
1)先在spss中录入原始数据。
2)菜单栏上执行【分析】——【降维】——【因子分析】,打开因素分析对话框,将要分析的变量都放入【变量】窗口中。
3)设计分析的统计量
点击【描述】:
选中“Statistics”中的“原始分析结果”和“相关性矩阵”中的“系数”。
(选中原始分析结果,SPSS自动把原始数据标准差标准化,但不显示出来;选中系数,会显示相关系数矩阵)然后点击“继续”。
点击【抽取】:
“方法”里选取“主成分”;“分析”、“输出”、“抽取”均选中各自的第一个选项即可。
点击【旋转】:
选取第一个选项“无”。
(当因子分析的抽取方法选择主成分法时,且不进行因子旋转,则其结果即为主成分分析)
点击【得分】:
选中“保存为变量”,方法中选“回归”;再选中“显示因子得分系数矩阵”。
点击【选项】:
选择“按列表排除个案”。
4)结果解读
5)A.相关系数矩阵:
是6个变量两两之间的相关系数大小的方阵。
通过相关系数可以看到各个变量之间的相关,进而了解各个变量之间的关系。
相關性矩陣
食品
衣着
燃料
住房
交通和通讯
娱乐教育文化
相關
食品
1.000
.692
.319
.760
.738
.556
衣着
.692
1.000
-.081
.663
.902
.389
燃料
.319
-.081
1.000
-.089
-.061
.267
住房
.760
.663
-.089
1.000
.831
.387
交通和通讯
.738
.902
-.061
.831
1.000
.326
娱乐教育文化
.556
.389
.267
.387
.326
1.000
B.共同度:
给出了这次主成分分析从原始变量中提取的信息,可以看出交通和通讯最多,而娱乐教育文化损失率最大。
munalities
起始
擷取
食品
1.000
.878
衣着
1.000
.825
燃料
1.000
.841
住房
1.000
.810
交通和通讯
1.000
.919
娱乐教育文化
1.000
.584
擷取方法:
主體元件分析。
C.总方差的解释:
系统默认方差大于1的为主成分。
如果小于1,说明这个主因素的影响力度还不如一个基本的变量。
所以只取前两个,且第一主成分的方差为3.568,第二主成分的方差为1.288,前两个主成分累加占到总方差的80.939%。
說明的變異數總計
元件
起始特徵值
擷取平方和載入
總計
變異的%
累加%
總計
變異的%
累加%
1
3.568
59.474
59.474
3.568
59.474
59.474
2
1.288
21.466
80.939
1.288
21.466
80.939
3
.600
10.001
90.941
4
.358
5.975
96.916
5
.142
2.372
99.288
6
.043
.712
100.000
擷取方法:
主體元件分析。
D.主成分载荷矩阵:
元件矩陣a
元件
1
2
食品
.902
.255
衣着
.880
-.224
燃料
.093
.912
住房
.878
-.195
交通和通讯
.925
-.252
娱乐教育文化
.588
.488
擷取方法:
主體元件分析。
a.擷取2個元件。
特别注意:
该主成分载荷矩阵并不是主成分的特征向量,即不是主成分1和主成分2的系数。
主成分系数的求法:
各自主成分载荷向量除以各自主成分特征值得算数平方根。
则第1主成分的各个系数是向量(0.925,0.902,0.880,0.878,0.588,0.093)除以后才得到的,即(0.490,0.478,0.466,0.465,0.311,0.049)才是主成分1的特征向量,满足条件是系数的平方和等于1,分别乘以6个原始变量标准化之后的变量即为第1主成分的函数表达式(作业中不用写公式):
Y1=0.490*Z交+0.478*Z食+0.466*Z衣+0.465*Z住+0.311*Z娱+0.049*Z燃
同理可求出第2主成分的函数表达式。
E.主成分得分系数矩阵
元件評分係數矩陣
元件
1
2
食品
.253
.198
衣着
.247
-.174
燃料
.026
.708
住房
.246
-.152
交通和通讯
.259
-.196
娱乐教育文化
.165
.379
擷取方法:
主體元件分析。
元件評分。
该矩阵是主成分载荷矩阵除以各自的方差得来的,实际上是因子分析中各个因子的系数,在主成分分析中可以不考虑它。
元件評分共變異數矩陣
元件
1
2
1
1.000
.000
2
.000
1.000
擷取方法:
主體元件分析。
元件評分。
6)因子得分
在之前的“得分”对话框中,由于选中了“保存为变量”,方法中的“回归”;又选中了“显示因子得分系数矩阵”,因此SPSS的输出结果和原始数据一起显示在数据窗口里:
7)主成分得分
特别提醒:
后两列的数据是等16个地区的因子1和因子2的得分,不是主成分1和主成分2的得分。
主成分的得分是相应的因子得分乘以相应的方差的算数平方根。
即:
主成分1得分=因子1得分乘以3.568的算数平方根
主成分2得分=因子2得分乘以1.288的算数平方根
得出各地区主成分1和主成分2的得分如下表:
后两列就是16个地区主成分1和主成分2的得分。
(有兴趣的同学可以验证一下:
上面推导出来的主成分的函数关系式计算出来的主成分得分是否与该数据栏的的得分一致)
8)综合得分及排序:
每个地区的综合得分是按照下列公式计算的:
Y=0.73476*主成分1得分+0.26524*主成分2得分
按照此公式计算出各地区的综合得分Y为:
按照综合得分Y的大小进行16个地区的排序:
点击【数据】——【排序个案】
特别提醒:
1.若主成分分析中有n个变量,则特征值(或方差)之和就等于n;
2.特征向量(或主成分的系数)中各个数值的平方和等于1,否则就不是特征向量,也不是主成分系数;
3.主成分载荷向量各系数的平方和等于其对应的主成分的方差;
本例中0.9252+0.9022+0.8802+0.8782+0.5882+0.0932=3.568
4.SPSS没有专门的主成分分析模块,是在因子分析模块进行的。
它只输出主成分载荷矩阵和因子得分值,而我们最想得到的主成分的系数(特征向量)和主成分则需要另外计算。
5.若计算没有错误,因子1、因子2、主成分1、主成分2和综合得分Y,它们各自的数值之和都等于0;
6.主成分分析应该计算出综合得分并排序。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 操作 步骤