因子分析.docx
- 文档编号:4386498
- 上传时间:2022-12-01
- 格式:DOCX
- 页数:32
- 大小:302.58KB
因子分析.docx
《因子分析.docx》由会员分享,可在线阅读,更多相关《因子分析.docx(32页珍藏版)》请在冰豆网上搜索。
因子分析
因子分析
一、实验目的与要求
1.通过上机操作使学生掌握因子分析方法在SAS软件中的实现;熟悉因子分析的用途、目的,掌握如何判断因子分析的适用条件,能正确选择适当的因子;熟悉因子旋转的意义并能正确使用旋转方法;
2.要求学生能正确解释软件分析处理的结果;
3.要求学生阅读一定数量的文献资料,掌握因子分析方法在写作中的应用。
二、实验内容与步骤
因子分析的基本目的是用少数的几个因子去描述多个变量之间的关系,以达到降维的目的。
被描述的变量一般都是可观测的随机变量,而因子是不可观测的潜在变量。
例如:
“态度”,“能力”都是不可观测的潜在变量,多用“受教育水平”“工作业绩”等可观测变量来反映潜在变量水平。
因子分析就是利用这些不可观测的潜在变量作为公共因子来解释可观测变量的一种工具。
因子分析的基本思想就是把联系比较紧密的变量归为同一个类别,实现不同类型的变量之间有较低相关性。
在同一个类别内的变量,认为是收到了某个共同的影响而高度相关,这个共同因素称之为公共因子,即为潜在的不可观测变量。
因子分析的基本原理是以相关性为基础,从协方差或相关矩阵入手把大部分的变异归结为少数几个公共因子所为,把剩余的变异称为特殊因子。
每一类变量代表了一个公共因子,因子分析就是寻找和确定这些公共因子的分析方法。
因子分析反映了一种降维的思想,通过降维将相关性高的变量聚在一起,不仅便于提取容易解释的特征,而且降低了需要分析的变量数目和分析问题的复杂性。
在问题内在体系还不了解时,可利用它吧观测变量鬼碧昂为少数几个公共因子,令每个因子代表一个空间的维度,经过正交或斜交旋转,使各个维度互不相连,用这些维度刻画系统的结构。
因子分析的内容非常丰富,常用的因子分析类型是R型因子分析和Q型因子分析。
R型的因子分析是对变量作因子分析,Q型因子分析是对样品作因子分析。
因子分析与主成分分析不同:
主成分分析是寻求若干个可观测随机变量的少量线性组合,说明其含义;因子分析主要的目的是找出不一定可观测的潜在变量作为公共因子,并解释公共因子的意义,及如何用不可观测随机变量,计算可观测随机变量。
因子分析方法在心理学,经济,医学,生物学,教育学等方面有重要用途。
例如为了测验应聘者的素质,出40道题,让应聘者回答,每道题有一得分,40题得分被认为可以观测的随机变量。
我们希望找出有限个不可观测的潜在变量来解释这40个随机变量,这些不可观测的潜在变量不一定能表示为原来随机变量的线性组合,但却是有实际意义的,例如交际能力,应变能力,语言能力、推理能力、艺术修养、历史知识和生活常识等。
又如分析生物生长状况时,从生物的实测指标(长、宽和体重等)可以分析出生长因子和控制因子,找出它们在不同时刻的作用。
一、因子分析的步骤
1,因子分析的操作步骤
(1)确认待分析的变量是否适合做因子分析
(2)构造因子变量
(3)因子旋转是因子变量更具有可解释性
(4)计算因子得分
2,在因子分析过程中计算的过程分为以下几步
(1)对样本数据进行标准化处理;
(2)计算相关系数矩阵
(3)计算相关系数矩阵的特征值和特征向量,确定因子个数;
(4)求出因子载荷矩阵;
(5)根据情况进行因子旋转;
(6)计算因子得分
(7)以因子的贡献率为权重,计算因子得分的综合得分,根据综合得分排序。
二、操作步骤的详细解释
1,确认待分析的变量是否适合做因子分析
因子分析是从众多的原始变量中重构少数几个具有代表意义的因子变量的过程。
隐含的前提是原有变量之间要具有比较强的相关性。
所以,在因子分析之前,首要的就是要先对原有变量做相关分析,看它是否满足做因子分子的条件。
确定是否适合做因子分析的方法:
(1)计算变量之间的相关系数矩阵
如果相关系数矩阵在进行统计检验中大部分相关系数都小于0.3,那么表明这些变量不适合于进行因子分析。
(2)巴特利特球形检验(BartlettTestofSphericity)
此方法采用假设检验法。
假设各变量不相关,即相关系数矩阵对角线上值都为1,其他值都为0.统计量由行列式得到,如果显著性概率值小于0.05,则认为假设不成立,各变量相关性较大,适合做因子分析。
(3)KMO(Kaiser-Meyer-Olkin)检验
KMO值在0-1之间,其值越接近1,表明所有变量之间简单相关系数平方和远大于偏相关系数平方和,就越适合因子分析。
一般认为,大于0.7则适合做因子分析。
2,构造因子变量
因子分析中有很多确定因子变量的方法,如基于主成分模型的主成分分析和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。
下面对其中主成分分析法最为常用。
主成分分析通过坐标变换手段,将原有的相关向量x做线性变化,转换为另外一组不相关的变量y,并将y用x表示
y1,y2….yp为原有变量的主成分,按在总方差中所占比列排次序,所占比例越大,表明综合原有变量的能力也越强,这些从前往后取前面几个主成分,一般认为累积变量共享率达到85%以上时,所选择的所有主成分能够较为完整的表示所有原变量的信息,从而确定了因子个数和公共因子。
3,因子旋转
因子旋转的目的:
因子分析不仅是要找出主因子,更重要的是知道每个主因子所代表的意义。
通过估计因子载荷矩阵得到的因子模型还只是一个初始模型,不一定能反映问题的实质特征,它们所代表的实际意义也不一定容易解释。
因子旋转就是为了解决因子不能反映实际意义的问题的一种改进方法。
另外,如果求得的载荷举着A的所有元素都接近0或者|1|,则模型的公共因子就抑郁解释,反之,如果多数居中,不大不小,则对模型的公共因素不易做出解释。
这时,通过因子旋转,可以使得载荷矩阵的每一列上的元素的绝对值尽可能来开距离,是其中一些元素接近0,另一些接近|1|。
因子旋转的依据是因子模型的不唯一性。
附:
设T为任意一个m*m的正交矩阵,则TTT=I
X=u+Af+e=u+A(TTT)f+e=u+(AT)(TTf)+e
则载荷矩阵由A变为(AT),公共因子由f变为(TTf),
此时,仍然满足因子模型的假设
E(TTf)=TTE(f)=0;
V(TTf)=TTV(f)T=I;
Cov(TTf,e)=E(TTfeT)=0.
所以,因子载荷是不唯一的,因子模型也是不唯一的,在满足条件的情况下,可以根据这个性质因子旋转,实现公共因子的实际可理解性。
因子旋转的方法很多,如正交旋转,斜交旋转,正交旋转又包括最大方差旋转,四次方最大化旋转等。
(1)最大方差旋转法
原理:
选择正交矩阵T,使得矩阵AT所有m个列元素平方的相对方差之和达到最大。
V=V1+V2+…….Vm
步骤:
设已求出的因子载荷矩阵为
A=
任意选取两列A*(例如第一,二列)与正交变换矩阵T因子旋转,T可以表示为
A*T
由上式求得各列元素的相对方差之和V,易知V是
函数,利用微积分求极值的方法,将V对
导数等于0,求出
,使V达到最大。
此时,其余列不变。
之后,在其余列中再人选两列重复上述旋转,m个公因子总共需要进
行m(m-1)次,此时算是完成了第一轮旋转,然后再重新开始,进行第
二轮配对旋转,如此继续下去,得到一系列因子载荷矩阵A1,A2…..,
必然有V1 实际应用中,当V的值变化不大时,即可停止旋转。 4,因子的命名解释 因子旋转的主要目的,就是能够更好地进行因子的命名解释。 这是因子分析中另一个核心问题。 经过上述步骤的分析,得到了公共因子,它能反映所有原有变量的信息。 经过因子旋转,每个不同的公共因子能够反映不同的原变量组合的信息,因子的命名解释就是为了进一步定义这些公共因子在实际应用中的含义。 5,因子得分 在所建立的因子模型中,将总体中的原有变量分解为公共因子与特殊因子的线性组合,同样的,也可以把每个公共因子表示成原有变量的线性组合,称之为因子得分函数。 常用方法有Thompson,加权最小二乘法,回归法等。 因子得分可以解决公共因子不可测量的问题。 同时,因子得分可以看做是各变量值得权数综合,表示各个变量对于公共因子的重要程度。 SAS程序: 要用SAS软件对资料进行因子分析,可调用SAS软件的FACTOR过程,即因子分析过程。 FACTOR过程可以完成以上所述各种类型的公共因子分析,和各种旋转。 FACTOR过程的处理的数据集可以是原始数据、统计数据的相关阵或协差阵。 FACTOR过程主要包含两个语句: PROCFACTOR语句和VAR语句,当使用主因子法时,还要配上PRIORS语句。 (1)PROCFACTOR语句。 其一般形式是: PROCFACTOR选项项1,选项2,…;PROCFACTOR语句后的选项可以是DATA=…用以指定被分析的数据集,若缺省,则分析最新建立的SAS数据集;也可以是OUT=…用以建立输出数据集,把有关结果存入其中;也可以是method=…用以规定提取因子的方法;还可以是rotate=…用以给出旋转方法,n=…规定提取公共因子的个数,当使用选项COV时,SAS用协差阵计算因子负荷阵,否则用相关阵计算因子负荷阵,msa表示输出KMO(Kaiser-Meyer-Olkin)检验。 (2)VAR语句。 一般形式是: VAR变量1,变量2……;用以规定要分析的变量。 (3)PRIORS语句。 一般形式是PRIORS数值1数值2…;在调用SAS的FACTOR过程做因子分析时,若采用主因子法,要用PRIORS语句。 在调用SAS的FACTOR过程做因子分析时,为使SAS执行主成分法,应当在PROCFACTOR语句中,采用METHOD=p选项。 在调用SAS的FACTOR过程做因子分析时,在PROCFACTOR语句中,采用选项METHOD=ML就能指示SAS执行极大似然法。 使用极大似然法时 必须是正定阵,协差阵行列式不能是0。 在调用SAS的FACTOR过程做因子分析时,为使SAS执行主因子分析,应当在PROCFACTOR语句中,采用METHOD=p选项,并增加PRIORS语句,且相应变量值不等于1。 例6.5对5个公司AlliedChemical(阿莱德化学)、duPont(杜邦)、UnionCarbide(联合碳化物)、Exxon(埃克森)、Texaco(德士古)股票100周的回报率(如表6-2)做因子分析。 表6-25个公司100周股票的回报率 AlliedChemical DuPont UnionCarbide Exxon Taxaco 0.000000 0.000000 0.000000 0.039473 -0.000000 0.027027 -0.044855 -0.003030 -0.014466 0.043478 0.122807 0.060773 0.088146 0.086238 0.078124 0.057031 0.029948 0.066808 0.013513 0.019512 0.063670 -0.003793 -0.039788 -0.018644 -0.024154 0.003521 0.050761 0.082873 0.074265 0.049504 -0.045614 -0.033007 0.002551 -0.009646 -0.028301 0.058823 0.041719 0.081425 -0.014610 0.014563 0.000000 -0.019417 0.002353 0.001647 -0.028708 0.006944 -0.025990 0.007042 -0.041118 -0.024630 0.010345 0.006353 0.083916 0.010291 -0.000000 -0.030717 0.020202 -0.040860 -0.039049 -0.050505 -0.003521 0.118812 0.089686 0.060070 0.021276 0.060071 0.079646 0.028807 0.036666 0.026041 -0.003333 -0.001025 0.028000 0.028938 -0.010152 0.055596 0.091282 0.042759 0.059375 -0.015812 0.051282 -0.007519 -0.041431 -0.016269 0.058510 -0.060976 -0.043561 0.023576 0.004566 -0.015075 -0.035714 0.018170 -0.021113 -0.007575 -0.010204 0.000000 -0.021569 -0.007843 0.088549 0.082474 -0.006734 -0.015030 -0.086956 -0.021037 -0.019047 0.000000 -0.017294 0.017316 0.054441 0.033980 0.030508 0.047619 0.055319 -0.008152 0.032863 0.023026 0.012846 -0.002016 0.013698 -0.031518 -0.061093 -0.043902 -0.042424 -0.029729 -0.014084 0.041096 0.016326 0.048523 0.018105 0.071428 -0.013158 -0.004016 -0.038229 -0.042407 -0.048888 0.003333 -0.008065 -0.014992 0.000000 -0.028037 -0.056478 -0.014228 -0.038627 -0.005714 -0.019607 0.051899 0.018557 0.066964 0.020302 -0.015000 -0.013559 -0.029352 0.012552 -0.008571 -0.010152 -0.037801 0.003252 -0.012397 -0.020172 -0.025641 -0.021429 0.031466 0.039749 0.016176 0.005263 -0.014599 -0.024390 -0.010060 0.004341 -0.005235 -0.014815 -0.020833 -0.091463 -0.007204 -0.015789 0.011278 -0.017021 0.064877 0.065312 0.026737 -0.096654 -0.075758 -0.073529 -0.053133 -0.026041 0.020576 0.058548 0.018141 0.063309 0.016042 0.088710 0.046460 0.022272 0.004059 -0.000000 0.007407 0.019027 0.045752 -0.008086 0.052631 -0.022059 0.002075 -0.017272 -0.021739 -0.045000 -0.031579 0.010352 0.012848 -0.013888 0.010695 0.039370 0.054303 -0.014799 0.011428 -0.005291 0.015151 0.029154 -0.021459 -0.009887 -0.021276 0.000000 -0.010466 0.035088 -0.014265 0.038043 -0.037313 -0.024038 -0.019068 -0.024602 -0.010471 0.015504 -0.027586 0.006479 0.022255 -0.026455 0.034351 0.024316 0.034335 0.020319 0.005434 -0.036900 0.011869 0.014523 0.007112 0.016216 0.068965 0.014663 0.016360 0.038135 0.063829 0.089606 0.079961 0.102616 0.002721 0.020000 0.000000 0.016949 0.029197 0.002713 0.004901 0.059210 0.077193 0.019504 -0.012178 0.039024 0.027950 0.009772 0.000000 -0.000000 -0.000265 -0.004196 0.014516 -0.031696 -0.004445 -0.014354 0.018405 -0.046900 0.061594 -0.043235 -0.029126 0.069277 0.056888 0.040956 0.040816 0.020000 -0.016901 -0.018268 -0.008197 -0.005602 -0.019607 -0.017192 -0.001618 -0.001653 -0.016901 0.005000 -0.040816 -0.035656 0.000000 0.014326 0.004975 -0.018237 -0.003361 -0.028146 0.035310 0.014851 -0.003096 -0.021922 -0.027257 0.005457 0.039024 0.018634 0.025862 -0.017513 0.018995 -0.004694 -0.057927 -0.018487 0.000000 -0.023968 -0.037735 0.087379 0.049657 0.033868 0.047748 0.039215 0.000000 -0.011419 -0.010345 -0.005208 0.028301 -0.019367 -0.011551 -0.022817 0.007853 0.013761 -0.046012 0.035893 0.044964 0.040612 0.004608 -0.077170 -0.004029 -0.003442 0.003797 -0.027522 0.034843 -0.008157 -0.018998 0.008827 -0.014151 -0.006734 -0.019737 -0.026408 0.023749 0.014354 -0.023729 -0.019295 -0.032550 -0.001221 0.023584 0.065972 0.024807 0.057944 0.020782 0.004608 0.000000 -0.036728 -0.014134 -0.007185 0.004587 -0.052117 -0.058925 -0.069892 0.009650 0.009132 0.054983 -0.003683 0.026975 -0.002389 0.009049 -0.003257 -0.009242 -0.022514 0.005988 -0.013452 0.022876 0.033582 0.001919 0.026190 0.004545 -0.003195 -0.005415 -0.003831 -0.013921 -0.000165 0.043590 -0.014519 -0.013385 0.021176 0.013824 -0.009317 0.013812 0.021654 -0.014927 -0.009090 -0.056426 -0.005557 -0.003854 -0.023696 -0.018348 0.003322 -0.041475 -0.029014 -0.002427 -0.004672 0.016556 0.017308 0.033864 0.034063 0.009389 -0.009772 -0.016068 -0.003854 0.014117 0.013953 0.026316 -0.016330 -0.009671 0.032482 0.027522 0.009615 0.009766 0.017578 0.016247 0.017857 -0.047619 -0.027079 -0.051823 -0.045468 -0.021929 -0.026667 -0.061630 -0.056680 -0.013452 -0.040358 0.010274 0.023305 0.034335 -0.018181 -0.004672 -0.044068 0.020704 -0.006224 -0.018518 0.004694 0.039007 0.038540 0.024988 -0.028301 0.032710 -0.039457 -0.029297 -0.065844 -0.015837 -0.045758 0.039568 0.024145 -0.006608 0.028423 -0.009661 -0.031142 -0.007941 0.011080 0.007537 0.014634 0.000000 -0.020080 -0.006579 0.029925 -0.004807 0.021429 0.049180 0.006622 -0.002421 0.028985 0.045454 0.046375 0.074561 0.014563 0.018779 0.050167 0.036380 0.004082 -0.011961 0.009216 0.019108 -0.033303 0.008362 0.033898 0.004566 试对股票回报率用主成分法、极大似然法主因子法和迭代主因子法分别做因子分析,取2个公共因子。 以变量AllChemi、duPont、UnionCar、Exxon、Texaco表示这5个公司的回报率,先建立主成分法的SAS程序 datastock; inputAllChemiduPontUnionCarExxonTexaco; cards; 0.0000000.0000000.0000000.039473-0.000000 0.027027-0.044855-0.00
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析