主成分分析_精品文档PPT课件下载推荐.ppt
- 文档编号:15477525
- 上传时间:2022-11-01
- 格式:PPT
- 页数:37
- 大小:1.72MB
主成分分析_精品文档PPT课件下载推荐.ppt
《主成分分析_精品文档PPT课件下载推荐.ppt》由会员分享,可在线阅读,更多相关《主成分分析_精品文档PPT课件下载推荐.ppt(37页珍藏版)》请在冰豆网上搜索。
胸围、大腿围和臂围,等等。
举例说明如何利用这些指标对每一儿童的生长发育作出正确评价?
仅用单一指标:
结论片面;
没有充分利用原有数据信息。
利用所有指标:
各指标评价的结论可能不一致,使综合评价困难工作量大。
相关概念主成分分析(主分量分析)从多个数值变量(指标)之间的相互关系入手,利用降维的思想,将多个变量(指标)化为少数几个互不相关的结合变量(指标)的统计方法。
基本思想寻找新变量(主成分)该新变量的主要特点:
比原来变量个数少各个变量间独立尽可能保留原始变量的信息主成分分析的应用1.对样品进行分类(肝病患者分类)利用主成分得分对样品进行分类2.对原始指标进行综合(调查表的制定)以互不相关的较少个综合指标反应众多原始指标提供的信息。
主成分分析的应用3.进行综合评价(基于主成分分析法的某医院老年病科医疗质量与效率的评价分析)4.进行探索性分析(医学生学习倦怠影响因素的主成分分析;
基于主成分分析的湿疹效应机制研究)利用因子载荷阵,找出影响各综合指标的主要原始指标。
应用例1通过患者的四个肝功能指标,来对肝病患通过患者的四个肝功能指标,来对肝病患者进行分类者进行分类原始数据(因素,调查表条目等等)原始数据(因素,调查表条目等等)XX11,XX22,.,XXmm计算特征根计算特征根11,22,33,.,mm确定主成分数确定主成分数kk提取主成分提取主成分ZZ11,ZZ22,ZZ33,.Z.Zkk主成分表达式主成分表达式ZZii=11XX11+22XX22+,.,+,.,mmXXmm总体评价表达式总体评价表达式Z=Z=1Z1+2Z2+3Z3+kZk
(一)
(一)主成分的求法主成分的求法1.1.对各原始指标值进行对各原始指标值进行标准化标准化为了方便,仍用为了方便,仍用Xij表示表示Xij。
标准化后的数据矩阵标准化后的数据矩阵X=2.2.求出求出XX11,X,X22,X,Xmm的相关矩阵的相关矩阵RRR=Cov(X)=3.3.求出矩阵求出矩阵RR的全部特征值的全部特征值(eigenvalue)(eigenvalue)ii,第第ii个主成分的组合系数个主成分的组合系数aai1i1,a,ai2i2,a,aimim满满足方程组足方程组:
(r11i)ai1+r12ai2+r1maim=0r21ai1+(r22i)ai2+r2maim=0rm1ai1+rm2ai2+(rmmi)aim=0(r11i)ai1+r12ai2+r1maim=0r21ai1+(r22i)ai2+r2maim=0rm1ai1+rm2ai2+(rmmi)aim=0ii为为矩阵矩阵RR的第的第ii个特征值,个特征值,共有共有mm个非个非负特征值,由大到小的顺序排列为:
负特征值,由大到小的顺序排列为:
12m0i=Var(Zi)4.4.由以上方程组,求出相应于特征值由以上方程组,求出相应于特征值ii的的特征向量特征向量(a(ai1i1,a,ai2i2,a,aimim)主成分主成分
(二)主成分的性质
(二)主成分的性质1.1.各主成分互不相关各主成分互不相关2.2.主成分的贡献率与累积贡献率主成分的贡献率与累积贡献率(原始指标值标准化原始指标值标准化)(指标个数指标个数)贡献率贡献率累积贡献率累积贡献率特征值(特征根)总体评价会用到总体评价会用到主成分个数的选取保留多少个主成分主要考虑保留部分的累积方差在方差总和中所占百分比(即累积贡献率),它标志着前几个主成分概括信息的多少。
常见的判断方法有:
1.特征值准则:
取特征值1的主成分。
SPSSSPSS软件中默认的软件中默认的方法。
方法。
2.累积方差比例原则:
一般推荐累积方差达到80%以上时,即可停止选择主成分。
3.利用碎石图:
将主成分按特征根从大到小排列,画出特征根随主成分个数变化的散点图,根据图的形状来判断主成分的个数。
曲线开始变平的前一个点(拐点)认为是提取的最大主成分数。
也就是根据特征根的变化速率来确定。
碎石图特征向量列出主成分表达式列出主成分表达式ZZ11为急性炎症成分为急性炎症成分(XX11转氨酶、转氨酶、XX22肝大指数)肝大指数)ZZ22为慢性炎症成分为慢性炎症成分(XX33硫酸锌浊度硫酸锌浊度)ZZ33为癌变成分为癌变成分(XX44甲胎球蛋白甲胎球蛋白)求出因子载荷阵求出因子载荷阵因子载荷的统计因子载荷的统计意义:
就是第意义:
就是第ii个变量与第个变量与第jj个个公共因子的相关公共因子的相关系数,即表示变系数,即表示变量量xixi依赖于依赖于ZZjj的份量(比重),的份量(比重),心理学家将它称心理学家将它称为载荷。
为载荷。
(应用(应用成分矩阵可以得成分矩阵可以得出与研究对象相出与研究对象相关的原始因素)关的原始因素)主成分得分主成分得分标准化指标主成分还原为标准化指标主成分还原为原始指标主成分原始指标主成分将该肝病患者的四项肝功能指标代入将该肝病患者的四项肝功能指标代入原始指标主成分原始指标主成分表达式:
表达式:
ZZ11=2.50865=2.50865,ZZ22=1.066261.06626,ZZ33=1.22943=1.22943该肝病患者可能为急性炎症。
该肝病患者可能为急性炎症。
Z=(Z=(11ZZ11+22ZZ22+33ZZ33+kkZZkk)Z:
Z:
被评价对象综合得分被评价对象综合得分ii:
权重(各主成分:
权重(各主成分贡献率贡献率)ZZii:
反应各相应评价指标信息的各主成分:
反应各相应评价指标信息的各主成分得分得分调查表数据制定调查表必须有预调查,蓝色标示的是预调查中的各个被调查者,红色标示的是调查表的各个条目。
表示各个条目之间表示各个条目之间的相关程度的相关程度最大的相关程度为1。
KOMKOM值:
检验变量的偏相关是否很小。
值:
KOMKOM值越值越大表示因子分析效果越好,一般认为大表示因子分析效果越好,一般认为0.50.5时,时,数据可做因子分析。
数据可做因子分析。
BartlettsBartletts球形检验球形检验:
是用来检验相关矩阵是是用来检验相关矩阵是否是单位阵,单位阵表示该因子模型不适宜。
否是单位阵,单位阵表示该因子模型不适宜。
若若P0.05P11、碎石、碎石图或者累积贡献率图或者累积贡献率80%80%)4.4.需要提供特征向量及主成分表达式需要提供特征向量及主成分表达式5.5.需要提供成分矩阵(因子载荷阵)需要提供成分矩阵(因子载荷阵)生存数据分析聚类分析COX比例风险回归模型
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 精品 文档