13判别分析.ppt
- 文档编号:2211532
- 上传时间:2022-10-27
- 格式:PPT
- 页数:43
- 大小:218.50KB
13判别分析.ppt
《13判别分析.ppt》由会员分享,可在线阅读,更多相关《13判别分析.ppt(43页珍藏版)》请在冰豆网上搜索。
判别分析判别分析DiscriminantAnalysis流行病与卫生统计学系流行病与卫生统计学系聚类分析:
对(样本)总体进行分类判别分析:
对(样本)个体进行分类判别与聚类判别与聚类聚类分析可以对样本聚类分析可以对样本/指标进行分类,判别分析指标进行分类,判别分析只对样本进行分类。
只对样本进行分类。
聚类分析事先聚类分析事先不知道事物的类别,也不知道应不知道事物的类别,也不知道应分几类;判别分析必须事先知道事物的类别,分几类;判别分析必须事先知道事物的类别,也知道应分几类。
也知道应分几类。
聚类分析不需要分类的历史资料,能直接对样聚类分析不需要分类的历史资料,能直接对样本进行分类;判别分析需要历史资料去建立判本进行分类;判别分析需要历史资料去建立判别函数,然后才能对样本进行分类。
别函数,然后才能对样本进行分类。
判别分析判别分析:
根据判别对象若干个指:
根据判别对象若干个指标的观测结果判定其应属于哪一类标的观测结果判定其应属于哪一类的统计学方法。
的统计学方法。
应用应用在经济学中,根据人均国民收入,人均工农业在经济学中,根据人均国民收入,人均工农业产值,人均消费水平等多个指标来判定一个国产值,人均消费水平等多个指标来判定一个国家的经济发展程度所属等级家的经济发展程度所属等级在农林害虫预报中,根据以往的虫情,多种气在农林害虫预报中,根据以往的虫情,多种气象因子来判别一个月后的虫情是大发生,中发象因子来判别一个月后的虫情是大发生,中发生或正常生或正常在体育运动中,判别某游泳运动员是适合练蛙在体育运动中,判别某游泳运动员是适合练蛙泳,仰泳还是自由泳泳,仰泳还是自由泳在医疗诊断中,根据某人多种检验指标来判断在医疗诊断中,根据某人多种检验指标来判断此人是某病患者还是非患者此人是某病患者还是非患者判别分析诊断判别分析诊断临床诊断:
临床诊断:
急腹症的患者,需要诊断患病原因。
急腹症的患者,需要诊断患病原因。
诊断阑尾炎时需要与其他急腹症作鉴别诊断;诊断阑尾炎时需要与其他急腹症作鉴别诊断;确诊为阑尾炎后,还需要诊断属何种类型,如确诊为阑尾炎后,还需要诊断属何种类型,如是否并发腹膜炎,是否穿孔等。
是否并发腹膜炎,是否穿孔等。
放射学诊断放射学诊断病理学诊断病理学诊断什么是判别分析?
什么是判别分析?
y=f(x1,x2,xk)x1,x2,xkx1,x2,xk病人病人(n1)正常人正常人(n2)yy分类明确的数据分类明确的数据计算机疾病辅助诊断原理计算机疾病辅助诊断原理以一批正常人和一批已经确诊的病人为样本,收以一批正常人和一批已经确诊的病人为样本,收集他们的各项检验指标,如化验指标、集他们的各项检验指标,如化验指标、X线、心线、心脑电图、超声波、脑电图、超声波、CT等诊断指标,然后利用这等诊断指标,然后利用这批分类明确的样本在这些相同指标上的观察值,批分类明确的样本在这些相同指标上的观察值,建立一个关于指标的判别判函数和判别准则建立一个关于指标的判别判函数和判别准则(区区分病人和正常人的界限的方法分病人和正常人的界限的方法),使得按此准则,使得按此准则来判断这批样本归属的正确率达到最高。
这就是来判断这批样本归属的正确率达到最高。
这就是计算机疾病辅助诊断方法,它的的理论依据就是计算机疾病辅助诊断方法,它的的理论依据就是判别分析方法原理。
判别分析方法原理。
第一节第一节判别分析的基本思想判别分析的基本思想判别分析判别分析(discriminantanalysis):
根据:
根据一批分类明确的样本在若干指标上的观一批分类明确的样本在若干指标上的观察值,建立一个关于指标的判别函数和察值,建立一个关于指标的判别函数和判别准则,然后根据这个判别函数和判判别准则,然后根据这个判别函数和判别准则对新的样本进行分类,并且根据别准则对新的样本进行分类,并且根据回代判别的准确率评估它的实用性。
回代判别的准确率评估它的实用性。
判别函数判别函数(discriminantfunction):
指的是:
指的是一个关于指标变量的函数。
每一个样本在一个关于指标变量的函数。
每一个样本在指标变量上的观察值代入判别函数后可以指标变量上的观察值代入判别函数后可以得到一个确定的函数值。
得到一个确定的函数值。
判别准则判别准则(discriminantrule):
对样本的判:
对样本的判别函数值进行分类的法则。
别函数值进行分类的法则。
建立判别准则建立判别准则:
建立判别函数建立判别函数:
其原则是,将所有样本按其判:
其原则是,将所有样本按其判别函数值的大小和事先规定的判别原则分到不别函数值的大小和事先规定的判别原则分到不同的组里后,能使得分组结果与原样本归属最同的组里后,能使得分组结果与原样本归属最吻合。
吻合。
回代样本回代样本:
即计算出每一个样本的判别函数值,:
即计算出每一个样本的判别函数值,并根据判别准则将样本归类。
并根据判别准则将样本归类。
估计回代的错误率估计回代的错误率:
即比较新的分组结果和原:
即比较新的分组结果和原分组结果的差别,并以此确定判别函数的效能;分组结果的差别,并以此确定判别函数的效能;判别新的样本判别新的样本:
如果判别函数效能较高,可用:
如果判别函数效能较高,可用以对新样本进行归类判别。
以对新样本进行归类判别。
判别分析的内容判别分析的内容判别分析的方法判别分析的方法FisherFisher判别分析法判别分析法采用采用FisherFisher判别准则:
判别准则:
它使得类间点的它使得类间点的距离距离最大,而类内点的距离最小。
最大,而类内点的距离最小。
适合于两类的判别分析。
适合于两类的判别分析。
BayesBayes判别分析法判别分析法采用采用BayesBayes判别准则:
判别准则:
它使得每一类中的每个样本都以最大的它使得每一类中的每个样本都以最大的概率概率进入进入该类。
该类。
适合于多类的判别分析。
适合于多类的判别分析。
第二节第二节FisherFisher判别分析法判别分析法1.1.建立建立FisherFisher判别函数判别函数假设假设AA和和BB为分类明确的两类症状。
在总体为分类明确的两类症状。
在总体AA中观中观察了察了pp例,在总体例,在总体BB中观察了中观察了qq例,每一例记录例,每一例记录了了kk个指标,它们是个指标,它们是x1,x2,x1,x2,xk,xk。
令。
令yy是这是这kk个指标的一个线性函数,即,个指标的一个线性函数,即,其中,其中,c1,c2,ck是待估计的未知系数。
是待估计的未知系数。
称这个线性函数是称这个线性函数是Fisher判别函数。
判别函数。
以以p=q=k=2来说明来说明Fisher判别分析法的基本原理和计算方法判别分析法的基本原理和计算方法根据根据Fisher判别分析法的基本原理,就是要选择一组判别分析法的基本原理,就是要选择一组适当的系数适当的系数c1,c2,ck,使得类间差异,使得类间差异D最大最大且类内差异且类内差异V最小,即,使得下式的值最小,即,使得下式的值Q达到最大。
达到最大。
根据多元函数求极值的原理和方法,使得根据多元函数求极值的原理和方法,使得Q取最大取最大值的点是值的点是Q的一阶偏导函数等于的一阶偏导函数等于0的方程组的解。
的方程组的解。
令上述方程组的解是:
令上述方程组的解是:
那么,那么,Fisher判别函数估计式是:
判别函数估计式是:
2.建立建立Fisher判别准则判别准则令判别临界点是:
令判别临界点是:
设设y*是某个样本的判别函数值,则,是某个样本的判别函数值,则,Fisher判别准则判别准则是:
是:
如果如果y*y0,则,则y*A类类3.估计各项指标对判别函数的贡献率估计各项指标对判别函数的贡献率对贡献率很小的指标可以剔除,重新建立对贡献率很小的指标可以剔除,重新建立只含有重要指标的判别函数。
只含有重要指标的判别函数。
第三节第三节BayesBayes判别分析法判别分析法Bayes判别法是以概率论中Bayes条件概率公式为基础导出的判别法。
WarnerHR等在1961年首先把它成功底应用于鉴别先天性心脏病,他们利用50个症候,鉴别33种先天性心脏病,借助于计算机,共试验36例,结果由计算机得出的判别结果与三位有经验的心脏病专家通过生理学研究和外科检查的诊断结论一致。
Bayes判别的基本思想E.g.急性肠梗阻的鉴别诊断第三节第三节BayesBayes判别分析法判别分析法1.建立建立Bayes判别函数判别函数假设假设x=(x1,x2,xk)出现在第出现在第i类中的事前概率是类中的事前概率是pi,i=1,2,g,它可以是理论值,也可以是经验值。
当样,它可以是理论值,也可以是经验值。
当样本是随机抽样得到的,事前概率可以取样本估计值,即,本是随机抽样得到的,事前概率可以取样本估计值,即,再假设再假设g个总体均服从个总体均服从k元正态分布,则对于任意一个样元正态分布,则对于任意一个样本本x*=(x1*,x2*,xk*),它属于类,它属于类s的事后概率是:
的事后概率是:
其中其中2.建立建立Bayes判别准则判别准则将每一个点将每一个点x判别到事后概率最大的类中。
判别到事后概率最大的类中。
3.估计各项指标对判别函数的作用估计各项指标对判别函数的作用o一元方差分析:
检验每一个指标变量是否对判别函数一元方差分析:
检验每一个指标变量是否对判别函数的判别能力有显著性意义。
的判别能力有显著性意义。
o多元方差分析:
检验所有指标变量是否联合对判别函多元方差分析:
检验所有指标变量是否联合对判别函数的判别能力有显著性意义。
数的判别能力有显著性意义。
o如果判别函数中特异性强的指标越多,则判别函数的如果判别函数中特异性强的指标越多,则判别函数的判别功能也就越强。
判别功能也就越强。
4.判别准则效能的评估判别准则效能的评估o错判率估计错判率估计(error-countestimates)o事后概率错误率估计事后概率错误率估计(posteriorprob.error-rate)例例2、为研究舒张期血压与血浆胆固醇对冠心病的作用,为研究舒张期血压与血浆胆固醇对冠心病的作用,调查了调查了50-59岁的女冠心病人岁的女冠心病人15名和正常人名和正常人16名。
他们的名。
他们的舒张期血压舒张期血压(x1)与血浆胆固醇与血浆胆固醇(x2)数据列在下表中。
试用数据列在下表中。
试用判别分析法建立判别冠心病人与正常人的判别函数。
判别分析法建立判别冠心病人与正常人的判别函数。
datad2;doi=1to16;dogrp=1to2;inputidx1x2;output;end;end;cards;19.865.18110.662.07213.333.73212.534.451513.335.961511.203.4216.169.333.63;run;procdiscrimdata=d2outstat=outanovamanovapool=test(协差阵齐性检验)(协差阵齐性检验)listerr(在输出结果(在输出结果中显示训练样本回代后被错误分类的结果)中显示训练样本回代后被错误分类的结果)posterr(显示分类准则的后验错分概(显示分类准则的后验错分概率估计值);率估计值);classgrp;varx1x2;priorsprop;(用于指定先验概率的类别用于指定先验概率的类别)run;SAS程序程序DiscriminantAnalysisDiscriminantAnalysis(11)TestofHomogeneityofWithinCovarianceMatricesTestofHomogeneityofWithinCovarianceMatricesTestChi-SquareValue=2.60with3DFProbChi-Sq=0.4567TestChi-SquareValue=2.60with3DFProbChi-Sq=0.4567S
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 13 判别分析