判别分析(3)贝叶斯判别PPT文件格式下载.ppt
- 文档编号:15559143
- 上传时间:2022-11-05
- 格式:PPT
- 页数:29
- 大小:610KB
判别分析(3)贝叶斯判别PPT文件格式下载.ppt
《判别分析(3)贝叶斯判别PPT文件格式下载.ppt》由会员分享,可在线阅读,更多相关《判别分析(3)贝叶斯判别PPT文件格式下载.ppt(29页珍藏版)》请在冰豆网上搜索。
待判样品X属于哪一类?
判别方法是,先由贝叶斯准则计算待判样品来判别方法是,先由贝叶斯准则计算待判样品来自自个总体的条件概率(也称后验概率)为个总体的条件概率(也称后验概率)为(4.18)式中,式中,归入第归入第总体的先验概率,时总体的先验概率,时为。
为。
未知4.3.1贝叶斯准则贝叶斯准则问题:
对于诸总体,显然分母(全概率)都是相同的,因此只要比较式分子的大小,即可判断条件概率的大小,进而对待判样品作出归类。
则X属于第t个总体。
4.3.1贝叶斯准则贝叶斯准则不妨设不妨设,则待判,则待判样品就归入第类总体样品就归入第类总体。
因此式(因此式(4.19)称为判别函数,按照条件概率)称为判别函数,按照条件概率最大进行归类的准则,称为最大进行归类的准则,称为贝叶斯判别准则贝叶斯判别准则。
在式(在式(4.19)中,为了给出判别函数)中,为了给出判别函数的具体表达式,下面以服从多元正态分布情的具体表达式,下面以服从多元正态分布情况来讨论。
况来讨论。
设设是第类总体第是第类总体第个样品第个样品第个变量的个变量的观测值,且各总体样品都是相互独立的正态随观测值,且各总体样品都是相互独立的正态随机向量,即机向量,即4.3.1判别函数判别函数在该假设条件下,由于均未知,为此在该假设条件下,由于均未知,为此我们可根据第总体的样品数据,计算出总体的我们可根据第总体的样品数据,计算出总体的样本均值及总体样本的协方差矩阵,用样本均值及总体样本的协方差矩阵,用作为总体的估计。
由统计理论知,作为总体的估计。
由统计理论知,式中,式中,第第类总体样品均值向量。
类总体样品均值向量。
总体第总体第个变量均值个变量均值()4.3.1判别函数判别函数称为称为总体组内方差总体组内方差协方差矩阵,式中,协方差矩阵,式中,此时,此时,均为已知,均为已知,总体的密度函数可表总体的密度函数可表为为4.3.1判别函数判别函数这里,这里,为矩阵为矩阵的逆矩阵的行列式。
上式表的逆矩阵的行列式。
上式表明明是一个具体已确定的函数。
下面的问题是一个具体已确定的函数。
下面的问题是要确定式是要确定式(4.19)中的先验概率中的先验概率,对于,对于的确定,实际应用中常用其频率来估计,即的确定,实际应用中常用其频率来估计,即。
由此式。
由此式(4.19)完全确定,于是完全确定,于是可以进行判别归类,为了计算方便,我们对式可以进行判别归类,为了计算方便,我们对式(4.19)进行化简,即对式进行化简,即对式(4.19)取对数,取对数,4.3.1判别函数判别函数对式中的同类项合并,去掉与分组无关的项。
对式中的同类项合并,去掉与分组无关的项。
并令并令故上式可写成故上式可写成(4.20)令令4.3.1判别函数判别函数式中,式中,这里这里为矩阵为矩阵中的元素。
于是最终得化简后中的元素。
于是最终得化简后的的类总体的判别函数为类总体的判别函数为()(4.214.21)4.3.1判别函数判别函数4.3.24.3.2判别效果的检验判别效果的检验建立建立个总体的判别函数后,这些判别函数的个总体的判别函数后,这些判别函数的判别效果如何需要检验。
在实际应用中,可将已判别效果如何需要检验。
在实际应用中,可将已知类别的样品代入判别函数进行回判。
如果判对知类别的样品代入判别函数进行回判。
如果判对率在率在75以上,则认为判别函数有效,其常用的以上,则认为判别函数有效,其常用的公式为公式为此外,还可采用统计方法对判别函数效果进行此外,还可采用统计方法对判别函数效果进行检验。
检验。
对于判别函数的显著检验,我们可用马氏距对于判别函数的显著检验,我们可用马氏距离来检验总体间差异是否显著。
若总体间差异不离来检验总体间差异是否显著。
若总体间差异不显著,显然建立在各总体基础之上的判别函数用显著,显然建立在各总体基础之上的判别函数用于归类其结果就不可靠。
马氏距离的计算公式如于归类其结果就不可靠。
马氏距离的计算公式如下:
下:
(4.22)应用统计量应用统计量对于给定水平对于给定水平查查分布表得其临界值分布表得其临界值。
如果求得的如果求得的,则说明,则说明总体与总体与总总体间差异显著,两总体的判别函数效果明显,体间差异显著,两总体的判别函数效果明显,否则为不显著。
否则为不显著。
4.3.34.3.3待判样品的归类待判样品的归类在建立了总体的判别函数且通过对各总体的在建立了总体的判别函数且通过对各总体的判别函数显著性检验后,若判别函数效果明显,判别函数显著性检验后,若判别函数效果明显,我们就可用其进行归类识别,其方法是将待判我们就可用其进行归类识别,其方法是将待判样品样品代入判别函数式(代入判别函数式(4.21),),计算它归入每个类的判别函数计算它归入每个类的判别函数值值(),然后选出),然后选出则将则将就归入第就归入第类。
类。
实际应用中,常常还需要知道待判样品实际应用中,常常还需要知道待判样品归归入第几类的概率,可以用下式计算:
入第几类的概率,可以用下式计算:
(4.23)对式(对式(4.23)两边取对数,并注意到:
在式)两边取对数,并注意到:
在式(4.23)中的分子、分母用它的反对数代替,)中的分子、分母用它的反对数代替,并不影响归类效果,故式(并不影响归类效果,故式(4.23)可表为)可表为计算时为避免产生计算计算时为避免产生计算“溢出溢出”现象,上式可改现象,上式可改为为(4.24)用计算出的概率大小判别样品用计算出的概率大小判别样品的归属,只要的归属,只要选中的最大的那个相应的类即可选中的最大的那个相应的类即可。
4.3.44.3.4线性判别分析计算程序线性判别分析计算程序n程序说明程序说明n1ff1dataMatlabdatafile(Mat文文件件),存存放放原原始始数数据据矩矩阵阵trainingmn、向向量量group1n和和待检测矩阵待检测矩阵sample;
n2class=classify(sample,training,group)线性判别分析函数线性判别分析函数
(1)classclassify(sample,training,group)指指定定sample数数据据的的每每的的每每一一行行到到训训练练集集training指指定定的的一一个个类类中中。
sample和和training必必须具有相同的列数。
须具有相同的列数。
(2)group向量包含从向量包含从1到组数的正整数,它到组数的正整数,它n指指明明训训练练集集中中的的每每一一行行属属于于哪哪一一个个类类。
group和和training必须具有相同的行数。
必须具有相同的行数。
n(3)返返回回class,它它是是一一个个与与sample具具有有相相同同行行数数的的向向量量。
class的的每每一一个个元元素素指指定定sample中中对对应应元元素素的的分分类类。
通通过过计计算算sample与与training中中每每一一行行的的马马氏氏距距离离,classify函函数数决决定定sample中的每一个行属于哪一个分类。
中的每一个行属于哪一个分类。
4.3.54.3.5应用综合实例应用综合实例例例4.14.1我国山区某大型化工厂,在厂区及邻我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的近地区挑选有代表性的15个大气取样点,每日个大气取样点,每日四次同时抽取大气样品,测定其中含有的四次同时抽取大气样品,测定其中含有的6种气种气体的浓度,前后共体的浓度,前后共4天,每个取样点每种气体实天,每个取样点每种气体实侧侧16次,试计算每个取样点每种气体的平均浓次,试计算每个取样点每种气体的平均浓度。
数据如表度。
数据如表4.1所示。
气体数据对应的污染地所示。
气体数据对应的污染地区分类如表中最后一列所示。
现有两个取自该地区分类如表中最后一列所示。
现有两个取自该
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别分析 贝叶斯 判别