判别分析作业图文.docx
- 文档编号:2480802
- 上传时间:2022-10-30
- 格式:DOCX
- 页数:7
- 大小:868.81KB
判别分析作业图文.docx
《判别分析作业图文.docx》由会员分享,可在线阅读,更多相关《判别分析作业图文.docx(7页珍藏版)》请在冰豆网上搜索。
判别分析作业图文
1.为什么要使变量去掉单位而使尺度无关?
为什么马氏距离是与尺度无关的?
(必讲题目,给出理论证明
(1基于欧氏距离,两个点之间的长度为:
每个变量之间的变量之间的尺度都不一样,例如第一个变量的数量级是1000,而第二个变量是变量的数量级是10,如v1=(3000,20,v2=(5000,50,那么如果只有2维的点中,欧氏距离为:
由上面可以很容易看出,当两个变量都变成数量级为10的时候,第一个变量存在一个权重:
10,因而如果不使用相同尺度的时候,不同尺度的变量就会在计算的过程中自动地生成相应的权重。
因而,如果两个变量在现实中的权重是相同的话,就必须要先化成相同的尺度,以减去由尺度造成的误差,这就是标准化的由来。
如果化成相同尺度的方法就变成标准化方法了,标准化的方法有很多种,有些办法是使数据化成[0,1]之间,如min-max标准化;有些通过原始数据减去平均值再除标准差的方法,如z-score标准化;有些类似如上面的方法那样,化成相同的数量级的方法,如decimalscaling小数定标标准化。
(2根据上面1所描述,当计算两点的相似度(也可以说是距离的时候,第一步是首先标准化,化成与尺度无关的量,再计算它的距离。
但是如果是单纯使每个变量先标准化,然后再计算距离,可能会出现某种错误,原因是可能在有些多维空间中,某个两个维之间可能是线性相关的,如下图所示:
黄色部分为样品点,可以知道x1与x2是线性相关的,根据正态分布,对于中心点u,与A与B的标准距离应该是相同的,而马氏距离能做到这一点,但欧氏距离做不到,如下图所示:
由上图看到,如果使用欧氏距离,A点与B点距离中心点相同,但是又可以看出,A点处于样品集的边缘了,再外出一点就成异常点了。
因此我们使用欧氏距离计算的时候,不能有效地区分出异常数据,看不出两变量之间的相似性与差异性,而上图中,A与B对于全体样品来说,差异性是够大的了。
为了解决这个问题,我们可以通过旋转坐标轴的方法,如下图所示:
可以看到y1与y2是线性无关的,因此我们可以通过对线性无关的分量进行标准化后,再求得距离是合理的。
其实通过旋转坐标轴的方式,相当于对x进行相应的线性变换:
Y=PX,使Y里面的各分变量变成线性无关的。
设
是
随机向量=[x1,x2,...xp]的协方差矩阵,它有特征值-特征向量对(λ1,e1,(λ2,e2,.....(λp,ep,其中λ1>=λ2>=....>=λp,则第i主成分由
因此得到的新的变量Y里面的各分量是线性无关的,此时对于离中心点距离为某常数C形成的曲面是超椭球面。
而yi的方差为λi,因而需要再把yi标准化,使之变成yi/λi,形成新的yi,这样生成的yi之间变成了与尺度无关的变量了,公式如下:
其中P是以特征向量为行向量的矩阵,根据正定距阵,特征向量互相正交。
现在来验证Y的协方差:
所以,对于旋转压缩后的Y的各分量之间线无关,而且已经标准化,与尺度无关,此时以Y分量为坐标轴形成的空间中,离中心距离为常数C的面为正圆球面。
因而可以直接使用欧氏距离描述两点之间的相似度,也就是距离,因此有:
因此,当原坐标经过适当的变换之后,可以求出两点与尺度无关的距离,这也是使用马氏距离的原因。
2,人文与发展指数是联合国开发计划署于1990年5月发表的第一份《人类发展报告》中公布的。
该报告建议,目前对人文发展的衡量指标应当以人生的三大要素为重点。
衡量人生的三大要素的指标分别为:
实际人均GDP指数、出生时的预期寿命指数、受教育程度指数(由成人识字率指数和综合总人学率指数按2/3、1/3的权重加权而得,将一生三个指数合成为一个指数就是人文发展指数。
今从2007年世界各国人文发展指数(2005年的排序中,选取高发展水平、中等发展水平和低发展水平国家各6个作为三组样品,另选四个国家作为待判样品,资料如下表所示。
试用判别分析过程对以下数据资料进行判别分析,并据此对待选的四个国家进行判别归类(分别使用距离判别和Fisher判别法。
解:
Matlab计算:
计算法:
解:
Matlab:
计算法:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别分析 作业 图文
![提示](https://static.bdocx.com/images/bang_tan.gif)