数学建模之模糊评价与模糊聚类.docx
- 文档编号:1591937
- 上传时间:2022-10-23
- 格式:DOCX
- 页数:10
- 大小:343.17KB
数学建模之模糊评价与模糊聚类.docx
《数学建模之模糊评价与模糊聚类.docx》由会员分享,可在线阅读,更多相关《数学建模之模糊评价与模糊聚类.docx(10页珍藏版)》请在冰豆网上搜索。
一、模糊评价
模糊评价法是应用模糊理论和模糊关系合成的原理,通过多个因素对被评
价事物隶属等级状况进行综合性评价的一种方法。
运用模糊评价法,通过多因素
或多指标,既对被评价事物的变化区间作出某种划分,又对事物属于各评价等级
的程度作出分析,从而更深入和客观地对被评价事物进行描述。
特点:
①模糊评价法的结果是一个向量,而不是一个数值,即被评价事物的状况是通过被评价事物的等级隶属度来表示。
②模糊评价法可以是一种多层的评价,即可以先对被评价事物的某一层面进行模糊评价,再将各层面的模糊评价结果进行模糊合成,得出总的模糊评价结果。
③模糊评价法具有指标或因素的自然可综合性。
由于模糊评价法只需确定各指标的等级隶属度,既可用于主观指标,又可用于客观指标,以此而无需专门对指标进行无量纲处理。
1.1模糊评价的应用
①人事考核中的应用,
②单位员工的年终评定,
③昆山公安信息化建设效绩的评估(下载文档),
④我国商业银行内部控制评价体系研究(下载文档),
⑤石化行业业绩评价(下载文档)等。
1.2一级模糊综合评判模型的建立步骤
①确定因素集及评语集
确定被评价对象的因素集U,,评语集;
②构造模糊关系矩阵R,进行单因素评判。
用表示U中的因素对应于V中等级的隶属关系,则有
③确定各因素的权重
用表示第i个因素的权重,,则评价因素权向量A为
。
④综合评判
由模糊关系矩阵R得到一个模糊变换为
则评判的综合结果为
。
1.3多层次模糊综合评判模型的建立步骤
①确定被评价对象的因素集U,,评语集;
②将按照某种属性划分成s个子因素集,即。
其中并且满足以下关系:
③分别对每个因素集做综合评价。
确定中各个因素相对于V的权重,用表示单因素评判矩阵,则一级评价向量为
④将各个看成一个因素,记该因素为,得到K的单因素评价矩阵为
按照对U的重要程度,确定权重,则得二级评价向量为
若包含的因素较多,可将多次划分,得到三级,四级评价模型等。
例题:
向位专家就科研课题进行调查,通过统计调查数据,形成科研课题A评价数据如下表:
科研课题A的评价数据
模型的建立
①确定因素集及评语集
令指标集为,指标由5个指标组成,即,表示立题必要性,表示技术先进性,。
表示实施可行性,。
表示经济合理性,表示社会效益。
令评语集为V,,,“四级”,。
由加权平均原则确定。
②构造模糊关系矩阵R,,进行单因素评判。
③确定各因素的权重
令权重集为,=0.15,=0.20,=0.10,=0.25,=0.30。
④综合评判
其中是合成的算子为向量或矩阵间的“乘”运算。
模型的求解
①确定因素集及评语集
根据加权平均原则来确定评语。
对各评语赋值,令“一级”、“二级”、“三级”、“四级”、“五级”分别为0.9分、0.7分、0.5分、0.3分、0.1分,令V=(0.90.70.50.30.1)。
②构造模糊关系矩阵R,,进行单因素评判。
从表可知,在立题必要性的调查中有6位专家认为属于“二级”,有3位专家认为属于“三级”;在技术先进性的调查中有5位专家认为属于“一级”,有3位专家认为属于“二级”,有1位专家认为属于“三级”;在实施可行性的调查中有4位专家认为属于“二级”,有4位专家认为属于“三级”,有位1专家认为属于“四级”;在经济合理性的调查中有7位专家认为属于“二级”,有2位专家认为属于“三级”;在社会效益的调查中有4位专家认为属于“一级”,有4位专家认为属于“二级”,有1位专家认为属于“三级”。
根据从指标着眼认为科研课题A属于评语的人数占总参与评价人数的比例数来建立被评对象与评语集之间的模糊关系。
由评价数据得,,同理得
,即。
同理得:
从而得到科研课题A与评语集V之间的模糊关系矩阵为
④综合评判
所以9名专家应用模糊评价法对某科研课题A给出的评语分数N为
二、模糊聚类分析法
在工程技术和经济管理中,常常需要对某些指标按照一定的标准(相似的程度或亲疏关系等)进行分类处理。
例如,根据生物的某些性态对其进行分类,根据空气的性质对空气质量进行分类,以及工业上对产品质量的分类等等。
这些对客观事物按一定的标准进行分类的数学方法称为聚类分析,它是多元统计“物以聚类”的一种分类方法。
然而,在科学技术、经济管理中有许多事物的类与类之间并无清晰的划分,边界具有模糊性,它们之间的关系更多的是模糊关系。
对于这类事物的分类,一般用模糊数学方法、我们把应用模糊数学方法进行的聚类分析,称为模糊聚类分析。
2.1步骤
①获取数据
设论域是被分类对象,其中由m个指标表示每个对象的性态,的观测值为
则得到原始数据矩阵为。
在实际问题中,不同的数据一般有不同的量纲,为了使有不同量纲的量能进行比较,需要将数据规格化,常用的方法有:
②数据标准化处理
为了让原始数据能满足模糊聚类的要求,需要将原始数据作标准化处理,常用的方法有:
(1)平移—标准差变换
对第i个变量作标准化处理,将换成,即
式中:
(2)平移—极差变换
若经过平移—标准差变换后,还存在数据,则再对其平移—极差变换得
则得到模糊矩阵为
③构造模糊相似矩阵
设论域,为的观测值,则有数据矩阵。
和的相似系数为,求的方法有:
(1)夹角余弦法
(2)相关系数法
(3)距离法
一般取,其中为适当选取的参数,它使得,可采用的距离有:
1)Hamming距离
2)Euclid距离
3)Chebyshev距离
(4)贴近度法
1)最大最小法
2)算术平均最小法
3)几何平均最小法
④聚类
(1)模糊传递闭包法
用平方法求出模糊相似矩阵的传递闭包,再从大到小取一组,并确定其相应的截矩阵,将其分类,画出动态聚类图。
(2)直接聚类法
1)取最大值,对每个作相似类,若和满足1,则看做是一类,当不同相似类出现公共元素时,将公共元素所在类合并。
2)取次大值,找出的元素对将对应于的等价分类中和所在类合并成一类,所有情况合并后得到相应于水平上的等价分类。
3)依次类推,直到合并到X变成一类为止,最后得出动态聚类图。
例题:
某地区内有12个气象观测站,10年来各站测得的年降水量如表1所示。
为了节省开支,想要适当减少气象观测站,试问减少哪些观察站可以使所得到的降水量信息仍然足够大?
表1年降水量(mm)
解:
我们把12个气象观测站的观测值看成12个向量组,由于本题只给出了10年的观测数据,根据线性代数的理论可知,若向量组所含向量的个数大于向量的维数,则该向量组必然线性相关。
于是只要求出该向量组的秩就可确定该向量组的最大无关组所含向量的个数,也就是需保留的气象观测站的个数。
由于向量组中的其余向量都可由最大线性无关组线性表示,因此,可以使所得到的降水信息量足够大。
用i=1,2,⋯,10分别表示1981年,1982年,…,1990年。
表示第j个观测站第i年的观测值,记。
利用MATLAB可计算出矩阵A的秩r(A)=10,且任意10个列向量组成的向量组都是最大线性无关组,例如,我们选取前10个气象观测站的观测值作为最大线性无关组,则第11,12这两个气象观测站的降水量数据完全可以由前10个气象观测站的数据表示。
设表示第i个气象观测站的观测值,则有
若上述观测站的数据不是10年,而是超过12年,则此时向量的维数大于向量组所含的向量个数,这样的向量组未必线性相关。
所以我们再考虑一般的解法,首先,我们利用已有的12个气象观测站的数据进行模糊聚类分析,最后确定从哪几类中去掉几个观测站。
(1)建立模糊集合
设(这里我们仍用普通集合表示)表示第个观测站的降水量信息,我们利用模糊数学建立隶属函数:
利用MATLAB程序可以求得,的值分别见表2,表3。
表3均值的值
表4标准差的值
(2)利用格贴近度建立模糊相似矩阵
令
求模糊相似矩阵。
(3)求R的传递闭包
CC求得是传递闭包,也就是所求的等价矩阵。
取,进行聚类,可以把观测站分为4类:
上述分类具有明显的意义,属于该地区10年中平均降水量偏低的观测站,属于该地区10年平均降水量偏高的观测站,是平均降水量最大的观测站,而其余观测站属于中间水平。
(4)选择保留观测站的准则
显然,去掉的观测站越少,则保留的信息量越大。
为此,我们考虑在去掉的观测站数目确定的条件下,使得信息量最大的准则。
由于该地区的观测站分为4类,且第4类只含有一个观测站,因此,我们从前3类中各去掉一个观测站,我们的准则如下:
其中,表示该地区第i年的平均降水量,表示该地区去掉3个观测站以后第i年的平均降水量。
利用MATLAB软件,我们计算了28组不同的方案(表5),求得满足上述准则应去掉的观测站为:
,此时年平均降水量曲线如图1所示,二者很接近。
图1年降水量比较示意图
表5前3类各取消一个站点的各方案的误差平方和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 模糊 评价