基于层次分析法和聚类对水质的研究.docx
- 文档编号:26854224
- 上传时间:2023-06-23
- 格式:DOCX
- 页数:16
- 大小:452.86KB
基于层次分析法和聚类对水质的研究.docx
《基于层次分析法和聚类对水质的研究.docx》由会员分享,可在线阅读,更多相关《基于层次分析法和聚类对水质的研究.docx(16页珍藏版)》请在冰豆网上搜索。
基于层次分析法和聚类对水质的研究
基于层次分析法和聚类分析对国内各大水系水质的对比研究
摘要:
本文先用聚类分析对给出的水质数据做聚类分析,观察水质污染是局部问题还是全国性问题。
然后利用专家打分法给出的信息,将每个专家的打分当做一个向量,服从一个多元分布,如此就可以利用多元分布的极大似然估计估计出分布的均值,再将均值作为对每个指标的真实打分,再以此均值向量为基础利用层次分析法确定权重,从而有效利用专家给出的信息,并且消除层次分析法的主观性;最后利用确定的权重得到个水系的污染指数,将指数进行分等级,并将其与聚类分析的结果对比。
关键词:
层次分析法专家打分法多元分布极大似然估计
水质污染指数
目录
一、引言3
1.1研究背景3
1.2研究现状4
二、模型理论计算5
2.1对权重的确定6
2.1.1多元分布的极大似然估计6
2.1.2层次分析法6
3、对各水系做聚类分析并编制污染指数................................7
3.1聚类分析7
3.2污染指数的编制9
3.3两者的比较10
结束语.............................................................11
【参考文献】........................................................12
附录...............................................................13
一、引言
1.1研究背景
水是人们日常生活中必不可少的物质,我们每天都会饮用大量的水资源,水质大好坏就关系到人们的切身利益,因此越来越多的人开始重视对水资源的保护,然而由于工业化进程的加速发展,废弃物的随意排放,导致许多地方的水都有了相当程度的污染,因此本文想通过对水质的分析能让大家更加意识到对水资源保护的重要性。
层次分析法(AnalyticHierarchyProcess,简称AHP)是对一些较为复杂,较为模糊的问题作出决策的简易方法,它特别适用于那些难以完全定量分析的问题。
它是由美国的运筹学家T.L.Saaty教授于70年代初期提出的一种简便、灵活而又实用的多准则决策方法。
在实际生活中,一个企业经常会遇到关于产品及服务提供优先顺序考虑的问题,或者会遇到一笔资金该如何分配的问题。
这些问题看起来是非常繁琐的,一堆需要考虑的因素放在那里,千头万绪,有时甚至让人摸不着头脑,不知道该如何下手。
而事实上,运用市场研究的方法,将问题分层次、逐步分析,这些问题就显得不像想象中的那么棘手了。
这时候,问题的关键就在于怎样去划分层次,怎样去一步步的将我们需要达到的最终目标分解为多个子目标。
只要清楚地界定了这些问题,那么就会有一个比较完整的思路,在处理这类问题时就不会显得力不从心了。
就一个产品、一项服务或者一次分配而言,我们一般都可以有很多不同的指标去衡量,那么我们也就可以从不同的方向去进行评价。
然而在这众多的指标中,哪些方面会是更重要的,需要我们去重点关注的和提高?
哪些不太重要,可以在对重要指标进行重点处理后再改进呢?
这些对一个企业,一个公司那都是相当重要的。
只有清楚了这些问题,才能有的放矢,不至于导致资源的浪费,进而在很大程度上为企业节省资金和时间。
进而大大的增加企业的效益,带来更多的盈利,让企业的运营更加合理、健康、高效,从而增加企业在行业内的竞争力,为企业取得长足的发展。
层次分析法在处理这类复杂问题有其独到的优势,然而却也有着不可忽视的缺点。
在确定哪些方面是重点时,常用的方法就是给它一个权重,越重要的权重也就越大;那么,要能很好的区分开不同的重要程度,那么权重的给予就必须相对比较准确,然而在实际生活中,我们每个人会由于阅历、经验等的不同,对相同事物的看法也不尽一致,因此不同的人在处理这类问题时是有一定差别的,即便是同一个人在不同的阶段处理相同的问题也不会完全相同。
那么,这样层次分析法就带有太强的主观色彩。
如此,那要怎样给这个权重才能更加的准确呢,更加客观呢?
本文将讨论这个问题。
1.2研究现状
关于如何确定权重,国内外学者做了大量的工作。
陈可嘉
研究了运用ANP(网络分析法)方法对权重的确定,通过反向构造约束锥,并与DEA模型结合,有效的解决了多个决策单元均有效而无法区分的优劣问题。
郑立峰
研究了基于灰色关联分析的系统仿真因素对权重的确定,并且用结果说明运用此方法的可靠性很高,同时还具有简洁、方便的特点,具有很高的运用价值。
庞永师
研究了基于粗糙集对评价指标权重的确定,利用遗传算法对指标体系进行约简后,利用粗糙集理论的属性重要度原理对最简约集各属性进行重要度分析,并通过归一化处理将各属性重要度转化为指标权重,进而得到一级指标、二级指标的权重分配。
刘涛
研究了基于熵权法对权重的确定,并用计算结果表明了该方法的可操作性和实用性。
韩小孩
利用主成分分析方法对权重进行确定,利用主成分分步确定权重在确定权重上也具有一定的指导意义。
而国外在确定权重的方法上与国内大致相同,在此就不再一一列举。
在对水资源的研究上,张辉
对新疆地区的引用水资源进行了调查评价,对水的硬度、氯化物、硫酸盐等指标进行了分析,然后对新疆地区水资源做了综合评价;郭芳
以云南木美地下河流域为例,对西南岩溶石山地区的水质状况做了分析研究,并且提出了贴切实际的保护措施。
对水资源的研究已经是相关学者关注的焦点,并且一直会是关注的重点。
二、模型理论计算
聚类分析本文利用SPSS19.0操作完成,其理论部分从略。
下面只对权重的确定进行阐述。
为了能有效的确定权重,采取专家打分的方法收集信息,并且将一个专家的打分当做一个向量。
那么就可以假设这一系列专家所打的分是来源于一个多元分布,这里设这个多元分布的均值为
,且协方差为
。
2.1对权重的确定
2.1.1多元分布的极大似然估计
假设该多元分布已经确定,并且其概率密度函数为:
,并且收集到的专家打分数据为:
n各专家对m个指标打分,那么就可以确定该似然函数为:
进而可以写出对数似然函数为:
同时由于有:
)
则可以用
分别对
和
求偏导,并且令偏导为零即可求得
估计值:
通过求解
式可以求得估计的
。
2.1.2层次分析法
在2.1节中,通过极大似然估计的方式已经求解出各个指标被专家打分时给的均值,那么下面就需要将打分转化为设计矩阵,在这里我们直接利用估计的均值的各指标对应值相比,并以其比值为设计矩阵的构造数据来源。
假设2.1.1中通过极大似然估计求得的均值向量为:
那么构造的设计矩阵为:
然后利用设计矩阵
求出其特征根特征向量,通过检验换算即可得到这m个指标的权重。
三、对各水系做聚类分析并编制污染指数
3.1聚类分析
将具体数据(数据已经经过处理,各指标已经变化成低优指标,数据包括ph值(已与标准ph做处理),DO(溶氧量,也已经做处理),CODM(高锰酸钾盐指数),NH3-N(氨氮容量))导入SPSS19.0中,通过如下操
:
分析-分类-系统聚类,将各个变量移入变量窗口,并且在“绘制”中点击“树状图”,其余采用系统默认的选项,点击“确定”即可运行出结果。
其输出的树形图见附录1.
从图中可以看出将样本聚类成若干类,其中树形图上可以看出样本10,14,16,43,49,120,121,125,126,127可以看做一类(本文只以这一类为典型进行说明),其中的10,14,16属于松花江流域,43,49属于淮河流域,120,121属于太湖流域,125,126,127属于滇池流域。
然后通过观察这些样本的原始数据,发现这些类的各项污染指标值都比较大,可以判断他们都是属于重污染流域,同时从污染的地点分布看主要集中在东北、淮河及太湖地区,这些地区在我国一直都是发展的重地,东北三省以重工业闻名全国;淮河地区是自古以来的中原地带,而且由于各类资源相对比较丰富,由于开采资源和工业水平较高而污染;而太湖流域的上海、江苏以及浙江等是目前中国经济发展最具有活力的一代,工厂林立,导致污染加剧;除此之外的滇池流域,地处西南边陲之地,其工业发展相对滞后,然而由于其旅游业比较发达,使滇池流域的发展加快,人口不断增加,工业化进程也在加快,生活污染物不断涌入流域之中,以致滇池流域水质恶化。
3.2编制污染指数
编制污染指数,需要确定各个指标的权重,利用极大似然估计和层次分析法来确定,在这里假设专家打分的向量服从对数正态分布,则通过计算,得到各个指标的权重,然后利用马氏距离即可得到污染指数,编
(具体程序见附录2)可以得到相应结果:
[1,]2.1469166
[2,]2.6156688
[3,]2.0468244
[4,]2.7163473
[5,]3.2406404
[6,]2.5780142
[7,]3.3905182
[8,]2.8902856
[9,]2.6417502
[10,]7.7357108
[11,]1.8162821
[12,]2.4268909
[13,]2.7136874
[14,]3.9685774
[15,]3.2423705
[16,]3.1115510
[17,]3.8770385
[18,]3.5160622
[19,]3.2099225
[20,]2.8386993
[21,]2.4028636
[22,]3.7284700
[23,]4.4169307
[24,]2.9212241
[25,]3.1077358
[26,]1.5515580
[27,]1.2886535
[28,]1.7927114
[29,]2.4716549
[30,]1.0519747
[31,]1.4317186
[32,]1.4432810
[33,]2.1805343
[34,]3.1186326
[35,]1.7225848
[36,]4.3055158
[37,]1.6577635
[38,]2.2814627
[39,]2.9827626
[40,]2.4788135
[41,]2.5974965
[42,]2.0827654
[43,]4.7577368
[44,]2.1235671
[45,]2.7097171
[46,]2.0158753
[47,]3.7702618
[48,]2.2456665
[49,]4.9003943
[50,]3.7117484
[51,]2.4925678
[52,]3.9550756
[53,]4.6211413
[54,]3.2803292
[55,]2.1775139
[56,]2.9783106
[57,]1.8778586
[58,]1.7836675
[59,]1.7079971
[60,]3.4878400
[61,]2.3363257
[62,]2.0025566
[63,]2.1941819
[64,]1.6175598
[65,]1.5369203
[66,]1.8946161
[67,]1.7528197
[68,]1.9760846
[69,]1.4750910
[70,]2.5425776
[71,]3.5930428
[72,]1.4879408
[73,]4.0936681
[74,]1.2965916
[75,]1.9525609
[76,]2.0282723
[77,]1.3212044
[78,]2.4742094
[79,]2.3541437
[80,]2.3264033
[81,]1.3744066
[82,]2.1139881
[83,]1.7671295
[84,]2.4443496
[85,]0.8672368
[86,]1.9749306
[87,]1.4983080
[88,]1.4890612
[89,]2.7630830
[90,]1.7488503
[91,]1.7161510
[92,]2.2936560
[93,]1.6762431
[94,]2.0300953
[95,]2.0867361
[96,]1.8325884
[97,]3.0450789
[98,]1.5400238
[99,]1.4435180
[100,]1.8166753
[101,]1.4070546
[102,]2.2663813
[103,]2.1869721
[104,]1.9828117
[105,]2.3321820
[106,]1.8738638
[107,]1.7352527
[108,]1.5068492
[109,]2.1877524
[110,]1.9598667
[111,]1.7163200
[112,]1.8553081
[113,]1.6678785
[114,]1.6038101
[115,]1.4384015
[116,]2.1997534
[117,]3.7254006
[118,]1.8633700
[119,]2.4927831
[120,]4.4245080
[121,]3.9227358
[122,]2.1948813
[123,]2.5115488
[124,]4.3945983
[125,]5.6667550
[126,]6.9996795
[127,]5.1984337
[128,]1.7726559
[129,]2.1682475
[130,]2.2629188
[131,]1.8815114
[132,]2.7100452
[133,]2.1328818
[134,]1.6030697
[135,]1.2660399
[136,]2.3686357
[137,]2.1923634
[138,]2.0461110
[139,]4.0514829
由上输出可知,对于样本10,14,16,43,49,120,121,125,126,127的污染指数相对都比较大,如10号样本污染指数为:
7.7357108,是所有样本中最大的值,而对样本14,16,43,49,120,121,125,126,127的污染指数值相对都比较大。
3.3聚类分析结果与编制的指数结果对比
通过对样本10,14,16,43,49,120,121,125,126,127的污染指数和聚类的结果说明两者存在一定的共性,在聚类分析中聚成一类的样本,指数值也比较接近(这个接近不是说数值上的,而是指在分布中的分位数点),两者同时都说明目前我国的水污染情况比较严重,分布范围不仅只局限于某一地区,而是在全国范围内都存在污染严重地方,虽然可能各自污染的起源不尽相同,但是与现代化经济的粗放型增长是密不可分的。
结束语
目前我国的经济增长迅速,经济规模已经成为世界第二,然而由于经济增长所带来的问题却也日渐暴露出来,随着社会的进一步发展,人们对以前那种不负责任的发展模式渐渐地认识到,越来越多的人开始谴责,政府也出台了很多措施,尽管如此,环境的破坏还是在一步步加深。
同时人们也开始品尝到了污染的后果,本文利用各大水域的监测情况入手分析,通过聚类分析和对不同水体的污染指数的编制,从结果入手分析两者想通之处,并仅此希望能让人们更加注重对水体的保护,对环境的保护,对我们家园的保护。
在此,向文中提到的各位文献作者表示感谢,对在学习中教授我知识的老师表示感谢,对国内外致力于该方面研究的学者表示感谢。
参考文献
[1]陈可嘉,于先康.《基于ANP权重确定的ANP-DEA模型及其逆向物流服务供应商选择中的应用》,[J],数学的实践与认识,2012年12月,第42卷第21期:
1-8
[2]郑立峰,唐见兵.《基于灰色关联分析的系统仿真因素权重确定》,[J],计算机仿真,2007年9月,第24卷第9期:
76-78
[3]庞永师,王莹,《基于粗糙集的建筑企业社会责任评价指标权重确定》,[J],工程管理学报,2012年6月,第26卷第3期:
109-113.
[4]刘涛,孔祥清,邓平基.《基于熵权法的高等教育个人投资风险模糊综合评价》,[J],科学与管理,2010年第5期:
79-80.
[5]韩小孩,张耀辉,孙福军,王少华.《基于主成分分析的指标权重确定方法》,[J],四川兵工学报(理论基础与应用研究),2012年12月,第33卷第10期:
124-126.
[6]张辉,余武忠,李强,《新疆南北东疆地区的饮用水水质调查与评价》,[j],干旱环境监测,1996年9月,第10卷第3期:
170-173.
[7]郭芳,姜光辉,《西南岩溶石山地区水窑水质状况及保护措施》,[J],水资源保护,2005年1月第21卷第1期:
18-20.
[8]朱建平主编,《应用多元统计分析(第二版)》,[M],科学出版社,2012年:
62-89.
[9]陈立萍等,《统计建模与R软件(下)》,[M],清华大学出版社,
附录
1、聚类分析的树形图
2、求解指数的程序:
n=4;m=6;
u<-matrix(0,nr=1,nc=n)
v<-matrix(0,nr=1,nc=n)
p<-matrix(0,nr=1,nc=n)
g<-matrix(0,nr=n,nc=n)
h<-matrix(0,nr=n,nc=n)
a<-matrix(c(4,3,5,4,3,4,4,4,4,3,5,4,3,3,4,4,3,3,5,4,3,3,4,5),c(n,m),byrow=F)
b<-log(a)#做对数变换
for(iin1:
n)
{v[i]<-mean(b[i,])}#取对数后的均值向量
d<-cov(b)#变换后协方差阵
for(iin1:
n)
{u[i]<-exp(v[i]+d[i,i]/2)}#未变换前均值向量
for(iin1:
n){
for(jin1:
n){
g[i,j]<-(exp(v[i]+v[j]+d[i,i]/2+d[j,j]/2))*((exp(d[i,j]))-1)#未变换前协方差阵
}}
for(iin1:
n){
for(jin1:
n){
h[i,j]<-u[i]/u[j]}}#定义设计矩阵
q<-eigen(h)
x<--q$vectors[,1]
for(iin1:
n){
p[i]<-x[i]/sum(x)}
p#各指标权重
mydata<-read.table("C:
/Users/Administrator/Desktop/shuju.txt",header=T)#数据放桌面
y<-as.matrix(mydata)#将数据转换成矩阵
z<-y%*%t(p)#各指标乘以各自的权重得到污染指数
z#输出各样本的污染指数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 层次 分析 水质 研究