模式识别论文文档格式.docx
- 文档编号:18856627
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:7
- 大小:780.94KB
模式识别论文文档格式.docx
《模式识别论文文档格式.docx》由会员分享,可在线阅读,更多相关《模式识别论文文档格式.docx(7页珍藏版)》请在冰豆网上搜索。
姓名:
XXX
指导老师:
完成时间:
二零一一年十二月
K-Means法在聚类分析中的应用
学生XXX
XXX
摘要:
K-Means算法是硬聚类算法,它是以数据点到原型的某种距离作为优化的目标函数,利用函数求极值的方法得到迭代运算的调整规则,算法采用误差平方和准则函数作为聚类准则函数。
K-Means是很典型的基于距离的聚类算法,算法以欧氏距离作为相似度测量,即认为两个对象的距离越近,它们之间的相似度也就越大。
目前K-Means算法是一种比较常用的进行遥感影像分类的算法,广泛被使用在各大具有分类模块的软件中。
关键词:
K-Means;
聚类分析;
非监督分类;
K-Meansalgorithmintheapplication
oclusteringanalysis
Student:
Supervisor:
Abstract:
K-Meansalgorithmishardclusteringalgorithm,Itisbasedonaprototypeofadatapointtothedistanceastheoptimizationobjectivefunction,Theuseoffunctionextremumobtainedbyiterationoftheadjustmentrules,Algorithmusestheerrorsumofsquaresastheclusteringcriterionfunctioncriterionfunction.K-Meansisatypicaldistance-basedclusteringalgorithm,AlgorithmforEuclideandistanceassimilaritymeasure,Whichistothinkofthetwoobjectsthecloser,thesimilaritybetweenthemisbiggeralso,CurrentlyK-Meansalgorithmisacommonlyusedalgorithmforremotesensingimageclassification,Widelyusedinthemajorsoftwaremoduleswithclassification.
Keywords:
K-Means;
Clusteringanalysis;
Unsupervisedclassification;
绪论3
1.什么是K-Means算法4
2.K-Means算法4
2.1K-Means算法描述4
2.2K-Means算法处理流程4
3.K-Means在聚类分析中的应用5
3.1实验处理过程5
3.2实验报告5
4.结论8
5.参考文献9
绪论
非监督分类也称聚类分析,非监督分类是指人们事先对分类过程不施加任何的先验知识,而仅凭数据(遥感影像地物的光谱特征的分布规律),即自然聚类的特性,进行“盲目”的分类;
其分类的结果只是对不同类别达到了区分,但并不能确定类别的属性,亦即:
非监督分类只能把样本区分为若干类别,而不能给出样本的描述;
其类别的属性是通过分类结束后目视判读或实地调查确定的。
一般的聚类算法是先选择若干个模式点作为聚类的中心。
每一中心代表一个类别,按照某种相似性度量方法(如最小距离方法)将各模式归于各聚类中心所代表的类别,形成初始分类。
然后由聚类准则判断初始分类是否合理,如果不合理就修改分类,如此反复迭代运算,直到合理为止。
与监督分类的先学习后分类不同,非监督法是边学习边分类,通过学习找到相同的类别,然后将该类与其它类区分开,但是非监督法与监督法都是以图像的灰度为基础。
通过统计计算一些特征参数,如均值,协方差等进行分类的。
所以也有一些共性。
1.什么是K-Means算法
k-means算法接受输入量k;
然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足:
同一聚类中的对象相似度较高;
而不同聚类中的对象相似度较小。
聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
k-means算法的工作过程说明如下:
首先从n个数据对象任意选择k个对象作为初始聚类中心;
而对于所剩下其它对象,则根据它们与这些聚类中心的相似度(距离),分别将它们分配给与其最相似的(聚类中心所代表的)聚类;
然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);
不断重复这一过程直到标准测度函数开始收敛为止。
一般都采用均方差作为标准测度函数.k个聚类具有以下特点:
各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。
2.K-Means算法
2.1K-means算法描述
K-means也是聚类算法中最简单的一种,聚类属于无监督学习,K-means
算法是将样本聚类成k个簇,具体算法描述如下:
1.随机选取k个聚类质心点为μ1.μ2.μ3...μk∈Rn
2.重复下面过程直到收敛:
对于每一个样例i,计算其应该属于的类
对于每一个类j,重新计算该类的质心
K是我们事先给定的聚类数,Ci代表样例i与k个类中距离最近的那个类,Ci的值是1到k中的一个。
质心μj代表我们对属于同一个类的样本中心点的猜测。
就是将所有的点聚成k个聚集区,首先随机选取k个点(或者作为k个聚集区的聚类心,然后第一步对于每一个点计算其到k个聚类中心中每一个的距离,然后选取距离最近的那个聚集区作为Ci,这样经过第一步每一个点都有了所属的聚集区;
第二步对于每一个聚集区,重新计算它的聚类中心μj(对里面所有的点坐标求平均)。
重复迭代第一步和第二步直到聚类中心不变或者变化很小。
对于K-means算法如何收敛,可以定义畸变函数如下:
J函数表示每个样本点到其质心的距离平方和。
K-means是要将J调整到最小。
假设当前J没有达到最小值,那么首先可以固定每个类的质心μj,调整每个样例的所属的类别Ci来让J函数减少,同样,固定Ci,调整每个类的质心μj也可以使J减小。
这两个过程就是内循环中使J单调递减的过程。
当J递减到最小时,μ和c也同时收敛。
在理论上,可以有多组不同的μ和c值能够使得J取得最小值,但这种现象实际上很少见。
2.2K-means算法处理流程
k-means算法接受输入量k;
聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”来进行计算的。
k-means算法的工作过程说明如下:
然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值);
处理流程:
(1)从n个数据对象任意选择k个对象作为初始聚类中心;
(2)循环(3)到(4)直到每个聚类不再发生变化为止
(3)根据每个聚类对象的均值(中心对象),计算每个对象与这些中心对象
的距离;
并根据最小距离重新对相应对象进行划分;
(4)重新计算每个(有变化)聚类的均值(中心对象)
3.K-Means在聚类分析中的应用
3.1实验处理过程
(1)打开ENVI,载入数据m.img,利用K-Means算法进行非监督分类
迭代次数30次,分成15类
图.1
(2)对分类后的图像进行图像解译,标注类别
图.2
(3)最后的分类图像
图.3
3.2精度报告
图.4
图.5
图.6
4.结论
通过对比原图与分类后的图像,可以发现水体植被道路等要素大多数可以被正确的区分开,一些阴影与深色的建筑物的区分效果不是很明显,分类后的一些小斑块处理还是很重要如聚类和过滤,通过小斑块处理可以很好的将一些未分类的黑点祛除。
本次试验利用K-Means算法进行非监督分类总体效果比较理想,多数类别可以正确区分,精度还是有限,需要与其他技术结合共同提升分类精度。
5.参考文献
[1]邓书兵.ENVI遥感图像处理方法[M].科学出版社.
[2]崔广才.李艳芳.模糊聚类算法及应用[M].国防工业出版社
[3]孙即祥.姚伟.滕书华.模式识别[M].国防工业出版社
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 论文