书签分享收藏举报版权申诉 / 7

立即下载加入VIP,免费下载

当前位置：首页 > 表格模板 > 合同协议 > 模式识别论文文档格式.docx

模式识别论文文档格式.docx

文档编号：18856627
上传时间：2023-01-01
格式：DOCX
页数：7
大小：780.94KB

模式识别论文文档格式.docx

《模式识别论文文档格式.docx》由会员分享，可在线阅读，更多相关《模式识别论文文档格式.docx（7页珍藏版）》请在冰豆网上搜索。

模式识别论文文档格式.docx

姓名：

XXX

指导老师：

完成时间：

二零一一年十二月

K-Means法在聚类分析中的应用

学生XXX

XXX

摘要：

K-Means算法是硬聚类算法，它是以数据点到原型的某种距离作为优化的目标函数，利用函数求极值的方法得到迭代运算的调整规则，算法采用误差平方和准则函数作为聚类准则函数。

K-Means是很典型的基于距离的聚类算法，算法以欧氏距离作为相似度测量，即认为两个对象的距离越近，它们之间的相似度也就越大。

目前K-Means算法是一种比较常用的进行遥感影像分类的算法，广泛被使用在各大具有分类模块的软件中。

关键词：

K-Means；

聚类分析；

非监督分类；

K-Meansalgorithmintheapplication

oclusteringanalysis

Student：

Supervisor：

Abstract:

K-Meansalgorithmishardclusteringalgorithm,Itisbasedonaprototypeofadatapointtothedistanceastheoptimizationobjectivefunction,Theuseoffunctionextremumobtainedbyiterationoftheadjustmentrules,Algorithmusestheerrorsumofsquaresastheclusteringcriterionfunctioncriterionfunction.K-Meansisatypicaldistance-basedclusteringalgorithm,AlgorithmforEuclideandistanceassimilaritymeasure,Whichistothinkofthetwoobjectsthecloser,thesimilaritybetweenthemisbiggeralso,CurrentlyK-Meansalgorithmisacommonlyusedalgorithmforremotesensingimageclassification,Widelyusedinthemajorsoftwaremoduleswithclassification.

Keywords:

K-Means;

Clusteringanalysis;

Unsupervisedclassification;

绪论3

1.什么是K-Means算法4

2.K-Means算法4

2.1K-Means算法描述4

2.2K-Means算法处理流程4

3.K-Means在聚类分析中的应用5

3.1实验处理过程5

3.2实验报告5

4.结论8

5.参考文献9

绪论

非监督分类也称聚类分析，非监督分类是指人们事先对分类过程不施加任何的先验知识，而仅凭数据（遥感影像地物的光谱特征的分布规律），即自然聚类的特性，进行“盲目”的分类；

其分类的结果只是对不同类别达到了区分，但并不能确定类别的属性，亦即：

非监督分类只能把样本区分为若干类别，而不能给出样本的描述；

其类别的属性是通过分类结束后目视判读或实地调查确定的。

一般的聚类算法是先选择若干个模式点作为聚类的中心。

每一中心代表一个类别，按照某种相似性度量方法（如最小距离方法）将各模式归于各聚类中心所代表的类别，形成初始分类。

然后由聚类准则判断初始分类是否合理，如果不合理就修改分类，如此反复迭代运算，直到合理为止。

与监督分类的先学习后分类不同，非监督法是边学习边分类，通过学习找到相同的类别，然后将该类与其它类区分开，但是非监督法与监督法都是以图像的灰度为基础。

通过统计计算一些特征参数，如均值，协方差等进行分类的。

所以也有一些共性。

1.什么是K-Means算法

k-means算法接受输入量k；

然后将n个数据对象划分为k个聚类以便使得所获得的聚类满足：

同一聚类中的对象相似度较高；

而不同聚类中的对象相似度较小。

聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”（引力中心）来进行计算的。

k-means算法的工作过程说明如下：

首先从n个数据对象任意选择k个对象作为初始聚类中心；

而对于所剩下其它对象，则根据它们与这些聚类中心的相似度（距离），分别将它们分配给与其最相似的（聚类中心所代表的）聚类；

然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；

不断重复这一过程直到标准测度函数开始收敛为止。

一般都采用均方差作为标准测度函数.k个聚类具有以下特点：

各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

2.K-Means算法

2.1K-means算法描述

K-means也是聚类算法中最简单的一种，聚类属于无监督学习，K-means

算法是将样本聚类成k个簇，具体算法描述如下：

1.随机选取k个聚类质心点为μ1.μ2.μ3...μk∈Rn

2.重复下面过程直到收敛：

对于每一个样例i，计算其应该属于的类

对于每一个类j，重新计算该类的质心

K是我们事先给定的聚类数，Ci代表样例i与k个类中距离最近的那个类，Ci的值是1到k中的一个。

质心μj代表我们对属于同一个类的样本中心点的猜测。

就是将所有的点聚成k个聚集区，首先随机选取k个点（或者作为k个聚集区的聚类心，然后第一步对于每一个点计算其到k个聚类中心中每一个的距离，然后选取距离最近的那个聚集区作为Ci，这样经过第一步每一个点都有了所属的聚集区；

第二步对于每一个聚集区，重新计算它的聚类中心μj（对里面所有的点坐标求平均）。

重复迭代第一步和第二步直到聚类中心不变或者变化很小。

对于K-means算法如何收敛，可以定义畸变函数如下：

J函数表示每个样本点到其质心的距离平方和。

K-means是要将J调整到最小。

假设当前J没有达到最小值，那么首先可以固定每个类的质心μj，调整每个样例的所属的类别Ci来让J函数减少，同样，固定Ci，调整每个类的质心μj也可以使J减小。

这两个过程就是内循环中使J单调递减的过程。

当J递减到最小时，μ和c也同时收敛。

在理论上，可以有多组不同的μ和c值能够使得J取得最小值，但这种现象实际上很少见。

2.2K-means算法处理流程

k-means算法接受输入量k；

聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”来进行计算的。

k-means算法的工作过程说明如下：

然后再计算每个所获新聚类的聚类中心（该聚类中所有对象的均值）；

处理流程：

（1）从n个数据对象任意选择k个对象作为初始聚类中心；

（2）循环（3）到（4）直到每个聚类不再发生变化为止

（3）根据每个聚类对象的均值（中心对象），计算每个对象与这些中心对象

的距离；

并根据最小距离重新对相应对象进行划分；

（4）重新计算每个（有变化）聚类的均值（中心对象）

3.K-Means在聚类分析中的应用

3.1实验处理过程

（1）打开ENVI，载入数据m.img，利用K-Means算法进行非监督分类

迭代次数30次，分成15类

图.1

（2）对分类后的图像进行图像解译，标注类别

图.2

（3）最后的分类图像

图.3

3.2精度报告

图.4

图.5

图.6

4.结论

通过对比原图与分类后的图像，可以发现水体植被道路等要素大多数可以被正确的区分开，一些阴影与深色的建筑物的区分效果不是很明显，分类后的一些小斑块处理还是很重要如聚类和过滤，通过小斑块处理可以很好的将一些未分类的黑点祛除。

本次试验利用K-Means算法进行非监督分类总体效果比较理想，多数类别可以正确区分，精度还是有限，需要与其他技术结合共同提升分类精度。

5.参考文献

[1]邓书兵．ENVI遥感图像处理方法[M]．科学出版社．

[2]崔广才．李艳芳.模糊聚类算法及应用[M]．国防工业出版社

[3]孙即祥．姚伟．滕书华．模式识别[M]．国防工业出版社

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

下载	加入VIP,免费下载

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 模式识别论文

冰豆网所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：模式识别论文文档格式.docx
链接地址：https://www.bdocx.com/doc/18856627.html

模式识别论文文档格式.docx

热门标签