kmeans算法(算法+数据+代码).ppt
- 文档编号:2644573
- 上传时间:2022-11-04
- 格式:PPT
- 页数:17
- 大小:1.93MB
kmeans算法(算法+数据+代码).ppt
《kmeans算法(算法+数据+代码).ppt》由会员分享,可在线阅读,更多相关《kmeans算法(算法+数据+代码).ppt(17页珍藏版)》请在冰豆网上搜索。
K-means聚类算法聚类分析概念1K-means算法2K-means实验-国民健康3K-means实验-图像分割4K-means实验-商户评级5目录1.聚类分析概念聚类与分类的不同在于:
分类简单来说,就是根据文本的特征或属性,划分到已有类别中。
也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。
聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。
聚类不需要对数据进行训练和学习。
2.K-means算法Q1Q1:
KK是什么?
是什么?
A1A1:
kk是聚类算法当中类的个数。
是聚类算法当中类的个数。
Summary:
Kmeans是用均值算法把数据分成K个类的算法!
Q2Q2:
meansmeans是什么?
是什么?
A2A2:
meansmeans是均值算法。
是均值算法。
2.K-means算法距离的定义距离的定义欧式距离:
N维空间点或向量的距离曼哈顿距离:
城市街区距离夹角余弦:
向量方向的差异相关系数:
信息熵:
2.K-means算法K-means算法详算法详解解步骤一:
取得步骤一:
取得k个初始中心点个初始中心点从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类2.K-means算法K-means算法详算法详解解MinofthreeduetotheEuclidDistance步骤二:
把每个点划分进相应的簇步骤二:
把每个点划分进相应的簇根据欧氏距离最小原则,把每个点划分进相应的簇2.K-means算法K-means算法详算法详解解MinofthreeduetotheEuclidDistance步骤三:
重新计算中心点步骤三:
重新计算中心点根据均值等方法,重新计算每个类的中心点2.K-means算法K-means算法详算法详解解步骤四:
迭代计算中心点步骤四:
迭代计算中心点重复第二步和第三步2.K-means算法K-means算法详算法详解解步骤五:
收敛步骤五:
收敛聚类中心不再发生移动3.K-means实验-国民健康数据示意图数据示意图国家和地区婴儿死亡率()出生时平均预期寿命/岁1990年2000年2006年1990年2000年2006年中国36.329.920.168.970.372中国香港77.480.981.6孟加拉国1006651.654.86163.7文莱108874.276.277.1柬埔寨84.57864.854.956.558.9印度806857.459.162.964.5印度尼西亚603626.461.765.868.2伊朗54363064.868.970.7以色列105.64.276.67980日本4.63.22.678.881.182.3哈萨克斯坦50.537.125.868.365.566.2朝鲜42424269.966.867韩国854.571.375.978.5老挝120775954.660.963.9马来西亚16119.870.372.674蒙古78.547.634.262.765.167.2缅甸917874.45960.161.6巴基斯坦1008577.859.16365.2菲律宾41302465.669.671.4新加坡6.72.92.374.378.179.9斯里兰卡25.616.111.271.273.675泰国25.711.77.26768.370.2越南382314.664.869.170.8埃及66.74028.962.268.871尼日利亚12010798.647.246.946.8南非45505661.948.550.7加拿大6.84.977.479.280.4墨西哥41.531.629.170.97474.5美国9.46.96.575.27777.8X,textdata=xlsread(examp09_04.xls);row=any(isnan(X),2);X=X(row,:
);countryname=textdata(3:
end,1);countryname=countryname(row);X=zscore(X);startdata=X(8,27,42,:
);idx=kmeans(X,3,Start,startdata);S,H=silhouette(X,idx);代码代码轮廓图轮廓图聚类结果聚类结果3.K-means实验-国民健康4.K-means实验-图像分割灰度图灰度图代码代码分割后二值图像分割后二值图像4.K-means实验-图像分割真彩图真彩图4.K-means实验-商户评价数据示意图数据示意图代码代码大众点评网上1000家商户的评分4.K-means实验-商户评价聚类结果聚类结果MINMAX67.4666677.96666756.3666676.945.36.33333336.8333337.43333327.9666678.46666718.4333339.333333谢谢
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- kmeans 算法 数据 代码