聚类分析Q型R型聚类算法.docx
- 文档编号:29694392
- 上传时间:2023-07-26
- 格式:DOCX
- 页数:11
- 大小:19.39KB
聚类分析Q型R型聚类算法.docx
《聚类分析Q型R型聚类算法.docx》由会员分享,可在线阅读,更多相关《聚类分析Q型R型聚类算法.docx(11页珍藏版)》请在冰豆网上搜索。
聚类分析Q型R型聚类算法
信息与计算科学专业实验报告
课程名称
数据挖掘原理与算法
总实验学时:
第次
共次
实验项目名称
聚类分析
本次实验学时数:
实验类型
日期
2016年5月25日星期三
年级
本13信计01班
学生姓名
黄顺团
学号
20134390131
课任教师
唐志刚
1.实验目的:
用数据挖掘聚类算法(Q型聚类、R型聚类)求分类微博数据。
2.实验环境:
MATLAB7.0。
Windows7操作系统。
3.实验内容
由于数据集比较大,数据TXT文件不引入报告中。
命名为julei.txt。
相关两个源文件代码文件如下:
1、Untitled.m
clc,clear
loadjulei.txt%把原始数据保存在纯文本文件julei.txt中
r=corrcoef(julei);%计算相关系数矩阵
d=1-r;%进行数据变换,把相关系数转化为距离
d=tril(d);%取出矩阵d的下三角元素
d=nonzeros(d);%取出非零元素
d=d';%化成行向量
z=linkage(d,'average');%按类平均法聚类
dendrogram(z);%画聚类图
T=cluster(z,'maxclust',4)%把变量划分成4类
fori=1:
4
tm=find(T==i);%求第i类的对象
tm=reshape(tm,1,length(tm));%变成行向量
fprintf('第%d类的有%s\n',i,int2str(tm));%显示分类结果
end
r%显示相关系数矩阵
2、Untitled2.m
clc,clear
loadjulei.txt%把原始数据保存在纯文本文件julei.txt中
julei(:
5)=[];%删除数据矩阵的第5列,即使用变量1,2,3,4
julei=zscore(julei);%数据标准化
y=pdist(julei);%求对象间的欧氏距离,每行是一个对象
z=linkage(y,'average');%按类平均法聚类
dendrogram(z);%画聚类图
fork=2:
8
fprintf('划分成%d类的结果如下:
\n',k)
T=cluster(z,'maxclust',k);%把样本点划分成k类
fori=1:
k
tm=find(T==i);%求第i类的对象
tm=reshape(tm,1,length(tm));%变成行向量
fprintf('第%d类的有%s\n',i,int2str(tm));%显示分类结果
end
ifk==8
break
end
fprintf('************\n');
End
输出结果为:
1、
图一(R型聚类)
>>T=
4
2
3
1
2
第1类的有4
第2类的有25
第3类的有3
第4类的有1
>>r=
1.0000-0.18240.0439-0.0298-0.0871
-0.18241.00000.28440.41580.9003
0.04390.28441.00000.18830.3327
-0.02980.41580.18831.00000.4965
-0.08710.90030.33270.49651.0000
2、
图2(各对象聚类树形图)
划分成2类的结果如下:
第1类的有128268
第2类的有123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267269270271272273274275276277278279280281282283284285286287288289290291292293294295296297298299300
************
划分成3类的结果如下:
第1类的有125274
第2类的有123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170171172173174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259260261262263264265266267269270271272273275276277278279280281282283284285286287288289290291292293294295296297298299300
第3类的有128268
************
划分成4类的结果如下:
第1类的有192541101111121171173260283
第2类的有123456789101112131415161718202122232426272829303132333435363738394042434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100102103104105106107108109110112113114115116117118119120122123124126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170172174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214215216217218219220221222223224225226227228229230231232233234235236237238239240241242243244245246247248249250251252253254255256257258259261262263264265266267269270271272273275276277278279280281282284285286287288289290291292293294295296297298299300
第3类的有125274
第4类的有128268
************
划分成5类的结果如下:
第1类的有1048215233
第2类的有12345678911121314151617182021222324262728293031323334353637383940424344454647495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100102103104105106107108109110112113114115116117118119120122123124126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163164165166167168169170172174175176177178179180181182183184185186187188189190191192193194195196197198199200201202203204205206207208209210211212213214216217218219220221222223224225226227228229230231232234235236237238239240241242243244245246247248249250251252253254255256257258259261262263264265266267269270271272273275276277278279280281282284285286287288289290291292293294295296297298299300
第3类的有192541101111121171173260283
第4类的有125274
第5类的有128268
************
划分成6类的结果如下:
第1类的有293031323334353637424344454647495070120161187188189190191197198199200282
第2类的有12345678911121314151617182021222324262728383940515253545556575859606162636465666768697172737475767778798081828384858687888990919293949596979899100102103104105106107108109110112113114115116117118119122123124126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160162163164165166167168169170172174175176177178179180181182183184185186192193194195196201202203204205206207208209210211212213214216217218219220221222223224225226227228229230231232234235236237238239240241242243244245246247248249250251252253254255256257258259261262263264265266267269270271272273275276277278279280281284285286287288289290291292293294295296297298299300
第3类的有1048215233
第4类的有192541101111121171173260283
第5类的有125274
第6类的有128268
************
划分成7类的结果如下:
第1类的有10
第2类的有48215233
第3类的有293031323334353637424344454647495070120161187188189190191197198199200282
第4类的有12345678911121314151617182021222324262728383940515253545556575859606162636465666768697172737475767778798081828384858687888990919293949596979899100102103104105106107108109110112113114115116117118119122123124126127129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160162163164165166167168169170172174175176177178179180181182183184185186192193194195196201202203204205206207208209210211212213214216217218219220221222223224225226227228229230231232234235236237238239240241242243244245246247248249250251252253254255256257258259261262263264265266267269270271272273275276277278279280281284285286287288289290291292293294295296297298299300
第5类的有192541101111121171173260283
第6类的有125274
第7类的有128268
************
划分成8类的结果如下:
第1类的有123456891112131415161718202122232426272838395152545556575859606162636465666768697172737475767778798081828384858687888990919293949596979899100102103104105106107109110112113114115116117118119122123126127129130131132133134135136137138139140141142143144145146147148149150151153154155156157158159160162163164165168169170172174175176177178179180181182183184185186192193194195196201202203204205206207208209210211212213214216217218219220221222223224225226227228229230231232234235236237238239241242243244245246247248249250251252253254255256258259263264265266267269270271272273275276277278279280281284285286287288289290291292293294295296297298299300
第2类的有74053108124152166167240257261262
第3类的有10
第4类的有48215233
第5类的有293031323334353637424344454647495070120161187188189190191197198199200282
第6类的有192541101111121171173260283
第7类的有125274
第8类的有128268
转化为源字符数据为:
划分成2类的结果如下:
第1类的有曹国伟曹国伟
第2类的有其他
************
划分成3类的结果如下:
第1类的有张向东周鸿祎
第2类的有其他
第3类的有曹国伟曹国伟
************
划分成4类的结果如下:
第1类的有Hitwise王建硕小小数据分析师琳琳乱飞麦田程苓峰-云科技淘宝指数fengyuncrawl王烁龚宇
第2类的有其他
第3类的有张向东周鸿祎
第4类的有曹国伟曹国伟
************
划分成5类的结果如下:
第1类的有白鸦陈坤淘宝网万客团
第2类的有其他
第3类的有Hitwise王建硕小小数据分析师琳琳乱飞麦田程苓峰-云科技淘宝指数fengyuncrawl王
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 聚类分析 型聚类 算法