模式识别大作业讲解文档格式.docx
- 文档编号:13436319
- 上传时间:2022-10-10
- 格式:DOCX
- 页数:22
- 大小:1.03MB
模式识别大作业讲解文档格式.docx
《模式识别大作业讲解文档格式.docx》由会员分享,可在线阅读,更多相关《模式识别大作业讲解文档格式.docx(22页珍藏版)》请在冰豆网上搜索。
图1先验概率0.5vs.0.5图2先验概率0.75vs.0.25
图3先验概率0.9vs.0.1图4不同先验概率
对测试样本1进行试验得图
对测试样本2进行试验
程序bayesflq2.m和bayeszcx2.m
3.自行给出一个决策表,采用最小风险的Bayes决策重复上面的某个或全部实验。
设以ceshi1单个特征身高进行试验:
决策表
W1
W2
0.7
0.3
closeall;
clearall;
X=120:
0.1:
200;
%设置采样范围及精度
pw1=0.9;
pw2=0.1;
%设置先验概率
sample1=textread('
FEMALE.txt'
)%读入样本
samplew1=zeros(1,length(sample1(:
1)));
u1=mean(sample1(:
1));
m1=std(sample1(:
y1=normpdf(X,u1,m1);
%类条件概率分布
figure
(1);
subplot(2,1,1);
plot(X,y1);
title('
F身高类条件概率分布曲线'
);
sample2=textread('
MALE.txt'
samplew2=zeros(1,length(sample2(:
u2=mean(sample2(:
m2=std(sample2(:
y2=normpdf(X,u2,m2);
subplot(2,1,2);
plot(X,y2);
M身高类条件概率分布曲线'
P1=pw1*y1./(pw1*y1+pw2*y2);
P2=pw2*y2./(pw1*y1+pw2*y2);
figure
(2);
plot(X,P1);
F身高后验概率分布曲线'
plot(X,P2);
M身高后验概率分布曲线'
P11=pw1*y1;
P22=pw2*y2;
figure(3);
subplot(3,1,1);
plot(X,P11);
subplot(3,1,2);
plot(X,P22);
subplot(3,1,3);
plot(X,P11,X,P22);
sample=textread('
allsample.txt'
[result]=bayes(sample1(:
1),sample2(:
1),pw1,pw2);
%bayes分类器
function[result]=bayes(sample1(:
error1=0;
error2=0;
fori=1:
50
ifP1(i)>
P2(i)
result(i)=0;
pe(i)=P2(i);
else
result(i)=1;
pe(i)=P1(i);
end
end
fori=1:
ifresult(k)==0
error1=error1+1;
elseresult(k)=1
error2=error2+1;
ratio=error1+error2/length(sample);
%识别率,百分比形式
sprintf('
正确识别率为%.2f%%.'
ratio)
作业2用身高/体重数据进行性别分类
(二)
试验直接设计线性分类器的方法,与基于概率密度估计的贝叶斯分离器进行比较。
同时采用身高和体重数据作为特征,用Fisher线性判别方法求分类器,将该分类器应用到训练和测试样本,考察训练和测试错误情况。
将训练样本和求得的决策边界画到图上,同时把以往用Bayes方法求得的分类器也画到图上,比较结果的异同。
解答:
Clc
clearall
[length1,width1]=size(sample1);
[length2,width2]=size(sample2);
One1=ones(length1,1);
One2=ones(length2,1);
plot(sample1(:
1),sample1(:
2),'
r*'
sample2(:
1),sample2(:
bo'
)
Famale和male身高体重聚类图'
Y1=sample1(:
1:
2);
Y2=sample2(:
m1=mean(Y1);
m2=mean(Y2);
S1=(Y1-One1*m1)'
*(Y1-One1*m1);
S2=(Y2-One2*m2)'
*(Y2-One2*m2);
sw=S1+S2;
ww=inv(sw);
w=inv(sw)*(m1-m2)'
;
Y=[Y1;
Y2];
z=Y*w;
holdon
t=z*w'
/norm(w)^2;
plot(t(:
1),t(:
2))
length1+length2
plot([Y(i,1)t(i,1)],[Y(i,2)t(i,2)],'
-.'
axis([12020040100])
fisher线性变换后'
grid
作业2图一
作业2图二
利用K-L变换进行特征提取的实验
一、基本要求
用FAMALE.TXT和MALE.TXT的数据作为本次实验使用的样本集,利用K-L变换对该样本集进行变换,与过去用Fisher线性判别方法或其它方法得到的分类面进行比较,从而加深对所学内容的理解和感性认识。
二、具体做法
1.不考虑类别信息对整个样本集进行K-L变换(即PCA),并将计算出的新特征方向表示在二维平面上,考察投影到特征值最大的方向后男女样本的分布情况并用该主成分进行分类
2.利用类平均向量提取判别信息,选取最好的投影方向,考察投影后样本的分布情况并用该投影方向进行分类。
3.将上述投影和分类情况与以前做的各种分类情况比较,考察各自的特点和相互关系。
三、实验原理
K-L变换是一种基于目标统计特性的最佳正交变换。
它具有一些优良的性质:
即变换后产生的新的分量正交或者不相关;
以部分新的分量表示原矢量均方误差最小;
变换后的矢量更趋确定,能量更集中。
这一方法的目的是寻找任意统计分布的数据集合之主要分量的子集。
设n维矢量,其均值矢量,协方差阵,此协方差阵为对称正定阵,则经过正交分解克表示为,其中,为对应特征值的特征向量组成的变换阵,且满足。
变换阵为旋转矩阵,再此变换阵下变换为,在新的正交基空间中,相应的协方差阵。
通过略去对应于若干较小特征值的特征向量来给y降维然后进行处理。
通常情况下特征值幅度差别很大,忽略一些较小的值并不会引起大的误差。
1.不考虑类别信息对整个样本集进行K-L变换(即PCA)
(1)读入female.txt和male.txt两组数据,组成一个样本集。
计算样本均值向量和协方差
(2)计算协方差阵C的特征值和特征向量U
(3)选取特征值最大的特征向量作为投影方向
(4)选取阈值进行判断
2.利用类平均信息提取判别信息
(1)读入female.txt和male.txt两组数据,分别计算样本均值向量和协方差,及总均值向量
(2)计算类间离散度矩阵Sb()与类内离散度矩阵Sw()
(3)用比较分类性能,选择最佳投影方向
四、实验结果与分析
U=(0.6269,0.7791)T,P1=0.5,P2=0.5
判错个数
错误率
采用K-L变换判别方法
14
14%
采用Fisher线性判别方法
12
12%
2.利用类平均信息提取判决信息
U=(0.5818,0.8133)T,P1=0.5,P2=0.5
13
13%
%不考虑类别信息
clc;
[FHFW]=textread('
C:
\Users\rengang\Desktop\homework\FEMALE.txt'
'
%f%f'
[MHMW]=textread('
\Users\rengang\Desktop\homework\MALE.txt'
FA=[FHFW];
FA=FA'
MA=[MHMW];
MA=MA'
fork=1:
NT(:
k)=FA(:
k);
fork=51:
100
k)=MA(:
k-50);
end
X=(sum(NT'
)/length(NT))'
%这里NT'
是一个100*2的矩阵,X为总样本均值。
c=cov(NT'
[u,v]=eig(c);
%求矩阵c的全部特征值,构成对角
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式识别 作业 讲解