基于MATLAB的字符识别研究.docx
- 文档编号:4333245
- 上传时间:2022-11-29
- 格式:DOCX
- 页数:21
- 大小:468.90KB
基于MATLAB的字符识别研究.docx
《基于MATLAB的字符识别研究.docx》由会员分享,可在线阅读,更多相关《基于MATLAB的字符识别研究.docx(21页珍藏版)》请在冰豆网上搜索。
基于MATLAB的字符识别研究
基于MATLAB的字符识别研究
汽车牌照识别程序的设计
题目(简述):
本次设计的目的是通过对基于MATLAB的字符识别的研究,以汽车牌照识别的设计为实例,详细介绍字符识别的相关原理。
整个汽车牌照识别的过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用MATLAB软件编程来实现每一个部分,最后识别出汽车牌照。
在研究的同时对其中出现的问题进行了具体分析,处理。
寻找出对于具体的汽车牌照识别过程的最好的方法。
1功能介绍
在MATLAB的字符识别研究中,汽车牌照的识别是最经典的样例,因为车辆牌照识别系统(LicensePlateRecognitionSystem,简称LPRS)是建设智能交通系统不可或缺的部分。
基于MATLAB图像处理的汽车牌照识别系统是通过引入数字摄像技术和计算机信息管理技术,采用先进的图像处理模式识别和人工智能技术,通过对图像的采集和处理,获得更多的信息,从而达到更高的智能化管理程度。
车牌识别系统整个处理过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用MATLAB软件编程来实现每一个部分处理工程,最后识别出汽车牌照。
2功能实现
程序由两个部分组成:
MATLAB代码(.m文件)和图形(.jpg)
2.1系统组成
基于MATLAB图像处理的汽车牌照识别系统主要包括车牌定位字符车牌分割和车牌字符识别三个关键环节其识别流程图如图1所示。
图1识别流程图
其中,
原始图像:
由数码相机或其它扫描装置拍摄到的图像;
图像预处理:
对动态采集到的图像进行滤波、边界增强等处理以克服图像干扰;
车牌定位:
计算边缘图像的投影面积,寻找峰谷点,大致确定车牌位置,再计算此连通域内的宽高比,剔除不在域值范围内的连通域,最后得到的便为车牌区域;
字符分割:
利用投影检测的字符定位分割方法得到单个的字符;
字符数据库:
为第6步的字符识别建立字符模板数据库;
字符识别:
通过基于模板匹配的OCR算法或基于人工神经网络的OCR算法,通过特征对比或训练识别出相关的字符,得到最后的汽车牌照,包括英文字母和数字。
2.2图像预处理
图像在形成传输或变换过程中,受多种因素的影响,如:
光学系统失真、系统噪声、曝光不足或过量、相对运动等,往往会与原始景物之间或图像与原始图像之间产生了某种差异,这种差异称为降质或退化。
因此在图像处理之前必须进行预处理,包括去除噪音、边界增强、增加亮度等等。
输入的彩色图像包含大量颜色信息,会占用较多的存储空间,且处理时也会降低系统的执行速度,因此对图像进行识别等处理时,常将彩色图像转换为灰度图像,以加快处理速度。
对图像进行灰度化处理、边缘提取、再利用形态学方法对车牌进行定位。
具体步骤如下:
首先对图像进行灰度转换,二值化处理然后采用4X1的结构元素对图像进行腐蚀,去除图像的噪声。
采用25X25的结构元素,对图像进行闭合应算使车牌所在的区域形成连通。
再进行形态学滤波去除其它区域。
I=imread('CAR/0.jpg');%读取图片
I1=rgb2gray(I);%转化为灰度图像
I2=edge(I1,'robert',0.09,'both');%采用robert算子进行边缘检测
se=[1;1;1];%线型结构元素
I3=imerode(I2,se);%腐蚀图像
se=strel('rectangle',[25,25]);%矩形结构元素
I4=imclose(I3,se);%图像聚类、填充图像
I5=bwareaopen(I4,2000);%去除聚团灰度值小于2000的部分
通过对比原始图片,我们可以发现形态滤波后的图像已经很接近正确的车牌位置了,因此后期处理将通过这张图来找出车牌位置。
2.3车牌定位
观察经过预处理后得到的图像发现车牌位置有明显的矩形有明显的矩形图样,通过对矩形区域的定位即可获得具体的车牌位置。
(3)最后拼合获取的车牌在图像的行列位置
DW=I(PY1:
PY2,PX1:
PX2,:
);
subplot(1,3,3);
imshow(DW),title('车牌定位后图像');
2.4字符分割
在汽车牌照自动识别过程中,字符分割有承前启后的作用。
它在前期牌照定位的基础上进行字符的分割,然后再利用分割的结果进行字符识别。
%%车牌图像转为灰度
ifisrgb(I)
I1=rgb2gray(I);
else
I1=I;
end
%%二值化车牌图像
I1=im2bw(I1,graythresh(I1));%二值化图像
I2=bwareaopen(I1,16);%去除小于16像素的区块
figure();
subplot(1,2,1);
imshow(I2),title('二值化车牌图像');
分割成七块后的车牌图像
2.5建立字符模板数据库
模板库的合理建造是字符识别准确的关键之一,所以在字符识别之前必须把模板库设置好。
汽车牌照的字符一般有7个,大部分车牌第一位是汉字,通常代表车辆所属省份,或是军种警别等有特定含义的字符简称;紧接其后的为字母与数字。
车牌字符识别与一般文字识别在于它的字符数有限,十个阿拉伯数字0~9,26个大写英文字母A~Z以及相关的车牌用汉字:
京、沪、苏、台、港、澳、甲、乙、丙、使、领、学、试、境、消、边、警等,以及新式军牌中的汉字南、兰、广、北、沈、济、空、海等;车牌颜色:
蓝、白、黑、黄等。
所以建立字符模板库也极为方便。
通过前面实验获取的几幅不同的车牌图片截取到的图片加上使用PhotoShop制作的部分图片如下:
建立模板数据库时必须对这些图片进行统一处理,因为对前面处理分割后的车牌图像的测量得知单个字符的最佳宽高比是1:
2,所以将这些图片归一化为50×25大小;因为之后的字符识别考虑使用神经网络算法进行字符识别,所以再将上面归一化后的模板图像的样本排列在一起构成1250×18的矩阵样本,程序设计如下:
functioninpt=Pretreatment(I)
%%训练样本前期处理
ifisrgb(I)
I1=rgb2gray(I);
else
I1=I;
end
I1=imresize(I1,[5025]);%将图片统一划为50*25大小
I1=im2bw(I1,0.9);
[m,n]=size(I1);
inpt=zeros(1,m*n);
%%将图像按列转换成一个行向量
forj=1:
n
fori=1:
m
inpt(1,m*(j-1)+i)=I1(i,j);
end
end
这是一个自定义函数的Pretreatment.m文件,可以解决频繁写重复代码的问题,前面的图像预处理及车牌定位的代码可以写进Location.m文件中,通过代码DW=Location(I);取得车牌定位后的图像;同时字符分割的代码亦可写进StringSplit.m文件中,可以通过代码[PIN0,PIN1,PIN2,PIN3,PIN4,PIN5,PIN6]=StringSplit(DW);取得的字符分割后的图像。
2.6字符识别
字符的识别目前用于车牌字符识别(OCR)中的算法主要有基于模板匹配的OCR算法以及基于人工神经网络的OCR算法。
基于模板匹配的OCR的基本过程是:
首先对待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。
用人工神经网络进行字符识别主要有两种方法:
一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。
识别效果与字符特征的提取有关,而字符特征提取往往比较耗时。
因此,字符特征的提取就成为研究的关键。
另一种方法则充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。
本文主要研究基于人工神经网络的方法来识别车牌字符。
设计代码如下:
%%识别出的结果以标题形式显示在图上
S=strcat('粤',str2,str3,str4,str5,str6,str7);
figure();
imshow(DW),title(S);
第一次训练后识别出的车牌号码:
发现第二个字符识别错误,在进行第二次识别:
可以看出完成了准确识别车牌的目的。
3程序总结
在汽车车牌识别的整个过程中,查找了很多资料,综合了各方面的信息。
车牌实现的每一步都有许多的方法,各种方法都有其优劣,但是对于具体的图像处理,并不是每一种理论在实践中都可以实现,即使实现了也很难说哪一种方法最合适,还得在具体的实验中比较选择。
第二点在程序调试的过程中要耐心的检查每一个错误。
测试结果表明,本设计有以下几条优点:
充分利用MATLAB中已有的函数库,使整个程序设计简单易行;
使用了MATLAB的自定义函数功能,使程序设计更简洁。
但也发现了更多的缺点:
程序的局限性:
只能针对图像中一辆汽车的牌照进行识别;对于图像内的元素较复杂的照片可能无法进行识别。
神经网络的训练要花费30秒以上的训练时间才能进行下一步的字符识别,效率太慢。
程序可能会受软件环境的影响识别准确性,据测试,MATLAB的2010a版比2009a版识别效率高,准确性也高点。
车牌识别程序设计能够得以顺利完成。
在很大程度上得利于MATLAB这套软件,MATLAB功能强大,它包括数值计算和符号计算,并且计算结果和编程可视化。
这为编程调试创造了一个便利的环境。
作为图像处理最适用的工具之一,其突出的特点是它包含一个图像处理工具包,这个工具包由一系列支持图像处理操作的函数组成。
所支持的图像处理操作有:
图像的几何操作、邻域和区域操作、图像变换、图像恢复与增强、线性滤波和滤波器设计、变换(DCT变换等)、图像分析和统计、二值图像操作等。
在图像的显示方面,MATLAB提供了图像文件读入函数imread(),用来读取如:
bmp、tif、jpg、pcx、tiff、jpeg、hdf、xwd等格式图像文件;图像写出函数imwrite(),还有图像显示函数image()、imshow()等等。
这些,都使编程效率大为提高。
4课程总结
MATLAB语言是当今国际上科学界(尤其是自动控制领域)最具影响力、也是最有活力的软件。
它起源于矩阵运算,并已经发展成一种高度集成的计算机语言。
它提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化与界面设计、便捷的与其他程序和语言接口的功能。
MATLAB语言在各国高校与研究单位起着重大的作用。
MATLAB的含义是矩阵实验室(MATRIXLABORATORY),主要用于方便矩阵的存取,其基本元素是无须定义维数的矩阵。
MATLAB自问世以来,就是以数值计算称雄。
MATLAB进行数值计算的基本单位是复数数组(或称阵列),这使得MATLAB高度“向量化”。
经过十几年的完善和扩充,现已发展成为线性代数课程的标准工具。
由于它不需定义数组的维数,并给出矩阵函数、特殊矩阵专门的库函数,使之在求解诸如信号处理、建模、系统识别、控制、优化等领域的问题时,显得大为简捷、高效、方便,这是其它高级语言所不能比拟的。
美国许多大学的实验室都安装有MATLAB供学习和研究之用。
在那里,MATLAB是攻读学位的大学生硕士生、博士生必须掌握的基本工具。
MATLAB中包括了被称作工具箱(TOOLBOX)的各类应用问题的求解工具。
工具箱实际上是对MATLAB进行扩展应用的一系列MATLAB函数(称为M文件),它可用来求解各类学科的问题,包括信号处理、图象处理、控制系统辨识、神经网络等。
随着MATLAB版本的不断升级,其所含的工具箱的功能也越来越丰富,因此,应用范围也越来越广泛,成为涉及数值分析的各类工程师不可不用的工具。
MATLAB5.3中包括了图形界面编辑GUI,改变了以前单一的“在指令窗通过文本形的指令进行各种操作”的状况。
这可让使用者也可以象VB、VC、VJ、DELPHI等那样进行一般的可视化的程序编辑。
在命令窗口(matlabcommandwindow)键入simulink,就出现(SIMULINK)窗口。
以往十分困难的系统仿真问题,用SIMULINK只需拖动鼠标即可轻而易举地解决问题,这也是近来受到重视的原因所在。
作图的plot函数和ezplot比较常见
线性的linprog或者用牛顿法,都可以,前面的比较好用
非线性用最小二乘或者lsqcurvefit非线性拟合
优化的有很多,黄金分割,进退法,这些都可以,最速下降法都可以,这几个也是可以用手算的,当然最速下降法手算有点难,因为当他接近目标的时候会很慢,算很多次,一般先最速下降,后牛顿,这样配合比较好
附录(部分程序)
(1)车牌的行起始和终止位置的确定
[y,x,]=size(I5);
I6=double(I5);
%绘制行曲线图
Y1=zeros(y,1);
fori=1:
y
forj=1:
x
if(I6(i,j,1)==1)
Y1(i,1)=Y1(i,1)+1;
end
end
end
figure();
subplot(1,3,1);
plot(0:
y-1,Y1),title('行像素灰度值累计'),xlabel('行值'),ylabel('像素和');
[temp,MaxY]=max(Y1);
PY1=MaxY;
while((Y1(PY1,1)>=80)&&(PY1>1))
PY1=PY1-7;
end
PY2=MaxY;
while((Y1(PY2,1)>=80)&&(PY2 PY2=PY2+7; end (2)车牌的列起始位置和终止位置的确定 %绘制列曲线图 X1=zeros(1,x); forj=1: x fori=PY1: PY2 if(I6(i,j,1)==1) X1(1,j)=X1(1,j)+1; end end end subplot(1,3,2); plot(0: x-1,X1),title('列像素灰度值累计'),xlabel('列值'),ylabel('像数和'); PX1=1; while((X1(1,PX1)<3)&&(PX1 PX1=PX1+7; end PX2=x; while((X1(1,PX2)<3)&&(PX2>PX1)) PX2=PX2-7; End %%分割字符 Px0=1; Px1=1; figure(); fori=1: 7 while((X1(1,Px0)<3)&&(Px0 Px0=Px0+1; end Px1=Px0; while(((X1(1,Px1)>=3)&&(Px1 Px1=Px1+1; end Z=I2(: Px0: Px1,: ); switchstrcat('Z',num2str(i)) case'Z1' PIN0=Z; case'Z2' PIN1=Z; case'Z3' PIN2=Z; case'Z4' PIN3=Z; case'Z5' PIN4=Z; case'Z6' PIN5=Z; otherwise PIN6=Z; end subplot(1,7,i); imshow(Z); Px0=Px1; End %%分割字符按行积累量 [y,x]=size(I2); I3=double(I2); X1=zeros(1,x); forj=1: x fori=1: y if(I3(i,j,1)==1) X1(1,j)=X1(1,j)+1; end end end subplot(1,2,2); plot(0: x-1,X1),title('车牌列像素点累计'),xlabel('列值'),ylabel('像素和'); closeall; clearall; %%归一化训练样本 I0=pretreatment(imread('BP/0.jpg')); I1=pretreatment(imread('BP/1.jpg')); I2=pretreatment(imread('BP/2.jpg')); I3=pretreatment(imread('BP/3.jpg')); I4=pretreatment(imread('BP/4.jpg')); I5=pretreatment(imread('BP/5.jpg')); I6=pretreatment(imread('BP/6.jpg')); I7=pretreatment(imread('BP/7.jpg')); I8=pretreatment(imread('BP/8.jpg')); I9=pretreatment(imread('BP/9.jpg')); I10=pretreatment(imread('BP/A.jpg')); I11=pretreatment(imread('BP/B.jpg')); I12=pretreatment(imread('BP/C.jpg')); I13=pretreatment(imread('BP/D.jpg')); I14=pretreatment(imread('BP/G.jpg')); I15=pretreatment(imread('BP/K.jpg')); I16=pretreatment(imread('BP/L.jpg')); I17=pretreatment(imread('BP/M.jpg')); P=[I0',I1',I2',I3',I4',I5',I6',I7',I8',I9',I10',I11',I12',I13',I14',I15',I16',I17']; T=eye(18,18);%输出样本 %%bp神经网络参数设置 net=newff(minmax(P),[1250,32,18],{'logsig','logsig','logsig'},'trainrp'); net.inputWeights{1,1}.initFcn='randnr'; net.layerWeights{2,1}.initFcn='randnr'; net.trainparam.epochs=5000; net.trainparam.show=50; %net.trainparam.lr=0.003; net.trainparam.goal=0.0000000001; net=init(net); [net,tr]=train(net,P,T);%训练样本 %%测试 I=imread('CAR/0.jpg'); DW=Location(I);%车牌定位 [PIN0,PIN1,PIN2,PIN3,PIN4,PIN5,PIN6]=StringSplit(DW);%字符分割及处理 %%测试字符,得到识别数值 PIN0=pretreatment(PIN0); PIN1=pretreatment(PIN1); PIN2=pretreatment(PIN2); PIN3=pretreatment(PIN3); PIN4=pretreatment(PIN4); PIN5=pretreatment(PIN5); PIN6=pretreatment(PIN6); P0=[PIN0',PIN1',PIN2',PIN3',PIN4',PIN5',PIN6']; fori=2: 7 T0=sim(net,P0(: i)); T1=compet(T0); d=find(T1==1)-1; if(d==10) str='A'; elseif(d==11) str='B'; elseif(d==12) str='C'; elseif(d==13) str='D'; elseif(d==14) str='G'; elseif(d==15) str='K'; elseif(d==16) str='L'; elseif(d==17) str='M'; elseif(d==0) str='0'; elseif(d==1) str='1'; elseif(d==2) str='2'; elseif(d==3) str='3'; elseif(d==4) str='4'; elseif(d==5) str='5'; elseif(d==6) str='6'; elseif(d==7) str='7'; elseif(d==8) str='8'; elseif(d==9) str='9'; else str=num2str(d); end switchi case2 str2=str; case3 str3=str; case4 str4=str; case5 str5=str; case6 str6=str; otherwise str7=str; end end
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 MATLAB 字符 识别 研究
![提示](https://static.bdocx.com/images/bang_tan.gif)