图像处理方法总结1.docx
- 文档编号:29177047
- 上传时间:2023-07-21
- 格式:DOCX
- 页数:41
- 大小:1.48MB
图像处理方法总结1.docx
《图像处理方法总结1.docx》由会员分享,可在线阅读,更多相关《图像处理方法总结1.docx(41页珍藏版)》请在冰豆网上搜索。
图像处理方法总结1
图像处理算法归纳
图像处理算法归纳1
1颜色空间2
2图像的增强5
3阈值化8
4边缘检测的算法13
5形态学16
6连通区域法20
7灰度级插值24
8角度检测26
1颜色空间车牌定位与分割算法的研究及实现7
HSV空间
HSV(hue,saturation,value)颜色空间的模型对应于圆柱坐标系中的一个圆锥形子集,圆锥的顶面对应于V=1.它包含RGB模型中的R=1,G=1,B=1三个面,所代表的颜色较亮。
色彩H由绕V轴的旋转角给定。
红色对应于角度0°,绿色对应于角度120°,蓝色对应于角度240°。
在HSV颜色模型中,每一种颜色和它的补色相差180°。
饱和度S取值从0到1,所以圆锥顶面的半径为1。
HSV颜色模型所代表的颜色域是CIE色度图的一个子集,这个模型中饱和度为百分之百的颜色,其纯度一般小于百分之百。
在圆锥的顶点(即原点)处,V=0,H和S无定义,代表黑色。
圆锥的顶面中心处S=0,V=1,H无定义,代表白色。
从该点到原点代表亮度渐暗的灰色,即具有不同灰度的灰色。
对于这些点,S=0,H的值无定义。
可以说,HSV模型中的V轴对应于RGB颜色空间中的主对角线。
在圆锥顶面的圆周上的颜色,V=1,S=1,这种颜色是纯色。
HSV模型对应于画家配色的方法。
画家用改变色浓和色深的方法从某种纯色获得不同色调的颜色,在一种纯色中加入白色以改变色浓,加入黑色以改变色深,同时加入不同比例的白色,黑色即可获得各种不同的色调。
HSI空间
HSI色彩空间是从人的视觉系统出发,用色调(Hue)、色饱和度(Saturation或Chroma)和亮度(Intensity或Brightness)来描述色彩。
HSI色彩空间可以用一个圆锥空间模型来描述。
用这种描述HIS色彩空间的圆锥模型相当复杂,但确能把色调、亮度和色饱和度的变化情形表现得很清楚。
通常把色调和饱和度通称为色度,用来表示颜色的类别与深浅程度。
由于人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度,为了便于色彩处理和识别,人的视觉系统经常采用HSI色彩空间,它比RGB色彩空间更符合人的视觉特性。
在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,它们可以分开处理而且是相互独立的。
因此,在HSI色彩空间可以大大简化图像分析和处理的工作量。
HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法,因而它们之间存在着转换关系。
在颜色立体图中垂直轴表示光的亮度变化,顶部最亮表示白色,底部最暗表示黑色,中间是由浅至深的灰色。
在与黑白轴垂直的平面圆周上各点代表光谱上各种不同的色调,如图中箭头所指红橙黄…紫构成闭合的环,其值在0度~360度之间。
处于圆周上的点式饱和度,颜色从圆周到圆心过渡,表示颜色饱和度逐渐降低,其值用百分比表示。
当颜色在立体图同一平面上变化时,只改变色调和饱和度,而亮度不变。
YIQ/YUV空间
RGB空间
RGB(red,green,blue)颜色空间最常用的用途就是显示器系统,彩色阴极射线管,彩色光栅图形的显示器都使用R、G、B数值来驱动R、G、B电子枪发射电子,并分别激发荧光屏上的R、G、B三种颜色的荧光粉发出不同亮度的光线,并通过相加混合产生各种颜色;扫描仪也是通过吸收原稿经反射或透射而发送来的光线中的R、G、B成分,并用它来表示原稿的颜色。
RGB色彩空间称为与设备相关的色彩空间,因为不同的扫描仪扫描同一幅图像,会得到不同色彩的图像数据;不同型号的显示器显示同一幅图像,也会有不同的色彩显示结果。
通常把RGB空间转换到HSV空间进行处理的原因:
H和S两个分量包含了图像的彩色信息,说明了颜色的深浅、合成色度,与人感受颜色的方式紧密相连;而分量V表示亮度,包含了光照条件方面的信息,与图像的彩色信息无关。
如果舍弃V分量,只考虑H和S分量则减少了光照条件的影响,这对于光照条件不均匀的彩色汽车图像分割具有重要意义(但是在实验中,为了解决复杂光照背景下存在阴影的状况,我们并没有完全舍弃V分量而是将其作为辅助条件)。
因此在HSV模型下,用H和S两个分量辅助以V分量就可以将蓝色和黄色两种颜色区域找出来,同时发现只用V分量就能将白色和黑色两种颜色识别出来,因此HSV模型特别适合于利用车牌的颜色特征来识别车牌。
2图像的增强边缘检测算法在车牌定位系统中的应用研究[1]
2.1灰度级的修整
直方图均衡
直方图用来表达一幅图像灰度等级分布情况。
(横轴灰度值,纵轴像素数)直方图均衡化通过灰度映射使图像的灰度值在直方图上均匀分布,改善偏亮和偏暗的图像。
为了改变图像整体偏暗或整体偏亮,或灰度层次不丰富的情况,可以将原图像的直方图通过变换函数修正为均匀的直方图,使直方图不再偏于低端,也不再偏于高端,而是变成比较均匀的分布。
其计算步骤如下(车牌定位与字符分割的研究与实现[2])
1统计原始图像的各灰度级的像素数目ni
2统计原始图像各灰度级的频数:
Pf=ni/n;n为总的像素数目
3根据Pf计算累计分布函数,此分布函数值为0~1之间;用其乘255可得映射后的灰度值。
灰度拉伸
灰度拉伸是根据灰度直方图的分布拉伸某段灰度区间以改善输出图像。
灰度拉伸功能用于加强选择区域的对比度;它在0到255之间按顺序取两点X1和X2,他们将0-255之间的灰度划分成[0,x1],[x1,x2]和[x2,255]三个灰度区间;采取一个分段式的灰度拉伸方程来强化车牌前景和背景间的灰度差异。
(车牌定位与字符分割的研究与实现[2])。
通过调整Y1和Y2的大小改变灰度拉伸方程在[0,X1]和[X2,255]之间的斜率,突出[X1,X2]间的车牌区域。
2.2图像平滑
图像在生成或传输过程中页常受到各种噪声源的干扰和影响而使图像处理变差。
有时抽样效果差的系统同样给图像带来噪声,在图像上的反映就是使原本均匀和连续变化的灰度突然变大或变小,形成一些虚假的边缘或轮廓。
抑制或消除这类噪声而改善图像质量的过程称为图像的平滑过程。
平滑分空域上和频域上的平滑算法。
2.2.1空域处理
2.2.1.1领域平均法
领域平均法中,我们假定图像时由去多灰度恒定的小块组成,相邻像素间有很高的空间相关性。
而噪声是统计独立地叠加在图像上的,其均值为0。
因此,可以用领域内各像素灰度值的平均值代表原来的灰度值,实现图像的平滑。
简单平均值:
设图像中某像素的灰度值为f(x,y),它的领域s为M*N大小的窗口,则平滑后的灰度值为:
阈值平均法
设图像中某像素的灰度值为f(x,y),取以该像素为中心点的M*N大小的窗口,则平滑后的灰度值为:
K近邻平均法
在一个M*N窗口中,属于同一个物体的像素,它们的灰度值将高度相关。
因此,窗口内的中心像素的灰度值可用窗口内与中心点灰度相近的K各领域的平均灰度来代替。
一般来讲,K值越小则噪声方差降低越小,但能保持细节较好;而较大的K值平滑噪声效果好,但也使图像模糊。
2.2.1.2低通滤波法
从频谱上看,噪声特别是随机噪声是一种具有较高频率分量的信号。
平滑的目的就是通过一定的手段滤去这类信号。
一个很自然的想法就是使图像经过一个二维的低通数字滤波器,让高频信号得到较大的衰减。
在空间域上进行的这种滤波实际上就是对图像和滤波器的冲击响应函数卷积。
2.2.1.3统计排序滤波器
统计滤波器是一种非线性而的空间滤波器,它的响应基于图像滤波器包围的图像区域的像素排序,然后由统计排序结果的值代替中心像素的值。
比较常用的就是中值滤波器,它将像素领域内灰度的排序中值来代替该灰度的值。
2.2.2频率域处理
边缘和其他尖锐变化在图像的灰度级中主要出于傅里叶变换的高频部分。
因此,平滑可以通过衰减指定的图像傅里叶变换中高频成分的范围来实现。
理想低通滤波器
具有陡峭的截止特征,但是高频分量完全为0,使图像的边缘变得模糊,而且在截止的边缘处由于不连续会产生振铃效应。
巴特沃兹滤波器
由于转移特性曲线较平滑,故无振铃效应,图像边缘的模糊比理想低通滤波器的小。
2.3图像锐化
在图像判断和识别中,需要有边缘鲜明的图像。
图像锐化技术常用来对图像的边缘进行增强,反映在频谱的修改上,就是保留高频段而使低频段受到很大的抑制。
常使用的手段是高通滤波器。
若需要某一频段的图像明显,可以使用带通或带阻滤波器。
巴特沃兹高通滤波器
2.4图像恢复
在获取图像时,由于汽车与摄像机之间的相对运动,反映在底片上的图像有明显的移动,形成了模糊的运动图像,这主要是由水平方向的运动所造成的,为了使算法简单些,我们假定是由水平方向的匀速运动造成的。
2.5反锯齿车牌定位与字符分割技术研究[2]
在拍摄动态情况下的汽车图片时,由于数码摄像机的工作原理是按行拍摄视频信息的,这样数码摄像机每扫描完一行,汽车发生移动,在扫描下一行时图像的行与行之间就会出现错位的情况,由此产生锯齿。
在利用黑白跳变来定位车牌时锯齿会严重影响算法的准确程度。
可以采取使用原始图像的偶数行来代替奇数行组成一幅新图像替代原始图像的办法来消除锯齿,或者是只抽取偶数行组成一幅新的图像来消除锯齿
3阈值化(基于计算机视觉的车牌定位研究[11])
二值图像是指整幅图像画面内仅黑、白二值的图像。
在实际的车牌处理系统中,进行图像二值变换的关键是要确定合适的阈值,使得车牌信息与背景能够分割开来,二值变换的结果图像必须要具备良好的保形性,不丢掉有用的形状信息,不产生额外的空缺等等。
二值化的阈值选取主要分为3类:
全局阈值法、局部阈值法和动态阈值法。
3.1自适应阈值分割法
对图像按照坐标分块,对每一块分别选一阈值进行分割,这种与坐标相关的阈值称为动态阈值法,页称为自适应阈值法。
这类算法的时间复杂度和空间复杂度比较大,但是抗噪声能力比较强。
自适应阈值选取比较简单的方法则是对每个像素确定以它为中心的一个领域窗口,计算窗口内像素的最大值和最小值,然后取它们的均值作为阈值。
(见后文分块聚类)(小波变换的二值化阈值选取可见智能交通系统中车牌定位方法的研究)
3.2全局阈值法
是根据图像的直方图或灰度空间分布确定一个阈值,并根据该阈值实现灰度图像得到二值化图像的转化。
全局阈值方法的优点在于算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对输入图像量化噪声或不均匀光照等情况抵抗能力低,应用受到极大限制。
典型的全局阈值法包括类间方差阈值分割法、最大熵方法等。
1类间方差阈值分割法(车牌定位方法研究[4])
3.3局部阈值法
则是由像素灰度值和像素周围点局部灰度特性来确定像素的阈值的。
Bernsen算法是典型的局部阈值方法,局部阈值法也存在缺点和问题,如实现速度慢、不能保证比划的连通性,以及容易出现伪影等现象。
Bernsen算法以局部窗口内灰度最大、最小值作为参考来确定考察点的阈值。
考虑以(x,y)为中心的(2W+1)*(2W+1)为模板,Bernsen算法可描述为:
1计算每点阈值
如果f(x,y)>T(x,y)则b(x,y)为原图在考察点(x,y)坐标的灰度,T(x,y)为局部动态阈值。
Max为(2W+1)*(2W+1)模板灰度的最大值,min为最小值。
分块聚类二值化方法:
基于分块聚类的车牌图像二值化及车牌定位方法研究[10]
将整幅图像等分成多个小块,在每个小块中根据像素点的灰度值对像素进行聚类,根据聚类结果二值化,从而得到各个小块的二值化结果,将各个小块的二值化结果组合成车牌图像的二值图像。
首先对图像进行分块。
将原始图像从左到右、从上到下划分成等大小的多个小块。
接着对每个小块进行聚类二值化。
聚类二值化算法主要根据车牌图像的灰度特点来设计。
其依据是车牌部分的图像可分为字符与底色两部分,在灰度图像中字符的灰度值较大而底色部分的灰度值较小,且各部分内灰度值比较均匀,而两部分的对比度比较大。
聚类算法将像素点的灰度值分成小灰度值类LC(底色),大灰度值类HC(字符)。
下面介绍聚类二值化算法中的参数
数组Value[1…elemcount]:
小块中所有像素点的灰度值。
数组中的值初始化为快内各个像素点的灰度值,并按照升序排列。
elemcount为数组中元素的个数,其值为块中像素点的总个数。
lowindex,highindex:
分别为数组Value[1…elemcount]中划分到小类LC、大类HC中的最大元素、最小元素的下标值。
则当某一次聚类完成后,属于小类LC的元素为Value[1….lowindex],属于大类HC的元素为Value[highindex…elemcount]。
初始化值为1和elemcount。
lowcount,highcount:
分别为小类LC和大类HC中元素的个数。
则当某一次聚类完成后lowcount的值为lowindex,highcount的值为elemcount-highindex+1。
Lowcentre,highcentre:
分别为小类LC和大类HC的聚类中心,它们是设计聚类准则的主要依据之一。
在算法执行过程中其值分别为小类LC和大类HC的平均值,分别由下公式计算可得。
初始化值分别为Value[1]和Value[elemcount]。
Difflow,diffhigh:
分别为小类LC和大类HC的类内平均方差。
在聚类二值化算法中有一个要求是聚类后的结果中小类LC和大类HC中的值都是比较均匀的,故定义这两个变量来分别度量两个类中的值是否比较均匀。
在算法执行过程中可由公式得出,初始化值都为1.
Para1:
为类内最大相差因子。
用来度量类内员素质与其相应的聚类中心之间所允许的最大差值,即类内元素与其聚类中心的最大差值为其相应聚类中心值与类内最大相差因子para1的乘积。
其取值为0~1之间的经验值,经过大量的实验确定其值为0.2。
Para2:
为类间最小相差因子。
在聚类二值化算法中另一个要求是聚类后的结果中小类LC和大类HC之间的差别应该是比较大的,故定义该变量来度量两类之间的最小差值,即两类类间最小差值为大类HC的聚类中心值与类间最小相差因子para2的乘积。
取值为0~1之间的经验值,经过大量的实验确定其值为0.5。
Para3:
为256级灰度下人眼可区别的灰度级的最小值。
一般其值为24,考虑到噪声的影响,本文中取30。
Fixedlowcentre:
标识小类LC的聚类中心是否已确定,即小类LC的聚类过程已经结束。
1表示是,0表示否,其初始化值为0。
Fixedhighcentre:
标识大类HC的聚类中心是否已经确定,即大类HC的聚类过程是否已经结束。
1表示是,0表示否,其初始化值为0。
Templowcentre,temphighcentre:
分别用来存储最后一次有效聚类后得到的lowcentre和highcentre的值。
其初始化值为Value[1]和Value[elemcount]。
Tempdiffow,tempdiffhigh:
分别用来临时存储上一次聚类过程中得到的difflow和diffhigh的值。
其初始化值都为1。
下面介绍聚类准则
聚类是一个迭代过程,每次迭代都是根据上一次迭代过程中计算出来的highcentre和lowcentre将数组Value[1….elemcount]中还没有划分的元素依据聚类准则进行划分。
其过程可通过数组的遍历来实现,遍历从数组两端同时向中间进行。
对数组中的任一元素Value[i],归属有三种LC,HC,NC。
小类LC的聚类准则:
当Value[i]的值小于或等于小类LC的聚类中心,或Value[i]与小类LC的聚类中心的差值小于小类LC的类内最大差值,或Value[i]与小类LC的聚类中心的差值小于人眼所能区分的最小灰度级。
即满足下列条件之一:
大类HC的聚类准则:
当Value[i]的值大于或等于大类HC的聚类中心,或大类HC的聚类中心与Value[i]的差值小于大类的类内最大差值,或大类HC的聚类中心与Value[i]的差值小于人眼所能区分的最小灰度级。
即对下列条件:
迭代终止条件
二值化算法描述
S1将整幅图像分割成n小块。
S2对每个小块一次进行如下操作:
S2.1将块内像素点的灰度值排列成升序成数组Value[1…elemcount],对所有参数初始化。
S2.2若条件condition成立,表明上一次迭代聚类结果无效,终止迭代聚类,跳到S2.9。
S2.3若fixedlowcentre+fixedhighcenre=2,表明小类、大类聚类都已完成,终止迭代聚类,跳到S2.9
S2.4若lowindex>highindex,表明数组Value[1…elemcount]中的所有元素都已划分完,终止迭代聚类,跳到S2.9
S2.5templowcentre=lowcentre,temphighcentre=highcentre,保存上一次有效聚类的后的小类LC和大类HC的聚类中心值。
S2.6若fixedlowcentre=1,表明对小类LC的聚类已完成,不再对小类LC进行聚类,跳到S2.7
S2.6.1若Value[lowindex+1]使小类条件成立,表明Value[lowindex+1]可以划分到小类LC中,则lowindex++,即将该元素划分到小类LC中,跳到S2.6.1;
S2.6.2tempdifflow=difflow,记下前一次聚类后的小类LC的类内平均方差,更新lowcentre、difflow,若difflow>tempdifflow,即表明本次小类LC聚类无效,令fixedlowcentre=1,表明小类LC聚类完成。
S2.7若fixedhighcentre=1,表明对大类HC的聚类已经完成,不再对大类HC进行聚类,跳到S2.8
S2.7.1若Value[highindex-1]使大类条件成立,表明Value[highindex-1]可以划分入大类HC中,则highindex--,即将该元素换分到大类HC中,跳到S2.7.1。
S2.7.2tempdiffhigh=diffhigh,记下前一次聚类后的HC类的类内平均方差,更新highcentre,diffhigh,若diffhigh>tempdiffhigh,表明本次大类HC聚类无效,令fixedhighcentre=1,表明本大类HC聚类完成
S2.8跳到2.2
S2.9lowcentre=templowcentre,highcentre=temphighcentre,根据聚类结果对小块二值化,即若某像素点的灰度值为大类HC,则将其置1,否则置0。
迭代法求最佳阈值车牌定位与字符分割技术研究[2]
属于全局阈值的一种。
在迭代法取阈值时,首先计算灰度图像加强边缘特性后的灰度直方图,记录下256个灰度级的数目。
如果灰度级i的大小假设为M,所反映的内涵式这幅图像里面的灰度值为i的像素点有M个。
将图像中像素的灰度值所能达到的最大值Tmax和最小值Tmin取算术平均值,作为选择迭代二值化阈值的初值T0,设定迭代选取二值化阈值的次数最多为100次,先以T0为界,将灰度级低于T0的那些灰度级放在一起(换言之,是将灰度值低于T0的所有像素点放在一起),求取其加权平均值T00,
同样的将灰度值高于T0的那些灰度级放在一起(即将灰度值高于T0的所有像素点放在一起),求其加权平均值T01,其计算公式为:
取新的二值化阈值为:
T1=(T00+T01)/2
判断T1是否等于T0,若不相等,则进行下一次循环,一直到Ti=Ti+1或者迭代次数达到了一百次。
4边缘检测的算法(边缘检测算法在车牌定位系统中的应用研究1)
4.1微分算子法
这种方法主要从边缘点(通常对应于一阶微分幅度值大的点),同时也从二阶微分的零交叉点出发,设计一些一阶或二阶微分算子,求得其梯度或二阶导数过零点,再选择一定的阈值提取边界。
如roberts算子、sobel算子、prewitt算子、laplacian算子等。
另外还有基于曲面拟合的各种边缘检测算法,它们的基本思想是用一个平滑的曲面和待测点周围某领域内像素的灰度值进行拟合,然后计算此曲线的一阶或二阶导数。
4.1.1Roberts算子
在图像检测中,经常用到Robert梯度算子和sobel算子检测边缘。
Robert算子采用的是对角方向相邻两像素之差,即:
Robert算子的模板2*2
4.1.2sobel算子
Sobel算子实现做加权平均,然后再微分,即:
Sobel算子有一定的噪声抑制能力,在检测阶跃边缘是得到的边缘宽度至少为两像素。
其算子由两个3*3的模板组成。
4.1.3laplacian算子
Laplacian算子是一种不依赖于边缘方向的二阶微分算子,它是标量而不是矢量,而且具有旋转不变即各方向同性的性质,在图像处理中经常被用来提取图像的边缘。
函数的拉普拉斯变换页可借助各种模板来实现。
模板的基本要求是对应中心像素的系数为正,对应中心像素邻近像素的值为负,且他们的和为0.
由于该算子是一种二阶导数算子,所以对图像中的噪声相当敏感。
另外它常产生双像素的边缘,而且也不能检测边缘方向的信息。
由于上述原因,拉普拉斯算子很少直接用于检测边缘,而主要是用于已知边缘像素后确定该像素是在图像的暗区或明区一边
4.2最优算子法
这类方法的目的是根据信噪比求得检测边缘的最优滤波器。
Marr_hildreth算子是应用gauss函数先对图像进行平滑,然后采用拉普拉斯算子根据二阶导数过零点来检测边缘,也被称之为LOG算子。
LOG算子和视觉胜利中的数学模型相容,从而在计算机视觉和视觉生理研究之间建立了联系,在机器视觉研究领域得到了广泛的应用。
另一种方法是局部曲线最小二乘拟合法,其基本思想是:
根据最小二乘法把图像的局部区域近似表示为一组基函数的线性拟合,从而达到消除噪声的效果。
Canny从边缘检测算子的信噪比准则、定位精度准则、单边缘响应准则出发,提出了canny算子,它检测受高斯白噪声影响的阶跃型边缘有比较好的效果。
4.2.1MARR边缘检测方法
存在较大噪声的场合,由于微分运算会起到放大噪声的作用,因此,梯度算子和拉普拉斯算子对噪声比较敏感。
这种改进的方法实现对噪声的平滑,以抑制噪声,然后再进行微分;或者,先对图像进行局部线性拟合,然后再用拟合所得的光滑函数的导数来替代直接的数值导数。
当用一阶导数最大值或二阶导数过零点的方法检测边缘点,检测出来的都是噪声引起的假的边缘点,这是因为噪声一般是高频信号,在噪声的前沿或后沿,噪声信号的导数一般要高于边缘点处信号的导数。
解决这一难题的办法是先对信号进行平滑滤波,以滤去噪声。
对平滑滤波后的信号求导如下,可以将先平滑、后微分的两部分运算合并,并将平滑滤波器的导数称为1阶微分滤波器。
因此,边缘检测的基本方法是设计一个平滑滤波器h(x)
检测边缘用二阶导数即拉普拉斯算子
4.2.2Canny边缘检测[车牌定位方法研究4]
Canny边缘检测利用高斯函数的一阶微分,能在噪音抑制和边缘检测之间取得较好的平衡。
4.3多尺度方法
此方法是随着多分辨率和小波理论的出现而逐渐发展起来的。
窗口大小(或尺寸)参数的自动调整是很难的,而应用多个尺度可以对此问题给出一个比较满意的解决。
多尺度信号处理的目的不仅是为了辨识出信号中的重要特征,而且能以不同细节成都来构造对信号的描述,在高层次视觉处理的任务中多尺度方法有着重要的作用。
4.4基于自适应平滑滤波的边缘检测方法
基于自适应平滑滤波的边缘检测方法的基本思想是利用一个通用算子对信号进行平滑
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 处理 方法 总结