看1Word文件下载.docx
- 文档编号:19195548
- 上传时间:2023-01-04
- 格式:DOCX
- 页数:19
- 大小:650.05KB
看1Word文件下载.docx
《看1Word文件下载.docx》由会员分享,可在线阅读,更多相关《看1Word文件下载.docx(19页珍藏版)》请在冰豆网上搜索。
本文引入欧氏距离的相似性度量方法实现图像检索。
实验表明,该方法具有较好的查全率和查准率。
【关键字】图像检索,颜色特征,颜色直方图,相似性度量方法
CONTENT-BASEDIMAGERETRIEVALSYSTEM
LEARNANDREALIZATION
第一章绪论6
1.1课题研究的目的和意义6
1.2图像检索系统的关键技术7
1.3国内外研究现状8
1.4本文所作的主要工作9
第二章基于颜色特征的图像检索10
2.1颜色模型10
2.1.1RGB模型11
2.1.2HSV模型12
2.1.3CMY模型13
2.1.4L*a*b模型14
2.2颜色特征的提取与表达14
2.2.1全局颜色直方图15
2.2.2基于分块颜色直方图法15
2.2.3累加直方图15
2.2.4局部累加直方图16
2.3图像特征的相似性匹配16
2.3.1直方图相交法17
2.3.2欧氏距离方法18
2.3.3模糊方法18
第三章图像检索系统的设计19
3.1系统设计19
3.1.1算法分析19
3.1.2系统结构框图20
3.2系统性能分析21
第四章总结与展望22
4.1论文工作总结22
4.2进一步的工作23
致谢23
参考文献(References)24
ABSTRACT
Thisimageretrievalsystemisbasedonaimprovedweightedcolorhistogram.
Withcombiningtheimprovedimageretrievalalgorithemofbasedontheweightedcentral-blockcolorhistogramandtheimageretrievalalgorithemofoverallhistogram,therecallrateandtherateofsearchisimproved.Usingtheimportanceoftheimageofthemiddlepart,theretrievalmethodbasedontheblocklocalhistogramdivideapictureintoanaverageof3×
3sub-blocks.Choosethemiddleone,calculatethecolourfeaturedistancebetweenthemiddleblockoforiginalimageandthemiddleblockofreferenceimage.Thencalculatethecolourfeaturedistancebetweentheoriginalimageandreferenceimage.Weightedwithfixedvalue,wecangetthesimilaritybetweenthem.WeintroducetheEuclideandistancemeasurementmethodstoachievesimilarimageretrieval.
Theexperimentsshowthatthemethodhasabetterrecallrateandtherateofsearch.
Keywords:
ImageRetrieval,featuresofcolor,colorhistogram,similarmethodsofmeasurement
目录
摘要--------------------------------------------------------------I
ABSTRACT----------------------------------------------------------II
第1章绪论-------------------------------------------------------1
1.1课题研究的目的和意义---------------------------------------1
1.2图像检索系统的关键技术----------------------------------------
1.3国内外研究现状---------------------------------------------
1.4本文所作的主要工作-----------------------------------------
第2章基于颜色特征的图像检索--------------------------------------
2.1颜色模型---------------------------------------------------
2.1.1RGB模型
2.1.2HSV模型
2.1.3CMY模型
2.1.4L*a*b模型
2.2颜色特征的提取与表达-----------------------------------
2.2.1全局颜色直方图
2.2.2基于分块颜色直方图法
2.2.3累加直方图
2.2.4局部累加直方图
2.3图像特征的相似性匹配---------------------------------------
2.3.1直方图相交法
2.3.2欧式距离方法
2.3.3模糊方法
第3章图像检索系统的设计-----------------------------------------
3.1系统设计
3.1.1算法分析
3.2系统的实现
3.3一个图像检索实例
第一章绪论
1.1课题研究的目的和意义
随着多媒体技术的快速发展,计算机硬件技术的不断更新,以图片、图表、动画和视频为形式的信息发布量日益庞大,随之出现了大量庞大的不同内容的图像信息库。
数字图像的应用包括国防军事、工业制造、医疗卫生、新闻媒体、大众娱乐等各方面。
人们在工作生活中越来越多地接触到大量的各种各样的图像信息。
首先,在科学计算、可视化、工程制图及其他众多的应用领域如数字图书馆、天气预报、知识产权保护、天气预报、医疗图像管理、犯罪预防、军事观察和地球资源观察系统、宇宙探测、交通检测等领域,每天都有数量非常巨大的图像信息在不断产生与使用。
其次,随着Internet的发展,网络的应用和发展对社会各个领域产生了巨大影响,特别是WEB的兴起,网络上传输的信息正以指数级增长。
作为一种全新的媒体和公共资源,越来越多的图像信息出现在Web站点上,但是它们都是无序、无索引的,在这样的环境下寻找感兴趣的资料是非常耗时的。
因此,人们对信息检索工具和系统的依赖将会日益增加。
面对信息量如此巨大的图像信息,热门迫切需要一种有效的检索方法。
传统的图像检索技术是基于文本索引的图像检索,通过用文本描述图像的语义,然后再这些图像文本标注基础上应用成熟的文本搜索算法,为用户搜索预期的图像。
虽然检索比较准确而且速度很快,但是随着图像数据库规模的增大(如数十万以上),这种检索消耗的时间大大增加,而且人工标注具有主观性和不确定性。
鉴于上述因素,人们提出了一种新的图像检索技术--基于图像内容的检索CBIR(contented-basedimageretrieval),它不需要用户的参与,而利用图像自身的特征,如颜色、纹理、形状等特征来进行检索,具有较强的客观性。
基于内容的图像检索是一种实用性很强的技术,有着广阔的前景,涉及到社会和生活的方方面面。
1.2图像检索系统的关键技术
目前,对于通用的静止图像检索,用于检索的特征主要有颜色(Color)、纹理(Texture)、形状(Shape)等,其中颜色、纹理、形状应用尤为普遍;
活动视频检索脱胎于序列图像分析中的技术。
本文主要研究对静止图像检索,其中数据库是专用的图像库。
对于目标图像和检索图像进行颜色空间转换、亮度图像的边缘提取和二值分割、提取目标区域的颜色特征。
颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。
按照全局颜色分布来索引图像可以通过计算每种颜色的像素的个数并构造颜色灰度直方图来实现,这对检索具有相似的总体颜色内容的图像是一个很好的途径。
局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。
比如Smith等提出了颜色集合(colorset)方法来抽取空间局部颜色信息并提供颜色区域的有效索引。
运用颜色直方图进行检索有如下三种方式:
(1)指明颜色组成--该法需要用户对图像中的颜色非常敏感,而且使用起来也不方便,检索的查准率和查全率并不高,因此暂时不做进一步开发。
(2)指明一幅示例图像--通过与用户确定的图像的颜色直方图的相似性匹配得到查询结果,这是该课题研究方法的根本。
(3)指明图像中一个子图--分割图像为各个小块,然后利用选择小块来确定图像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像,该方法是进一步优化检索的一个设想。
在颜色空间选取方面,最常用的颜色空间是RGB颜色空间。
通常,人们采用欧氏距离来刻画两种颜色之间的差异,RGB空间存在的一个严重问题是其中所计算出来的两种颜色之间的距离无法正确表征人们实际所感知到的这两种颜色之间的真实差异。
HSI空间比较直观并且符合人的视觉特性。
HSI颜色模型有两个重要的特点作为基础。
首先,I分量与彩色信息无关,其次H和S分量与人感受彩色的方式紧密相连,其中H分量尤其影响人类的视觉判断。
这些特点使得HSI模型非常适合基于人视觉系统对彩色感知特性的图像处理。
得到图像特征的统计直方图后,不同图像间的特征匹配可借助计算直方图间的距离来进行。
一般意义上直方图匹配方法有直方图相交法,直方图匹配法,欧氏距离法,中心矩法,累积直方图匹配法共6种。
本文重点讨论欧氏距离法,并将其作为系统编程实现的主要方法。
所以,颜色特征的图像检索关键技术路径如图一:
特征表达
颜色空间
颜色颜色空间颜色空间空间
相似度量
图1-1颜色特征的图像检索关键技术路径
1.3国内外研究现状
基于内容的图像检索技术开始于上世纪90年代初期,目前已有十几年历史,是当前研究的热点,许多著名杂志如IEEETrans.OnPAMI、IEEETrans.OnImageprocessing等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如:
IEEEconferenceofCVPR、ACMconferenceonmultimedia等纷纷设立专题交流最新的研究成果。
各大研究机构和公司都推出了他们的系统,在商用领域,IBM首先研制出了QBIC系统;
在学术研究领域,MIT的Photobook系统,新加坡国立大学的CORE系统,美国哥伦比亚大学的VisualSEEK系统,加利福尼亚大学SantaBarbara分校的Netra、伊利诺依大学的MARS、CMU的Infomedia以及哥伦比亚大学的VideoQ等。
下面主要介绍这些系统概况:
1.QBIC系统
IBMAlmaden研究中心研究开发的,是基于内容检索系统的典型代表。
QBIC系统允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。
2.Photobook系统
MIT的媒体实验室在1994年开发研制的。
图像在装入时按人脸、形状或纹理特性自动分类,图像根据类别通过显著语义特征压缩编码。
3.CORE系统
新加坡国立大学开发的一个基于内容的检索机。
其显著技术特色包括:
多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。
4.VisualSEEK系统
美国哥伦比亚大学图像和高级电视实验室开发的。
它实现了互联网上的"
基于内容"
的图像/视频检索系统,提供了一套工具供人们在Web上搜索和检索图像和视频。
1.4本文所作的主要工作
从图一的技术路径分析,结合设计要求,我们需要对要素工作具体化,目的是使系统试验简单高效而不失代表性。
如下:
颜色空间选取——面向硬件的RGB空间和面向视觉的HSI空间;
颜色特征的表达——全局直方图,全局累加直方图,局部累加直方图;
相似性度量——欧氏距离计算方法。
第2章基于颜色特征的图像检索
图像是通过颜色表现出来的,颜色是图像最重要的属性。
所以,对于基于内容的图像检索来说图像采取哪种颜色表示方式就显得尤为重要。
本章的主要任务是分析不同的颜色空间表示方式以及适合于图像检索系统的颜色空间。
2.1颜色模型
图像是通过颜色表现出来的,颜色是彩色图像的最显著的特征,与其它特征相比,颜色特征具有非常稳定,对于旋转、平移、尺度变化都不敏感,表现出很强的鲁棒性,又由于颜色特征计算简单,因此基于颜色的查询成为现有基于内容的图像检索系统中应用最基本的方法。
而如何选取合适的颜色特征,以及对颜色特征如何进行有效的抽取将关系到最终的颜色特征的相似性比较和检索的效果。
颜色模型是指某个三维颜色空间中的一个可见光子集,它包含某个颜色域的所有颜色。
颜色模型的用途是在某个颜色域内方便的指定颜色。
由于每一个颜色域都是可见光的子集,所以任何一个颜色模型都无法包含所有的可见光。
常见的颜色模型包括RGB(红、绿、蓝);
HSV(色调、饱和度、亮度);
CMYK(青、洋红、黄、黑);
以及CIE组织的L*a*b等。
2.1.1RGB模型
面向硬设备的最常用颜色模型是RGB模型。
在RGB模型中,所有颜色都可看作是3个基本颜色,即红(R,red),绿(G,green)和蓝(B,blue)的不同组合。
将这三种颜色成分分别人为地分成0到255共256个等级,0表示没有刺激量,255表示刺激量达到最大值。
R、G、B均为255时表示白光,均为0时表示黑色。
这样,我们就能表示出256×
256×
256(约1600万)种颜色。
如图2-1所示,采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起产生复合色。
绝大部分的可见光谱可以用红、绿、蓝R(、G、B)三色光按不同比例和强度的混合来表示。
在颜色重叠的位置,产生青色、洋红和黄色。
因为RGB颜色合成产生白色,它们也称为加色。
将所有颜色加在一起产生白色,也就是说,所有光被反射回眼睛。
加色用于光照、视频和显示器。
RGB颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。
(0,0,0)为黑色,(l,1,1)为白色。
正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特征,是与硬件相关的。
在显示屏上显示颜色定义时,往往采用这种模式。
图像如用于电视、幻灯片、网络、多媒体,一般使用RGB模式。
图2-1RGB颜色模型
虽然RGB彩色模型被广泛应用于CRT设备显示彩色图像,但它并不是一个均匀视觉的颜色空间,不符合人对颜色的感知心理,而且,RGB颜色空间上的距离并不代表人眼视觉上的颜色知觉差异。
但在对彩色图像进行特征提取时,需要用数量来描述颜色的差别,因此需要用另一种符合人的视觉心理的视觉彩色模型来表示颜色。
2.1.2HSV模型
HSv空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域[25]。
它把彩色信号表示为三种属性:
色调H(Hue)、饱和度S(Saturation)和亮度V(value),其中亮度又称LightneSS或Intensity,所以HSV空间还有HLS和HIS这两种叫法。
HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度-180~180或O~360来度量。
亮度V是颜色的明暗程度,通常用百分比度量,O%为最暗的黑色,而100%为最亮的白色。
饱和度S指颜色的深浅程度,即在纯色中包含的白色光的成份。
例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。
饱和度S也用百分比来度量,从浓度最小的O%到浓度完全饱和的100%。
色调H和饱和度S分量合起来定义了颜色的色度(Chromatieity)特性。
HSV颜色模型用Munsell三维空间坐标系统表示,其示意图如图2-2所示。
2-2HSV颜色模型
Munsen颜色空间具有以下己经被人的眼睛所证实的特点:
1.坐标之间的心理感知独立性(PereeptualIndependenee),即人可以独立感知各颜色分量的变化。
2.线性伸缩性(LinearSealability),人眼可感知的颜色差异与HSV颜色分量的相应值上的欧几里德距离(EuelideanDIStanee)是成比例的。
因为HSV颜色空间根据色调H的值来区分不同的颜色,因此在HSV的三个分量中,H分量是尤为重要的,它可以很好地模拟人类对颜色的识别和记忆过程。
2.1.3CMY模型
以红、绿、蓝的补色青(eyan)、品红(Magenta)、黄(Yellow)为原色构成的CMY颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。
CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型所对应的子空间几乎完全相同。
差别仅在于前者的原点为白,而后者的原点为黑。
前者是定义在白色中减去某种颜色来定义一种颜色,而后者是通过从黑色中加入颜色来定义一种颜色。
CMY模型以打印在纸张上油墨的光线吸收特性为基础,当白光照射到半透明油墨上时,部分光谱被吸收,部分被反射回眼睛。
理论上,青(Cyna)、品红(Magenta)、和黄(Yelolw)色素能够合成吸收所有的颜色并产生黑色。
因为所有打印油墨都会包含一些杂质,这三种油墨实际上产生一种土灰色,必须与黑色(K)油墨混合才能产生真正的黑色。
将这些油墨混合产生颜色称为四色印刷。
减色(CMY)和加色(RGB)是互补色,每对减色产生一种加色,反之亦然。
如图2-3所示。
2-3CMY颜色模型
2.1.4L*a*b模型
L*a*b颜色模型是在1931年国际照明委员会(CIE)制定的颜色度量国际标准的基础上建立的。
1976年,这种模型被重新修订并命名为CIEL*a*b。
L*a*b颜色设计为与设备无关,不管使用什么设备创建或输出图像,这种颜色模型产生的颜色都保持一致。
L*a*b颜色由亮度或光亮度分量(L)和两个色度分量组成:
即a分量(从绿到红)和b分量(从蓝到黄)。
2.2颜色特征的提取与表达
1991年Swain和Ballard首次提出了基于颜色直方图的特征表示,其核心思想是在一定的颜色空间中对图像中各种颜色出现的频数进行统计。
具体做法是,在给定的颜色空间基础上,统计每种颜色分量的像素数占图像总像素数的比例,从而得到图像各种颜色分量的比例分布—直方图,最后把直方图作为图像的颜色特征进行图像检索。
由于图像的颜色直方图具有尺度不变性和旋转不变性,因此被广泛采用。
颜色直方图是颜色信息的函数,它表示图像中具有同颜色级别的像素的个数,其横坐标是颜色级别,纵坐标是颜色出现的频率(像素的个数)。
但是,直方图也存在着缺陷。
首先,颜色直方图只包含了图像中某一颜色值出现的频数,而丢失了像素点所在的位置信息。
而且,虽然对任意一幅图像都能唯一的给出与它对应的直方图,但不同的图像却有可能具有相同的直方图特征,也就是直方图与图像之间并非一一对应的,而是一对多的关系。
这些缺点都会影响直方图特征检索的有效性。
2.2.1全局颜色直方图
全局直方图是一种经常被采用的颜色特征,已在很多图像检索系统中得到应用。
设C(x,y)为RGB空间一幅彩色图像,其颜色直方图的定义为:
其中,M、N为图像C(x,y)垂直和水平方向上的像素数目,并简称为
图像的高和宽;
而k为变换空间的颜色数。
2.2.2基于分块颜色直方图法
采用的分块方法是把图像分成单独的N×
N块,并且图像分块太大则失去分块的意义,不能充分包含颜色的分布信息,分块太小则会增加检索过程的计算量。
经试验比较分析,对二维空间进行3×
3划分是较有效的划分方案。
当图像中的特征并不能取遍所有可取值时,统计直方图中会出现一些零值。
这些零值的出现会对计算直方图的相交带来很大影响,从而使得算出的匹配值并不能正确的反映两图间的颜色差别。
累加直方图是以颜色作为横坐标,从坐标原点到该颜色的所有颜色的像素出现的频数为纵坐标绘出的图形。
这样图像的累加直方图向量H可以定义为:
表示C1~Ck种颜色的像素的累加频数:
我们已经计算出图像的一般直方图,可以方便地计算图像累加直方图。
这样,最后得到的累加直方图特征向量为:
在HSI空间里,H=0基本对应红色,H=pi/3基本对应黄色,H=2pi/3基本对应绿色。
这样在H轴上黄色与红色间,黄色与绿色间距相等。
但从人的视觉感知来讲,黄色与红色间,黄色与绿色间本无所谓哪两个更相似。
这表明色度信号的分布从视觉意义上讲,并不满足累加直方图应用的前提。
所以,对色彩比较复杂的自然景物图像,一般累加直方图算法在检索中就会将不同色度的信号混淆起来。
另外,一幅图像的颜色一般非常多,尤其是真彩色图像,因此直方图矢量的维数会非常高。
如果能采用局部累加后降维,则计算量要少得多。
系统设计中,我们采用Pi/3为区间的长度,将H轴共分成6个不重叠的局部区间[60k,60(k+1)],k=0,1,…5,通过分别计算每个局部区间的累加直方图进行检索。
上述方法都保留了颜色在图像中出现的概率信息,但也丢失了很多颜色的空间信息,因此不同的图像有可能具有相同颜色特征表示。
许多人提出了颜色索引的改进方法---局部颜色特征索引。
从划分局部区域的角度来说可分为:
基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的颜色分割方法。
局部区域中的颜色信息可以表示为平均颜色、主颜色、颜色直方图和二进制颜色集等来表示。
设计系统中暂不做讨论。
2.3图像特征的相似性匹配
在基于文本的检索方法中采用的是文本的精确匹配,而基于内容的图像检索则是通过计算查询图像和图像库中候选图像之间在视觉特征上的相似度匹配进行。
因
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 看1.docx