基于颜色特征的图像数据库检索系统开发.docx
- 文档编号:23742501
- 上传时间:2023-05-20
- 格式:DOCX
- 页数:46
- 大小:601.60KB
基于颜色特征的图像数据库检索系统开发.docx
《基于颜色特征的图像数据库检索系统开发.docx》由会员分享,可在线阅读,更多相关《基于颜色特征的图像数据库检索系统开发.docx(46页珍藏版)》请在冰豆网上搜索。
基于颜色特征的图像数据库检索系统开发
基于颜色特征的图像数据库检索系统开发
摘要
目前图像检索技术主要分为两大类:
基于文本的图像检索(Text-basedImageRetrieval)和基于内容的图像检索(Content-basedImageRetrieval)。
本课题主要研究基于内容的图像检索技术,其中侧重于颜色特征的研究和学习。
基于内容的图像检索是指直接根据图像内容的各种特征进行检索,它的研究目标是提供在没有人参与的情况下能自动识别和检索与目标图像的特征相同或相似的图像。
通过对该领域的研究可以深刻地理解图像重要特征的算法。
基于内容的图像检索是一种利用图像的视觉特征(颜色、纹理、形状等)进行图像检索的技术。
本论文所开发的图像检索的体系结构可以划分为两个部分:
颜色特征提取和图像检索。
颜色特征提取主要负责提取图像的各种低级视觉特征建立图像的特征向量,图像检索主要负责对查询样本图像和图像库中的图像进行相似性计算以便找到目标图像。
在本文中将主要论述基于颜色特征的图像检索系统的开发过程,以及颜色特征的理论知识。
最后的实验结果和分析证明了本文所开发图像检索系统是有效的和高效的。
关键词:
图像检索,颜色空间,直方图,特征提取
ABSTRACT
Imageretrievaltechniquemainlyisdividedintotwomajortypescurrently:
text-basedimageretrievalandcontent-basedimageretrieval.
Thistopicmainlystudiesatechniqueaccordingtocontent-basedimageretrieval,particularemphasisonintheresearchandstudyofcolorfeature.Content-basedimageretrievalisthatdirectcarryonanretrievalaccordingtovariouscharacteristicofpicturecontents.Theresearchtargetisprovideautomaticallyidentifyandretrievethetargetimageofcharacteristichomologyorthepictureoflikenessunderthesituationthatnooneparticipate.Bywayoftheresearchinthisfield,Icandeeplycomprehendthearithmeticofimageimportantcharacteristic.
CBIRisanimageretrievaltechnique,whichsynthesizesvariousvisualfeaturesindigitalimage,suchascolor,textual,andshapesfeatures.Generally,theimageretrievalsystemIdevelopedisdividedintotwodifferentsub-systems:
featureextractionsystemandimageretrievalsystem.Theformerwasmainlydevisedtoacquirelow-levelvisualfeaturesandtoconstructimagefeaturevector;whilethelatertomakeenquirytosampleimagedatabaseandtoretrievalobjectimagesbycalculatingthesimilarityfunctions.
Inthisarticle,mainlydiscussthedevelopmentprocessofthesystemaccordingtotheimageretrievalofthecolorcharacteristic,andthetheoriesofthecolorcharacteristic.Theexperimentoftheendtestresultprovedthatthisimageretrievalsystemisvalidwithefficiently.
Keywords:
Imageretrieval,Colorspace,histogram,featureextraction
目录
第1章绪论
基于内容的图像检索(Content-basedImageRetrievalCBIR)技术兴起于近几年,它主要是为了客服基于文本的图像检索(Textual-basedImageRetrievalTBIR)技术的缺点而出现的[8]。
作为一项新兴的图像检索技术,CBIR在当代信息处理领域具有较高的研究意义和实用价值,因此逐渐成为近年来的研究热点。
1.1图像检索的研究意义
近年来,随着Internet和社会信息化的蓬勃发展,图像数据快速增长,每天都有海量的图像数据从各种图像采集系统上生成。
如何有效的利用这些图像数据就成为一项迫切需要解决的问题。
图像检索系统自20实际70年代以来就是一个非常活跃的领域,其主要目的就是为了用户提供良好的图像管理和查询功能,这在大量数据的图像数据库中显得尤其重要。
随着计算机系统存储与计算能力的不断提高,以图像特征描述为基础的图像检索方法研究取得了长足的进步。
目前图像检索技术主要分为两大类:
基于文本的图像检索(Text-basedImageRetrieval)和基于内容的图像检索(Content-basedImageRetrieval)。
从20世纪70年代开始,有关图像检索的研究就已开始,一直以来都是一个非常活跃的研究方向。
当时主要是基于文本的图像检索技术(Text-basedImageRetrieval,简称TBIR),利用文本描述的方式描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。
该方法需要人工对每幅图像按其内容进行标注,然后将标注信息存到文本数据库中用于后来的检索。
显然,随着图像的增多,人工标注非常困难,而且,每个人对图像内容的理解不同会造成标注的主观性过强,不利于用户检索。
90年代以后,图像检索研究重点是基于图像内容的检索(CBIR)。
如图像的颜色、纹理、布局等进行分析和检索的图像检索技术。
虽然采用传统的文本检索技术从图像基本信息数据库中检索到与关键字相关程度高的图像。
这个方法可以有效的管理图像数据库,但随着图像数据库的进一步扩大,这个方法出现了严重的弊端。
一方面,人工图像文本所需工作量大,难以满足人们日益增长的需要。
另一方面,图像内容的丰富往往导致对于图像的多样性解释。
事实上,人们对于一幅复杂图像的描述往往加入了人的主观因素,从而似的对于图像的描述缺乏客观性。
为了解决这些问题,20实际90年代起,基于内容的图像检索系统出现。
基于内容的图像检索,其基本思想是以图像特征作为关键字,通过对图像的颜色、形状、纹理等特征的提取和量化,得到反映图像内容的特征信息,同样利用数据库管理图像的特征信息,通过对关键字和数据库中图像的特征信息的相似度度量,得到与关键字相似度高的图像。
1.2国外图像检索系统
目前,国外存在一些比较著名的图像检索系统,如QBIC、Virage、MARS、Photobook、WebSEEK、Blobworld等,这些系统虽然大多没有成为商业化系统,但也反映了图像检索系统研究的主要成果。
在这里我将重点介绍一下QBIC、Virage和MARS这3个图像检索系统。
QBIC是基于图像内容查询的英文缩写(QueryByImageContent)。
QBIC系统是IBM推出的第一个商业化的基于内容的图像检索系统。
该系统的设计和采用的技术对后来的图像检索系统产生了深刻的影响。
它支持基于例子图像的查询方式,也支持通过由用户构造的草图、轮廓和选定的色彩和纹理样式的查找方式,以及其他一些查询方式。
Virage是由Virage有限公司开发的基于内容的图像检索引擎。
同QBIC系统一样,它也支持基于色彩、色彩布局、纹理和结构特征(对象边缘)的视觉查询功能,但Virage要比QBIC在技术上向前迈了一步,它支持以上四种基本查询的任意组合后的查询方式。
Jeffery等人进一步提出了图像管理的开放式框架。
根据不同的领域的具体需要,各种有用的基本特征就可以加入到这个开放式结构中。
MARS是多媒体分析和检索系统(MultimediaAnalysisandRetrievalSystem)的英文缩写,是伊利诺斯大学Urbana-Champaign分校开发的。
MARS无论在研究角度还是应用领域都和其他的图像检索系统有很大的差异,主要体现它是一个多交叉学科融合的产物。
MARS系统的重点在于根据实际的应用环节和用户需要在检索系统框架中动态地组合调整各种不同的图像特征。
国外其它一些著名的检索系统还有:
MIT的媒体实验室在1994年开发研制的Photobook,美国哥伦比亚大学图像和高级电视实验室开发的WebSEEK系统实现了互联网上的“基于内容”的图像/视频检索系统。
虽然基于内容的图像检索技术有着广阔的应用前景,并且已经取得了很大的进步,但是仍然有许多关键技术没有简介或不够完善。
因此,该项技术的研究有着深远的意义,也将面临巨大的挑战。
基于内容的图像检索技术在图像检索领域是一种较新的检索技术,是指直接根据图像内容的各种特征进行检索,它能从数据源中查找到与目标图像内容的特征相同或相似的图像。
它的研究目标是提供在没有人参与的情况下根据图像本身的内容进行图像检索,能自动识别出与图像特征相同或相似的图像。
目前,基于内容图像检索的主要工作集中在识别和描述图像的颜色、纹理、形状、空间关系上,以及图像语义的提取上。
由此可见,这是一门涉及面很广的交叉学科,它融合了图像处理、模式识别、计算机视觉、图像理解等领域的知识。
基于内容的图像检索系统具有如下的特点:
直接从媒体内容中提取信息线索。
基于内容的检索是一种近似匹配,这一点与常规数据库检索的精确匹配方法有明显不同。
特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,也大大减少了工作量。
基于内容检索时根据媒体特征进行相似性匹配检索的媒体特征有:
颜色(color)、纹理(texture)、轮廓(sketch)、形状(shape)、空间约束(spatialconstraints)、运动(motion)、领域概念(domainconcepts)、结构描述及其他的图像信息。
它还需从认知科学、人工智能、数据库管理系统、人机交互、信息检索等领域引入新的媒体数据表示和数据模型,从而设计出可靠、有效的检索算法、系统结构以及友好的人机界面。
1.3课题背景及意义
本课题是上海市教委优秀青年科研项目“基于内容的图像数据库检索技术研究”。
其编号为03YQHB173。
本人对图像检索这方面也颇感兴趣,在VC++编程方面有一定的基础。
因此,选择了“基于颜色特征的图像检索系统”作为自己的本科毕业设计题目。
从对该图像检索领域相关知识的了解到本图像检索系统的开发,以及到随后的论文撰写,都花费了很多的时间和精力。
我相信通过这次很长一段时间的学习和研究,我对该图像检索领域有了一定的认识和了解。
本课题旨在通过图像的颜色特征的图像检索系统的开发,对图像检索领域的新技术和设计思想有一定的了解和掌握,为将来进一步的深入研究打下扎实的基础。
本课题的研究也可作为本人今后学习的一个研究方向。
本毕业设计主要根据图像的颜色特征为线索从图像数据库中检索出相同的、或具有相似特性的其它图像。
其中,我所用到的颜色特征包括HSV颜色空间直方图、YUV颜色空间直方图、RGB颜色空间直方图、XYZ颜色空间直方图、HSL颜色空间直方图、YIQ颜色空间直方图、以及分块加权HSV颜色空间直方图(即将图像分割为3×3块)。
本毕业设计还设计到对检索效率的计算,比如说检索所花费的时间、检索结果的准确率等等。
本课题的研究和设计旨在对图像内容检索的一种尝试和探索,为今后更好的研究和实践打下扎实的基础。
基于内容的图像检索系统有着十分广阔而重要的应用领域,本毕业设计所开发的系统之所以取名“ImageSystem”,因为该系统可以作为图像检索系统的一部分,其中包括我所开发的基于颜色特征的图像检索系统,在将来的研究工作中可以加入基于纹理的图像检索、和基于形状的图像检索等,共同组成一个完整的图像检索系统,这是一个不断完善的工作。
本图像检索系统具有一定的实用价值,应用范围广。
例如可以应用到以下的领域:
数字图书馆;
地理信息系统GIS;
医疗图像管理;
安全管理(如人脸识别和指纹识别);
建筑与工程设计;
卫星遥感图像管理等等。
本图像检索系统相比其他图像检索系统相比具有如下的特点:
直接提取图像的颜色特征,在本系统中共实现了7种颜色空间。
采用了通用的ACCESS数据库,将颜色特征序列化得到二进制文件,以及并同文件路径名存取在数据库表格中。
这样做大大提高了检索的效率。
在相似度的计算中采用了近似匹配,涉及到常用的算法有相交距离法,和欧拉距离法。
检索出来的结果根据相似度的高低依次排列出来。
图像颜色特征完全相同的话,其检索结果中的相似度为1。
本图像检索系统在操作上简便,检索结果准确率高,检索速度快,具有一定的实用价值。
1.4本文主要研究内容
在本文中将主要讲述本图像检索系统(ImageSystem系统)的开发过程,以及颜色特征的相关理论知识。
如:
颜色空间的选择,颜色特征的提取,相似度的计算,图像检索技术。
第一章首先介绍了图像检索的研究意义,然后简介了国外的一些图像检索系统,最后探讨了本课题的研究意义。
第二章概述了基于颜色特征的图像检索的相关理论知识。
讲述了颜色空间,重点分析了RGB、HSV这2种颜色空间,颜色特征的提取,颜色直方图,相似度量的理论。
第三章论述了本图像检索系统的功能设计,主要有CxImage类库,系统组成,系统框架,数据库的设计,Feature类的设计
第四章论述了系统的功能实现,实现了ImageSystem图像检索系统的各个功能。
第五章分析图像检索系统的性能评价方法,最后对ImageSystem系统中的各个颜色空间作出性能评价。
论文最后进行了总结,并阐述了下一步的工作方向。
第2章基于颜色特征的图像检索
在图像的形状、颜色、纹理等特征中,颜色特征是最显著、最可靠、最稳定的视觉特征,是人识别图像的主要感知特征。
相对于几何特征而言,颜色对图像中子对象的大小和方向的变化都不敏感,具有相当强的鲁棒性。
同时,在许多情况下,颜色是描述一副图像最简便而有效的特征。
人们对于一副图像的印象,往往从图像中颜色的空间分布开始。
所有这些都促使颜色成为基于内容的图像检索所采取的主要手段之一[6]。
在本文中将重点论述和研究颜色特征。
对于基于颜色特征的图像检索,科学工作者们提出了许多方案。
譬如颜色直方图、主色调、颜色矩(ColorMoments)、颜色集(ColorSets)、聚类、扫描线投影等检索算法。
颜色直方图是目前较常使用的检索方法。
本文选择了图像的颜色特征作为研究对象。
相对于基于内容的图像检索技术,基于颜色特征的图像检索还涉及到颜色模型和颜色直方图。
2.1颜色空间
图像颜色特征的表达涉及到如下三个方面的问题:
一是选择一个合适的颜色空间;二是将颜色特征量化成向量形式;三是定义一种相似度(距离)标准用来度量不同图像之间在颜色上的相似性。
对彩色图像检索的研究,必须在特定的颜色空间中进行,实际应用中常用的颜色空间很多,有RGB、YIQ和HSV等等。
对于颜色空间的构造需要满足三个要求:
完备性(Completeness),颜色空间应能描述人能感知的所有颜色;
一致性(Uniformity),即颜色在空间度量的差异和感知的差异相吻合;
唯一性(Uniqueness),颜色空间中颜色在感知上彼此不同。
目前常用的颜色空间可分为两类,一类面向诸如彩色显示器或打印机之类的硬设备,另一类面向以彩色图像处理为目的的应用。
面向硬设备的最常用的颜色空间是RGB颜色空间,而面向彩色图像处理的最常用颜色空间是HSV颜色空间。
颜色空间的表示有很多种模型,在本毕业设计中使用了HSV颜色模型,YUV颜色模型,RGB颜色模型,XYZ颜色模型,HSL颜色模型,YIQ颜色模型,以及分块加权的HSV颜色模型。
在本文中将重点讨论RGB颜色模型和HSV颜色模型。
其他颜色模型的相关介绍可参见本人所写的开题报告。
RGB颜色模型:
这个模型如图2-1所示,对应于笛卡尔坐标系统,三个轴分别为R、G、B,见下图所示。
原点对应于黑色,离原点最远的点对应于白色。
在这个模型中,从黑到白的灰度值分布在从原点到离原点最远顶点间的连线,而立方体内其余各点对应不同的颜色,可用从原点到该点的矢量表示。
为了方便,假定所有的颜色值都已被标准化,这样所有的R、G、B值都在区间[0,1]中。
图2-1RGB彩色空间立方模型
根据这个模型,每幅彩色图包括三个独立的基色平面,或者可以说分解到三个平面上。
反过来如果一幅图像可以表示为三个平面。
HSV颜色模型:
HSV(hue,saturation,value)颜色空间可以看作是倒置的圆锥体,长轴表示亮度,离开长轴的距离表示饱和度,围绕着轴的角度表示色调。
灰度色调沿着轴线从底部到顶部由黑变到白。
具有最高亮度、最大饱和度的颜色位于圆锥体顶面的圆周上。
Androutsos等人通过实验对HSV颜色空间进行了大致划分,亮度大于75%并且饱和度大于20%为亮彩色区域,亮度小于25%为黑色区域,亮度大于75%并且饱和度小于20%为白色区域,其它为彩色区域。
HSV颜色空间反映了人观察彩色的方式,同时也有利于图像处理。
HSV颜色空间有两个特点:
其一,亮度分量与图像的彩色信息无关;其二,色调和饱和度分量与人感受颜色的方式是紧密相连的。
这些特点使得HSV颜色空间非常适合于借助人的视觉系统来感知彩色特性的图像处理方法。
HSV颜色空间直接对应于人眼色彩视觉特征的三要素,通道间各自独立,其中色调尤其影响人类的视觉判断。
HSV颜色空间各个分量在视觉上彼此无关,空间距离符合人眼视觉特征,从RGB到HSV的转换简单快速。
而且,HSV颜色空间的量化结果可以产生符合视觉特征的维数较小的颜色空间,有助于颜色特征查询的应用。
所以我们选取HSV颜色空间进行彩色图像检索研究,根据色调、饱和度和亮度三个分量的直方图匹配来确定图像的匹配度量。
RGB与HSV颜色空间的相互转换
HSV颜色空间是RGB空间的变换过来的,常用的HSV空间于RGB空间变换如下:
(2-1)
(2-2)
(2-3)
(2-4)
(2-5)
如果S=0,H不定义,否则
,
,
,
其余情况
再将H分量乘以60,转化到角度。
HSV颜色空间反应了人观察彩色的方式,具有两个显著特点:
其一,亮度分量与图像的彩色信息无关;其二,色调和饱和度分量与人感受颜色分量的方式是紧密相连。
这些特点使得HSV模型非常适合人的视觉系统来感知彩色特性的图像出来算法。
2.2颜色特征的提取及表示
图像是信息的载体,颜色是图像的重要内容。
在许多情况下,特别是对自然景物来说,颜色是描述一幅图像的最简单有效的特征要素。
例如,在需要检索海滨景物图像时,指定了图像中重要颜色的大致比例后,如蓝色对应海水,黄色对应海滩,即可以此为依据查找颜色分布类似的图像,其中包含有沙滩图像;而对于草原风景图像的检索,则可以通过指定图像以绿色为主色调的特征,来有效的检索包含草原图像的图像集。
以上两种情况,也正是目前CBIR系统中颜色特征采用的主要两种形式:
颜色的空间直方图和图像的主要颜色。
由于颜色特征所具有的优点,几乎所有CBIR系统都将颜色作为重要视觉特征,参与内容提取与匹配。
在QBIC系统中,颜色是最有效的检索特征;在Virage系统中,颜色是缺省权重最大的检索特征。
颜色特征的提取与表示,是研究基于颜色特征的图像检索的重要内容,也是本章要讨论的问题。
利用颜色特征进行图像检索的关键之一是颜色特征的提取,图像的颜色特征可以是颜色特征在图像检索中的应用研究各种颜色的比例分布以及颜色的空间分布等。
众多学者提出了多种不同的颜色提取和表示方法,主要有颜色矩、颜色直方图法、累加直方图法、局部累加直方图法、量化直方图法、主色调直方图法等等。
在下面一节中将重点论述颜色直方图法。
2.3颜色直方图
利用颜色特征进行图像检索的关键之一是颜色特征的提取。
图像的颜色特征可以是各种颜色的比例分布以及颜色的空间分布等,目前大部分基于颜色的图像检索系统都采用颜色比例分布来获取颜色特征,这是颜色领域中的直方图。
颜色直方图是图像颜色特征最普遍的表示方法。
该算法的基本思想是将图像的不同归结为颜色直方图的差距,从而将图像的检索转化为颜色直方图的巨鹿计算。
具体做法是,在确定颜色空间的基础上,统计每种颜色分量的象素数占图像总象素数的比例,得到图像各种颜色分量的比例分布——直方图,如图2-2所示,最后把直方图作为图像的颜色特征进行图像检索。
图2-2颜色直方图计算示例
颜色直方图计算简单快捷,相对于集合特性而言,具有与生俱来的旋转不变性(rotation-invariance)和缩放不变性(scale-invariance)。
对大小、方向、物体移动和视点等不敏感而在基于内容的图像检索中得到了广泛的应用。
表示图像内容的一种直观方式是对象素的颜色的出现进行统计得到颜色直方图。
颜色直方图反映的是图像中颜色的组成分布,即出现了哪些颜色以及各种颜色出现的概率。
其函数表达式如下:
(2-6)
其中,k代表图像的特征取值,L是特征可取值的个数,
是图像中具有特征值为k的像素的个数,N是图像象素的总数。
Swain和Ballard[7]最先提出了使用颜色直方图作为图像颜色特征的表示方法。
他们还指出:
颜色直方图相对于图像的以观察轴为轴心的旋转以及幅度不大的平移和缩放等几何变换是不敏感的,颜色直方图对于图像质量的变化(如模糊)也不甚敏感。
颜色直方图的这种特性使得它比较适合于检索图像的全局颜色相似性的场合,即通过比较颜色直方图的差异来衡量两幅图像在颜色全局分布上的差异。
由于3D颜色空间的概率分布可视化比较困难,颜色直方图的表示一般用3个1D直方图来表示,各个通道是相互独立进行1D直方图统计得到的,即是3D分布在三个坐标上的投影。
3×1D颜色直方图是常用的简单的颜色信息提取和表示方法,其常用的颜色空间即前面给出的RGB和HSV颜色空间。
颜色直方图的主要性质有:
直方图中的数值都是统计而来,描述了该图像中关于颜色的数量特征,可以反映图像颜色的统计分布和基本色调;直方图只包含了该图像中某一颜色值出现的频数,而丢失了某象素所在的空间位置信息;任一幅图像都能唯一的给出一幅与它对应的直方图,但不同的图像可能有相同的颜色分布,从而就具有相同的直方图,因此直方图与图像是一对多的关系;如将图像划分为若干个子区域,所有子区域的直方图之和等于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 颜色 特征 图像 数据库 检索系统 开发