基于颜色特征的图像检索算法的实现毕业设计汇总文档格式.docx
- 文档编号:18941734
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:30
- 大小:397.24KB
基于颜色特征的图像检索算法的实现毕业设计汇总文档格式.docx
《基于颜色特征的图像检索算法的实现毕业设计汇总文档格式.docx》由会员分享,可在线阅读,更多相关《基于颜色特征的图像检索算法的实现毕业设计汇总文档格式.docx(30页珍藏版)》请在冰豆网上搜索。
1.2基于内容的图像检索的发展历史..................................1
1.3基于内容的图像检索的特点和主要应用............................1
1.4基于内容的图像检索的关键技术..................................2
1.5国内外研究现状................................................3
1.5.1国外研究现状................................................3
1.5.2国内研究现状................................................4
2基于颜色特征的图像检索方法.....................................4
2.1颜色度量体系.................................................4
2.2颜色空间......................................................5
2.2.1RGB颜色空间................................................5
2.2.2HSV颜色空间................................................5
2.2.3CMY颜色空间................................................6
3颜色特征的表达.................................................7
3.1颜色直方图....................................................7
3.2累加直方图.....................................................8
4图像特征的相似性匹配.............................................9
4.1距离度量方法...................................................9
4.2直方图的交集的方法............................................9
4.3欧式距离法....................................................9
5图像检索算法实现................................................10
5.1程序开发运行环境..............................................10
5.2程序检索逻辑...................................................10
5.3算法具体实现..................................................11
5.4实例演示......................................................14
6全文总结与展望..................................................15
6.1全文总结......................................................15
6.2展望..........................................................15
致谢..............................................................15
参考文献..........................................................16
英文摘要...........................................................16
基于颜色特征的图像检索算法的实现
计算机科学与技术专业学生XX
指导老师XX
摘要:
文章介绍了一种基于颜色特征的图像检索技术的算法并给出了程序实现。
首先介绍了基于内容的图像检索技术、发展历史及基于内容的图像检索技术的特点和主要应用,并在此基础上探讨了该领域所用到的一些关键技术。
文章着重探讨了图像的颜色空间、图像特征提取及图像相似性度量等内容,并利用matlab技术实现了一个简单图像检索的程序。
文章最后则对当前基于内容图像检索技术研究热点和今后的发展方向进行简单的阐述。
关键字:
基于内容的图像检索;
颜色特征;
颜色直方图;
相似度度量方法
1绪论
1.1基于内容的图像检索的概念
基于内容的图像检索[1](ContentBasedImageRetrieval,CBIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。
它利用从图像中自动抽取出来的底层特征,如颜色、纹理、轮廓和形状等特征,进行计算和比较,检索出符合用户需求的结果图像集。
目前图像检索系统技术实现的基础是对底层特征信息的计算和比较,也即是“视觉相似”。
1.2基于内容的图像检索的发展历史
图像检索技术的发展[2]可以分为两个阶段,第一阶段始于70年代,当时的图像检索是通过人工的标注来实现的,随着计算机技术和通信网技术的发展,特别是因特网的快速发展,图像数据的容量越来越大了,这种“以关键字找图”的方法越来越不适应检索技术的发展了。
由于图像内容的丰富内涵以及人们对图像内容进行抽象时的主观性不同的人对同一幅图像有不同的理解,这就引入了主观多义,不利于检索。
为了克服文本标注检索的弊端,90年代研究者提出了基于内容的图像检索,其方法是:
根据图像的颜色特征、纹理特征、形状特征以及空间关系等作为索引,计算查询图像和目标图像之间的相似距离,然后按相似度匹配进行检索,这种技术很大程度地利用了人们的视觉客观特性,避免不同人对图像主观理解的不同而达不到理想的搜索效果。
从研究方向的层面来看,基于内容的图像检索可分为三层:
第一层是根据图像的底层特性来进行检索,如颜色、纹理,形状等等,涉及图像信息处理、图像分析和相似性匹配技术;
第二层是基于图像对象语义,如图像中实体及实体之间的拓扑关系的检索,对象级检索技术建立在下层特征基础上,并引入了对象模型库、对象识别和人工智能等图像理解技术;
第三层是基于图像的抽象属性如行为语义,情感语义和场景语义的推理学习来进行检索。
需要用到知识库和更加有效的人工智能和神经网络技术。
这三个层次由低到高,与人的认知接近,下一个层次通常包含了比上一个层次更高级的语义,更高层的语义往往通过较低层的语义推理获得。
尽管经过了多年的研究,较为成熟的基于内容的图像检索技术目前仍处于底层水平,由于底层研究是上层研究的基础,为了给上层建立准确、有效的图像特征提取方法,底层的研究仍在不断的发展。
1.3基于内容的图像检索的特点和主要应用
基于内容的图像检索技术有以下特点[3]:
一是它突破了传统的基于表达式检索的局限,从媒体内容中提取信息线索。
利用图像内容特征建立索引进行检索,使得检索更加有效,适应性更强。
二是基于内容的图像检索是一种近似匹配,即按照某种相似性度量,比较图像特征间的差异度。
相似度较低的图像将作为检索结果返回给用户。
三是它是大型数据库的快速检索。
在实际的多媒体数据库中,数据量巨大,而且种类和数量巨大,因此要求CBIR技术快速地实现对多媒体信息的检索。
四是以相关反馈为有效手段。
为了提高检索的准确性,整个过程是个逐步逼近和相关反馈的过程。
用户的交互性增强了表达查询、评价查询结果和基于评价结果进行进一步检索的能力。
CBIR己经成功地应用于一些专门领域。
典型应用领域[4]包括:
(1)搜索引擎:
随着各种电子商务网站的发展,图像搜索引擎将成为这些网站的重要工具。
(2)家庭用图像检索:
数码科技使得普通家庭也会产生成千上万的图像,家庭图像检索系统将是家庭PC的一个基本工具。
(3)数字图书馆:
数字图书馆实际上是一个数字信息资源库,其中有字符数值库、文本库、声音库、图像库等。
因此,如何快速、高效地从数字图书馆中找出用户所需的信息就成为现代图书馆研究的热点和关键技术之一。
(4)商标检索系统:
可在收录了己注册商标的数据库中查找是否有与注册商标类似的,防止商标权受侵害。
(5)法律及公安:
它是图像数据库技术的一个重要应用领域。
典型的例子有:
面部数据库、指纹数据库、犯罪纪录数据库以及建筑物保安数据库等。
我国在“人脸”及“指纹”数据库建立方面已做了不少工作,并有一批实用性的成果投入应用。
(6)邮票资料库:
主要用于邮票资料的管理与查询,也可以提供邮票鉴定等更高级的应用服务。
(7)教育与培训:
在教育与培训领域,例如远程教学、交互式培训、自学教育及雇员再教育等有着广阔的应用前景。
国外在培训系统领域已投入了大量的经费,开展了相关课题的研究工作。
我国多媒体教学研究工作也已经开展,网上教学与辅导已进入实用阶段,这些都为图像数据库应用于教育培训领域提供了广阔的前景。
(8)工业与商业:
工业应用包括企业多媒体信息系统、CAD/CAM等商业应用有电子商务、在线广告、在线购物、股票等。
(9)保健及医疗:
图像数据库在该领域中应用范围很广,除了专用的图像管理与检索系统外,还包括建立多媒体医疗信息管理系统,将庞杂的医疗数据管理起来.这些数据包括病历、病人的图像信息(如X光片、CT扫描及MRI照片等)以及描述手术过程的视频信息等。
它为现有的医学系统带来了一场革命,其中最有前景的应用是远程医疗(Telemedicine)、远程外科手术(Tele-surgery)及远程诊断(Tele-diagnoses)等。
1.4基于内容的图像检索的关键技术[5]
目前,对于通用的静止图像检索,用于检索的特征主要有颜色(Color)、纹理(Texture)、形状(Shape)等,其中颜色、纹理、形状应用尤为普遍;
活动视频检索脱胎于序列图像分析中的技术。
本文主要研究对静止图像检索,其中数据库是专用的图像库。
对于目标图像和检索图像进行颜色空间转换、亮度图像的边缘提取和二值分割、提取目标区域的颜色特征。
颜色内容包含两个一般的概念,一个对应于全局颜色分布,一个对应于局部颜色信息。
按照全局颜色分布来索引图像可以通过计算每种颜色的像素的个数并构造颜色灰度直方图来实现,这对检索具有相似的总体颜色内容的图像是一个很好的途径。
局部颜色信息是指局部相似的颜色区域,它考虑了颜色的分类与一些初级的几何特征。
比如Smith等提出了颜色集合(colorset)方法来抽取空间局部颜色信息并提供颜色区域的有效索引。
运用颜色直方图进行检索有如下三种方式:
(1)指明颜色组成--该法需要用户对图像中的颜色非常敏感,而且使用起来也不方便,检索的查准率和查全率并不高,因此暂时不做进一步开发。
(2)指明一幅示例图像--通过与用户确定的图像的颜色直方图的相似性匹配得到查询结果,这是该课题研究方法的根本。
(3)指明图像中一个子图--分割图像为各个小块,然后利用选择小块来确定图像中感兴趣的对象的轮廓,通过建立更复杂的颜色关系(如颜色对方法)来查询图像,该方法是进一步优化检索的一个设想。
在颜色空间选取方面,最常用的颜色空间是RGB颜色空间。
通常,人们采用欧氏距离来刻画两种颜色之间的差异,RGB空间存在的一个严重问题是其中所计算出来的两种颜色之间的距离无法正确表征人们实际所感知到的这两种颜色之间的真实差异。
HSV空间比较直观并且符合人的视觉特性。
HSV颜色模型有两个重要的特点作为基础。
首先,V分量与彩色信息无关,其次H和S分量与人感受彩色的方式紧密相连,其中H分量尤其影响人类的视觉判断。
这些特点使得HSV模型非常适合基于人视觉系统对彩色感知特性的图像处理。
得到图像特征的统计直方图后,不同图像间的特征匹配可借助计算直方图间的距离来进行。
一般意义上直方图匹配方法有直方图相交法,直方图匹配法,欧氏距离法,中心矩法,累积直方图匹配法共6种。
本文重点讨论欧氏距离法,并将其作为系统编程实现的主要方法。
所以,颜色特征的图像检索关键技术路径如图1:
相似
度量
特征
提取
颜色
空间
图1颜色特征的图像检索关键技术路径
1.5国内外研究现状[6]
1.5.1国外研究现状
基于内容的图像检索技术是当前研究的热点,许多著名杂志如IEEETrans.OnPAMI、IEEETrans.OnImageprocessing等纷纷设专刊介绍该领域研究的最新成果,著名的国际会议如:
IEEEconferenceofCVPR、ACMconferenceonmultimedia等纷纷设立专题交流最新的研究成果。
各大研究机构和公司都推出了他们的系统:
(1)IBM的QBIC系统
IBM的QBIC是第一个商业化的基于内容的图像检索系统,它的系统结构包括图像入库、特征计算、查询阶段三部分,允许使用例子图像、用户构建的草图和图画、选择的颜色和纹理模式、镜头和目标运动和其他图形信息等,对大型图像和视频数据库进行查询。
它的系统框架和结构对后来图像检索系统具有深远的影响。
(2)新加坡大学和MIT媒体实验室的Photobook系统
该系统是用于交互式浏览和搜索图像库的工具。
图像在装入时按形状、纹理和人脸的面部外形三种特征自动分类,同时还能结合文本关键字进行查询,图像根据类别通过显著语义特征压缩编码。
(3)Virage公司的Virage系统
该系统是基于内容的图像搜索引擎,比QBIC更进一步,支持基于颜色、颜色布局、纹理和结构(对象边界信息)及这四个原子查询的任意组合。
VirageVirageEngine主要有3方面的功能:
图像分析、图像比较和图像管理,技术的核心是VirageEngine以及在图像对象层上的操作。
(4)美国哥伦比亚大学的VisualSEEK系统
VISualSEEK图像查询系统是一个可视化的图像特征搜索引擎,实现了互联网上的"
基于内容"
的图像/视频检索系统,它由四部分组成:
图形用户界面、服务器应用、图像检索服务器、图像归档。
在VisualSEEK中,整幅图的颜色分布使用全局颜色直方图,区域颜色的索引采用二进制颜色集的表达方法。
它采用基于小波变换的方法来表示图像的纹理特征。
1.5.2国内研究现状
相对国外而言,国内在这方面的研究起步相对较晚:
I.浙江大学从95年开始进行多媒体图像检索的研究,完成了基于颜色和基于形状的图像原型系统,总体设计思想是允许用户找到包含特定颜色、纹理和形状的图像。
II.中科院计算技术研究所开发了一个图像检索原型系统“ImageSeek"
,作为“中国数字图书馆示范工程”课题的一个关键技术。
该系统实现了基于文本、颜色、纹理特征的图像检索。
III.杭州贝尔研发的具有自主知识产权的智能图像检索系统,通过提取图像的颜色、纹理和形状等特征,实现了基于图像内容的快速智能检索,被列入2001年信息产业部重点科研计划。
2基于颜色特征的图像检索方法
2.1颜色度量体系
颜色度量体系[7](colorsystem),也叫做颜色制或者叫做颜色体制,实际上就是人们组织和表示颜色的方法。
组织和表示颜色的方法主要有两种:
一种是颜色模型,一种是编目系统。
颜色模型是用简单的数值方法描述所有颜色的一套规则和定义,可使人们方便地描述任何一种颜色,颜色模型通常用颜色空间描述,如RGB、CMY和CMYK,从这个意义上说,颜色模型和颜色空间互为同义词。
任何一种颜色都可用三种基本颜色按不同的比例混合得到,显示彩色图像用RGB相加混色模型:
颜色=R(Red百分比)+G(Green百分比)+B(Blue百分比)
颜色空间是表示颜色的一种数学方法,人们用它来指定和产生颜色,使颜色形象化。
颜色空间通常用三维模型表示,空间中的颜色能够看到或者使用颜色模型产生。
颜色空间中的颜色通常使用代表三个参数的三维坐标来指定,这些参数描述的是颜色在颜色空间中的位置,其颜色要取决于使用的坐标。
对于颜色空间的构造需要满足三个要求:
完备性(Completeness),颜色空间应能描述人能感知的所有颜色;
一致性(Uniformity),颜色在空间度量的差异和感知的差异相吻合;
唯一性(Uniqueness),颜色空间中颜色在感知上彼此不同。
2.2颜色空间[8]
2.2.1RGB颜色空间
面向硬设备的最常用颜色模型是RGB模型。
在RGB模型中,所有颜色都可看作是3个基本颜色,即红(R,red),绿(G,green)和蓝(B,blue)的不同组合。
将这三种颜色成分分别人为地分成0到255共256个等级,0表示没有刺激量,255表示刺激量达到最大值。
R、G、B均为255时表示白光,均为0时表示黑色。
这样,我们就能表示出256×
256×
256(约1600万)种颜色。
如图2所示,采用三维直角坐标系,红、绿、蓝为原色,各个原色混合在一起产生复合色。
绝大部分的可见光谱可以用红、绿、蓝R(、G、B)三色光按不同比例和强度的混合来表示。
在颜色重叠的位置,产生青色、洋红和黄色。
因为RGB颜色合成产生白色,它们也称为加色。
将所有颜色加在一起产生白色,也就是说,所有光被反射回眼睛。
加色用于光照、视频和显示器。
RGB颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。
(0,0,0)为黑色,(l,1,1)为白色。
正方体的其它六个角点分别为红、黄、绿、青、蓝和品红,需要注意的一点是,RGB颜色模型所覆盖的颜色域取决于显示设备荧光点的颜色特征,是与硬件相关的。
在显示屏上显示颜色定义时,往往采用这种模式。
图像如用于电视、幻灯片、网络、多媒体,一般使用RGB模式。
虽然RGB彩色模型被广泛应用于CRT设备显示彩色图像,但它并不是一个均匀视觉的颜色空间,不符合人对颜色的感知心理,而且,RGB颜色空间上的距离并不代表人眼视觉上的颜色知觉差异。
但在对彩色图像进行特征提取时,需要用数量来描述颜色的差别,因此需要用另一种符合人的视觉心理的视觉彩色模型来表示颜色。
图2RGB颜色模型
2.2.2HSV颜色空间
HSV空间是一种符合人类视觉感知特征的颜色空间,特别适合于人类肉眼对颜色的识别,因此被广泛应用于计算机视觉领域。
它把彩色信号表示为三种属性:
色调H(Hue)、饱和度S(Saturation)和亮度V(value),其中亮度又称LightneSS或Intensity,所以HSV空间还有HLS和HIS这两种叫法。
HSV模型的色调H表示从一个物体反射过来的或透过物体的光的波长,更一般地说,色调是由颜色名称来辨别的,如红、橙、黄、绿等,它用角度-180~180或O~360来度量。
亮度V是颜色的明暗程度,通常用百分比度量,O%为最暗的黑色,而100%为最亮的白色。
饱和度S指颜色的深浅程度,即在纯色中包含的白色光的成份。
例如同样是红色,也会因颜色浓度不同而分为深红色、粉红色和浅红色。
饱和度S也用百分比来度量,从浓度最小的O%到浓度完全饱和的100%。
色调H和饱和度S分量合起来定义了颜色的色度(Chromatieity)特性。
HSV颜色模型用Munsell三维空间坐标系统表示,其示意图如图3所示。
图3HSV颜色模型
Munsen颜色空间具有以下己经被人的眼睛所证实的特点:
(1)坐标之间的心理感知独立性(PereeptualIndependenee),即人可以独立感知各颜色分量的变化。
(2)线性伸缩性(LinearSealability),人眼可感知的颜色差异与HSV颜色分量的相应值上的欧几里德距离(EuelideanDIStanee)是成比例的。
因为HSV颜色空间根据色调H的值来区分不同的颜色,因此在HSV的三个分量中,H分量是尤为重要的,它可以很好地模拟人类对颜色的识别和记忆过程。
2.2.3CMY颜色空间
以红、绿、蓝的补色青(Cyan)、品红(Magenta)、黄(Yellow)为原色构成的CMY颜色模型,常用于从白光中滤去某种颜色,又被称为减性原色系统。
CMY颜色模型对应的直角坐标系的子空间与RGB颜色模型所对应的子空间几乎完全相同。
差别仅在于前者的原点为白,而后者的原点为黑。
前者是定义在白色中减去某种颜色来定义的一种颜色,而后者通过从黑色中加入颜色来定义一种颜色。
CMY模型以打印在纸张上油墨的光线吸收特性为基础,当白光照射到半透明油墨上时,部分光谱被吸收,部分被反射回眼睛。
理论上,青(Cyan)、品红(Magenta)和黄(Yellow)色素能够合成吸收所有的颜色并产生黑色。
因为所有打印油墨都会包含一些杂志,这三种油墨实际上产生一种土灰色,必须与黑色油墨混合才能产生真正的黑色。
将这些油墨混合产生颜色称为四色印刷。
减色(CMY)和加色(RGB)是互补色,每对减色产生一种加色,反之亦然。
如图4所示。
图4CMY颜色模型
认知科学及视觉心理学证明,人类不能像计算机显示器那样只使用RGB成分感知颜色,因此,选择一个适合于人类视觉特征的颜色空间可以改善检索效果。
由于在进行基于内容的图像检索时,查询要求往往是按照用户的主观视觉感受而发出的,因此在进行图像之间颜色差异的比较时,CBIR系统一般采用具有视觉一致性的颜色空间。
所谓视觉一致性,是指对两种不同的颜色,它们在颜色空间中坐标的距离与它们在观察者的颜色感知空间中的距离是大致相同的。
HSV空间具有这样的特性[9]。
因此本系统选用HSV颜色模型。
3颜色特征的表达
3.1颜色直方图
(1)颜色直方图的定义
颜色直方图[9]是颜色信息的函数,其核心思想是在一定的颜色空间中对图像各种颜色出现的频数进行统计,颜色直方图描述的是不同色彩在整幅图像中所占的比例,而并不关心每种色彩所处的空间位置,即图像的对象或物体。
它的优点就在于它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。
颜色直方图可以基于不同的颜色空间和坐标系,最常用的是RGB颜色空间,因为大部分的数字图像都是用RGB颜色
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 颜色 特征 图像 检索 算法 实现 毕业设计 汇总