基于颜色特征的图像检索方法最终版Word文档下载推荐.docx
- 文档编号:22359867
- 上传时间:2023-02-03
- 格式:DOCX
- 页数:40
- 大小:605.29KB
基于颜色特征的图像检索方法最终版Word文档下载推荐.docx
《基于颜色特征的图像检索方法最终版Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《基于颜色特征的图像检索方法最终版Word文档下载推荐.docx(40页珍藏版)》请在冰豆网上搜索。
Content-BasedImageRetrieval(CBIR).
CBIRisatechniqueforretrievingimageonthebasisofautomaticallyderivedvisionfeature.TherearefourfundamentalbasesforCBIR,i.e.visualfeatureextractionandrepresentation,similaritymatching,multi-dimensionedindexing,andretrievalsystemdesign.Nowadays,CBIRisthemainsupporttechniqueforalotofapplicationdomains,suchasdigitallibraries,multimediainformationsystems,medicaldatabases;
etc.Itiscurrentlyaveryactivetopicinimagedatabasesandmultimediainformationretrieval.
Color,asimportantvisualinformation,hasplayedaveryimportantroleincontent-basedimageretrieval.Thispaperhavediscussedthreekeyquestionsonhowtomakeuseofthecharacteristicofcolor,whichincludedexpressingcolor,obtainingthecharacteristicofcolorandmeasuringthelikenessbasedoncolor.Itquantifiescolorsectorwithequalinterval,andgetcharacteristicvector.Finally,itmatchedthesimilarityofimagewiththedistancefunction.
Thepaperholdscertainreferentialvalueandpracticalsignificanceinpromotingthedevelopmentofretrievaltechniqueofimagedatabase.
Keywords:
ContentBasedImageRetrieval,Color,CBIR
第一章绪论
1.1基于内容的图像检索的研究背景
随着计算机软硬件和国际互联网技术的飞速发展,多媒体数据的数量也以惊人的速度增长。
各行各业有越来越多的信息通过图像的形式进行表达,这些图像中包含了大量有用的信息。
但是这些图像松散的分布在世界各地,缺少有效的组织,难以达到资源共享的目的。
因此如何利用如此众多的图像信息并从中定位感兴趣的材料,是对图像信息的查询技术提出的重大挑战。
在信息的组织、管理和检索方面,传统上应用最广泛的是数据库技术,它采用基于关键词的检索方式,这对于处理结构化比较强的文本、数值信息效果比较好,然而,它对于图像和视频这些视觉信息的检索却具有相当大的局限性,这是由视觉信息自身的特点决定的,它们与传统的文本、数值信息相比具有如下的特点:
[1]
1)非结构化特性。
在传统的文本、数值数据库中,记录信息具有明显的结构特性,它是现实世界中对象间关系的反映,可通过实体——关系模型抽象得到。
与此相比,图像和视频对象具有较强的非结构化特性,许多多媒体信息以流的形式存在(例如视频流),这种媒体想要得到它的信息,必须对它先进行结构化处理,而这种结构化不能通过简单的抽象来完成,而需要相应的媒体分割和组织技术。
2)内容多义性。
在传统的文本、数值数据库中,每一个记录所包含的语义确定而且有限。
而对于像图像或视频这样的多媒体对象来说,具内容往往对不同的用户、不同的应用具有不同的解释,即具有多义性的特点,这样其内容就很难通过有限的属性来充分描述。
此外,对多媒体对象的检索一般都是内容相似程度的检索——即查找内容描述与检索要求最接近的对象。
这就要求建立的内容描述支持内容相似性程度的比较,这是在传统的文本、数值数据库中广泛采用的定性描述所不能满足的。
在1970年以后,随着数据库管理和计算机视觉两个领域的飞速发展,图像检索技术(ImageRetrieval)的研究成为热点。
由于图像检索在这两个领域的不同应用,所以它们采用的研究方法也各自有所侧重。
数据库管理领域的研究采用基于文本(text-based)的图像检索方法,而计算机视觉领域则偏重于基于视觉(visual-based)的图像检索。
基于文本的图像检索,主要在数据库领域中进行研究,它的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。
但是,基于文本的图像检索存在很大困难,尤其是图像的数据量非常大的时候,其一,手工对图像进行注释所需的工作量太大;
其二,许多图像很难用文字的方式进行描述;
其三,不同的人对同一幅图像的理解不一样,即使同一个人对同一幅图像在不同环境下理解也不完全相同,这样使得对图像的描述不唯一,造成检索结果的千差万别;
其四,由于世界上存在许多语种,采用不同的语言文字对图像进行描述而建立的索引在应用中造成了一定的障碍。
因此基于文本方式的图像检索存在很大的局限性。
基于内容的视觉信息检索旨在对视觉信息提供强有力的描述,实现视觉信息的结构化,最终达到用户对这些视觉信息内容自由访问的目标。
它是一门涉及面很广的交叉学科,包括:
信号处理,图像处理,机器视觉,数据库,信息检索,模式识别等相关技术。
近十年来,基于内容的图像检索和视频检索是当前最活跃的研究热点之一。
每年都有相关的国际会议召开,如SPIE的StorageandRetrievalforImageandVideoDatabases,ACMMultimedia等,而且许多国际上的知名杂志都发表了相关内容的专刊,如:
IEEEComputer,IEEETrans.onPAM1,PatternRecognition,ImageandVisionComputing。
目前,国内外很多研究机构都在进行相关的研究工作,并取得了很多令人瞩目的成就。
如;
IBM的QBIC,UIUC的MARSI,CMU的Infomedia,MIT的Photobook等,国内的主要研究单位有:
中科院联合实验室、中科院自动化所国家模式识别实验室、清华大学、上海交通大学等。
1.2基于内容图像检索的主要应用[2]
CBIR己经成功地应用于一些专门领域.典型应用领域包括:
1.搜索引擎:
随着各种电子商务网站的发展,图像搜索引擎将成为这些网站的重要工具。
2.家庭用图像检索:
数码科技使得普通家庭也会产生成千上万的图像,家庭图像检索系统将是家庭PC的一个基本工具。
3.数字图书馆:
数字图书馆实际上是一个数字信息资源库,其中有字符数值库、文本库、声音库、图像库等。
因此,如何快速、高效地从数字图书馆中找出用户所需的信息就成为现代图书馆研究的热点和关键技术之一。
4.商标检索系统:
可在收录了己注册商标的数据库中查找是否有与注册商标类似的,防止商标权受侵害。
5.法律及公安:
它是图像数据库技术的一个重要应用领域。
典型的例子有:
面部数据库、指纹数据库、犯罪纪录数据库以及建筑物保安数据库等。
我国在“人脸”及“指纹”数据库建立方面已做了不少工作,并有一批实用性的成果投入应用。
6.邮票资料库:
主要用于邮票资料的管理与查询,也可以提供邮票鉴定等更高级的应用服务。
7.教育与培训:
在教育与培训领域,例如远程教学、交互式培训、自学教育及雇员再教育等有着广阔的应用前景。
国外在培训系统领域已投入了大量的经费,开展了相关课题的研究工作。
我国多媒体教学研究工作也已经开展,网上教学与辅导已进入实用阶段,这些都为图像数据库应用于教育培训领域提供了广阔的前景.
8.工业与商业:
工业应用包括企业多媒体信息系统、CAD/CAM等:
商业应用有电子商务、在线广告、在线购物、股票等。
9.保健及医疗:
图像数据库在该领域中应用范围很广,除了专用的图像管理与检索系统外,还包括建立多媒体医疗信息管理系统,将庞杂的医疗数据管理起来.这些数据包括病历、病人的图像信息(如X光片、CT扫描及MRI照片等)以及描述手术过程的视频信息等。
它为现有的医学系统带来了一场革命,其中最有前景的应用是远程医疗(Telemedicine)、远程外科手术(Tele-surgery)及远程诊断(Tele-diagnoses)等。
1.3国内外典型系统介绍
1.3.1国外研究成果
虽然当前对CBIR的研究还很不成熟,但是作为商业软件包的图像检索系统已经问世。
在网络上的演示版本也相应出现。
基于内容检索的图像数据库的典型代表主要有以下几个:
1.QBIC图像检索系统
QBIC[3](QueryByImageContent)图像检索系统是IBM公司90年代研制开发的图像和动态影像检索系统,英文原意是“依靠图像得内容进行查询”。
它主要为IBM的DB2大型数据库提供图像检索功能,并支持基于Web的图像检索服务。
它是标准的基于Content-based技术的图像检索系统,用户无需提供文字检索词,只要输入以图像形式表达的检索要求即可检索出一系列相似的图像。
它提供多个图像数据库供检索试验,例如美国1995年以前发行的邮票图案,世界著名商标,旧金山美术博物馆图像数据库,法国文化部图像数据库,可视化图书馆等。
2.ImageRover系统(图像漂泊者系统)
ImageRover是基于万维网的图像导航器,用户使用点击小图标的方法查询到自己所需图文信息。
ImageRover内部成功运用了Content-based技术,特点是通过HTML(HypertextMakeupLanguage)文件将可视化信息和文本信息统一起来。
它由文件采集子系统和图像检索系统两部分组成.
(1)ImageRover文件采集子系统
文件采集子系统中,运用自动采集索引机器人(Robot)技术,定期采集Web文件,Web服务器也可主动向ImageRover提供图文信息。
文件采集的基本原理与一般搜索引擎相似。
当采集到网页后,系统将分析网页图文内容,分离图像和文本信息,对图像进行特征分析和抽取,将特征索引存储在工mageRover的检索系统中。
(2)ImageRover图像检索子系统
ImageRover进行查询的步骤是:
客户机终端输入查询图像,查询服务器分析特征和语义后送入索引生成服务器进行对照,索引生成服务器将最优结果指令传输给数据库服务器,客户即可得到数据库的答复。
3.VisualSeek和WebSeek
VisualSeek系统是万维网图像/影像检索工具,研制者JohnRSmith毕业于哥伦比亚大学电子信息研究中心,一直致力于Content-based技术开发研究,创造出一系列成果,例如VisualSeek,WebSeek,SAFE和CBVQ等,VisualSeek提供一系列搜寻和检索万维网视图信息的工具。
WebSeek实际上是这些工具中的一种。
VisualSeek的技术内核与其他Content-based检索系统相似。
比较其他多媒体信息检索系统,VisuaISeek的优点在于:
高效率的WEB图像信息检索,采用了先进的特征抽取技术,用户界面强大,操作简单,查询途径丰富,结果输出画面生动,支持用户直接下载信息。
在VisualSeek的众多工具中,WebSeek具有较强功能和特色,其本身就是一个独立的万维网可视化信息编目工具,已经对650000幅图像和10000个影像片断进行了编目。
用户可使用目录浏览和特征检索方式进行图像检索。
1.3.2国内研究成果
国内的一些高校和研究机构也注意到这个研究方向的巨大潜力,已经开始了这方面的研究,开发了一些原型系统,而成熟的商品化应用系统还很少。
浙江大学1995年开始进行多媒体图像检索的研究,分别完成了基于图像颜色和基于图像形状的原型系统[4]。
在此基础上,又在Soralis系统上开发了新的多媒体检索系统。
其总体设计思想是允许用户找到包含特定颜色、纹理和形状的图像,它支持基于关键字、全局颜色、全局纹理、对象形状、颜色布局、纹理布局等的查询。
中国科学院声学研究所开发的图像检索系统ImageHunter[5]基于纹理和颜色特征对图像进行检索,并且对这两种图像特征的综合检索进行了实现。
此外,系统还加入用户反馈,通过反馈信息对参数进行不断调整以得到更佳的效果。
南京邮电学院也进行了这方面的研究,研制了基于纹理和颜色特征的实验系统[6]
1.4本文的研究内容及结构安排
本文对CBIR技术作了较全面的研究,重点研究了基于颜色特
征的图像检索方法,并用java语言设计实现了一个基于颜色特征的图像检索系统。
该系统包括图像处理,特征提取,相似性度量三大部分。
具体讨论图下面章节所示:
第一章绪论。
主要介绍选题的背景,意义以及基于内容的图像检索的应用和现有的研究成果。
第二章基于内容的图像检索技术。
主要讨论了基于内容图像检索的分类,特点,一般过程以及关键技术。
第三章基于颜色特征的图像检索方法。
主要介绍了基于颜色特征的图像检索的一些关键技术。
第四章基于颜色特征的图像检索系统的设计。
主要介绍了作者设计的演示系统的总体设计。
第五章基于颜色特征的图像检索系统的实现。
主要介绍了图像检索演示系统的总体结构,各模块的实现以及实验结果分析。
第六章全文总结与研究展望。
第二章基于内容的图像检索技术
近年来,基于内容的检索已经成为一个研究热点,并成为多媒体数据库、数字图书馆等重大研究项目中的关键技术。
所谓基于内容的图像检索(CBIR,Content-BasedImageRetrieval),是指直接根据图像媒体对象内容进行的各种特征检索,它能从数据库中直接找到具有指定特征或含有特定内容的图像,它区别于传统的基于关键字的检索手段,融合了图像理解、模式识别等技术。
2.1图像检索的分类[7]
图像检索可根据检索系统提供给用户的查询方式分为:
(1)相关查询用户没有特定目标,查询是通过浏览非限定图像源来寻找感兴趣的东西,进而查找类似图像。
由于这类查询通常利用相关反馈技术来对查询和结果进行优化,因此具有高度交互化的特点。
(2)目标查询即特定图像的查询,检索的目标可以是用户印象中的某一图像,也可以使具有相同目标物的其它图像,还可以是根据用户迭代指定的一组图找出的最相似图像。
(3)范畴查询查询指定类型的任意代表图像,用户可能已有一幅或一组图像,而查询的目的就是得到别的同类图像。
图像类别可根据图像标记得到也可直接来自数据库。
该类查询通常是根据相关领域注定的相似性来定义迭代优化检索结果。
图像检索还可根据所利用的图像特征将图像查询分为如下三个层次:
(1)第一层次对于图像简单特征,如颜色,纹理,形状或图像要素的空间位置的查询,由于这一层次检索使用的特征不带有主观性,可直接从图像中得到,因此不需要任何外部知识。
(2)第二层次对于图像个体特征(通常为局部特征),如检索某目标或者人物的查询,由于这些特征包括对于所要识别目标某种程度上的逻辑推理,因此需要外部知识的辅助,以说明如何定义类型和目标物。
(3)第三层次对于图像抽象属性的查询,包括:
检索有关某个事件或者某类活动的图像等,如检索包含某种感情或信仰的图像等,由于抽象属性包含对于目标或者场景所代表含义,目的的描述及更高层的推理,因此通常需要通过复杂推理与主观判断来讲图像内容与抽象概念联系起来。
按照检索时所基于的不同颜色特征,又可将基于内容的图像检索技术分为如下四种类型,它们分别是:
(1)基于颜色特征的检索
(2)基于纹理特征的检索
(3)基于形状及区域的检索
(4)基于空间约束关系的检索
2.2基于内容的图像检索的特点
基于内容的图像检索旨在对图像信息提供强有力的描述,实现视觉信息的结构化,最终达到用户对这些视觉信息内容自由访问的目标。
具有如下特点:
(1)直接从图像媒体内容中提取信息线索。
(2)基于内容的图像检索实质上是一种近似匹配的技术。
(3)整个过程是是一个逐步逼近和相关反馈的过程
2.3基于内容的图像检索系统的一般结构
图像检索系统一般由两个子系统构成,库生成子系统和查询子系统,库生成子系统主要以离线的方式工作,而查询子系统提供在线的图像检索功能。
库生成子系统完成的主要功能是图像预处理和特征提取。
图像预处理包括对入库前的图像进行的一系列处理,如图像压缩格式转换、色彩空间转换、滤波、图像比例调整等。
基于内容检索是建立在图像视觉特征提取的基础上的,特征提取是库生成子系统的核心模块,它主要完成图像视觉特征的提取,包括对图像的颜色、纹理、形状以及一些文本描述特征提取。
图像查询子系统完成基于内容的检索功能。
由查询接口、结果浏览器、检索引擎三个模块组成[8]。
图像检索的一般过程为:
首先通过图像库生成子系统生成图像特征库及图像库,此操作可以脱机执行;
然后用户通过查询接口进行参数设置,包括显示的图像的数目,用户感兴趣的图像特征以及一些阙值;
在用户提交了检索请求(如范例、草图)后,检索引擎主要是完成图像的相似性匹配工作,并按照相似度的大小对图像进行排序;
最后结果浏览器主要用来显示查询的结果;
一个典型的图像检索系统结为:
图2.1图像检索系统结构图
2.4基于内容的图像检索的关键技术
以图像的特征作为索引,对静态图像进行检索是目前使用最多的方法。
对于静态图像,其用于检索的特征主要有颜色、纹理和草图(sketch)、形状等,其中颜色、形状和纹理特征的应用较为普遍。
主要思想是根据图像的颜色、纹理、图像对象的形状以及它们之间的空间关系等内容特征作为图像的索引,计算查询图像与目标图像的相似距离,按相似度匹配进行检索。
正如图2.1所示,要设计一个好的CBIR系统,所涉及的关键技术包括:
图像检索的表达、图像特征的提取、图像特征的相似性度量以及图像检索的判别标准等。
[9]
2.4.1图像检索的表达
图像特征包括视觉特征和统计特征两类。
视觉特征范围内,通常将其进一步细分为两类:
全局特征(Generalfeature)和细节特征(domain-specificfeature)。
前者包括颜色、纹理和形状,具有直观意义;
后者是基于应用的,包括诸如人脸、指纹等局部和细节特征;
统计特征基本上无直观意义,它们是对图像象素与纹理特征的统计,如颜色直方图和频谱等。
图像的视觉特征,除了包含颜色、形状之外,同时还包含纹理和子对象空间位置关系等。
即使是同一种视觉特征,也有多种不同的表达方法,以便从不同的角度模拟人类感知的主观性。
图像的这种多特征性和特征表达的多面性,给图像检索的表达带来了一定的困难。
一种灵活有效的检索表达机制将是影响图像检索效率的重要因素之一。
现有图像检索系统的检索表达机制十分简单,仅对多特征检索融合进行了一些探讨。
如IBM的QBIC系统采用的单特征检索结果取交集的方法、Virage公司的Virage检索系统采用通过对不同单特征空间距离赋以权重,形成总特征空间复合距离的检索表达方法等。
在实际的图像检索中,用户往往需要表达更加复杂的检索要求,现有图像检索表达机制的能力难以满足这种复杂检索要求的需要。
随着图像检索的进一步深入,开发出一种灵活有效的检索表达机制来表达用户复杂的检索要求将显得十分必要[10,11]。
这种表达机制要能够充分反映用户的检索要求,并将用户的检索要求转换为底层索引的查找操作。
对图像检索表达机制的研究,将是图像检索中需要面临的一个重要的挑战。
2.4.2图像特征提取
图像特征提取的好坏,将直接影响着图像检索系统的性能,特征提取是基于内容的图像检索的基础。
特征的提取可以分为手工提取、半自动提取和自动提取。
这在很大程度上依赖于图像处理技术的发展。
从图像中提取出来的图像特征,主要分为三个层次:
低层次、中层次和高层次。
低层次的图像特征是形状、纹理、颜色、轮廓等图像某一方面的特征。
这些特征各自相对独立,与数学联系较为紧密。
中层次的图像特征是指将图像的特定区域或者干脆是图像中包含的目标物体作为图像的索引,用于图像的检索。
高层次的图像特征是在图像中层次特征基础上的再一次抽象,它赋予图像一定的语义信息,是图像所包含内容的一种抽象概括,也是基于内容的图像检索所要达到的最终目标。
在这三个层次的图像特征中,低层次的特征提取是基础,并且由于其不需要人工的干预而被广泛的应用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 颜色 特征 图像 检索 方法 最终版