图像检索与数据库.docx
- 文档编号:5733062
- 上传时间:2022-12-31
- 格式:DOCX
- 页数:6
- 大小:74.66KB
图像检索与数据库.docx
《图像检索与数据库.docx》由会员分享,可在线阅读,更多相关《图像检索与数据库.docx(6页珍藏版)》请在冰豆网上搜索。
图像检索与数据库
西北工业大学
得分:
学号___________________________
姓名___________________________
考试课程___________________________
考试日期___________________________
图像检索与数据库
近年来,由于现代电子技术的发展,文字情报与文字情报一样,也能够经过数字化处理制成数据库用于计算机检索。
本文便是对图像数据库及其检索的初步探讨。
1、图像数据库
1.1图像数据库的类型
数据库一般分为文献参考数据库和源数据库。
前者本身并不直接提供用户所需情报,而是起着一种指示、介绍、牵线搭桥的作用;后者提供的是可供用户直接使用的一次情报。
显然图像数据库属于后一类型。
目前的图像数据库按照图像情报类型可分为三类,即图形数据库、照片数据库、绘画图案数据库。
图形数据库大多应用于自然科学、工程技术领域,收录的是用线条来表达概念的图形资料,包括设计图、配线图、住宅草图;地图(如地形图、地势图、道路地图、住宅地图、指路图;天气图等)。
照片数据库在图像数据库中占有主要地位,广泛应用于社会,人文科学和自然科学,工程技术各领域。
收录的主要内容有:
报纸照片;X光片、CT等医用诊断图;幻灯片;卫星照片、宇航照片等观测图;;资料照片、肖像、记录照片;商品广告用赠礼照片等等。
日本摄影研究中心的PhotoDiscLibrarySystem光盘数据库便属此类,它收录了日本著名摄影家的5万多幅彩色照片,极富观赏性。
绘画·图案数据库数量也在逐年增多,涉及的专业领域较多。
该类数据库一般收录绘画、插图、图案、CAD、注册商标、公共设施标志等。
如美国专利商标局的Trademackscan一federal数据库收录了几十万个有效、被废弃、去消或期满的商标,通过DIALOG系统为用户提供联机服务。
图像数据库虽属源数据库之列,但收录的内容不全是单纯的图像,实际上它是图表、照片、书目记录甚至全文的握合体。
图像数据库有以下几个特点:
1.输出内容具有视觉上的魅力;
2.文档编排方法简单;
3.减少情报传递中的语言障碍;
4.收录其他数据库不能收的情报;
5.图像可压缩;
6.避免图像原件(如名画、照片、标本等)年久劣化;
7.方便复制。
1.2图像的数字化处理
图像的数字化处理不是通过键人的方法,而是采用自动图像处理技术进行的。
生成数字化图像的设备有计算机、图像扫瞄设备等。
图像扫瞄设备将图像分割成很细的扫瞄线,继而将其分割成象素(图像的最小单位),并生成二进制的阵列,每个二进制数代表一个象索的亮度,所产生的二进制数据经过图像控制器的处理后存人载体中。
典型的8-1/2“xll”文件页,以每英寸30条扫瞄线扫瞄的话,黑白图像约需IMB的存贮容量;彩色图像所需的存贮容量则远远高于黑白图像。
若想存贮几万幅图像,可想而知存贮设备得有多大的容量才行,目前要做到这一点仍是不可能的。
实际应用中在不影响使用效果的情况下可以降低图像的精度(若要数字化图像完全代替图像原件使用。
尤其是照片、绘画作品等,需要很高的精度)。
上述黑白图像由于同页面中相同的数据较多(例如空白部分多),通常可以压缩十分之九,而彩色图像即使经过压缩仍需海量存贮装置。
所幸的是现在的磁、光存贮装置可以满足图像存贮对于容量的要求,尤其是CD一ROM光盘可以存贮一万枚经过压缩的图像。
在实际应用中,一般将光学字符识别和图像扫瞄结合起来使用。
如美国专利和注册商标局将专利中的文字以前者为手段转换成数字形式,而以后者为手段对专利中的图形进行数字化处理,并将处理过的图像存贮在光盘上。
2、图像检索
图像检索,从90年代以来,主要使用基于图像内容的方法进行图像检索,也就是CBIR。
即基于图像特征从大型数据库中检索出用户所需要图像。
CBIR现今常用的检索方法为基于低层的视觉特征(如:
颜色、纹理、形状、空间结构等)进行检索,当然也有更高层的基于图像语义特征的检索,但是应用的技术还很不成熟。
但不管是什么样的检索,这些特征提取的过程必须是计算机自动完成的。
2.1查询语言
查询语言是用于帮助用户检索的高级语言,是指各种操作的接口。
书目检索所采用的莱单、填空、SQL及自然语言都可用于图像检索。
菜单是由若干个可供用户选择的项目组成的表。
用户从屏幕显示的若干个可选项中进行选择,对无检索经验的用户特别方便。
这种方法可适用于选择项分级安排的系统。
填空是指用户用系统提示的关键词作为查找表达式,可以使用布尔逻辑和其它方法扩缩检。
为了便于不熟练的用户使用,常以菜单式,用户友好接口软件结合使用。
不少图像检索系统都采用莱单方式提供检索。
如日本东京海洋生物公园情报检索系统,该系统收录200种左右鱼类(91年10月)的文字和图像情报。
菜单提供海域、水槽、分类和名称四个选择项,每一选择项下又有若干下位选择项,检索者通过连续选择,即可获得所需海洋生物的图像。
如从海域角度检索叫红的鱼。
检索初期屏幕显示主菜单:
检索初期画面
1海域“选择根据生活,海域”
2水槽“选择放养的水槽”
3种类“根据生物种类选择”
4名称“根据生物名选择”
用手指轻触1,即进人“海域”
1海域
《世界地图》
1)东京的海
2)太平洋
选择1)进人“东京的海”
l)东京的海
《海域部分图》
(l)东京湾
(2)伊豆诸岛北部
(3)伊豆诸岛南部
选择(3)进人“伊豆诸岛南部”在这一层次的选择项上,出现许多生活于该海域的鱼类名称,选择红,即出现静止的该鱼图像,继而进一步提供有关该鱼的文字情报。
图像检索还可采用SQL(结构化查询语言)。
SQL与关系数据库配套使用,可采用布尔逻辑算符,通过使用find、Print等指令支持数据库的查找和其他操作,具有正规的、强有力的语法。
日本国立民族学博物馆照片幻灯片数据库(DatabascforPhotographsandslidesattheNationalMuseumofEthnology)采用的便是这种语言。
检索时使用莱单,屏幕上的检索卡上只有文字情报的项目名称,数据部分是空白的,由用户输入检索条件,实行检索时通过PC机将检索卡上的项目名称与用户填人卡中的字符串生成结构化查询语言的检索命令,再将期送人主机进行检索。
图像检索也可采用有一定限制的自然语言进行。
自然语言是最灵活的语言,系统分析提问的语法,辨认词类,识别文档,记录和字段名,并执行逻辑运算。
如DIALOG的TRADEMARKSCAN-FEDERAL文档,除了用人工语言外,也可以用复合词或图像说明语中的词进行自然语言检索,如STOOTSIE(w)POP?
ORT00TSIEPOP?
用商标复合词检索。
2.2平面图像检索
书目信息(如题名、责任者、解说词等提图像数据库不可缺少的组成部分,每个图像或多或少地带有相应的书目信息。
书目信息用文字的形式描述了图像的内部特征和外部特征,所以书目信息检索是最常用的图像检索方法。
不同的图像数据库其书目信息事项不尽相同。
以DIALOG的TRADEMARKSCAN一REDERAL为例,该文档每条记录包括商标、美国分类号、国际分类号、所有人姓名,商品或服务描述及有关该商标情况的其它信息。
许多记录还带有附加信息和历史数据。
该文档基本索引提供从商标名称检索的途径。
如作为完整词的字符串检索:
SROSE。
也可以用复合词在TX商标字段进行布尔逻辑检索:
S(ROSEANDEXPRESS)ORROSEEXPRESS?
。
而该文档的辅助索引则提供了近50个检索途径,如As=受让人,CL=美国分类代码,DS=设计代码,RN=登记号等。
用户只要知遣其中任一信息,便可采用相应字段检索。
2.3立体图像检索
人们在向他人描述立休形状时,一般使用语言或类似图。
图像检索时,人们也希望能采用这些方法。
但是要让计算机理解语言和类似图并不容易,如果有“中问媒介”将人们对三维的表达与计算机对三维的表达结合起来,就可以进行人机交流了。
现在除了通过书目信息检索立体图像外,又出现了新的检索方式,日本NTTHumanInterface研究所开发的立体形状检索系统以超二次函数做三维索引,用数学式子来表达三维物体。
通过上面的叙述我们对图像数据库以及检索有了一定的认识,下面再来看看当今世界国内外发展的情况。
1.国外研究发展现状
目前在国外比较成熟的各具技术特色的图像检索系统主要有IBM的QBIC,MIT的Photobook,哥伦比亚大学的VisualSEEK,ILLIONS大学的MARS。
(1)QBIC系统
QBIC是由IBM提出的、在基于图像检索领域应用最早的商用产品。
QBIC系统是基于图像的视觉内容,利用颜色百分比、颜色分布和纹理等特征进行检索,系统提出了多种查询方式,包括:
支持用户使用例子查询、用户素描草图查询、扫描输入图像查询、制定特征查询方式、用户输入动态影像片段和前景中运动的对象等查询方式。
颜色主要使用在(R,G,B)、(Y,I,Q)、(L*,a*,b*)等颜色空间的颜色真方图。
纹理特征主要是文献的描述方法;形状信息主要采用面积、图形度、偏心度等。
另外,QBIC系统还考虑到了高维特征的索引,采用R*树作为索引结构。
(2)Photobook
Photobook是MIT多媒体实验室开发的图像检索系统,Photobook有三个子部分,分别用于形状提取、纹理和面部特征。
因此,用户可以再这三个字部分中分别进行基于形状、基于纹理和基于面部特征的图像检索。
在Photobook的最新版本FourEyes中,Picard等人提出了把用户加入到图像注释和检索过程中的思想。
同事由于人的感知是主观的,他们又提出了“模糊集合”来结合人的因素。
实验结果哦表明,这种方法对于交互式图像注释来说非常有效。
(3)VisualSEEK和WebSEEK
由美国哥伦比亚大学开发的姊妹系统。
Visualseek和Webseek的主要特点是研究利用图像区域空间关系进行查询和压缩域提取视觉特征来进行检索。
系统中主要使用的特种是颜色特种和基于小波变换的纹理特征,并且使用基于Quad-Tree和R-Tree的索引结构以提高检索速度。
支持基于视觉特征及其相互之间的空间关系的检索。
Webseek主要是面向Web的搜索引擎,它包括3个模块,图像/视频收集,分类与索引和搜索,浏览和检索。
支持关键词检索,并使用用户相关反馈技术来改善检索结果。
(4)MARS
MARS是多媒体分析检索系统。
其特点是使用比较全面的图像底层特征,提供基于树结构的多特征组合检索。
检索时对各层特征分别采用相应的相似性度量方法,最后给出综合排序。
MARS系统是正式提出相关反馈的图像检索系统。
MARS系统实现了被称为标准背离方法的特征权重调整的方法的改进。
权重调整的方法试图通过调整各个特征、特征各维的权重来优化检索结果。
由于采用多方面的图像特征描述和相应的相似性度量方法,该系统可以提供比较复杂的检索功能,如可以通过布尔表达式进行组合查询,动态的组织和优化查询,提高检索效率。
2.我国研究发展现状
近几年来,我国基于内容的图像检索技术方面也取得较大的发展。
在国内,基于内容的图像检索系统主要有中国科学院计算机技术研究所智能信息处理重点实验室开发的基于内容的图像检索演示系统,Mires系统是一个综合利用高层语义特征和低层可视特征的图像检索系统。
它通过提取图像语义类别来表示图像高层内容,低层特征则集成图像的颜色、纹理、边缘特征。
中国科学院声学研究所开发的图像检索系统ImageHunter,主要是基于纹理和颜色特征对图像进行检索。
南京邮电学院研制了基于纹理和颜色特征的实验系统。
图像数据库系统由数据输入系统、数据表示与管理系统、数据检索与操作系统和应用系统四部分组成。
下面是一个图像数据库系统:
随着图像数据库的研究与开发,图像数据库技术的应用范围已从典型的文字模式识别、显微照片的分析发展到医学、遥感及各种工业领域。
实际应用的典型图像数据库系统有:
①日本东京大学为医学、遥感及工业应用开发的标准图像数据库系统SIDBA;②美国堪萨斯大学为陆地卫星遥感图像开发的集成图像数据库系统IMDS;③美国卡内基-梅隆大学为图像理解开发的多传感器图像数据库系统MIDAS。
通过对图像检索与数据库这门课程的学习,让我认识到图像数据库及其检索的重要性,作为一个新的领域,当然还有不少有待研究的问题。
如超二次函数三维索引描述概略立体形状效果较好,但是对于一些复杂形状的表现力不强。
因此还要研究概略开状以外更广范围的形状的数学描述。
又如图像数据库以光盘系统据多,联机系统较少,这种状况影响了时效性强的图像的及时检索。
通过学习,让我对它有了一个更新的认识。
我们现在需要做的就是通过更多的知识去认识,去分析,近而解决现实中遇到的问题,使图像查找起来更方便。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 检索 数据库