基于内容的图像检索中多维索引技术研究Word格式文档下载.docx
- 文档编号:19013649
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:6
- 大小:21.86KB
基于内容的图像检索中多维索引技术研究Word格式文档下载.docx
《基于内容的图像检索中多维索引技术研究Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《基于内容的图像检索中多维索引技术研究Word格式文档下载.docx(6页珍藏版)》请在冰豆网上搜索。
1多维数据及多维数据索引结构的特点所渭多维数据.是指多维空间中的数据。
例如二维空间中的点、线段、弧线、矩形,i维空间的球、立方体以及多维空间中的点数据等。
严格来讲,空间数据库包括带有对象的外在属性、对象的扩展以及对象在空间的位置的多维数据。
这些对象的描述都是用矢量格式进行的。
多维数据被视为特殊的数据.一般来说.具有特点12・71:
复杂的结构、动态的特性、数据的海量、多样化的操作、时间代价大、不能排序。
正是由于多维数据具有和传统数据不一样的特点.所以要求图像数据库的索引结构也相应具有以下一些特征131:
(1动态性:
对空问数据目标的处理常常包括一些诸如插入和删除等操作.这就要求访问方法的设计和维护必须考虑索引结构的动态特点。
(2二级/三级存储管理:
尽管主存容量口益增大。
但仍不能将整个数据库保存在主存里.索引结构也有可能会很大.凶此索引结构应该充分考虑到二级及三级的存储管理提高效率。
(3支持尽量多的操作:
不能以牺牲其他的操作来支持某种特定的操作.而且应该能保证操作的并行性和可恢复性.
(4简单性和鲁棒性:
复杂的访问方法可能有时在某一方面的性能优异,但付m的代价却是计算量大、易于出错且往往鲁棒性较差。
这样的结构川在大型系统里一般不如简单、鲁棒性强的结构更为实用。
(5高效性:
一方面要求索引方法对于空间数据的检索比较快;
另一方面.又希望索引范围相对于整个数据库比较小.即搜索窄间小。
存储利用率高。
(6最小的影响:
李间索引方法与数据库系统的融合应对现存系统产生最小的影响。
2多维数据库的查询方式
多维空间数据索引的一个重要环节就是要选取一
收稿日期:
20LO一03一08修稿日期:
20LO-04—08
作者简介:
王猛(1986-,男,陕西商洛人,硕士研究生。
研究方向为多媒体分析、处理和检索
@现代计算机2010.05
万方数据
竺兰竺竺//
个好的查询方法。
通常情况下,多维窄问数据的查询操作主要还是依赖于其不同的应用领域来定义。
查询结果一般是卒问数据目标的集合。
下面介绍五种常用的多维空间数据查询方式14・61:
(1精确匹配合询(ExaetMatchQuery:
对于给定的查询数据q,从数据库中找出所有与a相同的数据。
(2点查询(PointQuery:
给定对象q。
从数据库巾找出所有包含点q的数据。
(3区域查询(RegionQuery:
绘定一查询区域,找出所有和查询区域:
占至少一个公共点的空间目标。
区域查询有町以细分为:
①相交查询(IntersectionQuery:
给定具有一定形状的空间数据q,从数据库中找出至少包含q中一点的所有数据.
②包含查询(EncloseQuery:
给定查询对象q,从数据库中找出所有包含对象q的数据。
③被包含杏询(ContainmentQuery:
给定查询对象q,从数据库中找出所有被a包含的数据。
④相邻查询(AdjacencyQuery:
给定查询对象q。
从数据库中找出所有与q邻接的数据。
(4范匍查询(RangeQuery:
给定查询对象q和查询半径r.从数据库中找出所有与q的距离小于r的数据。
(5k一最近邻查询(kNearest—NeighborQuery:
给定查询对象q及正整数k,从数据库中找出距离q最近的k个数据。
当k=l时,又称为“最近邻查询”。
3六种有代表性的索引结构【3・5・7】
(1R-Tree
R—Tree是B—Tree在多维空间的扩展.是一种对应空间矩形层次嵌套结构的动态平衡树.许多其他数据索引方法都是在R树的基础上演变m来的。
R—Tree使用最小包含矩形(MinimalBoundingRectangle,MBR来近似表达空间目标.由于R-Tree的构造基于几何意义上的覆盖关系.它只限于以欧氏距离作为相似度量的检索.它具有以下的一些性质【4l:
①如果用max和min(min≤(max/2分别表示一个节点node中可存放的项的数目的最大值和最小值.则除了根节点之外,每个节点中必须含有『min,max]个项,根节点中至少包含两个项,除非它是叶子节点;
②节点中每个项的结构为(rect,pointer,rect是其子节点中所有数据的MBR。
在非叶子节点中,pointer指向的是孩子节点:
在叶子节点中,pointer指向实际数据存放的位置:
③所有的叶子节点出现在同一层E。
R-Tree是一种性能比较好的索引结构.它是按数据来组织索引结构的.使其具有很强的灵活性、可调节性。
无须预知整个空间对象所在的空间范围,就能建立空间索引。
它足高度均衡的。
能够较容易地进行插入和删除操作及快速查找数据。
具有与B—Tree相似的结构和特性,使其能很好地与传统的关系型数据库相融合。
R—Tree的MBR之间允许重叠.那么在维数较高时很可能会导致索引次数和存储空间的大量增加.严重影响查询效率。
(2R宰—Tree
R—Tree在结点的插入和分裂过程中.中间结点间产生了重叠。
随着索引夺间日标数量和R—Tree的深度逐渐增大.中间结点目录矩形的重叠迅速增长.致使整棵R—Tree的重卺急剧增加。
当进行空间检索时。
失败查找路径也会增长、扩散.这必然导致R—Tree的查找性能随着宅问数据量的增加而急剧下降。
为解决这一问题.人们对R—Tree提出了很多改进.派生了一系列索引,R木一Tree便是其中重要的一种。
R,Ic—Tree主要针对R-Tree修改了的插入和分裂算法.并引入强制重捅机制:
且在选择插入路径时同时考虑了结点的重叠度、结点所覆盖的区域和MBR的形状.而R—Tree只考虑结点所覆盖的区域。
因此。
R宰一Tree大大减少了MBR之间的重叠区域的大小.在一定程度上提高了搜索性能。
但是R木一Tree中存在的多条路径查找依然是制约检索性能的瓶颈。
(3X-Tree
X—Tree是R幸一Tree的改进.支持多维数据有效查询过程的索引结构。
目标是不仪支持点数据,也支持扩展窄问数据.它主要通过采用引入超结点概念和最小重叠分裂结构来实现动态组织目录.从而改进R掌一Tree结点重叠的问题。
即高度重叠的数据用线性组织.而较少重叠的数据以层次化组织。
因此.X—Tree索引就具有线性数组目录结构和层次化的R_Tree目录的优点。
实验表明。
对于维数高于16的矩形数据来说.X—Tree检索性能一般超过R木一Tree两个数量级。
现代计算机2010.05
囝
\\、竺竺!
(4四叉树
四叉树是属于基于空间划分组织索引结构的一类索引机制。
与R树系列不同的是。
将已知范围的空间划成四个相等的子空间。
如果需要可以将每个或其中几个子空间继续划分下去。
这样就形成了一个基于四叉树的空间划分。
四叉树是一种递归式的数据结构。
当图像是方形的且像素点的个数是2的整树次幂时.四叉树最合适。
四叉树的根节点对应于整幅图像。
叶节点对应各单个像素或具有相同特性的像素组成的方阵.所有的点可分为三类:
目标节点、背景节点、混合节点。
同R树相比,四叉树可用顺序存储的线性表来表示索引.内存需求量小,可以在内存中实现。
插入和删除操作更加简单、方便。
有利于查询速度的提高。
但是四叉树是一种非平衡树.在建立索引之前必须预先知道空间对象所分布的范围.可调节性比较差.而且当合询区域覆盖多个节点时.尤其不同父亲节点时.查询代价比较大。
(5K—D—B~Tree
K—D—B—Tree是K—D—Tree和B—Tree的结合.它通过递归地采用垂直于坐标轴的坐标平面对检索空间进行切割来构建树形索引结构.适用于大量多维点数据的动态索引。
它由两种基本结构组成.即叶结点(点页和非叶结点(区域贞。
根节点表示整个数据区域,非叶结点所代表的空间区域为它的所有子节点的区域之和.点页存储点目标。
每个叶子结点和内部结点都对应各自的空间区域.并存储到同一物理存储块。
K—D—B—Tree的最大特点就是在树的同一层所有结点对应的子空间是没有相互重叠的.那么从根到叶子的检索路径就足唯一的。
但这种空间分区方法易于产生空结点或包含很少数据的结点.当对节点进行删除时.一般采取节点重组的方法来提高空间利朋率。
当对空间块数据进行检索时.采用的分裂方法须对数据进行强制切割来降低存储空间的利用和相似检索的效率。
(6向量近似文件VA—File
VA—File是Weber等人提出的第一个基于VA的索引方法,采用紧凑的近似向量表示原始数据。
其原理是把n维数据空间划分为个矩形子空间.这样就可以把数据空间中的每一维都最化为一定数量的区间.可以用占空间很小的比特串来表示。
VA—File采用了顺序扫描的思想。
基于VA—File实
①
现代计算机2010.05现查询需经过两个步骤:
①过滤阶段,顺序访问整个VA—File.并根据特征向量的近似位串计算来过滤掉大量无用数据.保留候选者:
②需要访问原始特征向量精确计算得到K近邻查询结果。
由此可以看出.VA—File具有以下两个优点:
①由于特征向量的近似位串所需比特数远小于原始数据.在进行顺序扫描时磁盘的!
/O代价必然减少。
提高效率:
②多维数据分布的比较密集。
对数据直接进行顺序扫描有时会比扫描索引树有更高的效率。
4结语
索引技术是基于内容的图像检索中的一项关键技术,经过这儿十年的发展,虽然取得了比较大的进展,提出了许多索引方法。
但这些索引方法都有着各自的优势与不足.如何在现有的索引技术基础卜提出更有效的方法解决维数危机以及将多维索引技术应用在基于多特征的内容图像检索Web检索系统中仍是今后的发展趋势.
参考文献
[1】庄越挺,潘云鹤。
吴飞.网上多媒体信息分析与检索【M】.清华大学出版社.2002
【21梁晔,须德.基于焦点和角度的多维索引方法【J】.北京交通大学学报.2005
f31占毅.基于内容的图像检索巾索引技术的研究与系统实现【D1.重庆计算机学院,2006
141t飞龙.基于内容图像检索中索引技术的研究【D】.上海海事大学.2008
【5】曲吉林。
寇纪淞,李敏强.图像检索中索引技术研究叨.情报科学.2006
【6]GuttmanA.R-Tree:
ADynamicIndexStructureforSpatialSeprching[R].InProc.oftheACMSIGMODInd.Conf.onMan-agementofData,1984:
47—54
【7]cH.Cha,X.Zhu,D.Petkovic,eta1.AnEfficientIndexingMe-tIIodforNearestNeighborSearchesinHiish—Dimensionallm-ageDatabases[J].IEEETrans.Multimedia,Mar,2002
(下转第93页
竺竺,,/
DevelopmentandTeachingExplorationonTrainingCourseofIntegratedProjects
LIUXiao-hua
ZHANGXi-sheng
(SchoolofElectronicandInformationEngineering,ShenzhenPolytechnic,Shenzhen518055
Abstract:
Focusesonhowtoteachtrainingcourseofintegratedprojectsdevelopmentinschool,andputs
forwarditsownsolutionfromtheconceptofcurriculumdevelopment,teachingdesignandother
aspects.Proposesfivedevelopmentconceptsofwholeweektrainingcoursesforthefirsttime:
comprehensive,practicality,progressive,independentandpreview。
Themethodisidealforhigh・
ervocationalstudentswho
havepooracademicfoundationgenerally.Afterputtingthemethod
intopractice,itachievesbetterteachingresultsthanever.
Keywords:
TrainingCourse;
ASP.NET;
PracticeTeaching
(上接第80页
ResearchonMulti.——・DimensionalIndexingTechnologiesof
ImageRetrievalBasedonContent
WANGMeng,ZHANGMing
(CollegeofInformationTechnology,ShanghaiMaritimeUniversity,Shanghai200135
Imageretrievalbasedoncontenthasbeenreceivedgradually,andmuhi-dimensionalindexingis
akeytechnologyinimageretrievalbasedoncontent.Analyzestherelevanttechnologiesofmul—
ti—dimensionalindexing,includingdevelopmentstatusonmulti-dimensionalindexingtechnolo—
gies,characteristic,query
methodsofmulti—dimensionalindexingstructure,andfocusesonana—
lysisofseveraltypical
indexstructure.
Multi-DimensionalIndexing;
Multi-DimensionalData;
ImageRetrieval;
IndexingTechnology
现代计算机2010.05囝
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 内容 图像 检索 多维 索引 技术研究