一种基于谱图理论的Web图像搜索方法Word下载.docx
- 文档编号:13573659
- 上传时间:2022-10-11
- 格式:DOCX
- 页数:4
- 大小:18.94KB
一种基于谱图理论的Web图像搜索方法Word下载.docx
《一种基于谱图理论的Web图像搜索方法Word下载.docx》由会员分享,可在线阅读,更多相关《一种基于谱图理论的Web图像搜索方法Word下载.docx(4页珍藏版)》请在冰豆网上搜索。
对于基于链接的Web图像搜索引擎的研究目前尚处于起步阶段,针对如何将链接分析算法有效地应用于Web图像搜索有一些方案提出,并出现了一些对应的Web图像搜索引擎。
然而,目前这些方案的效果均不够理想,一方面是由于Web图像搜索本身就是一个难度极大的工作;
另一方面也可能是研究者尚未找到最适合Web图像信息的数据分析方法。
1Web图像搜索研究现状
研究如何在图像数据库中检索图像由来已久,这方面比较成熟的技术是基于内容的图像检索(CBIR),随着互联网上数字图像的急剧增长,如何对网页上的图像进行检索,即Web图像搜索成为研究热点。
当研究人员试图将CBIR的技术直接运用于Web图像搜索时,却遇到了一些难题。
一方面,即使在离线检索模式下(在线模式反应时间过长,一般不使用),图像数据库也是相当庞大的,对图像内容的处理及分析开销将使系统难以承担,同时在线等待的用户不能容忍等得太久;
另一方面,对于种类繁多的Web图像,用低层的图像特征很难准确表示图像的语义属性。
因此,一些基于内容的Web图像搜索引擎,如WebSeer[4]、ImageRover[5]、WebSeek[6]等,在直接针对互联网进行Web图像搜索时效果并不令人满意。
这类搜索引擎采用了很多传统图像检索系统(CBIR)中的技术,如特征提取、数据降维等,技术方法相对比较成熟,但由于上面提到的局限性,使其比较适合小范围的Web图像搜索(如特定网站内的图片搜索)。
与图像数据库中的图像不同,Web图像存在于网页中,伴随它的有许多附加信息,如图像周围的文字、图像的替换文本(alternatetext,ALT)、图像的URL等。
这些信息对于表示图像的语义属性具有重要的作用。
一些研究人员尝试建立基于相关文本信息的Web图像搜索引擎,如Lycos、Yahoo公司的ImageSurfer等,但这种搜索方式面临的一个问题是用于判定的信息为极为有限的文本,检索时将可能出现许多相关度相同的结果,对于结果的进一步筛选就会遇到困难。
为了解决这个问题,一些研究人员将文本搜索中普遍使用的HITS或PAGERANK等链接分析算法引入到Web图像搜索中,构建出基于链接的Web图像搜索引擎。
HITS或PAGERANK等链接分析算法均基于两个假设:
a)页面A如果有指向页面B的链接则表明页面A的作者认为页面B是有价值的,即页面A的重要性可以通过它指向的页面来衡量;
b)被同一页面指向的多个页面可以被认为属于同一语义主题。
在基于链接的Web图像搜索引擎中,与Web图像相关的链接(包括所在页面间的链接、页面区域间的链接等)分析将成为对其标注和排序的关键信息。
在此基础上,再结合前面提到的相关文本信息,这些信息的综合分析结果将表示图像的语义属性。
链接分析算法用于文本搜索已经被证明是有效的,但Web图像的特点与文本相比差异较大,如何将链接分析算法有效地用于Web图像搜索仍然有待进一步研究。
基于链接的Web图像搜索引擎的研究尚处于起步阶段,目前比较典型的例子是PicASHOW[7]。
2基于谱图理论的学习算法简介
谱图理论是微分几何领域的一个分支理论,最早关于这方面的研究可以追溯到古希腊时期的等周问题(isoperimetricproblems),但它作为一个相对独立的理论是1997年由FanChung提出的[8]。
该理论通过研究根据图定义的矩阵的谱,进一步研究图中包含的信息,最后通过微分几何、矩阵分析及线性代数等方法在离散空间与连续空间之间建立联系。
基于该理论的一些学习算法最近在机器学习、数据降维、智能信息处理等领域得到了较多的关注。
其中比较经典的算法包括LLE、Isomap、LaplacianEigenmap等。
这些算法的主要思想均是首先将离散的数据集设法表示为图的形式,然后用谱图分析的方法处理这些图的结构,最后将数据转换到连续空间从而完成数据的学习。
通过进一步的研究,发现这些算法在图像检索、文字识别、人脸识别、数据可视化等具体应用上表现出了比传统学习算法更佳的效果,国际上关于这方面的研究已经成为机器学习领域中的一个研究热点,而国内的周志华、王珏等学者也在这方面作了一些有益的研究[9,10]。
作者近年来针对LaplacianEigenmap算法的线性优化及在图像检索中的应用作了一些有意义的研究,比较有代表性的成果是在结合相关反馈技术的基础上,提出了用于图像检索的FLPP算法[11]。
该算法在用于基于内容的图像检索时能明显提高检索的准确度。
基于谱图理论的学习算法在某些应用领域已经表现出了优异的性能,而基于链接的Web图像搜索中最关键的工作就是根据链接、相关文本等信息对数量庞大的Web图像数据进行分类和标注,从本质上可以说是一个机器学习问题,而且,一些权威研究[12]也表明Web从数学上更适合表示为图的形式。
因而,如果根据谱图理论的研究成果,设计出适用于基于链接的Web图像搜索的排序及聚类算法,并在此基础上构建Web图像搜索引擎将是一项具有较大理论意义和应用前景的开拓性工作。
3基于谱图理论构建Web图像搜索引擎
基于谱图理论的学习算法研究已经取得了一些有意义的成果。
基于这些研究成果,本文提出了一种基于基于谱图理论构建Web图像搜索引擎的方案。
该方案的要点如下:
a)在离线状态根据包括页面间链接、用户日志等信息将海量的Web图像构建成一个Web图像结构图;
b)设计基于谱图理论可以分析海量数据的学习算法,有效地对Web图像结构图进行处理分类;
c)设计基于谱图理论的相关反馈算法,将用户反馈用于调整Web图像结构图的权重,从而在用户搜索时返回最佳?
┙峁?
;
d)利用Web图像结构图便于实现语义聚类的优势,实现返回结果的聚类显示。
要真正实现上述方案具有较高的难度,尽管已经有一些关于谱图理论学习算法的研究作为基础,但完全基于谱图理论构建Web图像搜索引擎的研究尚处于探索阶段,要取得实质的进展,笔者认为尚有如下几个关键问题有待研究:
a)高维空间的最近邻搜索问题。
到目前为止,这仍然是一个国际性的难题,但是这个问题对于图像搜索有着直接的关键性的影响。
当进行基于谱图的Web图像搜索时,Web图像将被表示为一个点,由于与Web图像相关的链接、用户日志及文本等其他信息量很大,数据点的维度将可能达到好几百,甚至上千。
根据目前的研究现状,最好的高维空间最近邻搜索算法能处理的维度一般都是小于100的,因此,传统的高维空间最近邻搜索算法将不能直接应用于Web图像搜索。
可以从两个途径尝试解决这个问题:
(a)提出新的高维空间最近邻搜索算法,使其能够处理高达几百维的数据;
(b)直接应用成熟的基于谱图的数据分析算法,降低数据的维度,然后再进行搜索。
国际上对于利用成熟谱图分析算法进行剧烈数据降维已经有了一些有意义的研究,因此按上面提出的第二个途径解决该问题把握较大,但这种途径的缺点是会产生一定的计算开销,虽然这些计算可以在离线状态进行,但对于任务繁重的Web图像搜索系统仍有一定影响。
如果按上面提出的第一个途径解决该问题,虽然国际上这方面的相关研究很少,但如果能取得进展,将不会有额外计算开销的产生,从而将为Web图像搜索中的高维数据搜索问题找到更佳的方法。
b)如何构建Web图像结构图。
目前基于链接的Web图像搜索引擎(如PicASHOW[7])一般都是直接利用Google等文本搜索引擎中得到成熟应用的PageRank、HITS等链接分析算法来分析图像所在页面间的链接,再结合相关的文本信息,从而标定图像的语义属性。
该方法的缺陷:
(a)PageRank、HITS等链接分析算法并不直接适用于Web图像搜索,因为图像的含义本身就比较复杂,单纯用文本或相关度评分过于简单,并不能准确标定Web图像的语义属性;
(b)不适合检索结果的聚类处理。
为了解决这些问题,借鉴谱图理论的一些研究成果,可以尝试利用Web图像的链接信息,Web图像周围的文字信息(surroundingtext)以及用户日志(userlogs)等信息建立Web图像结构图。
根据谱图理论,Web图像结构图应按权图形式构建,图像作为图中的节点,与图像相关的页面间链接以及文本信息均由节点间的权来体现。
虽然上面对于如何构建Web图像结构图有了初步的方案,但具体的权图构建方法,包括各种因素的比重如何确定等细节问题将是本项目研究的关键问题之一,尚有待于后续研究中通过大量的实验分析确定。
当Web图像结构图建立后,就可以利用谱图分析的方法来处理该结构图,从而最终标定Web图像的语义属性。
c)设计有效的基于谱图理论的Web图像排序算法。
传统的文本搜索引擎和现有的基于链接的Web图像搜索引擎均用相似性度量来标定页面属性后再实现搜索结果的排序。
应用谱图理论进行排序与传统方法中直接用相似性度量的最大区别是:
基于谱图的排序是在整个图(graph)上同时进行的,而相似性度量则可以分别对每一个对象处理。
用相似性度量进行排序的最大优点是排序的计算开销极小,缺点是用于图像排序时过于简单,难以表示图像间复杂的语义关系;
而基于谱图进行排序的最大优点是按谱图理论构建的Web图像结构图可以较好地表示图像间复杂的语义关系,但缺点是通过谱图进行排序将产生一定的时间(计算)及空间(数据存储)开销。
因此,设计基于谱图的排序算法时的关键是如何降低算法的时间和空间复杂度,以适应Web环境中的大规模计算,这也是本方案需要解决的关键问题之一。
目前国际上对于谱图排序的一些研究已经表明,基于谱图进行排序在某些应用领域具有更佳的效果,这方面比较有代表性的成果参见文献[13]。
本方案也以此为基础,再结合作者研究基于谱图理论的传统图像检索系统时一些成果[11],从而设计出适合Web图像搜索的排序算法。
d)如何实现Web图像搜索结果的聚类。
基于相似性度量的搜索方法很难直接实现返回结果的聚类显示,但基于谱图的搜索方法在这方面却很容易实现,这是因为根据谱图中数据点的几何分布很容易直接进行相对准确的聚类划分。
目前基于谱图的聚类算法很多,比较有代表的算法是斯坦福大学A.Ng等人提出的谱图聚类算法[14]和宾夕发尼亚大学J.Shi等人提出的NormalizedCut算法[15]。
在对现有谱图聚类算法进行深入分析的基础上,针对Web图像搜索结果返回的一些特点(如聚类区别非常明显、用户反馈可以提供指导作用、系统计算负荷大等),找到一种适合Web图像搜索的谱图聚类算法也将是本方案需要解决的一个关键问题。
对于该问题,笔者注意到基于谱图的排序和聚类在数学原理上是一致的。
如果通过使用一些数学技巧同时得到排序和聚类结果,就使得聚类算法与前面提到的谱图排序算法在某种程度上结合起来,从而大大降低系统的计算开销。
4结束语
基于链接的Web图像搜索引擎使用文本搜索中普遍使用的HITS或PAGERANK等链接分析算法对图像进行分类和标注,在表达图像的语义属性方面具有一定的优势。
对于基于链接
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一种 基于 理论 Web 图像 搜索 方法