数据网格环境下的元数据分发技术研究硕士学位论文 精品Word文档格式.docx
- 文档编号:15883757
- 上传时间:2022-11-16
- 格式:DOCX
- 页数:41
- 大小:438.38KB
数据网格环境下的元数据分发技术研究硕士学位论文 精品Word文档格式.docx
《数据网格环境下的元数据分发技术研究硕士学位论文 精品Word文档格式.docx》由会员分享,可在线阅读,更多相关《数据网格环境下的元数据分发技术研究硕士学位论文 精品Word文档格式.docx(41页珍藏版)》请在冰豆网上搜索。
Major
ComputerSoftwareandTheory
Supervisor
Prof.LuYansheng
HuazhongUniversityofScienceandTechnology
Wuhan430074,P.R.C.
January,2007
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。
尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。
对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。
本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名:
日期:
年月日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:
学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。
本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
保密□,在________年解密后适用本授权书。
本论文属于
不保密□。
(请在以上方框内打“√”)
学位论文作者签名:
指导教师签名:
日期:
年
月
日
摘要
伴随着Internet网络规模的飞速增长,在计算密集型和数据密集型应用领域,传统的分布式计算和并行处理技术已不能满足高性能分布式处理和分布式海量存储管理的需求,于是网格技术应运而生。
数据网格(DataGrid)的概念来自于网格,它是网格技术在数据管理方面的应用和实现。
数据网格环境下的数据访问过程依赖于资源发现,而资源发现即为发现对数据资源进行描述的元数据,网格环境下网络资源频繁变化,相应的元数据变化也很频繁,而如何能更加快捷有效地获得所需要的元数据,就需要各个节点能够将各自的元数据快捷有效地分发到网络中的其他相关节点,这取决于元数据分发策略的实施。
现有的元数据分发策略基本可以分为两类:
被动分发和主动分发。
主动元数据分发具有很高的准确性,但是却会占用很多网络资源;
被动元数据分发具有低代价性,但是却很难保证元数据的准确性。
轮值会议元数据分发(RotatingMeetingMetadataDissemination,RMMD)以轮值会议召开的方式来进行元数据的分发,并采用了HLA(HighLevelArchitecture)数据分发管理中采用的数据过滤机制,它兼具了主动元数据分发的准确性和被动元数据分发的低代价性,能快捷有效的完成元数据在整个网格中的分发,让整个网格的元数据在较短的时间内、用较小的代价得到较好的配置。
通过模拟仿真实验将RMMD策略与主动元数据分发策略、被动元数据分发策略进行比较,实验结果显示RMMD策略可以有效的分发整个网格中的元数据,提高分发的准确性,并保证分发的低代价性。
关键词:
数据网格,元数据分发,轮值会议
Abstract
Withtherapidgrowthofinternetnetworkscale,thetraditionaldistributedcomputationandparallelprocessingtechnologyhasn’tmettheneedofthishigh-powereddistributedcomputationanddistributedmanagementforlargememoryinthedomainofcomputation-denseanddata-denseapplication.Asaresult,gridtechnologycameintobeing.Datagridofisthegridtechnology’applicationandrealizationindatamanagement.
Theprocessofdataaccessinginthedatagriddependsonresourcediscoverywhichfindsoutthemetadatathatdescribessource.Fortheresourceingridfrequentlychanges,thecorrespondingmetadatachangesalot,too.Togettherequisitemetadataquicklyandeffectivelyrequiresthateverynodecoulddisseminateitsdatatoothercorrespondingnodesquicklyandeffectively,andthisliesontheimplementofmetadatadisseminationstrategywhichisclassifiedaspassiveandactive.Activemetadatadissemination(ACTMD)hasgreatveracitybutitoccupiestoomuchnetworkresource.Passivemetadatadissemination(PASMD)haslowcostbutithardlyensurestheveracityofmetadata.
RotatingMeetingMetadataDissemination(RMMD)disseminatemetadatainthewayofrotatingmeetingconvocation,andadoptsthedatafiltrationmechanisminHLAdatadistributionmanagement.TheRMMDwhichhasboththebenefitsofveracityofACTMDandlowcostofPASMDcandisseminatemetadatainthewholegridquicklyandeffectively,andmakethemetadatainthewholegridgetbettercollocationwithlowercostinashortertime.ComparedRMMDwithPASMDandACTMDthroughsimulationexperiment,theresultsshowtheRMMDstrategycoulddisseminatethemetadatainthewholegrideffectively,increasetheveracityandensurethelowcostofdissemination.
Keywords:
DataGrid,MetadataDissemination,RotatingMeeting
目录
摘要I
AbstractII
1绪论
1.1研究背景
(1)
1.2国内外研究概括
(2)
1.3本课题研究的目标和意义(5)
1.4本文组织结构(6)
2数据网格中的元数据分发技术
2.1数据网格核心问题(7)
2.2元数据的提出(7)
2.3传统数据分发技术(11)
2.4数据网格中传统元数据分发技术(13)
2.5小结(15)
3轮值会议元数据分发机制
3.1背景介绍(16)
3.2轮值会议元数据分发的原理(18)
3.3轮值会议元数据分发的协议(19)
3.4小结(28)
4原型系统开发与仿真实验分析
4.1RMMD原型系统开发(29)
4.2实验环境OPNET(30)
4.3仿真模型(34)
4.4仿真算法(37)
4.5实验与性能分析(40)
4.6小结(43)
5总结与展望
5.1本文工作总结(44)
5.2展望(45)
致谢(46)
参考文献(47)
1.1研究背景
伴随着Internet网络规模的飞速增长,计算机网络技术和分布式技术得到了高速发展和广泛应用,许多科学计算领域,特别是计算密集型和数据密集型应用领域,对广域网环境下海量数字信息分析处理和协同计算能力的要求也越来越高[1]。
这类应用需要将分布在不同地理区域的高性能计算能力、超大规模数据集合和各种资源整合在一起,为分布在不同地理区域的用户提供服务。
传统的分布式计算和并行处理技术已不能满足这种高性能分布式处理和分布式海量存储管理的需求,于是网格[2,3]技术应运而生。
网格技术可以把分布在各地的计算机连接起来,实现计算资源、存储资源、数据资源、信息资源、知识资源、专家资源的全面共享,感觉如同个人使用一台超级计算机一样。
这种虚拟资源可以使相关人员迅速获得所需的数据访问和处理能力,帮助其进行计算密集型的研究和数据分析、解决复杂的业务问题。
这样,网格就可以帮助用户突破今天技术基础设施的限制。
对于传统网络环境,网格具有动态可变、异构、多域等特性。
网格计算作为新一代的分布式计算框架,与传统分布式系统的主要区别在于在没有集中控制的情况下,通过对计算资源进行大规模的共享,满足应用程序对高性能计算的要求[4],并且这种对计算资源的大规模共享是动态的、柔性的、安全的和协作的。
目前,在国内外网格也引起了极大的关注,如美国Argonne国家实验室研发的Globus系统[5,6]、欧洲数据网格DataGrid[7]、美国能源部的科学计算网格DOEScienceGrid、中科院计算所的织女星网格VEGAGrid[8]等等。
数据网格(DataGrid)源于网格,它是网格技术在数据管理方面的应用和实现。
它将地理上分布、异构的多种数据资源,通过高速互连网络连接并集成起来,屏蔽底层异构的物理资源,形成单一的逻辑视图,实现资源共享和协同工作,为用户提供虚拟的数据访问、数据存储、数据管理和处理环境。
其中,良好地表示、存储、访问和使用大量资源信息是数据网格运行的基本前提。
在数据网格计算中,资源是分布的,资源及其提供者也是分布的。
为了对网络资源进行有效的管理和检索,使目前有序和无序状态并存的网络资源能够像传统资源(如馆藏资源)一样有序化,从而使它们得到更好的利用,人们一直都在作着多方面的努力。
从早期的Archie和Gopher系统,到近期的搜索引擎和主题指南,都是这方面努力的成果。
历年实践表明,增加关于资源的额外信息或元数据(metadata)是更好地组织资源的基础,它能够提高相关资源被检索和存取的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据网格环境下的元数据分发技术研究硕士学位论文 精品 数据 网格 环境 分发 技术研究 硕士学位 论文