本体模式分类研究综述.docx
- 文档编号:28117085
- 上传时间:2023-07-08
- 格式:DOCX
- 页数:18
- 大小:274.12KB
本体模式分类研究综述.docx
《本体模式分类研究综述.docx》由会员分享,可在线阅读,更多相关《本体模式分类研究综述.docx(18页珍藏版)》请在冰豆网上搜索。
本体模式分类研究综述
本体模式分类研究综述
李晓辉孙坦宋文
(中国科学院国家科学图书馆北京100190)
【摘要】本体模式分类是对其认识的最初阶段,也是本体模式应用的基础。
介绍了两种本体模式分类方式:
NeOn本体设计模式和E.Blomqvist本体模式,通过实例对具体模式类型进行了说明。
对二种分类进行比较分析,提出需要进一步研究的内容。
【关键词】本体本体模式本体设计模式本体模式分类
【分类号】G250
ReviewofOntologyPatternsClassification
LiXiaohuiSunTanSongWen
(NationalScienceLibrary,ChineseAcademyofScienceBeijing100190)
【Abstract】OntologyPatternsClassificationisthefirststageofunderstandingandthebasisofpatternsusing.Introducedtwokindsofontologypatternsclassification:
NeOnontologydesignpatternsandE.Blomqvistontologypatterns.Describeddifferentkind’stopologybyexamples.Comparedandanalyzedthetwoclassifications.ProposedOngoingandfuturework.
【Keywords】OntologyOntologypatternsontologydesignpatternsontologypatternsClassification
引言
本体模式是一套本体元素、结构或构建原则,用来解决具体的本体工程问题,可再次使用,以准确复制或改编的形式出现在某些本体集中,或者出现在将来的本体中[1]。
模式最初出现在软件领域,是编码的最佳实践,是人们面对同样的软件设计问题的经验总结,有了模式,就可以利用其他人实践经验的精华。
目前Web上发布有大量本体,通过Swoogle可检索到10,000多本体[2],本体复用的问题随本体数量的增加而被研究者所关注。
近年来,轻型本体的应用呈上升趋势,一些简单的本体,像FOAF,SKOS显示了潜在的便携性和持续性,被广泛的复用,这样的本体没有沉重的公理化,仅仅对一个数据集提供一个形式化的语义描述,可以更加容易的构建和复用本体;W3C推荐的本体语言OWL本身也具有局限性,无法保证利用它可以充分的描述本体,OWL只给出了逻辑语言的结构,但并没有给出如何使用它们来解决任务。
本体模式是可以复用的解决方案,减少不经过经验丰富专家来构建本体的模糊和武断性。
基于以上原因,以复用经验和解决方案为目的的模式思想进入本体设计的研究视野。
模式在知识工程中出现是上世纪90年代中期,并被软件工程的发展所驱动[3]。
随语义网和本体工程的涌现,模式作为可复用的设计问题的解决方案被应用于本体工程[4,5]。
2004至2005年间,W3C成立了本体工程和模式任务组(OntologyEngineeringandPatternsTaskForce OEP),并提出本体设计模式(OntologydesignpatternsODPs)及其复用,主要是关于逻辑模式,表达领域独立的建模问题的解决方案,用OWL语言描写[6]。
2008年,相似的倡议被NeOn项目提出,建立了ODPs社区,并不断的扩大,覆盖各种类型的本体设计模式,它是时下最大的语义Web本体模式社区[7]。
曼彻斯特大学也维护着一个ODPs目录,本体设计模式公共目录(ONTOLOGYDESIGNPATTERNS(ODPs)PUBLICCATALOG),这一公共目录主要收集生物知识领域的本体设计模式[8]。
本体模式的会议(WorkshoponOntologyPatternsWOP)已于2009和2010年召开了两次,WOP系列拓展了以前关于本体模式的研究范围,包括了所有与本体相关的模式设计和用于语义Web的知识工程[9,10]。
从2009年的本体模式的国际研讨会开始,相关研究渐多,基于模式的本体设计成为本体建设过程中一个重要的理念和方法。
本体模式分类是对其认识的最初阶段,也是研究和构建本体模式的基础,有了对本体模式一致的分类,就有了统一的词汇用语便于模式社区的讨论,方便研究者之间的交流和进一步的工作;其次,不同类型的模式在本体构建过程中的作用不同,全面深入的认识模式,也是正确利用模式的前提。
目前的研究共有三种分类方式,一种是NeOn的分类,一种是瑞典林雪平大学(Linköping)E.Blomqvist的分类,还有一种是曼彻斯特大学维护的一个本体设计模式仓储(这个目录只涉及到生物学领域,不能算是严格的本体模式分类)。
本文主要介绍前两种分类,并对其进行比较分析。
1NeOn的分类
NeOn(NetworkedOntologies)项目由4个欧盟机构参与,受欧盟第六框架计划资助,通过发展一套整合的方法来构建网络化本体,通过情境与模式构建实现现有本体的重构、映射、模块化、本体化,并将非本体资源重组为本体资源,旨在通过本体网络进行大规模语义应用,并发展了工具和相应方法。
NeOn研究了本体设计过程中模式的角色,研究模式的分类、创建、表达、工具等,构建了ODPs社区。
需说明的是,这里叫NeOn分类,因为这一分类出现在NeOn项目的报告中,但不完全包含在其报告中,有些内容来源于其它研究,但也是依据这一分类框架,在其基础上的进一步研究,这里统称为NeOn研究分类。
1.1NeOn研究分类框架
研究将本体设计模式(OntologyDesignPatternsODPs)按其在本体建设过程中的功能不同,分为如下六大类型:
内容ODPs(Content-ODPs)、结构ODPs(Structure-ODPs)、词汇-句法ODPs(Lexico-SyntacticODPs)、推理ODPs(Reasoning-ODPs)、表达ODPs(Presentation-ODPs)、通信ODPs(Correspondence-ODPs),以及它们的子模式[11]。
各模式之间的层次关系见图1。
图1NeOn的本体设计模式类型[11]
1.2内容本体设计模式(ContentOntologyDesignPatterns)
内容ODPs(Content-ODPs)是一个小本体,是本体设计中的基本建模成分,覆盖某一能力问题(CompetencyQuestionsCQ),为某一问题提供解决方案。
一个内容ODPs可以从现存的概念模型中重组,也可以从其他参考本体中抽取,通过移植(owl:
improt)能被直接复用。
但不是所有小本体都是内容ODPs,如果它不能回答能力问题,或不能允许相关的推理,如一个独立的类,或一列没有关系的类都不是内容ODPs[12]。
内容ODPs是逻辑ODPs的实例化或合成。
CPs解决领域建模问题,只影响特定领域,通常使用OWL作为形式化表达语言。
内容本体设计模式的分类。
内容本体模式分为通用的和领域的两个子类。
通用内容本体设计模式类似于通用本体的片段,解决某一CQ问题。
如:
参与模式(participationpattern),描述-状态模式(description-situationpattern),角色-任务模式(role-taskpattern),角色-实体模式(role-entitypattern),收集-实体模式(collection-entitypattern),集中-任务模式(collective-planpattern),计划-执行模式(plan-executionpattern),简单部分-整体关系模式(simplepart-wholerelationspattern),设计-人造物品模式(design-artifactpattern)。
[13]领域的内容本体设计模式与具体领域相关,类似于领域本体的片段,目前主要涉及到农业、渔业、生物领域。
其它的领域在ODPs仓储中极少[7]。
例:
“参数内容本体设计模式”(Parameter),一个表达概念参数的基本模式,只使用了简单的类和属性,属于通用的内容本体设计模式。
这一模式抽取自DOLCE本体,用UML图表示如下:
图2Parameter内容本体设计模式的UML图[14]
在这一模式中,有两个对象属性:
owl:
ObjectProperty:
hasParameter,isParameterFor;一个数据类型属性:
owl:
DatatypeProperty:
hasParameterDataValue;两个类:
owl:
ClassConcept,Parameter。
这是一个通用的模式,表达特定概念的参数。
内容本体设计模式,是对本体设计很有用的一种模式,因为它们提供了领域内问题的解决方案。
内容ODPs不需要依赖任何特殊表达语言,很适合语义WEB上本体和数据的重用和互操作的需要。
也是实现本体评价、匹配、模块化的工具,例如:
一个本体能通过出现的模式来评价(模式扮演着单元测试unittests的角色)。
内容ODPs方便本体映射和对齐,两个根据内容ODPs构建的本体能以更容易的方式映射。
1.3结构本体设计模式(StructureOntolgogyDesignPatterns)
结构ODPs(Structure-ODPs):
结构ODPs包括逻辑(Logical)ODPs和构建(Architectural)ODPs。
结构ODPs影响本体的整体形状,它的目标是“本体应该看起来像什么”。
逻辑ODPs是一种形式化表达,是OWLDL表达的一部分,用来解决表达性问题,它首先用逻辑语言表达,其次是内容独立。
目的是为了解决设计问题,因为目前的本体表达语言并不直接支持一定的逻辑结构,一个逻辑ODPs可以表达N元关系。
逻辑ODPs分为两种类型:
Logicalmacros:
逻辑宏,为逻辑表达的再利用提供直接的快捷模式。
Transformationpatterns:
转换模式,一种逻辑语言到另一种,逻辑模式影响结果,影响推理程序效率,用来解决复杂的逻辑表达问题。
逻辑ODPs实例。
在ODP社区中提交了10个逻辑ODPs,例如N元关系模式,在RDF和OWL语言中,一个属性是二元关系,一个二元关系经常用来连接两个个体(实例),或一个个体和一个属性值,然而,在某些案例中,把一个个体与更多的个体与属性值相连,这就叫N-元关系[15]。
如何表达这种关系,提出N元关系模式。
这一模式的目标是允许基于RDF具体化的,在最初的N元不同的属性关系之间能进行推理。
下图是N元关系的图型。
图3N元关系本体逻辑模式(N-AryRelationPattern)(OWL2)[16]
构建ODPs,目前在ODPs社区只有一个构建模式被提交,“查看继承模式”(ViewInheritance),解决对领域概念划分困难的问题,因为在表达概念抽象程度时,存在概念定义的复杂性和标准的多选择问题。
下图中Criterion_i:
这些类代表每个目标领域内概念可选的抽象标准;Ci_Class_x:
细化每个抽象标准;CiClass_xCjClass_y,Ci_Class_xClass_y:
这些类参与多个继承类,结合了来自不同的可选的抽象标准,对其细化。
图4查看继承本体构建模式(ViewInheritance)[17]
1.4词汇-句法本体设计模式(Lexico-SyntacticODPs)
词汇-句法ODPs(Lexico-SyntacticODPs):
语言结构或框架,定义为由一定类型的单词按着特定顺序组成的语言结构或框架,可以归纳或抽取文本表达的含义[11]。
模式把简单的逻辑和内容ODPs与自然语言句子联系起来。
目前在ODPs社区中提交的LSP,90%以上用英文来描述一些逻辑与内容ODPs,例:
一个LSP的名称是“LSODPs与两个类之间的等价关系相连(correspondingtoEquivalencerelationbetweenClassesODP),与逻辑ODP的两个类之间的相等关系相连(EquivalencerelationbetweenClasses)。
这一模式的实例如下:
NL表达:
Poisondartfrogsarealsoknownaspoison-arrowfrogs
LSP表达:
NP
1.5表达本体设计模式(Presentation-ODPs)
表达ODPs(Presentation-ODPs):
从用户的角度来考虑本体的可用性和可读性,来支持模式的复用。
包括命名(Naming)ODPs和注释(Annotation)ODPs。
命名ODPs包含为命名空间、文件、本体元素创建通用名称的惯例,提高人对本体的可读性和理解。
注释ODPs是提供注释属性或注释属性框架,目的是帮助用户提高对本体和本体元素的理解[11]。
捷克布拉格的OndřejŠváb-Zamazal2010年的博士论文“基于模式的本体匹配和本体对齐评价”,研究中,分类了命名模式、本体匹配模式、本体转换模式。
命名ODPs:
是一套为命名空间、文件、本体元素命名的一般规则习俗。
[19]其研究中主要关注本体实体的URI片段,研究把其叫做实体名字。
根据结构的复杂程度和底层(建模)语言作为标准,将命名模式分为单独实体模式(single-entitypatterns)和跨实体模式(cross-entitypatterns),单独实体模式与不同的实体类型相关,如类、对象属性、数据类型属性和实例;跨实体模式与结构相关,如类-子类对,互逆属性对等。
针对每一类明确不同的规则和习俗,如单独实体模式的通用命名规则如下:
针对命名使用的词汇、分隔符进行规定:
为了人和NLP工具都能理解,实体名字使用的术语应从人类语言词汇中选取,其次避免使用缩略语和俗语,OWL不鼓励使用分隔符,如下划线、连字符等。
在类命名模式(ClassNamingPatterns)规定中;规定了命名类的核心问题,如使用名词短语,尽量使用单数,还不要有太多的象征意义(token)等等。
命名模式,不仅用来设计本体,也可以进行本体评价,本体转换/匹配。
作用主要有两方面:
首先是作为最佳实践,被设计者在未来本体中应用;其次作为经验模式,协助自动分析现存本体。
未来的研究中,要扩展到本体的任何词汇部分,不仅是URI片段(如rdfs:
Label,rdfs:
comment),此外,还要建立元数据纲要,在ODP门户社区收集这一类型的模式(目前社区还没有收录这一类型的模式)这样会大大影响这一类型模式的研究和应用。
应用命名模式评价其他设计模式,尤其是内容模式。
图5命名模式的分类[19]
1.6通信本体设计模式(Correspondence-ODPs)
通信ODPs(Correspondence-ODPs):
包括重组ODPs和映射ODPs。
重组ODPs为设计者提供概念模型转换的问题解决方案,是一套从源模型到目标模型的转换规则。
源模型可以是本体,也可以是各种非本体资源,目标模型是一个新本体。
映射ODPs是指发现并建立相互映像的元素之间可能存在的语义关系,用于映射的三种最基本的关系是:
等于,包含,交叉。
在ODPs社区中,共提交了10个通信模式。
奥地利因斯布鲁克大学(Innsbruck)的F.Scharffe2009年的“通信模式表达”[20],研究将通信模式分为简单通信和复杂通信。
以通信模式(CorrespondencePatterns)作为本体对齐的一个新方法,通信模式为本体对齐提供模版,提出了本体通信模式的表达方式,并建立了一个通信模式库(见图6),来解决本体匹配问题。
根据投入通信的实体类型来组织和命名通信模式。
图6基本的通信模式类型[20]
通信ODPs(也叫对齐ODP,alignmentODPs)例:
ODP名称:
通过属性值对齐(Classbyattributevalue),至力于解决一个本体中的类等于另一个本体中的下位类,这下实例有一个指定的属性值,在类/属性/属性值之间建立映射。
把类限制到一个有特定属性值的实例,在两个范围原来不同的类之间进行匹配。
图7通过类的属性值的通信模式[21]
重组ODPs:
重组ODPs是一套用来从源模型中的元素到目标模型创建新本体的转换规则,用来重组本体的资源有分类表,叙词表,字典,放标签系统,关联数据等。
[22]目前在ODPs社区提交了12个重组模式,分别就分类表和叙词重组为本体提供建模最佳实践。
转换ODPs:
即两个本体模式之间如何进行转换,是一个三元组,
[19]
1.7推理本体设计模式(Reasoning-ODPs)
推理ODPs(Reasoning-ODPs):
推理ODPs是逻辑ODPs的应用,基于在推理机上完成的行为,获得一定的推理结果[11]。
未见对其进行深入研究,也没有相关模式被提交到ODPs社区。
不同的模式用来解决本体构建过程中不同的问题。
结构ODPs用来设计本体的逻辑结构。
内容ODPs用来设计本体内容。
结构和内容ODPs通常至力于实现本体元素和公理;词汇-句法ODPs用来连接自然语言和本体元素,一般会被有新手的本体设计团队使用,或建立本体的基础—文本集;表达ODPs用来命名本体元素或本体声明,如果本体的可用性非常重要,这时要用到表达ODPs;通信ODPs与建立本体网络相关,主要用于本体间的映射或重组各种类型的资源;推理ODPs介入一定的推理能力,定义一些推理服务并提供某种类型的信息。
2E.Blomqvist的分类
E.Blomqvist对本体模式的分类与NeOn的分类不同,从更宽的范围进行分类,而不仅仅局限于本体设计模式,还考虑了本体的应用。
2.1E.Blomqvist研究分类框架
E.Blomqvist研究的本体模式按如下三个成对的因素来描述:
抽取和建立;结构和内容;抽象程度和粒度。
提出4种本体模式。
本体句法模式、本体应用模式、本体构建模式和本体设计模式。
结构模式处理本体元素的逻辑结构,但不用来做本体元素的实际表达,一个结构模式是空的签名,即在设计水平没有实际命名的类和属性。
内容模式处理本体建模解决方案,因此有具体化的领域,领域范围依赖于本体的抽象水平,有类和属性等的命名;粒度这里涉及到模式的范围,是本体的一个小部分还是整个本体?
抽象程度是隐藏一些结构细节,为了方便描述结构的某一方面;抽取是指模式的构建方式是从其它本体或模式中抽取出来的,建立是通过人工从无到有仔细构建的。
图4E.Blomqvist本体模式类型[23]
2.2本体应用模式(OntologyapplicationPatterns)
本体应用模式致力于的问题:
本体的目标是什么?
它如何在软件系统中被应用?
本体应用模式按照目标、情境、界面等来描述已完成的本体如何被应用的通用方法。
本体应用模式是一种软件体系结构模式,该模式描述了利用本体来创建其功能的软件系统,还介绍了本体或系统中本体的属性,以及本体和系统其他部分之间的连接[23]。
这类模式关注于如何使用本体和提供功能,提供与软件模式的连接,主要是软件构建模式和参考构建,系统使用本体。
迄今为止,还没有本体的应用模式,但是有许多本体使用模型,这些模型显示了一个具体系统中的不同的本体如何相互作用相互依靠,它们可以抽象为本体应用模式。
2.3本体构建模式(OntologyArchitecturePattern)
本体构建模式致力于的问题:
本体由哪些部分构成?
如何构建它的结构?
本体是否应该划分为不同组分或模块?
或分为不同的层次,或使用其他构建原则?
涉及到本体整体结构。
本体构建模式是描述本体整体结构的模式,或用来约束要完成本体的设计模式,以完成本体的需求目标。
在构建水平有很大可能从其他领域获取经验,如一些软件构建模式也许能被本体社区利用,构建本体构建模式。
在这一水平上,不考虑本体的描述(概念和关系),也不考虑如何用逻辑语言实现本体[23]。
根据目前已知情况,还没有文献中提到这一分类方法中的本体构建模式。
2.4本体设计模式(OntologyDesignPatterns)
本体设计模式致力于的问题:
本体应该包含什么;哪些概念,关系和公理?
致力描述本体的设计和内容。
也就是个体需求如何在整体结构中被实现。
本体设计模式是一套本体元素,结构或构建原则,解决了清晰定义的特定的建模问题。
本体设计模式用逻辑本体建模语言在抽象的水平上描述了解决方案。
设计模式分为结构设计模式和内容设计模式。
结构本体设计模式是一个逻辑词汇,还有一个空的signature签名,解决具体的建模问题。
本体内容设计模式是一个或几个逻辑设计模式的实例,由一些本体元素组成,是非空的签名,结合起来解决具体的建模问题[23]。
本体设计模式的作用。
该模式致力于描述本体中通用的可再现的构建。
完成后可以构建成一个小的本体(或是一个组份或模块)。
这些模式可以自动或人工使用,模式必需足够具体,可以允许它们自动或半自动使用,同时,要足够通用,以便在一定领域的不同本体之间使用。
构建这些模式是从现存的本体中抽取本体,这种方法需要有足够的本体存在,如果某一领域没有足够的本体,就很难用这种方法抽取模式。
一种折中的方法是从其他领域已积累的知识中从抽取,如计算机领域中的许多模式也描述了某类知识,虽然它们最初构建的目标不是这个。
研究这类模式,把它们发展为本体模式是目前研究的一个重要内容。
2.5本体句法模式(OntologySyntacticPatterns)
本体句法模式至力于的问题:
本体在语句上如何构成?
至力于本体表达。
如,表达本体的逻辑语言,推理的效果,根据用户理解的可用性等。
如何命名概念和属性,或本体本身的命名。
本体句法模式是运用特殊的表达语言,来部分或整合实现其他本体模式[23]。
3两种分类比较
概念名称上的区别。
在术语上最大的区别是“design”。
NeOn把所有的模式都叫做“本体设计模式”,Blomqvist研究叫“本体模式”。
其次,即使有些模式名称相同或相似,表达的意义也不一致。
NeOn许多分类可以归为Blomqvist的一个类中。
Blomqvist研究的本体设计模式是一个更窄的范围,是与解决本体的逻辑设计相关的模式,即解决逻辑建模问题。
同样,本体构建模式也有些不同,Blomqvist关注于本体整体结构的模式,不关注逻辑表达,而在NeOn中,本体构建模式用来作为在设计水平的逻辑限制,关注一个完全本体。
在抽象程度上,两个水平相混淆。
Blomqvist的句法模式与NeOn的两类模式,句法-词法ODPs和表达ODPs相关。
二种分类在某些术语之间是重叠交叉的,但意义不完全一致。
(见图5)。
至今为止,大部分提出的本体模式是在设计模式水平。
如:
曼彻斯特大学和W3C提出的结构模式,及ODPs社区收集的内容本体设计模式。
只有Blomqvist提出的模式覆盖了本体发展的全过程。
E.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本体 模式 分类 研究 综述