本体概念描述语言和方法论方面的综述Word文档下载推荐.docx
- 文档编号:22112058
- 上传时间:2023-02-02
- 格式:DOCX
- 页数:23
- 大小:173.53KB
本体概念描述语言和方法论方面的综述Word文档下载推荐.docx
《本体概念描述语言和方法论方面的综述Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《本体概念描述语言和方法论方面的综述Word文档下载推荐.docx(23页珍藏版)》请在冰豆网上搜索。
1.概念化(conceptualization):
客观世界的现象的抽象模型;
2.明确(explicit):
概念及它们之间联系都被精确定义;
3.形式化(formal):
精确的数学描述;
4.共享(share):
本体中反映的知识是其使用者共同认可的。
原文:
“anabstractmodelofaphenomenontermed‘conceptualization’,aprecisemathematicaldescriptionhintstheword‘formal’,theprecisionofconceptsandtheirrelationshipsclearlydefinedareexpressedbytheterm’explicit’andtheexistenceofanagreementbetweenontologyusersishintedbytheterm‘shared’.”
Swartout将本体定义为:
“本体是一个为描述某个领域而按继承关系组织起来作为一个知识库的骨架的一系列术语”。
(“Anontologyisahierarchicallystructuredsetoftermsfordescribingadomainthatcanbeusedasaskeletalfoundationforaknowledgebase.”)[5]。
他的定义强调了本体中术语(terms)的重要性。
Fensel定义“本体是对一个特定领域中重要概念的共享的形式化的描述”。
(“Anontologyisacommon,sharedandformaldescriptionofimportantconceptsinanspecificdomain.”)[7]。
NoyF.N.认为“本体是对某个领域中的概念的形式化的明确的表示,每个概念的特性描述了概念的各个方面及其约束的特征和属性。
”(“Anontologyisaformalexplicitrepresentationofconceptsinadomain,propertiesofeachconceptdescribescharacteristicsandattributesoftheconceptknownasslotsandconstrainsontheseslots.”)[8]。
Fonseca定义“本体是以某一观点用详细明确的词汇表描述实体、概念、特性和相关功能的理论”。
(“Anontologyisatheorywhichusesaspecificvocabularytodescribeentities,classes,propertiesandrelatedfunctionwithcertainpointofview.”)[9]。
Starla认为“本体必需包括所使用术语的规范说明、决定这些术语含义的协议、以及术语之间的联系,来表达概念”。
(“Anontologynecessarilyincludesaspecificationofthetermsused(terminology)andagreementsthatallowtodeterminetheirmeaning,alongwiththepossibleinter-relationshipsbetweentheseterms,standingfor"
concepts"
.”)[10]。
M.UscholdandM.Gruninger认为“”(“Ontologyisanexplicitaccountorrepresentationof(somepartof)aconceptualisation.”)[12]。
他还推荐了一个来自SRKB(SharedRe-usableKnowledgeBases)电子邮件列表的定义“本体是关于共享的概念模型的协议。
共享的概念模型包括进行领域知识建模的概念框架、互操作的agent之间进行交流的内容明确协议、以及表达特定领域理论的协定。
在知识共享的上下文环境中,本体特指表达性词汇表的定义的形式。
一个非常简单的例子就是分类的层次结构,指明了类和它们之间的包含关系。
关系数据库模式的作用也和本体一样,它指定了某些共享数据库之间可以存在的关系以及必须保持的完整性约束”(“Ontologiesareagreementsaboutsharedconceptualization.Sharedconceptualizationsincludeconceptualframeworksformodelingdomainknowledge;
content-specificprotocolsforcommunicationamonginter-operatingagents;
andagreementsabouttherepresentationofparticulardomaintheories.Intheknowledgesharingcontext,ontologiesarespecifiedintheformofdefinitionsofrepresentationalvocabulary.Averysimplecasewouldbeatypehierarchy,specifyingclassesandtheirsubsumptionrelationships.Relationaldatabaseshemataalsoserveasontologiesbyspecifyingtherelationsthatcanexistinsomeshareddatabaseandtheintegrityconstraintsthatmustholdforthem.”)。
以下是个人的看法:
尽管定义有很多不同的方式,但是从内涵上来看,不同研究者对于本体的认识是统一的,都把本体当作是领域(可以是特定领域的,也可以是更广的范围)内部不同主体(人、机器、软件系统等)之间进行交流(对话、互操作、共享等)的一种语义基础,即由本体提供一种明确定义的共识。
进一步,本体提供的这种共识更主要的是为机器服务,机器并不能像人类一样理解自然语言中表达的语义,目前的计算机也只能把文本看成字符串进行处理。
因此,在计算机领域讨论本体,就要讨论本体究竟是如何表达共识的?
也就是概念的形式化问题。
这就涉及到本体的描述语言、本体的建设方法等具体研究内容。
二、本体的描述语言
本体语言使得用户为领域模型编写清晰的、形式化的概念描述,因此它应该满足以下要求[18]:
✓良好定义的语法(awell-definedsyntax)
✓良好定义的语义(awell-definedsemantics)
✓有效的推理支持(efficientreasoningsupport)
✓充分的表达能力(sufficientexpressivepower)
✓表达的方便性(convenienceofexpression)
大量的研究工作者活跃在该领域,因此诞生了许多种本体描述语言,有RDF和RDF-S、OIL、DAML、OWL(注:
DAML+OIL不再单独列出,认为它是一个过渡,直接介绍OWL)、KIF、SHOE、XOL、OCML、Ontolingua、CycL、Loom。
我们简单把它们归类如下:
✓和Web相关的有:
RDF和RDF-S、OIL、DAML、OWL、SHOE、XOL。
其中RDF和RDF-S、OIL、DAML、OWL、XOL之间有着密切的联系,是W3C的本体语言栈中的不同层次,也都是基于XML的。
而SHOE是基于HTML的,在HTML的一个扩展。
✓和具体系统相关的(基本只在相关项目中使用的)有:
Ontolingua、CycL、Loom。
✓KIF已经是美国国家标准,但是它并没有被广泛应用于互联网,作为一种交换格式更多的应用于企业级。
下面我们逐一进行介绍。
1.RDF、RDF-S[22,23]
ResourceDescriptionFramework,资源描述框架,是W3C在XML的基础上推荐的一种标准,用于表示任何的资源信息。
RDF提出了一个简单的模型用来表示任意类型的数据。
这个数据类型由节点和节点之间带有标记的连接弧所组成。
节点用来表示Web上的资源,弧用来表示这些资源的属性。
因此,这个数据模型可以方便的描述对象(或者资源)以及它们之间关系。
RDF的数据模型实质上是一种二元关系的表达,由于任何复杂的关系都可以分解为多个简单的二元关系,因此RDF的数据模型可以作为其他任何复杂关系模型的基础模型。
W3C推荐以RDF标准来解决XML的语义局限。
RDF和XML是互为补充的。
首先,RDF希望以一种标准化,互操作的方式来规范XML的语义。
XML文档可以通过简单的方式实现对RDF的引用。
其次,由于RDF是以一种建模的方式来描述数据语义的,这使得RDF可以不受具体语法表示的限制。
但是RDF仍然需要一种合适的语法格式来实现RDF在Web上的应用。
将RDF序列化为XML表示可以使RDF获得更好的应用可处理特性,并使得RDF数据可以像XML数据一样的容易使用、传输和存储。
因此,RDF是定制XML的良伴,而不只是对某个特定类型数据的规范表示,XML和RDF的结合,不仅可以实现数据基于语义的描述,也充分发挥了XML与RDF的各自优点,便于Web数据的检索和相关知识的发现。
与XML中的标记(tags)类似,RDF中的属性(properties)集也是没有任何限制的。
也就是说存在同义词现象和一词多意现象。
RDF的模型不具备解决这两个问题的能力,而RDFSchema虽然可以为RDF资源的的属性和类型提供词汇表,但是基于RDF的数据语义描述仍然可能存在语义冲突。
为了消解语义冲突,我们在描述数据语义的时候可以通过引用Ontology的相关技术,对语义描述结果作进一步的约束。
幸运的是,RDF(Schema)在提供了简单的机器可理解语义模型的同时,为领域化的Ontology语言(OIL,OWL)提供了建模基础,并使得基于RDF的应用可以方便地与这些Ontology语言所生成的Ontology进行合并。
RDF的这一特性使得基于RDF的语义描述结果具备了可以和更多的领域知识进行交互的能力,也使基于XML和RDF的Web数据描述具备了良好的生命力。
2.OIL[20]
OntologyInferenceLayer/OntologyInterchangeLanguage。
OIL是一种针对本体的基于互联网的表现和推理层。
它是由theEuropeanUnionISTprogrammeforInformationSocietyTechnologiesundertheOn-To-Knowledgeproject(IST-1999-1013)andIBROW(IST-1999-19005)资助的,也得到了更广泛的研究者的参与。
它的语言集如下图所示。
OIL综合了三个不同团体的工作,提供一种通用的语义互联网的标记语言。
这三方面的工作分别是:
→基于框架的系统
基于框架的语言在AI中有很长的历史,它们的中心建模元语是类(称作框架)和属性(称为槽)。
→描述逻辑
描述逻辑通过概念(对应于类或者框架)和角色(对应于槽)描述知识。
DL的一个重要特征是它们具有良好理解理论性质,并且在DL中任何表达的含义都可以通过数学的精确的方式描述。
OIL从DL中继承了形式化语义和有效的推理支持。
→互联网标准
这里指的是XML和RDF。
OIL标记语言的语法源自W3C的这些标准。
OIL的使用比较广泛,支持OIL的工具也很多,最著名的有OILEd,是一个基于OIL的本体编辑器。
其他一些工具,比如OntoEdit、theFaCT(FastClassificationofTerminologies)System等也都支持OIL。
3.DAML[21]
DARPAAgentMarkupLanguage,该项目正式开始于2000年8月,由美国政府支持,目标是开发一种语言和一组工具,为语义互联网提供支持。
MarkGreaves是该项目的领导者。
DAML形成于DAML-ONT(一种本体语言)和DAML-Logic(一种表达公理和规则的语言)。
DAML提出的原因和OIL类似,一批支持语义互联网的研究者发现XML、RDF作为模式语言其表达能力很有限,希望开发一种有更强的表达能力的模式语言。
尽管DAML并不是W3C的标准,但是参与的开发者中有很多来自W3C的工作者,包括TimBerners-Lee。
DAML扩展了RDF,增加了更多的更复杂的类、属性等定义。
它一度很流行,成为网上很多本体的描述语言,直到DAML的研究者和OIL的研究者开始合作,推出了DAML+OIL语言,成为W3C研究语言互联网的本体语言的起点。
4.OWL[18,19]
OWL全称WebOntologyLanguage,是W3C推荐的语义互联网中本体描述语言的标准。
它是从欧美一些研究机构的一种结合性的描述语言DAML+OIL发展起来的,其中DAML来自美国的提案DAML-ONT,OIL来自欧洲的一种本体描述语言(二者在上文都有介绍)。
在W3C提出的本体语言栈中,OWL处于最上层,见下图。
针对不同的需求OWL有三个子语言,描述列表如下:
子语言
描述
例子
OWLLite
用于提供给那些只需要一个分类层次和简单的属性约束的用户。
支持基数(cardinality),只允许基数为0或1。
OWLDL
支持那些需要在推理系统上进行最大程度表达的用户,这里的推理系统能够保证计算完全性(computationalcompleteness,即所有地结论都能够保证被计算出来)和可决定性(decidability,即所有的计算都在有限的时间内完成)。
它包括了OWL语言的所有约束,但是可以被仅仅置于特定的约束下。
当一个类可以是多个类的一个子类时,它被约束不能是另外一个类的实例。
OWLFull
支持那些需要在没有计算保证的语法自由的RDF上进行最大程度表达的用户。
它允许在一个Ontology在预定义的(RDF、OWL)词汇表上增加词汇,从而任何推理软件均不能支持OWLFULL的所有feature。
一个类可以被同时表达为许多个体的一个集合以及这个集合中的一个个体。
这三种子语言之间的关系是:
✓每个合法的OWLLite都是一个合法的OWLDL;
✓每个合法的OWLDL都是一个合法的OWLFull;
✓每个有效的OWLLite结论都是一个有效的OWLDL结论;
✓每个有效的OWLDL结论都是一个有效的OWLFull结论。
用户在选择使用哪种语言时的主要考虑是:
✓选择OWLLite还是OWLDL主要取决于用户需要整个语言在多大程度上给出了约束的可表达性;
✓选择OWLDL还是OWLFull主要取决于用户在多大程度上需要RDF的元模型机制(如定义类型的类型以及为类型赋予属性);
✓在使用OWLFull而不是OWLDL时,推理的支持不可预测,因为目前还没有完全的OWLFull的实现。
这三种子语言与RDF的关系是:
✓OWLFull可以看成是RDF的扩展;
✓OWLLite和OWLFull可以看成是一个约束化的RDF的扩展;
✓所有的OWL文档(Lite,DL,Full)都是一个RDF文档;
✓所有的RDF文档都是一个OWLFull文档;
✓只有一些RDF文档是一个合法的OWLLite和OWLDL文档。
OWL的语言规范这里不再介绍。
5.KIF[24]
KnowledgeInterchangeFormat(KIF)是一种为了在不同的计算机系统(这里的不同是指由不同的程序员在不同的时间使用不同的语言开发等)之间交换知识而设计的语言。
它的主要目的不是和人交互,也不是在一个计算机系统内部作为知识的表现方式,只有在不同的计算机系统之间需要交换知识的时候,它们把各自的内部表现方式转换成KIF,交互后再转换成各自的方式。
它是由斯坦福大学的TheLogicGroup提出并实现的,是一种美国标准(ANSI)。
在KIF的设计中,以下特征是其本质特性:
✓有公开的语义。
它不再需要专门的解释器。
✓在逻辑上是全面的。
可以对任意的逻辑语句进行表达。
✓提供对元知识的表现。
除了这几个本质特征以外,KIF还尽量的最大化实现能力和可读性。
6.SHOE[25]
全称:
SimpleHTMLOntologyExtensions,简单HTML的本体扩展。
这是一种与XML一致的互联网知识表达语言,使得网页编辑者可以对他们的互联网文档进行标注。
由马里兰大学计算机系提出的,但是目前他们有关本体的研究项目已经使用OWL和DAML+OIL作为互联网本体的描述语言,SHOE已经停止研究了。
SHOE是HTML的一个超集,它扩展了一些标记,使得在HTML中可以增加任意的语义数据。
它的标记有两类,一类用于创建本体,一类用于注解文档。
7.XOL[26]
OntologyExchangeLanguage,本体交换语言。
源于SRIInternational'
sArtificialIntelligenceCenter(AIC)的BioinformaticsResearchGroup。
XOL设计之初是为生物信息学领域本体的交换,但是它可以应用于各种领域。
它是一种简单通用的定义本体的方法。
基于XML和RDFSchema有两种变体。
其目的是在不同的数据库、本体开发工具、或者其他应用程序之间交换本体。
8.OCML[27,28]
OperationalConceptualModellingLanguage,是由英国的KnowledgeMediaInstitute实验室开发的。
OCML建模语言通过几种具体的构件(Functionalterms、Controlterms、Logicalexpressions)来支持知识模型的建模架构。
该语言使得对函数、关系、类、实例和规则的形式化操作成为可能。
它还包括定义本体及问题解决方法的机制。
KMI的WebOnto编辑器是基于OCML的。
9.Ontolingua[1]
一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本体 概念 描述 语言 方法论 方面 综述