Semanticwiki.docx
- 文档编号:4835874
- 上传时间:2022-12-10
- 格式:DOCX
- 页数:7
- 大小:22.96KB
Semanticwiki.docx
《Semanticwiki.docx》由会员分享,可在线阅读,更多相关《Semanticwiki.docx(7页珍藏版)》请在冰豆网上搜索。
Semanticwiki
语义维基的定义
语义维基是一种根据知识模型组织页面的维基。
语义维基系统就是将传统的维基系统和语义网技术结合起来,这样使得一方面维基系统可以利用语义网技术提供比目前的维基系统更好的用户界面、更先进的检索和导航工具,另一方面语义网也以借助维基的方便、简单性和共享性使得非技术的普通用户也能够参与到语义网建设中。
(本部分摘自《语义维基概述》作者余胜爱)
语义维基的层次
整个语义维基系统分为三层:
数据存储层、程序接口层、用户界面层。
语义维基的分类
第一类是强调语义网应用,将语义维基作为组织语义数据的工具,比较适合领域专家使用,但非技术用户只能敬而远之;另一类是强调“用户友好”,将语义作为维基的数据组织工具,针对普通用户,但只能应用语义网的部分特性。
用维基组织语义数据(WikisforSemanticData)
当前的很多项目都是基于第一类,它们将词条作为概念(Concept),超链接作为对象或数据属性(Property),这种模型被称之为“维基本体(Wikitology)”。
这类维基系统作为充分支持本体信息编辑的协作编辑工具,能帮助领域专家和本体工作者在一个系统里合作,同时维基页面里的文字内容既可以供人阅读同时也是正式的本体。
即使这种维基不能编辑复杂的schema信息,它仍可能用来开发和存档本体词汇。
这类语义维基的主要代表是SemanticMediaWiki(简称SMW)。
它是在MediaWiki(WikiPedia使用的维基引擎)的基础上引入语义标注,即在原有的维基标记语言(WikiML)基础上增加了新语法,建立标注属性、类型、值的关系的语法基础。
SMW在每个页面下面增加了一个factbox,里面显示与当前维基词条相关的语义数据,同时还可将该语义数据输出为OWL/RDF格式。
同时SMW还提供一个浏览语义数据的界面你可以从输入一个词条名称开始,浏览所有语义相关的数据还可以通过点击按钮转到对应的维基页面。
通过点击按钮查找所有具有相同属性值(propertyvalue)的语义数据。
这类语义维基成了本体的动态和不断修正的工具,并使得维基内容从文本描述到正式概念的提升。
这类语义维基并不适合普通用户,用户需要学习WikiML及本体建模相关知识。
语义作为维基的数据组织工具(SemanticDataforWikis)
目前有些应用只是引入语义工具来支持现有的维基,比如,通过语义搜索功能简化信息搜索。
在这种情况下,语义数据主要目标是保持简单易用的原则,因此不会引入太多新的界面或功能,也不能进行大规模的推理。
IkeWiki是这类语义维基的典型代表,支持从非正式文本到采用OWL正式本体的不同层次的形式化表达,并且具有丰富的界面交互。
它基于JAVA技术,采用著名的Jena语义平台。
IkeWiki与SMW最大的不同之处在于IkeWiki要求预先加载本体到系统中,也就意味着如果本体中没有OWL元素属性,就无法在IkeWiki系统中进行谓词标注。
另外一个不同在于IkeWiki将语义数据与维基页面内容分开存储。
当呈现(rendering)一个页面时,呈现通道(renderingpipeline)将分别存储的文章内容和元数据组合成带有语义标注的页面文本。
(本部分摘自《语义维基概述》作者余胜爱
根据侧重的使用目的分类:
语义Wiki的特征可被划分为五种类型的活动:
创建,导航,检索,重用和社会协作。
除了OntoWiki,它们都缺乏必要的社会协作手段。
比较完善的语义Wiki引擎依次如下:
OntoWiki、COW、SemanticMediaWiki、Makna、IkeWiki等。
语义维基除了具有传统维基的基本特点之外,还需要着重解决三个问题:
如何对维基内容进行标注?
如何对内容进行形式化地描述?
如何对内容进行导航?
PlatypusWiki、SemanticMediaWiki、SemperWiki、IkeWiki和WikSAR。
这些系统都具备如下的特征:
(1)对链接进行标注。
几乎所有的语义维基系统都能够通过给链接赋予一定的类型而对链接进行标注。
这是因为,由用户所创建的链接几乎本身就带有一定的含义,而不仅仅是用于简单的链接导航。
不同的系统采用不同的方法进行链接标注。
一些语义维基系统把标注作为维基语法的一部分,如SemanticMediaWiki,而另外一些维基系统提供了一个独立的编辑器来用于标注,如IkeWiki。
(2)上下文敏感的表达方式。
许多语义维基系统可以根据语义标注来改变内容的表达方式。
这包括:
将语义相关的页面显示在一个独立的链接框中、显示来源于底层知识库的信息(如将属于同一层次结构下的内容以图形树的形式显示在对话框中),甚至可以根据上下文环境使得同一个页面的内容以不同的方式显示(如以多媒体方式显示或以文本方式显示)。
(3)增强的导航功能。
对链接进行标注可以为导航提供更多的信息。
传统的维基系统只是沿着链接方向导航,而语义维基系统则提供了描述链接关系的额外的信息,这些信息可以被用于提供更复杂的导航。
(4)语义检索。
大多数的语义维基系统能够基于底层知识库进行语义检索。
通常采用SPARQL(一种用于RDF上的语言)查询语言来表达语义查询。
通过使用语义检索,用户可以在语义维基系统中进行诸如“检索由莫扎特所谱写的所有作品”等的查询。
(5)支持推理功能。
推理意味着使用预先定义的规则从知识库中存储的事实信息中获得额外的、潜在的知识。
例如,从“曹雪芹创作了《红楼梦》”的事实信息中,具有推理功能的语义维基系统就可以推断“曹雪芹是一个作家”。
尽管推理是一项重要的特征,但目前只有一小部分维基系统支持这一功能。
(本部分摘自《语义维基技术及应用》作者龚立群)
各类semanticwiki简介
IkeWiki
IkeWiki(ike表示knowledeg,Wiki表示fast)也来源于夏威夷语,可以被翻译为“快速的知识”。
IkeWiki系统是奥地利萨尔茨堡研究中心的SebastianSchaffert等人所研发的语义Wiki原型系统IkeWiki(http:
//ikeWiki.salzburgresearch.at/或http:
//www.ikeWiki.org/或
IkeWiki主要的特征是使用语义术语对现有的数据进行语义标注来增加系统的检索和导航功能、基于现有的本体创建实例数据,也可以做为创建和编辑本体的工具。
在进行设计时,IkeWiki遵从了如下的设计原则:
(1)提供容易使用并具有交互功能的界面;
(2)与Wikipedia/MediaWiki相兼容;
(3)与语义网标准相兼容;
(4)语义描述可以直接使用;
(5)支持不同层次人员的工作。
IkeWiki是采用Java实现的,运行于Tomcat服务器,并使用JenaRDF知识库来存储元数据,系统使用了AJAX来实现系统与用户之间的交互。
Kaukolu
Kaukolu(http:
//kaukoluWiki.opendfki.de/)是建立在JSPWiki
(http:
//www.jspWiki.org/)和Sesame(http:
//www.openrdf.org/)的基础之上的,它提供了EDF的输入和输出功能,提出了本地名字空间解决方案。
Makna(http:
//www.apps.ag-nbi.de/makna/)是基于JSPWiki和Jena2.0创建的,通过引用本体原语来标注Wiki的内容,同时保证语义模型的一致性,提供了基于内容和结构的查询功能和导航功能,能输出RDF或N3作为语义输出。
OntoWiki
OntoWiki是为支持敏捷分布式知识工程的工具
(http:
//aksw.org/Projects/OntoWiki或http:
//ontoW。
Ontowiki的架构
PlatypusWiki
PlatypusWiki(http:
//platypusW)第一个语义Wiki系统,由StefanoEmilioCampanini等人开发。
Platypus系统使用户能够为Wiki页面增加元数据,并用RDF属性来描述链接含义、提供导航层次。
从Wiki的角度来看,Platypus中的每个页面都被分在某一个主题组下面,第一层目录代表一个相关页面集;从语义网的角度来看,每个页面都可以是一个类、属性或个体,第一层目录是一个本体的命名空间或一个知识库。
Platypus用JAVA实现,使用了Sevlet和JSP技术,并使用了JakartaLucene作为搜索引擎来实现全文或元数据检索。
Platypus使用Jena来管理RDF模型,并具有有限的推理能力。
PlatypusWiki可以用来作为个人知识管理系统,也可作为社区实践,该网站中提供了很多关于wiki的新闻。
SemanticMediaWiki
SemanticMediaWiki(
系统包括五个组件:
用户界面、解析器、页面服务器、分析器和内容存储器。
用户界面向用户显示Wiki页面,并从页面服务器请求一个或多个页面(如页面内容、一个导航菜单、一组相关的项目和一个日历),页面服务器则从内容存储器中检索到用户所请求的页面。
页面服务充当了内容存储器和其他组件间的中介,封装了Wiki的业务逻辑。
当用户使用基于文本的Wiki语法编辑或创建一个Wiki页面后,解析器将页面转换成WIF(WikiInterchangeFormat)格式,然后页面服务器将页面存储在存储器中。
内容存储器中存储了RDF数据和二进制数据,并能够支持版本和访问控制。
分析器从结构层和语义层分析和整合数据。
SemanticMediaWiki采用PHP实现,使用的是MySQL数据库。
SemperWiki(http:
//semperWiki.org/)系统最初是作为一个桌面应用系统由爱尔兰国立大学的EyalOren等人开发,后来他们将其移植到了Web上。
SemperWiki
SemperWiki系统最初是作为一个桌面应用系统由爱尔兰国立大学的EyalOren等人开发,后来他们将其移植到了Web上。
SemperWiki系统包含的组件有:
一个用户界面、一个解析器、一个数据分析器和一个数据存储器。
用户可以通过用户界面浏览、编辑和查询页面。
用户界面应该能够使用户导航相关项目,并能够随着用户的不同而进行调整,以满足用户个性化需求。
当用户对一个Wiki页面进行编辑时,用户界面就会通知解析器,解析器对页面上的文本进行分析,并抽取出描述和链接。
所有的数据(文本和描述)都被存储在知识库中,从知识库中所存储的数据中,数据分析器计算出与当前页面相关的页面集,并通过用户界面显示给用户。
SemperWiki用面向对象的脚本语言Ruby实现,并使用了GTK图形工具包。
WikiSAR
WikiSAR(SemanticAuthoringandRetrievalwithinaWiki)是由德国莱比锡大学的DavidAumueller等人所开发的语义Wiki系统,该系统界面包括一个Wiki页面和一个可选的交互可视化图形界面。
Wiki页面被分为三个组成部分:
文本输入(编辑)框、文本显示区和包含有上下文链接的工具条。
WikiSAR具有如下几个特征:
简单易行的创建和语义编辑、基于上下文的导航、语义检索和与本体整合。
WikiSAR系统用Perl语言实现,并将每个Wiki页面作为纯文本文件存储在WEB服务器中。
WikiSAR原型系统使用Unix的“grep”来抽取RDF三元组,使用支持RDQL和SPARQL查询语言的查询引擎RAP(RDFAPIforPHP)进行查询,并可以将查询嵌人到Wiki页面或模板中。
SweetWiki
SweetWiki基于CORESE语义搜索引擎来提供查询和推理,此外还提供安全管理和本体编辑工具。
(摘自《基于单元的语义wiki》《语义维基技术及应用》等)
语义Wiki中存在的问题
虽然语义Wiki已经得到了一定的发展,但是目前它仍处于研发阶段,依然存在许多没有解决的问题,现有语义Wiki主要存在以下问题:
1、互操作性问题。
(备注:
互操作性是指不同的计算机系统、网络、操作系统和应用程序一起工作并共享信息的能力。
)
尽管语义web标准的一个主要议题之一就是解决互操作性问题,但是几乎所有的语义Wiki都不支持本体(RDF)数据的导入。
一些Wiki允许使用本体(如OWL或RDF语言),但是集成到Wiki概念,本体是不可修正的。
例如,本体的加载通常是不展示在Wiki中,它们一般被加载到另一个独立的知识库中。
同时,本体被认为是保持不变的,并且它们不能被Wiki的用户进行编辑。
此外,Tolksdorf和simperl认为,在传统的Wiki中存在一个重要限制(这在我们看来,同样存在于语义Wiki)就是设计决策时考虑一个Wiki将作为一个封闭的系统,没有与其他Wiki或其他服务互动的可能。
他们提出的解决方法就是引入分布式和开放性作为未来的Wiki系统整体设计的理念,并提供一个实现这一目标的研究和发展蓝图,但没有给出具体的实现方法。
2、标注复杂性问题。
在现有的语义Wiki当中,主要是用RDF来进行标注:
RDF支持描述现有的供人阅读的特征的语义信息。
因为Wiki的基本单元是页和页之间的链接,将一个Wiki映射为RDF,可以通过如下的方法来实现,将页看作是RDF的资源,Wiki页之间的链接是RDF资源之间的关系。
这种典型方法的实现可以使用户将RDF三元组融入到Wiki页中,但是只能设置每个页之间URI为三元组的主体。
由此得出结论,当使用RDFs时,Wiki页必须既支持典型Wiki:
page又必须支持典型资源的描述。
但是这样会有两大障碍:
首先,从一个知识工程师的角度观点出发,实体的客观存在既可能是一个文本(一个Wiki页面)又可能是页面中一个实例(例如一个具体的人),这不是我们想要的。
其次,当这种方法非常方便地产生RDF数据,即浅层次的本体,它有一些类和许多关系,我们认为随着本体和结构越来越细致的时候,它就会迅速达到一个极限。
3、本体的存储和管理问题。
首先由于标注复杂性带来的本体的不断膨胀,本体规模越来越大,越来越繁杂,这将会给本体的存储和管理带来困难。
4、数据模型问题。
几乎(但不是全部)现有的语义Wiki都假定概念C的网页就是一个主体或者客体,每个Wiki网页上只有一个概念,这样的简化使得它非常容易表达一个概念的语义陈述。
但如果你只能是指“网页的概念”,你怎么去指一个特定的网页片段呢?
而且一个网页一般情况下均会包含多个概念。
5、名字空间问题。
几乎所有的语义Wiki都只是解决了本地的内部名字空间问题,而且通常都是通过文本全文检索来解决的,但要达到互操作性,就要解决外部的名字空间问题。
6、本体的编辑问题。
现在的语义Wiki大多把本体当成是一个静态知识库来处理,本体通常情况下是预先定义好的,不能更改,也不能恢复。
7、本体的灵活导入和导出问题。
目前语义Wiki大多数都不支持本体的自由灵活地输入和输出。
由于一般的语义Wiki都把本体视为静态的知识库,如一些语义Wiki将语义辞典WordNet引入其中作为其参照知识库,一般都是一次性引
入,期间不会对WordNet做修改,否则会对其知识库产生致命的影响。
8、平滑的迁移:
现有的语义Wiki允许添加语义特征到现有内容(例如,通过在该Wiki输入先前没有的类型的链接),但是几乎没有一个Wiki具有帮助用户从纯文本中抽取更多的语义特征。
9、查询问题。
查询语义信息的唯一手段既不是非常简单的建立一个用户接口(如“显示所有的出版物列表给我”)进行查询,也不是复杂的采用一个查询语言,如SPARQL进行复杂的手工查询。
虽然目前的研究和开发尽力提出一些查询接口,但要使目前的语义Wiki能够像独立搜索系统一样利用仍然是相当困难的。
(摘自《基于语义wiki的本体知识库研究》作者饶国政)
关于这次调研的个人总结:
本次调研主要采取文献调研法,许多wiki网站正在维护,和本人英语水平有限,实践较少。
本次调研遇到的困难,一个是对语义应用相关知识了解的太少,以至于很多名词看不懂,需要不停查阅,而且查阅后只是个初步了解,理解的并不深刻。
注:
一些相关知识
资源描述框架(ResourceDescriptionFramework,简称RDF)是一个用于表达关于万维网(WorldWideWeb)上的资源的信息的语言.它专门用于表达关于Web资源的元数据,比如Web页面的标题、作者和修改时间,Web文档的版权和许可信息,某个被共享资源的可用计划表等。
W3C是英文WorldWideWebConsortium的缩写,中文意思是W3C理事会或万维网联盟。
W3C组织是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来定制。
OWL(WebOntologyLanguage)是W3C开发的一种网络本体语言,用于对本体进行语义描述。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Semanticwiki