知识库系统docx.docx
- 文档编号:26330660
- 上传时间:2023-06-17
- 格式:DOCX
- 页数:26
- 大小:271.62KB
知识库系统docx.docx
《知识库系统docx.docx》由会员分享,可在线阅读,更多相关《知识库系统docx.docx(26页珍藏版)》请在冰豆网上搜索。
知识库系统docx
第9章知识库系统
9」知识库系统概论
•随着计算机科学技术的发展,以计算机为工具的信息处理技术经历了数值计算阶段和数据处理阶段之后,已经进入了知识管理与处理的阶段,也就是说,计算机可以像人类一样具有进行创造性思维活动的能力,即其具有智能。
计算机具有智能是计算机変展史丄的一个旬時彳弋白6标志,意请着信息社会进入一个知识信息处理的新时代,而知识库技术将使计算机应用系统具有更多的智能。
•由于知识库是智能计算机的核心部件,同时又是其他智能信息处理系统,例如智能机器人、智能视觉、自然语言理解及专家系统的关键部件和基础,因此成为当前计算机科学研究的前沿,是一门正在逐步形成和迅速发展的新兴学科。
•知识库可以看作是数据库理论研究的产物,更确切地讲,知识库是人工智能(AI)和数据库(DB)结合的产物。
如果说数据库就是把数据从应用程序中分离出来交予系统程序处理,则知识库就是把知识从应用程序申分离岀来,交由知识系统程序处理。
从研究角度看,AI和DB技术的结合将产生未来信息系统新的基础结构,从应用角度看,两者的结合最终将产生新一代信息系统。
•DB技术对Al的意义在于帮助Al系统规模进升到实用水平,而AI技术对DB的意义体现在以DB为基础的信息系统可以增加强有力的表达和推理能力,同时,对数据库理论、功能、性能和数据库技术扩展等都可以起到推进作用。
9.1.1知识的概念
•1•数据、信息与知识
••数据数据是对事实的一种表达形式,包括数字、字符和图形。
数据可以通过人工或自动化装置进行处理。
••信息信息是对人有用的,能够影响人们行为的数据。
信息通过对数据加工处理而产生。
••知识知识是人类对客观规律的认识,是系统的有条理的信息。
•例如,摄氏39度是一个数据,如果用来表示一个人体温,则成为一种信息;对于医生或具有保健常识的人来说,如果一个人的体温达到摄氏39度,则其正在发烧,需要及时治疗,这就祿为一祁知识。
•2•知识的要素
•知识的要素是指构成系统知识集合必须的基本知识元素,其中包括事实、概念和规贝I」。
••概念概念给出知识的最基本内容,是知
识的最底层基础,通常以名词形式出现,例如花,红色,太阳,风,雨等。
••事实事实是知识所表不的有关问题涉及到的事物、环境的常识性知识,如事物的分类、属性、事物之间的关系、科学事实、客观事实等。
事实建立了概念之间的联系。
事实是静态地为人们所共孚、最低层次一-0层的知识,通常以“……是……”的形式出现。
••规则规则由事实组成,建立了事实间的联系。
规则是有关问题中与事物的行动、动作相联系的因果关系知识,这种知识是动态的,通常以“如果……则……”的形式出现。
例如启发式规则:
如果下雨,则出门带伞。
912知识库知识库管理系统和知识库系统•1.知识库
•从知识存储的角度来看,知识库是知识的集合。
当然,这些知识包括概念、事实与规则。
由于概念一般均包含在事实内,实际上知识库中应当包含事实与规则两个部分,而仅由事实组成的知识库只能认为是广义的知识库。
•2•知识库管理系统
•知识库是知识的集合,当知识以一定结构方式存储并具有一定共享性和持久性,且这种集合的元素数量很大时就需要进行管理,管理知识库的计算机软件就称为知识库管理系统(knowledgebasemanagementsystem,KBMS).
•知识库管理系统应当具有以下功能:
••支持传统数据库管理系统的一切功能
••具有一种对知识进行操纵和处理的描述性语言
•这种观点是Ulman在其名著uPrincipleofdatabaseandknowledgesystem”申提岀的。
・目前,一般知识库管理系统可以用如下的几个方面来刻画其特性。
・
(1)KBMS所管理的知识仅限于事实和规则两种。
・
(2)KBMS应能管理大量的知识
・(3)KBMS所采用语言大多用逻辑语言,即用谓词表示
・(4)KBMS的核心是一个推理机制(inferenceengine),它完成对知识的操纵,其中包括对知识的一致性校验,知识的演绎检索。
3■知识库系统
・如果一个系统具有使用计算机所存储的知识对输入数据进行解释,生成作业假说并对其进行验证的功能,则称该系统为一个知识库系统
(knowledgebasesystem,KBS)。
・按照上述知识库系统概念,知识库系统中知识,
是系统本身进行推理过程中所利用的信息,而不是提供给系统使用者的信息。
由此可以知道,知识库系统与数据库系统的重要区别之处在于,它并非向用户提供查询的信息,而是提供根据数据输入数据信息通过知识推断而得到的结果。
•从逻辑构成上来看,知识库系统的基本组成情况如下图所示。
•从具体资源组成上来看,知识库系统是一种资源的集成,它包括硬件、软件、信息和有关人员,具体有如卜内容:
•知识库及相应的存储机构
•知识库管理系统及相应的机器
•知识获取机构及相应的人员(包括知识工程师)
•知识库管理员。
4■知识库系统实现的关键技术
••知识表示
••知识利用
••知识获取
913知识库语言
•研究知识库系统十分重要的一点就是研究知识库语言,从数据库领域引进AI技术的角度,对知识库语言的研究主要集中在逻辑语言上,这是因为逻辑语言接近于自然语言,具有良好表达能力与推理能力,比较符合知识库萦统的變耒。
目前用彳乍知识庫逻辑语言的主要分两类:
以Prolog和以Datalog为代表。
当今国际上领先的两个知识库试验系统NAIL和NU-Prolog所使用的知识库语言部是由Datelog和Prolog扩尧的。
•1-Prolog
・Prolag是一种基于一阶谓词的逻辑程序设计语言,它由H.Kowalskv和A.Colmerauer首先提出,它在AI和知识库的实现技术中具有重要作用。
我们知道?
数理逻辑的一种形式是一阶谓词演算,二阶
Horn2?
句。
任一种子句形芸描述的逻辑喪达式都可攻用Horn手句的形式耒I®迓。
而Prolog语言能为数据库系统中演绎推理公理系统,具有很强的逻辑描述能力和推理能力。
它也使数据库系统和知识库系统两者具有共同的坚实的数学基础。
・作为一阶谓词的逻辑语言,Prolog在实现知识库中具有如下特征:
・•一阶谓词逻辑的语言是形式化的严格定义
・•一阶谓词逻辑的语言十分简单易懂
・•逻辑公式不需要重复表达,与不同应用无关
•事实、假设、推理、查询、视图和完整性约束
条件都能以基于一阶谓词逻辑的Prolog表达。
•2.Datalog
•Datalog语言是Prolog语言的一种特殊形式,由于prolog语言是一种适应面较为广泛的通用语言,它在数据库、知识库领域中虽然也能适应,但是也存在一定的不足之处,这主要是数据库及知识库领域中具有一定的特殊性
••在知识库中,知识个数是有限的一数量有限
••在知识库中,一般只有知识操作而很少有计算操作——操作受限
•因此在实际上需要对prolog进行一定的限制,使其在知识库领域中发挥更大作用,而Datalog即是Prolog的一彳申适应于知识库的改进形式语言,是一种受限的Prolog语言,适用于知识库。
9.2传统的知识表示模式
•921知识表示基本概念
•知识表示是指知识的符号化,它包含两层含义:
用给定的知识结构,按一定的原则,组织表示知识;擢瘙所義示知识的意叉。
就其形式而言,知识表示就是用来组织求解某问题的一组描述约定。
知识表示是人工智能和知识工程中的一个核心研究领域,是知识库有效表示知识、运用知识和管理知识的关键技术。
•知识表示方法种类繁多,分类标准不尽相同,通常由直接表示、逻辑表示、产生式规则表示、语义网络表示、框架表示、脚本方法、过程表示、组合型知识表示方法、面向对象表示方法等,其中主要的知识表示方法及其彼此间联系如下图所示。
表示方法
922知识的谓词逻辑表示
•在知识库中目前大都采用“概念■事实■规则”三级层次的知识构造体系。
这种体系的知识表示方法也很多,在人工智能和知识工程领域学科中知识表示方法已经成为一个专门领域。
由于谓词逻辑本身的很好的一些基本特点,当前的知识库系统中一般采用谓词逻辑表示方法。
•尽管其他知识表示方法各有千秋,但由于谓词逻辑表示方法简单,比较适合于知识库中的知识构造体系,具有较强的推理能力和相对较好的理论基础,在知识库系统中被广泛采用而作为一种主要的知识表示方法。
•在谓词逻辑表示的知识构造体系中,概念、
事实与规则可分别用个体(或变元)、谓词与谓词公式表示,它们可使知识表示具有统一的结构模式,以后还可以将谓词进一步改造成某种具有结构简单的称为Hom逻辑的统一标准形式。
9・2・3知识的产生式表示
•产生式知识表示方法也称为产生式规则知识表示方法。
由于该表示方法是建立在因果关系基础之上,可以方便的描述事实、规则和进行不确定性度量。
•1■事实的表示
・事实可以看作是断言一个语言变量的值或者多个语言变量间关系的陈述句。
・一般用三元组(对象属性,值)或孕鬲,谢.象1,对象2)k乗表不事实,其申对象就是语吞变量。
如果考虑不确定性就变化为用四元组(对象,属性,值,不确疋度量值).来表示。
这种表示在机器内部的实就就是一张表。
•例如对事实“老李今年40岁”即为(李,年龄,40),而“老赵和老张是同学”即为(同学,张,李)。
•2•规则的表示
•规则表示是事物间的因果关系,以“ifconditionthenaction”的单一形式表示,其中condition部分成为前彳牛,而action部分成
•产生式的一般形式为前件、后件。
前件部分通常是一些事实的合取与析取,而后件通常是某一事实。
如果考虑不确定性,则需要另附加可信度量值。
•在自然界的各种知识单元中存在着大量的因果关系,这些因果关系转化为前件和后
件,用产生式规则表示非常方便。
产生式
式十产生式的一种特殊形式,只能表示确
定性的知识,其值只能是真或是假,在使用谓词逻辑中的蕴含式的匹配规则必须是精确的。
•3•产生式系统结构
•专家系统多是以产生式表示知识,将一组产生式放在一起,让它们相互匹配,协同工作,一个产生式的结论可以供另一个产生式作为前件使用,以这种方式求解的系统就称为产生式系统。
一个一般的产生式系统如图9・4所示,有知识库和推理机组成,而知识库又由数据库和规则库组成。
924知识的语义网络表示
•语义网络是一种用实体及其语义关系来表达知识的知识表达方式。
从结构上来看,语义网络一般是由一些最基本的语义单元组成。
这些最基本的语义单元被称为语义基元,这些语义基元是由有向图表示的三元组(结点1,弧,结点2),如下图所示。
语义关系
结点1
结点2
•其中,结点表示实体,代表各种事物、概念、情况、属性、状态、事件、动作等;弧是有方向和有标注的,方向体现了结点所代表的实体的主次关系,即结点1为主,结点2为辅。
弧线上的标注表示它所连接的两个实体之间的语义联系。
应该注意在语义网络中,弧的方向是不能随意调换的。
•但多个语义基元用相应的语义联系关联在一起的时候,就形成了一个语义网络。
下图是命题“小学生坐车去参观”的语义网络图。
•由语义网络的结构特点可以看出,语义网络不仅可以表示事物的属性、状态、行为等,而且更适合于表示事物之间的关系和联系。
图9・6表示的语义网络图既表示了小学生的所属(性质),又表示了小学生与“参观”、“坐车”之间的联系。
事实于规则的语义网络的表示结构是相同的,区别在于弧上的标注不一样。
•语义网络表示法和产生式表示法之间有着对应的表示能力。
语义网络基元是一种知识的单位,人脑的记忆是由存储了大量的网络基元来体现的。
而产生式表示方法是以一条产生式规则作为知识单元的,各条产生式规则没有直接的联系。
同样从逻辑表示法来看,一个语义网络相当于一个二元谓词。
•例如,如果有谓词逻辑表示法Relation
(objectl,object2),则用语义网络表示则为(objectl,relation,object2),也可以改写为谓词P(个体1,个体2),其中个体分别对应于结点,而弧及其弧上的标注的结点间关系由谓词P来体现。
•再如,“小李和小王是同学”语义网络如下图所示。
•对应的产生式表示法为
•IfLiandWangthenclassmate
•谓词逻辑表示则为
•Classmat:
Classmate(Li,Wang)
9・2・5知识的框架表示
•框架(frame)是将某类对象的所有知识组织在一起的一种通用数据结构,而相互关联的框架连接成框架系统。
一个框架由框架名和若干个槽(slots)组成,槽值描述框架所表示实体的各个属性。
每个槽又可以由多个则面(faces)组成,各个侧面从不同方面来描述槽的特性。
•槽值有四种填写方式:
••由上下文提供;
••通过默认值隐含;
••通过属性继承获得;
••通过附加过程推理得到。
•框架之间通过泛化联系联结成上下层面的纵向联系,还可以通过槽值为另一个框架名的嵌套联结成横向联系。
整个框架系统由纵、横联系成为一个具有层次的网络结构,框架推理时由上下文中的数据选择候选框架,通过上下文查询、默认、继承、附加过程等获得属性值,按照框架中各个槽的次序填入,使候选框架具体化,以生成一个描述当前情况的实例。
•2框架的构造
•框架由一组描述事物各个方面的槽组成,每个槽拥有若干个说阳槽值的不同类型的侧面,隼个侧面具有不同俞眉。
屣架的基本组成如下述所示
•(FrameNameFrameType
・(Slotl:
NameSlotl:
Type
•(Factl:
(Datuml))
(Factj:
(Datumj)))
(Slotm:
NameSlotm:
Type
(Factl:
(Datuml))
(Factj:
(Datumj))))
其中各个组成组成部分的意义介绍如下
•
(1)FrameName知识库内框架的名称
•
(2)FrameType知识库内框架的类型,可以分为四类:
•Class抽象概念的框架
•Instance具体实例的框架
•Fact——事实框架
•Rule——规则框架
•(3)SlotName槽名,槽是表示具有独立语义的属性单元
•(4)SlotType槽类型,具有两种不同的类型:
•RelationSlot——关系槽,说明上下框架的联系
•GeneralSlot普通槽,说明属性
・(5)Facet侧面,表示属性值的操作类型,常用操作有以下几种:
•Value属性值为常数
-IfNeeded——调用属性值获得过程
•Default属性值为默认值
•IfAdded调用属性值追加过程
•IfRemoved调用属性值删除过程。
・(6)Datum属性值,或属性值获得过程名。
•3•事实的表示
•事实框架是一个具体事例,例如一个状况,一个概念、一个事件等,下面就是一个关于描述人、职工、教师的概念框架和具体的职工、教师实例框架的例子。
•例9」
•Aclass
•上位框架:
生物
•下位框架:
[职工,教师]
•性别:
[男,女]
•年龄:
[1,100]
•身高:
IF-ADDEDASK
•体重:
IF・NEEDEDCALCULATE
•职工class
•上位框架:
人
•下位框架:
[张,王,……]
•工种:
[制造,装配,电焊,.••…]
•工资:
[1000,5000]
•工龄:
[1,40]
•教师:
class
•上位框架:
人
•下位框架:
[王老师,李老师,……]
•职称:
[助教,讲师,..•…]
•教龄:
[1,40]
•工资:
[2000,8000]
•专业:
[英语,数学,……]
•李华INSTANCE
•上位框架:
职工•性别:
男
•年龄:
24
•身1.73
•工种:
制造
•工资:
1500
•工龄:
5年
CE师
AN教
原渠女
I框••
丽位别龄高重称龄资业
王上性年身体职教工专
65
381
53公斤
副教授
15年
4500元英语
58
•4•规则的表示
•在框架系统中,规则知识框架的类型用Rule表示,类似于产生式规则表示,框架中具有if,then两个部分,分别由不同的槽来记述。
If部分记述规则知识的条件,then部分记述规则的结论或者操作。
•例9-2设有知识“如果一个人在大学工作,主要从事教学或科研工作,并且学历为研究生,则他就为教师”,其框架表示如下:
•职业RULE
•IF工作单位:
大学
•工作内容:
教学或科研
•文化程度:
研究生
•THEN该人是教师。
9.4知识库系统原理
•当前,知识库系统中的知识一般分为事实和规则两种,它们都用一阶谓词逻辑表示,而知识库的推理规则采用一阶谓词逻辑中的证明论与模型论理论,基于这两种理论都可以产生知识推演的算法,即以归结原理为代表的基于证明论的算法和以魔集算法为代表的基于模型论的算法。
9A1知识库系统中的一阶谓词逻辑表示
•一阶谓词逻辑是知识表不的一种有效方法,它具有表示能力强、手法简练,具有强大数据理论支撑。
因此,目前知识库系统大都用它作为知识表示工具。
当然,为了适应知识库系统的实际表示需要,在表示知识时往往对一阶谓词逻辑作一些必要的改造。
1•七种基本符
个体常量符号如a,b,c,.…个体变量符号如x,y,z,函数符号如f,g,h,....谓词符号如P,G,R,..联结符号厂—o
量词符号V3
逗点与括弧符号“,”,“(”,“)”
•2•项
••个体常量是项
••个体变量是项
••设f是n元函数符号,t1,t2,,tn是
项,则f(t1,t2,……,tn)是项
••项由且仅由有限次使用上述步骤生成
•2•原子公式
•P是n元谓词,t1,t2,,tn是项,贝ijP
(t1,t2,,tn)是原子公式,原子公
式也称为原子。
•3•—阶谓词逻辑公式(公式)
••原子公式是公式
••如A,B是公式,贝》A,AAB,AVB,A->B,AoB是公式
••如A是公式,x为个体变量,贝iWxwA和3XGA是公式。
••公式由且仅由有限次经过上述步骤生成。
942子句
•阶谓词逻辑公式的表示方法具有表达能力丰富和表示方法简洁的优势,但其表示不够规范,不太适合计算机中使用和处理,需要做必要的改造,使其具有一定的规形式,这就是子句形式和Horn子句形式,简称为子句和Horn子句。
•1■子句
•
(1)子句具有下述形式的公式称为子句
•A1AA2A...AAk->Ak+1VAk+2
V...VAn
•其中Ai为原子公式
・
(2)公式化为子句集合
・①将公式转换为一阶谓词逻辑中的Skolem范式,
Skolem范式是一种标准范式,具有下述形式:
・3ylay2...3ymvxlvx2...vxn
(A11VA12V...VA1k1)
A(A21VA22V...VA2k2)
・A……A(Ar1VAr2V...VArkr)
・其中Aij为原子公式或原子公式的否定。
•②将出现有存在量词约束变元换为某种约束岁数(称之为Skolem函数)以取代存在量词,经过此种代换后,Skolem范式中仅岀现有全称量词。
•③去掉Skolem范式中所有前缀,即所有全称量词,并只要做一个简单的假定,即公式中所有变元均为全称量词化的。
到此为止,一个公式可以改造为如下形式之合取范式:
(A11VA12V...VA1k1)
A(A21VA22V...VA2k2)A……A(Ar1VAr2V...VArkr)
•④将上述合取范式中的合取项作适当改造,这个合取项是个析取式。
将析取式中的原子公式用交换律将其置换于子式的左部,而将所有原子公式否定用交换律置换于子式的右部,并且进一步将否定符号用对偶律提取括弧外从而构成如下公式形式:
•(Bi1VBi2V...VBik)A-
(Bik+1VBik+2V...VBik)
•⑤进一步改造上式,用QV「P等价于p_>Q可以得到如下公式形式
•Bik+1ABik+2A...ABik->Bi1VBi2V...VBik
•此为子句形式。
•⑥进一步可以认为,(3)中的合取范式与
(5)中形式的子句形式的子句集合的永真性是等价的。
因此,可以认为任一个公式可以用子句集合表示。
•这样,子句成为具有表示普遍性的一种合适形式,它具有表示方式单一,又具有蕴含形式,易于进行知识推理,所以非常适合于在计童机中屣用。
•一般,为表示方便起见,可以将子句定义中的形式改写为如下形式:
•Ak+1Ak+2...An^A1A2...Ak
•或进一步将替换成而得:
•Ak+1Ak+2...An:
-A1A2...Ak
•子句表示有很多表示上的优点,但也有不足之处,其主要之点是这种形式用于推理时其蕴含后件是析取式,这种析取式引起了推理结论的不确定性。
为改变这种情况,瑞士数学家Horn寤子句作进一步改造,构成一个子句的特殊形式,称为Horn子句。
9.4.3Horn子句
•I.Horn子句
•具有下述形式的子句称为Horn子句:
•An<-A1A2……Ak
•或Am-A1A2……Ak
•2.Horn子句的基本特例
•Horn子句的几个特例在以后讨论中是有用的。
••断言当Horn子句中n=1,则称其为断言,断言具有下面形式
•An—或An:
-
•也可以简单的表示为An
••假设当Horn子句中K=n,则称其为假设,假设具有下面形式
•^A1a2……Ak或:
-A1a2……Ak
••空子句当Hom子句中K=0,则称其为空子句,空子句具有下面形式
•—或口
9.4.4Datalog表示方法
•Horn子句表示方法是较好的一种逻辑知识表示方法,以这种形式为基础所研制的逻辑程序设计语言Prolog已经被广泛用于人工智能等各个领域。
但是它在数据库与知识库的应用中还需要略作修改。
这种Horn子句在数据库和知识库中的表示版本称为Datalog0
•Datalog作为特殊的Horn子句,它满足如下几条限制:
••Datalog中项仅由个体常量或个体变量组成,不含有函数
••Datalog必须满足安全性规则
•在数据库或知识库中,数据必须是有限的,任何岀现有变量的地方必须作量的限制,否则这种表示形式在计算机内会产生无法计算的现实。
因此Datalog关系对其中出现的变量作量的限制。
Datalog的安全性规则具体表示是,在Datalog的变元中,或者出现变元为a(x=a)(此时变量受限),或者谓词中变元受限,或者变元x=y而y受限。
•此外,为使Datalog使用方便,在其内引入若干个内部谓词,即常谓词。
女口x=y:
Eq
(x,y),x>y:
G(x,y).
•目前,数据库和知识库中所使用的逻辑表示方法大都采用Datal
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 知识库 系统 docx