基于云模型定性规则推理的分类方法.docx
- 文档编号:23168754
- 上传时间:2023-05-15
- 格式:DOCX
- 页数:6
- 大小:18.85KB
基于云模型定性规则推理的分类方法.docx
《基于云模型定性规则推理的分类方法.docx》由会员分享,可在线阅读,更多相关《基于云模型定性规则推理的分类方法.docx(6页珍藏版)》请在冰豆网上搜索。
基于云模型定性规则推理的分类方法
论文导读:
:
根据粗糙集原理和模糊集理论,提出了一种基于云模型定性规则推理的分类方法,它利用云的相关理论获得多条件单规则中包含隶属度的决策表,结合模糊模式识别技术进行样本分类。
针对一些数据对象分别隶属于不同类别的情况,定性概念来代替模糊集中的定量数据并建立二元关系,能对连续型数据进行更为简单合理的“软”分类,从而使基于定性概念的算法模型符合人类思维方式。
论文关键词:
云模型,规则推理,分类算法,定性概念
0引言
在模糊理论[1]中,模糊聚类分析方法就是通过建立模糊相似矩阵或模糊等价矩阵,利用直接聚类法、最大树法、编网法等方法结合阈值对论域中的样本进行分类。
然而模糊相似矩阵和模糊等价矩阵都是通过相似系数法、距离法和其它方法(如数量积法、夹角余弦法、海明距离、欧氏距离、切比雪夫距离等方法)建立在二元关系的基础之上,并且通过等价关系的传递性质进行动态聚类。
因此,建立二元关系是进行分类或聚类的重要过程。
不同论域中定量数据可以通过模糊聚类方法中的一般步骤建立起二元关系,即两个样本之间的相似关系(或相关程度)。
那么,定性概念[2,3]是符合人类思维方式的一种数据结果表达方法,建立定性概念之间的二元关系是否也能对相应论域中的样本进行分类呢?
由于云是定量数据与定性概念之间相互转化的智能模型,它主要应于数据挖掘[4,5]、预测[6]和决策[7,8]等领域,实现算法过程的定性概念描述和推理分析。
通常情况下,定量数据的推理过程是通过模糊控制理论来实现,起到定量数据的模糊化推理,可以达到较好的结果。
同样,不确定性人工智能云理论的诞生,为定性推理奠定理论基础。
本文主要根据模糊粗糙集理论,提出一种基于云理论定性推理的分类算法。
与传统方法相比,该方法通过利用云模型的相关机制对隶属于不同概念的样本实现“软”分类,而且其分类的输出结果符合人的思维模式。
1云模型
为了更为方便地说明分类算法过程分类算法,我们对李德毅院士提出的云模型的相关定义作一些简单的介绍,并给出一些相关定义。
定义1设是一个用精确数据值表示的定量论域,是上的定性概念,若定量值,且是定性概念的一次随机实现,对的隶属度(确定度)为是具有稳定倾向的随机数,则在论域上的分布称为云,每个称为一个云滴。
云[2,3,9]是用语言值表示的某个概念与其定量表示之间的不确定性转换模型,用以反映自然语言中概念的不确定性。
概念的整体特性用云的数字特征来反映,数字特征用三个参数来描述,分别为期望,熵和超熵论文参考文献格式。
期望表示最能够代表定性概念的点,熵表示定性概念的不确定性度量,反映了模糊性与随机性的关联性,超熵是熵的不确定性度量。
定义2由统计学原理可知,若满足:
~,其中,且对定性概念的确定度满足,则称在论域上的分布称为正态云。
定量数据和定性数据的转换可以通过正向正态云发生器和逆向正态云发生器来实现,如图1所示。
规则推理
图1 云发生器示意图
在不确定性人工智能研究过程中,如图2所示,“软与”可以看成是一个定性概念,处理双条件单规则发生器时,用二维正态云表示,其中两个维的论域分别对应着确定度和的取值范围,即和。
通过“软与”操作转换后的云滴的统计分布的期望是(1,1),则在论域中的这一点上,它的确定度,相当于逻辑上的“与”操作,而其它位置的确定度都小于1,反映了“与”的不确定性,这就是“软与”的特性。
图2双条件单规则发生器
定义3对于多条件单规则If、、…、,Then,前件规则被激活概念的隶属度分别为、、…、,通过“软与”运算SA(SoftAnd)[10]的结果为;则称是分别在概念、、…、下的相关程度,记。
2分析过程及算法描述
2.1分析过程
在多条件单规则发生器中,规则前件的多个条件和规则后件的单个规则可以用形如表1的决策表所描述,其中任意。
表1中表示仅描述了规则集中一条规则的数据分布信息,这条规则为If、、…、,Then。
表1多条件单规则决策表
决策表中所有样本满足同一规则推理,即If、、…、,Then,按规则推理可知,应该把这些样本都归为同一类,即归为概念集合中。
然而根据粗糙集相关原理可知,在属性决策表中,若所有样本的条件属性值和它对应决策属性值都各不相同,则说明这些样本之间存在一定的差异,应该对它实现进一步的分类,从而让更相似的数据样本归为同一类。
事实上,如果所有样本的条件属性值激活每个条件概念属性的隶属度都为1,那么可以推出所有样本决策属性值对应于概念的隶属程度也为1,即对于表1中任意一个样本,若、、…、,一定可以推出。
根据逆向云发生器原理可知,若隶属度为1,则说明为概念云模型的期望值,因此,所有样本就成了同一个样本的复写。
但在工程实践中,决策表是不可以是同一数据的复写,其条件属性与决策属性都不相同,因此,对于可以推出同一规则且具有相同的激活概念的样本,由于条件隶属度的不同,导致每个样本隶属于同一规则(决策属性)的程度存在差异,即隶属于同一决策概念的样本之间可能存在较大的差异,故需对它们实现进一步的分类。
从粗糙集的角度出发分类算法,如果决策属性为连续型数据,那么要对数据样本进行分类,首先将连续型数据转化为离散型数据。
若利用边界划分或人工划分等方法对连续型数据进行离散化,但通常会导致临界数据的划分不合理性,即对数据实现了硬划分。
然而,利用云模型中的云变换,对连续型数据进行软划分,不仅对数据进行了有效的离散化,而且充分考虑到数据客观分布的特性。
、、…、能够推出,说明之间存在一定的相互关系,这样才能共同作用推出规则,这种关系就是“软与”关系,其相关程度的值为“软与”操作的结果。
极端地说,如果激活其相应概念的隶属度都为1,则可以推出,此时值为决策概念的期望值,它最能代表决策概念的特征,说明具有超强关系或稳定关系。
因此,的相互关系是通过对同一决策属性的共同作用来反映它们之间的关系,展示这种关系的过程就是“软与”操作。
相应地,为了方便进一步讨论基于云规则推理的分类思想,需要把表1的决策表变成以隶属度为数据值的决策表,如表2所示。
表2多条件单规则中隶属度的决策表
通过上述分析,表2所有的样本不能简单地把其归为概念类。
那么,这些样本到底可以归为哪些类?
哪些样本能够比较合适地被概念所描述呢?
根据知识的不确定性,概念与概念之间的关系存在着一定的模糊区域,因此,在模式识别或概念识别过程中,对特定概念所描述的区域(或称管辖范围)可以允许存在一定的弹性,使得这个概念随着条件的变化更能够体现其描述的力度。
把这种能够增强概念描述力度的弹性对象称为弹性系数,其值是根据决策表2中所有决策属性值的分布情况来决定的。
通常情况下,弹性系数取值为,其中、分别为概念云模型左右相邻的云模型、与之相交的隶属度值,如图3所示。
图3概念及相邻概念的云模型
图3中,两个红点u1与u2的纵坐标的值就对应于、的值,此时弹性系数的值就为论文参考文献格式。
2.2算法描述
有了上述的分析理论做准备分类算法,则基于云规则推理的分类模型的核心思想如下:
(1)对于决策表2,若第个样本在规则前件的隶属度通过“软与”后得到的相关程度为,若,则把该样本归入概念类中;
(2)若,则利用条件云发生器计算出云模型在激活强度为的值(两个值),即;再利用条件云发生器计算分别在云模型的确定度,即,;
(4)反复执行步骤
(1)~(3),直到为止。
步骤
(2)是分类思想的主要运算部分,其过程及对应值分布如图4所示。
图4各概念被激活的隶属度分布图
3实例分析
通过对某一网站上Web日志上大量数据的采集,对大量不同客户(customer)(customer)的数据进行分析处理,即考虑客户(customer)(customer)在网站上的停留时间,访问次数和访问信息量等条件因素,来调查客户(customer)(customer)对该网站信息的满意程度,最终得到客户(customer)(customer)的有效分类。
图4实际上是该实验过程的结果,通过本文方法,若将最终的决策属性分为三个定性概念,即不满意、较满意和满意三个不同的概念,其对应的云模型分别为:
LCB(29,9.5,0.113),CB(50,8.4,0.097),RCB(85,10,0.082)。
某一客户(customer)(customer)对网站的访问信息为因素集(停留时间、访问次问、访问信息量和满意值),通过计算得到这些条件因素的相关程度。
又因为决策属性的三个定性概念之间的弹性系数为,且,通过算法可知,该用户被归入了概念LCB中。
在此过程中可以最多得到个规则,为每个条件因素的概念个数,例如:
表示决策表中客户(customer)(customer)的满意程度的三个概念。
最终任意一多条件单规则R都可以描述为形如:
“停留时间‘长’、访问次数‘较大’和访问信息量‘一般’分类算法,则客户(customer)(customer)的满意度为‘较满意’”的规则。
与定量数据相比,它更合乎人类的思维模式。
实事上,在模糊模式识别当中,最大隶属原则和择近原则是样本归属分类的主要依据,同样,基于云规则推理的分类模型的出发点也是利用最大确定度的原则来对样本进行恰当的分类,这也就证明了该模型的可行性。
4总结(summary)(summary)
本文提出了一种基于云模型的定性规则推理分类方法,事先通过云变换对每个数值型属性进行离散化,生成一系列用云表示的基本概念集。
将这些基本概念提升到合适的概念层次上,采用极大判定法对每个数值型属性进行软划分,并求得相应被激活各属性概念的确定度,就可以得到基于隶属度的决策表。
该方法摆脱了以往依赖于定量数据的分类,实现了数据的软操作,通过定性推理过程,对数据对象进行定性概念的推理,进而实现了符合人类思维活动的分类过程。
需要说明的是,多条件单规则是多条件多规则的一个子集,可以通过扩展,把多条件单规则拓展到多条件多规则中,实现基于多条件多规则的定性推理分类。
参考文献
[1]谢季坚.模糊数学方法及其应用[M].武汉:
华中科技出版社,2003,7.
[2]李德毅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):
15-20.
[3]李德毅.不确定性人工智能[M].北京:
国防工业出版社,2005.7
[4]杜鹢,宋自林,李德毅.基于云模型的关联规则挖掘方法[J].解放军理工大学学报,2000,1
(1):
29-35.
[5]LiDeyi,DiKaichang,LiDeren,etal.Miningassociationruleswithlinguisticcloudmodels[J].JournalofSoftware.2000,11(20):
143-158.
[6]蒋嵘,李德毅,陈晖.基于云模型的时间序列预测[J].解放军理工大学学报,2000,1(50):
13-18.
[7]柳炳祥,李海林,杨丽彬.云决策方法[J].控制与决策,2009,24(6):
957:
960.
[8]李海林,柳炳祥,杨丽彬.一种基于云理论的考核成绩评价模型[J].计算机时代,2007,10:
4-5.
[9]LiDeyi,HanJ,ShiXM.KnowledgeRepresentationandDiscoveryBasedonLinguisticModels[J].In:
LuHJ,MotodaHeds.KDD:
TechniquesandApplictions.Singapore:
WorldScientificPress,1977,pp.3-20.
[10]李海林,柳炳祥,杨丽彬.云模型中的概念软与方法[J].计算机应用,2008,10:
5120-5124.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 模型 定性 规则 推理 分类 方法