1、在故障诊断规则库的建立过程中综合考虑了诊断模型结构的复杂性和故障信息的利用效率,利用粗糙集相对约简的不唯一性,对汽轮发电机组的故障征兆进行分类,形成不同的证据来源,既实现了证据理论对于同一事物要求有不同的证据来源的要求,又对故障征兆进行了降维处理,消除了故障信息的冗余性。实例证明,基于多故障诊断规则库信息融合的诊断识别准确性和可靠性比基于单一故障诊断规则库的诊断识别有较大的提高。关键词:汽轮发电机组;主元分析;聚类分析;粗糙集;证据理论;故障诊断0 引言汽轮机发电机组是火电站的关键设备, 汽轮发电机组的故障停运严重影响火电机组运行的可靠性和经济性,所以汽轮机发电机组的状态监控和故障诊断一直备受
2、关注,人们对其进行了大量的研究工作1-7。振动是汽轮发电机组状态最常见的外部表现形式,振动信号中包含了丰富的机组状态信息,当机组发生故障时,其振动形态也将发生改变。长期以来,对于汽轮发电机组的振动故障诊断方法,主要是采用振动频谱分析的方法,通过分析转子的振动频谱图或利用提取出来的频率特征进行分析和计算来区分判断故障的类型,现有的故障诊断方法大多数还是基于振动的频谱特征来实现的。但是振动的频谱特征只是反映了汽轮发电机组故障的部分信息,还有些故障不能根据振动特征明显区分开,这就需要引入其它征兆进行判别,如温度、压力等参数变化情况及振动信号的各种趋势分析等。因此,如何既能充分利用振动的频谱特征这一重
3、要故障征兆作为故障诊断的重要证据,又能综合利用反映故障不同方面信息的不同类型的故障征兆,从而可以更准确的进行故障别,成为目前急待解决的问题。聚类分析就是将研究或处理的对象按照一定的条件或属性进行分类的数学方法。这种方法有广泛的实际应用,是数理统计多元分析的一个分支8。在故障诊断中使用聚类分析,可以对故障类型进行分类,找到相似故障之间的某些共同之处。信息融合就是将多源信息进行综合处理,从而得到更准确更可靠的结论。基于证据理论的信息融合技术在故障诊断中得到了广泛的应用,已被证明是一种有效的算法9。为此,本文提出了一种聚类分析与信息融合相结合的振动故障诊断方法。利用振动的频谱特征对振动故障的几种常见
4、故障模式进行分类,形成故障模式类,从而可以在故障模式类层次区分开属于不同性质的故障模式,解决类间的识别问题,进而缩小故障模式的识别范围。对于同一故障类中的故障模式,采集不同类型的故障征兆,利用粗糙集相对约简的不唯一性,对故障征兆进行提取,构成含有不同故障征兆且具有独立诊断能力故障诊断规则库,把故障诊断规则库中故障诊断结论的可信度作为初步诊断结果,应用证据理论对不同故障诊断规则库的初步诊断结果进行信息融合,以实现故障模式之间的准确识别。1 相关理论1.1主元分析1901年, Pearson提出了主元分析(PCA)方法,这种方法是一种基于多元统计分析的数据降维和特征提取方法,能有效去除数据间的相关
5、性,降低计算复杂度。主元分析根据数据的相关性分析,将数据投影到负荷向量中,得到能反映原始数据信息的线性无关向量。主元分析的具体算法见文献1011。1.2 模糊C均值聚类1973年,Bezdek提出了模糊C均值聚类(FCM)算法,作为早期硬C均值聚类(HCM)方法的一种改进。模糊C均值算法不仅能够用于完成聚类,而且还能获得每一类别的聚类中心。在传统的硬C划分中要求将样本划分成C个互不相关的子空间。而在模糊C划分中,各样本以一定的程度隶属于C个不同子空间。模糊C均值聚类的具体算法见文献1213。1.3 粗糙集1982年波兰数学家Pawlak提出了粗糙集理论,该理论是一种刻画不完整性和不确定性的数学
6、工具,能有效地分析和处理不精确、不一致和不完整等各种不完备信息,并从中发现隐含的知识,揭示潜在的规律。粗糙集理论对知识的分类主要是通过知识的约简来实现的。由于信息系统的属性并非同等重要,甚至一些属性是冗余的,因此通过知识约简在保持系统分类能力不变的条件下,删除不相关或不重要的属性知识,提取出最能反映系统特征和变化规律的属性与规则,使系统达到最简化。粗糙集约简的具体算法见文献1415。1.4加权模糊逻辑推理在诊断推理过程中,简单的非真即假的二值逻辑往往不适应需要。汽轮发电机组故障诊断中存在着大量不完全的知识和模糊知识,不具备确定的状态。一条诊断规则通常按照其真实性可信赖度的大小赋以一个0到1之间
7、的一个值,并由多个前提条件决定,每个前提条件也不等量齐观,往往具有主次之分,因而要对不同的前提条件赋予不同的权值,以此体现各自在诊断规则中的重要性程度,前提的不确定性也决定了诊断规则的不确定性,这就是加权模糊逻辑推理。加权模糊逻辑推理的具体算法见文献1617。1.5 证据理论证据理论是由Dempster在1967年最初提出的,后来由Shafer推广并形成证据推理,因此又称为Dempster-Shafer理论,简称D-S证据理论,在处理不确定性推理方面具有独特优势。证据理论针对具体诊断目标建立识别框架,把不同故障目标的可信度分配函数按照融合规则进行融合,确定新的可信度分配函数,再计算信任测度和似
8、然测度,产生各故障目标的信任区间,最后根据决策规则进行诊断决策,从而实现对故障目标的诊断。证据理论的具体计算方法见文献1819。2 振动故障聚类分析2.1 汽轮发电机组常见振动故障的频谱特征表1是汽轮发电机组常见振动故障的频谱特征表20,表1中的数据表明,不同的故障对应着不同的频率成分,频率可以反映故障的性质;存在着具有相似频谱结构的故障,因此利用频谱信息进行诊断,必然不能区分开有相似谱结构的故障。可以对故障频谱进行聚类分析,以确定常见故障的模式类及其模式中心的分布,从而在故障类层次上进行模式识别。2.2 采用主元分析方法进行特征提取对于振动故障频谱特征采用主元分析方法进行二次提取,这是因为频
9、谱特征参数之间存在着强相关性,对频谱特征参数使用主元分析方法进行特征提取,可以剔出变量之间的相关性以及冗余性,然后再进行聚类分析,这样不但可以剔出干扰信息影响,而且可以降低聚类分析时输入变量的维数,简少聚类分析的计算量。主元分析后的汽轮发电机组振动故障频谱特征表见表2。表2 主元分析后的汽轮发电机组常见振动故障频谱特征表Tab.2 PCA spectrum feature table of commonvibration fault for turbogenerator 故障征兆故障模式第1主元第2主元第3主元第4主元1转子质量不平衡0.7052-1.08431.0315-0.67592转子热
10、弯曲3转子部件脱落4动静碰摩0.62242.18630.38040.47045不对中1.7019-0.3031-0.3094-1.45686轴裂纹2.66011.26551.0347-0.53147轴承座松动-0.8725-0.41842.51561.25558油膜涡动-1.8913-0.70790.5669-0.64469油膜振荡-1.8771-1.02270.5103-1.219810蒸汽激振-2.4592.2534-1.6040.09892.3 采用模糊C均值聚类方法进行聚类分析对表2中的故障模式进行模糊C均值聚类分析,求取故障的模式类及模式中心。对表2中的数据样本进行初始化及相似矩阵计
11、算后确定初始矩阵U(0),取C=3,q=1.1,=0.001时,聚类计算后得到3个故障模式类,其中(1,2,3)为第一类,(4,5,6)第二类,(7,8,9,10)为第三类,因此故障模式类第一类为1倍频类故障;第二类为高频类故障;第三类为低频类故障。3个故障模式类的聚类中心为:V1=(0.7052,-1.0843,-1.0315,0.6759);V2=(-1.7750,0.0261,0.4972,-0.1275);V3=(1.6615,1.0496,0.3686,-0.5059)。表3以表格形式反映了振动故障模式类主元特征,表3可以看作是对表2主元分析后汽轮发电机组振动故障频谱特征信息的二次处
12、理,对信息的再提炼,目的是形成新的模式,增强类间距,排除误识别,提高正确的识别率。表3 振动故障模式类主元特征表Tab.2 PCA Spectrum feature table of common vibration fault mode classification for turbogenerator 主元故障模式类1 -1.03150.67592 -1.77500.02610.4972-0.12753 1.66151.04960.3686-0.5059在进行故障识别时,实际的测试值与故障模式中心进行比较,确认属于哪一个故障模式类。由于本方法的目的是利用汽轮发电机组振动故障频谱信息,所以选
13、用欧式距离作为贴近度,通过求贴近度进行故障模式类识别。对于N类模式识别,用M维矢量Vj表示第j类模式聚类中心,设第i个测试数据Xi=(x1,x2, ,xM),则第i个测试数据对第j类模式的贴近度为: (1)式中,cjk为第j类模式中心第k个特征元素。xik是第i个测试数据Xi的第k个特征元素。欧式距离表达了测试数据Xi与N个模式类中每一个标准模式Vj的接近程度,dij越小,说明测试数据Xi与Vj表示的故障标准模式类越靠近。根据汽轮发电机组振动故障模式的聚类分析结果,得到汽轮发电机组振动故障模式划分,如图1所示。3 基于粗糙集的振动故障诊断规则库的建立3.1 振动故障知识库的建立表4是汽轮发电机
14、组常见振动故障的故障知识库,该表表明了振动故障模式与故障征兆之间的关系,是通过对振动故障机理的研究及前人实验的结论21-22得到的,表中数据表明了当故障发生时各个故障征兆所处的状态。图1 汽轮发电机组常见振动故障分类Fig.1 Diagram of common vibration fault classification for turbogenerator3.2 故障诊断决策表的建立根据表4给出的汽轮发电机组常见振动故障知识库,和2.3节中对振动故障模式分类的结果,形成三个故障模式类诊断规则库,用粗糙集方法对故障诊断规则进行提取。表5给出了故障征兆集合C,表示条件属性;表6给出了故障模式集
15、合D,表示决策属性。本文给出了高频故障模式类的故障诊断决策表,如表7所示。3.3 基于粗糙集的诊断规则库的建立利用粗糙集对每个故障模式类的故障诊断决策表分别进行约简,得到各故障模式类的相对约简,根据约简结果建立相应的故障诊断规则库。每个故障模式类都存在多个相对约简,如何在多个相对约简中选取所需的约简来建立故障诊断规则库,需要综合考虑诊断模型结构的复杂性和信息的利用率,可以遵循以下原则:1)两两约简的交集尽量大;2)具有交集的约简的并集尽量大,尽量把条件属性平均分配到诊断规则库中,使每个规则库尽量具有均等的诊断能力;3)所有约简的并集尽量大,最好等于条件属性集合C;4)为避免模型过于复杂,选取诊
16、断规则库的个数尽量少,在本文为每个故障模式类选取两个诊断规则库。根据以上选取原则,以高频故障模式类为例,对高频故障模式类的故障诊断决策表进行约简,得到该故障模式类的相对约简表,如表8所示。表8 高频故障类相对约简表Tab.8 Reduction table of high frequency fault mode class序号相对约简1 c1 2 c2 3 c11 4 c3,c65 c3,c76 c4,c67 c4,c78 c5,c69 c5,c710 c6,c811 c7,c812 c6,c913 c7,c914 c6,c1015 c7,c10在表8中,约简c3,c6, c6,c8, c6
17、,c10彼此存在交集,可以取并,形成一个规则库Q1=c3,c6,c8,c10;约简c4,c7, c5,c7, c7,c9,可以取并,形成一个规则库Q2=c4,c5,c7,c9;约简c1,c2,c11做为单独的约简,分别添加到这两个规则库中,使Q1与Q2的并集与条件属性集合C相同。添加后的Q1= c1,c3,c6,c8,c10,Q2= c2,c4,c5,c7,c9,c11,Q1作为故障诊断规则库1,Q2作为故障诊断规则库2,这样既不影响每个故障诊断规则库对于故障状态的划分能力,又考虑到了冗余信息的综合利用。依据这个原则,建立各个故障类的故障诊断规则库,本文给出了高频故障模式类的故障诊断规则库,如
18、表9所示。表9 高频故障类故障诊断规则库Tab.9 Rule base of high frequency fault mode class故障诊断规则库 c1,c3,c6,c8,c10 c2,c4,c5,c7,c9,c113.4诊断规则的提取根据诊断规则库中所包含的条件属性,对诊断规则进行提取,并对规则中的每个条件属性赋予相应的权值,解决了人工故障诊断过程中规则匹配的权重分配问题。由专家凭经验给出的权重虽然能在一定程度上反映实际情况,但其具有一定的主观性,有时不能反映实际情况,从而导致诊断结果与实际情况发生较大偏离,而基于粗糙集理论得到的权重分配方法,克服了主观分配权重存在的不足,使权重分配
19、结果符合实际。属性ci与决策属性D之间的依赖程度定义为 (2) 式中表示D的ai正域中对象的个数, |U|表示整个集合对象的个数。在诊断规则中每个条件属性的权重被定义为 (3)本文给出了高频故障模式类的故障诊断规则库中诊断规则的提取及规则中条件属性的权重,如下所示。1)高频故障模式类故障诊断规则库1的诊断规则为: If “特征频率为组合频率” and “相位特征不稳定”and“进动方向可能出现反进动” and “振动不随负荷变化而变化” and “振动不随油压变化而变化” then “故障为动静碰摩”;If “特征频率为2X” and “相位特征稳定”and“进动方向为正进动” and “振动
20、随负荷变化而变化” and “振动随油压变化而变化” then “故障为不对中”;If “特征频率为1X” and “相位特征不稳定”and“进动方向为正进动” and “振动不随负荷变化而变化” and “振动不随油压变化而变化” then “故障为轴裂纹”。按公式(2), (3)依次计算得到每条诊断规则的依赖程度,权重分别为,;。2)高频故障模式类故障诊断规则库2的诊断规则为:If “常伴频率为0” and “振动不稳定”and“轴心轨迹紊乱” and “振动不随转速变化而变化” and “振动不随油温变化而变化” and “振动信号的波峰多,波形毛糙、不稳定,或用削波现象” then “
21、故障为动静碰摩”;If “常伴频率为1X” and “振动稳定”and“轴心为香蕉型” and “振动随转速变化而变化” and “振动随油温变化而变化” and “波形为正弦波” then “故障为不对中”;If “常伴频率为2X、3X” and “振动不稳定”and “轴心轨迹紊乱” and “振动随转速变化而变化” and “振动不随油温变化而变化” and “波形为畸变正弦波” then “故障为轴裂纹”。3.5诊断规则可信度的确定在故障诊断过程中,应用加权模糊逻辑推理对诊断规则进行匹配,得到诊断规则的可信度。故障诊断规则中前提条件模糊量的确定有两种方式:(a)根据用户的回答形成的证据
22、;(b)系统通过自动获取算法获得的证据。在本文中采用下面三种方式之一获得。1)如果规则的前提条件是确定性的,则提出的问题是确定的,用户只要给出确定或否定的回答,推理机将根据回答获得置信度1或0。2)如果规则的前提条件是不确定的,则提出的问题将是模糊的,用户可以直接输入置信度,也可以从模糊量词中选取,系统将根据模糊量词量化区间,量化用户的模糊回答,得到置信度。模糊量词量化区间:非常确定,0.70.9;基本确定,0.40.6 ;不确定,0.10.3。3)如果调用的规则前提条件中包含系统的监测量,同时该前提条件又是不确定的,则推理机将调用相应的隶属度函数,根据实际的测量值,计算置信度。4 基于证据理
23、论的信息融合将故障模式类的两个故障诊断规则库的初步诊断结果通过D-S证据理论进行信息融合,得到最终的诊断结果。故障模式类识别框架应该是故障模式类中各故障模式的并集,由于本文计算过程中选取的各故障模式相同,故障模式类即为诊断模型的识别框架。将每个诊断规则库的诊断结果作为一个独立的证据体。本文将各诊断规则库的诊断结果进行转换后作为识别框架上命题的基本概率分配,实现基本概率分配赋值的客观化。由于每个诊断规则库的诊断能力是有限的,因此每个诊断规则库存在一个可靠性系数a,即证据的折扣,它表示对某一证据体的信任程度,在本文中将用规则可信度作为可靠性系数。设某个故障类的第i个诊断规则库的第j个输出值为Oi(j),则该诊断规则库对判断j的基本概率分配为 (4) (5)式中mi(j)表示第i个证据对判断j的信任度分配,n表示故障模式类识别框架中故障模式的个数,mi()表示对第i个证据的不确定性的信任度分配。在本文中规则可信度作为可靠性系数a确定为0.7,根据诊断决策规则的规定,所定位的故障类型与其他故障类型的信任函数值之差必须大于阈值2,如果2取得太大,则无法得出诊断结论;