故障诊断学与可靠性工程作业吐血分享.docx
- 文档编号:24254642
- 上传时间:2023-05-25
- 格式:DOCX
- 页数:25
- 大小:690.61KB
故障诊断学与可靠性工程作业吐血分享.docx
《故障诊断学与可靠性工程作业吐血分享.docx》由会员分享,可在线阅读,更多相关《故障诊断学与可靠性工程作业吐血分享.docx(25页珍藏版)》请在冰豆网上搜索。
故障诊断学与可靠性工程作业吐血分享
机械故障诊断学及可靠性工程
MECHANICALFAULTDIAGNOSTICSANDRELIABILITYENGINEERING
作业题目基于冗余第二代小波包变换和邻域粗糙集以及支持向量机的机械故障诊断
作者姓名黎原
作者学号S1*******030
学科专业机械设计及理论
指导教师董敏教授
2013年6月
机械故障诊断学及可靠性工程
基于冗余第二代小波包变换和邻域粗糙集以及支持向量机的机械故障诊断
硕士研究生
:
黎原
硕士生学号
:
S1*******030
导师
:
董敏教授
学科专业
:
机械设计及理论
所在单位
:
机械工程学院
MechanicalfaultdiagnosticsandReliabilityEngineering
Mechanicalfaultdiagnosisbasedonredundantsecondgenerationwaveletpackettransform,neighborhoodroughsetandsupportvectormachine
byLiYuan
Supervisor:
ProfessorDongMin
YanshanUniversity
May,2013
摘要
本文研究的冗余第二代小波包变换(RSGWPT),邻域粗糙集和支持向量机(SVM)(NRS)关于故障检测,属性简约和模式分类中的应用。
在此基础上,提出了基于RSGWPT,NRS和SVM的机械故障诊断的一种新方法,它利用RSGWPT从小波包系数的统计特征中提取故障特征参数构成特征向量的,然后通过NRS法使性能简约从而取得的主要的功能特性,最后这些主要特点被输入到SVM实现故障模式分类。
所提出的方法用于变速箱和汽油发动机气门列车的故障诊断,实验结果表明,该方法可以提取故障特征,具有更好的分类能力,同时在保证分类准确率的情况下,减少了很多的冗余功能,从而提高分类效率,达到更好的分类性能。
关键词:
冗余第二代小波包变换;邻域粗糙集;支持向量机;属性约简;故障诊断
目录
摘要I
正文1
1引言1
2RSGWPT和故障特征提取3
3NRS和故障特征选择5
4SVM和故障特点分类8
5实验装置和数据采集10
5.1变速箱试验10
5.2汽油发动机气门列车实验10
6结果与讨论11
6.1案例1:
变速箱故障诊断11
6.2案例2:
汽油发动机气门的故障诊断13
6.3讨论14
7结论17
致谢18
参考文献19
正文
1引言
随着越来越多的高品质的生产需求,有效的机械故障诊断已获得越来越多的关注[1-3]。
一般来说,在故障诊断系统中的两个重要步骤:
第一个是故障的特征提取的信号处理的,它决定了设备中是否发生了故障,第二步骤包括在先前步骤中获得的特性的基础上的模式分类。
目前故障诊断方法的有效性进行评估时,精度和速度都是非常重要的因素,所以寻找一个准确且快速的方法进行故障诊断是一个重要的问题[4,5]。
总之,机械故障诊断的研究的目的是要找到一种方法,通过使用从收集到的振动信号或声音发射信号中提取出来的故障特征来准确评估故障类型。
初期的故障特征往往是薄弱的,并且隐藏在背景信号中,所以很难用传统的信号处理方法来检测它们。
第二代小波变换(SGWT),由WimSweldens提出,是一种新的小波构成方法,该方法采用了提升方案[6,7]。
它可以被看作是经典的离散小波变换的替代实现。
SGWT主要特征的是它提供了一个完全的空间域变换的解释,而不是传统的基于频域的结构。
SGWT的时间-频率分辨率随分解的水平不同而变化。
它在高频子带提供了良好的时间分辨率和较差的频率分辨率,在低频子带,它提供良好的频率和较差的时间分辨率。
为了在故障特性经常存在的高频子带中获得更高的分辨率,第二代小波包变换(SGWPT)已经建成,并因此在每个层次的细节系数进一步分解从而得到的近似和细节分量[4,8-10]。
不幸的是,SGWPT没有时间不变性。
延迟信号的分解结果,将原始信号的时移版本。
这可能会导致有用信息的特征提取与故障诊断故障的损失。
冗余提升方案具有时间不变性并且克服了提升方案的缺点,摆脱了小碎步和算子和更新算预测的零填充,这使得各级的近似和细节信号与原始信号的长度是相同的[11-13]。
基于冗余提升方案小波包变换不仅能提供更详细的局部时频信号的描述,还能抑制频率混叠成分的分析结果,因为它没有分割和合并步骤的分解和重建阶段[14]。
因此,统计功能从变换系数RSGWPT提取有更大的能力来检测故障信号。
一般来说,震动信号是从 监控机械设备中获得的。
A/D转换后,采样的振动数据分解使用RSGWPT。
从每一个所得到的子带的小波包系数,可以计算出统计特性来描述每一个尺度的信号的特性。
这些统计功能,可以直接在故障诊断应用,但在实践中,从实验数据中提取的某些功能通常是不完善和冗余,甚至对方不兼容,因此给机械故障诊断带来了很多问题,如高计算复杂度,低的识别速度和识别效果弱。
因此,调查故障诊断方法使用较少的属性值,而不错过任何故障信息是非常有意义的。
粗糙集理论是解决不确定的,不精确的和模糊的信息问题的一种有用的数学工具,这方面的知识是关于域名COM分区和粒度特性。
粗糙集理论的特点是创造近似描述对象进行数据分析,优化和认可,它不需要域或先验知识。
因此,使用这种方法可以评估的各种属性的重要性,并没有额外的知识,除了保留一些关键的属性所需提供的数据[5]。
目前,粗糙集方法已经应用在许多领域,如机器故障诊断,股市预测,决策支持系统,医疗诊断,数据过滤和软件工程[15-18]。
然而,经典的粗糙集模型可以被用来处理类别特征是离散值,因此机械故障诊断系统中基于粗糙集的特征选择,因此有必要引入一个离散化算法分区值域实
图1.提出的故障诊断程序的流程图。
时值的变量分成几个时间间隔,然后把它们看作是类别特征。
近年来许多的数值属性离散化方法已经提出,包括等距离方法,频率相同的方法,最大熵法等[16]。
显然,离散化的数值属性,可能会导致信息丢失,因为不考虑数值离散化值的隶属度[19,20]。
为了解决这个问题,引入一个邻域粗糙集模型,可以处理分类和数值属性,一些属性约简算法基于此模型已建成[20-22]。
由于数值属性离散化的情况下的故障信息,邻域粗糙集模型的属性约简,可以完美地保存原始数据。
对于分类,文献中有很多关于特定应用的最优分类,例如齿轮故障检测,复式压缩机,滚子轴承等等[23-26]。
支持向量机(SVM)是一种新型的基于统计学习理论的机器学习方法,该方法最初是由Vapnik介绍,其中有许多吸引人的特点,包括其理想的分类能力有少量的非现场故障数据样本和有前途的实证表现线
性和高维模式识别[27-29]。
根据上述原则,本文提出了一个新的机械设备故障诊断方法,它利用了构建在冗余提升方案和SGWPT基础之上的RSGWPT来提取故障特征参数,然后运用NRS方法使故障特征向量的属性约简从而获得主要特性参数,最后这些主要特点输入到SVM实现故障模式分类。
故障诊断方法的流程图建议如图1所示。
本文的其余部分安排如下:
在第2节中,统计参数的小波包变换系数作为故障特征由RSGWPT所提取。
在第3节,通过NRS法,特征向量被减少,一些关键功能也被选择了进行分类。
在第4节中,我们使用支持向量机来完成基于选定的功能基础上的故障模式分类。
在第5及6中,所提出的方法应用于汽油发动机的齿轮箱和气门传动诊断不同的状态,结果已验证建议的诊断方法的有效性。
最后的结论将在第7节中进行了简要叙述。
2RSGWPT和故障特征提取
为了完成RSGWPT的构建,本节介绍SGWPT和冗余提升方案。
首先SGWPT的分解和重建阶段说明如下。
SGWT的分解阶段包括三个步骤:
分裂,预测和更新。
在分解阶段,根据下面的公式计算每个子带的系数:
SGWT的重建阶段的是分解阶段的一个相反的过程,其中包括逆更新步骤,逆预测步骤和合并步骤。
在重建阶段,将要被重构子带系数被保留,然后其他子带系数被设定为零。
最后,重构的结果,由公式如下得到:
图2.RSGWPT的分解阶段
其次,在冗余提升方案,小碎步将被丢弃。
假设Pl和Ul分别代表l级冗余提升方案的预测和更新算子,则Pl和Ul的系数通过用零[11]填充P和U初始算子Pj和Uj得到。
运用冗余提升计划和SGWPT,RSGWPT很容易被构造。
RSGWPT在l级的预测步骤和更新步骤通过使用Pl和Ul进行预测,表示如下:
RSGWPT的重建阶段可以从其分解阶段得到,并且可以由下述公式表达:
RSGWPT的分解和重构的阶段分别由图中2和图3表示。
由于没有RSGWPT分解阶段的分割操作,所有各级的近似和细节系数与输入信号具有相同的长度。
因此,RSGWPT的分解结果具有时间不变性,并且保持完美的原始信号的信息。
此外,它还具有抑制频率混叠性能[14],这是非常有用的故障特征提取与故障诊断。
使用RSGWPT对采样的振动数据分解,从每一个所得到的子带的小波包系数,九个统计特性包括峰值,均值,标准差,均方根,形状系数,偏度,峰度,峰值因数和脉冲指数指的是在每一个尺度来描述的信号的分布特性。
如果RSGWPT的分解水平是l,即,子带的小波包的数目为2l,和n统计特性从各子带中提取的,那么所形成的故障的特征向量有2l乘以n功能的参数。
根据这些统计特性,可以得到的特征向量,并且,故障的原因和类别的特征向量的映射关系,也可构建。
3NRS和故障特征选择
基于粗糙集的特征选择的动机是选择一个最小的属性子集,它作为整个属性集具有相同的特征。
古典粗糙集模型只适合处理的分类功能。
虽然作为数字数据,它广泛存在于机械故障诊断的实际应用,但有必要转换数值属性分类属性。
研究人员通常采用离散化算法值域实值变量分成几个间隔分区,然后把它们看作是类别特征。
这种转换可能不仅会导致信息丢失,而且也使得获得的结果在很大程度上取决于离散效应。
为了解决这个问题,邻里粗糙集模型被提出[20,21]。
下面介绍了它的基本概念和原理。
在信息系统中,U是一个非空有限集合,被称为总体的样本{X1,X2,...,XN},A是一组属性{A1,A2,...,AM}(也称为功能),它表明了样品特性。
具体来说,也称为决策表,如果A=CD,其中C为条件属性和D为决策属性集。
给定一个xi∈U,B
C功能空间B中的xi的邻域被定义为:
其中δ是邻域的大小,而⊿是一个距离函数。
特别的,如果B是分类的功能集,则δ=0。
一般归结距离被定义:
其中xik和xjk分别是xi和xj在功能为k时的值。
P是一个不小于1的实数。
根据所选择的不同的P值得到三种距离函数:
(1)当P=1时,为曼哈顿距离⊿1;
(2)当P=2时,为欧氏距离⊿2;(3)当P=∞时,为切比雪夫距离⊿3。
δB(xi)是以样本xi为中心的邻域信息点,它受两个重要因素的影响。
一个是所使用的距离函数,该函数决定邻域的形状,另一个是阈值δ,用于控制邻域的大小。
如果属性集A中同时包含数值属性B1和分类属性B2,那么由B1,B2和B1∩B2得出的样本x的邻域被定义为:
从上面的定义中,我们可以看到,样本领域内在类别特征的数值的功能很有多相同的值,其距离比阈值δ低。
总体中的领域关系式N可以写成相关矩阵(rij)n×n的形式,如Eq中所示。
邻域关系中绘制在一起的对象在距离上具有相似性或不可分辨性。
如果在系统中有一个属性在总值范围内生成一个邻域关系,那么这个信息系统被称为邻域信息系统,记为NIS=。
具体来说,如果在系统中有两种属性集,即A=C∪D,其中C为条件属性集,D是决策属性集,那么至少存在一个条件属性,它包括总体中的邻域关系,邻域信息系统也被称为邻域决策系统,它由NDT=表示。
假设x1,x2,…,xm是命令1-N的对象子集,δB(xi)是由属性子集B
C产生的样本xi的邻域信息。
相对于属性B的定值D的下限和上限的约数被定义为:
其中
定值的下限约数也被称为定值正区域,用POSB(D)表示。
对象的子集邻域地区均属于决策类。
与此相反,位于邻域子集的边界区域(BN(D)=NBD-NBD)的样本来自于一个以上的决策类中。
因此邻域模型将样本分为正区域和决策类边界地区。
正区域中的样品可分为没有不确定性的决策类和不能被确定的边界区域分类,后者很容易被错误分类。
因此,边界区域越大,条件属性的特征越不明显。
为了表征功能的显著性,D-B的依赖程度被定义为:
其中︱·︱是一个集合的基数。
γB(D)反映B近似D的能力,它可以用来测量特征子集的重要性。
运用的上述属性评价方法,本文采用了基于邻域粗糙集模型的属性约简算法计算正无穷的数值。
从一个空集开始,该算法计算每一轮的所有其他属性中该属性的比重,并具有将比重最大的属性加入到还原集的功能。
直到该属性的比重在其余所有属性中的比重接近于零,该算法才停止。
该算法被描述如下:
步骤1:
给定一个邻域决策系统NDT=作为输入,其中U是一个非空有限的样本集{x1,x2,…,xn};A=C∪D,其中C为条件属性集,D是决策属性集;
步骤2:
对于
a∈A,计算Na的领域关系;
步骤3:
让
→red,其中red是包含所选属性的区域;
步骤4:
属性的子集的比重可以由SIG功能定义。
对于每一个ai∈A-red,计算其Sig(ai,red,D)=γred∪a(D)-γred(D);
步骤5:
属性选择的目的是要搜索属性的一个子集,使得它的分类问题在所选择的特征空间中具有最大的一致性,属性评价的措施之一是选择一个满足下式Sig(ak,red,D)=max(Sig(ai,red,D))的ak值。
步骤6:
如果Sig(ak,red,D)>0,red∪ak→red,那么程序转到步骤4;否则回到red的还原效果。
图3.RSGWPT的重建阶段
4SVM和故障特点分类
SVM是一种统计机器学习技术,已被广泛应用在模式识别领域。
让
表示一个实验样本集S,每一个样本
属于集合
。
支持向量机的目标是要找到一个超平面来划分S,例如,与同一个标签上的所有点的超平面的同一侧上,而这两个类A和B之间与和超平面的距离达到最大化。
两个数据集的最优超平面的一个例子如图4所示。
如该图4所示,圆圈和方块分别代表两类相同的样本点。
H是一个分离平面。
H1和H2是分别平行于H的平面,并且通过这些级别中离H最近的采样点。
H1和H2之间的距离被定义为余量。
具有泛化误差最小的最佳分离平面是一个不仅能正确将所有样本点分为这两级,而且但也在H1和H2之间的留有最大分差。
应用核函数,支持向量机可以用于非线性分类任务中。
其基本思想是使用非线性变换到一个高维特征空间的变换输入向量,然后在特征空间中进行线性分离。
为了构建一个非线性支持向量分类模型,内积(xi,x)的被核函数K(xi,x)所取代,如以
图4.(A)小幅度分离平面和(B)大幅度的分离平面
图5.变速箱四个条件下一个周期内的振动信号
下等式中所示:
支持向量机具有两个层次。
在学习过程中,第一层从给定的一组由内核中定义的基地中选择基础K(xi,x),i=1,2,...,N;第二层在这个空间内构造的一个线性函数。
这和在对应特征空间构造最优超平面是完全等价的。
通过使用不同的内核功能,如线性,多项式,高斯和拉普拉斯径向基函数,SVM算法可以构建多种学习机制。
在本文中,采用序列最小优化(SMO)算法来验证支持向量分类。
径向基核函数的被选用并且复杂性参数C被设置为10。
所有算法由十倍交叉验证法进行测试,该方法把样本分成10份,9份用于实验,其余的1份进行测试。
的10次试验的结果被看作是所有测试的平均值。
5实验装置和数据采集
为了证明提出的故障诊断方法的性能,本节中提供二种实验设置来提供汽油发动机的齿轮箱和阀列车由各种故障情况下的振动信号。
5.1变速箱试验
该实验装置包括一个四速摩托车变速箱根据测试的基础上,一个恒定的标称转速为1420rpm的一个电机,负载机制,多道脉冲分析仪系统,三轴加速度计,转速计和四个减震器根据试验台的基础[32]。
使用加速度计,从实验测试的齿轮箱的振动测量的信号。
加速器安装在齿轮箱的输入轴的轴承箱的外表面。
使用分段三次Hermite插值法测得的振动信号的二维同步从创新的角度来看,这不能保证与转速表所需要的信号相同步。
每转一圈的信号的同步之后,在这四种状态一个周期中的振动数据如图5所示。
表1汽油发动机气门的五种状态
状态代码
故障描述
S-1
正常状态
S-2
进气门间隙的4缸和4缸的排气门间隙过大
S-3
进气门间隙的第3和第4缸和第2缸的排气门间隙过大
S-4
进气门间隙的第4和第1缸排气门间隙过大
S-5
进气门间隙的第3和第4和第1和第2缸的排气门间隙过大
5.2汽油发动机气门列车实验
第二个例子是,以确定不同的汽油发动机的气门传动条件。
由脉冲传感器产生的四气缸的
极限位置线被设定为所有信号的基准点。
一个工作周期振动信号的记录,其中包括约7201曲轴转角。
振动的加速度传感器被安装在所述气缸盖中,采样频率为16千赫。
对几个典型故障的阀门火车进行模拟,如进气门间隙过大和排气门间隙过大。
测试了五种状态,包括阀列车的四个故障状态和一个正常状态。
气门的五种状态如表1所描述示。
这五个状态在一个周期中的振动数据如图6所示。
图6.五个条件一个周期内的气门的振动信号
6结果与讨论
为了确定汽油发动机的监控齿轮箱和气门传动的不同的工作条件,建议实施上述的故障诊断方法。
6.1案例1:
变速箱故障诊断
首先,对于变速箱的故障诊断来说,使用RSGWPT将样本数据分解为3级。
分别选择原始的操作数P和U,M=4,N=4。
基于ISM,初步预测算子P为[0.0625,0.5625,0.5625,0.0625]初始更新算子U为[0.0313,0.2813,0.2813,0.0313]。
然后获得八个子带系数,从而可以计算每个样品72的统计特性。
通过网络实名制, 使用所有故障的功能和选定的故障功能,分类精度得到了研究。
结果在表2中列出。
变速箱试验的分类精度,对于使用所有故障的特性并且通过NRS使用所选择的错误的功能的方法来说几乎是相同的。
因为这个实验的数据的分类具有较低复杂性。
为了解释建议的故障诊断方法的优点,运用邻域粗糙集可靠功能所计算的单一的故障的功能的意义如图7所示,并且邻域的大小被设置为0.2。
表2通过NRS使用所有故障功能和选定的故障功能获得变速箱试验的分类准确率(%)
分解水平
提取特征
特征选择
使用所有功能的分类精度
使用所选功能的分类精度
1
18
4
99.94
99.96
2
36
3
99.98
100
3
72
2
100
100
图7.变速箱实验相邻相关单一功能参数的差别对比
图8精确度随变速箱按差异降序排列中附加的特征参数的增加
结果表明,所提取故障特征的差别是不同的。
某些功能的差别较大,有些是零。
因此,故障特征向量的特性,对于识别不同的工作条件不都是有用的,也就是说,它包含一些无用的和冗余信息。
为了解释这个问题,功能参数根据自己的等级进行降序排序。
然后依次使用最好中的的一个,两个,...,k个来构建分类模型。
图8表明, 分类功能的精度,通过使用这种方法,增加了这种差别的降序排列。
从图8,我们可以发现,对于齿轮箱的实验中,随着添加功能的数目的增加,分类精度有所改进。
但是,当数大于20时,分类精度停止提高。
这意味着后面的故障特性是完全无用的故障模式分类。
这种方法被称为的排序功能选择方法。
在该方法中存在的问题是不能够识别冗余的功能参数。
第3节中提到的贪婪搜索策略,可以在一定程度上缓解这一缺点。
图9表明,分类功能变化,随着一定选用功能采用基于NRS的贪婪的数值属性约简算法而更加精确。
我们可以发现,使用基于贪婪搜索战略的特征选择,对于变速箱实验,只需要大约2个功能参数,分类精度就可以达到99%以上。
这似乎是,故障特征向量中的许多特征参数能够进行更新,从而提高学习速度和分类效率。
6.2案例2:
汽油发动机气门的故障诊断
对于汽油发动机气门故障诊断来说,由于这5个状态之间的差异是非常小,也就是说,不同的状态的分类的复杂性高于齿轮箱实验的样本数据,因此,实验结果表明所提出的诊断方法的优势更加明显。
使用RSGWPT,样本数据分解到5级,最初的算子P和U的选择和以上变速箱的实验一样。
其结果列于表3。
图9.变速箱实验中随着使用基于NRS的贪婪的数值属性约简算法的一定数量的选定特征参数而产生的精确度的变化
表3通过NRS使用所有故障的功能和选定故障功能获得汽油发动机上气门分类准确率(%)
分解水平
提取特征
特征选择
使用所有功能的分类精度
使用所选功能的分类精度
1
18
14
82.37
83.10
2
36
18
89.13
89.16
3
72
13
94.48
94.41
4
144
11
97.34
97.28
5
288
9
97.83
98.01
从表3中,我们可以看到,通过NRS使用选定的故障功能所得到的分类精度,
接近或略多于使用所有故障功能所得到分类精度。
但是,考虑到模式分类的时间和空间成本,所提出的,通过NRS,包含功能选择诊断方法,显然是一个全面的性能优化方法。
此外,该结果也表明,分类精度随着分解级别的增加而增加,同时,增加速率有降低的倾向。
这似乎表明,分解层次的增加会导致更高的分类性能。
另一方面,RSGWPT的运算成本和分类的复杂性也随着分解级别的增加而增加。
因此,当选择一个特定的故障诊断问题的分解等级的时候,不可避免地,需要在分类精度和算法的复杂性之间进行权衡和舍取。
邻域的大小被设置为0.2,同时,通过邻域粗糙集相关性功能计算所得到的3级和5级的单一故障特性参数的差别分别展示在图10(A)和(B)中。
结果再次表明,故障的特征向量的特征参数对于识别不同的工作条件不都是有用的,并且,它包含冗余的信息。
图11和图12表明,在3级和5级,随着功能参数被加入到差别的降序排列之中,分类更加精确了,同时,随着采用基于NRS的贪婪的数值属性约简算法的选定特征参数的增加,分类的变化也变得精确。
从图11和12,我们可以发现,分类精度随着附加功能参数的数量的增加而得到改善,直到数量为27(第3级)和72(5级),分类精度不再提高。
然而,对于使用基于NRS的贪婪的数值属性约简算法的方法,只需要约13(第3级)和9(5级)的性能参数,就可以使分类精度分别达到94%和98%以上。
6.3讨论
根据[32],对于变速箱的故障诊断,首先是将样本数据使用WPT分解为4级,得到16个子带系数,结果计算出构成故障特征向量的每个子频带的标准偏差值。
因此,在特征向量中有16个故障特征参数。
最后,将特征向量输入人工神经网络来完成故障模式分类。
有研究结果显示,使用这种故障诊断方法的分类准确率能达到100%。
但在本文中,用变速箱(相同的振动信号样本[32])进行故障诊断的实验结果表明,只使用2个故障特征参数时分类精度可以达到100%。
在汽油发动机阀列车实验中,情况与第一个样本一样。
实验结果表明,邻里特征选择算法能够删除大部分冗余和不相关的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 故障诊断 可靠性工程 作业 吐血 分享