GLT-CNN方法及其在航空发动机中介轴承故障诊断中的应用

    王奉涛 薛宇航 王洪涛 马琳杰 李宏坤 韩清凯 于晓光

    

    

    

    摘要:航空发动机中介轴承故障振动信号是一种非平稳非线性信号,其中常混有干扰信号及噪声成分。以往方法大多采用人工特征提取来进行故障识别,特征提取往往依靠专家经验,不仅增加识别复杂度,同时选取的特征也不能很好地表征状态信息。因此提出一种基于卷积神经网络( Convolutional Neural Networks,CNN)的中介轴承故障诊断方法,首先将原始故障振动信号进行灰度变换(Gray-level Transformation,GLT),然后输入到结合滑动平均模型的卷积神经网络中,并选用相应的神经网络优化算法实现故障诊断与分类。最后,通过航空发动机中介轴承振动数据,验证所提方法的有效性。

    关键词:故障诊断;轴承;卷积神经网络;灰度变换;优化算法

    中图分类号:TH165+.3;TH133.3

    文献标志码:A

    文章编号:1004-4523 (2019) 06-1077-07

    DOI:10. 16 385/j. cnki. issn. 1004-4523. 2019. 06. 017

    引言

    中介轴承作为航空发动机双转子系统中重要的零部件,常采用内外圈同向或反向旋转两种工作方式,其工作温度高,动载荷变化频繁,安装难度大,相比于一般工况下的滚动轴承,更容易出现故障[1]。其中,因磨损或润滑不当等原因造成的裂纹故障是中介轴承较易发生的故障,一旦发生此类故障,将引起航空发动机异常振动等状况,对发动机的安全运行将造成极大威胁。同时,中介轴承故障信号极难获取,相关故障诊断研究工作较少,因此对中介轴承进行故障试验,并对故障信号进行识别与分类显得尤为重要。

    轴承故障诊断是机械监测领域的热门研究方向,其主要由信号特征提取与模式识别两个部分组成[2]。隋文涛等[3]利用经验模态分解对轴承振动信号进行分解,结合时域峭度与包络谱峭度选择IMF分量进行重构,并应用最大峭度解卷积算法对IMF分量进行信息增强,通过包络解调方法实现故障识别与分类;丁锋等[4]利用小波降噪对故障信号进行降噪处理,然后对降噪后的信号进行Hilbert变换解调出故障特征频率,实现对轴承故障的识别与分类。

    以往方法大多采用人工特征提取,并依靠专家经验进行故障识别与分类[5]。近年来,随着Hinton等[6]在2 00 6年提出深度学习的概念,越来越多的研究人员将深度神经网络应用于轴承故障识别之中。深度神经网络善于从原始数据中挖掘出数据的特征,它克服了传统故障识别算法复杂的特征提取,同时有效地解决了浅层神经网络泛化能力不足的问题[7]。李巍华等[8]采用深度置信网络(Deep BeliefNetwork,DBN)对滚动轴承不同程度的內环、外环故障进行诊断,并对其时间复杂度进行研究。Ap-pana等[9]利用CNN自动地提取包络谱中的滚动轴承缺陷特征信息,实现故障诊断。Ding等[10]采用小波包分解信号,并构建二维小波包能量图作为CNN的输入进行轴承故障诊断。Tra等[11]利用随机对角线Levenberg-Marquardt 法训练CNN网络,实现了滚动轴承在变转速情况下单一及复合故障的诊断。W ang等[12]使用粒子群优化算法设置CNN网络参数,并利用t分布领域嵌入算法(t—SNE,t-distributed stochastic neighbor embedding)方法对特征学习过程进行可视化。基于以上研究,本文提出一种基于卷积神经网络的中介轴承故障诊断方法,首先将原始振动信号时域图转换成灰度图,利用灰度变换进行精细化处理,将预处理后的时域图输入到深度卷积神经网络中,并结合滑动平均模型,采用几种不同的网络优化算法进行故障识别与分类,通过将诊断结果与传统故障诊断方法进行对比,对比结果显示了本文提出的方法的有效性。

    1 理论基础

    1.1 灰度变换

    图像的灰度化变换就是将三维彩色图像的每个像素点在色彩空间中的值通过线性关系映射到一维灰度空间[13]。灰度图不含色彩信息,因此处理灰度图像的计算量相比于三维彩色图像要少,有利于降低模型复杂度。以往研究有多种图像灰度化方法,本文采用浮点转换算法,即对原图像的三个分量进行加权平均的算法

    f(x,y)=F(f0(x,y))

    (1)式中 f0(x,y)为原图像x·y处的像素值,f (x,y)为对应的灰度图该点的像素值,F()为灰度化变换。同时,为提高对比度,便于图像特征提取,对灰

    1. 2.1 卷积层

    卷积层由多个滤波器内核组成,滤波器可以将当前层神经网络上的一个子节点矩阵转化为下一层神经网络上的一个单位节点矩阵。每个卷积滤波器重复地作用在其整个神经元感受野上,对预处理后的输入特征图进行卷积运算,然后通过激活函数输出卷积结果构成特征图,提取出输入特征图的局部特征[16]。每个卷积滤波器的参数共享,可以减少网络模型参数的数量,使得训练出的模型泛化能力更强。卷积过程描述如下度图采用分段线性灰度变换方法,表达式如下式中 λ,u为用于决定分段线性灰度变换斜率的给定参数。

    通过分段线性变换,原图中灰度值在O到a和大于b间的动态范围映射后被压缩,而a到b区间的动态范围增加,从而增强了这个范围内的对比度。

    1.2 卷积神经网络

    卷积神经网络本质上是一个典型的多层感知机,是一种深度机器学习模型[14]。CNN主要通过挖掘数据的空间上的相关性实现其网络模型功能,CNN将图像作为输入,避免了传统方法中复杂的人工特征提取和数据重构。典型的CNN网络模型如图1所示,其主要由输入层、多个卷积层与采样层,全连接层以及输出层组成,且层与层之间采用稀疏连接,可以减少计算复杂度[15]。式中 xinpui为卷积层的第i个输入特征图,kij为其对应的卷积层第j个权重矩阵,bj为卷积层的第j个偏置项,Mj为输入特征图的集合,xjout为输出特征图。fcovv()为激活函数。

    由于ReLu激活函数具有线性非饱和特性及快速收敛性质,本文选用ReLu整流线性单元作为激活单元,用来加速CNN的收敛,其函数表达式为

    1.2.2 采样层

    采样层通常设置在卷积层之后,同样由滤波器组成,采样层滤波器中的计算并不是神经元节点的加权和,而是采用最大值或平均值运算[17]。采样层的目的是起到二次提取特征的作用,减小特征图矩阵的尺寸,从而减少全连接层中的参数,加快计算速度。本文选用最大池采样层,采样层层公式如下式中 xipinput为池化层的第i个输入特征图的第p个神经元的节点值,fmax()为最大值函数,xilout为池化层第i个输出特征图的第l个神经元的节点值。

    1.3 网络优化

    1. 3.1 过拟合问题

    由于神经网络较之更为复杂,训练的网络模型可以很好地“记忆”训练数据中的随机噪声部分,而忽略训练数据中通用的趋势,这就是过拟合问题,为了避免过拟合,常用的方法是L2正则化[18]。

    正則化就是在损失函数中添加刻画模型复杂度的指标,假定在训练过程中的损失函数是J(θ),加入正则化后优化变为J(θ)+ λR(ω)项,λR(ω)刻画模型的复杂度,λ表示损失在总损失中占有的比例。L2正则化的函数为式中 ω为权重。L2正则化方法通过限制权重实现防止过拟合问题,同时不会使得参数变得稀疏。

    1.3.2 优化算法

    由于篇幅有限,在此选出两种代表性优化算法进行分析

    (1) Adagrad优化算法

    Adagrad算法是一种基于梯度下降的优化算法,根据每个参数计算的过往梯度,对每个参数自适应选择不同的学习速率,对出现频率较低的参数采用较大的学习率进行更新,相反对出现频率较高的参数采用较小的学习率进行更新。Adagrad非常适合处理稀疏数据,其学习率更新公式如下

    式中 λi,k为参数在第k次迭代的学习率,gi,j为梯度值,ε为平滑项,避免分母为零,一般取值为1×10-8,a项为初始学习率。则此时参数更新公式为

    Adagrad算法虽自适应调节学习率,但仍依赖于人工设置的一个全局学习率,若全局学习率设置过大会使学习率更新约束项过于敏感,对梯度调节变大,在网络训练迭代后期,约束项分母上的平方累加将会变大,使得梯度更新提前结束。

    (2) Adam优化算法

    自适应矩估计(AdaptiveMoment Estimation,Adam)优化算法是通过计算梯度的1阶矩估计和2阶矩估计而为不同的参数设计独立的自适应性学习率[19]。Adam算法对梯度的对角缩放具有不变性,因此很适合求解带有大规模数据或参数的问题。该算法同样适用于解决大噪声和稀疏梯度的非稳态问题。式中 m。和ut分别为对梯度的1阶矩估计与2阶矩估计,为了抵消偏差,对其进行校正,校正后如下此时,参数更新公式为

    Adam算法包含了几个超参数,β1通常设置为0.9,β2通常设置为0.999,ε一般为1×10-8。

    1.3.3 滑动平均模型

    为增加网络模型的鲁棒性,本文结合滑动平均模型与CNN实现对网络参数相应处理。

    滑动平均模型的初始化过程中,对每一个待更新的变量都会维护一个影子变量,并选择合适的衰减率,实现控制模型更新的速度,其更新公式为式中 xs影子变量,x为待更新的变量,a为衰减率。为增加模型参数更新速度,可采取动态设置衰减率的形式,此时,衰减率更新公式为式中 as为调整后的衰减率;a为初始设置的衰减率,在实际应用中,初始衰减率一般设置为接近1的小数,本文设置a为0. 99;ε为迭代轮数,依据所要更新的网络参数的迭代过程进行调整。

    2 基于CNN的故障诊断方法

    本文将卷积神经网络与中介轴承故障诊断结合,方法流程如图2所示。

    具体步骤为:

    (1)将获得的轴承故障信号时域图归一化,并进行重叠采样从而实现数据集增强;

    (2)将重采样后的时域图进行灰度化处理,并进行线性灰度变换,将变换后的中介轴承数据随机分成训练集及测试集两部分;

    (3)初始化CNN网络的网络参数,并将训练集输入,训练神经网络模型;

    (4)选择不同的优化算法训练网络,并添加滑动平均模型;

    (5)将测试集输入到训练完成的网络,输出结果。

    3 试验验证

    3.1 中介轴承故障试验台

    为了验证本文所提方法的有效性,搭建双转子中介轴承试验台模拟中介轴承的不同故障类型,采集原始故障振动信号进行分析。试验中,轴承选用中介轴承型号NU1013,模拟中介轴承正常、内环单划痕故障、外环划痕故障、滚动体划痕故障4种不同的状态,故障均由电火花加工技术加工,故障切槽宽度为2 mm及0.8 mm,槽深为0.8 mm,如图3所示。试验中选用4个加速度传感器分别安装在高、低压轴支撑轴承座上采集中介轴承的振动信号。

    在试验过程中,硬件采集系统选用NI9234采集卡对数据进行采集,采样频率为25.6 kHz。试验台高、低压电机在转动过程中转速均为1200 r/min,除正常轴承状态只在内外环同时相向转动的工况下采集以外,其他3种状态分别在内环转动、外环转动、内外环相向转动3种工况下进行实验,共1 0种不同状态。试验台结构如图4所示。

    3.2 数据预处理

    增加样本量可有效提高神经网络模型的泛化能力,样本量增加的方式有图片平移,旋转修剪,缩放等方式。针对中介轴承故障信号图,采用重叠采样,选择合适偏移量重新采集,即重采样之后的相邻样本间有一定重叠;同时对重采样后的信号图进行灰度化变换,并压缩尺寸为116*28,试验台重采样方法如图1所示。

    试验中,将采集的数据样本进行重叠采样,每次选用2048个数据点作为单个样本,重叠采样步长为2 5 6个数据点,分别制作0.8 mm及2 mm的1 0种不同状态的数据集,每个数据集中的训练样本均为6 00 0个,测试样本均为1 000个,每个数据集的详细介绍如表1所示。

    3.3 试验结果分析

    为比较各优化方法的特点,本文设置的CNN网络包括1个输入层,3个卷积层,3个池化层及1个全连接层,1个输出层,卷积层的核分别选取16*7*7,32*5*5,64*3*3尺寸,步长为1,采样层选择对应卷积层数量的2*2核,步长为2,全连接层设置为1 02 4个节点。试验中只改变优化方法,并设置迭代终止为2 00 0次,试验次数为4次,选择故障尺寸为2 mm的数据集,取其一次试验的前5 00次迭代过程,可得各个优化算法训练收敛率变化如图5所示。2 000次迭代后的收敛率如表2所示。

    最终分类结果如图6所示,平均准确率由表3所示。

    由图5及表2可知,Adam优化算法的训练迭代过程收敛最快。由圖6及表3可得,选取Adam优化算法训练的模型平均分类正确率达到95. 725%,在所有试验中,Adam算法在第3次试验中达到最高正确率96.7%。RIMSprop优化算法及Adagrad优化算法的迭代收敛过程稍慢,且其平均分类结果也达到了90%以上,GD优化算法及Adadelata优化算法在2000训练迭代中并没有完成收敛,其最终分类结果也较低。由此可知,Adam算法在对比的算法中的收敛速度最快,同时诊断准确率也相对较高。

    同时,本文将滑动平均模型与CNN网络相结合,并与浅层网络BP神经网络(Back PropagationNeural Networks,BPNN)及传统诊断模型支持向量机(Support VectorMachine,SVM)进行对比。每个数据集的4次试验的具体诊断准确率及平均准确率如表4所示。

    由表4可以得出,在每个数据集上采用滑动平均模型与CNN相结合的诊断方法在4次的诊断结果的平均准确率为96.7%与9 8.O%,远远高于其他传统方法,高于仅结合灰度变换的CNN方法的准确率,说明采用滑动平均模型在一定程度上可以提高CNN网络的鲁棒性,使得诊断准确率更高。浅层神经网络BPNN只有37.1%及33.7%的平均准确率,说明使用原始振动时域数据作为输入,浅层神经网络难以获得较好的分类效果。采用核主成分分析(Kernel Principal Component Analysis, KPCA)方法进行降维,可以一定程度上提高传统诊断方法的准确率,然而传统特征提取及诊断方法的局限性限制了诊断准确率的进一步提高。

    4 结 论

    采用滑动平均模型及卷积神经网络模型相结合,并选择合适的参数优化方法可以有效地对航空发动机中介轴承故障诊断,并且其相对于传统方法具有更高的准确率,泛化能力更好,并具备以下特点:

    (1)本文采用灰度变换方法对输人数据作预处理,减少CNN模型运算参数,降低模型复杂度,可以快速地训练神经网络模型。

    (2)所用方法可以直接将原始信号数据作为输入,不需要进行人工特征提取,相对于其他浅层神经网络或传统方法可以得到更好的诊断效果。

    (3)将CNN模型与滑动平均模型结合,并添加L2正则化,可以增加神经网络模型的鲁棒性,避免过拟合现象的发生。

    参考文献:

    [1] 邱 天,栾孝驰,盖金发,等,航空发动机轴承微弱故障特征提取技术研究[J].一重技术,201 7,(5):35-40.

    Qiu Tian, Luan Xiaochi, Gai Jinfa, et al. Extractiontechnology of weak fault features of aero-engine bear-ings[J]. CFHI Technology, 2017,(5):35-40.

    [2] Cui L,Huang J,Zhang F. Quantitative and localiza-tion diagnosis of a defective ball bearing based on verti-cal-horizontal synchronization signal analysis[J]. IEEETransactions on Industrial Electronics, 2017, 64(11):8695-8706.

    [3] 隋文涛,张 丹,Wang Wilson.基于EMD和MKD的滚动轴承故障诊断方法[J].振动与冲击,2015,34(9):55-59.

    Sui Wentao, Zhang Dan, Wang Wilson. Fault diagno-SiS of rolling element bearings based on EMD andMKD[J].Journal of Vibration&Shock, 2015, 34(9):55-59.

    [4] 丁 锋,秦峰伟,小波降噪及Hilbert变换在电机轴承故障诊断中的应用[J].电机与控制学报,2017, 21(6):89-95.

    Ding Feng, Qin Fengwei. Application of wavelet de-noising and Hilbert transform in fault diagnosis of mo-tor bearing[J]. Electric Machines&Control, 2017,21(6):89-95.

    [5] Cui L, Wu N, Ma C, et al. Quantitative fault analysisof roller bearings based on a novel matching pursuitmethod with a new step-impulse dictionary[J]. Me-chanical Systems&Signal Processing, 2016,68-69:34-43.

    [6] Hinton G, Salakhutdinov R.Reducing the dimension-ality of data with neural networks[J]. Science, 2006,313 (5786):504-507.

    [7] 雷亞国,贾 峰,周 昕,等,基于深度学习理论的机械装备大数据健康监测方法[J].机械工程学报,2015, 51(21):49-56.

    Lei Yaguo, Jia Feng, Zhou Xin, et al.A deep learn-ing-based method for machinery health monitoringwith big data[J]. Journal of Mechanical Engineering,2015,51(21):49-56.

    [8] 李巍华,单外平,曾雪琼,基于深度信念网络的轴承故障分类识别[J].振动工程学报,2016,29 (2):340-347.

    Li Weihua, Shan Waiping, Zeng Xueqiong. Bearingfault identification based on deep belief network[J].Journal of Vibration Engineering, 2016, 29 ( 2) : 340-347.

    [9]Appana D K, Prosvirin A, Kim J M. Reliable fault di-agnosis of bearings with varying rotational speeds u-sing envelope spectrum and convolution neural net-works[J]. Soft Computing, 2018:1-11.

    [10] Ding X, He Q. Energy-fluctuated multiscale featurelearning with deep convnet for intelligent spindle bear-ing fault diagnosis[J]. IEEE Transactions on Instru-mentation& Measurement, 2017, 66(8):1926-1935.

    [11] Tra V, Kim J, Khan S A, et al. Bearing fault diagno-sis under variable speed using convolutional neural net-works and the stochastic diagonal Levenberg-Mar-quardt algorithm. [J]. Sensors, 2017, 17(12) :2834.

    [12] Wang F, Jiang H, Shao H, et al. An adaptive deepconvolutional neural network for rolling bearing faultdiagnosis[J]. Measurement Science & Technology,2017, 28(9) :095005.

    [13]余章明,张元,廉飞宇,等.数字图像增强中灰度变换方法研究[J].电子质量, 2009,(6):18-20.

    Yu Zhangming, Zhang Yuan, Lian Feiyu, et al. A re-search of gray-scale transformation based on digitalimage enhancement [J]. Electronics Quality, 2009,(6) :18-20.

    [14] Jin K H, Mccann M T, Froustey E, et al. Deep conv-olutional neural network for inverse problems in ima-ging[J]. IEEE Transactions on Image Processing,2017, 26(9) :4509-4522.

    [15]常亮,邓小明,周明全,等.图像理解中的卷积神经网络[J].自动化学报, 2016, 42(9):1300-1312.

    Chang Liang, Deng Xiaoming, Zhou Mingquan, et al.Convolutional neural networks in image understanding[J]. Acta Automatica Sinica, 2016, 42 (9): 1300-1312.

    [16] Ince T, Kiranyaz S, Eren L, et al. Real-time motorfault detection by l-D convolutional neural networks[J]. IEEE Transactions on Industrial Electronics,2016 , 63 (11) :7067-7075.

    [17] Bhadane M, Ramachandran K I. Bearing fault identifi-cation and classification with convolutional neural net-work[C]. Kollam,lndia: IEEE International Confer-ence on Circuit, Power and Computing Technologies,2017 : 1- 5.

    [18] Zhang Y, Guo J, Li X. Efficient recovery of group-sparse signals with truncated and reweighted l2, i-regu-larization[J]. Journal of System Engineering and Elec-tronics,2017, 28(1) :19-26.

    [19] Kingma D P, Ba J. Adam: A method for stochasticoptimization[C]. San Diego:lnternational Conferenceon Learning Representations(ICLR) , 2014.