多源信息深度融合的行星齿轮箱故障诊断方法

    陈仁祥 黄鑫 胡小林 徐向阳 黄钰 朱孙科

    

    

    

    摘要:行星齿轮箱运行工况复杂,振动激励源多,仅依靠单一征兆域会导致故障诊断结果不确定性高。为此,对行星齿轮箱多通道多征兆域深层特征信息进行融合,提出基于多源信息深度融合的行星齒轮箱故障诊断方法。首先构建多个深度残差卷积神经网络(Deep Residual Convolution Neural Network,DRCNN)分别对行星齿轮箱多通道多征兆域信息进行特征学习以建立局部特征空间与故障空间的映射;其次提取各子DRCNN所学习到的各征兆域深层故障特征以构建全局特征空间的证据体集;最后利用随机森林(Random Forest,RF)对证据体集进行融合以从不同角度充分利用多源故障特征信息,建立起全局特征空间与故障空间的映射,得到诊断结果。所提方法将特征自动提取与信息融合有效统一为整体,增强了方法的智能化与自适应能力。多工况下行星齿轮箱故障诊断实验结果表明所提方法诊断不确定度小、精确度高,能够有效对行星齿轮箱故障进行诊断。

    关键词:故障诊断;行星齿轮箱;深度残差卷积神经网络;随机森林;多源信息深度融合

    中图分类号:TP165+.3;THl32.41文献标志码:A 文章编号:1004-4523(2020)05-1094-09

    DOI:10.16385/j.cnki.issn.1004-4523.2020.05.024

    引言

    行星齿轮箱广泛应用于风力发电、石油、航空航天等领域,对国民经济发展具有重要意义。其振动激励源多,故障关联性强,故障还呈现出多样性与不确定性,难以仅依靠单一故障信息对其进行精确诊断。

    近年来,国内外众多学者将信息融合技术应用到机械故障诊断领域中,取得较好效果。张明等提出径向基神经网络与加权证据融合理论结合的方法对往复式压缩机进行诊断;李凌均等研究融合多源谱信息的矢双谱分析技术,有效提高了齿轮箱故障诊断准确性;cai等提出基于贝叶斯神经网络信息融合诊断方法,有效诊断了热泵故障;郭文勇等提出基于多信息的模糊神经网络故障诊断方法,对柴油机缸套磨损故障进行了有效性诊断。saflzadeh等利用多源信息融合方法对滚动轴承振动故障进行了诊断研究。以上信息融合诊断方法主要融合人工提取特征,存在以下问题:(1)依赖于人的专业知识和经验,需要复杂的信号处理技术支持;(2)机械设备运行工况复杂,振动激励源多,不同零部件的振动特征信息相互影响,使得现有人工构造特征不可避免地会带来信息丢失;(3)特征提取方法泛化能力和鲁棒性差,对环境噪声或硬件干扰引起的系统变化敏感。一旦因以上原因降低所选特征对故障的表征能力,势必影响信息融合诊断结果。

    深度学习以其非凡的特征学习能力,已在诸如图像分类、目标检测等领域取得一系列研究成果,并在故障诊断领域得到了成功运用。如Jia等利用深度神经网络对轴承以及行星齿轮故障进行了有效诊断。Lu等采用堆叠去噪自动编码对旋转机械故障进行了诊断。chen等提出了样本扩展深度稀疏自动编码的滚动轴承故障程度诊断方法。这些基于深度学习的故障诊断方法都具有很好自适应性和诊断能力,然而目前它们仅用于针对单一征兆域信息进行特征学习,由于行星齿轮箱故障模式复杂,耦合性强,难以仅依靠单一征兆域信息对进行精确诊断。

    为解决以上问题,本文将深度残差卷积神经网络(Deep Residual Convolution Neural N etwork,DR-CNN)与信息融合相结合对行星齿轮箱故障进行诊断。首先构建多个DR-CNN以学习行星齿轮箱多通道多征兆域中所隐含的深层故障特征,初步建立局部特征空问与故障空间之间的映射关系。然后提取各子DR-CNN所学习的深层故障特征,构建起全局特征空问的证据体集。再利用随机森林网络(Random Forest,RF)对证据体集中多源特征信息进行融合,以从不同角度反映行星齿轮箱故障状态,达到充分利用各方面信息的目的,并最终建立起全局特征空问与故障空问的映射,形成基于多源信息深度融合的行星齿轮箱故障诊断方法。这样既解决了仅依靠单一征兆域进行故障诊断时不确定性高的问题,最大程度避免了漏检、误检的发生,又克服了传统信息融合难以避免人主观因素影响的缺点,将特征自动提取与信息融合有效统一为整体,增强了信息融合过程的智能化以及自适应能力。

    1理论基础

    1.1DRCNN网络模型

    传统深度神经网络主要面临着两个问题:(1)随着网络深度增加,会出现梯度消失(爆炸);(2)较深的网络会出现精度退化。为解决这两个问题,He等提出了深度残差卷积神经网络(DRCNN),其借助堆叠网络拟合残差的方式来解决精度退化和梯度消失问题。DRCNN以独特学习策略能有效地从输人数据中拾取特定故障特征分布,网络层级越深,输入层和输出层相连越接近,特征学习效果越好。因此,使用DRCNN实现故障特征自动学习。

    DRCNN网络结构如图1所示,主要由卷积层、池化层、批标准化层以及残差单元组成。残差单元结构如图2所示,其残差定义为:

    4)将各故障不同通道不同征兆域时频图集Emn随机划分为训练集和测试集,在训练集上分别利用各DRCNN学习时频图集Emn中所隐藏的故障特征,初步建立局部特征空问与故障空问之问的映射,并提取各子DRCNN所学习到的特征以构建全局特征空问的证据体集c。

    5)采用随机森林对由4)获得的证据体集c中多源特征信息进行决策融合,最终建立全局特征空问与故障空问的映射,至此本文所提方法框架构建完成。

    6)利用测试集进行验证,得到最终诊断结果。

    3试验案例

    3.1试验数据

    使用行星齿轮箱故障来验证所提方法的可行性和有效性。如图5所示,行星齿轮箱故障模拟试验台主要由编码器、采集卡、传感器、行星齿轮箱等组成。在试验台上模拟行星齿轮箱4种故障状态:正常、缺齿、齿根裂纹、齿面磨损。在行星齿轮箱水平和垂直方向分别安装加速度传感器以获取多通道故障信号,采样频率为30.72kHz,采样时问为2。13s。在电机转频为30,40Hz下,每种转频负载电流分别为0,0.38,0.67A等共计6种工况下,每种故障均各采集3组信号。采用问隔采样方式获取故障样本,构建故障各通道时域样本集s,其中单个样本长度为4096点。

    针对行星齿轮箱故障的正常、缺齿、齿根裂纹、齿面磨损等试验数据进行研究,由此构建识别框架θ={F1,F2,F3,F4),其中,F1为正常,F2为缺齿,F3为齿根裂纹,F4为齿面磨损。采用图4所示时频分析方法对故障各通道时域样本集s进行处理,并创建故障各通道各征兆域训练集和测试集,如表1所示。

    图6为行星齿轮箱不同故障时域波形及频谱,其仅单独从时域或频域角度对故障进行表征,难以从时频空域进一步揭示其故障特征。由此,本文提出通过构建多通道多征兆域时频图集E={E11,E12,E21,E22),利用各DRCNN从时频空域中拾取更具有判别性的故障特征,其中E11为水平传感器信号EEMD征兆域时频图集,E12为水平传感器信号WPT征兆域时频图集、E21为垂直传感器信号EE-MD征兆域时频图集,E22为垂直传感器信号WPT征兆域时频图集。图7为正常、缺齿、齿根裂纹、齿面磨损的水平传感器信号EEMD和WPT征兆域时频图,限于篇幅其余通道征兆域时频图本文不再赘述。

    对比图6和7,本文所构建各征兆域时频图中包含了更加丰富的信息量,从不同侧面反映了与故障有关的信息。对比图7(a),(c),(e),(g)或(b),(d),(f),(h)可知,在行星齒轮箱各故障问,其能量分布特点存在着显著差异,即其能量强度以及能量波动历经时问均存在明显不同。同时对比(a)和(b),(c)和(d),(e)和(f),(g)和(h)可知,在不同征兆域上同一故障展现出了不同特征信息,这也为本文所提方法的可行性提供了根据。相反,时域波形及频谱所提供的信息就显单调,难以从中准确提取出能够判定行星齿轮故障的特征。

    3.2残差卷积神经网络设计

    为从多通道多征兆域时频图集E中学习到各征兆域有效故障特征,需首先构建合适的DRCNN模型。通过前期试验结果以及试验条件,构建了一个包含16个残差学习单元的DRCNN模型,输入维度设置为224×224×3,其中每个残差单元由3个卷积层以及1个旁路连接组成。表2为DRCNN第一个残差单元具体网络参数,c1,c2,c3,C4为卷积层;BNl,BN2,BN3,BN4表示批归一化层(BatchNormalization);Actl,Act2,Act3为激活层,激活函数选用ReLu函数,其中C4,BN4位于旁路连接处。实验平台配置如下:WindowslO 64位操作系统,内存192GB,程序运行环境为Matlab2018b。

    3.3试验结果与分析

    3.3.1行星齿轮箱故障初步诊断

    首先,选择合适的超参数以初步建立起局部特征空问与故障空问的映射,完成故障的初步诊断,并学习局部有效故障特征。根据前期试验结果,将最小批量(MiniBatchSize)设置为100、学习率为0.0001,最大迭代次数(MaxEpochs)为30次,采用交叉熵损失函数(Cross-Entropy)对DRCNN进行优化。各子DRCNN在相应通道征兆域训练集中的特征学习精度和误差变化曲线如图8所示,其展示了局部映射建立的全过程。图8中,HWPT,VWPT,HEEMD,VEEMD中的H,V分别代表水平、垂直传感器振动信号;WPT,EEMD分别代表小波包变换与EEMD变换。

    观察图8,随着迭代次数增加,各子DRCNN在不同征兆域中的特征学习精度不断提高,学习误差则不断下降,局部映射逐步建立。当Epochs=30次时学习精度和误差均已进入收敛阶段,局部映射建立完成。图8中不同曲线的收敛速度、精度存在明显差异,即局部映射建立过程呈现出不同变化趋势,说明各征兆域所包含的故障判别信息量不同。经对比可知,垂直传感器信号EEMD征兆域包含了更多判别信息,其在收敛速度以及精度上均表现最好,训练精度达到98.13%。

    将各征兆域的测试集样本输入到已训练好的DRCNN中,得到初步诊断结果s={S1,S2,S3,S4},其中S1为时频图集E11初步诊断结果(表3),s2为时频图集E12初步诊断结果(表4),s3为时频图集E21初步诊断结果(表5),S4为时频图集E22初步诊断结果(表6),其中结果表示DRCNN对各故障预测的平均概率值,其代表各DRCNN对故障的平均预测倾向。为了衡量各DRCNN对每类故障的不确定度大小,将DRCNN在测试集上对各故障诊断误差作为不确定度。另外为了避免随机因素的影响,本文在5个不同的测试集上对各DRCNN模型进行测试。

    由表3-6可知,单一征兆域信息对各故障均有着不同程度的不确定性,这说明不同通道、不同征兆域信息确实对诊断精确度有较大影响。这主要是因为单一征兆域信息存在不完备性,导致其诊断结果出现不确定性,特别是水平传感器信号EEMD征兆域信息以及WPT征兆域信息,由初步诊断结果s,和s2可知,其可信度水平偏低,平均不确定度偏高,难以单独用于故障诊断。为了探究造成不确定性的原因,本文提取各子DRCNN全连接层特征并利用t-SNE算法对其进行维度约简以便于特征可视化,如图9所示。

    观察图9可知,导致各子DRCNN不确定性的主要原因是缺齿、齿根裂纹和齿面磨损三种故障难以被完全分离,从而造成误检、漏检。另外可以看出各子DRCNN诊断结果中各故障的聚集性相对分散,说明不同通道各征兆域的确均存在信息不完备。由图9(c)可知,虽然在垂直传感器信号EEMD征兆域信息中DRCNN能很好地将大部分故障分离,但仍有少部分齿根裂纹故障与缺齿故障混叠。而在其余子征兆域信息中DRCNN难以完全分离缺齿、齿根裂纹和齿面磨损三种故障,三者问均存在不同程度的交集。以上结果进一步说明单一征兆域信息难以对行星齿轮箱故障进行准确诊断,故需融合多通道多征兆域特征对其进行故障诊断。

    3.3.2行星齿轮箱深层特征融合诊断

    为了避免仅依靠单一征兆域所造成的故障诊断不确定性,本文提取各子DRCNN所学习到的各征兆域深层故障特征以构建全局特征空问的证据体集c,并利用由100个决策树分类器集成的随机森林树对证据体集c中多源特征信息进行融合,最终建立全局特征空问与故障空问的映射关系,得到融合诊断最终结果,如图10所示为特征融合后诊断结果。由图10可知本文所提方法将几乎所有故障样本正确分类,每类故障都具有很好的聚集性。

    为了清晰显示所提方法对训练集中每一类故障分类效果,本文采用混淆矩阵(Confusion Matrix)对分类结果进行可视化,由图11(a)可知,本文所提方法将每类故障几乎全部正确分离,有效地避免了漏检、误检情况的发生,不同故障的召回率和精确率均在98%以上,说明了本文所提方法能很好地对故障进行诊断,其诊断精度达到99.6%,这主要是因为本文通过融合各征兆域深层故障特征将各征兆域不完备信息加以综合形成了相对完备的诊断信息,为故障诊断提供了更具判别性的故障诊断信息。为了避免随机因素影响,也用在5个不同测试样本集上对所提方法进一步验证,平均诊断结果如表7所示,其中某一测试样本集诊断结果可视化模糊矩阵如图11(b)所示。

    由表7可知,在测试集上除了F2缺齿故障外,其余故障平均不确定度re(O)均为0,最终以99.96%的诊断精度将各类故障进行了准确分类,这说明了本文所提方法对行星齿轮箱故障诊断确实有效。

    为了与其他智能方法进行比较,本文采用多通道时频图集+DRCNN、多通道时域数据+DRC-NN、多通道特征+支持向量机(Support VectorMachine,SVM)三种方法对行星齿轮箱故障进行信息融合诊断。首先提取10种行星齿轮箱故障常用特征,分别为:标准方差、峰值、偏态、峰度、波峰因数、波形因数、冲击系数,均方根值,MF(Mean Fre-quency),MC(Frequency Center),以上特征均能较好地刻画行星齿轮箱故障特征信息,其定义在文献[21]中有具体描述;然后将所提取到的不同通道的故障特征构建为常用特征的证据体集P;最后采用以Fine Gaussian为核函数,Gamma值为1.2的SVM对证据体集P进行融合识别。其中证据体集P中每个样本均由上述不同通道信号特征组成,共3000样本,其中20%用于训练SVM,其余用于测试。为了避免随机因素干扰,上述试验也均在不同测试集上进行5次。采用上述三种故障信息融合诊断方法的结果也示于表7中。

    由表7可知,采用不同方法对行星齿轮箱故障进行信息融合诊断结果表明:本文所提出方法效果确实要优于其他信息融合诊断方法,其各故障不确定性均接近或等于0,诊断精度达到99.96%。另外,可观察到多通道特征+SVM方法的信息融合故障诊断精度仅为87.36%,其中齿根裂纹和齿面磨损的不确定度m(θ)分别高达0.235和0.262,说明该方法对齿根裂纹和齿面磨损故障识别作用差,难以对其进行有效故障诊断。值得注意的是,利用多通道时频图集+DRCNN方法对行星齿轮箱故障进行信息融合诊断,其故障诊断精度仅为94.3%,明显低于本文所提方法,而且其整个训练过程耗时高达到约28h;多通道时域数据+DRCNN的诊断精度也仅为91.7%,耗时也达近11h。这主要因为单个DRCNN在同时处理故障多征兆域时频图集或多通道时域数据集时,不仅会使得输入样本量过多,输入样本空问维度过大而导致训练时问过长,而且由于单个网络泛化能力和容错能力有限,使得其对多个征兆域信息的不确定性融合能力受到限制,难以完全消除单一征兆域信息不确定性所带来的影响,导致诊断精度偏低。

    相比较而言,本文所提方法则采用多个DRCNN分别从不同征兆域时频图集中进行特征学习,不仅能缓解单个DRCNN需要处理的样本量,较大程度减少了输入样本空问维度的规模,使得整体计算消耗成本较低,而且其泛化能力和容错性更好,能有效消除单一征兆域信息的不确定性,使得最终诊断效果很高,诊断精度接近100%,这进一步说明本文所提方法不仅对行星齿轮箱故障具有很好的诊断效果,而且能有效加快数据处理速度,節省计算资源。

    4结论

    针对融合行星齿轮箱多通道多征兆域深层故障特征来解决仅依靠单一征兆域进行故障诊断带来的不确定性高的问题,提出了一种基于信息深度融合的行星齿轮箱故障诊断方法。该方法首先利用多个DRCNN对多通道多征兆域进行特征学习以建立各局部特征空问与故障空问的联系,达到初步诊断的目的;其次提取各征兆域深层故障特征并构建特征空问的证据体集;最后利用随机森林树对特征证据体集中多源特征信息进行融合,从而实现行星齿轮箱多源信息融合诊断。所提方法将特征提取与信息融合有效统一为整体,克服了传统信息融合难以避免主观因素影响的缺点,增强了信息融合智能化以及对故障信号的自适应能力。