基于动态分布适配的迁移网络在跨域轴承故障诊断中的应用 | CJME论文推荐
Liao, Y., Huang, R., Li, J. et al. Dynamic Distribution Adaptation Based Transfer Network for Cross Domain Bearing Fault Diagnosis. Chin. J. Mech. Eng. 34, 52 (2021). https://doi.org/10.1186/s10033-021-00566-3
在机械故障诊断中,获取故障样本(标签数据)需要耗费大量的时间和资源。迁移学习可以从具有完备标签样本的源域中学习故障诊断知识,并将其迁移到无标签样本的目标域中,以提高目标域诊断模型的性能,已经广泛应用于各类跨域诊断任务中。但是,现有迁移学习诊断方法大多通过对齐源域和目标域特征的边缘分布或条件分布来减少两域特征间的分布差异,而未考虑边缘分布和条件分布对于特征分布差异的影响程度。针对此问题,提出一种基于动态分布适配的迁移网络(Dynamic Distribution Adaptation based Transfer Network,DDATN)用于跨域轴承故障诊断,通过所提的实例加权动态最大均值差异(instance-weighted dynamic maximum mean discrepancy, IDMMD)计算域间特征分布差异。IDMMD不仅量化了边缘分布和条件分布对于特征分布差异的贡献量,还进一步考虑了各类对于条件分布差异的影响,以及目标域样本伪标签的置信度。在更好地评估特征分布差异的同时,减小了错误的目标域样本伪标签的影响。在滚动轴承数据集上对所提方法进行评估,实验结果表明,与深度域混淆网络(Deep Domain confusion,DDC)、基于特征的迁移神经网络(Feature-based Transfer Neural Network,FTNN)、深度迁移网络(Deep Transfer Network,DTN)、不考虑边缘分布的DDATN(IWC)、以及不考虑边缘分布和条件分布贡献差异的DDATN(IWCM)等方法对比,所提方法在跨域轴承诊断任务中平均分类精度高,泛化性能更好。
在DDATN中,通过最小化源域标签样本的监督损失以及目标域和源域之间的特征分布差异实现跨域轴承故障,因此损失函数包含两部分:监督学习部分和动态分布适配部分,如图所示。监督学习部分的损失函数是常见的交叉熵损失函数LC,只有源域标签样本参与这部分的损失函数的计算,最小化这部分损失函数以期得到一个可以提取有效故障特征的特征提取网络以及对应的故障分类网络;动态分布适配部分的损失函数为本文提出的IDMMD(如式(1)所示),源域标签样本和目标域无标签样本均参与这部分损失函数的计算,通过最小化IDMMD,使得特征提取网络能将目标域和源域样本,映射到一个两域间特征分布差异最小的特征空间,避免因为域间特征分布差异影响跨域轴承故障诊断的性能。
图1 DDATN原理图
为了更好地评估两域间的特征分布差异,IDMMD以常用的分布差异度量MMD为基础,借鉴动态分布适配的思想,考虑网络训练过程中边缘分布和条件分布对于域间特征分布差异贡献量的动态变化,并进一步在计算条件分布时考虑目标域样本伪标签的置信度,提出IDMMD作为特征分布差异度量。IDMMD中提出了一种考虑目标域样本伪标签置信度的条件分布计算方法,利用上一次迭代得到的网络预测样本属于各类的概率,将其作为样本在计算各类条件分布时的训练权重,如式(3)所示。在训练过程中,面对不断更新的特征提取网络,IDMMD以各类别的条件分布差异占总分布差异的比值作为各类别的条件分布差异的训练权重,以边缘分布差异占总分布差异的比值作为边缘分布差异的训练权重,如式(4)所示。
式中,IDMMDM指边缘分布差异,IDMMDC(c)指第c类的条件分布差异,Ωs和Ωt分别指源域和目标域,yi(c)指xis关于第c类的真实标签,ŷi(c)指xjt关于第c类的预测概率.
以凯斯西储大学轴承数据集作为源域数据集,实验室开展的轴承故障实验数据作为目标域数据集进行跨域轴承诊断实验。轴承的状态包含健康、内圈故障和外圈故障3种,使用加速度传感器采集的振动信号作为模型输入,采样频率均为12kHz,每个样本长度为2048个点。通过组合不同故障程度(7、14、21mils)和载荷(1、2、3hp),构建9个源域数据集;根据实验时转速(500、800、1100、1400rpm)的差异,划分出4个目标域数据集。9个源域数据集和4个目标域数据集一一对应进行跨域轴承诊断实验,共开展36组实验。对比方法为DDC、FTNN、DTN、IWC、IWCM。为了避免随机误差,每组实验重复10次,计算分类正确率的均值和标准差,并计算36组实验分类正确率的均值和标准差作为总体评价指标。
在36组跨域轴承诊断实验中,DDC表现最差,其分类正确率几乎在每一组中都垫底,总体分类正确率为63.34%,标准差为15.50%。FTNN对DDC进行了改进,将DDC的单层适配改为多层适配,并加入了伪标签学习,其表现优于DDC,总体分类正确率为80.45%,标准差为12.51%。DTN也是基于DDC的迁移学习方法,把条件分布差异加入特征分布差异中,并给边缘分布差异和条件分布差异同样的权值,未考虑它们对于特征分布差异贡献的不同,也未考虑目标域无标签样本的置信度,其表现同样优于DDC,并略优于FTNN,总体分类正确率为82.41%,标准差为14.59%。DTN与DDC和FTNN的对比表明,同时考虑边缘分布差异和条件分布差异能有效提高跨域轴承诊断任务的精度。
IWC的总体分类正确率为91.24%,标准差为11.16%;IWCM的总体分类正确率为92.99%,标准差为9.45%。对比IWCM和DTN可知,论文提出的条件分布差异度量方法在跨域轴承诊断任务中表现更好。DDATN的总体分类正确率为95.20%,标准差为7.85%,在所有方法中表现最好,证明所构建的模型考虑了边缘分布差异和条件分布差异对特征分布差异的影响程度,可以有效提高跨域轴承诊断任务的精度。
论文提出了一种基于动态分布适配的迁移网络,通过提出边缘分布和条件分布对于特征分布差异贡献量的计算方法,将动态分布适配框架引入轴承跨域诊断中;并考虑目标域样本伪标签置信度,对条件分布差异度量方法进行了优化。论文的主要结论如下:
(1) 在计算条件分布差异时,考虑目标域样本置信度能有效避免错误伪标签对跨轴承诊断任务的负面影响。
(2) 所提的基于动态分布适配的分布差异度量方法IDMMD能更好地评估源域数据和目标域数据间的特征分布差异,能有效提高跨轴承故障诊断任务的分类正确率。
对于工程应用中缺少故障样本(标签数据)时,如何构建装备故障诊断模型提供一种新的思路。具有一定的工程应用价值。
[1] 杨强, 张宇,戴文渊等. 迁移学习[M]. 北京:机械工业出版社,2020.
[2] 陈雪峰, 訾艳阳.智能运维与健康管理[M]. 北京:机械工业出版社, 2020.
[3] Ian Goodfellow, Yoshua Bengio, AaronCourville. Deep Learning[M]. Cambridge: The MIT Press, 2016.
[4] 李巍华, 张小丽,严如强. 复杂机电系统智能故障诊断与健康评估[M]. 北京:国防工业出版社,2021.
李巍华,华南理工大学吴贤铭智能工程学院副院长、教授、博士生导师。获广东省教学成果奖(高等教育)一等奖1项。IEEE高级会员、IEEE仪器测量学会(IMS)状态监测与故障诊断仪器技术委员会(TC-03)联合主席;ASME会员;中国机械工程学会高级会员、设备与维修工程分会常务理事;中国振动工程学会理事、故障诊断专业委员会常务理事、机械动力学专业委员会理事;中国汽车工程学会会员;中国图象图形学会交通视频专委会理事;广东省机械工程学会设备与维修工程分会副理事长;Chinese Journal of Mechanical Engineering、振动工程学报编委;IEEESensors Journal、 Mathematical Problems in Engineering专刊客座编辑。主要从事装备智能运维、汽车自动驾驶、工业大数据、数字孪生等领域的研究工作,主持国家重点研发计划课题1项,国家自然科学基金项目4项,广东省重点研发计划课题1项,主持企业合作项目近10项;在IEEE系列汇刊、RenewableEnergy、MSSP、Computers in Industry等学术期刊上发表论文80余篇;授权发明专利10余项、实用新型专利40余项;出版专著4部。
团队研究方向包括:装备智能运维、汽车自动驾驶、工业大数据、数字孪生以及车辆NVH性能测试与诊断。
[1] 侯文擎,叶鸣,李巍华*.基于改进堆叠降噪自编码的滚动轴承故障分类.机械工程学报, 54(07):87-96, 2018. (《机械工程学报》第四届高影响力论文)
[2] Weihua Li, Zhuyun Chen, and Guolin He*. Anovel weighted adversarial transfer network for partial domain fault diagnosisof machinery. IEEE Transactions on Industrial Informatics, 17(3): 1753-1762,2020.
[3] Yixiao Liao, Ruyi Huang, Jipu Li, ZhuyunChen and Weihua Li*. Deep Semisupervised Domain Generalization Network forRotary Machinery Fault Diagnosis Under Variable Speed. IEEE Transactions onInstrumentation and Measurement, 69(10): 8064-8075, 2020.
[4] Y. Xie, S. Zheng and W. Li*. Feature-GuidedSpatial Attention Upsampling for Real-Time Stereo Matching Network. IEEEMultiMedia, 28(1): 38-47, 2021.
[5] 郑少武,李巍华*,胡坚耀.基于激光点云与图像信息融合的交通环境车辆检测.仪器仪表学报, 40(12):143-151, 2019.
更多详细内容请点击文后阅读原文获取。
编辑:恽海艳 校对:向映姣
有一种合作叫做真诚,有一种发展可以无限,有一种伙伴可以互利共赢,愿我们合作起来流连忘返,发展起来前景可观。关于论文推荐、团队介绍、图书出版、学术直播、招聘信息、会议推广等,请与我们联系。
推荐阅读
Normal force and sag resistance of pipe conveyor | CJME论文推荐
仿生抗固体颗粒冲蚀材料研究进展:学习自然,超越自然 | CJME论文推荐
具有高(220)择优取向的纳米颗粒增强型镍基复合镀层的高效制备 | CJME论文推荐
版权声明:
本文为《机械工程学报》编辑部原创内容,欢迎转载,请联系授权!
在公众号后台留言需要转载的文章题目及要转载的公众号ID以获取授权!
联系我们:
联系人:暖暖
电话:010-88379909
E-mail:jme@cmes.org
网 址:http://www.cjmenet.com.cn
官方微信号:jmewechat