数字孪生驱动的离散制造车间生产进度预测
Digital twin driven production progress prediction for discrete
manufacturing workshop
数字孪生驱动的离散制造
车间生产进度预测
文章导读
2022年9月出版论文“数字孪生驱动的离散制造车间生产进度预测”,这篇文章由Weiwei Qian, Yu Guo, Hao Zhang, Shaohua Huang, Litong Zhang, Hailang Zhou, Weiguang Fang, Shanshan Zha共同完成。在订单式生产模式下,准确的生产进度预测是动态优化生产流程和按时交付订单的重要基础,数字孪生技术为之提供了一种新的使能工具。尽管数字孪生模型可以对生产过程进行实时的监测、分析和控制,但由于物理车间具有的多扰动、强不确定性等特性,导致数字孪生模型与物理车间运行性能存在一定的偏差,从而影响生产进度的预测精度。因此有必要研究面向精度保持的数字孪生模型的同步演化方法,以保证虚实运行性能的一致性,针对该问题,本文主要讨论如何有效地实现基于动态样本数据的数字孪生模型同步更新,构建了一种性能退化表征模型和基于Adaboost-DNN-LSTM的同步演化模型,并引入了竞争机制,以提升复杂制造环境下生产进度预测的准确性。通过在实际生产数据集上的实验,验证了所构建的同步演化模型对于提升物理车间运行性能的同步性具有极大的促进作用,显著提高了对生产进度的预测能力。
文章信息
2022年9月,文章发表于 《Robotics
and Computer-Integrated
Manufacturing》期刊
DOI:10.1016/J.RCIM.2022.102456
论文链接:
https://doi.org/10.1016/j.rcim.2022.102456
引用本文:
Qian W, Guo Y, Zhang H, et al. Digital twin driven production progress prediction for discrete manufacturing workshop[J]. Robotics and Computer-Integrated Manufacturing, 2023, 80: 102456.
译 文 阅 读
数字孪生驱动的离散制造
车间生产进度预测
Weiwei Qiana,Yu Guoa,Hao Zhanga
Shaohua Huanga ,Litong Zhanga,
Hailang Zhoua,Weiguang Fangb,Shanshan Zhac
aThe College of Mechanical and Electrical
Engineering,Nanjing University of
Aeronautics and Astronautics, China
bThe China Academy of Launch
Vehicle Technology, China
cThe 38th Research Institute, China Electronic
Technology Corporation, China
摘要
在订单式生产模式下,准确的生产进度预测是动态优化生产流程和按时交付订单的重要基础,数字孪生技术为之提供了一种新的使能工具。尽管数字孪生模型可以对生产过程进行实时的监测、分析和控制,但由于物理车间具有的多扰动、强不确定性等特性,导致数字孪生模型与物理车间运行性能存在一定的偏差,从而影响生产进度的预测精度。因此有必要研究面向精度保持的数字孪生模型的同步演化方法,以保证虚实运行性能的一致性,针对该问题,本文主要讨论如何有效地实现基于动态样本数据的数字孪生模型同步更新,构建了一种性能退化表征模型和基于Adaboost-DNN-LSTM的同步演化模型,并引入了竞争机制,以提升复杂制造环境下生产进度预测的准确性。通过在实际生产数据集上的实验,验证了所构建的同步演化模型对于提升物理车间运行性能的同步性具有极大的促进作用,显著提高了对生产进度的预测能力。
关键词:数字孪生模型;同步演化;离散制造车间;生产进度;Adaboost;深度神经网络;长短期记忆;竞争机制
正文选读
1. 引言
数字孪生系统(Digital twin system, DTS)是集建模、计算、物理过程和网络化为一体的多维复杂系统,通常分为物理层、传输层和虚拟层三层。随着物联网、大数据、人工智能技术的发展,制造业进入了数字化竞争的新阶段。基于工业物联网的信息交互赋予了DTS在工业环境中的功能和效能,包括大规模系统的实时感知、动态控制和信息服务。在此背景下,数字孪生车间(Digital twin workshop, DTW)作为一种新型的车间运营模式,逐渐在制造业中得到探索和应用。然而,物理车间(Physical workshop, PW)和虚拟车间(Virtual workshop, VW)之间仍然存在状态同步的问题,这限制了生产过程中的连接和映射的准确性。
当信息技术、虚拟模型和物理制造系统相互连接进行智能制造时,制造系统的物料流、信息流和控制流在车间中汇聚。PW的实时数据和状态可更新到虚拟模型中,仿真和分析结果可依次作用于PW,形成闭环控制,使DTW具有仿真、监控和调度应用的潜力。DTW通过传感器和控制器实现同步,实现了在VW层面的优化和决策,这取决于从PW更新的实时数据。所有这些都基于一个非常重要的前提,即数字孪生模型(Digital twin model, DTM)(VW的重要组成部分)是准确的。精确的DTM有助于推测PW的未来运行状态和性能变化趋势,进而实现对PW生产过程的预测、评估、优化和决策。
随着DTW的探索与应用,数字孪生生态建设日益重要,包括建模、校验、更新、管理、模型重用和评估等。缺失完善的数字孪生生态,给DTM的精度保持带来了困难和挑战。主要表现在:其一,DTW由各种异构设备和组织结构组成,产品、生产和运行过程耦合关联,具有鲜明的动态特征。为了提高DTW的运行效率,DTM的实时更新需要具有较高的准确性和及时性,以适应车间生产状态的变化。其二,DTM的精度会随着时间的推移逐渐降低,导致DTM不能很好地适应和跟踪动态过程。此外,当DTM即将失效时(如当DTM的精度显著降低时,需要触发DTM的更新机制),很难实现软更新。由于传统的学习技术主要依赖于大型的历史训练数据库,在实时应用和不确定的生产任务中面对上述问题时变得更具挑战性。因此,需要设计适应复杂多变生产环境的DTM同步进化策略,特别是在基于最新的数据样本进行优化决策时。
数字孪生模型的同步演化是数字孪生技术在离散制造车间中应用的关键。本文提出了一种基于集成学习的数字孪生模型同步演化方法,建立了生产进度性能退化的数字孪生模型(digital twin model of production progress performance degradation, DTM3PD),以表征车间的动态过程,跟踪生产进度性能退化状态,实现对生产进度的预测。通过引入竞争机制和动态样本的更新机制,提高了DTM3PD的精度、泛化能力和鲁棒性。主要贡献归纳如下:
(1)建立了性能退化的通用表征模型和个性表征模型,用于分别描述车间性能退化过程中的一般规律和差异化特征。
(2)首次提出了基于Adaboost-DNN-LSTM的DTM3PD同步演化方法,保证数字孪生模型与物理车间性能的一致性。
(3)设计了一种竞争机制,根据历史样本和动态样本从DNN和LSTM中选择基学习器,显著提高了生产进度预测的准确性。
2. 离散制造车间性能退化表征与数字孪生模型
模型和参数的不准确性被认为是导致仿真结果与实际系统动态行为存在明显偏差的主要原因。目前DMW涉及的产品种类多,生产过程动态多变,生产要素之间紧密耦合,这给工业环境下DTM的精度保持带来了困难。此外,DMW中制造要素(如设备)的性能在其生命周期内会下降,若没有同步演化,初始模型与实际PW之间的偏差会不断增大,导致精度下降,甚至失效。因此,为了保证DTM与PW性能的一致性,迫切需要对DTM进行同步演化更新。
DTM的同步演化使其能够表征DMW性能退化的动态过程和不确定性传播规律,跟踪PP的性能退化状态,实现对PP的预测。更新DTM3PD的目的是根据物联网实时传感数据和PP的性能指标,更新模型参数。DTM3PD的同步演化框架如图1所示。
图1 DTM3PD同步演化的框架
3. 实验与讨论
在本节中,通过PP预测的性能指标来揭示所提方法的优势。实验在中国上海某企业的典型机加工车间进行。传感设备已在车间部署了6年,数字孪生车间建设已有2年,如图2所示。车间有13个工位,主要从事小型结构件加工。为了验证所提方法,对最近11个订单的5979条生产数据(每条数据包含627个数据特征)进行实验。算法是用Python 3.7编写,并在一台配有8GB RAM和2.60 GHz的英特尔酷睿i7-6700HQ处理器的计算机上进行测试。
PP数据集的主要内容是不同时期的生产状态、数量、类型等。在DMW中,根据工位之间的在制品流程对生产数据进行收集、处理和分析。
图2 实验车间
3.1 参数设置
UWB、RFID和设备数据具有多源、异构的特点。现实中的一些任务可能具有波动的持续时间,而没有明确的开始/结束时刻。为了验证所提方法的优势,有必要模拟数据流随时间的动态流动。将订单数据分成14个测试集,然后进行训练。随着时间推移,模拟PP的训练集和测试集如图3所示。
图3 模拟PP随时间变化的训练集和测试集
实验使用单个数据集作为基本时间单位,数据集从1过渡到14。随着时间的推移,通过收集新的样本并构成新的数据批次,然后添加到数据流中,模拟DMW中的动态数据流,以此来阐述动态更新DTM的重要性和必要性。
在实验中,基于T-1数据样本建立PP预测模型,同时使用建模数据集后一个数据集对模型进行测试。例如,数据集1用于模型训练,数据集2用于测试模型性能,然后数据集1和数据集2用于模型训练,数据集3用于测试模型性能,以此类推。从而验证了模型的动态更新性能。
Adaboost-DNN-LSTM算法中需要设置的参数有两类,这两类参数会影响PP预测的准确性。一个是基学习器DNN和LSTM的参数,另一个是Adaboost的参数。前者包括网络结构、每层神经元数量、学习率等。后者包括基学习器的迭代次数和权重。通过Optuna优化和手动微调得到合适的超参数值,基学习器DNN和LSTM的详细参数如表1所示。
表 1 基础学习器DNN和LSTM的详细参数
3.2 实验结果与分析
为了验证所提方法的有效性,设计了三组实验。(1)第一组测试模型集成的有效性,(2)第二组测试竞争机制和动态新样本更新机制的有效性,(3)第三组测试集成模型在新样本数据上的泛化能力。采用了常用的评价指标,包括MAE、RMSE、SMAPE和R2,可根据式(14)-(17)计算。
1)为测试模型集成的有效性。以MSE为输出,分别记录DNN、LSTM、Adaboost-DNN、Adaboost-LSTM和Adaboost-DNN-LSTM等5个模型的收敛过程,如图4所示。Adaboost-DNN表示基学习器只有DNN。类似地,Adaboost-LSTM表示基学习器只有LSTM。Adaboost-DNN-LSTM则表示模型具有基学习器竞争机制、动态新样本的更新机制和基于预测误差的权重更新策略。
图4 五个模型的收敛曲线
结果表明,5个模型均快速收敛,Adaboost-DNN-LSTM、Adaboost-LSTM和LSTM均收敛于较低的MSE。由于所提出的模型具有一定的随机性,因此,在相同的计算环境下,每个模型都进行了20次实验,以获得更客观、更全面的实验结果。
假设当前建模数据样本从数据集1过渡到数据集13,相应的预测数据样本从数据集2传输到数据集14。MAE、RMSE、SMAPE、R2值的测试结果如表2所示,其中每个数字均为20次实验的平均值。对于每个性能指标,粗体数字是五个模型中的最优值,下划线数字是五个模型中的最差值。
表2 五种模型的检验结果
结果表明,Adaboost-DNN-LSTM在10个测试集上的综合性能优于其他4个模型在MAE、RMSE、SMAPE和R2上的综合性能。Adaboost-LSTM在13个测试集上的MAE、RMSE和R2综合性能并不比LSTM差,但在SMAPE中没有体现优势。与DNN相比,Adaboost-DNN的MAE、RMSE、SMAPE和R2仅在测试集1和测试集2中具有优势,在其他测试集中无优势,说明Adaboost-DNN在特定数据集上具有优势,且具有显著的数据依赖性。因此,只使用单一类型的基学习器可能更容易受到不同数据集的影响。
Adaboost-DNN-LSTM和Adaboost-LSTM在13个测试集上的表现显著优于其他模型。其表现更好的原因是基学习器LSTM比DNN更能适应此类数据。Adaboost-DNN-LSTM在很多情况下会选择基学习器LSTM,而只有少数情况下会选择基学习器DNN。这使得Adaboost-DNN-LSTM和Adaboost-LSTM都达到了较好的精度,但Adaboost-DNN-LSTM的精度更高。
为了更好地说明,将Adaboost-DNN-LSTM在测试集1、测试集2和测试集3上的部分预测值与目标值进行比较,用曲线图直观地显示,如图5所示。
图5 Adaboost-DNN-LSTM对200个随机测试样本的目标值与预测值的比较
从图5中蓝红线的重合程度可以看出Adaboost-DNN-LSTM在测试集1和测试集2具有较高的预测精度。而测试集3的预测精度低于测试集1和测试集2,产生这种结果的原因可能是测试集3的数据分布与测试集1和测试集2的数据分布不同。但Adaboost-DNN-LSTM仍具有较高的预测精度,满足实时动态预测PP的需求。
2)为了分析基学习器竞争机制的有效性,将Adaboost-DNN-LSTMNone与DNN、LSTM、Adaboost-DNN和Adaboost-LSTM在13个测试集上进行比较,如图6所示。Adaboost-DNN-LSTMNone表示模型中只存在基学习器的竞争机制,不存在动态新样本的更新机制和基于预测误差的权重更新策略。
图6 13个试验数据集的MAE、RMSE、SMAPE和R2值曲线
MAE结果表明,Adaboost-DNN-LSTMNone的MAE低于其他四个模型,并且在13个测试集中具有最高的整体精度。Adaboost-DNN-LSTMNone在13个数据集中有9个数据集表现最好,占69.23%,而DNN和Adaboost-DNN的总体精度最低。此外,LSTM和Adaboost-LSTM的性能介于DNN和Adaboost-DNN-LSTMNone之间,说明Adaboost-DNN-LSTMNone的整体预测误差最低。
RMSE结果表明,Adaboost-DNN-LSTMNone的平均RMSE低于其他四个模型,在13个数据集中有10个表现最好,占76.92%,在13个测试集中具有最高的整体精度。DNN和Adaboost-DNN的平均RMSE最高,说明Adaboost-DNN对部分样本的预测精度比DNN差,可能存在过拟合。
SMAPE和R2结果表明,Adaboost-DNN-LSTMNone和Adaboost-LSTM具有相似的性能,曲线基本重合。但与其他三种模型相比,仍然具有更好的SMAPE和R2指标值。Adaboost-DNN-LSTMNone和Adaboost-LSTM在13个数据集中有9个表现最好,占69.23%。Adaboost-DNN-LSTMNone和Adaboost-LSTM表现相似的原因可能是在基学习器的竞争选择过程中,LSTM选择较多,而DNN选择较少。
从图6中的MAE、RMSE、SMAPE和R2来看,Adaboost-DNN-LSTMNone模型在13个测试集上的综合性能高于其他4个模型。这表明所提出的基学习器竞争机制是有效的。
3)为了分析动态新样本的更新机制和基于预测误差的权重更新策略的有效性,将Adaboost-DNN -LSTMNone与Adaboost-DNN -LSTMNoDateUpdate、Adaboost-DNN-LSTMNoErrorUpDate和Adaboost-DNN-LSTM在13个测试集上进行比较,如图7所示。
图7 13个试验数据集的MAE、RMSE、SMAPE和R2值的柱状图
Adaboost-DNN-LSTMNoDateUpdate表示存在基学习器的竞争机制和基于预测误差的权重更新策略,但不存在动态新样本的更新机制。同样,Adaboost-DNN-LSTMNoErrorUpdate表示存在基学习器的竞争机制和动态新样本的更新机制,但不存在基于预测误差的权重更新策略。
MAE结果表明,Adaboost-DNN-LSTMNoErrorUpdate的MAE低于Adaboost-DNN-LSTMNone,在13个数据集中有10个数据集的性能更好,占76.92%。在RMSE结果上,Adaboost-DNN-LSTMNoErrorUpdate的平均RMSE低于Adaboost-DNN-LSTMNone,并且在13个数据集中有13个表现更好,占100%。根据SMAPE和R2结果,Adaboost-DNN- LSTMNoErrorUpdate仍然比Adaboost-DNN-LSTMNone具有更好的SMAPE和R2指标值。Adaboost-DNN-LSTMNoErrorUpdate在13个数据集中有11个数据集的性能更好,占84.62%。Adaboost-DNN-LSTMNoErrorUpdate之所以比Adaboost-DNN-LSTMNoErrorUpdate性能更好,是因为动态新样本权重更新机制在Adaboost-DNN-LSTMNoErrorUpdate中发挥了重要作用。
同样,根据MAE和RMSE结果,Adaboost-DNN-LSTMNoDateUpdate的MAE和RMSE指标值低于Adaboost-DNN-LSTMNone。Adaboost-DNN-LSTMNoDateUpdate在13个数据集中有12个性能较好,占92.31%。蓝色和橙色线在数据集2到9之间重合。此外,Adaboost-DNN-LSTMNoDateUpdate的SMAPE和R2指标值仍优于Adaboost-DNN-LSTMNone。Adaboost-DNN-LSTMNoDateUpdate在13个数据集中有11个性能最好,占84.62%,在13个数据集中有12个性能占优,占92.31%。蓝色和橙色线在数据集2到9之间重合。Adaboost-DNN- LSTMNoDateUpdate比Adaboost-DNN- LSTMNone的性能更好的原因在于基于预测误差的权重更新策略在Adaboost-DNN-LSTMNoDateUpdate中发挥了重要作用。
从图7中的MAE、RMSE、SMAPE和R2来看,Adaboost-DNN-LSTM在13个测试集上的综合性能要高于其他3个模型,这说明所提出的基于预测误差的权重更新策略和动态新样本的权重更新机制是有效的。
为了测试集成模型在新样本数据上的泛化能力,并进一步验证Adaboost-DNN-LSTM中基于预测误差的权重更新策略和动态新样本更新机制的有效性,将13个数据集重新划分,原2-5个数据集作为新数据集1*,原6-9个数据集作为新数据集2*,其余数据集作为数据集3*。Adaboost-DNN-LSTM在新的测试集1*、测试集2*和测试集3*上的实验结果如图8所示。
图8 三种新的试验数据集的MAE、RMSE、SMAPE和R2值的柱图。
在MAE和RMSE结果上,Adaboost-DNN-LSTM的MAE和RMSE均低于其他三个模型。此外,对于三个新的测试集,其也具有最高的整体精度。Adaboost -DNN- LSTM和Adaboost-DNN- LSTM NoDateUpdate具有相似的性能,但优于Adaboost- DNN- LSTM NoErrorUpdate,说明基于预测误差的权重更新策略在新数据集1*和2*上是有效的。Adaboost - DNN- LSTM比Adaboost- DNN- LSTM NoDateUpdate具有明显的优势,说明动态新样本的更新机制在新数据集3*中发挥了重要作用。此外,Adaboost- DNN- LSTM的整体误差棒比其他三种模型短,表明预测值与真实值之间的误差较小,具有很好的鲁棒性。
在SMAPE和R2结果上,Adaboost-DNN-LSTM在新数据集1*和2*上表现出与Adaboost-DNN- LSTMNoDateUpdate相似的性能,说明该模型更关注基学习器的竞争机制和基于该数据集预测误差的权重更新策略。在新数据集3*上,Adaboost-DNN-LSTM同时关注了基学习器的竞争机制、基于预测误差的权重更新策略以及动态新样本的更新机制。结果表明Adaboost-DNN-LSTM可以根据数据集中的数据组成动态选择合适的机制进行模型训练,从而提高泛化性能。
综上所述,通过比较DNN、LSTM、Adaboost- DNN、Adaboost- LSTM None、Adaboost- DNN- LSTM NoDateUpDate、Adaboost-DNN- LSTM NoErrorUpDate等7个模型,Adaboost-DNN - LSTM模型具有最佳的综合性能,较强的鲁棒性和泛化性能,能够有效跟踪DMW中PP的演化过程
4. 结论
精确的DTM同步演化对DT技术在DMW中的应用至关重要。本文提出了一种基于集成学习的DTM同步更新方法,通过建立DTM3PD来表征DMW的动态过程,跟踪PP的性能退化状态,实现对PP的预测,并引入基学习器的竞争机制与动态新样本更新机制相结合,提高了DTM3PD的精度、泛化能力和鲁棒性。通过对PP预测的实例验证,说明了DTM更新的全过程。以实际PP中采集的5979条数据(每条包含627个特征)为输入,分别与DNN、LSTM、Adaboost - DNN、Adaboost - LSTM、Adaboost- DNN- LSTMNone、Adaboost- DNN- LSTM NoDateUpdate、Adaboost- DNN- LSTM NoErrorUpdate进行对比分析。实验结果表明,Adaboost- DNN- LSTM模型的性能优于其他7种模型。因此,验证了所提方法的有效性。
所提方法的局限性在于要求传感器数据在工业环境中具有准确性。例如,RFID容易被部件干扰和阻挡,感知范围有限(一般小于2米),导致标签误读、数据频繁遗漏或发生错误。此外,应用UWB采集数据时,容易受到干扰和监控范围的限制,导致定位数据漂移(如AGVs上标签位置信息的误差)。因此,受限于RFID和UWB数据采集的准确性,这些数据误差可能会影响DTM3PD的准确性。DTM3PD的可解释性还有待提高。
考虑到本文的研究内容和领域发展,在制造过程中可能会出现极端情况。在后续研究中可以进一步挖掘更多的不平衡数据,从而提出更有效的集成方法来实现DTM的同步演化。此外,为了支持PP的可追溯性分析,迫切需要增强DTM3PD的可解释性,探索建立在PP上的制造要素(如设备)性能的反演模型,指导DMW中PP的优化控制,提高制造系统的性能。
1234
更多资料下载
点击下方图片
来源:《Robotics and Computer-Integrated Manufacturing》,对原作者表示感谢,分享仅作学习交流,不作商用,我们尊重版权,如有侵权请联系我们删除等相关处理。
监制/西贝
编辑/荔枝