点赞机电学子!我院本科生科研成果在中科院一区TOP期刊发表
NEWS
近日,
苏州大学机电工程学院
本科生科研成果获新进展!
研究设计了一种新颖的深度强化学习模型,
用于解决智能制造领域的实时调度问题。
看!官微已经划好重点啦~
大规模生产系统实时控制一直是智能制造领域中极具挑战性的难题。近日,由杨宏兵老师(通讯作者)指导的我院本科生陈睿奇(第一作者)、黎雯馨的高级排产研究成果:“A Deep Reinforcement Learning Framework Based on an Attention Mechanism and Disjunctive Graph Embedding for the Job Shop Scheduling Problem”,在线发表于IEEE Transactions on Industrial Informatics期刊,该刊为中科院一区TOP期刊,影响因子10.215。
该项研究成果首次将Transformer 框架引入到智能制造系统,并基于Attention mechanism和Disjunctive Graph理论设计了一种新颖的深度强化学习模型用于解决智能制造过程中的实时调度问题,实验结果表明在大规模场景下,该方法性能优于google公司OR Tools以及当前的一些主要算法,进一步实验表明该方法仅需要在在少量场景下训练后即可用于其他不同场景下生产系统的智能调度,表现出良好的泛化性和鲁棒性,为大规模生产系统的智能控制提供了新的研究方向和思路。
DOI: 10.1109/TII.2022.3167380
研究背景
智能生产调度系统通过优化工厂中订单的加工顺序,从而提升生产效率和机器利用率,是现代智能制造系统的关键组成部分。调度算法是调度系统的核心,它决定了生产计划的质量和调度系统的响应速度。
——智能调度算法对于工业生产至关重要。
工业4.0进程对生产调度系统提出了更高的要求。传统调度算法主要基于精确优化算法(如分支定界,拉格朗日松弛法)和启发式方法(如遗传算法、粒子群算法)设计。该类算法在求解大规模调度问题时需要经过大量迭代才能得出高质量的解,它们往往难以满足智慧工厂中对订单快速响应,甚至是实时调度的需求。
——传统调度方法难以满足大规模实时调度的需求。
近年来,人工智能技术迅猛发展,基于深度强化学习(DRL)的调度模型得到了越来越多研究者的关注。调度智能体在与生产环境交互的过程中不断学习,改进自身调度策略。此类模型离线训练时不依赖于难以获得的真实生产数据样本,在线调度时可以快速获得高质量的调度方案。然而现阶段的DRL调度模型往往存在泛化性不足的问题,模型在训练后只能求解特定结构的调度问题,这使得模型的应用场景极为受限。
——新型DRL调度方法的实用性亟需改善。
研究成果
本研究提出的DGERD Transformer智能调度模型在经过训练后,即可求解不同规模的调度问题,有优秀的鲁棒性、泛化性和实用性。本研究使用国际标准调度案例库OR-Library测试算法性能,大量实验结果显示,相较于在每一个调度实例中效果最佳的启发式排产规则, DGERD Transforme所求得的解的质量平均可提高2.69%。在进行工件数量超过50个,机器数量超过20台,总工序超过1000道的大规模调度时,DGERD Transformer的调度性能可稳定的超过Google开发的组合优化求解器OR-Tools。同时,DGERD Transformer的解质量及求解速度均显著优于量子粒子群、差分进化、禁忌搜索、人工鱼群等元启发算法。在求解案例库中最大规模的调度实例时,DGERD Transformer相较于其他算法的性能改善甚至高达11.57%。
——实用性好、响应速度快、调度质量高。
本研究开创性的将深度强化学习、注意力机制、Transformer架构、node2vec图嵌入方法等前沿的人工智能技术改进后融入到智能调度算法的设计中。证明了这些技术被运用于工业生产调度的可能性和潜力,为大规模生产系统的智能控制提供了新的研究方向和思路。
长按二维码,关注我们!
微信公众号 | 苏大机电
往期推荐
苏州大学机电工程学院出品
编辑排版:薛旭宁