高源博士与林天麟教授开发异构机器人团队围捕系统,相关论文被T-RO接收
近日,我院智能机器人中心团队的论文“Asymmetric Self-Play-Enabled Intelligent Heterogeneous Multirobot Catching System Using Deep Multiagent Reinforcement Learning”被机器人领域顶级期刊 IEEE Transactions on Robotics 接收。
该论文旨在开发一个更加强健和智能的异构机器人团队围捕系统,以应对现代异构多机器人系统中不断增长的异构性和不同类型机器人数量。
图1. 基于多智能体强化学习算法规划的异构多机器人室外围捕系统
图2. 通过对不同机器人建模形成的统一训练感知接口
论文链接:https://ieeexplore.ieee.org/document/10101687
01
期刊介绍
IEEE Transactions on Robotics 为机器人学领域公认的三大顶级期刊之一(T-RO / IJRR / Sci. Rob.),平均每年全球发文量约100篇,该期刊致力于发表最新的机器人技术研究成果,包括算法、控制、感知和应用等方面,代表了机器人领域最先进的重大进展,要求论文在理论和工程效果上同时推动机器人学的发展。
02
研究背景
多机器人系统是一个涉及协调和控制多个机器人的复杂性问题领域。它包括任务分配、路径规划和电动控制学习等各种方面。目前已有很多关于同构机器人的研究工作,越来越多人也关注具有不同功能和特点并共同工作的非均匀设置(即所谓“异构”的设置)。多机器人系统的应用包括农业、SLAM 和探索等领域。
03
研究方法
文章提出了一种基于演员-评委(Actor-Critic)多智能体强化学习的用于解决异构机器人团队合作博弈的框架,通过融合不对称自我博弈和课程学习技术来实现异构机器人团队之间的合作行为。这个框架使异构多机器人系统在真实世界约束条件下进行复杂捕捉变成可能。
图3. 基于多智能体强化学习异构机器人团队智能围捕博弈架构
04
研究结论
研究团队进行了模拟实验以评估不同机制对方法性能的影响,并进行了现实世界试验以评估系统在复杂真实围捕问题中的表现。此外,团队还开展了比较 S2M2(另一个最先进方法)与文章所述方法在异构围捕问题中的桥接研究,结果表明文章所述方法在对抗性环境下表现更好。研究团队通过训练期间融合不对称自我博弈和课程学习提出的框架,在模拟和真实世界约束条件下成功完成异构多机器人团队捕捉任务,并为未来大规模智能安全与救援异构多机器人团队提供了方向。
图4. 团队进行异构多机器人室内统计学实验(无人机,通讯和围捕机器人)合作围捕系统示意图
05
作者简介
本文由来自 AIRS、香港中文大学(深圳)、清华大学、伦敦大学学院的研究者合作完成。第一作者和通讯作者分别是 AIRS 高源博士和林天麟教授。
高源博士,博士毕业于瑞典乌普萨拉大学,现为深圳市人工智能与机器人研究院(AIRS)助理研究员,科研项目负责人,深圳市海外高层次人才。高源博士曾参与欧盟机器人研究项目,现在林天麟教授的领导与指导下,负责主持广东省“基于图表征多智能体强化学习的大规模智能异构多机器人系统研究”。高源博士专注于机器人学习算法,异构自适应系统和机器行为学研究,在 IEEE T-RO、IEEE T-MECH, ACM IMWUT、IEEE RA-L、NIPS、ICRA、IROS 等国际期刊及会议发表论文余30余篇。
林天麟,香港中文大学(深圳)助理教授-校长青年学者,机器人与智能制造国家地方联合工程实验室常务副主任,深圳市人工智能与机器人研究院(AIRS)智能机器人中心主任,电气与电子工程师协会(IEEE)高级会员。分别于2006年和2010年在香港中文大学获得一级荣誉学士学位和博士学位。研究重点包括多机器人系统,新型移动机器人及协作机器人等。获国内外授权专利70余项,发表2部专着,在 T-PAMI、T-IP、T-RO、T-MECH、JFR、RA-L、ICRA、IROS 等顶尖国际期刊及会议发表论文余50篇。获2011年 IEEE/ASME T-MECH 最佳论文奖, 2020年 IROS 机器人机构及设计最佳论文奖及2020年 IROS 最佳应用论文提名奖。研究成果被 Reuters、Discovery Channel、IEEE Spectrum、NHK 日本放送协会等众多国际知名媒体广泛报导。
06
团队介绍
AIRS 智能机器人中心由林天麟教授领导,旨在研究多机器人系统自由组成各种形态以解决不可预知问题的关键技术,通过简单智能体的集群实现复杂的智能群体行为,让机器人系统拥有可复用、自由构型、可拓展、故障自修复等通用特性,为机器人设计领域创造出一种全新切实可行的实现形态。
团队长期从事机器人和人工智能研究,开发了十余种机器人和智能系统。在承担国家科研项目方面经验丰富,获得了国家自然科学基金面上项目、国家科技部 “智能机器人”重点研发计划项目等多项纵向项目资助。科研成果发表于 T-RO、T-IP、T-MECH、JFR、ICRA、IROS 等机器人与自动化领域的国际顶级期刊和会议上。关于 FreeBOT 的研究成果获2020年 IROS 机器人机构与设计最佳论文奖,IEEE Spectrum、日本放送协会 NHK 和Engadget 等多家国际知名媒体对其进行了广泛报道。
扫码了解团队更多论文和视频信息:
团队主页:
团队B站:
CUHKSZ-RAIL
* 相关论文信息由论文作者提供
相关阅读:
我院胡君杰博士与林天麟教授在人工智能顶刊IEEE T-PAMI发表文章
我院林天麟教授团队再发IEEE Transactions on Robotics,本年度T-RO两连发
我院林天麟教授团队在 IEEE Transactions on Image Processing 上发表文章
我院林天麟教授团队在IEEE Transactions on Robotics上发表文章
AIRS in the AIR | 模块化自重构机器人系列讲座精彩回顾