深圳具身智能研究突破 推动机器人技术与行业需求深度融合
近日,深圳市人工智能与机器人研究院(AIRS)具身智能中心发布了一系列重要研究成果,为机器人领域的发展带来了新的突破。
据了解,具身智能(Embodied AI)是一种全新的人工智能理念,它区别于传统人工智能的观念,主张智能的产生不仅依赖算法和算力,还需要通过与实际世界的互动来实现。这意味着,智能体(例如机器人)需要具备感知环境、执行物理操作和与环境互动的能力,以便更全面地理解和掌握世界知识。
图源:Unsplash
具身智能研究跨越了机器人学、人工智能、认知科学及神经科学等多个学科,旨在深化对智能本质的理解。具身智能的挑战在于如何构建高度适应性的感知和决策系统,使机器人能够准确理解和预测物理世界的复杂动态,并确保机器人能以自然有效的方式与人类及其他智能体交互。解决这些挑战有望将智能机器人应用推向家庭、工业、医疗和探索等多个领域,促进人机交互的自然化和任务执行的效率化。
为了实现这一目标,深圳市人工智能与机器人研究院(AIRS)具身智能中心正在致力于设计并实现先进的机器人大脑系统,为多种机器人形态提供脑力,类似于移动互联网时代 Android 系统对多种移动设备的赋能。
据该中心负责人刘少山博士介绍:“就像智能手机时代 Android 系统重塑市场软件生态一样,对具身智能机器人软硬件系统的研究与开发,将引领机器人领域的重大变革,也将为机器人时代开启新的篇章。”
目前,该中心在学术和工程方面均取得了显著进展。具身智能中心的俞波博士带领团队在可靠性和容错计算、基于因子图的机器人计算系统、机器人以及无人驾驶路径规划软硬件协同设计等领域取得了重要突破,相关研究成果已分别被计算机行业顶刊 Communications of the ACM(CACM)、计算机体系结构顶会 ASPLOS24 以及现场可编程门阵列领域顶会 FPGA24 录用。
CACM,影响因子22.7, 是计算机科学领域最顶尖的学术期刊之一,被誉为“计算机界的圣经”。我们发表于CACM的文章,“The Vulnerability-Adaptive Protection Paradigm Toward Reliable Autonomous Machines”,介绍了我们在机器人系统可靠性和容错计算方面的研究,后续可靠性和容错计算将是具身智能系统同一个重要的研究课题,本文章的合作方包括美国乔治亚理工大学(GeorgiaTech)以及美国罗彻斯特大学(University of Rochester)。
ASPLOS,CCF A类会,是计算机体系结构领域最顶级的国际学术会议之一。我们的论文“ORIANNA: An Accelerator Generation Framework for Optimization-based Robotic Applications”介绍了我们在基于因子图的机器人计算系统方面的研究,提出因子图在感知、规划和控制方面的软硬件协同设计的框架和设计方法。本文章的合作方包括中科院计算所以及天津大学。
FPGA ,CCF B类会,是现场可编程门阵列领域最具影响力的国际学术会议之一。我们的论文“Accelerating Autonomous Path Planning on FPGAs with Sparsity-Aware HW/SW Co-Optimizations”介绍了我们在机器人以及无人驾驶路径规划软硬件协同设计的成果。本文章的合作方包括北京理工大学以及美国加州大学欧文分校(UC Irvine)。
此外,具身智能中心的夏轩博士带领团队在多模态大模型支持的智能体智能(Agent AI)方向开展了多项研究,成功开发了三类智能体:规划智能体 AIRS-Bot、编程智能体 AIRS-Code 以及群智智能体框架 AIRS-Agents。这些智能体将为机器人提供更强大的感知、学习、决策和行动能力,推动机器人技术与行业需求的深度融合。
◾ 规划智能体AIRS-Bot。借助多模态大模型能力,该智能体可以与人类进行自然语言文字交互、通过图像感知环境、基于文字生成图像、以及以用户定制的语音进行交互。该智能体支持API调用,可以为机器人提供行为规划与决策能力,满足机器人具身智能的功能实现。
◾ 编程智能体AIRS-Code。该智能体的能力包括诊断错误,优化代码,提供详细的编程概念解释,并提供各种编程语言和技术的步骤指导。该智能体在HumanEval指标上pass@1性能达到43.4%,超过了CodeLlama-Python-13B的43.3%,用更少的参数获得了更好的性能。该智能体可以为机器人提供自主编程能力,满足机器人的自主复杂操作技能需求。
◾ 群智智能体框架AIRS-Agents。该智能体框架支持定义多个不同类型的机器人智能体以及它们的规划智能体,将它们构成智能体集群并进行统一的调度规划。该智能体可以为机器人集群提供群体智能,实现大范围的机器人具身智能。
在未来,具身智能中心将继续在具身智能软件、软硬件协同设计和安全性等领域开展研究与工程化实现。重点围绕以下方向开展研究工作:
◾ 具身智能软件:进一步研究和开发能够赋予机器人感知、学习、决策和行动能力的智能软件系统,提升机器人对环境的理解和适应能力。探索具身智能软件在不同领域的应用,例如生产制造、服务业、医疗康复等,推动机器人技术与行业需求的深度融合。
◾ 软硬件协同设计:加强软硬件协同设计研究,突破机器人系统软硬件之间的协同瓶颈,提升机器人系统的整体性能和效率。探索软硬件协同设计的新方法和新技术,为具身智能机器人系统的研发提供有力支撑。
◾ 可靠性:高度重视机器人系统的可靠性问题,开展机器人可靠性技术研究,确保机器人安全可靠地运行。研究制定机器人可靠性标准和规范,推动机器人可靠性技术发展和应用。
◾ 人形机器人应用开发:探索人形机器人的多模态感知技术,为其提供相应的周围物体、场景和事件的识别、理解和预测能力。探索人形机器人的社会交互和创造性能力,让人形机器人能够与人类和其他机器人进行自然、流畅和友好的社会交互,并开发人形机器人的艺术创作和逻辑推理技能。