宇树科技王兴兴:与其完善多模态大模型,不如探索开发全新模型
【关 键 词】 人形机器人、具身智能、强化学习、自动驾驶、触觉感知
2024年被广泛认为是人形机器人技术发展的重要年份,具身智能论坛在2024智源大会上成为焦点,吸引了众多关注。宇树科技的创始人兼CEO王兴兴在论坛上强调,探索开发全新模型比继续完善现有大语言模型和多模态大模型更可能带来突破。英伟达GEAR负责人范麟熙也认为2024年将是机器人全面崛起的第一年,英伟达CEO黄仁勋在GTC AI大会上提到生成式人工智能的发展催生了新的机器人产业。
宇树科技作为具身智能领域的领军企业,其产品H1被誉为“国产首款能跑的全尺寸通用人形机器人”,在英伟达GTC AI大会上受到关注。王兴兴在论坛上分享了人形机器人如何通过强化学习等技术实现稳健行走,同时指出机器人行业需要结合多种技术实现真正的落地应用。
在具身智能体的数据来源方面,王兴兴提到目前主要依赖仿真环境中的深度强化学习,但在某些情况下,结合真实数据进行训练可以取得更好的效果。他强调,在复杂任务和人机交互中,真实数据尤为重要,因为现有仿真环境对接触的模拟较为粗糙。尽管高精度仿真环境可以提高训练效果,但其成本较高,且在某些情况下难以实现。
王兴兴还探讨了智能模型和模型结构的改进空间,提出开发对数据需求较低的模型,以更接近人类的学习方式。他认为,与其继续完善现有的大语言模型,不如探索开发全新模型,这可能带来更大的突破。
在自动驾驶领域,王兴兴和清华大学助理教授高阳讨论了模块化系统和端到端大模型的优缺点。高阳认为端到端的方法更自然和高效,而王兴兴指出,在复杂系统中,直接训练端到端模型的难度较大,通常需要将任务分解、分别训练,再合并整体训练。
此外,王兴兴提出了为机器人增加触觉感知的可能性,以提升其智能和交互能力。他认为这可能是一个值得研究的方向,但触觉传感的设计和实现非常困难。他期待未来机器人能够在硬件要求低、AI要求高的情况下,通过下载先进的通用智能模型来完成各种任务。
对于具身智能产业的发展前景,王兴兴预测在未来两到三年内,具身智能可能在一些相对简单的工业领域或体育赛事中得到应用,因为这些场景目标明确,过程清晰,相对容易实现。这表明具身智能技术正逐步走向成熟,并有望在不久的将来在特定领域实现广泛应用。
【原文链接】 阅读原文 [ 3621字 | 15分钟 ]
【原文作者】 元界