查看原文
其他

Voyager:Minecraft中embodied agent具身智能体

renee创业狗 Renee 创业随笔
2024-10-09

今天看了一篇论文,英伟达的Voyager,它是由英伟达的MineDojo团队开发的,利用大型语言模型(LLM)驱动,在Minecraft世界中实现具身智能体(embodied agent)。这个团队的负责人是Jim (Linxi) Fan,他在AI领域是个网红,据说是OpenAI的第一个实习生。之前在美国举办的真格活动中,我听了他的一次分享,他当时提到他在英伟达负责Game AI。

在MineDojo的GitHub上Star最多的三个项目分别是:

  • Foundation Model,MineCLIP
  • 主项目MineDojo:Building Open-Ended Embodied Agents with Internet-Scale Knowledge
  • 今天我们要介绍的Voyager,即An Open-Ended Embodied Agent with Large Language Models

Voyager无需人类干预,就能持续探索世界、习得多样化技能,并做出新发现。论文地址:https://voyager.minedojo.org/


项目背景

作为Minecraft中第一个LLM驱动的Open-Ended Embodied Agent,Voyager不断探索、掌握技能并做出新发现。

【三个关键组成部分】

1)一个自动课程,考虑到探索进度和代理状态,以最大化探索范围。

2)一个不断增长的可执行代码技能库,用于存储和检索复杂行为。在新任务出现时,库的顶部添加新技能,底部执行查询以识别前五个相关技能。

3)一个新的迭代式提示机制,包括环境反馈执行错误自我验证,以改进程序。

左侧是环境反馈,例如GPT-4意识到在制作棍子之前需要两个木板;右侧是执行错误,例如GPT-4意识到应该制作木斧而不是金合欢斧。

自我验证通过提供代理的当前状态和任务给GPT-4,我们要求它充当批评者,并通知我们该程序是否完成了任务。如果任务失败,还会提出完成任务的建议。

Voyager通过blackbox查询与GPT-4交互,避免了对模型参数的微调需求。Voyager所发展的技能在时间上延续,具有强解释性且具有组合性,这加速了它的能力累积,减轻了灾难性遗忘的问题。

对比

相较于以往的最佳技术,看看效果:

  • 获得的独特物品增加了3.3

  • 旅行距离增长了2.3

  • 技术树关键里程碑上的速度提升了高达15.3倍。

继续滑动看下一个
Renee 创业随笔
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存