查看原文
其他

用 AI 理解 AI:和 Kimi 一起,我读懂了斯坦福的「AI 小镇」!

🐣 AI 破壳儿 2024-03-08

于今年 4 月发表的《Generative Agents: Interactive Simulacra of Human Behavior》(生成式智能体:人类行为的交互仿真),引起了业界的广泛关注。

论文由 Google 和斯坦福联合发表,全长 22 页。

带着对它的好奇,上周拿到 Kimi Chat 的内测资格后,我又将它翻出,计划做一次“一石二鸟”的实验:

  • • 目的一:实测 AI 智能助手产品 Kimi Chat,这款由 Moonshot AI 发布的国产大模型应用,使用体验究竟如何?

  • • 目的二:圆自己读论文的心愿,获得一手认知。


  • 💡 论文总结 / Kimi Chat 体验渠道均附在文末。

前情提要
什么是「AI 小镇」实验?

研究者创建了一个虚拟的 AI 小镇,在这里生活着 25 个智能体。

他们睡觉、起床、吃饭、上班,画家在画画,作家在写作。他们有思想,会互相聊天。他们有社会关系,也会交新朋友。他们有记忆,会反思,会制定计划,并按计划做事。

就像我们每个人的日常。

更有趣的是,这些 AI 竟可以有类似人类的行为,不管是个体行为,还是群体行为。比如:

  • • 当一个智能体看到另一个的早餐 🥣 要烧糊了,他会立即关掉炉子 🔥;

  • • 当一个智能体被邀请参加派对 🎉,他会记住这个日程,并邀请“朋友”同行 🤝‍;

  • • 当一个智能体告诉 💬 “别人”自己要参加选举,这个话题在“小镇”上传开 💨。

10 分钟,30 个问题
我如何跟 Kimi 协作阅读?

在此之前,我对这篇论文的了解,只停留在科技资讯报道层面。今天,希望借和 Kimi Chat 的协作,高效且深入地了解其中的原理和专业概念。

不得不说,这是一次成功的人机合作。😉

接下来,开始详细介绍我的 AI 阅读攻略。

第一步:发送 PDF,获取中文总结

第二步:解释关键术语和专业概念

第三步:澄清相似概念

这篇论文中重点提到的是生成式智能体(截图中被翻译为:生成代理),所以我有点搞不清楚,这跟 AI Agent / AI 智能体有什么区别?

值得关注的是,这些内容并未存在在论文中,而是 Kimi 基于自身能力提供的回答。

第四步:举例子,理解抽象概念

我让 Kimi 开始介绍“故事性”的内容,比如:实验中的小镇和 25 个智能体,是如何被创造出来的?

第五步:查漏补缺,建立全面的认知

作为一个人类,我还很关心,实验者是如何与这些智能体交互的

实验的有效性验证是如何操作的?Kimi 在开头提到了论文中的两个验证有效性的方法,即受控评估和端到端评估,通过询问操作方法,可以获得具体的操作步骤和解释。

智能体有哪些局限性?由于这些智能体都是自发行动与互动,我很好奇他们有没有什么异常表现?

关键技巧:交叉验证 AI 的正确性

对于一些重点信息,可以要求 Kimi 提供参考来源(如章节、原文描述、第几页第几行等),来交叉核实答案正确性。大模型生成的内容,需要仔细甄别!

附加题:追踪新信息,与老信息对比

论文是 4 月发表的,当我看到一个 9 月发布的相关新闻,我请 Kimi 对比有何新发现。

Kimi 支持实时访问网络,可以轻松总结网页上的内容,并与原论文内容进行比较。


论文要点总结
这场实验,发现了什么?

温故知新,尽管 AI 可以帮我们快速阅读、获取知识线索,但是正如之前在聊 Perplexity 提到的:知识内化的过程,仍然需要我们自身进行信息归纳。

以下是我们根据 Kimi Chat 提供的阅读帮助,进行的最终总结。

1 - 生成式智能体是一种特殊的 AI Agent。它使用生成模型(论文中使用的是 GPT-3.5)来模拟人类行为,能够根据过去的经验和当前环境生成逼真的行为,在交互式应用中更具吸引力。

2 - 智能体在实验环境中,表现出模拟人类的可信行为,包括个人行为和群体行为,但也存在局限性。他们能够根据过去的经验做出反应、回答问题、互动、生成计划和行动。但这不意味着他们的行为 100% 正确,他们也会犯错误。

3 - 实验者通过扮演智能体的“内心声音”,或改变智能体周围的物体状态,来干预模拟世界。实验者可以通过与智能体进行自然语言对话来干预,使智能体将这作为自己的“内心声音”来指导行动。而类似炉子的状态从“打开”改为“燃烧”的案例,是通过直接改变物体状态来影响智能体的行为。

4 - 实验者为什么要进行干预?因为这有助于观察智能体的互动和行为。比如实验者让其中的一个智能体发起派对,以此观察智能体之间传播、参与的社会性互动。

5 - 智能体如何被构建?通过自然语言进行角色初始化,通过实验干预和自由互动趋于稳态。实验者为每个智能体提供一个简短的自然语言描述,作为其初始记忆,而后经历两天的自由互动。实验者通过观察生成智能体的长期行为和群体行为,以了解它们在真实场景中的稳定性和可信度。

6 - 生成智能体架构的三个主要组件:记忆、反思和规划,缺一不可。控制评估的结果表明,这三个组件对生成智能体产生可信行为至关重要。当移除这些组件中的任何一个时,智能体的表现都会下降。

  • • 论文原文:arxiv.org/pdf/2304.03442v1.pdf

  • • Kimi Chat 体验:kimi.moonshot.cn/‍‍‍‍‍

如果本文对你有帮助,点个赞 👍 告诉我们吧~


Kimi Chat 已被收录至「AI 破壳儿」旗下的 AI 工具使用指南 Poke Book。

如果你还想了解更多易用、实用的 AI 工具,欢迎点击 ⬇️ “阅读原文”,免费订阅 Poke Book。

继续滑动看下一个

用 AI 理解 AI:和 Kimi 一起,我读懂了斯坦福的「AI 小镇」!

🐣 AI 破壳儿
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存