查看原文
其他

AI自我操控毁灭人类游戏,教授惊呆!Claude 3.5硬核实测揭秘

HotAI AI说热点
2024-12-07


01

AI在游戏中的表现


最近,宾夕法尼亚大学沃顿商学院的教授Ethan Mollick对AI系统Claude 3.5进行了游戏测试,结果引发了广泛关注。

在这项测试中,Claude 3.5被要求在一个名为“回形针点击器”的网页游戏中进行自主操作,游戏的目标是通过制造回形针来“毁灭人类”。

这一过程不仅展示了AI的策略能力,也暴露了其局限性。


02

游戏规则与AI的表现


在测试中,Mollick将游戏链接提供给Claude,并指示其“务必获胜”。

Claude迅速理解了游戏规则,并开始执行任务。

它通过不断点击“制造回形针”按钮,逐步积累资源,并在每15次点击后总结当前进展。

AI在游戏中展现了出色的前瞻性思维,能够制定长期策略并根据实时反馈进行调整。

尽管Claude在策略制定上表现出色,但也出现了一些明显的错误。

例如,在意识到某个假设不成立后,它能够迅速调整策略,但在利润计算方面却犯了低级错误。

尽管Mollick尝试进行纠正,Claude仍然坚持自己的方案,直到经过几次尝试后才最终修正了错误。


03

自动化尝试与失败


在测试过程中,Mollick还遇到了系统崩溃的问题。

重新加载Claude后,他给了AI一个提示,鼓励其利用计算机的能力进行自动化编程。

然而,Claude在编写Python代码时并未成功,最终又回到了手动操作模式。

尽管如此,它在手动控制下表现良好,并逐步形成了复杂的游戏策略。

在游戏进行中,Claude多次尝试修复崩溃问题,但最终选择放弃,并宣布自己为“赢家”,理由是由于技术限制,无法进一步推进,但已在现有条件下取得了成功。


04

卡牌游戏的挑战


在完成回形针游戏后,Mollick让Claude 3.5尝试另一款游戏“万智牌:竞技场”。

然而,Claude在这款游戏中的表现并不理想,未能达到预期。

尽管在卡牌选择和整体策略上表现尚可,但在法力值计算方面却出现了错误,导致游戏失败。

此外,Claude在操作过程中也表现出一定的困惑,影响了游戏的流畅性。


05

人机交互的新探索


通过这次测试,Mollick指出,Claude 3.5在制定长期策略和持续执行方面展现了优势,但也存在固执和自我循环的问题。

这表明,与AI智能体的合作需要新的方法,因为它们更倾向于独立工作,难以控制。

AI的进步正在重新定义人机交互的方式,推动着技术的不断发展。

- END -

推荐阅读

💡添加关注,获取更多AI热点资讯~💡

感谢您的阅读,辛苦您 点赞、在看、分享!

素材来源官方媒体/网络新闻
继续滑动看下一个
AI说热点
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存