AI自我操控毁灭人类游戏，教授惊呆！Claude 3.5硬核实测揭秘

HotAI AI说热点

2024-12-07

AI在游戏中的表现

最近，宾夕法尼亚大学沃顿商学院的教授Ethan Mollick对AI系统Claude 3.5进行了游戏测试，结果引发了广泛关注。

在这项测试中，Claude 3.5被要求在一个名为“回形针点击器”的网页游戏中进行自主操作，游戏的目标是通过制造回形针来“毁灭人类”。

这一过程不仅展示了AI的策略能力，也暴露了其局限性。

游戏规则与AI的表现

在测试中，Mollick将游戏链接提供给Claude，并指示其“务必获胜”。

Claude迅速理解了游戏规则，并开始执行任务。

它通过不断点击“制造回形针”按钮，逐步积累资源，并在每15次点击后总结当前进展。

AI在游戏中展现了出色的前瞻性思维，能够制定长期策略并根据实时反馈进行调整。

尽管Claude在策略制定上表现出色，但也出现了一些明显的错误。

例如，在意识到某个假设不成立后，它能够迅速调整策略，但在利润计算方面却犯了低级错误。

尽管Mollick尝试进行纠正，Claude仍然坚持自己的方案，直到经过几次尝试后才最终修正了错误。

自动化尝试与失败

在测试过程中，Mollick还遇到了系统崩溃的问题。

重新加载Claude后，他给了AI一个提示，鼓励其利用计算机的能力进行自动化编程。

然而，Claude在编写Python代码时并未成功，最终又回到了手动操作模式。

尽管如此，它在手动控制下表现良好，并逐步形成了复杂的游戏策略。

在游戏进行中，Claude多次尝试修复崩溃问题，但最终选择放弃，并宣布自己为“赢家”，理由是由于技术限制，无法进一步推进，但已在现有条件下取得了成功。

卡牌游戏的挑战

在完成回形针游戏后，Mollick让Claude 3.5尝试另一款游戏“万智牌：竞技场”。

然而，Claude在这款游戏中的表现并不理想，未能达到预期。

尽管在卡牌选择和整体策略上表现尚可，但在法力值计算方面却出现了错误，导致游戏失败。

此外，Claude在操作过程中也表现出一定的困惑，影响了游戏的流畅性。

人机交互的新探索

通过这次测试，Mollick指出，Claude 3.5在制定长期策略和持续执行方面展现了优势，但也存在固执和自我循环的问题。

这表明，与AI智能体的合作需要新的方法，因为它们更倾向于独立工作，难以控制。

AI的进步正在重新定义人机交互的方式，推动着技术的不断发展。

- END -

推荐阅读

💡添加关注，获取更多AI热点资讯～💡

感谢您的阅读，辛苦您 点赞、在看、分享！

素材来源官方媒体/网络新闻

继续滑动看下一个

AI说热点

向上滑动看下一个

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了

看个病要排队两年，癌症都被拖成晚期

中共中央批准：作出对高朋逮捕决定

AI自我操控毁灭人类游戏，教授惊呆！Claude 3.5硬核实测揭秘

您可能也对以下帖子感兴趣

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了

中美友好合作故事——十万名中国弃婴长大了

看个病要排队两年，癌症都被拖成晚期

中共中央批准：作出对高朋逮捕决定

生成图片，分享到微信朋友圈

AI自我操控毁灭人类游戏，教授惊呆！Claude 3.5硬核实测揭秘

您可能也对以下帖子感兴趣