AI自我操控毁灭人类游戏,教授惊呆!Claude 3.5硬核实测揭秘
01
AI在游戏中的表现
最近,宾夕法尼亚大学沃顿商学院的教授Ethan Mollick对AI系统Claude 3.5进行了游戏测试,结果引发了广泛关注。
在这项测试中,Claude 3.5被要求在一个名为“回形针点击器”的网页游戏中进行自主操作,游戏的目标是通过制造回形针来“毁灭人类”。
这一过程不仅展示了AI的策略能力,也暴露了其局限性。
02
游戏规则与AI的表现
在测试中,Mollick将游戏链接提供给Claude,并指示其“务必获胜”。
Claude迅速理解了游戏规则,并开始执行任务。
它通过不断点击“制造回形针”按钮,逐步积累资源,并在每15次点击后总结当前进展。
AI在游戏中展现了出色的前瞻性思维,能够制定长期策略并根据实时反馈进行调整。
尽管Claude在策略制定上表现出色,但也出现了一些明显的错误。
例如,在意识到某个假设不成立后,它能够迅速调整策略,但在利润计算方面却犯了低级错误。
尽管Mollick尝试进行纠正,Claude仍然坚持自己的方案,直到经过几次尝试后才最终修正了错误。
03
自动化尝试与失败
在测试过程中,Mollick还遇到了系统崩溃的问题。
重新加载Claude后,他给了AI一个提示,鼓励其利用计算机的能力进行自动化编程。
然而,Claude在编写Python代码时并未成功,最终又回到了手动操作模式。
尽管如此,它在手动控制下表现良好,并逐步形成了复杂的游戏策略。
在游戏进行中,Claude多次尝试修复崩溃问题,但最终选择放弃,并宣布自己为“赢家”,理由是由于技术限制,无法进一步推进,但已在现有条件下取得了成功。
04
卡牌游戏的挑战
在完成回形针游戏后,Mollick让Claude 3.5尝试另一款游戏“万智牌:竞技场”。
然而,Claude在这款游戏中的表现并不理想,未能达到预期。
尽管在卡牌选择和整体策略上表现尚可,但在法力值计算方面却出现了错误,导致游戏失败。
此外,Claude在操作过程中也表现出一定的困惑,影响了游戏的流畅性。
05
人机交互的新探索
通过这次测试,Mollick指出,Claude 3.5在制定长期策略和持续执行方面展现了优势,但也存在固执和自我循环的问题。
这表明,与AI智能体的合作需要新的方法,因为它们更倾向于独立工作,难以控制。
AI的进步正在重新定义人机交互的方式,推动着技术的不断发展。
推荐阅读
- • 第10个国家中心城市的消失,背后隐藏了什么真相?
- • 简历加一句话,面试邀约暴涨四倍!马斯克都笑了,百万网友争相模仿!
- • 小米SU7 Ultra即将来袭!10月29日揭开战斗氛围的神秘面纱!
- • WTT法国蒙彼利埃冠军赛小勒布伦4:1张本智和夺冠狂欢,张本兄妹失落亚军,背后的故事让人心疼!
- • 摆摊致富梦破灭,数千小餐饮创业者为何惨遭重创?