其他
谷歌DeepMind:GPT-4高阶心智理论彻底击败人类!第6阶推理讽刺暗示全懂了
新智元报道
新智元报道
【新智元导读】刚刚,谷歌DeepMind、JHU、牛津等发布研究,证实GPT-4的心智理论已经完全达到成年人类水平,在更复杂的第6阶推理上,更是大幅超越人类!此前已经证实,GPT-4比人类更能理解语言中的讽刺和暗示。在心智理论上,人类是彻底被LLM甩在后面了。
高阶心智理论
第6阶:GPT-4准确率93%,人类准确率82%
多阶心智理论问答:MoToMQA
来源:网络资料
结果
ToM任务
事实任务
锚定效应
人类AI大PK!
人类
LLM
GPT-4如何超越人类?
规模+微调
语言+多模态
高阶表现
回忆任务
更懂人类,能做仲裁
数据集
五项心智理论,GPT-4四项超越人类
错误信念
反讽
失言
暗示
奇怪故事
作者介绍