事实上,人对物体长什么样子的知识,与实际视觉识别它的经验之间关系,是非常复杂的,这个发现来自于北师大的毕彦超教授的团队。
Carving the nature at its joints.
—— 柏拉图
研究者找来了几位视障群体,这些人从没有看见过物体长什么样子。研究者给正常人看了不同物体的图片,又分别把不同物体的名字念给视障人士和正常人听。
在和正常人的对照实验中,研究者发现视障人士和正常人的脑区表现出特别一致,或者是特别不一致的对物体的偏好。
脑区 A
不管是视障人士还是正常人,脑区A都非常喜欢几类物体:场景、家具、交通工具,还有一切大的东西。并且脑区A与一些参与空间导航的脑区连接都更强。
视障人士和正常人的这个脑区都特别喜欢工具和躯干,不论是看到这些图片或者听到它们的名字都有更强的激活。因此,脑区B可能喜欢的涉及人的动作、肢体运动的信息,而对工具的兴趣来自于是手脚对它进行操作和使用。正常人的这个脑区最喜欢看的是动物,包括哺乳动物、昆虫、鱼、鸟、爬行动物等等。但是视障群体和正常人在听这些词的时候就完全没有这种偏好。也就是说脑区C,对动物的特异性感知是完全靠视觉来驱动的。为什么正常人和视障人士对某些物体类别图片偏好的脑区相似,而有些类别的脑区不相似呢?这是因为人作为主体识别加工物体脑机制,与人的进化过程应该是非常相关的。不同类型的物体有很不同的进化意义。我们看到动物和人造物时,会有很多种不一样的推论和目的:动物长什么样子,我们人只能被动的接受。我们没有办法决定一个恐龙长什么样子,一个鱼长什么样子。我们只能去适应它,去学习它、去识别它。之所以对动物识别的脑区特点如此依赖视觉输入,是因为人去加工它的视觉输入跟对它的合适反应,是一个应该怎么适应接受的状态。但是人造物的出现是完全不一样的。人造物完全是人进化过程的产物。一个凳子它是这个样子,是因为我们人把它做成了这个样子,人可以坐在上面;一个书包长什么样子,是因为我们人把它做成中空的可以装东西。在进化过程当中,人造物的形状、人对它的反应,和它的操作方法和功能是有直接的对应。工具创造和使用的进化过程,可能对人大脑有很强的塑造。对于人脑来说,处理不同类型物体的过程和机制是非常不一样的,物体视觉识别的过程与我们如何与它进行交互、包括非视觉的交互,都密切相关。对于人的进化有非常不同进化意义和目的的物体,大脑可能进化出了不同的模板去处理,而这种模板既包括视觉系统内部的特征,也包括视觉与非视觉系统的关系。我们可以这么说:知识在在人的大脑里以这两套模式存储,组合在一起是人类知识表征。无论我们是看一个图片,还是看一个词,最终都是这两套系统一起激活。需要额外强调的是感觉知识的表征,不仅仅和感觉信号本身有关,还和运动动作相关。我们推测可能感觉来源的知识系统对非文本编码的“common sense knowledge”表征,有额外重要的作用;而语言来源的知识系统也在视觉识别中有所影响。柏拉图有个经典说法:Carving the nature at its joints. —— 对自然界的正确切分。大脑成功点也在此——对自然世界的进行特定的切分处理。
更多有趣的AI应用,尽在Mixlab星球!
欢迎加入!