神经元的混合选择性:高维表征实现高级认知
按:对高级认知功能的理解可以从神经系统的不同层面进行,在神经元水平上,高级认知功能被认为与神经元的混合选择性以及高维表征有关。本文基于Fusi等人综述的部分内容,主要从理论层面介绍混合选择性和高维表征的概念。相关实证研究可以见文末“相关阅读”。
对于大脑功能的传统观点认为,一个神经元(甚至一个脑区)会高度特定地具有某一种功能,即结构和功能存在较确定的对应关系。但是,许多研究表明事实并非如此。高级皮层(额叶/顶叶)的许多神经元似乎具有多种功能,可以根据不同任务情境表现出不同的功能。这种属性我们就叫做“混合选择性”(mixed selectivity)。混合选择性的编码方式就叫做“适应性编码”(adaptive coding),即神经元可以根据任务情境,编码多种任务相关变量,如规则、感觉特征、运动决策等。具有这些特性的神经元也在海马、杏仁核中被发现。
那么,大脑为什么要发展出这样的特性呢?从计算的角度来看,一个基于高度特异化神经元组成的大脑只能学习少量的简单任务,很容易陷入瘫痪,而混合选择性可能是完成复杂思维和行动的核心。
具有混合选择性的神经元可以被不同任务变量的组合选择性地激活,而非被单个变量的反应所预测。这种神经元反应在相同的情境里是可重复的,但在不同情境中是不同的。因此,单个混合选择性神经元本身的活动是没有意义的,只有在某种情境下和其他神经元一起,其编码的信息才可以表达确定的意思。这符合近期更新的神经元学说(Yuste et al., 2015; Nat Rev Neurosci),即神经系统的功能单位可能是神经元群体(ensembles),而非单个神经元。
不过,神经元只是编码信息是不够的,编码的信息必须是明确的,这样才能被下游的结构所接受。为此,我们需要一个标准来确定神经环路能够解释哪种表征。对此,我们可以借助人工神经网络,如果一个基于简化生物学原理的人工神经网络可以读取相关信息,那我们便假设大脑也可以。一个传统的方法是线性读取(linear readout),因为它可以很容易地实现人工网络单个单元的加权求和与阈值运算。
图1a/b可以帮助我们理解具有混合选择性的神经元集群的编码优势。图中三条轴分别代表三个不同神经元的放电频率(神经元1对声音敏感,其活动随声音强度提高线性增强;神经元2对视觉输入敏感,其活动随视觉对比度提高线性增强;神经元3对这两个因素的线性组合敏感,具有线性混合选择性)。图中四个圆点分别表示该神经元集群在四种不同条件下的反应;实验任务是要对两种刺激组合做出一种反应(红色圆点),对另两种组合做出另一种反应(黄色圆点)。
图1 (a) 低维神经表征;(b) 高维神经表征
我们将神经表征的维度定义为确定所有点位置所需坐标轴的最小数目。图1a的四个点位于一个平面上,所以它们存在于一个低维空间(2D);图1b的四个点则不再共面,它们位于对其而言的高维空间上(3D)。在图1a的情况下,由于所有神经元对刺激都只有线性反应,所有点位于同一个平面,因此我们无法利用线性分类器将红色条件和黄色条件区分。但是,只要我们将具有混合选择性的神经元3变为一个可以反映两种因素非线性组合的时候,神经表征就会从二维变成三维(图1b所示),这时我们就可以利用线性分类器对不同条件进行区分。在更一般的情况下,线性分类器可分类的数目随着神经表征的维度呈指数增长。因此,具有高维输入的线性分类可以实现大量任务相关反应。
多样性和非线性混合选择性是必须的,但当考虑到噪声时,这些可能还不够。在真实的情况下,图1a和图1b中的圆点会被一群点取代,这些点表示了对于一个特定条件,不同试次间的神经活动分布。噪声的存在可能导致神经表征的维度增加,但由于噪声的随机性,这些成分对于编码和分类没有用处。本文后面也介绍了利用主成分分析(PCA)或交叉验证的方法,在存在噪声的情况下测量维度,这部分这里不具体介绍,有兴趣的同学可以参考原文。
利用PCA的方法,在存在噪音的情况下确定维度数(详见原文)
尽管高维表征带来了更强的可分性,但高维表征并不总是理想的,一些情况下我们需要降维。图1c/d展示了一个降维的例子:这里我们考虑两个神经元,各自对不同的声源做出反应(例如一个对左耳声音,一个对右耳声音),任务是判断哪个声音更响。声音的产生满足某种分布,在图中反映在椭圆形的放电频率分布上。由于噪音的存在及有限的取样,如图1c所示,对于6个点进行分类的结果可能并非是最优的,分类器横跨了两个分布,其泛化能力有限。
图1 (c) (d) 降维可以提高泛化能力(generalization)
对此,一种解决有限取样问题的方法就是降维,如图1d所示,将6个点投影到一条虚线上(从二维降到一维),这时即使只有6个点的样本,也有可能推断出一个最佳的分离超平面。这种降维有助于提取最相关的特征,忽略不重要的变化。
对神经表征的维度进行量化,可以让我们了解在大脑中,感觉和认知信号是如何被处理的。近期的计算研究通过使用深度学习等方法来理解感觉皮层、高级皮层的神经编码,其中心策略是在整个层次结构的处理过程中,在升维和降维之间取得平衡。例如,降维在感觉加工(如物体识别)中很重要,我们面对不同视角的同一物体需要获得相同的分类结果。相反,升维对于刺激输入的可分性和反应输出的灵活性很重要,这有助于完成涉及多个变量的复杂任务。
最近的实验结果表明,神经表征的维度和行为表现之间存在相关。灵长类动物在进行认知工作记忆任务时,前额叶皮层神经表征的维数达到了最大值,在错误试次中,额叶区域的神经表征维度会崩溃,这表明高维表征有助于正确执行任务(见:Nature文献 | 前额叶功能总是难以捉摸?神经元的混合选择性与高维神经表征)。
神经表征维度与行为表现的关系(Rigotti et al., 2013; Nature)
用一句话来总结:大脑需要通过降维来去除无关的因素,同时将剩余的因素塑造到一个高维空间中以便对它们进行处理,从而正确产生复杂的行为。
论文原文:Fusi, S., Miller, E. K., & Rigotti, M. (2016). Why neurons mix: high dimensionality for higher cognition. Curr Opin Neurobiol, 37, 66-74. doi:10.1016/j.conb.2016.01.010
感谢支持!欢迎留言、转发、分享!