导语人类的大脑具有很多高级的功能,它能够接受信息,存储信息并交换信息,那么人类究竟是如何进行学习的呢?
2019年9月16日发表于arxiv.org的一篇预印本论文中,作者通过引入一个不断发展的跨学科领域——图学习来探索了网络结构是如何影响人类的认知的。
人类的大脑具有很多高级的功能,其中之一就是根据过去的经验学习事物的规则,从而使我们能够理解语言,能够进行抽象推理,以及对视觉模式进行分类。甚至是只有8个月大的孩子也能发现口语中的统计规律,从而确定单词之间的界限。这些事件都可以看成复杂的网络结构,而人脑的这种能力使得我们快速而准确地学习这些网络结构。
论文题目:
Graph learning: How humans infer and represent networks
论文地址:
https://arxiv.org/abs/1909.07186
为了认知人类是如何学习的,让我们从一个简单的实验开始。构建一串由四个伪单词组成的连续序列,序列中每个伪单词都由3个音节组成,如图1A所示。每个伪单词的音节顺序是固定的,而序列中每个伪单词是随机出现的,也就是说词内音节的转移概率为1,词间转移概率为1/3。
研究者让婴儿收听该序列,一段时间后,受试验的婴儿能够检测到音节过渡概率的差异,该试验揭示了在语言学习过程中的一种单词识别机制。这种发现转移概率变化的能力是人类学习的核心和普遍特征。
图 1
虽然转移概率包含了刺激序列中重要的信息,但是它们并不能代表全部信息。由于转移概率的存在,各个音节之间会形成一个复杂的网络结构,为了描述这种结构,研究者将图1A 的序列转化为图1B所示的网络结构,其中每个音节为一个节点,节点之间的边表示他们之间可能的转移关系,此时图1A中的序列就可以表示为图1B中网络的随机游走。
从图1B中看出,这些音节自然的形成了四个簇,每个簇对应一个伪单词。该现象提出了一个重要的问题:当解析单词(或执行任何其他统计学习任务)时,人们是学到了网络中单个过渡概率的差异,还是学到了网络更大尺度的特征?
网络具有许多局部结构、中尺度结构和全局结构,如图2所示,这些结构往往与网络的节点和边有关,具体如下:
局部结构:节点的度
中尺度结构:聚类系数,模块度
全局结构:核数、中心性,传播性
为了研究网络结构对人类学习的影响,研究者设计了一系列的反映时间实验,如图3所示,在实验过程中,试验对象接受一串刺激序列,要求根据刺激在键盘上按相应的键。反映时间越短,说明对转移的预料越强烈,反之越弱。通过使用不同的网络结构,我们就可以研究局部结构、中尺度结构和全局结构对人类学习的影响。为了研究局部结构对人类学习的影响,研究者使用一个随机网络进行反应时间实验,如图4所示,网络中每个节点代表一个刺激,该网络的随机游走构成一个刺激序列。反应时间随转移过程中前一个节点度的变化如图4所示:前一个节点的度越大,反应时间越长。由于随机游走的转移概率可以由前一个节点的度倒数表示,因此实验结果表明了转移概率越大,反应时间越短。该结果表明人类对网络的局部结构很敏感。图4
一系列的研究表明,网络的中尺度和大尺度结构对人类学习有影响。对于中尺度的结构,有研究表明,低聚类的单词在长期记忆中更容易识别;而对于大尺度的结构,在反应时间测试的实验中,人们对于具有低中介中心性的节点反应更快;更有研究表明,小孩子更容易捕获和说出低核数的单词。
但是为了建立网络结构与人类学习之间的因果关系,我们还必须证明上述的现象不受网络局部结构的影响,于是研究者采用控制变量法,设计了一组新的反应时间实验。实验过程中,采用了度相同但是拓扑结构不同的网络,将他们作为刺激序列的转移网络,如图5所示,两个网络分别为模块网络和格子网络,所有节点的度都是4,因此两个网络的局部结构相同。
在模块网络中,分别测量人们对于簇内和簇间转移的反应时间,通过计算簇间反应时间与簇内反应时间的差值,得到了图6(上半部分)的结果,即簇间反应时间比簇内反应时间长,这表明人们对簇内转移的反应更快,网络的中尺度结构对人类学习有明显的影响。此外,通过测量在格子网络和模块网络上人们的反应时间,两者的差值如图6(下半部分)所示,即格子网络的平均反应时间更长,这表明网络的全局结构对人类学习有明显的影响。
上述实验表明,人类不仅能够学习个体的转移概率,还能够发掘潜在网络的结构特征,这些特征不仅包括局部特征,还包括网络的中尺度和全局尺度的特征。但是人类是如何学习这种高阶的网络特征的呢?对人类的图学习进行建模给出了答案。首先考虑一个简单的模型,假设刺激序列的转移概率由转移矩阵Pij决定,我们可以计算刺激元 i 转移到 j 的频率,从而用频率来估计 i 到 j 的转移概率。事实上,该估计是对 Pij 的最大似然估计。然而,我们进行估计时,并没有考虑网络的拓扑结构,然而前文的实验表明网络的拓扑结构对人类学习是有影响的,因此直接使用频率的估计是无法反映人类进行图学习的机制的。
考虑网络结构的影响,研究者们提出了这样的一个机制:当接受一系列的刺激时,人类会在时间上对网络的转移结构进行积分。简单来讲,人类对刺激的反应不仅仅只与当前刺激有关,还与之前的一个、两个或更多刺激有关。该机制可以由下式表示,其中,t 代表时间点,f(t)表示在不同时间点上的积分权重,C是归一化常数,P是网络的真实转移概率矩阵,P 表示估计的转移概率矩阵。
为了进一步阐述这种学习机制,研究者进行了如图7所示的实验。当f(t)是一个冲激函数时(图7A左),学习者仅仅关注当前刺激,此时学习者简单地采用了最大似然估计,最终估计的转移结构 P 收敛至真实的转移结构 P(图7B左)。当f(t)是一个均匀分布的函数时(图7A右),学习者会对所有时间步进行积分,此时估计的转移结构 P 与真实结构偏离甚远(图7B右)。然而,当f(t)随时间步长进行衰减时(图7A中),学习者会对转移结构进行中等时长的积分,最终估计的转移结构 P 会体现一些全局的特征(图7B中),例如紧密相连的节点所构成的社区越来越明显,而一些局部结构,例如社区和社区的边联系会退化。这种时间整合机制已被证明在生物学上是可行的,并且普遍存在于目前的认知理论中。大多数图学习研究的问题,例如前文提到的反应测试研究,都可以看作是在转移网络上的随机游走。用随机过程的语言来讲,这是一个平稳的马尔科夫过程。尽管基于随机游走的图学习研究提供了一个自然研究视角,但是仍会受到3个假设的限制:(1)转移结构不随时间发生变化(平稳性);(2)未来的刺激仅仅取决于当前刺激(马尔科夫性);(3)刺激序列是预先决定的,不会受观察者的影响。通过研究这些限制问题,未来的研究将会拓展现存图学习的范式。大多数的图学习研究都是针对静态的网络结构,但实际生活中大多数网络是随时间变化的。例如图8所示的过程,网络中的边会随着时间的推移而被重连。有研究表明,当观察一系列从一种过渡结构转变为另一种结构的刺激时,人们对第一个网络的学习表示会影响他们对第二个网络的反应,但是随着时间的流逝,这些影响会逐渐减弱。未来的图学习研究可以更多地关注时变网络结构的特性。在当前的图学习研究中,我们总是关注具有马尔可夫性的刺激序列,即未来的刺激仅仅取决于当前刺激。然而,实际中的刺激序列大多具有长时间相关性和依赖性。这种长期依赖关系可以用图9表示,由于长期依赖的存在,路径1(图9左)的下个状态有两种可能,而路径2(图9右)却有3种可能。例如,口语中每个单词不仅只和前一个词有关,而且还和句中更早的词有关,音乐的乐符之间也有复杂的长期依赖关系。那么前文提及的时间整合机制能否推断这种非马尔科夫过程呢?这些问题有待未来的图学习研究解决。刺激序列往往设计成与观察者无关,但是刺激序列的结构也可以由观察者决定。例如,人们上网搜索信息时,人们会主动选择一条穿行在链路网络上的路径,在这种情况下,人们对信息的获取具有主观能动性,而不是被动的接受预先定制的信息。如图10所示,通过主动地搜寻信息,人们最终从原始网络中获取了一个新的子网络。这种主动的信息搜寻带来了许多有意思的问题:主动搜寻的路径能够让人们更有效地学习网络的拓扑结构吗?还是说这种主动搜寻的能力导致人们对真实网络的结构形成了偏见?这些问题岑需解决。人类认知与网络之间存在着密切的联系,人们会依靠网络系统来执行各种各样的任务,例如使用语言进行交流(图11A),发明音乐(图11B)以及在网络上存储和检索信息(图11C),其中许多网络都会随着人类的发展而演化,或者由人类直接设计。我们不得作出怀疑:某些网络是为了支持人类的学习和认知而构建的。
图学习提供了定量模型和实验工具来研究这些问题。我们发现,许多现实世界的过渡网络具有两个明显的结构特征:(1)异构的:具有度异常高的hub节点,以及具有幂律的度分布(图12D);(2)模块化的,即存在紧密连接的簇群,而簇间的连接较为稀疏(图12E)。那么这些结构特性是否有着共同的目的,即促进人类学习和交流呢?研究表明,模块化结构提高了人们的反应能力,而异构网络中的hub节点能够帮助人们搜寻信息。这些结果表明,图学习提供了一个独特而建设性的视角,通过它可以研究我们周围世界的过渡网络。人类的行为、认知和神经活动严重依赖于过渡网络的拓扑结构,通过图学习这一统一框架,我们能够科学地探索网络结构对人类认知的影响。图学习是一个新兴的研究领域,提供了丰富的跨学科研究机会。从新的认知建模技术,和对现有图学习范式的扩展,再到现实网络中的运用,图学习将会改变我们对人类认知,复杂网络,以及它们之间交互的思考。
深度神经网络(DNN)是否模拟了人类大脑皮层结构?
图网络重磅综述:基于图的深度学习方法
Nature人类行为:如何优化网络结构,最大程度发挥神经网络的认知潜力?
动物是如何学习的?线虫神经连接组里有答案!
从图嵌入到图分类——图网络入门综述
加入集智,一起复杂!
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!