查看原文
其他

想要别人注意你?说话时带点情绪

郑茜,杨志刚 心理学报 2023-05-13

想像这样一个场景,在一个人声嘈杂、觥筹交错的酒会上,你和几个朋友聊天。你正讲到一件有趣的事情想要吸引朋友的注意力,朋友却打着手势跟你喊到,“太吵了,你刚才说什么?”这时你,或者说你们,会怎么做?

每一个学习心理学的人对于上面的场景可能都不陌生,虽然我们可能从来都没有参加过一场类似的酒会,但我们都知道,这里所描述的就是心理学中著名的“鸡尾酒会问题”。最早认识到这个场景中所蕴含的科学价值的是英国科学家Collin Cherry,但他所关注的问题并不是嘈杂的场景给我们所带来的挑战,而是我们的听觉系统在面对类似的场景时所展现出来的极强的“鲁棒性”(robustness),尽管有来自很多无关声音的干扰,但对于一个听力正常的听者而言,很多时候我们还是能够克服外在的干扰,将注意力集中在自己感兴趣的说话人身上,聆听他/她说了些什么。所有其他的声音都被有效地过滤掉,成为你们谈话的背景,除非这个时候有人突然喊到你的名字,你才可能转过头去看是谁在叫你。而这种我们能够自动地在背景声中检测出自己所感兴趣的信息的现象又被称为“鸡尾酒会效应”。

不夸张地说,“鸡尾酒会问题”在心理学研究中的地位丝毫不逊色于“薛定谔的猫”在物理学中的研究地位。因为这个典型的问题场景中包含了至少两个相互纠缠的问题:一是来自于不同声源的信号如何彼此分离(segregate),二是来自于同一声源的信号如何被组合(grouping)在一起。Bregman (1990)将其统称为听觉场景分析(auditory scene analysis)问题。值得注意的是,虽然“鸡尾酒会问题”多数情况下都是指听觉领域而言,但它所涉及的场景分析问题同样适用于其他感觉通道。比如在复杂的视觉场景中,也存在如何将来自于不同客体的信号成分分开(比如图形和背景的分割)和将来自于同一客体的成分捆绑(binding)的问题。因而,“鸡尾酒会问题”一经提出,就在心理学、声学、计算机科学和神经科学等领域引起了巨大的反响,成为推动这些领域相关研究进展的一个模式问题。


两种不同的取向

先抛开计算机与神经科学领域的研究不谈,在行为层面上,“鸡尾酒会问题”至少在两个方向上获得了深入的研究。这两个方向一开始看似是相互分离的,但随着研究的深入,却发现有殊途同归的趋势。

首先是在心理声学领域。研究者们所关注的是“鸡尾酒会”场景中干扰声音对于目标声音的掩蔽(masking)问题。所谓掩蔽,就是指干扰声音的出现使目标声音识别变得更加困难的现象。这并不难理解,但这里的问题是,干扰声音为何能够导致目标声音加工的困难,或者说,听觉掩蔽的机制是什么?对于这个问题,早期的研究者们注意到干扰声在听觉外周(主要是耳蜗和听神经)处对目标声音的影响。具体说,声音刺激在听觉外周处会受到耳蜗和听神经的分频带编码,如果干扰声音和目标声音存在频率上的重叠时,同时呈现的干扰声就会占用本可用于加工目标声音的特定带宽资源,使得目标声音在听觉外周处得不到完整的表征,从而影响其在更高级听觉中枢的加工。研究者把这种发生在听觉外周阶段的掩蔽形式称为外周掩蔽能量掩蔽

然后,后来的研究表明,能量掩蔽并不是唯一的听觉掩蔽形式。在人们通过某些手段(比如将掩蔽声音与目标声音进行分频处理,使其不占用相同的频率带)控制或排除了能量掩蔽成分之后,干扰声音的存在仍然会对目标声音的加工造成影响。这就意味着在能量掩蔽之外还存在着其他的掩蔽形式。研究者们把这种不能够用能量掩蔽机制加以解释的掩蔽形式称为信息掩蔽,认为它主要是由掩蔽声与目标声的相似性或听者判断哪些信号成分属于目标声音的不确定性造成的。但对于信息掩蔽的具体机制,长期以来一直存在争议。人们更多地是将其作为一个“行李箱词汇”来使用。也就是说,所有不能归因于能量掩蔽的掩蔽效应都被认为是信息掩蔽。但信息掩蔽中是否包含不同的亚成分?其具体机制是什么?长期以来则一直存在争议。

另一方面,在认知心理学领域,“鸡尾酒会问题”所激发的则是一条不同的研究路径,主要聚焦于选择性注意领域。在Cherry提出“鸡尾酒会问题”并使用双耳分听追随程序对其进行实证研究之后不久,另一位著名的英国心理学家Broadbent即提出了著名的注意的过滤器模型对双耳分听实验的结果进行解释。该模型认为注意的选择是在不同的信息通道间进行的,被选择的信息会通过注意的门控机制,得到更进一步的高级语义加工,但没有通过过滤器的信息则不能得到高级加工。但过滤器模型作为最早的一个基于信息加工取向的认知模型不是没有缺点的,它假定注意对不同信息通道的选择是“全或无”式的,没有受到注意的信息会完全被屏蔽在高级认知加工之外。但这和经验观察的结果不一致,在实际生活中,对于注意通道之外的信息,人们是具有一定的加工能力的。正如Cherry所观察到的,如果你在和朋友专注交谈的过程中有别人突然提到你的名字,你马上就能注意到并将头转向说话人的方向。这就是与鸡尾酒会问题相关的“鸡尾酒会效应”。这两个概念叫法相似,意义上却有明显的区别。鸡尾酒会问题强调听觉系统在嘈杂的听觉场景中如何加工目标声音,而鸡尾酒会效应则强调在同样的场景中注意在不同刺激间的分配。

为了应对早期过滤器模型的不足,Ann Treisman和Deutsch等人对其进行了进一步的修正或挑战,提出了衰减模型和反应选择模型等。这些模型虽然在注意选择的位置和其对信息的效应等方面均存在差异,但与过滤器模型一样,都认为注意选择是在不同的信息通道(channel)之间进行的。需要注意的是,这里所谓的刺激通道,并非单纯指类似于左右耳这样的两个物理通道,而是在发生上同源的特定客体或事件。比如具体在听觉上,可以指两个人各自的说话声,哪怕它们是呈现给同一只耳,也属于两个具有一定独立性的声学事件。当然,不同客体或事件在知觉特征上的相似性会影响在它们之间做出选择的难度。相似性越高,也就越难于将不同的客体或事件区分开(segregate),当然也就难于将来自于同一客体或事件的信号成分组合在一起(grouping)。

然而,除了这类基于刺激通道的选择模型之外,还有一些研究者认为注意选择并不是基于通道间的选择,而是基于对中枢资源的分配。比如,在Daniel Kahneman于1972年所提出的注意的能量分配模型中,就假定认知系统可用的中枢加工资源是有限的,要在不同的任务间进行分配。很多因素可以影响可用资源的数量和分配方案,但模型并不假定这些资源的分配是在不同的刺激通道间进行的。这使得该模型可以比注意的通道选择理论更灵活性地解释一些现象,比如为何有时人们可以进行“一心二用”式的多任务操作,为何唤醒水平和任务难度都会对操作成绩产生重要影响等。但如何协调通道理论与能量分配模型间的关系?对于这一问题却一直没有深入的讨论。

注意的能量分配理论Kahneman, 1972


一个整合的框架

因此,我们发现,“鸡尾酒会问题”在不同的领域中都引发了大量的研究。但这些研究就像一张完整拼图中一些零散的片段,每一个领域都在讲述着一个故事,这些故事在主题上有明显的相似性,但却缺少一些关键的部件将它们整合在一起。在这种情况下,通过一些“打通”性的工作将不同领域内的研究整合起来,对于我们深入理解鸡尾酒会问题的实质具有重要的意义。

我们认为,我们之前所提出的一个三阶段的听觉掩蔽模型就可以起到这种作用。这个模型是直接在早期的二阶段听觉掩蔽模型的基础上提出的。如下图所示,我们仍然认为听觉掩蔽在总体上可以分为能量掩蔽和信息掩蔽两个大的阶段,但是在信息掩蔽这个“行李箱”中,我们可以划分出一些隔断,区分出信息掩蔽的一些子成分。具体地,我们认为信息掩蔽中包含两种子成分,分别可以称为知觉掩蔽(perceptual masking)和认知掩蔽(cognitive masking)。其中,知觉掩蔽是由掩蔽声作为一些独立的声音流与目标声音竞争注意资源所导致的,掩蔽声音流越多,其与目标声音流在知觉属性上相似性越高,就会造成越多的掩蔽;而认知掩蔽也可以称为内容掩蔽,它是因掩蔽声音中所包含的语义或其他泛语言内容所导致的。这些内容因其对听者的生态学意义而能自动地获得一定程度的前语义或语义加工,而这些内容的加工会占用本应用于对目标声进行内容解码或语义通达等操作的中枢资源,从而造成对目标声音的掩蔽。与知觉掩蔽不同,认知掩蔽与掩蔽声的知觉属性无关,而只与掩蔽声中所包含的语言或泛语言成分有关。在知觉掩蔽确定的条件下,掩蔽声中所包含的“内容”越多,就会造成越多的掩蔽量。

事实上,找出听觉信息掩蔽亚成分是听觉心理学领域中很多研究者的共识,有很多研究者都在进行这样的尝试。比如Cooke et al.(2008), Mattys et al.(2012)等人都指出掩蔽声音对注意的竞争、高级认知负载(cognitive load)和来自于熟悉的语言(known language)的知识的干扰是信息掩蔽的重要成分。但这些掩蔽类型的划分都很随意,且很难明确界定不同的掩蔽子成分间的关系。我们所提出的听觉掩蔽三阶段模型则可以从发生机制上很明确地说明两种信息掩蔽子成分的来源和影响因素。

此外,我们的模型还与注意领域研究中的两类注意模型相契合。具体说,知觉掩蔽阶段包括目标声在内每一个独立的声音刺激都会参与到对注意资源的竞争中,注意的选择是基于刺激通道的。受到注意的目标声会受到充分的加工,未受到注意的掩蔽声会受到衰减,但它(们)与目标声在知觉属性上越相似,听觉系统就越难以将其从目标声音流中“择”出来。因此掩蔽声音流中的一些内容片段就会蹓到高级加工中枢。而这时它们就会与目标声音流中的信息竞争内容解码资源。但在这一阶段,来自于掩蔽声的内容与来自于目标声的内容已不再具有“流”的属性,而是成为很多混杂在一起的信息片段。而此时认知中枢也不再将信息明确地区分为哪些是目标,哪些是掩蔽。所有的信息都会被进行同等程度的加工,而加工的具体程度则取决于可用的中枢资源。因此,很显然,在我们的模型中,知觉掩蔽阶段对应着注意的通道选择模型,而认知掩蔽阶段对应着能量分配理论。


与情绪有何干系?

写到这里,终于要谈到文章标题中所提到的情绪问题了,所有这一切与情绪有什么关系呢?我们知道,日常交流中,言语经常会带有情绪信息。具体地说,情绪信息可以以两种不同的形式出现。一是言语的情绪性韵律,一种是情绪性语义。虽然在实际生活中两者经常是一同出现的,比如一个人可能会怒气冲冲地向另一个人大吼,“我要杀了你!”,或是兴高采烈地说,“我太喜欢这里的景色了!”。在这些情景中,一方面说话者的语调会带有愤怒或高兴的情绪,另一方面他们所说的话语内容中也包含“杀了”或“喜欢”这样带有明显情绪信息的词汇。我们想知道的是,言语的情绪性信息在嘈杂的环境中是否能够起到克服掩蔽声干扰(即去掩蔽)的作用,如果有的话,情绪韵律和情绪语义是否有不同的去掩蔽机制?

结合前面所提到的听觉掩蔽三阶段模型,我们认为情绪韵律和语义都可以起到去掩蔽的作用,但两者去掩蔽的机制不同。具体地说,情绪韵律可以帮助我们在混合的声音流中更好地追踪目标声音流,从而可以起到去知觉掩蔽的作用;而情绪语义本身并不能在知觉层面上帮助我们更好地追踪目标声音流,但是情绪性的语义内容相对于中性语义内容在大脑的言语加工系统中具有优先性,从而可以使其在众多经过初级注意门控的信号中得到优先解码,从而可以起到去认知信息掩蔽的作用。

郑茜等人的研究正是为了验证这一假设。为此,他们录制了语义内容和发声韵律分离的语料。比如用高兴的语调说出的中性无意义语句(之所以用无意义语句是为了尽可能排除被试在句子识别过程中利用句子本身的意义进行的猜测效应)“这个铅笔可以调动那个站台”,或者是用中性的语调说出的带有积极情绪语义的句子,如“那些情侣可能爱慕这些别墅”。实验中,将这些目标句和作为掩蔽刺激的另外两个说话人的声音混合在一起呈现,之后要求被试复述他们所听到的目标句,研究人员会对被试复述的情况进行记录。结果证明了,言语的情绪韵律和情绪语义都具有去掩蔽作用。但是两者作用机制不同,情绪韵律主要作用于知觉掩蔽,对认知掩蔽也有较小的作用;情绪性语义只对认知掩蔽有效,对知觉掩蔽没有作用。

因此,这一研究的结果不仅发现情绪韵律和情绪语义的不同去掩蔽机制,还为我们此前提出的听觉掩蔽的三阶段模型提供了进一步的佐证。


文献来源:
郑茜, 张亭亭, 李量, 范宁, 杨志刚. (2023). 言语的情绪韵律和情绪语义对听觉去信息掩蔽的作用. 心理学报, 55(2), 177-191.
(点击左下角“阅读原文”可下载全文pdf)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存