PNAS:专业音乐训练对增加言语加工能力真的有效吗?
点击上方蓝字关注我们,即可获取更多精彩原创文章、学习资料。
音乐与言语感知公用大部分的神经基础,大量研究表明音乐经验对言语加工能力具有促进作用,引起了大家对于专业音乐训练的关注。最新发表于PNAS(Proceedings of the National Academy of Sciences of the United States of America)的文章:Inherent auditory skills rather than formal music training shape the neural encoding of speech,通过脑电的方法,揭示了专业的音乐经验既不是必要的,也不足以增强大脑的神经编码和声音感知能力。
关键词:脑电图| 经验依赖的可塑性| 听觉事件相关的脑电位| 频率跟随响应| 自然形成与后天培养
研究背景
据广泛报道,音乐训练改变了人脑的结构和功能特性,在听觉系统的各个层面都观察到音乐引起的神经可塑性,最值得注意的是,在他们的听觉-认知优势中,音乐家在言语和语言任务中特别有优势,包括语音噪声(SIN)识别,这表明音乐训练不仅在理想的声学环境下而且在不利的声学环境(例如,嘈杂的“鸡尾酒会”场景)中可以增加听的能力并且帮助解释言语。但是,在听觉学习和音乐相关可塑性的横断面研究中,听觉系统功能的先天差异很容易伪装成可塑性,音调技巧(如音高和时间感知)在婴儿时期(即6个月龄)就可以发展,甚至可能与某些遗传标记有关。不幸的是,大多数将音乐与语言可塑性联系起来的研究都是横断面的,只包括音乐家经验的自我报告,某些人仍然可能拥有自然丰富的听觉系统,使他们倾向于追求音乐兴趣,因此,在听觉感知任务中广泛报道的音乐家优势可能是由于与专业训练无关的内在差异。
为此,我们的研究并不是要反驳音乐训练和增强的语言脑功能之间的可能联系。相反,我们的目的是测试预先存在的听觉技能可能至少部分地介导语音处理中的神经增强的可能性,我们的设计包括神经成像(FFR和ERP)和行为测量,以复制先前工作的主要实验设计,记录训练有素的音乐家在语音和SIN处理中的神经可塑性。我们假设沉睡的乐者(music sleeper,具有高度接受音乐性的非音乐家)会对正常和噪音削弱的语音表现出增强的神经生理学编码,这与训练有素的音乐家中报道的广泛发现一致,我们的研究结果证明了先前存在的听觉技能在语音的神经编码中的重要但未被充分认识的作用,并且对音乐相关的神经可塑性仅仅是经验驱动的广泛假设进行了调整。 我们发现,专业的音乐训练既不是必要的,也不足以增强大脑的神经编码和对言语和其他复杂声音的感知。
研究方法
被试 28名年轻人(年龄:22.2±3.1岁,23名女性)参加了主体实验,被试数量是根据之前关于音乐训练的研究匹配的,所有被试都进行了极少的正式音乐训练(即<3 y)并且在过去5年内没有音乐训练(在先前音乐诱导的神经可塑性实验中被定义为non-musician),根据PROMS音乐性测试(评估音乐性,包括旋律,调音,重音和节奏感知四个模块的评估)得分的高低将被试氛围高低音乐性两组(如下图所示,Ps < 0.001),这些被试均具有正常的听力并且高低音乐性的两组在专业音乐训练年份[高分组= 0.57±0.63 y,低分组= 0.79±0.97 y; t(26)= -0.69,P = 0.50]、自我报告的音乐能力[高分组= 1.6±1.5,低分组= 1.1±1.2; t(26)= 1.11,P = 0.28]、读取音乐的能力[高分组= 0.9±1.3,低分组= 0.4±0.5; t(26)= 1.37,P = 0.18]、在给定起始音高的情况下编写简单旋律的能力[高分组= 0.6±1.3,低分组= 0.3±0.8; t(26)= 0.85,P = 0.40]并且无人报告了绝对音准能力,以及年龄[高分组= 23.2±3.6 y,低分组= 21.2±2.3 y; t(26)= 1.73,P = 0.10]、社会经济状况(根据父母教育程度的最高水平评估)[高分组= 4.5±1.4 ,低分组= 4.1±1.0; t(26)= 0.93,P = 0.49]、正规教育程度[高分组= 16.4±2.7,低分组= 15.6±2.4; t(26)= 0.73,P = 0.48]、利手情况[高分组= 85.7±21.1,低分组= 85.6±2.8; t(26)= 0.02,P = 0.986]均没有组间显著差异(Ps>0.05)。性别组间略不平衡[Fisher精确检验,P = 0.041],在随后的分析中把它作为协变量。并且在QuickSIN测试(测量噪音中的语音接收阈值)中没有观察到组差异[t(26)= 1.27,P = 0.22]。
图 1 根据PROMS音乐性分数分组情况,Error bars = ±1 SEM; ***P < 0.001
材料与EEG 使用合成的100毫秒语音(/ a /),其F0为100赫兹,在先前的研究中已经显示出在经验丰富的音乐家中引起FFR和ERP显著的群体差异,和之前的研究一致,在EEG记录期间没有任务,被试在被动接受语音下观看自选电影,除了“干净”的模块[信噪比(SNR)=∞dB]之外,语音呈现在背景噪音中,因为音乐家的语音增强通常是在复杂声学条件下观察的,噪声干扰的语音是通过将连续的,非时间锁定的嘟嘟声以+10 dB SNR覆盖到干净的模块来创建的,语音声音根据聚类序列以交替的极性呈现,交错的刺激间隔(ISI)为记录脑干(ISI = 150 ms; 2,000次试验)和皮质电位(ISI = 1,500 ms; 200次试验)优化,同时最小化反应适应。
实验结果
FFR的幅度和起始潜伏期用于评估听众对早期听觉通路中语音的神经反应的总体幅度和时间精确度,发现:
言语诱发的FFR揭示了音乐家听觉过程中中的神经增强,清晰(A和B)和噪声(C和D)语音条件下的FFR波形和频谱反映了锁相神经活动对语音的频谱时间特征的影响。
图(E) FFR F0幅度,专业音乐家的数据以进行比较。 反映语音“音调”编码的FFR F0幅度显示出组×噪声交互作用[F(1,26)= 6.42,P = 0.018,d = 0.99],低乐感被试对噪音具有降级效应(清晰>噪音),高乐感被试中的语音FFR对于噪声(清晰=噪声)是不变的,表明即使在具有挑战性的声学条件下高乐感被试也具有优越的语音编码能力。尽管高PROMS得分者的听觉功能强于低分组,但正规训练约10年的音乐家表现出比当前样本中所有非音乐人更大的语音FFR [单尾t(24)= 1.89,P = 0.03],与高得分组相比[t(24)= 1.76,P = 0.04]和低得分组相比[t(24)= 1.61,P = 0.05]
图(F) 谐波(即H2-H5)幅度反映了语音“音色”的神经编码,类似地显示了组×噪声交互作用[F(1,26)= 7.90,P = 0.009,d = 1.10]。这种效应可归因于高PROMS得分组的噪声中语音谐波编码更强,而PROMS低得分组没有观察到噪声相关的变化。 FFR潜伏期显示组[F(1,25)= 6.47,P = 0.018,d = 0.98]的主要效应,其中高PROMS得分被试的语音响应更早(即更快的精确度)。
图(G) 使用广义线性混合效应(GLME)模型回归来评估行为PROMS评分和神经FFR反应之间的联系,发现神经噪声是被试音乐性的强预测因子[t(54)= -2.61,P = 0.012],更大的“大脑噪音”与较低的PROMS表现相关,表明听觉感知技能较差。
皮质中语音诱发的反应受到噪声的调节,而不是被试固有的听觉技巧(音乐性),上图显示了清晰(A)和噪声干扰语音(B)的ERP波形。
图(C) 高PROMS得分非音乐家与音乐家之间的皮质ERP振幅没有显著差异[t(24)= -0.52,P = 0.31], 然而,音乐家的反应小于PROMS评分低的人[t(24)= -1.96,P = 0.03)。
图(D) 脑-脑相关性进一步揭示FFR F0振幅与噪声干扰语音的ERP P1振幅[r = 0.51,P = 0.006]相关,SIN处理期间的脑干反应预测上游的皮层反应。
图(E) FFR潜伏期预测P2(r = 0.40,P = 0.0346)和N1-P2振幅(r = 0.45,P = 0.0151)。
总结
具有高度熟练的听力技巧但没有接受正规音乐训练的人(即沉睡的乐者)具有更优的听觉系统功能,表现在更强大和时间上更精准的对言语的神经编码,这些效应与训练有素的音乐家的开创性研究中报道的依赖经验的可塑性十分相似,从自然形成与后天培养的角度来看,自然(即,先前存在的听觉脑功能差异)限制了神经生物学和行为反应,因此具有更高保真度的听觉神经表征的个体也倾向于具有更好的听觉感知;然而,训练的经验依赖效应能够“培养”神经生物学功能,并为交流信号的感觉处理提供额外的增益。最重要的是,我们的结果强调了在评估音乐对语音/听觉能力的影响以及声称与经验或训练相关的影响之前记录先验听力技巧的迫切需要。
简单来讲,如果没有什么乐感,大可没有必要通过专业的音乐训练有望提高言语感知技能了。
参考文献
Mankel, K., & Bidelman, G. M. (2018). Inherent auditory skills rather than formal music training shape the neural encoding of speech. Proceedings of
the National Academy of Sciences. Retrieved from http://www.pnas.org/content/early/2018/11/26/1811793115 doi: 10.1073/pnas.1811793115
培训信息
科研服务
灌注数据处理服务
EEG/ERP数据处理服务
脑电数据预处理:使用EEGLAB对Neuroscan、Brain Products、EGI、ANT、Biosemi等主流脑电设备采集的脑电数据进行预处理。
ERP成分统计分析:提取ERP成分的波幅和潜伏期,并进行统计分析。
EEG频谱分析:使用傅里叶变换的方法计算脑电各个频段的功率,并进行统计分析;使用短时傅里叶变换、小波变换和希尔伯特变换的方法进行脑电时频分析(如ERD/ERS分析、试次间相位同步分析)。
基于sLORETA的脑电源分析:ERP成分源定位;特定频段EEG源定位;源空间的脑功能连通性分析。
功能连通性分析:使用相关、相干、相位锁定值和格兰杰因果分析研究电极之间功能连通性。
近红外数据处理服务
PET数据处理服务
功能磁共振数据处理
任务态激活脑区分析
任务态E-prime实验实
功能连接分析
局部一致性(ReHo)分析
低频振幅(ALFF/fALFF)分析
基于图论及ICA的脑网络分析
结构磁共振数据处理
基于VBM的灰白质分析
基于Freesurfer的皮层厚度分析
基于FSL的纤维束追踪
详情联系:
微信/电话:13381109780(杨女士) 18920456283(于女士)