查看原文
其他

【综述】帕金森病的语音特征及功能影像研究进展

邹潇雅 承欧梅 中华神经科杂志 2022-04-27
点击标题下「蓝色微信名」可快速关注


文章来源:中华神经科杂志, 2021,54(6) : 620-625

作者:邹潇雅 承欧梅



摘要

言语障碍是帕金森病患者运动障碍最早出现的症状之一,甚至出现在肢体运动障碍之前。患者的生活质量会因为言语障碍的存在和严重程度受到显著的影响,针对帕金森病言语障碍的早期识别就显得尤为必要,而声学分析的异常在帕金森病的早期就已经发生。语音在声学分析上表现出了特征性的改变,有助于帕金森病的诊断。与此同时,这些特征与功能影像的相关性还不是很明确。文中主要阐述了帕金森病患者的语音特征及其功能影像上的改变,进一步揭示其言语障碍的发生机制,并为帕金森病的诊断及鉴别诊断提供线索。

帕金森病(Parkinson′s disease)患者的言语障碍(speech disorders)非常普遍,其患病率为70%~90%,是运动和非运动障碍共同作用所造成的结果,临床上主要表现为发声、清晰度、韵律等方面的异常1, 2, 3, 4]。有研究表明言语障碍可能是帕金森病的早期标志之一1, 2,5, 6]。在帕金森病早期,声学分析的异常就已经发生7]。一项关于快速眼球运动睡眠期行为障碍(rapid eye movement sleep behavior disorder,RBD)患者的前瞻性研究表明,在被诊断为帕金森病之前的6~7年,即所有其他运动特征还未出现时,患者就已经表现出了言语变化8]。目前帕金森病仍然采用临床诊断,尚未发现合适的早期生物学标志物。对患者的语音特征分析评估可能是帕金森病诊断的新方向,但还需要进一步的研究1]。此外,随着影像学技术的发展,我们可以将语音特征与功能影像的改变相结合,进一步探索其相关性。因此,文中主要阐述了帕金森病患者的语音特征及其功能影像上的改变,进一步揭示其言语障碍的发生机制,并为帕金森病的诊断及鉴别诊断提供线索。


我们检索了中国学术期刊全文数据库(China National Knowledge Infrastructure)、万方数据库(Wanfang Data)、中国生物医学文献数据库(Chinese BioMedical Literature Database)、PubMed、Web of Science(SCI)数据库从建库至2020年9月发表的帕金森病语音特征及功能影像学的研究文献,语言不限。使用“帕金森病”“言语”“语言”“声音”“言语障碍”“语言障碍”“声学分析”“影像学”“功能影像”等检索词在中文数据库进行关键词检索;采用“Parkinson′s disease”“Speech”“Voice”“Speech disorders”“Voice disorders”“Acoustic analysis”“Functional image”等检索词在英文数据库进行关键词检索,同时对检索出来的文献通过查阅其参考文献扩大检索范围。所选研究时间以近5年发表为主,最远不超过20年。


一、言语障碍的分析方法

言语(speech)是口语交流中的机械部分,其产生依赖于各种有关神经、器官和肌肉等组织的密切配合:包括呼吸、发声、共鸣、韵律等方面,任何一个相关部分损害就会出现言语障碍。言语障碍包括构音、嗓音及语流障碍,在临床上能够出现一系列语音特征的变化9]。因此,有言语障碍的帕金森病患者在临床上可以观察到以下的语音缺陷,包括噪音增加、音量下降、气音、声音刺耳、单音调、辅音发音不准、非自愿的停顿、词语和音节的快速重复、言语的突然加速和减速等1, 2, 3, 4]。临床上主要通过2种方式进行言语分析:主观上通过专家进行听感觉评定,客观上通过对言语的语音波形进行声学分析。


1.主观听感觉评定:主观上的听感觉评定大多采用统一帕金森病评定量表(Unified Parkinson′s Disease Rating Scale,UPDRS)第三部分的第18项来评分,分为0~4级,但这常用于筛查和治疗后的对比。此外,常用的评估方式还包括嗓音障碍指数(voice handicap index)、嗓音相关生活质量问卷(Voice-Related Quality of Life)以及总嘶哑度、粗糙声、气息声、无力嗓音、紧张嗓音(Grade,Roughness,Breathiness,Asthenia,Strain,GRBAS)听感知评估量表。虽然听感觉评定是主观上的一种评价,但它们更能代表患者实际的交流功能、缺陷和需要,具有一定的临床意义,但并不是非常的敏感。由于言语障碍症状可能会出现在帕金森病的早期甚至是前驱阶段,可能会因此漏诊。


2.声学分析:声学分析是听觉现象学的客观衡量标准,可以对患者的言语障碍进行标准化的测量。在分析中,发声和说话的语音记录通常被数字化,然后在计算机上进行处理。这一过程包含语音的参数化、随后进行的统计分析或是数学建模。传统的语音特征参数包括了:声强、基频微扰(jitter)、振幅微扰(shimmer)、谐波噪声比(harmonics-to-noise ratio,HNR)、基频(fundamental frequency)及其标准差等。语音参数化的过程对具有病理描述性的信号特征进行了量化。除了关注病理学解释性,参数化还依赖于语音任务的正确选择。为了量化帕金森病患者言语障碍的各方面问题,目前已经设计出了广泛的语音任务,包括持续元音发音、音节重复(口腔轮替运动)、句子重复以及阅读任务。单纯的发声任务与说话的言语任务,两者关于帕金森病诊断率哪个更高,目前研究结果还不一致10]


二、语音特征

1.音质变化:粗糙而无力的语音音质是帕金森病患者言语障碍的一个常见特征11]。同时,既往研究发现,声学分析提示帕金森病患者的HNR降低7,12, 13]。HNR测量声带震动产生的“谐波”相对于声门产生的“噪音”的比例14],其减少与声音的粗糙和沙哑相关。


基频微扰是频率扰动的一种度量。它代表了稳定发声过程中基频的周期间变化14]。目前已经发现帕金森病患者频率微扰增加,并且还将随着疾病的进展进一步增加7,13,15, 16]。近期一项研究发现,频率微扰值、振幅微扰值、基频标准差均与帕金森病患者的病程相关17]。基频微扰可能表明声带振动不稳定,并与粗糙的声音质量有关7,15]


振幅微扰是另一个声学参数,测量的是稳定发声过程中振幅的周期变化,这种变化的增加与呼吸频率有关14]。由于声门漏气造成喉部气流湍流增加,从而导致了这种噪音的产生15]。许多研究表明,帕金森病患者的振幅微扰增加7,13,15]。且振幅微扰在元音的[i]、[u]中存在差异17]。最近有一项样本量较大的研究发现,帕金森病患者和对照组受试者元音[a]的HNR值和声音基频微扰处于同一区间,以及每帧HNR值的标准偏差差异均无统计学意义上18]。但该研究分组的人数有差别,因此结果有待进一步证实。


2.韵律变化:韵律改变也是帕金森病患者言语特征之一。韵律反映了说话者语义、句式语法和情感等信息。韵律障碍测量的是在传达话语意义时言语中声音的响度、音调及语速节律等变化。


音调是临床上能够感知到的基频14]。帕金森病患者音调的变异性与健康对照组相比也有所降低19]。听感觉评定中显示帕金森病患者语调减弱的单音调特征与声学分析中基频变异性降低相对应7,12]。其次,帕金森病患者因为发声不足,在音量控制方面会存在缺陷。他们会表现出音量降低及单一的响度,这在声学分析中分别反映为范围和强度变化的减小7,16,20]。响度的声学相关性是均方根振幅(root-mean square amplitude)。振幅范围提供了整个话语中响度变化的信息。再次,与健康对照组相比,帕金森病患者的语速和停顿特征也表现出不同21, 22]


以阅读文本和独白的方式来进行发声、韵律损害的定量的声学自动检测是早期帕金森病诊断最有前景的方式之一1,19]。重音修饰阅读(包括疑问句、祈使句、陈述句)和节奏型语言任务(如诗歌)在分类和识别言语障碍上准确率相对更高11]。最近Lowit等23]发现,韵律障碍在无讲稿的自发性言语中更加明显。但目前,只通过韵律障碍的单方面的指标来进行声学分析并不能达到令人满意的分类准确率。相比之下,一般韵律特征(包括单音调、单重音、语音速率)的集合似乎能提高精度11]。因此,选择特征识别最明显任务方式,以及在各种指标中找出最有效的组合方式,能够提高韵律特征的分析能力。


3.元音与辅音变化:选择元音来分析时,研究者们在帕金森病言语障碍的声学分析中大多用的是[a]、[e]、[i]、[o]和[u]的持续发音。Novotný等16]和Rusz等24]的研究成果表明,持续的元音发音的声学分析可能有助于在早期发现帕金森病患者的言语障碍,其特征主要表现为元音发音不足。此外,部分元音发声时长变短,共振峰过渡持续时间缩短和发生的时间变缓也被认为是其特征2]。元音有助于监测言语障碍和帕金森病进展的严重程度。而在早期帕金森病患者中,辅音发音不准确可能也是帕金森病言语障碍最有力的指标之一16]


4.其他特征:帕金森病患者发音会出现延迟16],这可能与运动迟缓有相同的病理生理,其发音上的语音特征还包括发音衰减、不规则和缓慢音节重复等。Rusz等25]研究发现,RBD受试者能够表现出发音障碍和韵律障碍的各种组合,但其中发音障碍最为突出。其他研究还发现,大多数伴有言语障碍的帕金森病患者还表现出了过度鼻音,但声学分析显示这并不是帕金森病患者的常见特征26]


5.非常规特征:研究人员通常根据其常规特征进行声学分析,如声强、基频标准偏差、基频微扰、振幅微扰、语速、最大发声时间、HNR、口腔轮替运动速率、语音开始时间、元音清晰度指数(vowel articulation index)、清音段分数(degree of unvoiced segments)等。这些特征的优势是可以在临床上解释和预测,研究者可以将它们与特定的言语障碍临床表现联系起来并进行解释。但在帕金森病的晚期,语音会呈现出无周期、嘈杂、不规则和混乱的状态。在有的情况下,传统的一些语音特征无法捕获潜在的与病理有关的有效信息,或进行更高级的分析。如自动评估需要使用更复杂的参数化和数学模型。因此有研究者们开发出了更复杂稳定的非常规语音特征,包括关联维数(correlation dimension)、分形维数(fractal dimension)、基于经验模态分解(empirical mode decomposition)的特征、Mel频率倒谱系数(Mel-frequency cepstral coefficients)等一系列特征,但这些特征的临床解释性则较差27]


综上所述,帕金森病患者的言语障碍会出现许多语音上的变化。针对其语音特征来选择合适的语音任务、设计算法或者建立数学模型,能够有效提高诊断率。语音特征也有助于我们对帕金森病言语障碍的病理机制进行进一步探索与理解。此外,言语障碍不仅是帕金森病,也是非典型帕金森综合征的早期显著临床特征,如进行性核上麻痹(progressive superanuclear palsy,PSP)和多系统萎缩(multiple systems atrophy,MSA)等。使用客观的言语评估对语音特征进行分析,不仅能用于帕金森病的诊断,在鉴别诊断上也有一定的作用。Tykalova等2]研究发现,PSP和MSA患者的清塞音比帕金森病患者的发声时间更长,而三者中只有多系统萎缩患者浊塞音发声时间更短,这可能与其小脑受损有关。近期Rusz等28]又发现,与帕金森病相比,MSA-帕金森综合征亚型(multiple systems atrophy-Parkinsonian,MSA-P)患者表现出更严重的言语障碍,主要为嗓音刺耳、辅音发音不准确、单音调、过度的音调波动和音调的中断。可以通过语音特征区分MSA-P与帕金森病,以及曲线下面积达到0.86的2种MSA表型。但个别的语音特征或参数还无法对MSA、帕金森病、PSP三者进行区分29]。客观的声学分析在鉴别诊断方面还需要进一步的研究。


为了确保语音特征在声学分析中的可靠性,还有许多需要注意的方面。最近有研究发现,噪音环境会影响帕金森病患者言语表达的清晰度20,30]。多个协变量也会导致分析结果的偏移31],性别就是其中之一6,19],但其造成的差异的显著性和表现还有待进一步研究。此外,由于语音中的某些变化在一定程度上是基于语言发音等的可能性,为了进一步量化帕金森病的言语障碍,还需要考虑不同语言的语音特性差异。目前研究人员正试图通过不同的方法来提高声学分析的分辨率1,2,5,32]。有研究者收集了连续语音数据(如阅读段落、独白的这种自然语言)1],以及在无法控制噪音的存在干扰的环境下采集样本32],并进行自动分析。而通过对采集到的重复数据的变量进行选择分类,也可能提高诊断的敏感度及准确率5]。随着科技的不断进步,数据的采集和分析可能会变得更加简便、准确。


现正有研究者将声学分析运用至远程医疗33],通过智能化设备,要求患者定期执行一些语音任务,将其上传至云服务器后就能对患者进行远程的筛查和诊断。目前已经有相关的临床研究开展34],但还需进一步的验证与推广。随着对语音特征及客观声学分析研究的进一步深入,客观的言语分析或许能够作为一种廉价并广泛应用的筛查手段。


三、功能影像相关性

言语的产生涉及将语音表征映射到发音网络上的过程,准确的语音输出需要背侧语言通路介导的听觉-运动整合35]。帕金森病患者言语障碍主要的原因是皮质下神经病理学——共核蛋白病,破坏了基底节-丘脑-皮质运动网络。有研究结果显示帕金森病患者的言语障碍随着时间进展,但与疾病的持续时间和整体运动的评分没有关系,似乎还涉及其他非多巴胺能的机制36]


1.功能磁共振成像(functional magnetic resonance,fMRI):fMRI已经被广泛运用于研究帕金森病言语障碍,目前主要包括任务态和静息态两类。

任务态的fMRI研究结果显示,帕金森病患者的韵律障碍可能与顶上小叶(superior parietal lobule)、额下回(inferior frontal gyrus)及纹状体有关。在音调方面,Arnold等37]让患者以愉快或中性情绪的语调朗读句子,发现在准备期时,早期帕金森病患者服药和未服药状态下左侧顶上小叶、左侧额下回之间的功能连接减少;执行过程中,患者腹侧纹状体和背侧纹状体之间的有效连通性降低。因此,边缘和感觉运动纹状体之间病理性的相互作用影响了言语行为的情感调节,使患者语调及音调发生改变,从而造成韵律障碍。此外,Rektorova等38]发现帕金森病患者右壳核和缘上回(supramarginal gyrus)的连接强度与音调变异性也相关。


其次,帕金森病患者的音量也会受到纹状体及前额叶连通性改变的影响。Arnold等37]及Clark等39]发现,帕金森病患者对外部听觉反馈的监控在说话时出现减弱。而纹状体和前额叶连通性下降导致能量不足造成自我监控机制的失调,可能会导致帕金森病患者对语音响度的判断产生误差,从而影响音量的控制37, 38, 39, 40],这可能是发声减弱的原因之一。Rektorova等38]还发现中脑导水管周围灰质与右侧后部颞上回(superior temporal gyrus)的连接强度与语音响度相关。


最近,Baumann等41]对采用Lee Silverman嗓音治疗的患者进行了声学分析及任务态fMRI分析,发现该治疗方式能有效改善患者言语的清晰度、发音及音调,且fMRI提示右侧颞上区活动的增加与清晰度的提高相关;伴随着症状的缓解,辅助运动区(supplementary motor area,SMA)激活降低的部分正常化,而右侧颞上区和右侧缘上回的激活增加。这与Liotti等42]观察到的激活向右半球移动相符。作者称这些区域还与脑内进行的言语任务(如默读)产生的强度有关41]


静息态研究中,最近Manes等43]进行了基底节核团的全脑静息态功能连通(resting-state functional connectivity,rs-FC)分析,结果也提示帕金森病患者的言语障碍与左侧壳核和左侧内苍白球(internal globus pallidus)的皮质连接改变有关。Elfmarkova等40]则对感兴趣的种子点进行了分析,包括口面部初级感觉运动区(orofacial primary motor area,OF_SM1)、前扣带回(anterior cingulate cortex)以及尾状核(caudate nucleus)的头部这3个部位,结果显示使用左旋多巴的帕金森病患者,其尾状核和OF_SM1连接强度的变化与韵律改变有关。但健康对照者和帕金森病患者在服药、未服药两种状态下进行比较时,在rs-FC上未并发现药物有明显的作用;当于帕金森病组内进行两种状态的比较时,左旋多巴引起OF_SM1-SMA与尾状核-背外侧前额皮质(dorsolateral prefrontal cortex)的连接强度改变,与其引起音调变化的声学参数的改变,两者之间存在显著的联系40]。因此,多巴胺能的机制还需要进一步的研究。


上述研究结果表明基底节活性降低和功能连接缺陷可能与帕金森病的言语障碍相关37, 38,40,43]。此外,为了减少任务态时的言语运动在fMRI扫描时造成的伪影,最近有研究者提出了一种连续语音的任务范式,让受试者在进行fMRI过程中大声说话,同时尽量减少头部运动,能够减少运动带来的误差并保持扫描的有效性44]。这也许能够标准化研究的测量手段,减少运动伪影的影响。


2.正电子发射断层显像(positron emission tomography,PET):一些研究者使用PET揭示言语障碍及其治疗的神经机制。Pinto等45]对接受丘脑底核-深部脑刺激治疗的患者进行UPDRS量表和声学分析,结果表明其言语障碍有所改善。[15O]H2O-PET扫描发现,与健康对照者相比,非刺激状态下帕金森病患者的口面部初级运动区和小脑的激活减少,SMA、运动前区和前额叶区的激活增加。丘脑底核刺激能够逆转这些异常激活,使其正常化,这与研究中言语障碍的改善相一致。而最近Atkinson-Clement等46]的研究结果表明,相较于其他运动功能,言语功能对丘脑底核-深部脑刺激治疗的反应更差。


3. 单光子发射计算机断层扫描(single photon emission computed tomography,SPECT):一项对早期的未经治疗的帕金森病患者的研究表明,与无言语障碍者相比,有言语障碍者在[123I]N-(3-[18F]氟丙基)-2β-甲酯基-3β-(4-碘苯基)去甲基托烷(FP-CIT)SPECT检查中显示其纹状体突触前多巴胺能的摄取较低。较低的[123I]FP-CIT摄取量可能与较严重的言语损伤相关;此外,言语障碍与肢体运动迟缓和僵硬关系最为密切,震颤为主的表型中语言障碍者占18.9%,少动-僵直表型的语言障碍比例则为69.9%,相比之下更为多见47]。而又有研究者发现,与震颤表型帕金森病患者相比,少动-僵直型的纹状体对[123I]FP-CIT的摄取降低48]。综上所述,多巴胺能缺陷可能导致运动迟缓和(或)喉部肌肉僵硬,从而造成帕金森病患者的发声功能障碍。虽然这表示左旋多巴或许能有效改善发声功能,但还有待进一步的研究。


四、总结与展望
帕金森病的言语障碍特征包括发声障碍方面的音量降低、音质改变,韵律障碍方面的音调变平以及重音消失等,这些特征造成了语音清晰度降低和音质降低。而帕金森病言语障碍的声学分析有望作为其早期诊断的手段。随着机器学习等跨学科方法的引入,声学分析也有望成为一种帕金森病远程医疗的方式。智能化及可穿戴设备还能同时检测患者的生命体征、姿势及步态等,能进一步缩短临床医生与患者间的距离,做到实时监控。功能影像在探索帕金森病言语障碍的脑功能及代谢方面也有着巨大的潜力。将功能影像学与声学分析结果结合,能够为帕金森病的言语障碍提供病理上的支撑,并且有利于针对帕金森病言语障碍的神经相关病理提出更有效的治疗方法。但总体而言,目前关于帕金森病言语障碍的研究样本量小、检测及分析的方法各有不同,很难进行标准化的比较。随着研究的不断深入,以及机器学习、人工智能等新兴学科的引入,可以帮助我们进一步揭示其发生机制,指导诊断和治疗。

参考文献略





您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存