查看原文
其他

【综述】计算精神医学:机器学习在精神科的应用浅析

吴晓慧 等 中华精神科杂志 2022-04-17

点击标题下「蓝色微信名」可快速关注


文章来源:中华精神科杂志,2019,52(3): 228-231

作者:吴晓慧 牛志昂 方新宇 方贻儒


摘要精神疾病的诊断往往取决于患者的症状学特征和医生的临床经验,缺乏客观有效的指标。大数据时代的到来为使用计算方法来量化精神疾病的诊断提供了新思路。机器学习作为现代计算方法的标准承载者,近年来在精神科等医学领域的运用越来越广泛,给医疗行业带来了新的机遇和挑战。本文综述了机器学习方法在精神科的应用,以期帮助精神科医生了解其进展。



如今临床研究已进入大数据时代,越来越多的计算机和数据处理技术被应用于医学领域。近年来成为热点的机器学习方法,已逐渐作为现代计算方法的标准承载者。机器学习是人工智能的一个分支,近三十多年来发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析等多门学科[1]机器学习算法是一类从数据中自动寻找规律,并利用规律对未知数据进行预测的算法。机器学习算法因涉及大量的统计学理论而与统计学联系甚为密切,也被称为统计学习。常用机器学习算法包括卷积神经网络模型、随机森林、梯度提升决策树、极端梯度增强、支持向量机(SVM)、贝叶斯网络分类器、无监督聚类、无监督自组织映射、监督增强回归算法等。这些方法首先在非医学领域的数据中广泛应用,近年来亦得以运用于临床研究中。相比于传统的统计学方法,机器学习方法在选择预测变量以及变换算法时更为灵活,机器学习的参数量更大,可以通过计算机学习拟合多种临床定性或定量数据[2]医学数据集往往涉及众多的领域,包括临床定性表型、神经影像学、基因组学、蛋白质组学和转录组学等。对这些数据集的分析具有挑战性,特别是当数据量大且变量之间高度相关时,某些受试者的数据缺失将会使数据分析更为复杂。传统的统计学方法难以处理现今海量的临床数据。基于统计学的机器学习模型为我们提供了更有效的方法来分析这些庞大复杂的数据集[3]机器学习模型的预测能力可以辅助临床诊断分类、判断预后或指导优化治疗方案。但是由于样本选择存在偏倚且数据质量参差不齐,模型的预测效能仍面临挑战[4]本文综述了机器学习在精神医学领域的应用,以期为精神科疾病诊治及预后提供新思路、寻找新途径。



一、辅助诊断精神科疾病

精神医学目前仍是一门基于症状学和临床经验进行诊断的学科,是带有一定主观性的临床学科,缺乏客观的生物标记物来指导临床实践。因此,利用血清学数据、临床定性资料等探索和发现新的客观生物标记是当下精神医学主要的临床研究方向之一。Diniz等[5]首先采用富集途径分析对44例晚期抑郁症患者和31名健康对照者的外周蛋白质组学和结构脑成像数据进行了分析,发现61种蛋白质在晚期抑郁症患者中差异表达,然后运用机器学习方法对这些数据集进行分析,结果显示一组蛋白质(C-peptide,FABP-liver,ApoA-Ⅳ)可以区分晚期抑郁症和健康对照者,准确率为100%。轻度认知障碍(MCI)是阿尔茨海默病(AD)的早期表现,早期发现MCI有助于对潜在AD患者进行早期干预。社区药剂师是最容易接触和定期随访AD高风险人群的医务人员之一,他们在早期发现MCI中发挥重要作用,但其缺乏丰富的临床经验和更精确的专业知识。因此Climent等[6]用简短便携式心理状态问卷和简易精神状态检查量表从728名参与者中筛选出MCI阳性者,并对阳性者进行临床诊断,随后采用决策树方法分析发现,女性、每天睡眠时间>9 h、年龄>79岁、阅读频率是MCI的高风险因素。这些因素与此前的临床研究结果相吻合。该研究表明机器学习方法可以为社区药房提供早期识别MCI的工具,从而提高AD的早期诊断率。此外,Grassi等[7]将123例轻度认知功能损害和轻度认知功能损伤前状态患者的数据集用来建立不同的模型,数据集包含了人口学特征、临床检验数据、精神心理学测试分数、心血管风险指数和脑萎缩评定量表的基线信息等共36个预测因子。这些模型可以早期识别潜在的可发展成为AD的高风险患者。


影像学资料是目前机器学习应用最多的数据类型之一。影像学数据具有多维性,可分析性更强。机器学习方法可以处理临床上海量的影像学数据,亦可将影像学数据同其他临床指标结合,共同建立预测模型辅助临床诊断。Klöppel等[8]用SVM方法,通过采集分析MRI数据区分散发性AD、额颞叶变性和健康老年人,结果显示SVM可以区分出典型的AD,其准确率与训练有素的放射科医生相当。杨剑等[9]利用患者MRI数据构建了一种基于卷积神经网络的分类模型,该模型可以鉴别AD和行为异常型额颞叶痴呆,从而用于临床辅助诊断,其准确率优于传统机器学习模型。既往研究表明精神分裂症患者普遍存在脑结构的异常。Rozycki等[10]采用机器学习方法对多中心精神分裂症患者的MRI数据进行分析,并将精神分裂症相关的大脑结构异常准确分类。该研究表明特异的神经解剖学结构有可能成为诊断精神分裂症的定量影像学生物标记。Lueken等[11]使用机器学习方法处理功能磁共振成像(fMRI)数据,发现患有惊恐障碍(或广场恐惧症)且同时共病抑郁症者与无共病者的神经影像特征有所区别。这一发现表明可以通过机器学习方法进一步诊断恐惧症患者是否共病抑郁症。此外,Johnston等[12]使用SVM方法探索注意力缺陷多动障碍(ADHD)患者神经电生理的特征,该研究分析了43例ADHD患者与24名健康对照者MRI数据,结果表明单独使用T1加权图像的白质区域建立模型,其预测ADHD的准确率可达93%。Pettersson-Yeo等[13]利用SVM技术对健康对照者、首发精神病(FEP)患者和精神疾病超高危人群(UHR)的结构磁共振成像(sMRI)、fMRI、弥散张量成像(DTI)以及遗传和认知数据进行分析,结果显示机器学习模型可以识别首发精神病患者。其中,只有在sMRI和DTI数据基础上建立的模型可以区分健康对照者和精神疾病超高危人群。这些结果(表1)表明计算机化诊断方法在临床实践中确有成效。随着研究的进展,新兴的大数据技术和先进的数据密集型机器学习方法与精神疾病诊断的准确性、稳健性和可推广性将更加吻合[14]


二、指导决策治疗方案

精神疾病多为慢性复发性疾病,其治疗具有个体差异性。目前,在制定精神疾病治疗方案时,缺乏客观的个体化方案制定策略。利用机器学习方法构建决策精神疾病治疗方案的预测模型,或许可以为个体化治疗策略的研究提供证据和途径[15]。电休克疗法(ECT)是治疗严重抑郁症最有效的方法之一,Redlich等[16]用二元模式分类和SVM对纳入研究的24例接受ECT治疗的患者、23例仅用抗抑郁药治疗的患者和21名健康对照者的MRI数据和汉密尔顿抑郁评定量表评分进行分析,以找出能够准确预测对ECT反应的生物标记物。结果表明扣带回前部亚结构的轻度损伤似乎与ECT治疗的有效率相关,提示机器学习模型可能有助于筛选对ECT治疗敏感的患者。Amminger等[17]招募了81例精神疾病超高危人群,参与者接受长链omega-3多不饱和脂肪酸或安慰剂治疗,在为期1年的随访中获取参与者各项生化指标和精神病学评估量表得分。该研究采用机器学习方法对这些变量进行分类,结果表明红细胞膜α-亚麻酸水平较高的UHR患者可能更加受益于omega-3多不饱和脂肪酸。这意味着机器学习方法可以分析整合患者的各项临床指标和人口学特征,从而获得个体化治疗策略。Carrilo等[18]使用高斯朴素贝叶斯分类器来验证在治疗初测量的语言属性是否能够预测患者对赛洛西宾(psilocybin)治疗的敏感性,结果显示语音分析和机器学习结合不仅可以成功区分抑郁症患者与健康对照,还可以对赛洛西宾治疗敏感性进行预测,其预测的准确度达到85%(精确度为75%),提示情绪性词汇表达较少(尤其是阳性词汇)的患者对赛洛西宾治疗更敏感。Koutsouleris等[19]采用SVM方法,将欧洲334例首发精神分裂症患者的用药情况、临床检验指标和人口学特征整合分析。结果表明,治疗依从性差、非首次入院和生活质量低下的患者对氨磺必利和奥氮平治疗的敏感性高于氟哌啶醇、喹硫平和齐拉西酮。此外,Chekroud等[20]筛选出25个变量,包括各种人口学特征、抑郁评估量表、是否服用过特定的抗抑郁药、是否有过重度抑郁发作等,采用梯度增强机器学习算法,分别对接受依他普仑加安慰剂(单一疗法)、艾司西酞普兰加安非他酮和文拉法辛加米氮平这3组治疗方案的抑郁症患者的数据进行处理分析。该研究根据分析结果汇总了一份简单易行10分钟的问卷,可以辅助筛选出对一线抗抑郁药(艾司西酞普兰)敏感的患者。


三、预测疾病预后和转归

机器学习方法在预测精神疾病的转归和疗效上同样表现出巨大的潜力。Kautzky等[21]应用机器学习随机森林算法建立难治性抑郁症的预测模型,该模型包括47个临床变量和人口学特征因子。结果显示该模型预测治疗结果的准确度为75.0%,超越了临床评估的预测能力。该研究提示机器学习方法或许可以辅助临床监测抑郁症向难治性抑郁症的转归,有助于早期识别难治性抑郁症。为了寻找一种方法来单独预测患者对重复经颅磁刺激(rTMS)的反应,Koutsouleris等[22]将92例精神分裂症患者随机分入rTMS组(45例)和假rTMS组(47例),每周5 d,持续21 d,对两组患者采取rTMS(假rTMS)治疗后进行结构磁共振扫描,将获得的图像数据进行预处理。该研究采用SVM来分析影像学数据,结果表明其可以准确预测主要表现为阴性症状的精神分裂症患者对rTMS的个体反应。此外,研究者正在利用机器学习方法研究抗精神病药治疗的副作用,例如,Schependom等[23]使用Logistic回归、优化的人工神经网络以及SVM方法分析精神分裂症患者中代谢综合征患病情况,该研究旨在利用临床上常见的变量(例如是否为向心性肥胖和血压信息等)开发用于检测代谢综合征的算法,以避免对患者进行有创的血液采样。然而,还没有一种先进的统计方法可以获得准确有效的结果。因此,亟待更深入的研究通过机器学习算法将临床非侵入性检测指标或常用检测指标(如血常规、肝肾功能等)与相关精神疾病的预后和转归对应起来。抑郁症的相关研究发现,已知的症状缓解往往滞后于潜在神经结构和功能的变化,因此,生物标记的发现和应用可能在早期判断疾病疗效和转归中更有价值。生物标记可来自多个领域,包括神经成像、神经心理学测试、遗传学和蛋白质组学等。利用机器学习方法对它们进行整合分析或许可以发现新的有效的预测因子[24]


四、机器学习在精神科其他方面的应用

除了辅助诊断、治疗决策、判断疾病预后和转归,机器学习在精神病学领域还应用于遗传学机制研究、评估自杀风险等。Fabbri等[25]为了探究基因同抑郁症治疗反应的关系,在既往全基因组关联研究的基础上选择了8个候选基因中的44个单核苷酸多态性(SNP),根据这44个SNP对671例抑郁症患者进行基因分型,表型为抗抑郁治疗4周后的治疗反应/缓解情况和难治性抑郁症。该研究使用5种机器学习模型(神经网络、递归分区、学习矢量量化、梯度增强机器和随机森林)对SNP和临床表型数据进行分析和测试,结果表明存在独立的SNP可以预测难治性抑郁症,其灵敏度为0.83,特异性为0.56。为进一步探索难治性抑郁症相关生物标记或治疗靶点提供了遗传学基础。目前,自杀在全球范围内每年造成近80万人死亡。既往研究表明自杀行为可能与遗传有关。Ruderfer等[26]从来自Vanderbilt大学医学中心的280万例患者的电子医疗数据中筛选出3 250例有过自杀行为的患者,利用机器学习方法筛选出与自杀行为相关的基因型,并将其与其他精神疾病相关的基因型进行对比分析。研究结果表明自杀企图与失眠、抑郁症等其他几种精神疾病存在显著但不完全的遗传相关性,提示自杀企图或许与其他精神疾病拥有相似的遗传基础。此外,为了在一般人群中快速筛选出具有自杀风险的个体,Ryu等[27]从韩国国家健康与营养检查调查数据中筛选了11 628名个体,其中包括5 814名有自杀企图者和相同数量的无自杀企图者。采用随机森林方法建立模型以预测自杀企图者,该模型准确度为0.821,灵敏度为0.836,特异性为0.807。该研究表明运用机器学习方法建立模型可以在一般人群中筛查具有自杀风险者。


五、总结与展望

机器学习是一个涉及多学科领域,使用计算机科学、人工智能、计算统计和信息理论来构建可以从现有数据集中学习并对新数据集进行预测的算法。随着生物科技技术发展以及大数据时代的到来,机器学习方法恰好可以成为转化医学的桥梁,连接起基础研究、药物研发和临床[28]机器学习方法通过整合分析各类临床数据,广泛地应用于医学领域。在精神科疾病的诊断、预测和治疗中,它亦表现出巨大的临床潜力。机器学习可以提供量化手段,以个体为基础优化治疗策略。SVM是影像学常用的机器学习方法,卷积神经网络除了完成影像学任务还可对语音进行识别分析。此外随机森林、贝叶斯分类器等都是可运用于临床上的机器学习方法。目前,在精神病学领域,这些方法正逐渐得到广泛运用。已有研究利用机器学习方法结合人口学资料、常规检测、血液指标和影像学数据建立模型以辅助诊断精神分裂症、AD、ADHD、抑郁症等精神疾病,提高其早期诊断率,减小误诊率。除了诊断,亦有研究已建立机器学习模型用以确定患者的最佳治疗方案或评价患者的疗效。然而,将机器学习方法成熟的应用于精神科,仍然面临很多挑战,如样本量、样本选择偏倚、样本数据质量以及合适的机器学习方法,这些都是影响机器学习模型效能的重要因素,今后的研究需要考虑到这些问题,以提高研究质量,从而让临床真正得益于机器学习方法。


参考文献(略)


↓↓↓详情可点击文末下方阅读原文






您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存