追问TALK | 陈骥:精准诊疗精神疾病,AI如何帮到我们?
追问按
我们的大脑是一个复杂又脆弱的器官,其精密程度是世界上任何一种仪器都无法比拟的,这就给我们精神疾病的诊断与治疗带来了很多的不确定性。
在日常的诊疗过程中,临床医生一般会通过察言观色、面谈或量表评估等方法来诊断或评估疾病,并制定治疗策略,往往会引入一定的主观因素。
那么在这个数据量激增、数据科学快速发展的时代,人工智能能否助力精神障碍的诊断和研究呢?最近,在《TCCI应用神经技术、人工智能与精神健康专题论坛》上,陈骥研究员带来了有关构建精神健康人工智能生态系统的内容。
陈骥
浙江大学心理与行为科学系特聘研究员
今天我报告的主题是精神障碍中的多类别生物学数据的融合,维度表征和预测建模。我将从以下4个方面来和大家介绍:
一是我们现在有那么多数据,为什么我们需要多类别数据的融合;二是我们通过什么渠道可以获得多类别的生物学和表型数据;第三我们如何利用这些多类别数据进行建模;最后我将浅谈一下人工智能在精神健康应用方向的机遇与挑战。
为什么我们需要人工智能临床辅助诊疗
首先是因为目前精神障碍患者群体数量庞大,最近期的流行病学调查显示在我国,成年人(>18周岁)当中精神障碍的终生患病率超过了16%(Huang et al., 2019),其中焦虑障碍和心境障碍的患病率最高;而在6-16周岁的儿童和青少年群体中精神障碍的总患病率约为17.5%。其多动症占比最高,其次是焦虑障碍(Li et al., 2021)。
相对这样一个庞大的群体,精神科执业医师的人数却是十分紧缺的,也许每个医院的实际情况不同,但精神科医生们往往每天的门诊量就能达到上百例甚至几百例。
在日常的诊断过程中,临床医生一般会通过察言观色、面谈或者量表评估等等这些比较经典的方法来诊断或评估疾病,这样难免可能会带入一定的主观因素。
那么我们是不是可以通过融合多类别的生物学数据和表型数据,构建计算体系来辅助临床医生进行诊疗工作,并对个体患者实现高效和全面的多维描述与评估。
为什么我们需要融合多类别数据
过去基于临床量表数据、症状学数据的疾病分类或疗效预测的机器学习模型准确率较低;后来研究者逐渐结合脑成像数据进行模型的构建,其准确率会有一定的提高。
比如说fMRI(功能磁共振成像),目前应用非常广的一种非侵入式、高空间分辨率的成像手段,可在一定程度上反映疾病发生、发展过程中脑功能的变化。虽然它的分析有它独到的优点和特点,但血氧水平依赖的功能磁共振成像技术并不是对神经元活动的直接反映。
因此,融合基因、电生理和分子成像数据,可作为阐明相关机制的桥梁。总的来说,多类别数据可以提供有价值、互补的信息,潜在提高模型的准确性。
近年来,国际公开的大样本人群数据库,比如UK Biobank,数据库中既有脑影像数据,又有表型数据,还有基因数据,为我们融合多类别数据、构建人工智能模型提供了一定基础。
如何建立精神健康人工智能生态系统
接下来基于Winter等人今年发表在Molecular psychiatry上的文章(Winter et al., 2021)聊一聊精神健康人工智能这样一个生态系统,从数据收集、统一和共享,到模型构建,到评估与发布,到异质性解析。这里需要提一下,精神障碍群体的异质性是非常强的,因此需要对其进行拆解并解析。
此外,还包括伦理标准制定和模型解释性挑战,例如计算机辅助诊疗就会存在一些伦理方面的挑战。
01
数据收集
那么如何收集大量的数据?通过建立一个比较完善的电子健康病历系统,记录每一个人的健康情况;构建组学平台(基因组学、蛋白组学);收集脑成像数据,血液生化数据以及移动传感技术数据(智慧手机和手表收集)。
即使这样还是会存在一个问题,那就是不同医学中心之间的数据,其数据纳入的标准以及对象群体会有一定差异性。因此在采集数据之前,我们需要制定一个统一的方案并经过一些调和手段,才能更好的避免这个问题。
面对采集的高维度数据,可以将其划分一下,比如按症状学、影像学指标、遗传学,还有生化指标进行归类。在降低数据维度的同时,也要保留其疾病的关键信息,以及降低数据噪声,构建这些低维数据间的关联模式。
上面右边这张图,是我们之前做的一个研究(Chen et al., 2020; Biol Psychiatry)。这是评定精神分裂症症状严重程度的一个常用量表(PANSS),它有30个测评项目,在进行个体描述时可能会存在一定复杂性。
我们通过机器学习的方法提取PANSS量表的维度特征,通过矩阵因子分解的方法得到阴性、阳性、情感和认知症状这四个维度,可以稳定地表征精神分裂症的症状学并泛化到新的样本中。
基于得到的维度,我们采用聚类的方法推导精神病理亚型,然后通过脑影像数据对精神病理亚型进行分类,从而找到区别各精神病理亚型的生物学标志物。
随后我们利用脑功能网络连接预测得到的四个症状维度,将预测脑网络与PET显像(正电子发射型计算机断层显像)神经递质受体水平空间相关,从而建立症状学-脑功能影像-分子水平的关联模式。
02
人工智能模型建立
有时候我们收集样本,尤其是收集一些特殊疾病群体的样本会相对比较困难,针对小样本,可运用一些特定的机器学习方法,例如迁移学习。
其次,通过聚类等无监督学习方法,将同一个诊断分类下的患者分成若干亚型,降低异质性。
再者,可以运用多视角学习方法,建立多类别数据集间的关联模式,进行后续分析。
最后,通过建立常模,量化个体偏离健康人群总体分布的程度,辨识风险人群和潜在患者。
03
模型评估
关于模型的评估,可以将模型上传、交互共享,客观评估模型的有效性、有用性和推广价值。
同时,需要提高模型的可理解性、可应用性、稳健性和可重复性,尽量避免“Black Box”。除了考察和追求模型的准确性外,我们还需关注模型的临床实用性评估。
04
临床转化前景&挑战
人工智能在精神健康领域的应用前景,还是非常乐观的。
例如,人工智能模型可以提示患病风险,分类和亚型,以及治疗方案的选取。
人工智能在精神健康领域的应用仍存在一定的挑战,比如疗效和预后预测等。目前基于脑影像和临床数据的研究,其准确率仍较低。不同精神障碍的特异性生物标志物仍待探寻。
生物标志物需能够反映正常的生物学过程,反映病理过程,以及对特定干预措施的反应。这可能是我们未来需要关注的方向和解决的关键点。
针对这些挑战,我们可以更加关注特征空间的筛选,在大量的数据中挑选最关键和重要的信息;关注模型的优化和鉴别重要特征的能力。
我们还要结合严格的组内交叉验证和组间泛化性能,得到能够推广的模型,而不是只在特定场景中才能应用。
最后,关于数据的保护、病人信息的隐私性,各方权利和责任问题等等,我们还需要思考如何制定、规范和实施伦理标准。
Huang Y, Wang Y U, Wang H, et al. Prevalence of mental disorders in China: a cross-sectional epidemiological study. The Lancet Psychiatry, 2019, 6(3): 211-224.
Li F, Cui Y, Li Y, et al. Prevalence of mental disorders in school children and adolescents in China: diagnostic data from detailed clinical assessments of 17,524 individuals. Journal of Child Psychology and Psychiatry, 2021. https://doi.org/10.1111/jcpp.13445
Winter N R, Cearns M, Clark S R, et al. From multivariate methods to an AI ecosystem. Molecular Psychiatry, 2021: 1-5.
Chen J, Patil K R, Weis S, et al. Neurobiological divergence of the positive and negative schizophrenia subtypes identified on a new factor structure of psychopathology using non-negative factorization: an international machine learning study. Biological psychiatry, 2020, 87(3): 282-293.
追问互动
○ 如果您对本期内容有进一步想要追问的问题或者讨论的内容,或者加入我们的社群参与互动,添加小助手微信questionlab即可申请进群。
○ 今年11月19日,“Brain Talk 院士论坛”第二期即将展开。暨南大学粤港澳中枢神经再生研究院院长、中国科学院院士、香港大学医学院讲座教授苏国辉,以及索尔克生物研究所所长兼遗传实验室教授Rusty Gage将与我们分享神经再生领域的科学突破。如果您有关于神经再生的相关问题想要追问苏院士和Gage教授,欢迎联系我们,我们将邀请他们在报告或问答环节回答您的问题。(点击阅读详情)