计算机已能“看穿”自杀念头,人工智能判断自杀倾向正确率达87%
我们这个星球上每 40 秒就有一个人选择了自杀,在许多国家中,自杀率最高的人群通常为中年人或老年人。但自杀死亡数则是在 15 岁至 29 岁的人群中最高,这是因为这一年龄层的人口较多。根据世界卫生组织估计,每年有 80 万以上的人死于自杀,还有更多的人企图自杀。因此,每年有数以百万计的人经历自杀带来的丧亲之痛或受此影响。
从目前技术层面看,fMRI 对“预防自杀”的可推广性不高,高昂的费用无疑是个门槛,但基于有效算法的人工智能或许在未来可以真正实现预防自杀。不过,对于那些从来不对任何人倾诉自己有自杀念头的人群来说,未来人工智能的景象就很反乌托邦了:大众被算法机器控制,打算实施自杀的人群被分类(当然,可能你还会问:为何要干预他人的自杀?这则是另外一个伦理问题了)……
撰文 Megan Molteni
翻译 杨睿
审校 石炜
编辑 魏潇
图源:MEHAU KULYK/科学照片图书馆/Getty Images
每当有人选择结束自己生命的时候,他们就会给世界留下了很多难以回答的问题:“为什么他们要这样做?”“为什么我们无法预知他们会自杀?”“为什么我没能早点帮到他们呢?”如果我们真的能轻易从外部诊断出自杀,那它就不再会是今天公民健康的一道诅咒了。2014 年,美国的自杀率已经飙升到了 30 年以来的最高点,自杀成为当代年轻人的第二大死因。如果你能进入某人的大脑,看看在什么时候这种黑暗的想法可能会被付诸行动,一切会变成什么样呢?
(www.cdc.gov/nchs/products/databriefs/db241.htm)
目前,科学家正试图通过大脑扫描技术和人工智能来帮助这些有自杀倾向的人。在《自然人类行为》(Nature Human Behavior)发表的一项研究中,卡耐基梅隆大学和匹兹堡大学的研究人员通过观察人脑在 fMRI 中呈现的结果,分析了自杀个体对生命和死亡的看法、感觉与常人有何不同。然后,研究人员开始训练机器,让机器学习对应的算法来识别这些信号,比如提到“死亡”一词时会出现的额叶活动加剧。这种分类算法能筛选出那些有自杀想法的人,准确度超过 90%。此外,它还能区分试图真的伤害自己的人和那些只是想想却未付诸行动的人。
(www.nature.com/articles/s41562-017-0234-y)
事实上,这类 fMRI 研究都受一些人尽皆知的缺点的影响。这项研究的样本量太小,只有 34 名受试者。就算该算法可能在这些受试者的大脑中发现特定的区域被激活,那也不等于说它在更大的群体中也能有这么高的准确率。功能磁共振研究的另一个困境还在于:仅仅因为两件事情同时发生并不能证明是其中一件事引起了另外一件事的发生。如此一来,这类研究就要担心出现同义反复的问题:科学家猜测大脑的某些特定区域承担了某些特定功能,然后当他们观察到一系列人为挑选的触发条件激活了这些区域时,他们一开始的假设就能得到证实。这种逻辑是没有说服力的。
这项发表于《自然人类行为》的研究选择了 17 位年龄在 18 至 30 岁之间的年轻人作为对象。这些人最近都曾向自己的心理医生提到过有自杀的念头。研究人员还另外招募了 17 位“神经学典范”作为对照组参与研究,接受 fMRI 扫描(神经学典范泛指无特异神经性表现的人,即无自闭症、阅读障碍、发展性协调障碍、双相情感障碍、注意力缺陷过动症,或其他类似情况的人)。在核磁共振成像仪内,受试者会依次看到 30 个单词组成的随机序列。其中 10 个单词为普通正面词汇,10 个为普通负面词汇,还有 10 个单词是和死亡、自杀联系在一起的特定词汇。然后研究人员会要求受试者看着面前屏幕上显示的每个单词,思考三秒钟:“对你来说,什么是‘麻烦’?”“‘无忧无虑’的关键是什么?”针对每一个词,研究人员都会分别记录受试者的大脑血流量,观察他们大脑的哪些部分在活动。
两组受试者思考“死亡”一词的功能磁共振扫描结果。左:以前曾尝试过自杀的人。右:对照组。图源:卡耐基梅隆大学
随后,研究人员将这些脑部扫描结果导入机器,让机器学习算法。针对每一个单词,研究人员都会告诉算法哪些扫描结果是有过自杀念头的人,哪些属于对照组;在这个过程中,研究人员会随机挑出一个人,不让他的扫描结果出现在算法训练中。分类器学会很好地把这两类人分开之后,研究人员就会让它去对之前随机留下的那个人的扫描结果进行分类。研究人员要重复完成这 30 个单词,每次都要把一位受试者的扫描结果排除在算法训练之外。最后,分类算法通过查看扫描结果,可以较准确地说明该人是否有过自杀的念头,准确度达到了 91%。
为了知道分类器是否也能更普遍地分析人们的想法,研究人员又让分类算法去识别另外 21 名有自杀意向的人。因为他们的脑部扫描结果太过凌乱,这些人的扫描结果之前是被弃之不用的。利用六个最具识别度的概念:死亡、残忍、麻烦、无忧无虑、善良和赞美,算法发现自杀倾向者的概率为 87%。
卡耐基梅隆大学的心理学家、这篇研究论文的主要作者马塞尔·恰斯(Marcel Just)表示:“分类算法在处理更混乱的数据时依然表现良好,这说明这个模型具有更广泛的普遍意义。”但他还说,这种方法需要进行更多的测试才能确定它是否真的可以成功监测或预测未来的自杀企图。毕竟比较有自杀可能和没有自杀可能的群体,和利用大脑扫描结果确定受试者自杀可能性,并不是一回事。
但这就是总的研究方向。现在,医生唯一能知道病人是否有自我伤害倾向的方法,就是要看病人是否把这种想法告诉了自己的心理医生。但事实是,很多有自杀倾向的人并不会这样做。研究还发现,在医院中或出院后立即自杀的人当中,有近 80% 的人在和心理医生谈话时并不承认自己有自杀倾向。我们迫切地需要开发出更好的预测工具。人工智能的真正机遇就是去填补这个空白,但可能并不会用到 fMRI 的数据。
(psycnet.apa.org/record/2003-04657-008)
为什么不利用 fMRI 技术?因为这太不切实际。磁共振扫描可能要花费上千美元。而且,只有具备足够合理的临床理由,保险公司才会处理这部分费用。也就是说,必须得是医生认为,唯一能诊断出你有什么问题的方法就是把你放到一个巨大的磁铁上,这种方法才可能被保险公司承认。
虽然有大量的神经科学论文利用了 fMRI 技术,但在临床上,成像过程只在非常罕见的情况下才会保留下来。因此大多数医院都没有配备相应的仪器。也正是因此,恰斯打算重新进行这项研究,让扫描仪内的受试者戴上电子传感器。脑电图(EEGs)的成本只有功能磁共振成像成本的百分之一。恰斯是想将 fMRI 扫描出的大脑内部信号与对应的脑电图结果相结合,让医生可以借助成本更低廉的测试来识别出自杀风险高的患者。
其他科学家已经在开发更多样的、容易获取的数据,希望能找到预示自杀即将发生的指示性特征。佛罗里达州和范德堡大学的研究人员最近以 3250 名过去 20 年间曾试图自杀的人为研究对象,利用他们的病例记录训练机器学习算法。在这项研究中,机器并不是通过受试者的大脑活动模式进行识别,而是利用年龄、性别、处方和病史等其他因素进行识别。它能够较准确地预测出未来的自杀企图,准确度大概是 85%。
(journals.sagepub.com/doi/abs/10.1177/2167702617691560?journalCode=cpxa&)
范德堡大学的内科医生、临床信息学家科林·沃尔什(Colin Walsh)说:“作为一名医生,这些东西并不会自己弹出电脑,跳到我的面前。但电脑可以发现哪些特征组合可以预测出自杀的风险。”在科林的帮助下,该算法已经发展成了一种监测工具,纳什维尔的医生和其他医疗专业人员都可以利用这些算法来追踪患者。“要实际使用这种工具,还必须以定期收集的数据为中心。不用做新的测试,不用做新的成像研究。我们只要看这些医疗记录就够了,其中已经提供了很多医疗保健的信息。”
脸书正在扫描用户上传的照片和直播视频,寻找那些预示着自我伤害风险的单词组合。图源:newsroom.fb.com
甚至还有其他专家开始在上游进一步挖掘数据。公共卫生研究人员正在查看谷歌搜索结果,希望能找到自杀想法增加的证据。Facebook 也正在扫描用户上传的照片和直播视频,寻找那些预示着自我伤害风险的单词组合。美国退伍老兵事务管理局(VA)目前正在试用一种应用程序,它能被动拾取那些昭示抑郁症及情绪波动的声音线索。Verily 生命科学部门正在寻找智能手表和抽血过程中可以预测自杀倾向的生物标志物。这些努力都是因为我们想要主动出击,找到互联网和社交媒体上那些有自杀倾向的人,而不是等他们什么时候走过医院门口或是去做 fMRI 扫描的时候,才知道我们要对他们伸出援手。
原文链接:www.wired.com/story/fmri-ai-suicide-ideation/
本文经授权,转载自公众号“利维坦”(ID:liweitan2014)。
阅读更多
▽ 故事
· 他本该获得诺奖,却成了汽车店司机:人际关系、基金和命运对学者的无情嘲弄
· 为了做科研,TA们拎着粪穿城、抽自己的血补数据、用1个Bug搞砸了核聚变实验 | 本周“来聊”精选
▽ 论文推荐
· 你能发现论文造假吗?科睿唯安新工具帮助期刊避免虚假审稿人陷阱
· “三合一”抗体成功让猿猴抵御艾滋病毒,即将进行人体试验 | Science 论文推荐
▽ 论文导读
内容合作请联系
keyanquan@huanqiukexue.com