今年拉斯克奖给了人工智能,它们解读基因也“遥遥领先”?
点击上方蓝字关注“尹哥聊基因”
最近微信改版,容易找不到尹哥的文章,大家记得把尹哥设为星标⭐️ 哦~
前段时间,谷歌的DeepMind团队在Science杂志上发表了一项新研究,他们基于AlphaFold开发的人工智能模型AlphaMissense,预测了19233个人类蛋白质编码基因的7100万个错义突变,这之中32%是潜在致病突变。
通俗来说,AlphaMissense似乎已经具备了从基因层面判别疾病的能力,对比人工效率可谓“遥遥领先”。看到这,估计已经有小伙伴在畅想“医生是不是快失业了”,真的是这样吗?
△ Science以封面文章的形式刊登了关于AlphaMissense的研究
讲这个问题前,咱们先来聊聊什么是错义突变。
如果生命是一个语言,那么它将由ATCG四个字母构成并按照一定的规则排列,在被翻译成各种各样的蛋白质后,来维持我们的生命活动。但我们的DNA并不是一成不变的,如果某一位点发生不可预测的变化,导致编码某种氨基酸的密码子,变成编码另一种氨基酸的密码子,进而影响到蛋白质的顺序、结构、功能、理化性质等,这个变化就被称为错义突变。
有学者估计,每个人大约携带9000个错义突变,但绝大部分对翻译出来的蛋白质几乎没什么影响,即良性的,但也仍有一部分产生不利影响,破坏蛋白质的功能,这可能是某些疾病的根源。
另外,人类基因组中有超过30亿个碱基对,可能有具体功能的基因多达上万个,可能出现的基因突变达百万数量级,靠人一个个辨别好坏,等同于大海捞针。
世界上最大的体细胞突变数据库COSMIC(the Catalogue Of Somatic Mutations In Cancer)一共收录了大概400万个错义突变,只有不到2%被注释为良性或致病性,在可能发生的7100万个错义突变里只占不到0.1%。除了已经被注释的,其余错义突变则被“粗暴”地归类为“意义不明的突变”。
这次登场的AlphaMissense就是奔着解决错义突变注释的问题来的。研究人员用它给89%的错义突变进行分类,其中对已知致病变异的精确度达到90%左右,优于同类型工具。
从这个意义上讲,AlphaMissense有望改善对于罕见病的诊断,发现更多新的致病基因。
△ AlphaMissense与其他工具在预测错义突变效应方面的比较
当然,AlphaMissense并不是AI在生命科学领域的第一次应用。它的亲戚AlphaFold早前就被用于蛋白质三维结构的预测,在数量、质量和速度上的表现远超学界想象,被学界誉为“圣杯”级别的发现。前段时间,其研发团队核心成员因此获得有着诺奖风向标美誉的拉斯克奖。
而在医疗领域,辉瑞新冠药Paxlovid的开发过程也有AI的参与,对其快速应用和上市起到了强有力的支持。
今年年初风头正盛的ChatGPT近期迎来了重磅更新,也被认为即将颠覆医疗领域。简单来说,它已经在全平台支持图像识别,移动端支持语音输入输出,还可选择各种音色。这意味着ChatGPT越来越像“人”了,而据相关媒体的报道,ChatGPT的确在往具备“五感”方面努力,即能看到、听到、闻到、尝到、触摸到,并且能以文字、图片、语音、视频,甚至3D的形式表达出来。
ChatGPT变革的背后是其运算能力的大幅提升,根据OpenAI的论文,ChatGPT 5.0的算力将比现阶段的4.0版提升133倍,它还可以创建自己的子模型,分别训练,或完成特定任务,进而从量变引发质变。
开发ChatGPT的OpenAI,前段时间投资的一家挪威公司,更进一步地利用AI技术研发保姆机器人,融合了图片处理、语音交流等功能,据说它几乎能满足主人的一切需求,当然包括基本的医疗需求。
同样的,如果给ChatGPT装上摄像头、连上各类医疗设备,影响不可想象。但这是不是又回到了最初的问题,我们还需要医生吗?
△ OpenAI投资的一家公司正在开发保姆机器人1X technologies
AlphaMissense、ChatGPT 5.0等大模型的出现,确实给生命科学乃至医疗行业带来新的变化,但今天就想谈AI“颠覆”和“遥遥领先”还为时尚早。目前AI能做的,是基于过往经验、数据的推演,只能辅助决策,它也没办法做到100%准确,更遑论进入临床。
实际上,现代科学有它独特的思想来源:古希腊哲学(逻辑体系)、物理学(还原论体系)、医学(归纳统计实证体系)。大数据补了医学“归纳统计”的短板,却仍然缺乏“实证”。举个粗糙的例子,假如AI诊断出未经验证的疾病和治疗方案,您敢尝试吗?如果设计出一款未经任何验证的药,您敢吃吗?
真正能进入COSMIC的,都有着严格的循证医学证明,AlphaMissense的90%预测准确度远谈不上“完美”。从这个意义上来说,除了用AI辅助,我们在研究到临床应用之间,还有很多具体的工作需要去做。
AlphaMissense的研究人员也指出,开发该软件的目的并不是为了直接应用到临床,而是希望它能和其他证据源一起解释疾病,进而帮助研究人员更好地了解疾病,开发新的挽救生命的方法。
早在第一批互联网医疗大火之时,关于网络能否取代医生就有一段讨论。尹哥当时的意见也是基本不可能,至少对于人类的医学不可能。即使同样的知识,从网上查到的和从医生嘴里说出来的感觉,对于就医者是完全不一样的。因为医学的本质是:
医学是有温度的,不能把医学简单的等同于科学,它需要有人性光辉的这一面。关于这个话题,可参考韩启德先生《医学的温度》这本书:
— END —