其他

谷歌发布AI测序工具,可以根据基因组对症下药

2017-12-06 DeepTech深科技

年度订阅用户可加入科技英语学习社区,每周科技英语直播讲堂,详情查看“阅读原文”


15 年前,科学家首次对人类基因组进行测序;如今,解码人类生命机密的大量数据仍旧是一项艰巨的挑战。幸运的是,机器学习最擅长的就是解决这类问题。



周一,谷歌发布了一个名为 DeepVariant 的工具,它拥有最先进的 AI 技术,可以利用测序数据构建一幅更精准的人类基因组图像


DeepVariant 能将高通量测序(high-throughput sequencing)的读数转换成完整基因组图像。它自动识别测序数据中的插入基因、缺失突变和单碱基对变异。


高通量测序在 2000 年兴起,它的出现让基因测序更容易实现。但这一系统所提供的数据仅仅是有限且易出错的基因组快照。这给科学家带来很大困难,因为他们要将小的变异与测序过程中产生的随机错误区别开来,尤其对于一些重复的基因组片段。这些变异可能与癌症等疾病直接相关。


解读这些数据的工具有很多,包括 GATK、 VarDict 和 FreeBayes。但这些软件通常都是用简单的统计学和机器学习方法,通过排除读取错误来鉴别突变。


据参与 DeepVariant 研发的哈佛大学公共卫生学院的科学家 Brad Chapman 介绍:“其中一个挑战在于基因组的复杂片段,每种工具都有优缺点。这些复杂区域对临床测序异常重要,使用多种方法很有必要。”


与查普曼合作的研究人员包括:专注于 AI 研发与应用的谷歌大脑团队、谷歌生命科学部门 Verily,以及基因数据云储存平台 DNAnexus 的副总裁 Andrew Carroll。


团队通过瓶中基因组计划(Genome in a Bottle,GIAB)收集了数百万高通量读数和全测序基因组。GIAB 是一项公私合作的促进基因测序工具与技术的项目。研究人员将数据反馈给深度学习系统,并且不断调整模型参数,直到它能以很高的准确率解读测序数据。


去年,DeepVariant 赢得了“精准 FDA”真理挑战赛(PrecisionFDA Truth Challenge)的第一名。这项赛事是美国食品药品监督管理局组织的,目的是为了促进基因测序的准确性。


“DeepVariant 的成功具有重要意义。因为它证明了在基因组学中,深度学习可以自动训练系统,而且性能比复杂的手工系统有效得多”,Deep Genomics 公司 CEO Brendan Frey 说。


DeepVariant 的发布表明,机器学习有可能促进基因组学的发展。


有些公司正尝试用深度学习等技术梳理出疾病的遗传原因,并确定潜在的药物疗法。Deep Genomics 正是这样一家深度学习基因公司。


Frey 认为,AI 除了辅助基因测序之外还能做得更好。“目前医学所面临的鸿沟在于我们无法精确地将基因变异与疾病机制相互映射,所以无法用这些知识迅速得到救命疗法”,他说。


该领域另一个领先的公司是 Wuxi Nextcode,它在上海、雷克雅未克(Reykjavik,冰岛首都) 及马萨诸塞州剑桥都设有分公司。Wuxi Nextcode 收集了世界上最大的人类基因组全序列,公司在机器学习上也大量投资。


DeepVariant 可以在谷歌云端上获得。为了吸引更多人接触到最新的 AI 技术,谷歌及其竞争者正疯狂地将机器学习功能加入他们的云平台之中。


总的来说,未来几年 AI 会在很多方面助力医学取得巨大飞跃。有很多机会可以在图像或医疗数据等不同类型的医疗数据上大施拳脚,进而预测人类医生可能会忽略的疾病。


基因组医学领域的机会非常广阔,因为数据的规模和复杂性是前所未有的。“我们对生物学的测量能力,甚至实践力,已经远远超过我们对它的理解能力,这是历史首次”,Frey 说。“AI 是我们解读与操控海量数据的唯一技术。这将彻底改变医学的未来


-End-


编辑:孙小彪   校审:郝锕铀

参考:

https://www.technologyreview.com/s/609647/google-has-released-an-ai-tool-that-makes-sense-of-your-genome/


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存