“AI+” 时代 | 看云端基因服务为精准医疗 “加速”
The following article is from 微软研究院AI头条 Author 微软研究院AI头条
丹棱君有话说:每年,全世界大约有 175,000 名 14 岁及以下的儿童被诊断出癌症,如何在确保隐私安全的前提下,获取海量的基因数据,运用技术手段进行基因组比对和分析,寻找出精准的治疗方法成为全球医学界的重要课题。微软推出了云端基因服务(Microsoft Genomics),帮助医学工作者运用云平台的计算力处理庞大的基因数据,快速高效地获取分析结果,用于治疗方案的决策。跟丹棱君来看看吧~
孟菲斯圣裘德儿童研究医院(St. Jude Children’s Research Hospital)的一个研究团队从 2010 年就开始将患者的健康和癌症细胞的匿名数据上传到了公共数据库,尝试通过推动全球研究机构数据共享的方法来寻找出儿童癌症的治疗方法。而当时,微软正在制定一个基于云的计算流程,用于对比数以百万计的原始基因数据和参考基因数据,进而探明它们之间的不同之处。因此,双方在这一领域展开了合作。
基于这项工作,微软近日宣布推出 Microsoft Genomics 服务。Microsoft Genomics 服务通过利用和处理基因数据,来帮助医学研究者发明更精准地治疗癌症等疾病的药物。比如,通过分析患者的健康和肿瘤细胞组织以及其他患者的医疗数据(包括治疗方法和结果),医生能够选择最有效的治疗方案。
Microsoft Genomics团队
事实上,圣裘德儿童研究医院、微软以及 DNAnexus(一个运营在 Azure 上的基因数据管理平台)三方基于共享基因数据以及 Microsoft Genomics 服务,合作开发了一套基因组比对和基因变异识别的流程。基于这套流程,合作者们已经处理了超过 500 TB 的基因数据,并将其存储在 Azure 以供大家分析。对于研究医院、DNAnexus 和微软正在合力建立的数据分享平台来说,这些数据分析结果提供了一个良好的基础。
Microsoft Genomics 服务是微软 Healthcare NExT 的一部分,Healthcare NExT是微软发起的通过人工智能和云计算来加速健康保健行业发展的创新项目。在拥有大量准确医疗数据的前提下,微软希望通过部署在云上的 AI 工具来帮助研究者更快地发现癌症等疾病的治疗方法。而一个处理基因数据的通用流程,可以有效降低可能影响数据的伪影和噪音,有助于 AI 驱动下的精准医疗。
单一人类基因组测序的成本已经从 2001 年的一亿美元降为如今的不到 1000 美元,成本的降低极大地加速了基因测序的商业化。据业内专家预测,到 2025 年,将会有超过 1 亿人的基因组被测序。大量测序需求的出现对计算机的计算和存储能力提出了新的要求。
单个人类基因组数据约占用 100 GB 的存储空间,需要花费个人笔记本电脑几百个小时来处理这些数据。而随着越来越多的基因组将被测序,存储需求将达到 PB 甚至 EB 级别(1 TB=1024 GB,1 PB=1024 TB,1 EB=1024 PB)。面对如此庞大数据量,个人电脑将无能为力。因此,拥有海量存储空间和强大计算能力的云成为基因数据处理的完美工具。
目前,Microsoft Genomics 已经面向美国、西欧和东南亚的用户提供服务。由于基因数据处理通常会涉及到一系列法律和道德问题,为了保证数据的隐私和安全,Microsoft Genomics 服务已经获得了 ISO 认证,这意味着其达到了国际安全、隐私和质量标准。该服务同样符合 HIPAA(Health Insurance Portability and Accountability,健康保险携带和责任)法案标准,确保个人健康信息的安全使用。
本文转自微信公众号:微软研究院AI头条,原标题为“微软发布云端基因服务:推动 AI 驱动的精准医疗”。
点击 “阅读原文”,可阅读英文原文
了解更多:
后台入驻微软小冰
如果你很萌,请跟她一决高下!