用AI 模拟新冠病毒致病机理,微软亚洲研究院和清华大学有话说
新冠病毒致病机理两开花,
计算生物学潜力凸显
大体系、全原子是指构建拥有百万级原子的完整 S 蛋白,而不是只对10万个或1万个点进行抽象模拟,从而提升模拟精度。
长时间是指研究员们通过数十亿步的计算,每步代表1飞秒(1秒的一千万亿分之一),模拟运行了20微秒。不能小看这个数字,20微秒相当于2*1011步,在分子动力学模拟中这属于相当长的时间,以此可以更真实地模拟 NTD 和 RBD 之间的相对运动。
AI为生命科学研究开辟新方向,
开拓新产业
正如张林琦教授所言,AI、大数据等创新手段与生命科学的深度融合正在为生命科学研究开辟新的方向,甚至改变生命科学的研究范式。生命科学研究发展至今,经历了不同的阶段,从20世纪前的描述观察,到20世纪的实验分析,在科学家们的努力下,生命的密码正在逐渐被破解。但这些传统生物学研究方式依赖于不断地试错和积累,不仅耗资巨大,周期往往也很长。同时,基因组学等底层数据采集技术的发展以及药物试验中持续产生的数据等等,也让生物数据呈现爆发式增长。虽然这为个性化的靶向药物研发、精准医疗提供了可能,但海量数据也注定了单靠人力完成数据的整理、分析和挖掘已是不可能完成的任务。
如今,随着算力的提升、机器学习等模型的精进,大数据使得计算生物学的研究条件越来越完善,在基础科学研究中扮演着越来越重要的角色。对于 AI 与生命科学的结合,龚海鹏教授说道,“我们能不能从湿实验得到的数据中发现规律?人的逻辑思维可以有一个大致的判断,但还不够细致,AI 在这方面就能体现出它的优势。”对此张林琦教授也表示认同,他认为生命科学不能只靠感觉,而是要朝定量化和精准化的方向发展,“湿实验看到的结果往往是静态的,但所有的生命过程都是动态的,分子结构变化更是瞬时反应,在自然条件下一闪而过,人的肉眼连看到的机会都没有。在模拟分子动态变化以及定量评判方面,一些新的算法和技术能发挥非常大的作用,”张林琦教授说。
除了促进病毒、致病机理等基础科学研究的发展,计算机科学与生命科学的结合也可能会创造一个全新的生物医药产业。早在2018年,埃森哲(Accenture)就曾在一份统计报告中指出,“到2026年,大数据与医学和制药领域的机器学习相结合将产生每年1500亿美元的惊人价值”。
传统的新药研发极具风险和难度,周期长、费用高,过去十年药物开发项目从1期临床到获得 FDA 批准上市的成功率仅为7.9%。对此张林琦教授深有感触,不久前由他领衔研发的新冠“特效药”——单克隆中和抗体安巴韦单抗/罗米司韦单抗联合疗法获得中国药品监督管理局(NMPA)的上市批准,有助于治疗新型冠状病毒阳性患者。他说,“AI 在新药研发整个过程中的每个节点都可以发挥巨大的作用,比如为抗体的筛选、评估、预测、优化等提供支持,缩短研发时间,降低研发成本。另外,如果能在大数据分析的基础上利用 AI 技术总结规律、进行预测,在病毒突变之前,设计出专门针对突变的抗体,那么我们就能先下手为强,化被动为主动。”未来,从原始研究到临床试验,在生命科学产业的全链条上,通过跨界研究把干实验和湿实验无缝衔接,形成真实世界和理论数据的闭环,将为生命科学带来更广阔的发展前景。
跨领域、交叉学科协同合作,
打破次元壁的秘籍
尽管计算机科学与生命科学的跨界合作大有可为,但协作过程还需要更多的磨合。两个领域的科学家所面对的是两类不同的知识结构、语言体系,如何打破行业壁垒、共建合作生态是关键。微软亚洲研究院与清华大学通过上述两项合作研究,为跨学科交叉实践积累了一定的经验。
那么不同背景的科学家协同合作的秘籍是什么?
首先,明己之长,知己所短,优势互补。张林琦教授长期专注于艾滋病等人类重大病毒性传染病的致病机理、抗病毒药物、抗体和疫苗的研究;王新泉教授的主要研究方向是结构生物学;龚海鹏教授则致力于把分子动力学模拟等新方法用于分析生物大分子的大尺度构象变化。他们及团队在各自的领域都有着深厚的积淀和世界级的影响力。这些专家对生命科学专业、前沿的洞察为算法提供了实现基础,可以帮助算法专家理解数据背后的科学意义。而微软本身是以计算机技术为核心能力的平台公司,在人工智能、云计算等领域能为其他学科提供强有力且最先进的计算机科学加持。
“微软亚洲研究院在生物学、材料科学、物理和化学方面并不是专家,所以我们需要与真正的领域专家共同努力、密切合作。在这个过程中,双方会互相影响,相互改变。AI 科学家可以提供基于数据的端到端解决问题的思路,提供比传统科学计算更加高效的解决方案;自然科学领域的学者则可以提供独到的领域知识,让这些计算能力以一种符合科学规律的方式用到刀刃上,”微软亚洲研究院副院长刘铁岩表示。
其次,跨领域合作需要提出最具有前瞻性、挑战性的科学问题。只有前沿课题才能发挥双方实力,激励科研人员克服困难,合理调配资源。刘铁岩表示,“虽然人们认为 AI 能够在任何领域发挥作用,但如何找到关键的科学问题才是关键所在,这需要领域专家与 AI 专家坐下来细致地讨论,不断淬炼出真正重要的问题。”合作伊始,微软亚洲研究院的研究员们与清华大学的师生团队也遇到了预期不匹配、沟通鸿沟等问题。通过随后定期的会议与学术讨论,双方逐渐明确了彼此的优势所在,找到了“最难啃的骨头”。当实验结果出现差异时,大家会从不同角度共同分析问题产生的原因,不断磨合,增强了彼此的信任。
最后,是要有耐心与恒心。生命科学研究是一个漫长而枯燥的过程,很多基础研究短时间内都无法带来直接的收益。对此龚海鹏教授认为“做科研需要踏踏实实。解决生物学的实际问题,要以推动科学发展为目标,而不是以发论文为目标。微软亚洲研究院在提供强大的计算资源、AI 算法的同时,在合作研究中也极具耐心,这是跨领域合作的基础。”
在双方的合作中,大家也加深了对彼此所在行业和机构的理解。在合作之前清华大学的老师们还有些疑虑,“在我们眼中,企业的研究部门更多的是以短期业绩为导向的。但合作之后我们发现微软亚洲研究院是一个真正的学术机构,尤其是‘顶天立地’的价值取向和学术定位与清华大学的理念非常吻合。也只有这样才能开展更具学术性的研究合作,”王新泉教授说。
无论是用深度学习优化大气污染排放量、把 Graphormer 用于催化剂设计、神经网络用于新物理发现,还是近期 AI 领域顶会 NeurIPS 上火热的科学相关主题演讲,都昭示着 AI for Science 已经成为一种趋势。计算机科学、人工智能与生命科学、生物医药、量子科学、天文学等一系列基础科学研究交织碰撞,将为科学发展注入新的强劲动力。而在这一浪潮中,微软亚洲研究院也将继续与科学界合作,取得更加亮眼的成绩。
推荐阅读