查看原文
其他

AI 何以成为「生命健康」的破局者?写在 2022 智源大会「 AI 赋能生命健康论坛」后

智源研究院 智源研究院 2022-11-03


6月2日,2022北京智源大会「AI赋能生命健康专题论坛」成功召开! 在 AI for Life Science 这一前沿研究领域,我们作为论坛主席,邀约了一批最富洞见的中国学者,向每位带来精彩报告的嘉宾真诚道谢!
从研究前瞻聊到落地应用,一场酣畅淋漓的学术盛宴,令我们回味许久。在新药研发面临反摩尔定律愈演愈烈的趋势下,AI辅助药物研发如何破新局?如何以先锋姿态勇闯科学前沿突破,同时亦能落地造福平凡日常一蔬一饭?


药物分子生成、AI 与营养健康、蛋白质预测、药物研发范式、基因调控……关于 AI + Life Science 的无尽探索可能,随着与会嘉宾充满激情的演讲,把我们的思绪拉回到2021年8月,智源研究院成立健康计算研究中心的那个夏天。


彼时,随着 AlphaFold 的横空出世,推动蛋白质结构预测突破新高度,人工智能照亮生命健康等基础科学领域,指引出另一条潜力可期的研究路径…


以人工智能和数据驱动的第四范式为生命科学基础研究提供了新可能——受到这一珍贵的科研机遇感召,我们奋然投身这一交叉领域研究,期待我们的点滴科研进展能够切实为这个世界带来稍许进步与美好:

或是帮助医疗行业加速传染病、罕见病、癌症等重大疾病解决方案的研究,或是帮助人们追寻生命的奥秘。


就这样,智源健康计算研究中心“开张”了,聚焦人工智能技术赋能生命科学领域研究


不到一年,就吸引了一群志同道合的全职研究人员加入—— 他们中有来自微软亚洲研究院主管研究员、ICLR outstading paper得主、师从机器学习三巨头Yoshua Bengio的知名研究员,ACM金牌、来自Facebook的算法工程师等多位优秀人才。



以生物序列数据(DNA、RNA,蛋白质)为主要研究基础,我们尤其关注生物序列数据研究中的重要方面,如加速序列筛选,功能可控序列生成,三维结构建模预测和生成,复合物结合预测等,实现从0-1的新型药物设计。

传统药物研发是一个漫长而昂贵的过程,通常一款新药要花费超过十年、甚至二十年费用,更重要的是在临床测试阶段,通过三期测试的概率只有10%。在这些方面,人工智能技术大有可为:
药物研发领域积累了海量数据,包括科技文献、PDB公开数据、临床试验数据等,从海量数据中发现和总结规律,并用于结构和功能预测正是AI最精通的能力。
近年来,人工智能模型算法日益精进,在加速药物研发周期和提供成功率方面展现出巨大潜力。更重要的是,一旦AI辅助药物研发的“潘多拉魔盒”被打开,将在整个生命科学领域引发颠覆性变革,改变材料、化学、能源等多个基础学科的研究范式,加速相关重大课题的研究进程。
目前,智源健康计算研究中心取得了一些微薄进展:

01


众所周知,缺乏足够可供机器学习算法使用的数据,是AI解决生物学问题的关键瓶颈。如在RNA三维结构预测中,有结构的单体RNA只有1000个样本左右,不足蛋白质结构数据的1%。从第一性原理发出,采用量子力学计算模拟可能面临功耗过大,且无法进行大规模计算的问题。

基于此,团队提出使用粗粒化机器学习力场进行分子动力学模拟,并与结构预测等下游任务进行统一建模,将粗粒化模型模拟仿真作为隐式神经网络,实验端到端可微。该方法有希望将DNA、RNA、蛋白质结构模型用一套完整的原子层面进行表征,并与不同的下游任务联合进行端到端学习,从根本上解决数据孤岛和小样本难题。

02


在过去的一个月中,研究中心参加全球持续蛋白质结构预测竞赛CAMEO(Continous Automated Model EvaluatiOn)获得第一名,初步展现了团队在生物计算领域的科研实力。

CAMEO由瑞士生物信息研究所和巴塞尔大学联合举办,与CASP竞赛共同被视为全球蛋白质结构预测领域最重要的两项比赛,每年吸引全球生物计算领域的顶级企业和科研机构在此角逐。这项竞赛要求参赛者每周对 20 个由世界范围内的结构生物学家最新破解出的蛋白质结构进行预测,我们在IDDT关键指标上达到了85.8,击败Alphafold2模型。

03


研究中心积极在核酸适配体、小RNA药物、抗菌肽、基因编程等多个领域展开研究工作,将人工智能方法应用于领域内的问题上,并根据领域问题的特点优化机器学习算法与模型,均取得了不错的成绩。 
此外,在新冠病毒核酸适配体研究中,我们找到了体外实现效果极佳的高潜力候选物,正在开展进一步的临床实验验证。

AI for Life Science 是典型的交叉研究学科,对研究人员有着更高的跨界要求,需要广泛的领域合作。智源模式为我们的科研进展提供有利的帮助。

缺少跨界人才一直是制约 AI 药物研发领域的关键因素之一:
团队建设发展,需要跨越学科背景带来的理解偏差和先天障碍。研究人员不仅要有深厚的机器学习背景,精通算法的构建与优化,还要对生命科学领域有兴趣和热情,有坚实的分子生物学与结构生物学专业知识。
大多数研究员都是纯机器学习背景出身,需要半年内快速从“一窍不通”成长为“半个领域专家”,除了兴趣驱动外,“智源模式”亦提供了良好的环境和丰富的资源。
在这一过程中,基于智源研究院跨越产学研的中立定位,我们得到了来自各方优势力量的支持:
依托充满活力的智源生态圈,健康计算研究中心已经与国内众多研究机构建立密切合作关系,包括清华智能产业研究院(AIR),清华大学计算机系、自动化系,北大计算机学院,人大数学学院以及海德堡大学等。不同院校、不同学科顶尖学者的交流、合作机会,为研究成果提供了丰沃的学术土壤。
研究人员有机会与顶尖学者交流学习,比如,清华大学药学院鲁白教授,成为很多项目的指导老师,从生命科学角度对计算机背景团队的跨界科研给与大力指导;
通过青年人才俱乐部青源会,密切与海内外小同行互动切磋;借助产学界的合作项目,快速了解行业趋势和研究现状,为新课题提供重要指引……
我们的团队沐浴在自由、透亮的工作氛围里。我们最享受两个时刻,一个是和团队伙伴1V1聊研究进展,灵感激发着在白板上写下满满思路;另一个就是全组人结伴去食堂吃饭,聊聊家常,互相倾吐一下研究中的不容易和小坎坷——仿佛回到无忧无虑的大学生活。


我们是一个年轻的团队,每一天都充满了探索的激情与目标。


愿意给年轻人更多承担、锻炼的机会,愿意创造年轻人喜欢的“自由透气”的环境,这也是我们当初决心加入智源的理由:


相比“螺丝钉”的角色,我们更加渴望加入一个迅速发展的平台,承担更具成长性的角色,用青春的奋斗在科研简历上写下更有影响力的代表作!


我们相信,人工智能技术在AI药物研发、多组学数据分析、生物通路分析、可解释免疫原理研究、生物标志物发现等多个方向都有广泛的前景。


以人工智能推动生命科学领域的些许进步,将成为我们这个团队一段时间重要的主旋律。



畅想 AI for Life Science 下一个十年,我们都相信:

在不久的将来,一定能够在计算机里模拟整个生物体过程。



与有荣焉,我们和中国最优秀的科研同仁共同携手,交流、合作、探索。
我们最喜欢的一个环节,是论坛最后的圆桌讨论,每人要对十年后说一句话,这是我们对于当下与未来,滚烫的寄望。
也放在这封手记的最后,在时间的荒流中,用以自我鞭策。
畅想下一个十年,我们并不孤独,我们一起走到。

袁洋 | 清华大学交叉信息学院助理教授/智源青年科学家

十年后,AI技术或许可以时时监测人类的身体状态,并告知保持身体健康的方法。不治已病治未病,可能将是生命科学走进千家万户的基本形式。

黄文灏 | 智源健康计算研究中心技术负责人

传统医学领域的“不治之症”可能会被彻底根治,人工智能技术将会掌握更多的医学知识,并向用户提供个性化健康管理方法,帮助用户形成良好、循环的生活习惯。

汪小我 | 清华大学长聘教授

AI与生物医药的结合,特别是对大分子药物的操控,将对生物制药领域产生颠覆性影响。合成的生物学元基件,有助于抽象性的闭环、数基和碳基融合,让合成生物更智能。

李磊 | 加州大学圣芭芭拉分校计算机系助理教授

十年之后,人工智能技术在探究生物学机制和人体系统本身方面会产生重要影响。我们对复杂生物系统的理解仍处于初级阶段,未来随着海量数据源源不断的产生,期待人工智能帮助我们更好地理解人体机制。

许锦波 | 美国芝加哥丰田计算技术研究所教授

人工智能与生物学领域的交叉研究前景广阔,无论是探究生命机制,还是实现工程化应用。未来十年,我非常看好AI在合成生物学方面的探索,尤其是分子组合设计必将产生重大突破。

聂再清 | 清华大学国强教授和AIR首席研究员

在数据驱动的作用下,定制个性化药物可能是未来医药领域的主流趋势。基于个性化的精准营养,疾病检测和饮食干预,将逐渐形成适用于特定个体的药物或营养方法。

李成涛 | 星药科技创始人&CEO

AI在生物医药领域的应用会逐渐渗透到药物研发、合成、生产的全过程,大幅缩短药物研发周期,提高生产效率。

唐建 | 加拿大MILA实验室长聘副教授:

在十年的时间内,如果我们能够利用人工智能技术建构一个高精度生物模拟系统,提高临床药物试验的成功率,突破药物研发的真正瓶颈,这将是一项非常了不起的成果。

彭健 | 华深智药创始人/伊利诺伊大学厄巴纳-香槟分校副教授/清华大学智能产业研究院高级访问教授

人工智能在生物医药领域的应用,可能朝着数字化、自动化、智能化的方向发展,影响范围覆盖农业、能源、材料、食品等诸多领域,未来潜力无穷。










黄文灏 | 智源健康计算研究中心技术负责人


他近年来主要研究人工智能、深度学习、自然语言处理研究,对人工智能技术在金融行业的应用有丰富的实战经验;在MRSA研任职期间,相关成果应用于微软 LUIS,Office,Teams,Bot Framework 等平台,影响用户超过 30 亿。同时,在 AAAI、Transactions on Intelligent Transportation Systems 等顶级学术会议和高影响因子 SCI 国际期刊发表论文二十余篇。






叶启威 | 智源健康计算研究中心技术负责人


决策智能研究领域的杰出青年学者,在(深度)强化学习,决策树模型,生成模型等方向发表了多篇重要学术成果。2016年研发的LightGBM在精度和速度上超过同时代其他框架,成为业界最受欢迎的决策树算法之一;2018年研发人类史上最强麻将AI模型Suphx,在『天凤』平台超越人类顶尖选手。











您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存