互联网巨头下场之日,便是AI制药爆发之时——专访浙工大智能制药研究院院长段宏亮
+
导语
“重量级的选手还一直处于试水阶段,没有真正下场。”
文丨林怡龄
编辑丨刘聪
“在我的设想里,AI制药的行业发展应该是没有这么迅速的,但是自去年疫情爆发之后,AI制药在医药行业里逐步成为一个耀眼的存在。”段宏亮教授如是说。作为中科院上海药物研究所药物博士的他,早在2015年,就意识到计算机学科的巨大魅力,在美国进行药学博后深造的同时,攻读了人工智能硕士学位。然而,彼时的他没有想到,仅在五年后,AI会在向来平稳发展的制药界掀起如此之大的波澜。
五年前,美国的AI制药行业仍处于探索阶段,资本市场并没有给予过多的关注。但AI制药的革新力,还是吸引了大量企业进行尝试。无论是财大气粗的跨国药企还是互联网巨头,都开始接二连三下场,期待在这片处女地分一杯羹。站在AI和制药的发展洪流上,很多新兴公司获得了第一波市场红利。
现如今,欧美AI制药企业乘风而起,在资本市场拍起惊涛骇浪。AI席卷制药行业的浪潮,也于2020年起在中国不断飞舞出美丽的浪花。目前全球已有200多家从事AI药物研发的公司,涵盖了靶点发现到上市后的药品追踪。可以说,AI的应用覆盖了制药行业的多个环节。
感受到AI制药发展的巨大前景,深谙药物化学和人工智能的他在2020年以智能药物合成创新团队为核心,在浙江工业大学成立了智能制药研究院,下设智药大数据、智能药物设计与合成、智能制药装备、智能药物制剂四个研究所。为此,亿欧大健康为其做了专访,试图探寻AI制药的前世今生和智能制药研究院的研究布局。
01
AI制药方兴
2015年,一个选择,让他成为了日后中国AI制药浪潮里领先的一员。高考第一志愿是计算机专业的他,被阴差阳错地调剂到药学院。在国外顺利完成博后工作并出站后,身在美国的他毅然决然选择了攻读一个新的人工智能硕士学位,再次与计算机结缘。
就在那一年,AI技术刚刚崭露头角—AlphaGo大战围棋世界冠军李世石,并以4:1轻松获胜;在海外,AI被Google、Facebook、Microsoft等巨头公司的发展快速带动起来;在国内,百度,阿里和华为等大型互联网IT公司也开始青睐于AI技术的发展。一时间,与之相关的创业项目疯狂涌现,AI成为资本宠儿,荣光无限,并逐步形成接棒互联网成为新一个增长热点的趋势。
在制药行业,AI也开始初露锋芒。2014年成立的晶泰科技,在辉瑞总部的一次盲测竞争中一鸣惊人;日后推动第一个AI药物进入临床的Exscientia,刚刚为住友提供了第一个候选化合物。但与AI在其他行业营造出的火热景象不同,那时的制药界仍处于摸索观望状态。“从当时企业的融资金额看,美国那会虽然起步早,但也还在摸索阶段。资本市场并没有给予太多的关注。”段宏亮说到。
等到他人工智能专业学成归国的2018年,AI和制药行业的融合已经达到了前所未有的新高度。即便是专注在CADD的薛定谔公司,也敏锐地感知到这一新风口。而他们与AIDD(人工智能辅助药物设计)在技术方面的天然亲近,则让他们成为了第一波吃到AI制药红利的人。
严格意义上,CADD和AIDD并非完全等同,前者基于算力,后者则基于大数据。而在AI技术介入之前,CADD是创新药物发现过程中的一大法宝,但它的发展却是几经潮起潮落。 这个现象的根源在于其对新药预测的准确率不高。“计算机可以一次性给我们算出上万个分子,但这里面可能只有几百个有活性,而计算机难以准确地告诉我们哪些分子是真正有活性的,药物化学家又不可能把所有化合物都合成出来。这就导致了CADD和新药研发之间出现了鸿沟。”而这个鸿沟,却逐渐开始被AI技术抹平。
得益于AI带来的全新视角, 分子生成作为一种全新的业务场景应运而生。目前,该类业务场景已被Insilico、晶泰科技等业界领先的AI制药公司布局。
现有的分子生成底层技术有变分自编码器(VAE)、生成式对抗网路(GAN)以及其他基于自然语言处理(NLP)的RNN、Transformer等模型。在段宏亮看来,分子生成,与ADMET预测、合成路线设计所用的技术是相通的。“每一个AI制药的环节都会有那么几种主流的模型,只是各种模型在不同的任务场景上面会有不同的表现而已。”例如,他曾在接受媒体采访时指出,VAE虽然相对GAN和Transformer来说技术不是最新,但其对药物分子生成这一场景的贴合度很高,反而有极好的表现。
同时,他认为,“分子生成之后的活性评价才是药物发现最关键的环节,新药研发失败率高的原因大多源自于此。单纯从源头发现一个新的化合物不难,难的是在于把化合物结构优化使其活性由弱到强。而这正也是是AI制药行业需要全力攻克的痛点, 如果这个环节无法突破,那么AI制药就会丢失最为核心的阵地。”他指出,解决这一问题的关键所在其实在于数据,只要数据来源问题可以攻克,那么活性评价的任务也可以完成。
02
AI和制药真正融合的时代何时到来?
智能制药研究院下设的智药大数据研究所要解决的难题,便是药物数据问题。而智能药物设计与合成研究所专注的是智能药物研发中最主要且极具挑战性的环节——药物活性预测以及合成路线设计。以上的研究领域也是该研究院重点布局的方向。
目前,他们已经搭建起两大平台——药物数据工厂HighWorks和人工智能药物计算平台HighMatrix。关于这两大平台,段宏亮曾在一次演讲中介绍过:
“HighWorks是一个基于自有化合物库的高通量筛选平台和真实的实验数据平台。该数据平台可以针对任何生物学的靶点产出大量的活性数据,从而可以迅速获得海量的苗头化合物或者先导化合物。除此之外,HighWorks还可以为我们的后续的人工智能制药平台提供足够的生物活性数据。”而“HighMatrix可以完全基于HighWorks产生的活性数据来训练模型。”
除此之外,HighMatrix还有部分数据是来源于文献专利。通过HighWorks产生的活性数据来训练模型,便让智能制药研究院有了针对First in Class靶点的活性数据来优化模型的可能。
除了活性预测,该研究院在药物合成上也有所涉猎——利用深度学习技术,从反应溶剂、温度、催化剂、酸碱条件和反应时长等方面全方位地对候选药物分子的合成工艺进行优化,从而智能化设计出经济绿色的合成路线。
有机合成路线设计中最基本和常用的手段之一是逆合成分析。该方法可以简单理解为从目标分子结构入手,一步步将其拆解成简单易得的合成前体直至商业可得的初始原料为止。但是通过逆合成分析来设计分子合成路线往往需要具有丰富经验的有机化学家,并会耗费大量时间在有机合成实验上面。而基于大数据的AI技术,能显著减少这一方面的试错成本。
药物化学反应经过两三百年的发展,积累了数千万形式规范的高质量数据,利用AI技术攻克药物合成势在必得。从目前的AI模型发展水平来看,短时间可能还无法媲美顶尖的有机化学家。但是,段宏亮相信,随着数据的进一步不断完善以及AI模型不断优化提升,未来其在药物合成方面的巨大驱动力也会进一步展现出来。他指出,药物合成有可能是被AI率先攻克掉的药物研发环节。
尽管AI制药行业当下一片热闹,但在不少业内人士看来,数据、人才的缺乏问题依然是AI制药发展的两大阻力。“只要数据量足够,很多药物研发问题都是可以用AI来攻克的。”而对于AI制药这一多学科交叉的行业来说,人才的稀缺或许是更为根本的痛点。“对制药和AI都理解深刻,才会知道制药环节中哪些关键问题是AI擅长解决的,找到两者的契合点,才能发现适合的业务场景。”
此外,资本的涌入也给当下的AI制药行业带来了一丝浮躁的气息。“大家拼的可能是融资能力,而不一定是技术实力。”事实上,AI制药行业正在不断前进是毋庸置疑的,但“如果认为暴力砸几十亿的资金进来就能迅速颠覆,则是不太可能。”
在段宏亮看来,中国的AI制药发展虽然看似火热,但也只是刚刚拉开了序幕,重量级的选手还一直处于试水阶段,没有真正下场。他认为,随着药物数据的逐渐积累,AI制药将会迎来一个数据驱动的2.0时代。届时,随着互联网巨头消除疑虑,深度拥抱AI制药,行业的春天也将真正到来。
请尊重原创,转载需获得许可
联系我们
我知道你 在看 哦