查看原文
其他

浙工大智能制药研究院院长段宏亮|AI制药方兴未艾,未来可期

生物经纬 智药邦 2022-06-15


段宏亮  浙江工业大学智能制药研究院院长、教授

中科院上海药物研究所获药物化学博士学位,并获人工智能硕士学位;在美国俄克拉荷马医学基金会从事基于高通量筛选(HTS)的新药开发工作多年;作为核心成员开发的抗糖尿病药物以两亿元转让至法国施维雅制药公司,作为主要成员研发的3个一类新药现处于临床研究阶段;现主要从事AI药物研究方向,针对AI药物研发中,数据严重不足这一“痛点”,开创性地将HTS得到的药物大数据和AI技术结合起来,致力于建立基于“HTS + AI”双驱技术的药物开发平台,专注于临床前候选化合物的发现智能化、流水线化。

生物经纬对段宏亮院长进行了专访。

您在浙江工业大学智能制药研究院任院长,研究院下设智药大数据、智能药物设计与合成、智能制药装备、智能药物制剂四个研究所,这些研究所是近些年才设立的吗?是为了提前储备相应人才吗?

段宏亮:浙江工业大学智能制药研究院是2020年成立的,它的成立一方面为了响应国家人工智能的战略方针,另一方面是因为去年疫情以来,生物医药发展进入快车道,各种新技术和新理念层出不穷,学校是培养人才的地方,所以我们也顺势成立了智能制药研究院,来加强这个方向的人才培养工作。
研究院成立之前,我们在智能制药装备方向,已经有十几年的积累,方向比较偏硬件的自动化、智能化。此外,这几年,我们重点布局了基于AI的新药研发以及药物合成路线设计等几个研究领域,赶上这样一个契机,我们把这几个方向凝练在一起,成立了相应的研究所,把它们纳入到智能制药研究院下面。
我们学校成立智能制药研究院,还有一个大的背景,杭州本身就是一个数字经济城市,药学院在浙江工业大学算是学院重点发展的学院之一,把数字经济和AI跟制药做一个结合,符合产业和学术发展的趋势。同样身处杭州的浙江大学,也是将药学院和人工智能学院结合形成一个人工智能制药研究院。

这种做法在全国高校来看算是提前布局吗?

段宏亮:应该算是较早的,整个人工智能产业兴起不过三五年时间,这么短的时间人才储备不是很足。现在各大互联网公司都在拼命搞人工智能,做人脸识别、无人驾驶、自然语言处理等等,AI人才都是非常紧缺,人工智能和制药方向结合起来,人才就更缺了。
全国来看,研究AI制药方向的课题组并不多,很多高校想开始这个方向,但还没有充分的人才储备。目前国内AI制药企业雨后春笋一样涌现,各大互联网公司也在进军这个方向,企业界在抢人,学校也抢人,人才确实是个亟待解决的大问题。

AI制药涉及的学科比较广,对人才的要求也更高,您认为现阶段人才培养要有什么策略?

段宏亮:我们的人工智能制药目前还是归属在药学这个一级学科下面,大背景是制药,所以现在招的大多数研究生还是药学背景。但是和计算机背景的学生融合是大趋势,综合能力的培养是最有含金量的。

AI制药是一个技术性非常强的交叉学科,既需要药学背景的输入,又强依赖于计算机功底对算法的研究与实现。从人才培养角度,首先是甄别对这个方向具有浓厚兴趣与潜力的学生,其次是让各有侧重的同学日常进行科研合作与交流,进行最前沿的论文解读与研究,尽量做到高效的信息获取与产出。

您在中科院上海药物研究所获药物化学博士学位后,为什么选择了AI制药的研究方向?

段宏亮:说来话长,当年高考我的第一志愿其实就是计算机,但阴差阳错被调剂到药学院,后来读研究生、读博士、出国做博后都在做药学方面的事情。

在国外做博后的时候,学校和导师比较开放、宽容,让我有机会再修一个人工智能方向的硕士学位。那时在2015年,人工智能还没现在这么火,但我隐约感觉人工智能会跟各个行业发生关联,这种感受越来越强烈,后面就坚定选择了人工智能这个方向,等到我毕业的时候,国外的一些公司已经在做人工智能和制药的一些融合工作了。

回国之后,遇到这样一个契机,学校领导非常支持我这块的研究,建议我们把人工智能和制药两个方向融合在一起,成立这个研究院,也算是圆了我少年的梦。

根据您目前的研究,制药的哪个环节是AI最容易切入的?最有潜力的环节是哪个?

段宏亮:人工智能技术会深刻地改变各行各业,只是不同的行业渗透程度不太一样。像制药行业,相对而言是一个非常复杂的行业,AI技术渗透其中需要一个非常长的时间。但这势必是一个大趋势,我们尝试从制药中的一些小环节来找到突破点,一步一步利用AI技术改造医药行业。
我个人的理解,智能制药装备领域从技术角度上来说是比较容易切入的,它基本上就是一个智能化、自动化的过程。 
另外一个领域是针对小分子药的化学合成环节,因为这方面上百年来已经积累了几千万、上亿的数据。
我们知道人工智能是以大数据为基础的,大多数的制药相关行业,数据比较匮乏,数据获得也非常昂贵。化学反应数据量比较充足,最有可能从这个方向上取得一定的突破。这部分严格来说属于有机合成的细分领域,它并不是制药的核心环节。

制药最核心的环节在于找到活性化合物,比如抗新冠药物的研发,其实现在我们不知道是哪个化合物对新冠病毒有效,这才是最关键、最核心的环节。有机合成只是把化合物或者药物生产出来,相比而言,经济附加值没有那么高,但这个市场也是非常之巨大的。

目前AI制药更多的集中在药物分子发现,但目前还没有多少成功的发现案例,您认为其中还有哪些技术待突破?

段宏亮:AI制药目前的困境一方面是数据,另一方面是算力。
AI是以大数据为基础的,在AI这个概念火起来之前,大数据是先行的。只有先积累了大量的数据,才能在此基础上衍生出来AI技术,海量数据是人工智能的基石,所以说大数据与AI是一脉相承的。
像之前提到的,制药行业很多环节数据不足,哪怕有也非常昂贵,如果我们是纯粹基于数据的人工智能算法,没有数据想取得突破是相当困难的。

还有一种方式是基于计算化学或者量子力学,这种不太需要数据,但是它对算力的要求相当高,相应的对计算机的配置要求就很高,需要远超普通计算能力的超级计算机,甚至量子计算机,才能解决现在面临的算力瓶颈问题。

AI制药需要大量的数据支撑,大学或科研机构在这方面有所欠缺,这些机构开展AI制药研究该走什么样的道路?

段宏亮:传统的新药发现,积累数据速度非常慢,我们常说十年十亿美金才能够研发得到一个新药,这样的时间成本和经济成本,基本上不可能让新药数据积攒到我们需要的大数据的程度。
就算是针对前期的苗头化合物、先导化合物来说,数据获得其实也是很昂贵的,因为一个化合物可能需要几个月的时间才能合成出来,然后还要去去测试生物活性,如果没有活性,化合物又得舍弃,并不能给我们提供太多的信息,因此传统的方式获得数据的方式其实是非常困难的。
另外,因为医药数据对各大制药公司来说至关重要,各家公司非常注重数据的保密工作,基本上不会对外公开。医药数据本来就不足,每家制药公司又守着自己的一亩三分地,各自为政,可用的数据自然就更少了。
最近这些年,陆续有一些新的技术出现,可以在一定程度上弥补数据不足,比如说高通量筛选技术、DNA编码技术、组合化学技术等。比如DNA编码技术可以在短时间内衍生大量的活性化合物出来,可以一定程度上弥补数据量的不足。至于数据量是不是大到能够让我们的模型充分运转,可能还是需要业界人士去验证,并对数据模型进行优化。

另外一个办法就是从算法模型来突破,在小数据量的情况下通过迁移学习技术或者小样本学习技术来完成 AI模型的训练。比如我们只有几十甚至几个数据,是不是就一定不能学习到它的活性规律?其实理论来说也是有可能的,这就是我们算法工程师需要攻克的难题了。

有没有可能做到利用某一种制度或方法,来使制药公司把数据分享出来?

段宏亮:也有一些技术是可以实现的,比如说联邦学习和群体学习。联邦学习是一种比较新的AI技术,医药数据仍然存贮在制药公司本地,但是深度学习模型部署在AI公司,它既能给AI制药公司提供数据,又保证了数据安全,相当于把数据加密,提供给AI算法公司,AI运算完后,回来再解密就可以了。

这样对制药公司的数据是比较安全的,一定程度上可以打消一些制药企业的顾虑。而群体学习是同联邦学习类似却又完全去中心化的一种学习技术,利用分布式的深度学习以及区块链技术,既可以保证数据的保密性,又可以避免联邦学习的中心节点权力过大导致的风险。

现在更多的案例是AI和小分子药物领域的结合,未来AI制药有可能在大分子药物、细胞、基因治疗药物、或者其他新兴生物技术药物发现方面取得突破吗?

段宏亮:个人认为,一个比较可行的路径是:优先选择比较简单的小分子入手,训练我们的模型算法,等小分子药物研发彻底攻克之后,再慢慢的转移到蛋白药物的开发上来。

之所以优先在小分子药物上面着力,一个很重要的原因是小分子药物,相对大分子药物而言结构比较简单。如果是蛋白药物的话,配体和受体两边都是蛋白,结构都非常复杂,开发难度会比小分子药物高出很多。

如果不去考虑受体蛋白结构,只对小分子做研究,比如说预测晶型的任务,相对而言就更加容易,现在已经有很多成果落地了。

制药行业中您认为哪些环节更容易商业化?

段宏亮:其实制药行业的每一个环节,都有相应的商业公司,也就意味着AI技术都可以在已有的环节进行应用。

至于它能不能商业化,一个很重要的问题是我们的AI 技术,有没有把相应的制药问题解决掉。如果说某个环节没有被革命掉、颠覆掉,可能因为现在AI制药的技术还不够成熟,还需要假以时日。

很多互联网巨头陆续开始布局AI制药领域,您对这种现象怎么看?他们会探索出成果吗?

段宏亮:应该说这是一个好现象,说明整个社会关注度高,投入资源就有更大的概率更快获得突破。
去年疫情爆发,我们全民都关注了健康行业,AI制药又算是健康行业的一颗明珠,在闪光灯下的资本、媒体、互联网公司等各路人马集结起来之后,会吸引更多的人关注这个行业,也会有更多的资源进来,形成一个比较正向的驱动力。

短期的导入过多资源,确实可能会催生一些泡沫,但拉长周期看,对AI制药行业的发展成熟是好事。但总体还是希望大家理性对待这个行业和趋势吧。

您有产业转化的想法吗?

段宏亮:我们也会看合适的机会,可能也会切入到AI制药产业里面来。我自己的背景刚好是跨了制药和AI两个专业,知道还是有一些制药行业的痛点没有被AI发掘到。有时候想自己来试一试,看看在自己的认知背景之下,能否对一些个别的环节起到一点推动作用。

数据是AI制药的痛点,一方面我们可能从数据入手,另一方面可能从硬件,就是智能制药装备这一块入手。智能制药装备相对来说技术和市场确定性都比较高,更多的是工程化去落地的商业行为。

您认为随着AI制药领域的发展,未来会呈现一个什么样的局面?

段宏亮:制药行业其实是一个很古老的行业,知名制药公司大都有上百年的历史,生命力很持久。制药行业技术壁垒非常高,不会因为一个新技术出现,老的企业就会被瞬间革命掉,这点和互联网公司不太一样。
如果当某个AI制药公司成长为行业巨头,它可能会有比较持久的生命力,可能也会出现百年的AI制药老店。AI制药我们差不多跟国外是同时起步,国内AI技术发展很快,并不落后欧美公司太多,但是我们的资本热度更高,关注度也比较集中所以制药行业面临的机遇非常好。

近年来国内已经涌现一批国际领先的AI制药公司。未来会有更多AI制药的细分领域超过国外同类公司,有望出现百花齐放的局面,总的来说,AI制药领域的未来还是非常令人期待的。



— 关于浙江工业大学智能制药研究院 —


浙江工业大学智能制药研究院依托该校长三角绿色制药协同创新中心平台优势资源,于2020年以智能药物合成创新团队为核心组建。


研究院下设智药大数据、智能药物设计与合成、智能制药装备、智能药物制剂四个研究所。结合智能制药的发展特色,将人工智能和药学大数据、药物设计、药物合成、制药装备研发以及药物制剂等研发方向相结合,致力于提升药物研发速度,缩短研发周期,节省资金投入,提高新药研发成功率,推进智能化制药进程。


新闻采集 | 李浩

图文编辑 | 彭庶文

本文系【生物经纬】原创

----------- End -----------




感兴趣的读者,可以添加小邦微信(zhiyaobang2020)加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位 或姓名-学校-职务/研究方向






历史文章推荐    


浙江工业大学智能制药研究院段宏亮教授:AI制药的现状、技术与挑战
CHEM SCI|分子Transformer模型预测酶促反应
基于文本表示推断化学反应的实验步骤
基于AI的连续流反馈系统加速化学反应开发
使用数据驱动的分子连续表示进行自动化学设计
图卷积神经网络用于解决小规模反应预测
数据增强和迁移学习策略解决小数据集化学反应预测问题
Drug Discov Today|药物研发风险地图
Drug Discov Today|FDA童伟达:基于AI的语言模型为药物发现和开发提供动力
苏安|人工智能在药物合成设计中的应用

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存