查看原文
其他

AI赋能,批量涨停!

硬核调研 2023-05-02

声明:本文仅梳理公司和行业的最新基本面,并非在当前时间点推荐买卖公司,本公众号不具备个股操作指导功能,投资有风险,入市需谨慎

人民日报今日刊发《人工智能产业化应用加速》文章称,近几年,国内外厂商纷纷加码巨量模型的投入与研发,让人工智能产业落地找到了新的方向,新药研发就受益于此。华为云盘古药物分子大模型,是由华为云联合中国科学院上海药物研究所共同训练而成的大模型,可以实现针对小分子药物全流程的人工智能辅助药物设计

英伟达官网3月22日显示,全球100多家医疗保健企业正在与NVIDIA就Clara模型合作 ,推动人工智能加速解决方案。Clara模型可以用于药物设计,通过不同AI生成分子,来完成蛋白质生成、分子生成与对接等任务,甚至可以预测蛋白质和分子的三维相互作用,从而优化药物在体内的作用方式。

1、简单梳理下chatgpt会给医疗药物研发领域带来哪些变化?

药物研发从过去的时间点看,是一个经验与实验相结合的,是由大量的药物化学、生物、实验技术促进的学科,沉淀大量的经验。AI药物研发推进的同时也少不了药物化学家来对药物的优劣和药效做出判断,辅助算法的改进,chatGPT结合经验和数据到大模型里,短期可能不能替代高级的,但是初中级的药物专家能被大模型所取代。药物研发比较重要的是靶点的发现,本来也是对基因、蛋白组学的数据进行分析,建立关联,比较容易被大模型所替代,这一块的瓶颈是促进整个医药行业数据的发展,现在来做chatgpt数据是一个瓶颈。基因、蛋白组学由于测序有比较多的数据,但是像药物活性等比较难以采集数据,这一块的自动化是后面比较重要需要发展的。刚才说的是临床前发现的阶段,临床合规和文件编写是会完全能被chatgpt替代的,基于一些数据进行训练就能轻松拿到文件;另外chatgpt能很好生成模型,所以可以拿来做临床方案的设计。对医疗方向,可以对患者起到导诊、康复震后随访,比较容易取代,看病的过程中可能还用不上模型。

2、药物发现从靶点的出现到苗头、先导、候选化合物还是经历了很多步骤的,我们在药物发现中,AI是创造性还是辅助性的作用?

目前还是更偏辅助性,chatgpt是辅助性向创造性迁移的机会。药物研发的反馈周期太长,AI能做一定的评估,但不是100%的准确,还是要做实验去验证,涉及到实验的成本和周期。比如AI筛出10个分子,最终哪些采取实验还是药物化学家来做选择(做决策)。AI只能成为工具,而不是决策者。第二,AI不是100%准确预测的,分子设计(拿一个新颖的结构不侵犯专利),分子评估(活性、adme等性质),第一块分子设计AI可以做,但是效率不太高,生成很多分子,其中被药物化学家认为是具备药物化学基本逻辑的分子比例比较少,涉及到一个筛选的效率(虽然有用,但是效率不高)。分子评估基本上是预测一个范围,但是有比较好的排除作用,原来需要拿10个分子去做实验,现在能排除5个,节省下一半的成本和时间。排除不了的那5个需要人去做决策。

3、行业带来突破可能需要3-5年,现阶段AI制药没有像chatgpt那样应用那么广,限制在哪些方面?

chatgpt是一个通用的语音模型,是拿互联网上大量的文本去做的,帮你写一些东西、一些文案这些表现是很好的,但是问它非常专业的领域会出现错误,实际环境面对的问题是更加复杂的,药物研发领域也是一样的,刚提到有一些经验,主要是在小分子药物研发方面的,现在比较新的ADC、protac药物领域,里面会有与以前简单的小分子和蛋白结合的类似的机理在,但是有很多新的AI里没有的知识,AI训练的模型迁移性是差一些的,尤其是不同机理之间的迁移性。并没有出现一个能覆盖所有的模型。

4、算法需要大量的学习,数据是否有很重要的作用?

的确,chatgpt出现的时间很短,生物医药储备的数据比较少,现在看喂多少数据能产生比较好的效果,大家还在努力探索。我认为数据的确是最关键的,算力算法数据这三个要素,算法是比较明确各家没有很大的差别,这个行业的数据不是那么大,ai制药领域,生物医药的数据比较少,看谁能先准备好高质量的数据,算力跟数据多少有关,目前不是很大的瓶颈,后续数据爆发可能才有变化。

5、对于医药研发外包的公司,数据积累上有优势,未来3-5年数据优势的公司还能去做AI的应用,比直接做AI制药研发的公司更有优势吗?

有一个误解需要澄清,大家都认为CRO公司对外服务多所以接触到的数据比较多,数据的确多,但从合规来讲,他们是不能用这些数据的,从服务角度来说签合同协议,是不能用这些数据去做研发的。Cdmo公司帮客户做工艺研发,一些过程数据不是客户要求的,但是可以拿来做到AI模型里的。做完这些项目之后,内部培养了这些专业人士,和算法团队一起工作,能提出一些建议改善效果,对于CRO公司来说,这方面的人员比AI制药公司要多。孰强孰弱不太好说,需要落到企业自身的战略投入上。

6、现在的上市公司中,CRO或者药企,据您了解比较靠前的是哪几家(上市)?

AIDD公司走的比较靠前的是药明康德和成都先导,这两家比较偏CRO,药明康德有布局AIDD这一块的人员,成都先导主要做DNA编码化合物库,和AI有比较好的结合,但是做的范围也比较窄,其他的药企我了解都在这一块有探索,但是大部分还是和AI制药公司合作,给几条管线,做的过程中去了解。

7、先导在AI方面的布局是内部已经有了AI的算法帮助筛选苗头化合物,还是未来潜在发展的?

有的,定位来讲,业界认为他是做DNA编码化合物库的公司而不是AI制药的公司,利用AI提高筛选效率,还有筛到的分子成药潜质,它能不能变成完全的AI开发药物的公司还没有迹象。

8、他们与腾讯AI lab有合作,腾讯在这方面又布局吗?

具体的合作内容我不清楚,我推测腾讯的AI lab不是一个商业化运作的公司,腾讯也不是主要进军AI制药,而是他们有一个组在做这方面的研究,对外展开一些合作,但还未涉及到商业化。我认为合作点在于,成都先导位于成都的位置不利于招到AI相关的人才,达成合作对于内部业绩是有帮助的,AI lab也要做一些算法的验证,所以会找一些CRO和药企。具体在做什么算法的研究不得而知,但可以去了解一下腾讯AI lab的云深智药平台。

9、现在chatgpt对于生物医药知识,没有包含pubmed上面的文献,如果灌进去这些是不是会有很大的提升?

从我们对chatgpt的实际测试来看,它是有具有药物研发的通识在里面的,至少具备基础文献和相关的学科教材在里面的,如果把文献和专利喂进去,效果是会提升,但是是否能做真正的药物研发还有待验证,本身生成式模型就会有一些胡言乱语,可能也会产生比较大胆突破的分子设计。行业对于生成式模型的错误容忍度更高,某些方面我们会认为是一种创新。Chatgpt还有监督学习,对应到药物设计来说还是需要一些案例的,这种公开数据比较少,需要接触药企的案例,但是大药企不太愿意公开。

10、算力算法数据三要素,目前AI制药、CRO、药企自己搞,他们的算力算法跟腾讯、360没法比,在数据上有所优势,但是跟公开数据比又太少了,有绝对龙头优势的是不是也跑不出来?

有待商榷。这些药企、AI制药公司的算力算法不一定和大厂有差距,据我观察没有。大厂做AI很强,但是都是广告推荐算法、OCR等算法,具体到药物研发领域怎么用,不做几年,大厂也完全做不出来。算力这一块,由于云服务比较发达,只要达到一定水准就好,还没到算力慌的程度,但不排除未来风潮起来后,算力资源越来越紧张,大厂对自己有倾斜,但目前来看这个趋势还不明显。药企数据的可用程度和积累的量都不及公开数据的量大,在做大模型的过程中,大家能不能合力做大模型是后面要解决的问题(有没有公司或者国家战略牵头),数据的限制的确存在,但会出来新的解决方案来解决。

11、非专业的人员观察哪些公司的因素呢(未来在行业里跑出来)?

非专业人士看两点:1)从非专业的角度理解公司怎么解决数据,逻辑是不是通的,有没有独特的技术;2)看公司实际药物研发的管线数量及进展。

12、有没有AI制药算法领先的公司?

国外:薛定谔算法有领先优势,偏AI算法的是xx。国内分别对标的是晶泰、英硒。

13、这个行业的商业化模式是什么样,如果有公司跑出来,核心竞争力和壁垒在哪里?

最早卖软件,但是上限比较低;后面是做服务还是做药(药企orCRO模式),晶泰偏CRO,英硒偏biotech。短期内来看不太有药企有能力做一些商业化,短期内会在cro和药企这两个之间的定位。

壁垒在于自身对于算法的应用,能从靶点推向临床2期(药物poc)的能力才是最大的壁垒。


今天就聊这么多,感兴趣的戳文末阅读原文链接,加入星球,有更多投资策略、教程和工具,等着你。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存