查看原文
其他

BioBAY群访丨生物医药产业如何顺应生成式AI浪潮,赋能行业发展?

BioBAY BioBAY
2024-10-10



近日,OpenAI推出了多模态预训练大模型GPT4.0,相比去年年底爆火的ChatGPT,GPT4.0拥有了强大的识图能力;文字输入限制提升至2.5万字;回答准确性显著提高;甚至能够生成歌词、创意文本,实现风格变化。事实上,本段中的主要内容也均由AI生成,是不是完全察觉不出呢?

在生物医学研究和健康领域,ChatGPT与GPT4.0式的生成式人工智能系统也有许多应用。IT+BT是BioBAY持续关注的前沿技术之一,面对AI在各个领域掀起的浪潮,BioBAY邀请到了园内行业知名的AI制药企业德睿智药、晶泰科技英矽智能,以ChatGPT为切入点,探讨生成式AI对生物医药产业的影响、作用及未来的发展方向。同时我们也“邀请”了ChatGPT本尊共同作答,看看“AI眼中的AI”又会是怎样的存在。


图片来源:视觉中国

受访嘉宾:


英矽智能创始人兼联合首席执行官Alex Zhavoronkov
晶泰科技人工智能副总裁白明

           德睿智药CEO           牛张明
OpenAI大型语言模型 ChatGPT


Q:ChatGPT在生物医药领域/医疗器械领域的应用场景有哪些?


“主要有数据抽取、靶点发现、药物相互作用、合成生物数据预测等方面。”


德睿智药 牛张明:“在我看来,ChatGPT更像是一个技术混血儿,通过使用一套深度学习技术组合(NLP/GPT+Generative+Transformer等工程化的结果),把聊天机器人做出了新一代搜索引擎的效果。从而大大超出了人们的预期。


事实上,ChatGPT所用的许多底层技术在过去几年早已被AI制药公司应用在生物制药领域。如GPT本身就是与BERT技术并行的自然语言处理(NLP)技术/框架。NLP技术的代表之一的知识图谱技术(大部分基于BERT)在AI制药行业可以用做辅助靶点发现,机理阐述,药物药物相互作用预测等。德睿智药在2023年与一家世界前十药企刚达成的技术合作就是基于BERT技术的医学知识图谱应用场景(并将尝试应用类似ChatGPT技术)。Generative Models(生成模型)与Transformer技术也分别在AI制药的分子生成,性质预测,蛋白质结构预测中被使用。德睿智药在2022年的几篇论文也是对以上技术的落地应用与改进。


所以ChatGPT在药物开发领域潜在的部分应用场景是在药物知识图谱所擅长的场景,例如数据抽取、靶点发现、药物-药物相互作用预测等。”


晶泰科技 白明:从十来年深度学习发展历史上看,发现当训练数据量、模型参数量达到一定量级时(ChatGPT是千亿量级),模型的“高级思维”能力就出现了惊喜的跨越。


以ChatGPT为代表的LLM(大规模语言模型)技术已经表现出高阶指代关系推理等语言逻辑推理能力。ChatGPT能发挥出优势的场景通常具备如下前提:一是有海量数据可用于预训练;二是有针对性高质量的垂类监督数据,让模型学到prompt与answer之间关联;三是可利用对比数据(comparison data)训练奖励函数,借助强化学习让智能体更成熟。


晶泰科技三位一体药物研发“铁三角”


晶泰科技的“AI智能计算+自动化实验+专家经验”三位一体的药物研发铁三角恰恰匹配了上述ChatGPT核心点。作为AI药物研发的先行者,晶泰科技已成功研发了生物版ChatGPT“Protein GPT”,同时考虑生成结果的靶点亲和力和成药性指标,可以说“一键成药”,已正式应用到大分子药物设计项目中。同时,晶泰科技也非常看好此类技术在生物多组学分析、合成生物学、基因组编辑和DNA序列解读、专业文献信息提取等应用场景的落地。”


英矽智能 Alex Zhavoronkov:生成式AI可根据生成条件来生成合成数据,目前已被应用于医疗健康领域的方方面面,从靶点发现、小分子设计、生成合成生物数据、医疗和美容成像等等。任何地方,当你需要在医疗健康领域中使用‘AI想象力’,GANs就会是忠实的朋友。


生成式AI的主要潜力在于,一旦经过训练,系统就可以创建与现有训练数据集不同的新数据,这一特性在生成化学中被广泛使用。在生成化学中,所需分子是从零开始设计的,不受自然或化学供应商的限制。其中一些AI药物发现系统使用起来非常简单,所以即便是非生物/药物化学背景的医生/计算机科学家也可以使用,来选择疾病靶点并产生有效的抑制剂。


但考虑到ChatGPT使用的训练集和训练它的AI训练师水平,存在准确性问题,暂时不建议将其直接应用于任何生物医学领域。我认为,需要考虑医疗领域对准确率和专业知识的要求,更期待开发出在医疗健康领域类似 ChatGPT的专门系统。”


Q:ChatGPT的出现是否会取代一些生物医药领域的相关职位?


“对于需要人的经验进行主观参与的职位,AI暂时难以撼动人的地位,但一些较为简单的信息检索/提取工作等可能会被替代,并相应产生AI相关的新岗位。”


德睿智药 牛张明:短期内ChatGPT技术将很难取代经验丰富的科学家,医生。但有可能为医生/医院门诊部门分担部分工作压力,比如医疗系统中的(人工)电话接线员以及信息提取专家。”


ChatGPT:ChatGPT的出现可能会对一些生物医药领域的相关职位产生影响,但并不会完全取代这些职位。由于ChatGPT可以自动化地处理大量的自然语言数据,可能会减少某些生物医药领域中需要进行手动处理的工作量,例如文献搜索、数据整合等。同时,ChatGPT可以提供智能化的辅助决策支持,例如临床决策、药物研发等方面。这可能会减少某些职位中需要进行复杂分析和决策的工作量,但仍需要人类专业医疗专业人员来进行最终的决策。


值得一提的是,ChatGPT的出现也可能会为生物医药领域创造一些新的岗位,例如自然语言处理工程师、数据科学家、人工智能专家等,这些专业人才可以与医疗行业专业人员合作,共同推动医疗行业的发展。”


Q:除ChatGPT外,目前生物医药领域还有哪些具有颠覆性意义的AI智能?它们之间的异同点是什么?


“该领域最有知名度且具代表性的便是Alphafold2,能够精确预测蛋白质结构,二者在应用领域、数据来源及技术原理方面有所不同。”


德睿智药 牛张明:可能是最广为人知的前些年AI影像技术(图像识别),以及结构生物学领域的蛋白质结构预测技术Alphafold2。对结构生物学领域,Alphafold2是该领域的一个颠覆性突破,同时也对生物化学、细胞生物学、遗传发育、神经生物学、微生物学、病理药理等一大批生命学科和研究领域有着深远影响,有望大大加速我们对于生命过程的理解。


ChatGPT和AlphaFold皆是基于深度学习,尤其是Transformer底层架构构建的模型以及系统工程,但ChatGPT参数量更为庞大。其主要的区别在于应用领域和技术方法的不同:ChatGPT是一种基于自然语言处理的人工智能应用,而Alphafold2是一种基于人工神经网络的蛋白质结构预测技术。”


Alphafold2在多肽亲和力预测上的应用


ChatGPT:以Alphafold2与ChatGPT为例,二者都是基于深度学习的技术,利用神经网络模型来实现各自的功能,并且都是在各自领域内具有颠覆性意义的AI系统,为相关领域带来了创新和进步。


二者的主要区别在于:


1)应用领域:ChatGPT主要应用于自然语言处理领域,例如文本生成、问答系统等;而AlphaFold主要应用于蛋白质结构预测领域。


2)技术原理:ChatGPT是一种基于深度学习的神经网络模型,通过训练大规模的自然语言文本数据来预测文本序列中的下一个单词或语句。而AlphaFold是一种基于深度学习和概率模型的蛋白质结构预测模型,利用蛋白质序列和结构信息来预测其三维结构。


3)数据来源:ChatGPT的数据来源主要是文本数据,例如互联网上的大量文本、社交媒体上的评论等。而AlphaFold的数据来源主要是蛋白质序列和结构信息数据库,例如PDB(Protein Data Bank)等。


4)应用效果:ChatGPT可以生成高质量的自然语言文本,例如文章、诗歌等;而AlphaFold可以高精度地预测蛋白质的三维结构,有助于深入理解蛋白质的生物学功能和药物研发等领域。”


Q:ChatGPT等AI智能如何带来行业的颠覆?其对行业发展的深化有哪些影响?


“AI的参与可以大大提升药物发现和实验的效率,且AI模型中所涉及的核心技术也能够加强行业中数据的‘开源’与算法的‘增效’,推动新技术应用的发展。”


德睿智药 牛张明:借助ChatGPT类技术,有望更高效地将海量的机器语言转换为研发人员可以理解的自然语言,扩展相关任务的可解释性。有望产生更多对科学家有启发的灵感,更加高效的辅助靶点发现,激励阐述等下游任务。”


晶泰科技 白明:针对特定靶点创造有效药物是一个周期长、失败率高的过程。在晶泰科技参与的新药管线中,AI智能计算平台ID4IdeaTM和XuperNovoTM平台已经分别覆盖从分子生成、化合物筛选、亲和力预测、化合物合成、成药性判断、晶型预测等小分子全链路和大分子药物De novo设计,更有效地探索广阔的化学空间,降低湿实验验证频次,降本增效。


晶泰科技智能自动化实验室


此外,我们从ChatGPT背后核心技术,比如Instruction tuning、In Context Learning、Prompting,看到有助于解决生物医药领域中数据局限性问题的新方法,和算法对专家经验还原度的新思路。当大家领略到ChatGPT等AI智能技术带来的惊喜时,我们相信,在资本的加持下,产业同行会更加重视AI算法的突破和生物医药数据的深化融合,晶泰科技自动化+智能化体系会持续提高药物研发的速度、创新性和成功率。通过晶泰的实践,我们也有理由相信AI智能会加强行业数据的“开源”和算法的“增效”,提升生物机理认知,突破创新药行业的壁垒,最终让患者受益。”


英矽智能时间线图解:从GENTRL模型(2017年)到论文(2019年)再到Chemistry 42平台 (2021年)


英矽智能 Alex Zhavoronkov:“生成式AI系统可以在真实患者的大数据集上进行训练,然后为整个患者人群生成新的、具有所需属性的生物数据集,如年龄、性别和健康状况等。这些合成的健康数据不会追踪到任何个体患者,这样可以保持匿名性。合成数据集也可用于试点研究和培训,同时保护患者隐私。”


Q:ChatGPT等AI智能的数据收集是否会涉及到伦理、数据安全、知识产权等问题?相关单位应如何进行监管?


“现阶段AI的应用确实可能涉及到一些安全、伦理、专利问题,需要相关部门出台完善的监管法规”


德睿智药牛张明:“AI数据的采集和使用需要遵循伦理准则和法律法规,同时加强数据安全保护和风险管理。相关单位应该承担起监管的责任,确保AI数据的合法、合规、安全和可信,可能数字水印技术有助于解决相关问题。我们期待在合理的监管,在合规的范围内,ChatGPT能产生更大的价值。”


英矽智能 Alex Zhavoronkov在没有专家监督的情况下,不应该依赖ChatGPT等生成式AI工具。ChatGPT引发了对版权、剽窃、作者身份以及AI生成论文可能激增的重要担忧,但在生物医学领域,最主要的担忧是患者安全。这些系统的开发人员应该优先考虑准确性、有效性和安全性,进行开放的基准测试,并限制可能造成伤害的功能的使用。”


ChatGPT:是的,ChatGPT等AI智能系统的数据收集可能会涉及到伦理、数据安全、知识产权等问题。相关监管机构应该建立相应的监管制度和标准,监督和管理数据的收集和使用行为。同时,应该遵循伦理准则和法律法规,如需使用他人数据,应该获得相关权利人的授权或者按照法律法规的规定进行合法使用。”


Q:ChatGPT等AI智能未来的发展将会走向何处?


“目前的AI仍然处于无法自主产出内容的阶段,无法完成从‘0’到‘1’的突破,这是其未来的发展方向。”


晶泰科技 白明最近以ChatGPT等为代表的AIGC(AI-Generated Content)类技术展现出改变人类获取信息效率和密度的极大可能,在提高专职人员创作灵感方面打开了一扇新窗户。当前ChatGPT已经表现出能通过多轮信息交互,不断捕获有效信息,输出符合语言逻辑的答案,具备一定的逻辑推理能力。让人们直观感受到了AI技术量变发展促成质变飞跃的进步。


当前的AI智能技术的底层依然是基于大数据驱动的统计概率,随着技术进步,相信AI在因果推断、高语义逻辑洞察、常识推理等方面会有更大进展。除技术本身之外,深度结合生物医药行业特点的AI技术,会逐渐改变生物科学家和药物科学家的工作模式和思维方式,带来更贴近产业上的商业用途。晶泰科技看好并拥抱AI智能技术可能带来的行业变革,希望与产业伙伴联合起来,务实践行“让AI流淌到每一款新药,让患者更快获得有效治疗”的使命。”


英矽智能 Alex Zhavoronkov在生物制药领域,现在面临的真正问题是,人们可能知道所有人类生物学、化学和物理学的0.1%,但是对于如何改变这些缺乏观点,因此即使有生成式AI的重大进展,也不可能从0.1%产生100%的知识。当下,我们更需要做很多的研究和探索。生成式AI可能在某种程度上帮助发现靶点、生成分子,甚至从无到有产生一些新颖的想法,但在很长一段时间内,它不会取代实验。”


Alex Zhavoronkov与英矽智能联合CEO任峰博士在自动化实验室


不难看出,BioBAY的AI制药专家们都对于ChatGPT类生成式AI在生物医药领域中的应用前景表达了认可,但在具体落地使用的过程中,仍然有准确性、数据安全、知识产权等诸多亟待解决的问题,生成式AI在生物医药领域仍有很长的路要走。IT+BT作为BioBAY精心布局、持续加码的领域之一,已成为BioBAY产业集群的重要组成部分。涌现了一批已经在AI制药领域取得了重大进展的企业,本次受访的德睿智药、英矽智能都已有由自研AI药物平台发现的、进入临床阶段的药物,晶泰科技也是药物研发自动化、智能化研究中的佼佼者。祝愿BioBAY园内的AI制药引领者们能够持续取得进展,推动技术创新,助力生物医药领域生成式AI早日落地造福行业。




文稿:赵家帅 杜姝 宋佳铭
责编:何文正
审核:任旭

推荐阅读

BioBAY专访丨瑞特佰王群:打破了进口垄断,提供优质国产替代选择
名厨烹制 | 专访和铂医药CEO王劲松博士:和创新药,铂铸未来
名厨烹制 | 专访和铂医药王劲松博士:中国生物医药创新走向全球是必然趋势
修改于
继续滑动看下一个
BioBAY
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存