查看原文
其他

医药版ChatGPT狂飙,谁能抢滩登陆?

智药局 智药局 2023-08-18


ChatGPT发布不过几个月,我们仿佛看到了类似物种大爆发的盛景。人类理解它的速度,似乎已经跟不上它进化的速度了。


如果说以往AlphaGo击败世界围棋手,只是引发人们的赞叹,还能不痛不痒地谈一谈人工智能的局限性。


而ChatGPT/GPT-4的出现,以及其带来的一阵又一阵的浪潮和余波,都让我们身处对AI兴奋又炒作的时代。


大多数人已经达成共识:未来20年,整个社会都将面临人工智能的深度改造,AI替代人类工作不再是危言耸听。


而它即将引发的社会剧变,让马斯克等一众大佬们引发担忧,甚至倡议暂停大型AI模型的研发。


尽管如此,也难以停止大型生成模型的狂飙,生命科学领域也不意外。


ChatGPT的拐点时刻


无论是IBM沃森在问答节目中击败人类,还是AlphaGO战胜李世石,都难以让人类如此切实地感受AI与我们的生活如此贴近。


ChatGPT的出现,成为类似移动互联网的“iphone”时刻,iphone以一种划时代的方式,开启了一种全新的、几乎零门槛的人机交互时代


iphone将手机变成了“能打电话的智能终端”,围绕移动端催生出了大量生态应用,造就了一系如美团、携程、字节跳动等如雷贯耳的互联网公司。


现在,ChatGPT也在积极构建其生态影响力,包括此前开放API,整合进入搜索引擎,以及进入Office全家桶,再到ChatGPT宣布联网,更新最快的插件功能。


语言大模型以月的速度在更新,而其引发的社会变化则是以天在变动,调动了创业激情、创新应用以及讨论风潮。


相较于ChatGPT,GPT-4的能力又跃上了一个台阶,不仅从以往的语言对话变为多模态的语言模型,还是迄今为止规模最大、功能最强大的多模态预训练模型。


正如当初“互联网+”时代的来临,所有的行业都要重做一遍,如今AI的出现或许也将会为各行各业带来这样一个机会。


如何将这一技术落地到生物医药仍然是许多医疗智能公司冥思苦想的事。


微软:扣下商业化的扳机


谁也意想不到,AI技术的王权已经从谷歌移交到了微软手中,同时带领其商业化落地。


毫无疑问,微软已经成为GPT们在各行各业的推手,无论是此前的New Bing,还是ChatGPT加入微软全家桶,都成为微软引领AI浪潮的重磅炸弹。


科技巨头们早就对医疗保健领域多有布局,微软也不例外,将旗下智能医疗公司与ChatGPT相结合,使出一套组合拳。


3月21日,微软旗下AI公司Nuance发布了Dragon Ambient eXperience Express(简称:DAX Expres),一个集成工作流的全自动临床文档应用程序,这也是首个与OpenAI新模型GPT-4结合起来的临床医疗平台


与CPT-4集成后,DAX Expres可在患者就诊后几秒钟内自动创建草稿临床笔记,以便立即进行临床审查。该解决方案还与电子病历软件紧密集成。


Nuance是微软于2021年4月耗费197亿美元收购的智能医疗语音公司,被认为是医疗保健领域语音识别和人工智能技术的先驱,帮助医生无需记笔记并更好地预测患者的需求。


据悉,77%的美国医院和全球75%以上的财富100强公司都在使用 Nuance 的技术。


而搭载了GPT-4的将大幅度提升临床记录的生成时间。依靠GPT-4强大的生成式大语言模型和推理能力,DAX Express将记录过程缩短到仅仅几秒钟。


除此之外,微软也在推进AI在传统医药领域的渗透,包括和CRO以及bigpharma进行合作。


3月20日,CRO龙头企业赛纽仕宣布微软达成一项多年战略协议。协议包括与微软研究院合作、利用OpenAI的开发成果,一起为赛纽仕提供技术和数据解决方案,以加速临床开发并提升生物制药客户的商业绩效。


根据OpenAI的平台,赛纽仕可以处理和分析数据以快速跟踪时间表、优化资源分配并提高临床试验效率,赛纽仕也成为首家将ChatGPT的技术用于临床开发的CRO。


2022年9月,微软还和糖尿病巨头诺和诺德达成战略合作,计划将微软的计算服务、云服务技术和人工智能与诺和诺德的药物发现、开发和数据科学能力相结合来开发AI模型。


前不久,根据GPT-2训练后的BioGPT也被微软亚洲研究院开源,这是一款生物医学研究文献进行训练的大型语言模型,它能够读懂医学语言,PubMedQA 基准测试中达到了 81% 的准确率,能进行关系提取、文本生成、问题回答和文档分类等任务。


而这仅仅是基于已经落后的GPT-2进行微调的,众所周知GPT家族已经进化到了GPT-4。


微软过往几年持续投资OpenAI,并在1月底继续加码100亿美元的投资,甚至还专门为OpenAI打造了一台超级计算机。


野心勃勃下,微软在AI+医疗健康上的步子只会加快,不会减速。


争夺生物版“ChatGPT”


当OpenAI不再Open,ChatGPT和GPT4已经被微软独享,成为其生态圈以及商业版图中的重要一环。


尽管ChatGPT的通用能力已经开始展现,但是在特定的行业和环节,专业性的知识仍然难以得到专家承认。网络上的多篇“测评”中,我们可以看到无论是基因组学、药物设计,或者合成生物学,AI给出的答案仍然很局限。


在特定领域,经过专业知识训练的小模型比大型模型的效果更好


因此能够理解行业痛点在模型基础上快速抽取生成场景化、定制化和个性化的小模型,并且利用场景和行业 know-how的能力,则能够突破巨头在通用场景下的垄断,形成自己“小而美”的特色。


而ChatGPT背后代表了两大要素:一是以自然语言为媒介打破了以往计算机+生命科学的交互方式及门槛;第二则是深度生成模型为生物医药带来新的活力,提升研发效率与质量。


例如受到基于深度学习的自然语言模型的成功启发,近日来自Salesforce Research和高校共同研发了生命科学领域中类似于ChatGPT的蛋白质生成模型ProGen。


不少AI制药公司也将ChatGPT问答的方式加入到自己的研发平台中,当然公司都自称为“生物医药版的ChatGPT”。有趣的是,落地场景都各不相同,也体现了生成模型的多场景应用能力。


晶泰科技:ProteinGPT


晶泰科技自主开发了大分子药物 De novo 设计平台 XuperNovo®,该平台包含了一系列大分子药物从头设计策略,其中一款策略在内部被称为“ ProteinGPT ”,其技术路线与 ChatGPT 相似,可以一键生成符合要求的蛋白药物。


图:晶泰科技


英矽智能:ChatPandaGPT


英矽智能是一家端到端的人工智能驱动的医药研发公司,目前已经融资到D轮,同时有多个处于临床和临床前阶段的分子。


基于近期在大型语言模型上的最新进展,研发团队已在其靶点发现平台PandaOmics上整合了先进的AI问答功能。


这项新功能被称为 "ChatPandaGPT ",它支持研究人员在浏览和分析大型数据集的同时,高效开展基于自然语言的问答,促进更便捷发现潜在靶点和生物标志物。英矽智能是首家在其人工智能药物发现平台中使用大型语言模型实现问答功能的生物技术公司。


图:英矽智能


英飞智药:PharGPT

英飞智药由北京大学前沿交叉学科研究院定量生物学中心的裴剑锋创办,致力于AI制药技术的系统性落地,旗下PharmaMind是集成人工智能和计算模拟设计技术的小分子创新药物研发平台。


2月15日,英飞智药宣布其与北京大学共同研发的药物设计版ChatGPT工具——“PharGPT”,现已集成到PharmaMind®客户端V3.8版本中。根据笔者体验,该模块主要通过输入smiles格式的分子,实现新分子的生成与片段替换。


图:PharmaMind


百图生科:AIGP


百图生科是由李彦宏发起创立的生物计算公司,致力于将前沿计算能力赋能生物医药,构建了千亿参数的跨模态大模型 “xTrimo” 。


3月23日,百图生科在北京发布生命科学大模型驱动的 AIGP——AI Generated Protein 平台,设置了三类功能模块,在较短时间内设计和生成具有特定性质的蛋白质。百图生科计划于2023年6月起将部分功能模块进一步开放,让专业用户可以直接自主使用。


图:百图生科


由于药物研发的复杂性,很多AI药企将“GPT”作为一个模块集成到研发平台中,还包括亲和力预测、晶型预测等其他模块,类似于GPT-4的多模态多任务的医药通用模型还有待落地。


正如Nature Medicine对ChatGPT应用于医疗保健的讨论:


尽管ChatGPT在医药行业的潜力是巨大的,但基于深度学习的语言模型在医疗保健中的大多数应用还没有准备好进入黄金时段。基于深度学习的语言模型的具体临床应用将需要对专家注释进行广泛的培训,以达到可接受的临床性能和可重复性标准。


通用大语言模型的奇点已经来了,生物医药版的还会远吗?


—The End—


推荐阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存