其他
7月11日,由世界生命科学大会联合组织主办,亿欧大健康、中企世博承办的“乘势·破局”2023AI大模型医疗场景应用论坛在北京圆满落幕。亿欧董事总经理、亿欧大健康总裁高昂在会上带来演讲。文丨毛文倩7月11日,由世界生命科学大会联合组织主办,亿欧大健康、中企世博承办的“乘势·破局”2023AI大模型医疗场景应用论坛在北京圆满落幕。亿欧董事总经理、亿欧大健康总裁高昂在会上带来演讲,并对亿欧智库即将发布的《2023AI大模型医疗健康场景应用研究》进行了预热。以下为演讲实录,内容略有删改:高昂:谢谢主持人。也谢谢各位嘉宾的到场,我代表亿欧感谢各位能够在炎热的下午来到会场,欢迎大家,谢谢!亿欧是一家关注科技与产业创新,在各个行业里面落地和应用的三方研究机构。我们在大健康医疗这个领域,一直以来关注整个产业数字化转型为基础,关注人工智能,关注数字疗法,关注机器人,关注创新医疗器械,创新药等等这些方向。其实过去几天挺忙的,上周五组织数字疗法的企业在北京一起探索了目前他们在商业、临床领域所遇到的困难,上周末又在世界人工智能大会的会场,发布了人工智能医学影像行业报告,同时联合一些合作伙伴,一起发起了AI制药、自动化实验室方向的行业研究报告。今天聚集在这里,共同来探索大模型在医疗健康场景的应用。我们有一个观念:新的技术在产业的落地,只有在产业里面实现了规模化、可持续的商业闭环,才能够更好、更快的惠及更多人,让大家享受到技术带来的便利和技术发展带来的红利。实际上这一轮人工智能行业的应用兴起,大概可以从十年前开始谈起。经过两三年时间,团队的组建,算法打磨,公开数据集寻找、训练的基础上,2016年左右,开始了这一轮比较规模化,各个行业场景里面的应用跟落地。过去这几年时间里面,我们也是从2017年开始发布第一份行业研究,到现在六七年时间,其实企业也走过一些弯路,包括也在资本加持之下,做过一些非常规模化的服务边界的扩展,又经历了回到聚焦核心节点上深入的探索。回过头来看,当前生成式AI的发展,从今年年初到现在不到半年时间,刚才谈到这些团队的组建,资本的涌入,包括很多大厂纷纷下场,包括很多应用场景都开始了非常快速的落地,比之前看到任何新技术的出现,带来的速度,落地应用的时间都要更往前赶。我们能够可见的是,大模型的应用对于现有生产力的提升,对于生产关系的变化,在这一轮全球数字经济的大浪潮中,以及整个产业正面对的数字化产业升级的过程中,大模型的应用都会是一个非常关键的节点性的事件。所以也是基于此,留给行业去进行观察和准备的时间其实并不多,这也是我们在这个时间点把大家聚集到这里,发起这样一个论坛,发起这样一个行业应用研究的基础。在这份研究(《2023AI大模型医疗健康场景应用研究》)里面,也是希望尽可能多的去呈现现在行业里面已经有的,对于大模型医疗健康领域的探索和实践。也希望在座的各位,包括伙伴们,在后面继续的支持关注我们,也希望能够把你们现在手中的尝试、情况分享给我们。如果大家感兴趣的话,也可以会后联系我。今天邀请到场的各位嘉宾,都是目前已经在大模型医疗场景有过实际应用和探索的企业技术口的负责人,所以在给大家带来分享之前,我先做一个简单的抛砖引玉。刚才提到,其实AI的发展之前是经历过几次大起大落的,过去几年反复提,每一次大落之后也会经历技术蛰伏的发展,每一次的大起都是带来了里程碑式的进步。上一次所谓的2.5寒潮是在2010年左右开始,整个AI技术发展也是经历了多轮准备,到今年出现了大模型。最开始1.0的AI早期更关注逻辑,更面对的是一些确定性的逻辑推打。2.0通过一些经验主义,更大面积的数据,可以在一定程度上用概率的方式解决不确定性,有了一定的智能化和决策的基础。在此阶段叫决策式AI。到了3.0,也就是这一轮人工智能应用的兴起,深入学习范式的兴起,以数据为中心,深层网络堆积为基础,实现模型达到类人类智能水平的阶段。其实这个时候就已经实现一些高质量的内容创作和自动化程度。再往后发展就是泛人类的智能,可以像人类一样执行各种业务。所以目前我们现在所谓的大模型,是处在一个3.0到4.0进化中的过程。在当下,生成式大模型是基于官方基础算法、预训练大模型、多模态技术融合的产物,通过已有的数据寻找规律,并通过泛化能力形成相关内容。从商业角度看,是一种赋能技术。通过高质量、高自由度、低门槛的生成方式为内容相关场景及生产者进行服务。预学习模型,遇到特定任务的时候把共性认知转移到任务中,实际上是对之前模型的尺寸,微调能力方面有了一个比较大的提升,也就是说没有办法做到又好又快又便宜,这三个是很难同时去实现的。在此基础上,当模型足够大的时候,更多的是通过知识中游获得高精度的认知。当数据不够的时候,所用的解决方法就是生成一些实例来配合模型。以GPT应用为例,目前大部分厂商通过的方式都是扩大模型的尺寸。然后就是多模态,这也是最近经常会听到的一个词,其实就是实现了单模态到多模态的转变,在前面的一个阶段,这些数据都是各自在各自的模型里面进行计算,多模态可以同时处理多种类型的信息,并且互相转化,形成一个认知的扩大,这样的能力。相信后面的嘉宾也会有更多的讲解,我就不在这儿去过多的进行展开了。这是国外的一些关于“ChatGPT在医疗场景下的表现”的测试。测试的结果显示,在不同的场景下,ChatGPT的表现结果是存在比较明显差异的。比如说在回答患有前列腺癌症患者问题的时候,模型的准确率很高,93%,全面性91%,易懂性百分之百,这是一个非常好的表现。但是看回答有关肝硬化和肝细胞癌问题的时候,正确率下降到70%,全面性下降到40%,这是一个不稳定的表现。然后在临床信息的检索和参考文献,正确率只有67%,参考文献只有36%可以找到,大部分是由ChatGPT生成,可用的比例并不高;在线医生的咨询对话中,这个表现还不错,跟医生相比,患者的评价其实都还是不错的。从这里面大概能判断出,大模型现在能力的范围,它其实取决于几方面:一是用来训练的数据是否足够翔实,二是是人类本身对这个问题的理解是否足够。另外一点也很明显,当你用于和非专业人士去进行对话的这个部分,比如说跟患者有关的,其实它的表现都还不错。但你涉及到跟专业的去进行对话,或者说学术层面,它的准确率和全面性还有很大提升空间。这是目前看到的一个ChatGPT的情况。回到国内,中国的决策实验已经接近世界一流水平,而生成式AI还存在着基础要素不足,就是算力,算法和数据,还有着比较明显的差距。但是通过论文数量来看,决策式AI已经接近全球第一梯队了,像腾讯,阿里,华为,国家电网都贡献了不错的学术方面的支持。但是在目前,不管是从模型本身还是数据,生成式大模型(与国外相比)还是存在着较大的差距。目前核心的问题就是缺乏优质数据,如果我们过往缺乏相关的专业内容,其实就会对现有的模型有很大的影响。尤其是高质量中文资料数据,会影响到在相关知识领域的能力。这里面放在全行业来看,存在数据孤岛问题,大的厂商在数据之间,是很难去打通的。回到医疗行业,这个问题可能会更突出一些,其实在人工智能前面发展的这些年,这个问题就已经非常凸显,目前还是处在一个很多数据难以打通,甚至出不了手的状况。但是也有好消息。其实国家对于整个医疗大数据建设的事情,一直是有计划并且也在尝试中。印象里面从2017年,国家医疗大数据中心就开始建设,但是发展到今天,我们看到的结果,可能都不是特别理想。但是就在上周六,国家卫健委能力建设和继续教育中心的马兆毅主任,她给我们分享了一个目前国家正在集中去建设的公开数据集的计划,已经做了有一段时间。而这个数据集的建设是通过临床视角,通过单科室单病种的方式,来去建设数据中心。目前看到已经有以中华医学会牵头来去进行的科研项目的方向的一个实例,列表里面已经有二十多个项目和三个可用的数据集。也就是说,在这样的工作不断探索跟尝试的情况下,未来在短期内还是有一定的机会,可以应用到从国家层面上,去推动医疗公开数据集的应用。我们也在探索和(国家卫健委能力建设和继续教育)中心的合作——这个名字看似是和教育教学有关,但实际上它唯一的任务就是去探索医疗大数据的应用。所以我觉得还是一个非常利好行业的事情。接下来就是简单的一些医疗的大模型应用场景,我在这里不做太多展开:首先是在影像层面,还有在药物研发方向,其实现在最显性的能够看到,大模型对于效益的提升在药物研发的场景里面是比较明确的。再就是医疗文本的处理,这里面百度,医联也都有相应的尝试。再有就是学术这个领域。其实目前能看到,大模型对于科研场景中能做的事情很多,我们也用几个国内大模型做过一些尝试,就包括给现有的论文,一些文献去做一些综述和数据分析。但是测试下来,现在水平还没有办法达到直接可用的状态,还是有很多可以提升的空间。同时这里面也面临比较多的风险跟挑战,这些挑战来自于可信度,抄袭,透明,权威,数据隐私等等。所以实际上我们看到的大模型目前还是处在一个应用快速地发展,很多问题在发展过程中不断出现并不断被解决的状态之下。6月27日,北京市首批十个人工智能大模型案例里面有两个是跟医疗有关的。可以看到,企业层面上在做很多积极的尝试,推进的速度也是非常快的。关于综合类人工智能模型,其实是存在比较大的潜力空间的。按照从临床视角上来思考的逻辑,成像数据,非成像数据,基因组学,蛋白组学,结合病人的临床病史和一些实际诊断的影像数据,把这些数据放在一起,可以通过大数据的算法,生成对于患者和医生来讲更有可用性、对健康状况的解读更全面的完整报告,这对临床而言具备非常大的价值。从需求视角来讲,也期待着大模型的落地能够帮我们更好的去在实际应用的环节起到一些帮助。所以,接下来我们会按照上述的逻辑和一些想法,在大模型有可能应用到的场景里,像诊疗,健康管理,科研,区域化和片区化管理,包括像制药企业本身数字化需求等等,去开放案例的收集。也希望在座的企业后面可以跟亿欧保持互动,把你们最新的探索能够随时同步给我们,来确保这份研究能够更快地、更有效地去起到推动行业发展和落地的作用。接下来就把更多的时间交给后面的嘉宾了,我的分享就到这里,谢谢大家!本文首发于亿欧网2023年7月13日文中提到的《2023AI大模型医疗健康场景应用研究》预计将于8月正式发布,亿欧智库现面向医疗健康产业各端征集应用案例,欢迎您将所在企业的探索与实践分享给我们,也欢迎您与我们交流您对行业发展的宝贵见解!【案例投递请扫码】