解读|语音巨头科大讯飞如何布局人工智能+医疗?
近日,科大讯飞智慧医疗事业部常务副总经理、贝壳大学创业导师鹿晓亮先生接受了贝壳社专访,深入解读语音巨头入局智能医疗的布局和野心。
以下为采访全文实录。
科大讯飞智慧医疗常务副总经理 鹿晓亮
科大讯飞为什么选在2015年这个时间节点进军医疗行业?
鹿晓亮:
其实讯飞早在2010-11年左右就开始探索医疗,当时的规划只是语音技术在医疗中的应用,因为欧美在这方面的应用已经非常广泛—— 美国医生已经养成习惯,在给患者做检验检查和诊疗的过程中,用语音做记录,也有专人做转录。但这项技术当时还不够成熟,在国内的普及度也不够高,讯飞第一次进军医疗的尝试搁置。
2015年第二次进军医疗,很大程度是源于我们对技术的判断。深度学习技术成功应用于语音和图像识别大概是在2010年后,发展到2015年底,准确率已经大幅提升,不管在电子病历书写还是在阅片上都达到了应用的临界点。讯飞自身的技术也日臻成熟。
我们2014年第一次参加国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation),就拿到中英和英中互译方向的第一。
后来我们又参加了国际语音识别大赛(CHiME),国际认知智能测试(Winograd Schema Challenge)和国际知识图谱构建大赛(NIST TAC Knowledge Base Population Entity Discovery and Linking Track),都拿了第一。
一直以来,科大讯飞都在构建图像识别、翻译、自然语言理解等跟人工智能相关的核心技术,并在此基础之上构建了人工智能平台,在平台上再构建若干个赛道,比如在教育、汽车、智能家居、智能客服,这些领域中,我们都有相当成熟的应用。
背靠这些核心技术构建的人工智能平台,迁移到医疗领域是自然而然的事情。
那么到现在这个时间节点,科大讯飞布局的三个赛道——医疗+智能语音、医疗+智能影像诊断和智能辅助诊疗各自的技术成熟度如何?推广落地的过程中遇到了哪些困难?
鹿晓亮:
语音技术相对成熟,通用的语音识别准确率已经达到95%左右。虽然医疗中很多专业词汇,但只要机器人接收到这些信息,它学起来就非常快。医疗毕竟还是一个很明确的细分领域,因此语音技术应用到医疗的准确率实际上比95%更高。
讯飞目前的语音解决方案已经在全国50多家医院投入使用,我们的产品经理团队也做了大量的工作,和医生不断的磨合,探索如何把语音识别融入医生的工作流程:比如语音转录文字之后,还要形成结构化的电子病历,因为这才对提升医生工作效率有真正的价值,特别在医生双手被占用,但又需要做记录的时候,语音技术都有很强的应用场景,比如B超、内窥、手术等等。
图像识别技术的准确率目前也达到了较高水平。但医院的影像数据比较闭塞,数据孤岛普遍存在,这都给技术提升带来了一些麻烦。
另外,影像识别技术的商业和收费模式都还在探索中。目前看来,商业模式的创新需要有一定影响力和社会资源的公司,联合医疗机构和政府一起推动。因为这已经不是一个技术问题,所以对单靠人工智能技术的创业公司来说,难度会比较大。
相较语音技术和图像识别,辅助诊疗系统的成熟度要差一点。因为辅助诊疗要学习教科书、文献、病历等文字材料,这些都和自然语言理解技术相关,而目前自然语言理解技术(Natural Language Processing,简称NLP)比语音和图像识别的成熟度要低一些。
科大讯飞把语音和图像识别定位为感知智能,而跟人一样能理解、思考、推理的功能是认知智能。自然语言理解技术就属于认知智能,很多人把自然语言理解当做人工智能桂冠上的明珠。
讯飞的三大定位有很强的层次感—— 语音技术是成熟度最高的,影像次之,也达到了应用前夜,辅助诊疗相对挑战更大。
辅助诊疗系统在上世纪五十年代就出现了,70年代美国斯坦福大学研制的第一个辅助诊疗系统MYCIN还名噪一时,但它的商业表现其实并不好。直到现在,全球的辅助诊疗市场也就4亿美元左右,且主要集中在欧美国家,中国起步较晚。
但不可否认,辅助诊疗是市场刚需。现在是国家推动分级诊疗的关键时期,中国基层医生的能力又普遍偏弱,他们非常需要辅助诊疗技术来赋能,提高问诊和治疗能力。
历史上,辅助诊疗的产品形态大致分两类—— 要么集成在HIS、EMR等医院原有的信息系统之上,要么自成一个独立的系统,医生在日常工作之外,还要在这个系统内输入患者数据,才能查阅到相关资料。因此,目前最难的是如何设计一个无缝切入医生工作流程的产品,在医生自然工作的过程中提供帮助,而不需要医生再做重复动作。在这一点上,目前世界上没有任何一款成熟的产品可供参考。
另外,原来的辅助诊疗是专家系统,靠人类专家整理出来的规则输入推理引擎,其最大的缺陷就是自动学习能力太弱,但医学发展得太快,治疗方案日新月异,专家系统依赖人工更新的工作量太大。
讯飞理解的辅助诊疗是可以通过自然语言处理技术,自动学习大量文献——教科书、病历、临床指南等,形成自己的知识体系,遇到新的病历和患者数据可以给出自己的建议。人工智能辅助诊疗的另一个问题是学习资源的权威性和可靠性,这也是辅助诊疗系统投入使用后,是否能真正帮到医生的关键因素。
讯飞现在清晰意识到了这个问题,正在通过和人民卫生出版社、万方等对外战略合作整合更权威的资源。我们自主研发的辅助诊疗系统机器学习了五年制大学人卫医学本科教材、真实的电子病历、临床指南和病例报告,也包括一部分执业医师资格考试的模拟题。我们的想法是,要先让机器通过人类的医学考试,再去帮助基层医生。8月底,讯飞和清华联合研发的人工智能“智医助理”机器人就在北京参加临床执业医师资格考试的笔试评测。
对整个医疗+人工智能行业来说,目前主要的发展阻力又有哪些?
鹿晓亮:
在我看来,目前行业最缺乏的是三点:第一是医疗和人工智能结合的复合型人才;第二,是医疗信息和数据的标准化,虽然国家和一些民间组织也在制定一些标准,但是标准本身的完备性是一个问题,是否有上层的行政力量去推动标准的执行也是一个问题。美国电子病历的普及就是行政力量多年推动的结果;第三,虽然国家目前已经开始在地区层面推动信息平台建设,并有相应的规范和指导意见,但医疗信息数据孤岛和烟囱广泛存在,医疗大数据生态尚未形成。
医疗信息化厂商、互联网医疗公司以及医疗+人工智能公司各自发展的时期不同,基因也不同,但目前都在向人工智能积极布局。您认为三者谁会在发展中占得先机?
鹿晓亮:
我认为可能还是人工智能基因的公司。传统医疗信息化公司通过HIS,EMR等系统在医院占据了先机,要舍弃已有的市场和业务模式,再投入巨大力量做人工智能,对他们来说是很大的抉择。
人工智能公司没有历史包袱,切入的时候不会考虑做HIS或EMR,而是构建一个新的生态,要么构建在原来HIS和EMR之上,要么与之并存。
我认为互联网医疗本身就是一个伪命题。因为互联网和任何一个行业结合的前提都是供给侧过剩,在这种情况下,互联网的确能解决资源配置的效率问题。但医疗行业的供给侧本身极度短缺,在这种前提下,互联网提升效率是个伪命题。与之相反,人工智能是从供给侧来解决问题的。
当然,有这么多做人工智能的公司,业界和资本也都关注人工智能,这对推动行业来说是件非常好的事情。到底是谁能够真正占得先机,还要考虑一家公司技术的领先程度,综合实力,对商业模式创新的推动能力。其实大家都有机会,但对纯技术驱动的创业公司,可能风险更大,因为这已经不是一个光靠技术就可以驱动的行业。
在您看来,人工智能发展到一定阶段,是否有可能完全取代医生?
鹿晓亮:
机器有机器的优势,人有人的优势。现在人工智能的发展阶段还处在典型的弱人工智能—— 在某一特定领域,人工智能可以做得很好,甚至超越人类,但它不具备通用性和扩展性。比如AlphaGo下围棋可以赢过柯洁、李世乭,但是它完全不具备下国际象棋的能力,这就是典型的弱人工智能。
这恰恰是机器可以和人互补的地方。所以我认为,人工智能后续发展的一个比较理想的状态是人和机器协同工作。不是说影像科的医生被人工智能替代了,而是影像科医生在机器的辅助下,可以喝着咖啡就把很多患者的片子看完。
7月9日,科大讯飞、贝壳社、复星医药、德勤咨询、思创医惠、荣之联、Boston AI、浙江知识产权交易中心、杉杉医疗等单位联合发起成立健康产业人工智能技术创新联盟,科大讯飞背后的考量有哪些?
鹿晓亮:
人工智能和医疗结合还是处于一个相对早期的阶段,需要行业、业界和学术界共同关注和推动,联盟就是一个很好的平台,让相关公司和机构聚到一起来探讨和发声。
拓展阅读
科大讯飞与人民卫生出版社达成战略签约 共望人工智能+医疗美好前景
文 | 贝壳社 编 | Pink