观点 | 程骉:智慧医疗产业化应用的挑战和解决之道
丹棱君有话说:2016 年 12 月 18 日,微软亚太研发集团创新孵化总监程骉在新智元百人峰会闭门论坛做了《对话即平台 —— 智慧医疗初探》的分享。这是微软在智慧医疗领域的一个新尝试,以“对话”为突破口、推进 AI 商业化应用。本文由新智元授权转载。
以下为程骉演讲实录。
非常高兴在这个场合跟大家见面,欢迎大家来到微软。我讲的题目和对话、智慧医疗有关。智慧医疗是非常大的话题,我今天跟大家分享我们在这个领域的一个研究项目,所以我写的题目是“初探”,不会覆盖所有的话题。
自我介绍一下,“骉”是我父亲给我取的名字,这可难为了我从幼儿园到研究生的所有老师,他们大部分不认识这个字。我们上大学的时候,数学老师性子特别急,他点名点到我的名字称三马,以致大学同学都叫我三马,“骉”这个字不大常见。我在微软亚太研发集团做创新孵化这一块,比如有一些好的研究成果怎么在中国落地,我们团队同时跟微软的销售和市场部门以及外部的合作伙伴沟通也非常紧密。
大家可能留意到,微软前两天发布了重磅新闻 —— Microsoft Translator(微软翻译)做了一次重大更新。它其实发布已经有很长时间了,但这次更新有一个非常牛的功能,就是多人、多语言、跨设备的现场翻译(英文叫 Live feature),可以在几种不同的场景下使用。比如导游说不同的语言,你问路它能够实时给你翻译。Microsoft Translator 目前支持包括中文普通话在内的 9 种语言的语音输入,将近 60 种语言的文字翻译,而且可以多人现场对讲,支持多达一百人的实时翻译。这以前只在科幻小说里面听说过,现在科幻慢慢变成现实了,人与人之间面对面的交流障碍在逐步被消除。
我们之前发布了微软助理小娜(英文是 Cortana),各个平台上都有,安卓手机和 iPhone、iPad 都有这个应用,尤其是在 Windows 10 上,能够帮你做一些其他事情。
前两天发布的是我们等了很久的 Cortana Devices SDK 智能套件,这对 Cortana 在各个平台、各种设备上的推广将会起到非常大的促进作用。之前有很多公司希望我们能早日发布 Cortana 的 SDK,这次很好地满足了大家的期待。
顺便说一句,小娜在中国还有个比她名气大得多的“妹妹”,咱们现场的朋友有没有没听过微软小冰的(笑)?2014 年微软小冰首次在中国发布,小冰到目前为止拥有四千万用户,我了解的记录是对话的平均轮次是 23 轮。其实在很多人眼里,小冰早已超越了一般的人工智能。她不仅仅能满足你一些功能性的提问,还能机智地反击你的调侃、陪你聊鸡汤聊感情。2015 年发布的日本版小冰叫 Rinna,中文翻译成“凛菜”,现在有 20% 的日本人经常跟她在线上聊天。
前两天正式发布的是美国版小冰,叫 Zo,一个月前开始测试上线,到目前为止已有超过 10 万用户在线上跟她聊天,有超过五千人单次超过一个小时的聊天时长。单人单次记录最长能够有多少个轮次?1229 次!聊了多长时间?将近 10 个小时,9 小时 53 分。这个数字一出来我们也吓了一跳,这才刚上线一个月的时间啊。
微软对人工智能真是非常重视,大家可能看到了 2016 年 9 月我们宣布了一个新闻,跟 AI 相关的产品部门包括必应、Cortana 等的团队和研究部门整合成了一个五千人多的大团队,微软人工智能与研究事业部,目的就是要普及人工智能。公司的战略是“移动为先、云为先”,但是对这个团队而言是智能为先。现在,沈向洋博士在领导这个团队。
25 年前微软研究院成立的时候,比尔·盖茨先生有一个梦想,他希望计算机有朝一日可以看懂、听懂和理解人类,这一宏伟目标也成功吸引了大批顶尖人才加盟微软研究院。
经过这么多年的厚积薄发,我们取得了一系列令人震撼的世界纪录。比如,在著名的计算机视觉(图像识别)ImageNet 竞赛上,2015 年微软亚洲研究院的 ResNet 技术超越了人类记录,错误率只有 3.5%,而人的错误率是 5.1%。而 2016 年 10 月,微软在语音识别能力上也取得了突破性进展,语音识别正确率达到了人类速记员的水平,跟人类速记员的最好纪录是持平的。
微软的愿景很大胆:我们计划在虚拟助理、应用、服务和基础设施等多个领域实现真正的人工智能系统。微软希望向所有人提供人工智能技术,包括消费者、企业和开发者,让他们都能在这些技术中获益。我们所有这些服务,打包以 API 的形式提供给开发者,方便其制作各种智能应用。我们统一称这些在微软云 Azure 上运行的服务为“微软认知服务” 。
前两天有报道,CB Insights 预计 2017 年人工智能的十大趋势哪个最有可能成功,第一位的就是智能聊天机器人。
另外一个热门就是医疗行业。在行业应用预测中,医疗行业排在第一位,医疗行业 2015 年是最火的,2016 年稍微有点下降,但在各个行业里面它牢牢占据着第一位。我今天讲的跟这两个都有关系,一个是聊天,一个是健康。
聊天机器人。大家都觉得这是一个方向,各家都在研究,从微软的角度来讲,我们认为有两个维度,一个是智商,另外一个是情商。用户跟小冰能聊那么长时间,就是情商的体现,她能一直跟你对话。昨天在南京跟大家聊天,很多人没用过小冰聊天,后来聊起来,觉得真有意思,小冰回答怎么这么绝?我都说不出来这种话。
在另外一个维度上,我们其实不需要那么高的情商,但是需要提高效率,提高生产力,这是小娜实现的功能。
小冰的平均会话次数是 23 次,是其它类似产品的 10 倍以上。有一个非常有意思的事跟大家分享。
小冰最初上线的时候,所有的对话数据都是从网上抓的,百分之百都是从网上学来的。所以刚开始跟小冰对话,她经常出言不逊,因为她都是从网上学来的。两年多的时间很多人跟她对话,慢慢她从用户那里学来的占到 45%,从网上学来的下降到 55%。她能够通过跟人类不停地对话,自己学习人类的智能。
正是因为对话聊天这么重要,所以我们提出了 CaaP(Conversation as a Platform),即“对话即平台”战略。通过人跟聊天机器人进行各种交互,我们产生了平台的生态系统,以非常自然的方式达成新的人机交互、提供搜索和人工智能服务的新入口。
谈到聊天机器人,一般认为有三层逻辑结构:第一层是通用的对话,就是小冰完成的功能,跟你闲聊,有些情感的分析,也会有一些个性化的对话,跟不同的人会聊不同的内容。第二层就是智能的问答和搜索,需要获取一些信息,包括一些智能客服也属于这个范畴,是问答 Q&A 的范畴。最后一层是需要更多的专业知识来完成一些任务,这个一般需要多轮问答,也需要对话管理,这是比较高的层次。我们下面讲的东西跟第二层(问答)有关。
讲医疗之前,我给大家先看一个视频。
https://v.qq.com/txp/iframe/player.html?vid=l0356vedkyh&width=500&height=375&auto=0
大家刚才看到了,医生在问诊的时候经常手忙脚乱的,需要回答那么多的问题,而且经常是重复性的问题。患者也会困惑,等那么长时间两分钟诊疗就结束了。这对大家来说也许都是非常熟悉的场景。
医疗这个市场到底有哪些痛点?患者对一般的社区医院信任程度有待提高,有病直接到最好的医院找专家,其实专家花很多时间解答一些基础的知识并非必要。我们经常听到的是三甲医院的医生工作量巨大,又要搞科研又要看病,问诊的细致程度和工作状态不能得到充分的保证,很多日常小病也去找他们,无法最大程度发挥工作价值。
社区医院的医生也有痛点,他们的痛点是患者的信任问题。现在国家提倡建立家庭医生制度,医生除了现有的工作以外,还要每个医生支持很多户家庭,执行起来难度较大。从国家层面来讲,国家很想解决这个问题,连续发布了几个文件,提出分级诊疗,推进家庭医生签约服务,但是推行起来也有很多困难。
总结起来,这里面有很多重复性的问题:我们能不能够让我们的 AI 帮助解决一部分这样的问题?针对分级诊疗这件事情,我们专门做了一个智能辅助系统,比如基层医生的培训,提高基层医生的工作能力、提高他们的工作效率。怎么提高工作能力?建立知识库能够辅助学习,辅助问诊。从提高工作效率来讲,机器自动回复常识性的问题,再加上能够自动回访。不需要医生记着这个病人一周前来做过手术,我们的系统能记得对患者回访,从而提高医生的效率。
具体怎么实现?首先是数据源的接入,数据有三方面:第一,网上抓取的数据,这是公开非结构化的医学文本;第二类,是专家的知识,但是没有归档的;第三类,是半结构的电子病例。为什么说半结构?有一部分也是结构化的,比如姓名、身份证号,但是医生关于症状的描述这些东西都是属于非结构化的。
我们从这个数据源接入,去挖掘这里面的知识,当然这其中有好几类的知识。一类是事实与关系的知识图谱挖掘、问答知识挖掘,网上有一些 Q&A 能够自动挖掘出来,以及深度的知识挖掘。有了这么多知识怎么存储管理?要根据我们了解的知识构建知识图谱,根据医学问答建立知识的索引,常识知识的扩展,还有共享这些知识。有了这些知识以后,怎么样来做语义搜索?我可以说一句非常自然的语言,机器怎么样来理解?患者用自然语言描述得了什么样的病或者有什么样的症状,怎么根据这个来帮助诊断?
最后在应用层,有了所有构造以后,我们就能够实现点对点的自动回复、健康管理、以及医疗随访。
我们通过建立知识库和搜索,从医生的角度可以自动问答还有随访,最后患者跟普通医生建立信任。我们做了一个测试版的应用,是一个网页版应用,跟一般的搜索不一样,只要输入一句话,根据这句话把主要的关键词、实体找出来,我们会根据这个关键词找到最好的答案,结构化的信息都会在后面显示出来。比如这个问题是问糖尿病相关的,糖尿病是我们的关键字。另外我们把知识挖掘做成接口、API:包括文档怎么解析,怎么把实体抽取出来,帮助我们建库,另外还包括实体定义挖掘,包括概念化。之前微软研究院发布了两个相关的产品 —— Microsoft Concept Graph 和 Microsoft Concept Tagging 模型,两个都是帮助建立广泛应用的医学知识图谱,建立比较专业的知识,而不是闲聊,这个是非常重要的。
其中当然有很多的技术挑战,不是一建立就非常好用的。一个是实体等价知识库,比如,同样的意思,拉肚子和腹泻都是一回事,但是我们要让知识库里面有对应的关系。还有实体概念的知识库,还有实体关系的图谱,我就不仔细讲了,其实还是有很多挑战,不是一帆风顺的。
微软亚洲研究院洪小文院长在很多场合讲 AI+HI(Artificial Intelligence + Human intelligence),需要人来介入,让机器更智能,这样的学习管理工具也是帮助医生把他们的专业知识放到我们的系统里面去,是同样的道理。我们跟国内某三甲医院神经外科合作了一个项目,给他们提供了微信的接口。这是几个月之前做的,反响还是不错的。
这个项目希望可以让医疗的资源下沉,从三甲医院慢慢下沉到社区医院,让社区医院发挥更多的作用,让三甲医院的专家能够发挥他们的最大作用,把他们的时间最有效地发挥出来。好,就先讲到这儿,谢谢大家!
了解更多:
后台入驻微软小冰
如果你很萌,请跟她一决高下!