硬创先锋 | 这位清华女学霸做了件了不起的小事:让医院化验单说人话
从微软亚洲研究院、到欧洲微电子中心、再到百度研究院,回望医拍智能成立前的岁月,杨琼用了“在云端”三个字来形容。
智东西 文 | Lina
人工智能有一大一小两座黄埔军校,一座名为微软亚洲研究院,一座名为百度研究院。
在智东西此前《特稿:微软亚洲研究院英雄谱 主宰中国科技圈的半壁江山》《李彦宏的24门客:离开百度,野蛮生长》的两篇稿件中,已经详细梳理了两座研究院的前尘往事、缘起缘落、以及从中走出的各大AI玩家巨头们,此处就不再赘述了。
在对这两条支线的走访探寻过程中,一个名字吸引了我的注意。她不仅同时出现在微软亚洲研究院与百度深度学习研究院两大校友名单上,还是一所名为“医拍智能”的医疗+AI创企的联合创始人兼首席科学家。
医拍智能(原名“拍医拍”)的主营业务之一为运用计算机视觉进行医疗单据拍照识别,不仅可以准确的识别解读血常规、肝功能、肾功能、尿常规等医院常规检查项目的化验单,还能够识别相关的医疗发票,词条准确率达到96%。
医拍智能于2015年成立,2016年7月获3000万A轮,由重山远志健康基金领投,亿联资本、慈铭体检以及美国红点跟投;此前医拍智能还曾获得美国红点公司数百万人民币的天使轮投资,并且完成了从to C业务到to B业务的转型。
智东西来到了医拍智能的总部,与医拍智能的联合创始人兼首席科学家杨琼聊了聊。
一、两座AI黄埔军校
关于杨琼的故事,我们先从微软亚洲研究院讲起。
2002年,微软亚洲研究院研究院首次在计算机科研领域最富盛名的国际图形学年会SIGGRAPH上发表了4篇论文。随后的三年内,微软亚洲研究院迎来了它最为辉煌的岁月。2005年SIGGRAPH收录的9篇论文都来自于微软亚洲研究院,这相当于当年论文收录量的十分之一。
微软亚洲研究院不负众望地成为了当时世界上最受欢迎的实验室(hottest lab in the world),没有之一,是无数顶尖学术人才梦寐以求的研究场所。
而杨琼,也是这莘莘学子中的其中一个。
当然,眼前的机会越吸引,入门的条件也就越严苛。彼时刚从清华大学电子系博士毕业的杨琼在常人看来已经是百里挑一的顶尖学子了,可这回与她竞争的,是无数笼罩着同样光环的“别人家的孩子”。竞争异常激烈,入门条件极高。
“这一届两千多人,最后只录了我们两个。”
在院长李开复的带领下,当时的微软亚洲研究院吸引了包括张亚勤在内的一批学者回国,并建立起了一套完善的培养机制和创新文化——开放、分享、自由、学术,既能接受业界大牛的专业训练,又能培养自己的自由开放的研究思维,为杨琼打下了AI与计算机视觉的算法基础。
而一个更大的平台,同时也意味着一片更加广阔的天地,更多五彩斑斓的机会。
2007年,在一个偶然机会上,杨琼遇到了来自欧洲的计算机视觉大牛Luc Van Gool教授。
2007年,正是计算机视觉领域中“物体识别分类”技术的上升阶段。2007年,如今名噪一时的ImageNet项目才刚刚发起。2007年,计算机视觉与人工智能听上去还是个遥不可及的未来,让电脑识别物体仍旧是难上加难。2007年,如今的深度学习三巨头之一Yann LeCun还是纽约大学计算机系的一位普通教授。
2007年,杨琼接受了Luc Van Gool教授的邀请,来到欧洲微电子中心,进行当时最为前沿的物体图像识别分类研究。也正是在欧洲微电子中心,杨琼的AI知识第一次与医疗“触了电”。
机缘巧合之下,杨琼开始接触计算机视觉+医疗项目。比如当时的一个智能药丸(Smart Pill)项目,患者吞下一小颗“药丸”大小的颗粒,里头包含了微型摄像头、无线传输装置、计算芯片、照明系统、动力系统、还有电源。这颗药丸在患者体内录像、拍照、计算、最后传输图像并排出。
杨琼团队的工作就是将“小药丸”传出的6-10小时的视频进行前期处理、拼接、并通过计算机视觉对图像进行自动监测,检查体内哪里有出血/破损/息肉,而不是靠医生人工看完这些漫长的视频片段。
此外,杨琼还参与了医院内大型影像设备上的配准分割、医学视频中的计算机辅助诊疗、基于超光谱图像的皮肤病变早期检测等等医疗影像+AI的项目,让她能够将这些学术知识真正落地到实际应用上,也为后来的医拍智能埋下了种子。
而随着在2012年的ImageNet大赛上,多伦多大学的Geoffrey Hinton教授带领着团队使用深度学习进行机器训练与图像识别,错误率猛降至15.3%时——深度学习这个曾经被学界雪藏的概念,突然被重新推到了聚光灯下,猛底烧了起来;而且这一烧,就烧大发了。
在国内这一批AI弄潮儿中,走在AI最前列的正是百度研究院。2013年,李彦宏在基于原有多媒体部门的基础上成立了IDL深度学习实验室,主要针对深度学习在图像、语音等方面的研究。
而此时归国的杨琼作为首批人物之一加入IDL,成为国内首批使用深度学习进行模型训练、应用的AI科学家,主要带领团队负责深度学习的推广、自然场景中的文字识别、图片反作弊、百度翻译、图片分类等领域。
百度的经历一方面让杨琼对深度学习技术有了进一步的应用落地的经验积累,成为深度学习领域早期推动人,另一方面也让她更加了解中国互联网文化、产品和业界动态等。
从清华博士毕业、到微软亚洲研究院、到欧洲微电子中心、再到百度研究院,现在回头看来,杨琼用了“在云端”三个字来形容这些年的经历。大公司、大平台带来资源自然是其它环境所比不上的,但是她越来越觉得,在国内环境下想要真正让技术带来变革,还是需要落到地面上,甚至要亲自做些脏活累活,才能真正推动技术落地。
创业的念头自此萌生后,再结合此前在欧洲的医疗“触电”,一切便水到渠成了。2015年,经过共同朋友介绍,杨琼认识了同为百度系出身吴诗展(现任医拍智能创始人兼CEO),成立了医拍智能。
吴诗展是原赶集网首席DBA、技术保障部总监,国内的大数据专家。曾负责百度商业数据库团队,管理竞价排名、凤巢、网盟等和营收有关的数据系统;有着丰富的的大流量高负载互联网开发及架构经验,以及大数据管理和挖掘经验,尤其是高并发高可用性环境下的大数量运营。
(创始人及团队合影,上图中间为吴诗展)
二、成立之初与转型经历
就像无数其他创业公司一样,医拍智能在成立之初,也经历过一些波折。
2015年成立之初,医拍智能主打的其实是一款针对C端用户的App产品,普通老百姓看病时往往需要排好几个小时的队,拿着各种化验单等门诊,可轮到医生讲时三五分钟就结束了,患者无法详细了解自己病情。
针对这一点,医拍智能打造了一款医疗单据识别的APP,用户对自己的血常规、肝功能等医疗单据拍照上传后,系统可以识别出该项数据,并且给出相应的医学含义和养护建议。比如当你的白细胞数量上升时,它会告诉你白细胞的作用+上升这意味着什么;如果与此同时,你的红细胞数量下降了,它会结合两项参数一起给你综合的医学解释和养护方案。
6月17日,产品上线不到一周,“拍医拍App”在医疗类排名就达到76名,“最好的时候排到过30多名,一度超过阿里健康App”。
然而,2015年被无数人看好的“砸钱补贴”出来的C端市场有着它天然的商业变现困境,而随着2015年8月的股市大幅震荡,to C市场资本突然收紧,医拍智能本应在10月落地的A轮融资也因此而搁置。随后,医拍智能重新启动了新的融资接洽,并且开始重新思考公司发展方向。
转型之路,势在必行。
当时,医拍智能团队开始重新理清公司的优势和短板。他们认识到,公司的最大优势在技术,而B端用户对于技术输出的要求和付费意愿都要明显高于C端用户,所以需要果断调整战略方向,将工作重心从侧重C端转移到主打B端。
除了普通的化验单识别、病例识别外,医拍智能还在后续加入了医疗发票的识别功能,打造了一个提供医疗单据识别+信息汇 49 29250 49 14345 0 0 10690 0 0:00:02 0:00:01 0:00:01 10689总的平台型工具。医疗机构、体检机构、保险公司等等都愿意为此买单,不仅能够将原本人工录入的繁琐工作解脱出来,加快信息流动效率,还可以根据平台汇集的数据完善用户画像、优化相应产品。目前,医拍智能已经和慈铭体检、科研宝、部分保险机构等达成了合作。
现在医拍智能已经支持全国除了西藏、新疆等少数地区的大型医院化验单的信息识别录入,词条准确率达到97%;并且支持北京、上海等地的医疗发票识别,词条准确率达到96%,未来覆盖的市场将会进一步拓宽。
除了已经比较成熟的医疗单据识别业务之外,医拍智能目前还在拓展一条医疗影像领域的新业务线,通过深度学习、计算机视觉的技术,为放射科医生提供医疗影像(如X光、CT影片)辅助诊断,让系统告诉医生这张是肺癌病变图像,那张是良性肿块,降低医学影像漏诊率。
三、图文识别与医学知识库
医疗单据识别的核心技术是图文识别技术,这涉及到图像处理、机器学习、模式分类等相关技术,说起来好像非常复杂,但其实离我们生活非常近;比如车辆牌照的识别、名片识别等等。
但由于医拍智能是专门应用在医疗领域的图文识别,因此会比一般图文识别技术存在一些挑战:比如医学术语的识别与理解、病历/化验单照片比一般图片上的文字更为模糊,纸张也会更大等等。而医拍智能最近在拓展的CT、X光等医疗影像诊断新业务线则对图像处理、识别技术提出了更高的挑战。
文字识别清晰度等问题需要杨琼博士的团队对模型进行反复优化以提高效果,医学术语的识别与理解则要靠医拍智能内部的医学知识库储备了。
在医拍智能团队里,由联合创始人&医学专家杨劲松领导着的一个小型医生团队,专门负责医学知识库。杨劲松为原云医首席医疗官,有长达15年的从医经验,曾任人民医院医生、好大夫在线医学总监。
结语、日益火热的医疗+AI
从微软、到欧洲、再到百度研究院,杨琼的履历确实可以用“在云端”来形容。然而,在医拍智能,看着自己积累的技术确实能够落地到诊疗环节中,提高效率,优化就诊体验,这种创业公司所带来的拼搏感与成就感是云端生活所不能体会的。
从2016年开始,国内外做AI医疗成像分析服务、数字化医疗影像解决方案等的创企如雨后春笋般崛起,医疗也是大家普遍十分看好的一个深度学习落地应用领域,正在逐渐火热兴盛。
对人工智能医疗的需求主要基于几方面客观现实:一方面是优质医疗资源供给不足,成本高,医生培养周期长,误诊率高,疾病谱变化快,技术日新月异;另一方面,随着人口老龄化加剧、慢性疾病增长、对健康重视程度提高,医疗服务需求持续增加。
医拍智能没有选择从保守的体制内医院切入行业,而是选择了从相关的医疗机构、保险机构切入,一方面团队具备技术实力,另一方面有着从2015年以来一路积累下的行业资源支持,保证了一定的行业壁垒,在这片日益火热的医疗AI行业竞争中,找到了属于自己的打法。
延伸阅读
点击下方图片直接阅读
往期回顾
硬创先锋(2017)
共享经济
人工智能&大数据
VR/AR
汽车
聚焦特写
共享经济
共享充电宝真相:惨不忍睹
共享电动车卷土重来
失控的共享单车
企业观察