「公开课」郑杰:探寻医疗数据碎片化的终结者
▲ 关注“健康点”轻阅读智库
医疗大数据是一个比较宽泛的概念,通用的环节分为采集数据、存储分析数据和数据应用。
点睛观点
1、我们希望自下而上的推动医疗健康数据的归还运动,抵抗医疗数据碎片化。
2、未来的时代,每个人会建立一个人体信息模型(body information model)。所以,从数据到信息,到最后产生知识,建立模型,然后基于模型来进行智能化的设备服务,这是一个大的演进路径。
3、医疗机构的数据开放决定了整个医疗健康产业生态数据的完整性,如何让医疗机构把数据开放给个人将成为医疗大数据非常核心的任务。
4、对医疗大数据行业要去深入了解,一定也要了解互联网、了解维基百科、了解通信、了解开源。
5、基因编辑和合成生物学将会是未来大热的领域。
演讲内容
医疗数据的采集形式在不断变化
浙江大学国际医院是树兰医疗的第一家医院。我本人是IT背景,在浙大国际医院的筹建过程中,希望把IT驱动和这家新医院结合起来。
过去,医疗数据通过望闻问切的模式传输到医生的大脑里,医生通过直接感知来获得数据,然后处理数据。
在信息时代,医生和患者之间多了一层数据的量化和采集。在数据驱动的时代,所有的医疗健康活动都离不开这几个环节——数据的采集量化、诊断的评估、治疗的干预,以及疾病的治疗和预防。
在这个过程中,一个人的医疗信息经常用一些术语来表达,比如,EMR、EHR、PHR。我个人认为,电子病历(EMR)偏重于医院内部的保存,EHR侧重于跨医院的数据档案,PHR侧重于个人对数据进行更多的管理,甚至个人可以录入数据。
医疗数据的内容和内涵也在不断扩展
未来,一个人的信息量是极其巨大的。既有来自全基因的数据,又有来自各个组学的数
所谓“n的1的大数据”是指,在时间尺度上,一个人终生的完整的数据是一个大数据。有个词汇叫时间生物学,就是说你的整个生理心理的一些指标随着年龄的增长发生的波动以及24小时之内发生的变化等等这些时间尺度。在空间尺度上,人群数据也是重要的数据。
在数据的尺度上面,一个人的多组学数据到跨人群数据使我们对医疗大数据的视角发生了重大变化
在数据的产生来源上,除了医疗机构以外,个人的数据产生会越来越多,产生的地点也会超越时空限制,即随时随地都会产生各类健康数据。同时,很多患者生病以后也会通过数据来对身体情况进行了解。
现在,不同的机构和大公司都很注重数据采集。不仅有大型医院内部的数据平台,也有大型公司,比如苹果公司推出healthkit,所有进入苹果手机的设备能和苹果共享一个数据池。但是把数据从苹果手机迁移到安卓手机就会很麻烦。
医疗数据价值的演变路径
在医疗领域里面,我们会提到数据的结构化,即结构化的文档。从一个非结构化的医疗数据到结构化的数据到最后渐入模型,我认为这是整个医疗数据的发展路径。
我认为,未来每个人会建立一个body information model,即人体信息模型。所以,从数据(data)到信息(information),到最后产生知识(knowledge),建立模型(model),最后基于模型来进行智能化的设备服务,这是一个大的演进路径。
当最终给每个人建立独一无二的人体信息数据模型时,才会做到真正的预测。欧盟已经有一个名为“虚拟生理人”的计划,就是建立一个基于多变量的动态的人体信息模型来预测健康。
因此,各个行业的玩家都会考虑如何获取一个人的完整数据,这叫数据生态。在过去的六七年,我个人一直投身到数据生态环境的产业,参与了一些区域医疗的项目。
在整个数据采集环节,最终会回归到一个人的数据如何进行完整的收集处理。所以从国家层面到机构层面到公共卫生层面,都会考虑数据共享的问题。
上面这张图是我在8年前参与一个区域医疗项目时画的,当时全世界都在思考数据共享的问题。最简单的方法是,由政府来主导建立一个数据平台,医疗机构、医生、政府、个人都把数据分享到这个平台上。
这个命题的背后是医疗健康数据的碎片化分布,它的核心是如何把数据汇总。目前我认为,美国在数据的合并方面,他们的方法学值得学习。
当时我们还参考了一个叫信息生态学的问题。如果把数据和信息当做一个生态系统来考虑的时候,这里面的关键物种还是医疗机构。医疗机构的数据开放决定了整个医疗健康产业生态数据的完整性,如何能让医疗机构把数据开放给个人将成为医疗大数据非常核心的任务。
在整个的生态环境里面,在未来的产业格局上,大型的医疗保险、医疗服务网络、HIT厂商、影像检验机构,都是医疗大数据的集聚地。大型医疗集团数据的统一性是大家都在关注的话题。
所以综合起来,不管是现在穿戴设备的数据还是医疗机构的数据,我们希望最终能汇总到一个个人手中。所以PHR基于时间和空间上的健康数据汇总整合是所有大数据基础的基础。
提倡新理念,打破医疗数据碎片化
正是基于这一点,我们萌发了OMAHA联盟这个想法。以前医疗机构之间分享数据很困难,那是否能提倡一种理念,就是都把数据拷贝还给拥有数据的本人。如果能达成共识,整个产业生态将发生巨大变化。
OMAHA联盟要做的事就是,通过自下而上的推动医疗健康数据的归还运动,来抵抗医疗数据的碎片化。我作为树兰医疗的发起人之一,我们办医院也会积极成为数据开放的核心成员。
我们一直在积极实践浙大国际医院作为一家医院,如何做到诊前诊中诊后基于医疗大数据来做数据完整性。
在杭州,我们正在积极地实践与丁香园之间基于OMAHA平台的数据共享。我们将我们的数据直接拷贝给患者。当我们的患者来到丁香诊所,患者可以把数据给到诊所的医生。当丁香诊所的患者转诊到我们医院时,也可以把他的数据继续完整的导过来。
人工智能离不开个人数据的完整性和有效性
关于智能化问题,IBM的沃森机器人应用于整个医疗产业,人工智能也将应用于医疗健康生态系统。人工智能的前提是数据的完整性和有效性。如果没有数据的完整性和有效性,关于人工智能的一切都是空谈。
所以树兰医疗在积极实践下一代医院的时候,我们将深度思考我们和产业界各个环节上的产品和产品供应商之间如何来真正共享我们的患者数据,当然这个前提是在患者知情同意的前提下。而且,真正患有重病的患者尤其是疑难杂症和罕见病患者,他们非常希望加入一个研究者网络,愿意共享自己的数据,来获得来自全世界的科学家和最新型治疗技术的治疗。
医疗大数据的时代我相信一定是开放的、不断迭代的,而且是全世界的医生、网络工程师、数据工程师、科学家协作推动来迈向智能化。
精彩对答
1、在医疗健康的产业生态系统里,共享信息的基础需求是什么?很多时候利益驱动格局是非常重要的基础动力源。
我认为,共享信息的基础需求是所有医疗服务、诊断服务、人工智能服务都要基于一个人的完整数据。如果不能基于完整数据,很多判断都是片面的。就像很多穿戴设备基于某些指标来做智能分析,也是有局限的。我们医院与各类穿戴设备厂商合作时,我们会将完整数据分享出来和合作伙伴共同开发和研究。
关于利益驱动格局的问题,我认为大家在面向C端上面会达成一致。之前B2B之间的共享存在很多障碍,但是在面向个人时是没有任何问题的。有些地方已经在开始制定政策来保证患者拥有复制自己医疗数据的权利。
2、医院在选择与医疗级可穿戴设备合作时的标准是什么?
实际上,选择的标准更多的是对这家公司的信心,以及评判产品的技术路线是否符合行业发展趋势。未来对大型医院来说,对各类穿戴设备厂商的对接是非常考验这家医院的水平的。
某种意义上来说,未来一家大医院对行业技术分析和公司的分析已经接近于一个VC的分析部门。
3、您怎么看医疗数据云存储这一趋势?
有件事非常敏感,就是由谁来做医疗云。是政府、某一家技术公司、还是某家医院?我觉得这要回归问题的本质,首先让每个个人拥有自己的完整数据,然后个人对各个医疗云平台做出选择。每个C端将成为医疗云的节点。
4、鉴于目前院内的相对静态的临床医疗数据和院外的相对动态的健康状态数据,如何结构化融为一体。
这需要技术来支撑。我认为,院内已经不是静态的临床数据了,诊中过程中本身就会产生连续数据。与院外的动态数据对接将基于一个专科一个疾病来构建。现在正处于一个百花齐放的时代,将来每个疾病的大牌专家或者教授都会发展他所擅长的疾病研究。
未来,有无数的公司在单个病种来做医院诊中和诊后的完整的服务体系和数据对接的时候,医院如何承接这种对接,以及以何种标准的技术接口来承接这种专业的公司,这是值得思考的。
5、相比医疗机构或一些大型检测机构,患者能拿到的数据可能有限,如果从下而上达到数据共享,如何解决数据的完整性和有效性?
很多患者就医以后没有及时拷贝电子化数据,或者以前纸质版病历本丢失,这让患者在数据的完整性上处于被动地位。我们在推动拥有数据的B端把数据共享给C端之后,C端拿到的数据就完整了。将来C端会把大约1T容量的数据存储在家里的硬盘里还是上传到云端,这要由C端决定。
为了让大家有更好的听课体验,来福君恳请大家参与投票为我们留下宝贵的意见哟~谢谢大家!(有彩蛋!)
- end -
周末愉快!
尝试回复关键词,查看更多
移动医疗 | 分级诊疗 | 社会办医
医药电商 | 网上药店 | 医疗改革
刘谦 | 赵衡 | 曹健 | 汤晨
回复“呼叫来福君”勾搭健康点嗷~
-END-
财新健康点出品
如需转载请注明来源
微信号caixin-life
↓↓↓点击“阅读原文”开启大健康全新之旅!