导读医疗大数据的建设和应用需要转变观念,健康码为多源、异构、非标数据的整合利用提供了范本。
新冠肺炎疫情期间,防疫健康码被广泛应用,并发挥了重要作用。它融合了多部门、多来源的数据,超越了传统医疗大数据的概念,带来了医疗大数据新边界的思考。
在2020年6月7日由中国医院协会信息专业委员会(CHIMA)、《中国医院》杂志社联合HIT专家网共同主办、戴尔科技集团协办的“后疫情时代的医疗数字化转型之旅专家访谈”中,CHIMA主任委员王才有、解放军总医院医疗大数据中心主任薛万国和戴尔科技集团大中华区售前系统工程部解决方案架构师姜永凯,共同探讨如何重估医疗大数据概念。HIT专家网主编朱小兵主持访谈。
“防疫健康码,很多人认为它是一个码,实际上它是一个人的健康状态的标志数据。”王才有主任表示,健康状态的数据是多个来源的,既有医疗机构的检查、检验、诊断等数据,又有公共卫生机构的流行病学调查,还有个人信息、出行数据等来自其他系统的数据。那么,将这些多源、异构、标准不一的数据收集起来后,如何应用才能真正反映出一个人的健康状态呢?防疫健康码就是大数据的具体应用案例,它解决了多源、异构和非标数据的整合利用问题。
王才有认为,防疫健康码的应用离不开三个要素:一是要有一定的基本数据基础;二是要使用新的技术手段进行集成整合;三是体制机制的形成,抗击疫情的特殊需求,加快了体制机制形成,推动了跨部门数据交换与共享。
“防疫健康码给我们的启示是,在做大数据建设和应用时要转变观念。”王才有进一步解释道,“过去我们认为,只有统一规划、统一建设、统一标准的数据才能进行大数据应用;但现在我们看到,在数据标准不一致、数据来源多样化、数据含义也可能不一样的情况下,在特定条件下,这种大数据的应用问题还是有办法解决的。”
王才有主任认为,以前谈到大数据的本质和特征时都会突出“5V”,实际上这只是大数据的自然属性,过去我们忽视了大数据的社会属性。大数据不是自给自足的生产方式,它是通过社会化生产方式,而非通过某个机构生成的。尤其是医疗健康大数据,它肯定是多源的、分散在不同机构的、不统一的,但我们可以借助创新的技术和管理手段、创新的体制和机制去解决这个问题。
不过,从数据安全的角度看,很多人担心,数据集中在一起,不仅增加了安全风险,也增加了隐私保护的难度,很容易成为攻击的目标而被突破。
“这样的担心可以理解,但实际上,大数据的安全问题完全可以解决,我们要有信心。”王才有主任认为,首先,目前大数据的安全问题还不突出,之前发生的很多安全事件都是医疗机构内的“小数据”安全问题,真正大数据的安全问题尚不多见;其次,“大”虽然容易成为攻击目标,但它的防范能力也可以做得“大且强”,做得更安全,这与“把钱放在家里安全,还是放在银行的保险柜里安全?”问题类似,答案不言而喻。
当然,大数据安全与常规的数据安全确实存在不同之处,因为大数据的来源多,突破了围墙的限制,不再是“我的地盘我做主”,需要创新发展相应的技术手段、组织手段和制度设计手段去解决。
近年来,越来越多的头部医院,特别是研究型医院,都在推进医疗大数据的利用和研究,并希望在科研和临床中发挥大数据的价值,提升临床的获得感,让医患都能够受益。
对此,薛万国主任认为,医疗大数据最核心的内涵是数据分析,数据分析的目的是为医疗服务,即通过数据挖掘发现一些规律,再应用这些规律指导临床工作。医疗大数据通过数据分析后,通常会有三种产出形式:一是洞察,通过大量的病例研究发现并总结规律,发表论文;二是评价,对医疗质量和医疗行为进行评价,通过对大数据的研究分析,建立一套持续改进医疗质量的机制;三是应用,发现规律后建立模型,并把模型嵌入临床信息系统中,通过模型来预测一些疾病或不良事件的发生,或通过建立人工智能的模型应用到临床诊断中,指导医疗行为。由此形成院内医疗大数据的闭环,从临床中来、到临床中去。
“要想把大数据真正利用好,首先在于临床医生要有创新的问题和创新的思路。同时,数据质量非常重要。”薛万国主任谈道,比如在基础数据方面,临床研究要求数据一定要全面、数据质量一定要高,但在实际应用中经常遇到“捉襟见肘”的情况。薛万国主任举例道:“比如前一段在做ICU的数据分析,我们自认为ICU的数据质量还是比较好的,心率、脉搏、血氧等监护数据都有,但到真正做的时候才发现还缺少‘血气分析’的数据,这个设备的数据恰恰没有实现数字化采集,而是打印纸质报告。”
目前,真正能在临床开展并落地的研究和应用的案例还比较少。王才有主任认为,医疗大数据应用之所以“曲高和寡”,根本原因在于医疗大数据应用还面临诸多困难:
首先,在体制机制方面,限制了大数据的共享和流动,价值难以发挥出来。
其次,在技术方面,大数据平台的应用时间只有几年而已,技术上并不成熟,还有很多信息交换的互操作性问题尚未解决。
第三,在组织机构方面,真正设有大数据中心的医疗机构并不多,很多医院的数据资产还分散在个人电脑中,得不到利用。
第四,在人才方面,大数据应用需要复合型人才,既要懂计算机和数据分析,又要掌握统计方法学,还要能跟临床业务结合,而人才培养绝不是一朝一夕能解决的。
如何改变“曲高和寡”的局面呢?薛万国主任建议,首先,要通过具体案例提升业界对大数据的认识和理解,比如开展一些培训、比赛等;其次,通过一些优势学科或优势学科的联盟,以联盟共享的形式,解决数据收集难题,并带动整个联盟或医联体的数据利用;第三,扩大数据研究成果的应用范围,不能仅应用在大医院,还应转移应用到基层医院或医联体的其他医院,在广泛的应用过程中再不断发现问题、不断改进和提高。“总之,要从一些点、一些线上去突破,再逐步往面上推广开来。”
医疗大数据平台与以往的医疗信息化建设项目有所不同,它要打破原来的数据壁垒,在信息系统互联互通的基础上,跨部门、跨组织地进行数据收集、数据交换和数据价值的共享。
“医疗大数据平台是释放医疗数据资产价值的融合平台,也是数字新基建的重要内容,新基建很重要的理念是融合创新。”姜永凯认为,未来的医疗大数据平台将有很多融合创新的需求:一是融合原有信息系统,进一步打通原有烟囱式的信息系统;二是从边缘到数据中心、再到云端的融合创新;三是业务模式的创新,比如从医联体、分级诊疗、大健康等角度看,需要更多跨组织的ICT平台实现数据整合与分析。
未来的大数据平台不只是一个基于Hadoop的分析平台,它更多的是基于全量数据分析,具有实时共享、实时解决问题的能力。“戴尔将在不同层面发挥价值,帮助医疗大数据平台更好地服务于临床、科研和管理。”姜永凯表示,在基础架构层面,可帮助解决数据的产生、传输和互通问题;在分析层面,应用自然语言处理、图像识别等AI技术挖掘数据的价值;在安全层面,做好数据安全、隐私保护及数据的长期归档管理等。
此外,戴尔还将投入更多的资源进行大数据的生态建设,在信息技术的不同层面与更多的合作伙伴进行融合创新,帮助医疗机构实现数字化转型。【点击观看访谈视频】
HIT专家网∣致力推进中国卫生信息化长按二维码可申请加入HIT专家网专业交流群投稿:gong_chen@HIT180.com商务合作:(010)82373062