【e医疗原创】朱杰:数据质量的流水不腐
e医疗专栏作家:朱杰
医渡云高级产品总监
引言
商业智能(BI)项目中有一句话“垃圾进,垃圾出”(Garbage in,garbage out),形容脏数据对BI系统的危害。对于长期关注于业务流程控制的医院信息系统,后台中脏数据的比例往往出人意料地高,很多医院是在BI系统建立过程中第一次意识到这一点。
按理说前端业务系统是基于传统关系型数据库技术建立的,而关系型数据库对“事务”逻辑的强约束能力应当能够对数据质量有所保障。无奈,现实生活是不完美的,人工录入界面的校验缺失、系统集成不充分造成的二次录入、未标记的测试数据、应用系统升级造成的数据结构改变、数据字典更新中对旧数据兼容的考虑不足等等日常点滴,都会不断加重业务系统后台的脏数据沉淀。
雪上加霜的是,项目压力之下的开发人员总能够想出各种补丁通过前端逻辑屏蔽脏数据,让软件功能看上去流畅运行,而后台数据仍旧源源不断地“泥沙俱下”。笔者在处理后台数据时,经常看到处方表里面的单次剂量、使用次数、使用总量之间的数据不匹配,报告单ID数据直接关联患者ID而非医嘱(申请单)ID,手术日期早于患者入院日期等等让人哭笑不得的后台数据乱象。
如果说业务系统中的数据各种缺斤少两还有前端代码的屏蔽,至少让使用人员看到的界面、表单是逻辑连贯的,那么少数上报系统的数据缺少了业务闭环约束,数据质量更是惨不忍睹,不知道有多少医院在用DRG分组器运行自己的历史病案首页数据的时候发现高比例的诊断编码与手术编码不匹配报错。
大数据时代,各个机构中沉淀的数据已经被升级到“战略资源”的高度。相对踌躇满志的大院长,不知道有多少信息中心主任忧心忡忡地看了看自己后台的“战略资源”:这成吨的数据里面有多少是优质的无烟煤,多少是点不着的煤矸石呢?
临渊羡鱼不如退而结网,点石成金的妙方是没有的,但是ISACA(国际信息系统审计协会)还是给出了“沙里淘金”的路径。
ISACA发布的新版本COBIT(Control Objectives for Information and related Technology,信息系统和技术控制目标)对信息治理的生命周期给出了下面的概念图示。
简单来说,就是只有当数据被转化为价值的时候,才有可能驱动业务流程和IT流程的优化,进而提高数据质量。举个简单的例子,如果DRG在可以预见的未来真的成为医保支付手段,机构必然会有强大的驱动力改进ICD编码的业务流程和信息加工流程。
不难看出,上述闭环的关键节点在于业务流程和信息流程的改进,与以往的IT系统支持流程再造不同,这里说到的改进是以发现和提升数据价值为驱动点的。对于医院来说,不是信息部门配合临床业务科室,而是业务科室配合医院数据战略,无疑这样的改进对于项目负责人的协调能力要求更高。
COBIT的建议是按照战略制定、人员组织、流程改进、技术支持的顺序展开工作;专职的数据管理人员(Data Stewards)利用数据管理系统从源头开始控制数据采集的规范性,并且对系统中运行数据对质量做持续监控,对于过程中发现任何数据质量/安全规则失效,要从业务角度而非IT角度给出应对策略。
一个良好的数据数据管理系统是上述流程实现的基础,这个系统不但能够制定和监控数据规则的落实,追踪数据的产生和更改,而且能够在多个业务系统集成时统一监控数据访问权限,实现数据的生命周期管理。
当然,不论是数据质量安全控制的宽度还是全生命周期管理的深度,任何一个方向的数据治理工作都不可能毕其功于一役。COBIT的最佳实践原则是,一次解决一个问题。最好的业务系统都不可避免地存在垃圾数据,数据治理是个长期的、没有止境的工作,重点看数据价值的提高和改进。先把基本数据生命周期闭环建立起来所谓“流水不腐,户枢不蠹”。
-end-
近期会议
最新日程|关于召开“2017 医疗 IT 创新研讨会暨医疗大数据发展论坛”的通知【红头文件】
©以上文章来源
e医疗原创文章,转载请注明来源。