上海大数据DRG推行记:基于大数据的公立医院的资源消耗合理性指数研究
根据切比雪夫大数定律,随着样本容量n的增加,样本平均数将接近于总体平均数,这是大数据对传统数据方法论的根本改变。
作 者
上海市卫生计生信息中心 曹剑峰
e医疗 郑序颖
文章要点速览
人类认识世界方式的发展大致分三个阶段,曹剑峰认为,方兴未艾的云计算、大数据、人工智能是第三范式计算科学阶段的具体表现。
从方法论上对传统的统计分析方法和大数据分析方法进行了比较。
从六个角度对传统DRG和大数据DRG存在的差异进行了分析。
依据海量数据资源、还原医疗服务流程,这是上海大数据DRG的研发思路。
上海大数据DRG的核心看点。
人类认识世界方式的发展大致分三个阶段:经验科学阶段(第一范式)、理论科学阶段(第二范式)和计算科学阶段(第三范式)。
在经验科学阶段人们通过对有限的客观对象进行观察、总结、提炼,用归纳法找出其中的科学规律。
在理论科学阶段以演绎法为主,凭借科学家的智慧构建理论大厦。
在计算科学阶段人类借助计算机的高级运算能力对复杂现象进行建模和预测。
上海市卫计委信息中心副主任曹剑峰认为,方兴未艾的云计算、大数据、人工智能是第三范式计算科学阶段的具体表现。
上海大数据DRG研发初衷主要基于三点考虑:
(1)研发基于病种的分析模型,最终形成完全量化可比的综合指数;
(2)形成公立医院医疗服务产出评价的“度量衡”;
(3)科学评价公立医院服务效率、技术水平、费用控制、资源配置的合理性。
一
方法论与DRG新思路
首先
从方法论上对传统的统计分析方法和大数据分析方法做个比较
传统认知中通过抽样分析对整个数据集进行预测和判断,要求采用的抽样样本必须是高质量的,否则预测出来的结果会出现很大偏差。系统各要素之间呈直接的线性关系,由解剖局部而知全局,析一发而知全身。追求因果性是小数据时代的产物,也是传统统计分析时代的理想和目标。无论是唯理论还是经验论,都是在寻求因果关系,区别只在寻求因果关系的方式不同。
大数据分析方法对数据进行全集分析,数据量足够大时,数据本身保证了数据分析结果的有效性,对数据的噪音也有一定的包容性,这是所谓的“大数法则”(见图1)给我们带来的理论红利。
图1 “大数法则”给实践带来的理论红利
根据切比雪夫大数定律,随着样本容量n的增加,样本平均数将接近于总体平均数,这是大数据对传统数据方法论的根本改变:大数据强调了事物间的关系,弱化了因果关系,成为了人类认识世界的新工具。
资料卡:切比雪夫大数定律
设x1, x2, x3, …, xn是一系列互相独立的随机变量(或两两不相关),它们分别存在期望E(Xk)和方差D(Xk)。若存在常数C使得:D(Xk)≤C (k=1, 2, 3, …, n),则对任意小的正数ε,满足以下公式:
在复杂世界里非线性具有普遍性,线性只是非线性的特例。由于非线性的存在,复杂系统的任何局部信息都不可能代表全局。因此面对复杂系统必须树立全局视野,整体把握对象。对客观世界的认知,人们往往期望在不了解具体因果关系的前提下直接利用其结果。
大数据弱化因果关系,强调事物间相关关系,并试图通过变量间的依随变化找寻它们的相关性,这使其更能反映客观真实世界,成为这个时代认识世界的新工具。对大数据方法论的有效运用也成为贯穿上海大数据DRG研究及推行的主线。
其次
我们再来看看传统DRG和大数据DRG存在哪些差异
虽然两者在核心计算方法上有相似之处,但既然传统DRG基于传统的统计分类方法,那就和大数据DRG还是存在一些关键的不同之处,主要体现在以下几个方面。
1 从分析方法来看
传统DRG分析方法是通过标签来区分归类不同对象,是抽样、线性概念;大数据DRG通过聚类分析方法,通过某种成团分析找出事物之间存在聚集性原因,不贴标签,契合客观、全样本的概念。
2 从分组数量来看
目前较为权威的DRG分组量一般在600~800种,且分组器扩展和更新迟缓;上海大数据DRG2017年版最终累积了涵盖连续四年超过1200万住院病人的32万多种病种和操作的分组组合,并且每年还将累积最新年度数据进行动态扩展和更新,尽量还原病种的本质。
3 从应用方式来看
传统DRG通过权重、费率来调整收费价格,形成差别化定价,但模式复杂、可对比性低,可视化效果差;大数据DRG以病种指数为度量衡,进而确定指数标准单价,可定义标准单价的费用结构标准,通过标准差衡定收费标准,因此相对简单,对比性高,可视化效果好。
4 从应用范围来看
传统DRG可以用于医保医疗费用控制管理、医疗机构绩效考核,并能形成专项的疾病管理工具;大数据DRG能够提供完整、系统的管理工具,涵盖绩效管理、费用控制、成本管理、预估管理、规模控制、资源配置等内容,方便各医院据此形成自身的建设标准。
5 从表现形式来看
传统DRG对各层面进行的比较、评价数据难以转化,大数据DRG可以通过大数据可视化提高对各层面评价、分析的数据转化率。
6 从覆盖范围来看
传统DRG未覆盖门诊,所以存在住院病种向门诊病种转移的应对策略;大数据DRG则有可能率先实现“住院+门诊”病种的全覆盖。
门诊DRG与住院DRG相比,既有门诊疾病手术和操作较少的优势,也有门诊诊断代码缺失的不足。
“为此上海于2017年上半年发布了《门诊诊断代码》,上海门急诊代码共有7.6万条,接下来会在此基础上进一步细化,首先门诊诊断代码在类目、亚目、细目上与新版国标ICD-10有对应关系,还同步把包括解剖部位,疾病性质等相关属性涵盖进去,更精准地反映门诊病种的真实情况。”曹剑峰介绍道。
完成以上基础工作后,上海有望通过门诊电子病历数据的采集,用大数据DRG的方法,通过门诊病种的全样本统计分析,最后产出门诊病种指数的分组标准,进一步厘清门诊病种人头与人次的关系,从而为真正实现门诊病种的“按病种收费”打下坚实的基础,为疾病从以治疗为主转为以预防为主的探索扫清障碍。
二
上海大数据DRG的核心看点
1 大数据DRG的数据基础
依据海量数据资源、还原医疗服务流程,这是上海大数据DRG的研发思路。
上海基于全市超过10亿份门急诊诊疗病历(含挂号、处方、收费、检查检验)、超过1200万份住院病历(含医嘱、收费、检查检验、出院病案首页、出院小结)、累计超过300亿条的各类明细数据,以大数据分析方法研发出了基于病种的大数据DRG分析模型,最终形成完全量化可比的综合指数,形成了公立医院医疗服务产出评价的“度量衡”,能够科学评价公立医院的服务效率、技术水平、费用控制和资源配置的合理性。
“目前的指数限定在住院部分,核心数据是依据病案首页数据,其中累积的住院费用近2000亿。”据曹剑峰介绍。
2 大数据DRG的核心概念和主要方法
理解大数据DRG要厘清这几个概念(见图2)。
图2 传统DRG与大数据DRG差异分析
第一是某病种权重(rw),用某病种组合平均费用除以所有病例的平均费获得该权重,是病种最小可计量单位,每年依据最新费用情况动态更新。
第二是某机构的总量指数(RW),通过把某一机构所有病种rw组合乘以与之对应的病例数形成小计,并对所有的小计进行累加后的总量。它既反映了某一医疗机构住院业务容量,同时也是重要的“数据桥梁“——是最后形成机构机构综合指数(CMI)以及机构指数单价的重要中间结果数据。
第三是公立医院住院综合指数(CMI),用某机构的总量指数RW除以该机构的住院病例数来获得。CMI可以比较客观地反映该机构收治病种和开展诊治技术的难易程度或“高度”,可用于衡量该医疗机构的医疗服务水平。
第四是机构指数单价,用该机构住院总费用除以该机构总量指数来获得。不同于传统DRG费率的概念,上海大数据DRG创新了指数单价的概念,它是反映医疗机构投入产出、资源消耗、服务效率的“核心度量衡”;也是政府对医疗控费、资源配置进行精细化管理的“重要抓手”和“调控工具”。
有了以上这些基本理念我们就可以在大数据DRG的主题框架下做很多标准的细化和扩展。
3 大数据DRG的主体框架下标准制定和细化
不同病种出院病例的标化工具,利用该指数可以实现不同医院医疗服务产出的比对。
一是细化了七类医疗机构的年度指数单价标准
按照上述提到的指数单价的概念,是通过把同类医疗机构的住院总费用除以同类机构的总指数来获得,是用来衡量同级同类医疗机构资源消耗和服务效率的重要分类指标。
二是病种指数和病种指数单价的基础上,在结构上进行了扩展
用上述同样的方法在病种层面,针对药品和耗材两个重要维度进行结构上的扩展,从而在病种rw的基础上在结构上形成了病种的药品rw以及病种耗材rw,再进一步形成病种指数单价、病种药品指数单价以及病种耗材指数单价,共六项细化的病种相关基本标准。
4 大数据DRG的主体框架下的数据展示思想
大数据可以用于对客观事物相关关系的描述。有了大数据DRG的病种数据以及细化和扩展的以年度为单位的相关标准后,在数据展现层面需要把管理需求和技术实现再进行充分的整合,形成数据展示的核心思路,数据展示的核心问题归根到底还是核心思路方面的问题。
从数据挖掘技术角度来看,至少可以从时间、机构、病种、药品、耗材等维度进行比较、下钻和展示,方法上虽然与传统的BI类似,但维度上基于标准做了很多细化和扩展。同时充分利用移动App作为发布工具,可实现有效信息的快速发布。上海大数据DRG通过信息化解决数据透明化和有效信息的快速传播,这也是实现数据价值的一条重要经验。
从管理维度来看,要融合管理思路对设计者提出了更高要求,也就是常言的“思路决定出路”,以下可作为进一步的思路拓展:
(1)医疗费用是平均指数、指数单价、总指数的综合体现。
(2)控制医疗费用就是控制指数单价、控制指数单价结构(特别是药品和耗材),控制医疗费用的关键是减少资源浪费,提高资源配置效率。
(3)对医院来说,通过CMI指数的上升,以及带来患者病例数的上升所造成的医院总量指数RW的上升,是最理想的医院内涵式发展路径,是政府愿意看到的,政府不会抑制这种正向的增长。与之相反,对医院来说,CMI指数在下降,小病种在增加以及带来患者病例数的上升所造成的医院总量指数RW的上升,是医院走外延式发展规模无序扩张的粗放式发展的老路,是政府不愿看到的,这部分负面的增长是政府要严格控制的。
结束语
新医改建立公立医院精细化管理制度,是医改五大制度的核心。医改已经走向深水区,步履维艰,这更需要正确的管理理念以及方法论的指导。结合信息化手段,才能发挥出巨大的管理效能,这也是目前第三范式科学计算阶段条件下所应该具备的现代化管理能力。上海大数据DRG的建设思路和关键实施路径,正是这两者之间的一次“亲密接触”,擦出了一点点火花,我们希望这一点火花可以成为医改的“星星之火”,期待医改新政燎原之势的早日到来!
-END-
文章来源:e医疗2017年第5期
推荐阅读
2017.09.12 深度
2017.11.15 评论
2017.11.17 评论
2017.11.23 深度
©以上文章来源
e医疗原创文章,转载请注明来源。
点击“阅读原文”
订阅e医疗2017年第5期