临床大数据趋势下,如何建立医疗数据标准和质量评估体系?
近年来,随着医疗卫生信息化的迅速发展,大数据在医药研发、疾病管理、公共卫生和健康管理等方面逐渐突显出优势。
对于研究型医院而言,对已有的临床数据的回顾性研究,是分析研究疾病最基本、最重要的研究方法之一。依托院内的临床大数据平台和临床数据中心,对历史数据进行回顾性统计分析,分析结果将为医生临床诊疗全过程提供疾病共享的发病及治疗总体情况信息,帮助医生科学决策,提高诊疗水平。
现行大数据研究趋势下,临床历史诊疗数据在进行科研分析时,如何面向临床专题分析制定专题数据标准,建立专题数据质量体系?针对临床科研需求,如何建立符合科研专项特点的数据质量评估体系?
上个星期,twt社区邀请了来自某大型三甲医院的专家分享了这方面的实践及研究经验(点击标题可回顾:《临床大数据趋势下,医疗数据标准和质量评估体系如何建立? 》),并与大家一起交流探讨。以下是本次交流中产生的问题及解答集锦,结合前述分享,对医疗行业同仁很有参考价值。欢迎大家阅读收藏及转发!
1、倾向与应用情况和数据质量的评级,并给出了数据质量评估体系,如何看待这一情况?
回答:数据质量是重要的量化指标之一,相当于其他主观评价数据质量更能从数据上反映医院电子病历的实际应用情况,建立数据质量体系,针对院内数据进行数据治理势在必行。
2、电子病历等级评审中数据质量评估包含的内容有哪些?
回答:电子病历评级的数据质量评分主要考察数据质量的四个方面:
1、数据标准化与一致性:考察对应评价项目中关键 数据项内容与字典数据内容的一致性。
以数据字典项目为基准内容值,考察实际数据记录中与基准一致内容所占的比例。一致性系数=数据记录对应的项目中与字典内容一致的记录数/数据记录项的总记录数。
2、数据完整性:考察对应项目中必填项数据的完整情况、常用项数据的完整情况。必填项是记录电子病历数据时必须有的内容。常用项是电子病历记录用于临床决策支持、质量管理应用时所需要的内容。以评价项目列出的具体项目清单为基准,考察项目清单所列实际数据记录中项目内容完整(或内容超过合理字符)所占的比例。
符数、特定的结构化标记要求内容进行判断。
3、数据整合性能:考察对应项目中的关键项数据与相关项目(或系统)对应项目可否对照或关联。按照列出的两个对应考察项目相关的数据记录中匹配对照项的一致性或可对照性。
4、数据及时性:考察对应项目中时间相关项完整性、逻辑合理性。根据列出时间项目清单内容进行判断,主要看时间项是否有数值,其内容是否符合时间顺序关系。
3、数据质量评价标准过多的情况下,作为医院系统建设时应该遵循什么原则?
回答:
在国家大力发展区域医联体的前提下,医院作为区域医疗的一部分,原则上标准体系应符合上级部门的管理要求。
4、如何协调统计不同厂商直接因为数据接口不规范产生的报表与HIS不一致问题?
回答:在医院上新系统前,由信息中心主导自上而下,先建立起院内的标准规范体系,以此体系来规范各系统开发厂商的开发行为,保证院内数据接口的规范性及标准型性。
5、医疗大数据标准和质量评估体系对智能导诊的推进作用?
回答:通过建立院内的数据标准和质量体系,可以帮助医院梳理出符合医院实际的诊疗数据,举例来说,对门诊诊疗过程的相关数据进行规范化和规范化后,可以建立院内的就诊知识库,结合历史的患者主诉和对应诊疗方案,可以帮助医院建立起符合医院实际的导诊模型,为患者就医提供便利。
6、数据中心能在检验、检查的实际业务中发挥什么作用?
回答:帮助串联起完整的就诊数据,关联其他业务系统的数据,以患者为中心将检验和检查业务数据整合到患者的就诊数据集中,同时也为检验检查业务提供个性化的决策支持。
7、医院临床大数据的质量体系业内是否有相关标准?
回答:数据元标准可以参考2011年8月国家卫生计生委统计信息中心编制颁布了《卫生信息数据元目录》;数据集标准可参考2014年5月30日国家卫生计生委统计信息中心颁布了《WS 445-2014 电子病历基本数据集》;其他卫生行业的业务标准与规范主要包括《病历书写规范(2010)》、《电子病历基本规范(2010)》、《中医电子病历基本规范 (2010)》、《住院病案首页 (2011)》、《中医住院病案 首页 (2011)》等卫生行业规范。2016年国家卫生计生委统计信息中心颁布《WS/T-500电子病历共享文档规范》,在结构上遵循《卫生信息共享文档编制规范》,并结合业务实际进行了细化和应用落地。该标准使用可扩展标记语言(Extensible MarkupLanguage,XML),遵循HL7 RIM模型,借鉴了国际上已有的成熟文档架构标准ISO/HL7 CDA R2三层架构,同时结合我国医疗卫生业务需求,进行本土化约束和适当扩展,以适合我国卫生信息共享文档共享与交换。
8、临床医疗数据有什么基于大数据的使用场景?
回答一:例如区域临床医疗数据可形成区域临床医疗数据中心、以数据挖掘为技术核心为卫生宏观决策提供支持。
基于真实医疗环境的大数据研究会给出真实的卫生经济学指标,为政府部门决策提供客观的数据支持,以更好的利用现有资源保障人民群众的健康,指导医生和患者选择适宜的治疗方案。
回答二:基于患者全诊疗流程数据的专病科研数据库平台。
9、医疗大数据质量的评估维度有哪些?
回答:
1、数据的完整性,表述数据是否完整,有无缺失和漏项;
2、数据的一致性,表述同一数据的同一属性在数据系统或数据集内是否一致;
3、数据的关联性,表述数据系统或数据集内数据间是否存在逻辑、数值、应用等方面的关联;
4、数据的有效性,表述数据是否满足应用系统定义的条件;
5、数据的唯一性,表述数据在数据系统或数据集内是否存在重复记录。
10、临床医疗大数据一般使用什么技术方案?与其他领域的大数据技术方案是否有区别?
回答:举例来说,一般临床大数据分析包括几个步骤:第一步对来自不同医院信息系统的病人数据进行数据集成。第二步基于CDR构造专题库,确定:符合疾病特征的病例;确定需要的病例字段,对于结构化的字段,需要从原始的电子病历库中抽取,例如年龄与性别,对于半结构化或非结构化字段,需要使用文本抽取等技术,结合知识库对其进行结构化。在这个过程中,需要建立知识图谱,以方便自动化的病例数据抽取。第三步需要对病例库进行数据质量评估,评估其是否适用于挖掘。评估指标包括数据完整性、一致性、医疗实体及其编码的一致性、数据精确性等。若病历库达到评估要求,即可进行第四步的数据挖掘,如果不能,则需要回到前面步骤,重新抽取和整理数据。第四步,确定挖掘目标,选择合适的模型,设计并实施实验。如果实验发生问题,可能需要改进算法,也有可能是数据质量缘故,需要回到前面步骤,重新抽取和整理数据。
11、针对医疗专题大数据分析建立质量体系的步骤有哪些?
回答:建立质量体系主要应集中在数据质量问题和数据质量评估方法的研究,不同的应用场景对数据质量要求应该不相同,步骤通常包括以下:
1、收集评估需求。根据临床医生定义、疾病的诊疗指南、相关文献等多个来源的需求,明确用户使用数据的目的和重点关注的数据。
2、确定和采集评估数据。根据评估需求,明确所评估的数据范围,抽取出待评估数据集。
3、建立评估需求与评估数据之间的映射关系。
4、提出质量评估指标。根据用户使用数据的目的选择评估度量或自定义评估度量。
5、执行数据质量评估,针对以上每个评估度量通过自动执行或人工评估进行数据质量评估,根据评分标准得到评估结果。
6、分析评估结果。根据评估结果分析数据集的质量问题,判定是否适合于研究目的。
12、建立医院内数据质量体系的必要性如何?
回答:随着医疗信息化的发展,各地医疗信息系统产生的数据日积月累,已形成规模较大的数据,是一笔宝贵的财富,其巨大价值亟待挖掘利用。然而,由于EMR数据来源于多个不同的信息系统,经历了多次版本变化,数据的统一表示、关联和集成存在各种问题。同时,医生录入缺乏语义规范,同一诊断与治疗方案,不同医生的录入结果会不同。另外,EMR数据产生于病人真实的诊疗情况记录,目的并不直接面向科学研究。一个诊疗质量良好的病人记录,未必可以产生满足科研需求的数据记录。因此,为了掌握EMR数据是否能够或是多大程度上能够支撑某一类临床科研,需要在做科研之前,对数据进行质量评估。评估结果可以用于设计与细化实验分析过程,或是未来用于改造医学系统,建立院内的数据质量体系。
13、医疗大数据质量不好核心问题是什么?应该如何改善?
回答:数据质量核心问题主要有3种,第一是数据输入性错误,虽然输入是符合逻辑的,但数据内容无法保证真实性;第二是数据一致性问题,即数据库保存的数据与实际不符,原因包括工作人员违规操作、数据转换错误等;第三是数据颗粒度太粗,数据无法反映现实情况。
通过建立数据质量体系可以解决上述问题。具体内容包括:
(1)建立保证数据质量的工作流程;
(2)对提高数据录入的环境和系统进行投资,如更新现有系统,降低界面录入的出错率,培训录入人员,增加新的技术和设备提高录入效率;
(3)制定元数据和标准化规范化的术语库,提高数据的准确性,便于检索和统计。
(4)建立数据质量监控指标,随时监测和管理医疗数据的质量;
(5)数据清洗维护。
以上内容主要由社区专家sandos分享并汇总,Jonsnwwang 亦有贡献。
欢迎关注社区 “大数据” 技术主题 ,将会不断更新优质资料、文章,您也可以前往提出疑难问题,与同行切磋交流。
大数据技术主题:http://www.talkwithtrend.com/Topic/37
医疗行业相关资料:http://www.talkwithtrend.com/Topic/4913
下载 twt 社区客户端 APP
与更多同行在一起
高手随时解答你的疑难问题
轻松订阅各领域技术主题
浏览下载最新文章资料
长按识别二维码即可下载
或到应用商店搜索“twt”
*本公众号所发布内容仅代表作者观点,不代表社区立场