查看原文
其他

国家癌症中心郭强:肿瘤大数据平台建设与应用的体会与感受

龚晨、程格致 HIT专家网官微 2022-11-03

导读

医疗大数据的建设始终是“应用大于技术”,要追求赋能质量,而非追求赋能工具的水平和数量。

“构建一个协同高效、统一管理的肿瘤大数据平台,缩小与发达国家之间的癌症诊疗差距,从根本上提升肿瘤患者存活率,是实现我国肿瘤防治长期目标的重要手段之一。”
在2021年12月举办的第四届全国医疗IT创新研讨会(哈尔滨站)上,国家癌症中心、中国医学科学院肿瘤医院大数据办公室主任、信息中心副主任郭强从自身的工作经验出发,分享了我国肿瘤大数据平台建设和应用的情况,以及对于实现“健康中国”目标的重要性。

国家癌症中心、中国医学科学院肿瘤医院大数据办公室主任、信息中心副主任郭强
肿瘤防治需要大数据平台的支撑
“从各国癌症5年生存率对比情况来看,我国远低于欧美发达国家及日韩。”郭强谈到,造成这一差距的原因,一方面是由于发达国家与地区的癌症早筛普及率高,癌种与我国情况存在差异;另一方面则是他们凭借着率先建立的生物数据中心和国家癌症数据库,充分发挥数据应用的领先优势,更好地推进肿瘤防治工作。
根据《健康中国行动——癌症防治实施方案(2019-2022年)》,我国肿瘤防治的实施目标是:到2022年,总体癌症5年生存率不低于43.3%;到2030年,总体癌症5年生存率不低于46.6%。
据郭强介绍,目前国家癌症中心已构建起国家-省-地市-区县-乡村5级管理体系,覆盖人口接近6亿;同时,建设了国家癌症综合防控平台与国家肿瘤临床大数据平台,通过大数据技术与应用支撑肿瘤预防与规范化治疗。
“大数据正在开启信息化的第三波浪潮,肿瘤大数据平台的建设面临着新的机遇和挑战。”在机遇方面,郭强认为,数据标准、数据安全等方面的政策体系趋于完善;新技术簇蓬勃发展,数据处理和数据分析的速度得到极大提高,特别是二代基因测序技术的推出减低了基因测序成本,数据量大幅增加。从需求端来看,目前我国以心血管、肿瘤等为代表的慢病人群规模已超3亿人,科研数据量庞大,特征丰富、可靠,为医药和医疗的创新打下了扎实基础。
但挑战也同时存在。郭强认为:在数据标准化方面,医疗数据不完整、不规范、不准确、缺少关联等现象普遍存在;在数据挖掘方面,临床存在大量非结构化、自由录入的文本,现有技术利用数据的效率很低;在数据共享与安全方面,数据壁垒仍广泛存在,医疗数据的暴露风险居高不下。
对于未来肿瘤大数据平台建设趋势,郭强总结了4点展望,并用“1234”来概括。“1”是指“一个转变”,肿瘤大数据平台的服务重心将从以医院和医疗管理机构为中心的“肿瘤治疗”,向以全民健康为中心的“肿瘤预防”转变;“2”是指“两个多元化”,也即服务对象的多元化与技术发展的多元化;“3”是指“三个互通”,也即肿瘤大数据平台要实现与各医疗机构的数据互通、与区域健康信息平台的业务互联,以及与关键技术研究领域的成果互享;“4”是指“四个环节”,也即要特别重视数据采集、数据治理、数据赋能与数据联动环节。
其中,在“数据采集”环节,目前国内肿瘤数据平台的建设已经初步实现了从被动采集转向主动采集、从手工采集到自动化采集的转变;在“数据治理”环节,则要从目前的碎片化数据治理状态逐步演进为流程化、智能化的数据合规治理;“数据赋能”与“数据联动”两个环节的关键问题是要实现从“数据孤岛”走向跨云、跨业务的融合,通过医疗、医药、医疗器械的精细化管理有效赋能“三医联动”,同时推动围绕精准治疗的全球合作。
实践案例:国家抗肿瘤药物临床应用监测平台
在谈到肿瘤大数据的具体应用实践情况时,郭强以自己参与建设的“国家抗肿瘤药物临床应用监测平台”为例进行了介绍。
该平台始建于2019年,由国家卫生健康委委托国家癌症中心建设,目的是掌握我国抗肿瘤药物的临床应用情况,进一步加强肿瘤规范化诊疗管理,为卫生行政决策提供及时、可靠的数据。平台的监测范围覆盖全国31个省、直辖市、自治区的1400多家医院,主要监测抗肿瘤药物的采购使用情况、肿瘤患者临床诊疗和随访信息。
回顾平台的建设历程,郭强认为,在数据采集和治理方面,最重要的一条经验是“共建共治”。
郭强介绍,平台最初设计了16张不同维度的表格,下发到监测单位要求填报。“我们很快发现,这个方案是行不通的,报上来的数据靠我们自己的能力无法处理。”其中一个难点就是顶层设计与实际业务系统的标准转化问题,另一个难点是16张表单之间的逻辑关系问题。“因此,我们利用在各地培训的机会与监测单位反复沟通,认真总结各单位在工作中反馈的具体问题,重新调整了采集方案,将数据采集方式改进为以患者主索引为主,辅以单次就诊流水,通过患者信息+就诊行为两条线,将16张表的数据串联起来,帮助上报单位确定了要求、理清了思路,报上来的数据逐步变得可控、可用。”
“共建共治”的理念尤其体现在数据质控水平的提高上。“最开始平台收到的上报数据惨不忍睹,有的单位系统里连必填项都填不上来,按照质控标准都是不及格。”这项工作该如何继续开展,怎样才能提高数据质量,实现从30分到60分乃至90分的飞跃?
郭强认为,这需要有一个整体思维,要把主管单位、建设单位与监测单位当成一个整体,互相理解、互相信任。对于建设单位来说,团队既要能发现问题也要能解决问题:每一个质控规则都会根据不同地域、不同医院级别区别对待,冰冷的分数后面有算法,也有人情;同时通过建立“标准规划-上报-质控-整改”的PDCA流程,推进整个数据上报工作的正向循环。
经过两年的推进,目前平台的数据指标体系建设日趋合理和完善。依照数据完整性、数据唯一性、数据规范性、数据合理性、数据关联性、数据准确性、数据量等7大类、18小类指标,平台设立了496条数据质控规则,对监测单位的上报数据进行质检。在验收过程中,平台依照“分类验收”的原则,按医院等级、类型、对接方式等进行分类,不同类别的医院采用不同的验收标准。同时,平台实现了即时数据质控与自动化报告功能,可自动出具数据验收报告。
“通过定期向国家、省级卫生健康委反馈数据上报情况,向医院反馈数据质控情况,平台为我国的肿瘤防治工作提供了可靠的数据支持。”郭强介绍,随着上报数据的质量提高,国家抗肿瘤药物临床应用监测平台每年都会发布《国家抗肿瘤药物临床应用监测年度报告》,同时也为抗肿瘤药物临床应用合理性与可及性分析、抗肿瘤药物临床治理前组织病理诊断率分析等专项项目提供了数据支持。
面对当下“元宇宙”“数字孪生”等概念层出不穷的行业现状,郭强认为:医疗大数据的建设始终是“应用大于技术”,要追求赋能质量,而非追求赋能工具的水平和数量。“医疗大数据建设的最终目的,还要回归到为业务服务、改善用户体验、提高工作效率、实现价值创新上来。”
近期热文
HIT专家网∣致力推进中国卫生信息化长按二维码可申请加入HIT专家网专业交流群

寻求“商务合作”,长按二维码可快速与我们取得联系


投稿:gong_chen@HIT180.com

商务合作:(010)82373062


本公众号原创文章,版权归原作者所有。

未经许可,谢绝转载或以其他形式使用文章内容进行传播。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存