查看原文
其他

Hitachi Vantara:以影像数据为切入点,激活医疗机构的数据自主能力

龚晨 HIT专家网官微 2024-01-09

导读

将影像数据作为基座,集合结构化与非结构化数据形成数据湖。

当下,医疗机构正面临着数字化转型、高质量发展的重要任务。从相关政策要求来看,政策倡导的公立医院高质量发展,实质是“数据驱动下的高质量发展”。医疗行业的未来发展需要什么样的数据,以及什么样的数据能力?面向未来的医疗数据管理之路应如何探索?Hitachi Vantara(日立数据)医疗行业解决方案专家分享了Hitachi Vantara的思考与实践:以影像数据为切入点,全面激活医疗机构的数据自主能力,把握医疗数据的主动权。

基于VNA理念的“医学影像大数据中心解决方案”

在医院数字化转型的行业背景下,将原本分散在各业务系统中的医疗数据整合起来,以患者为中心进行统一管理,形成完整的患者数字画像,将对临床业务与医院管理起到非常重要的推动作用。

当前,医疗机构已积累大量医疗数据,这为基于大数据的患者画像提供了基础。不过,要想实现这一目标,Hitachi Vantara认为至少面临三类挑战:首先是跨业务系统与应用的数据抽取与加工,其次是数据集成、存储与检索,第三是数据的深度分析与洞察。特别对于医学影像数据而言,由于其数据来源多样化,磁共振、CT、DR、超声、核医学、内窥镜等都会产生医学影像;而且数据呈现多模态,各医学影像系统间缺乏统一的记录与接口标准支持,部分专科系统的医疗数据结构复杂,因此管理难度更大。从目前医疗数据相关技术的发展情况来看,其对结构化和文本医疗数据的抽取、集成、存储、治理、应用等方面的支持已较为充分,但对医学影像数据的支持还需加强。

为改变这种困境,Hitachi Vantara基于VNA理念推出“医学影像大数据中心解决方案”,帮助医疗机构突破上述三类挑战。

所谓VNA,即“供应商中立归档”(Vendor-Neutral Archive),是一种新兴的医学影像存储模式,其通过标准协议形式对医学影像、文档等进行统一存储与管理,并允许其他业务系统通过统一接口方便快捷地获取数据。在VNA理念与相关技术的支持下,医疗机构将能够摆脱医学影像设备与系统供应商的专用技术限制,获得在医学影像数据管理、应用方面更大的主动权。

“作为中立厂商,Hitachi Vantara在国内并不销售医学影像产品,同时具备强大的数据服务能力,因此非常适合帮助医疗机构解决医疗数据的整合、归档、应用等问题。”据介绍,Hitachi Vantara医学影像大数据中心解决方案的基础架构可分为数据存储层、数据集成层、任务调度层及协议支持层4个层级,分别整合了Hitachi Vantara旗下多款拳头产品。

Hitachi 医学影像大数据中心解决方案

数据存储层,主要由Hitachi Vantara的对象存储平台HCP(Hitachi Content Platform)提供服务,可对医学影像等大量数据进行在线归档存储,并提供应对物理故障和逻辑故障场景的免备份数据保护,具体功能包括元数据支持、对接S3访问接口、底层数据保护、Hash校验、数据自动更新、纠删码保护、免备份技术、逻辑多副本等;在数据集成层,主要由Hitachi Vantara的数据抽取工具PDI(Pentaho Data Integration)负责完成结构化数据抽取工作;协议支持层可支持DICOM 3.0、HL7等;而在任务调度层发挥作用的主要是对象存储数据抽取软件HCI(Hitachi Content Intelligence)。

Hitachi Vantara详细介绍了HCI如何在任务调度层发挥功效。此前,医疗机构在管理医学影像数据时往往需要对PACS系统进行改造,才能使得影像数据从PACS系统中“吐”出来。而在Hitachi Vantara解决方案的支持下,无需对现有系统进行大规模改造,HCI可通过NFS协议直接从存储底层抽取DICOM文件,并完成DICOM文件扫描、存储到对象存储平台HCP中。

“这完全颠覆了传统理念。”据Hitachi Vantara介绍,在传统方式中,用户需要什么DICOM数据,PACS系统就从前端传递什么数据;而HCI是直接对存储底层数据进行操作,这不但节省了系统改造、人力与沟通成本,更极大地提升了数据提取效率。“相对而言,DICOM的协议效率是较低的。当面对海量的影像数据时,如果用户需要同时调取50套甚至200套CT或MRI影像,DICOM协议的效率已经不能满足业务需求;而HCI底层调取的方式显然更加高效。”

与结构化数据相比,医疗机构在完成影像数据的抽取工作后还将面临更为复杂的数据解析与组织工作。比如,一张CT影像可能涉及2000-5000张连续断层图像,此外还储存着诸多扫描参数,HCI具备建立DICOM索引、协议转换、解析等功能,最终提供的影像数据脱离了原PACS系统的预设格式(也即“脱格式”),可按照医院实际所需的格式单独保存,随时可以被各业务系统进行灵活调用。这也是VNA理念的充分体现。

激活医疗机构的数据自主能力

在医疗行业,部分医疗机构对Hitachi Vantara的印象可能还停留在数据存储层面,目前全国已有超过300家医院使用Hitachi Vantara的存储产品。事实上,Hitachi Vantara从数据存储出发,到如何丰富数据、再到数据利用,日益强调针对数据的整合分析和管理,帮助医疗机构加速激活自身的数据自主能力。

在互联网、金融等行业,数据湖正在逐步成为数据治理的新范式。“严格来说,医疗行业还未出现真正意义上的数据湖。”Hitachi Vantara认为,数据湖的建立依赖于较高的数据标准化水平,结构化数据湖的构建相对容易,非结构化数据湖则较为困难。从医疗数据的构成上来看,结构化数据、文本数据及影像数据三者体量之比大约为1:10:1000。如果医疗机构拥有100T数据,其中至少80T是影像数据或非结构化数据,这显然加大了医疗行业构建数据湖的困难指数。

对此,Hitachi Vantara提供一种全新的建设思路:以医学影像数据作为切入点,整合全院数据,最终形成整体数据湖。

为什么选择以医学影像数据作为切入点?Hitachi Vantara用了一个比喻进行解释:“在一个摄影爱好者的移动硬盘中,占据存储空间最大的一定是各种照片。从文档管理的角度出发,他会希望在每张照片上标记一些其他信息,如照片中的人物是谁,拍摄的时间与地点,拍摄时发生了什么事、心情如何等。这部分信息可以称之为元数据的丰富。”

Hitachi Vantara进一步介绍到,对应到医疗行业,这些“照片”就是患者的影像数据,其占据的存储空间最大,除影像信息外,仅包括患者姓名、年龄、检查项目等基本信息;而这名患者的历次就诊记录、病历医嘱、检查结果、诊疗方案等结构化数据,可以通过Hitachi Vantara提供的数据平台和工具,重新方便地“写回”医学影像中并进行管理,从而丰富患者的医学影像档案数据。

“将体量占比最大的影像数据作为‘数据基座’,再将元数据加载到基座上,这一非结构化数据与结构化数据的一体化过程可以通过VNA平台实现,并最终存储在数据湖中。由此形成的数据湖,将是集合了结构化与非结构化数据的整体数据湖。”Hitachi Vantara表示。

而在数据应用方面,由于Hitachi Vantara提供的是完整的、脱格式的、整合了丰富元数据的医疗数据,帮助形成完整的患者数字画像,同时提供了DICOM、HL7等通用接口。因此,医疗AI、辅助诊断等系统、应用服务商都可以通过调用这幅完整的数字画像,开展多种类型的数据应用。

“我们希望能为医院在数据应用方面提供最大的自由度。”Hitachi Vantara介绍,在目前医疗机构普遍感觉遭遇瓶颈的数据上报工作中,Hitachi Vantara可借助PDI等数据抽取工具,帮助医院掌握快速抽取数据的自主定制开发能力,应对各类时间要求紧、覆盖范围广的数据上报任务。“除此之外,更广阔的‘用’还将表现在我们与医疗行业ISV、新技术开发商的对接中。”下一步,Hitachi Vantara将在医疗行业开展广泛的产业合作,将自身的数据服务能力集成到合作伙伴的产品中,帮助医疗机构提升医疗数据主动权,从而更好地开展数据应用,将医疗数据转化为数据资产。
近期热文
HIT专家网∣致力推进中国卫生信息化长按二维码可申请加入HIT专家网专业交流群

寻求“商务合作”,长按二维码可快速与我们取得联系


投稿:gong_chen@HIT180.com

商务合作:(010)82373062


本公众号原创文章,版权归原作者所有。

未经许可,谢绝转载或以其他形式使用文章内容进行传播。

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存