查看原文
其他

孩子心脏发育不好,我要存孩子的心电数据

亲爱的数据 亲爱的数据 2023-03-26
原创:谭婧

起名字,背后往往有故事。
 
我认识一个2020年11月出生的小朋友,名叫“建建”,取“健”字的谐音。

当建建还在他妈妈肚子里的时候,就被怀疑有先天性心脏病,因为从超声描述上看,是“二尖瓣瓣上隔膜样狭窄,左心发育不良”。
 
产检的时候,建建妈妈就哭了,手里拿着报告,一路走一路哭回家。

从老家,到北京。
从北京安贞医院,到北京儿童医院。
从这家,到那家。
四处求告。

建建妈妈说:“医院里,我就差给医生跪下了。”
 
医者仁心,在武汉协和医院心脏大血管外科就职,擅长先心病的胡志伟主任医师,看到北京安贞医院的报告后,对建建妈妈说:

“单纯主动脉缩窄的治疗效果是比较好的。但目前安贞医院检查报告显示主动脉发育不良,二尖瓣发育不良,看来是左心室发育不良综合症,需要多次手术。三次手术,也只能是一个心室的矫治,无法成为严格意义上的正常心脏!所以,需要慎重考虑!” 


“慎重考虑”,意味着,可能要放弃孩子。
 
北京两家医院都建议放弃,但是广东省妇幼保健院心脏中心的孙善权主任医生持不同观点,他说:

“胎儿血液循环与出生后完全不同,所以胎儿产前诊断是有巨大差异的!从描述上分析,这个孩子出生后也未必有先天性心脏病……”


孙善权主任的话,给了全家希望。
 
病情,有争议。
生下来,要赌。

命运把八零后父母推搡到赌桌前,让你全押。
 
最后几个月是熬着的,提前剖宫产,孩子早产了一个月,生下来,没来得及抱一下,就进了儿童重症监护室,保温箱一住就是十五天,胶布贴满了脑袋。
 
出院后,奇迹发生了。
 
建建的小心脏健康了。
 
真的,没开玩笑,医生说这种情况只有5%。
 
困难面前,建建妈妈没有“顾影自怜”,而是“自学成才”。
 
新闻上报道人工智能在医学领域有很多成功的应用,建建妈妈就向医生咨询——智能心电设备。

“如果我给孩子准备一个智能心电设备(类似手、环手表的可穿戴设备)您看能行不?

因为孩子出生的时候,是确诊的主动脉弓偏细的问题,这种设备我想着也是现在的发展趋势,需不需要准备上这类医疗器械专业级产品,给孩子日常备份一下心电数据,您说这样有用不?”

 
对此,北京儿童医院的朱耀斌医生的回复是:“其实吧,你就量个心率就行,量个(血氧)饱和度就行了,我觉得足够了。”

医生没有直接推荐智能心电设备。
 
但是,建建妈妈告诉我:“这些数据,(对我的孩子)有用。”
 
现实很残酷,市场上并没有儿童专用,且能在日常环境中提供医疗级精度的智能心电设备。
 
建建妈妈说,她对这类产品的希望是,

戴在身上,(孩子)看上去和正常的孩子一样。平时孩子身上戴了个笨重的医疗仪器,会让别人觉得他不健康。要是手表、手环什么的,绑个手机APP,随时能看到孩子的变化,多好。


建建妈妈怀孕的时候,也使用过医院提供的“胎儿监护仪”。“孩子一翻身,心跳就会加速,仪器都能监测到。”因为是借用,后来仪器还给了医院。
 
既然测量过,便萌生了存下这些数据的想法,虽然不知道这些数据具体是啥,但是她想存下来。

这些数据中。有一种就是心电数据。
 
(心电信号数据,心电图数据,往大里说,都是心电数据。)
 
养儿一百岁,长忧九十九。

建建妈妈觉得,哪怕未来只有1%的可能会用到,现在也想做100%的准备。
 
心电信号的特征是,随机性强、 信号微弱、抗干扰性差。所以,捕捉这种信号需要耐心。抓住心脏病这个“犯罪分子”,要心电监测时间够长,采集到全部吃喝拉撒、喜怒哀乐、跑跳玩闹的心电信号。
 
所以,心电有一个流派是可穿戴设备,玩的是动态心电图。

无独有偶,京东大数据研究院在2021年4月发布了《2021健康减脂消费趋势报告》,其中“智能穿戴设备具有心率检测,血氧检测的,销量同比增长170%,具有心电图检测的,关注度同比提升超10倍。”
 

可真是要谢谢这几年可穿戴设备的疯狂生长。

这样心电数据的来源就可以非常广泛,比如,从第4代开始的苹果手表Apple Watch 就有心电图功能,是单导联心电。 

而多导联心电,这个流派,玩的是静态心电图,用于复杂诊断,一般指常见的静态12导联心电图。

脑补一下贴很多电线在身上,平躺在医院检查的白色窄床上,休息一阵再检查。
 
拿修钢琴的师傅打个比方,单导联心电就是师傅检查节拍,看拍子准不准。多导联心电就是师傅对着钢琴说,抱歉了您嘞,全面专业检修。
 
好消息是,在心血管领域,中国有最庞大的患者群体和最丰富的临床病例,与最新信息技术的结合,发展空间巨大。
 
与此同时,人工智能科学家也在想办法,挖掘数据对病人的价值。
 
人工智能对数据的要求很高,心电图在中国医院就有不短的历史,可以追溯到九十多年前。
 
1928年,北京协和医院从英国Cambriger公司购买了两台标准双极导联心电图机。

仅在1928年到1949年期间,北京协和医院中心就积累了3万多份双极导联心电图的资料。
 
这只是万里长征第一步,“中国正常成人心电数据库项目” 2011年启动,中国心血管健康联盟的数据中心建在苏州,《中国正常成人心电数据库》2018年发布。
 
人工智能“看懂”心电图是一个有趣、有意义的研究方向。

2017年,知名华裔美国科学家吴恩达团队出过一篇论文,当时的数据集是3万多份30秒时长的心电图片段。
 
论文中,人工智能技术从心电图中识别14类心律不齐。论文作者也强调:“心律信号之间的差异可能非常细微,比如说,有两种心律不齐都叫做二度房室传导阻滞,它们在心电图上的表现也非常相似,但一种需要立刻治疗,一种不需要。”
 
2019年,吴恩达团队保持好奇心,继续跟进这一研究方向,他们使用人工智能迁移学习分析心电图的论文,登上了《自然》旗下顶级医学期刊Nature Medicine杂志。
 
在国内,也有厂商关注这个领域,医疗器械厂商乐普医疗就较早进入。

2018年11月,乐普医疗的心电图人工智能自动分析诊断系统(AI-ECG Platform)通过了美国FDA。在2020年第三季度,研发了首款使用人工智能深度学习分析算法的心电图设备“心电图机”(OmniECGB120AI),获 NMPA 注册批准。

2021年4月,“乐普系”频频与资本握手,进入上市阶段。现在并不清楚乐普医疗未来会给智能心电多少投入资金,但这是一个良好的开始。
 
在这些背景下,中科院自动化所助理研究员牛景昊博士和“亲爱的数据”主编谭婧讨论了:在人工智能自动“看懂”心电图这条路上,有何进展?


#1

AI准备好了吗?

 
医疗数据是不撒谎的日记,人们平时就医会被医生询问过敏史、重大病史等,这些就是在回顾历史数据。
 
医疗数据敏感,且稀缺。谁有病也不想让不相关的人知道,所以,谁有资格被授权接触和利用这些数据,可能需要长期的讨论才能有答案。
所以,医疗平台之间的数据互通困难,不仅仅是技术和金钱的问题。

个人医疗数据只用于一次性诊断有些浪费,但是很难建立医院中台统一处理各方面的数据。比如,家中监测的智能手环数据,难以与住院期间的生理指标合并分析。

 
有数据,来标注,人工智能这个时候出场才有戏。
 
医疗数据对每个人重要,对人工智能技术也很重要。如今,一定数量的高质量的标记数据,成为人工智能能够成功的重要因素。
 
标注,就是医生亲自“划重点”。数据需要让医生来标注,标注者的门槛高,成本昂贵,所以,医疗数据金贵。而且,难以大规模批量化生产。
 
这也可以解释为什么现在医疗数据比其他类别的数据集规模要小。
 
高质量的标注数据是人工智能技术的弹药,将通用诊断模型优化为个性化的、更高精度的算法模型。
 
比如,国际知名的心电领域2020年心电数据分析挑战赛,由PhysioNet组织。这几乎可以算是目前最大的公开数据集。
 
赛方通过对现有12导联心电图公开数据库进行组织和整理,提供了一个含有来自4个国家的66361份心电图记录的大型数据集,用于人工智能算法的模型训练和性能评估。
 
从数据集的规模这一点上看,心电图和计算机视觉比起来,还是弟弟。

计算机视觉大规模数据集ImageNet,有14197122张图像(截止到2021年3月11日)。
 
(注:PhysioNet英文全称为ResearchResource for Complex Physiologic Signals,直译为“复杂生理信号研究资源”,有网站,有美国国立卫生研究院的资助,现在由美国麻省理工学院的计算生理学实验室管理。从这个数据集的管理也可以看出来,医疗数据涉及学科交叉,需要信息技术和医疗部门都贡献力量。)
 

当前,有一些心电图智能设备厂商或者研究团队,公开报道称其自研的模型训练使用了比现有公开数据大百倍到千倍的私有数据。

虽然这些心电数据规模十分庞大,但是,赋能智能算法可能的局限在于:
 
第一,大部分是健康患者数据,对异常的判别贡献低。
 
第二,疑难杂症的精细标注有限,缺少顶级医疗机构的高年资医生背书。
 
虽然心电数据是吞金兽,花钱如流水,像富二代,但它是很有个性的,能以小见大。

为什么这么说?

因为心电数据的每个测量值都是有实际意义的数据,即使最小信息尺度的数据,也可以释放出很强的信号,包涵很多有意义的内容。
 
将心电信号数据和图像数据比较,图像数据的最小信息尺度的数据是像素点,需要多个像素点组合才能传递信息。

打个比方,APPLE,是苹果,这个单词里的每个字母,都不能单独表达意思,但是有的中文词汇可以。
 
心电信号数据像中文,单个字符都能表达一些具体的意思,“高矮胖瘦”里的每一个字都能表达具体的信息。
 
图像数据像英文,比如最小组成字符是字母(像素点),单个字母单独拿出来分析,没啥用,是缺少信息量的,需要字母组合到一起,才能表达出一个完整的意思。
 
心电图数据有可能仅基于一个数据点就可以医学判定为不正常,但是这在图像领域是不可能的。

虽然图像像素点也有信息量,但是不容易直接对应规则。
 
但是,完全不可能单凭一个像素值,区分是狗还是猫。

可是,心电数据能够基于一个“点”来设定专家判断规则。
 
近些年,在人工智能领域大放异彩的深度学习模型可以自动学习特征,所以,在图像这种难以直接设定规则的领域很早显示出统治力,基本不需要额外的手工特征。
 
而在医学生理信号应用中,专家设计的规则特征依旧有很大价值,研究方向有很多,比如使用深度学习算法分析人体的心电信号,可以将深度模型和医学专家知识有机结合。
 
比较而言,心电数据更依赖专家设计的规则特征。

#2

AI和医生怎么相处?

 
智能医疗产品有不同程度的诊断能力,对应的情况也大不相同。虽然建建的妈妈对儿童专业级智能心电产品满眼小星星,但是,医生的态度很关键。
 
先来几个灵魂拷问,
第一、医生能不能100%相信人工智能?

第二、医生会愿意使用一个替代自己诊断的东西吗?

第三、人工智能给出一个方案,医生还要重新再整一遍,那问题来了,医生的反问是:“我为什么要用这个鸡肋一样的智能设备?”
 
人工智能给一个结论,然后不解释,掉头就走,那谁也不敢信它的结论。再牛的技术也不能傲娇。
 
人工智能说:“不在,别找,找也不回,烦得很。”
人工智能科学家说:“想动手,怕你不抗揍。”
 
人工智能心电医疗的产品线很长,就诊周期三阶段都有涉及,包括诊前分诊(常规检查)、诊中(辅助治疗)、诊后(慢病管理)。

简单理解就是,从入院,到出院。

如果不解释,分诊的医生、治疗的医生、护理人员都会一脸嫌弃。

在诊断医生看来,虽然人工智能模型在实验室数据(测试数据)上分类的平均准确率很高,但是,有没有可能是患者个体特殊,人工智能的这个判断对这个患者不合适。这种情况下直接使用人工智能的诊断会给患者带来很大的风险。
 
所以,未来,人工智能拿出的解释,应该充分接入医生的问诊流程,根据循证医学的框架,从支撑诊断结果的医学证据角度,来提供可解释性信息。
 
比如,若干人工智能模型对患者信息的分析,可以对应某一条医生可以理解的诊断。
 
提升人工智能医疗应用的可解释能力,就是要结合医生在真实看病过程中的思维模式,给出特定诊断所必需的医学依据,从而让人工智能结论能够被医生认可理解和采纳参考。
 
某类疾病,不能只有心内科的人可以看,也可让多科室的医生同步了解,这样既给会诊带来便利,也提升了宝贵医疗数据的可复用性,减少漏诊和误诊的发生。
 
再举一个专业性更强的例子,

心电图中的ST段(简单理解是心电图里的一个波段)。ST段幅值高于标准值,就可以给出很强的心电异常诊断信息,如果模型既能给出正确的异常分类,又能给出解释:主要由于ST段的异常导致了这种诊断结论。
 
这样的话,就有理有据。
 
第二步,人工智能心电医疗,可以参与辅助决策。

比如心脏电介入手术这个场景,现在一些比较精密的心电检测设备的测量值,可以为辅助诊疗提供很大的参考,甚至可以对手术的方案给出具有一定指导性的建议。
 
人工智能产品直接给了诊断结果,医生第一反应是:“我能不能签字。”
这背后的问题就是,如何让医生去相信人工智能产品的结论?
 
牛景昊博士在采访中表示,当前用于智能心电算法评估的公开数据集由于病种不同,彼此比较孤立,单纯在某几个数据集拼算法精确率指标,意义不大。
 
此外,在临床医学中,患者的病情往往是变化的。

比如,心电数据和多种类型的疾病有关,人工智能可能对于某几种训练数据充足的疾病类型精确率高。但是,有些病就是疑难杂症,医院专家的会诊结论都难达成一致,这些人工智能软件就更难处理。
 
所以,最近,牛景昊博士团队在做这样一件事情,让人工智能产品的结论给医生看了后,就像是一个年资深的医生给出的参考意见。

于是,人工智能产品在帮助医生这个事情上,就往前推进了一小步。
 
遗憾的是,当下,很多公开的数据库涵盖的异常类别相对少,现有研究切入点也是找一些争议小的地方。

当遇到争议很大的疾病,医生也有对心电数据拿不准的时候,医工交叉的合作会回到实验室。


#3

性感的技术趋势


2021年,人工智能技术的大热点就是大规模预训练。业界共识:这是一个能做出成果的方向。
 
从谷歌到BAT,很多人工智能科学家认为,这是很有想象力的方向。
 
医疗人工智能也在往训练超大模型这个方向发展,大规模预训练和自监督学习的技术使得模型对数据标注的要求变低。比如说,一家三甲医院可能已经有上万例的心电数据,但实际上数据缺少非常精细的标注,可能用不了。
 
以前,经典的深度学习方法需要大量的数据才能达到有效的结果。但是,现在有了人工智能自学习的方法,创造了更多可能。

这种预训练算法需要结合数据的特性去专门设计。预训练的方法可以适配于心电数据,把模型迁移过来用。因此,用一些通用的预训练技术,充分利用超大规模的、标注质量可能有限的心电数据,获得类似于NLP(自然语言理解)领域的超大预训练模型,将惠及更多下游子任务。

用金庸的话说,就是,张无忌起初修习九阳神功五年,内力精进之后其他各类武功学习都是手到擒来,基本一学就会。
 
这个可能取决于两点:
 
第一点,把用于NLP或者是用于CV(计算机视觉)的成熟方法,很好地迁移到医疗这个垂直领域的任务上。
 
第二点,人工智能有生成图片的能力。人工智能模型(GAN)可以生成一些训练样本来提升模型精度指标。简单理解,自己动手丰衣足食。也就是,人工智能生成“自己需要的医疗数据”。
 
医疗生成数据主要为了提前产生训练数据中,没有收集到的患者模式(症状、局部影像异常、指标等),后面,用于提升模型的训练后精确度和稳定性。
 
然鹅,“第二点谈到的”,利用“人工智能造的数据”提升的模型性能是不是可靠,这里有一个大问号。
 
人工智能生成的数据样本使数据测试集的指标提升,但无法保证这些生成的样本是真的能够符合患者天然的病情表现。如果说“人工智能造的数据”是跟患者天然病情表现有差异,那么这些样本的可靠性就存疑。
 
医疗人工智能也在往训练超大模型这个方向发展,十分期待跨时代的标志性成果出现。

医疗人工智能领域的科学家关注类似这样的问题:

如何最好地利用预训练模型获得更好的效果?

如何使用预训练模型最佳地适应目标任务?


用大规模的预训练模型去提升小样本分类任务的性能的原理是,预训练模型是找到了一个共性(有点像common sense,或者叫做常识)。比如说人工智能模型能分辨橘猫的时候,是对猫的分类这个任务有点“理解”,不同的猫,大概也能分类,但是准确率低。
 
放在NLP场景里,这个词就像“语感”。比如初中英语完形填空题目,给你一段话,中间挖掉几个词,让人工智能去预测(predict)填哪个词好。

母语英语的人,顺嘴就出来,这种情况就是“语感”。大模型的能力也是类似,知道下一个字或者下一个词应该是什么。

也可以理解为,预训练模型把人类的语言知识,先学了一些。然后,再代入到某个具体任务,就顺手了。
 
学术论文里写的就叫context,直译就叫“上下文”。
 
学术上讲,是预训练通过自监督学习从大规模数据中获得与具体任务(下游任务)不直接相关的预训练模型,预训练模型优化相关参数,模型再跑到小样本上训练(在学术界就叫做下游任务),小样本模型效果相比于只依靠下游任务的训练数据有较大提升。
 
正常情况下,疑难杂症比较少见,相对的,疑难杂症的数据集一般也会规模较小。

比如在处理疑难杂症这种小规模样本数据的时候,先在大数据集上预训练,再对模型进行微调(fine turn),微调就是针对疑难杂症修正模型。
 
大模型预训练,专治疑难杂症和各种水土不服。
 
如果没有预训练大模型,仅能用小规模数据,也就是那种疑难杂症的数据去训练和测试,小样本的标注量比较少,就局限很大,效果很差。
 
迁移学习(Transfer Learning)是人工智能技术中的一种,预训练模型把迁移学习很好地用起来了。它所关心的问题是:什么是“知识”,以及如何更好地运用之前得到的“知识”。
 
迁移学习技术的应用有两点:

1

 病种之间的迁移



比如说房颤分类,它是一个患者数量特别大的心电图异常(预训练模型),把这类数据中学到的经验(姑且称为“先进经验”)迁移到一些提升疑难杂症的心电疾病数据库里(又称小样本),用“先进经验”把小样本数据库上训练的模型的精度提升上去(下游任务),进而提高了疑难杂症心电疾病数据库里训练模型的精度,这也可以称为跨病种的迁移。

2

 医疗机构之间的迁移



比如拿一个美国人的数据库,去中国人的、私有的、小规模的心电数据基础上做迁移。用美国人的心电数据大样本中找到的“经验”,来提升中国人的心电数据训练模型的精度,这就是中美医疗机构之间的迁移的例子。
 
举一个例子,心电做恶性心率失常预警。因为单导联的心电数据房颤筛查的数据采集普遍(苹果、华为手环,谢谢了),房颤筛查这类疾病就能收集到大量数据,进而用这些数据预训练模型得到经验,再给比如恶性心率失常(患者样本较少)这一病种做加速,缩减训练周期,同时提高恶性心率失常模型的预测精度。
 
换句话说,借助一系列自然语言理解领域大获成功的预训练模型(ELMo、GPT、BERT 等),通过学习标注条件比较一般的、与特定疾病诊断无关的大量心电图数据,使得模型获得对于心电信号处理心电数据的一种“语感”,然后在特性任务的小数据上微调。

迁移学习可以有很多方法,微调是其中的一种手段。
 

牛景昊博士观点:尽管用智能算法去处理多模态数据这一方法,推动了特定领域的进展,但不能为了多模态,而多模态。
 
他的理念是:不要为了追求更好的结果,特意收集全面的数据,更好的是,在一个场景里,恰好有多种模态的数据,把它用好。
 
好比医院里的过度检查,信息量多了,对判断会有一点帮助,但是不是最合适的,需要具体情况具体分析。可获得的医疗数据不全面,在实际业务中很可能是常态,学术界在医疗数据维度缺失的处理方面有持续的关注。
 
建建妈妈说:“孩子第一声哭和猫叫一样,现在嗓门很大了,能吃能喝能睡能喊。”说的时候,她声音里都是高兴。

我问建建妈妈:“你有什么想对人工智能科学家说的话吗?”
她说:“希望提醒心脏可能出现的问题,为孩子争取最佳的治疗时机。”

你有什么想对人工智能科学家说的话吗?

希望提醒心脏可能出现的问题,为孩子争取最佳的治疗时机。


全文结束
更多阅读:

科技大厂
  1. 电子地图“顽疾”难治,会“传染”自动驾驶专用高精地图吗?

  2. 搞深度学习框架的那帮人,不是疯子,就是骗子

  3. 七分之一在线评论都有假,人工智能救一把?

  4. 难倒刘强东的奥数题,京东智能供应链解开了

  5. 超级计算机与人工智能:大国超算,无人领航

  6. 消失的人工智能 “法外之地”



最后,再介绍一下主编自己吧,我是谭婧,科技和科普题材作者,围追科技大神,堵截科技公司,生命短暂,不走捷径,个人微信18611208992。还想看我的文章,就关注“亲爱的数据”。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存