人工智能医疗来到非洲农村诊所
遍布肯尼亚的农村医疗诊所中,迎来了一群群提出惊人要求的妇女:她们要进行“宫颈自拍”。
¶对于正在6个非洲国家开展的对抗宫颈癌的公共健康运动而言,她们的热情是个好兆头。使用固定在安卓智能手机上的光学配件以及手机自带的照相机,医疗工作者能够为妇女进行检查,捕捉癌症的早期迹象,使患者能够得到及时治疗。这一诊断设备不久将进一步升级。随着该技术与人工智能的整合,该设备或许会成为非洲以及其他地区的智能医疗典范。
¶这一筛查运动依赖于以色列MobileODT公司(ODT是“光学检测技术”的简写)开发的一个工具。医疗工作者采用被称为强化视觉分析(EVA)镜的夹式配件,将智能手机变成一台类似于阴道镜的设备。阴道镜是妇科医生用来观测女性子宫颈并放大图像的工具。结合配套的手机应用软件,筛查人员能够分析图像、将图像展示给患者,并将数据储存在云端。
筛查运动的组织者一开始担心妇女们不愿意以这种私密的方式进行检查——但事实上,许多女性不仅愿意,而且非常有兴趣看到她们的这些照片。相反,真正的挑战是如何确保医疗工作者能基于这些图像做出精确诊断。而在这方面,人工智能将派上用场。
我们中的两位(本文作者Cary Champlin和David Bell)所工作的创新中心Global Good希望利用如今无处不在的移动技术来对医疗保健领域进行变革,尤其是在世界上一些缺乏医疗基础设施的地区。作为实验案例,我们与MobileODT公司携手,将机器学习技术整合进EVA镜。在今年晚些时候,我们将开始在埃塞俄比亚进行现场试验。
这一举措与Global Good的使命相一致。Global Good是比尔•盖茨与高智发明公司(总部位于美国华盛顿州贝尔维尤)合作的产物,致力于开发能够改善世界上贫困地区人民生活的技术。在这一案例中,我们借助了看似神秘的机器学习方面的研究,并利用了卷积神经网络(CNN)。高智发明公司的创始人纳森•梅尔沃德(Nathan Myhrvold)是倡导将这些计算机科学战术应用于医疗诊断的先锋。他认为我们能够利用卷积神经网络将移动电话转变为超级智能的诊断工具,从而挽救数百万生命。为非洲的每间医疗诊所输送一名医疗专家也许不太可能,但使用人工智能,我们可以为这些医疗诊所输送专业知识。
选择宫颈癌筛查作为这一技术的测试案例是有充分理由的。根据世界卫生组织的统计,每年约有27万名妇女死于这种疾病,其中85%发生在低收入国家。这种疾病发作于正值盛年、需要养家糊口的成年妇女身上。这也是为什么在需求最为迫切的国家对抗女性癌症的非营利组织——粉红丝带红丝带——会与全世界的组织机构合作,在当地医疗诊所提供宫颈癌筛查。(本文作者之一Celina Schocken是粉红丝带红丝带的首席执行官。)
我们同样有充分的理由认为这一筛查运动将真正发挥作用:与其他多种癌症不同,宫颈癌大部分是可以预防、治疗和痊愈的。筛查可以发现这一疾病的早期预警迹象,这些迹象通常要10~15年之后才会发展到危险阶段。因此,健康专家拥有大量机会来诊断和处置这一潜在杀手。
但是,直到目前,大规模筛查的成本对于发展中国家来说还是过于高昂。总部设在华盛顿特区的粉红丝带红丝带预计,在非洲,只有5%的妇女接受过检查。
过去数十年间全世界所使用的传统筛查程序是:医疗工作者从宫颈细胞中提取样本(宫颈涂片检查),将样本送往实验室进行分析,之后等待结果。这一过程不仅昂贵,而且在道路崎岖、实验室缺乏的地方,需要花费数周的时间才能获得结果。虽然宫颈癌发展缓慢,但延迟治疗还是会导致严重后果。由于无法在同一天进行筛查和治疗,许多妇女永远无法获得所需的关怀。她们出于多种原因无法进行后续治疗:她们可能无法再次前往诊所,她们的丈夫可能表示反对,或者她们可能无法理解重返诊所的必要性。
挽救生命的突破发生在20世纪90年代。当时,研究人员发现,在子宫颈上涂抹乙酸(普通家用食醋的主要成分)会使癌前病变位置变为白色。于是医疗工作者就可以采用非常类似于皮肤科医生切除疣的方法,通过高温或者低温来破坏异常细胞。这一快速且相对无痛苦的处理能够使癌症停止发展——总花费不到20美元。(在富裕一些的国家,女性可选择对癌前病变进行长期监测或者进行更加彻底的外科手术,但在肯尼亚农村这类地区,这些选择通常都不太可行。)
许多发展中国家的诊所都开展了目视筛查项目,很可能已经挽救了成千上万条生命。然而,这一过程并不完善。一线医疗工作者需要经过培训和督导,才能分辨即将癌变的真正病变迹象和许多看似可疑实际上却是良性的病变情况。筛查人员也有可能遗漏掉晚期癌症的证据,而无法及时转给专家诊治。
Global Good的团队将这一情况视为软件工程挑战而非医疗挑战。在人眼需要帮助的领域,我们将借助由人工智能支撑的计算机视觉。
我们首先对阴道镜拍摄到的宫颈影像进行评估。我们很快认识到,一般的计算机视觉软件无法处理这种复杂的大型数据集,因为这些影像拥有太多多变的特征。我们无法直接设计出可以彻底区分健康宫颈和存在病变迹象的宫颈的算法。
这一情况下,我们需要采用机器学习——这是计算机科学的一个分支。在机器学习中,计算机会被给予一个目标、一个软件框架以及一个大型训练数据集,之后就有待计算机自行创建出任务执行方案。
机器学习的一个常见类型依靠的是深度神经网络(DNN)。之所以这样命名,是因为该计算方案大致模仿大脑的互连神经元。每个计算节点都可以被视为接收了许多输入信息的神经元。人工神经元基于这些输入信息执行某些功能,之后输出一个可作为其他神经元输入信息的单一信号。通过安排多层相连的神经元,计算机科学家使这些网络能够处理极其复杂的任务。
虽然神经网络的架构受到人类大脑的启发,但这一人工智能类型与人类的思考方式相去甚远。如果有人要解释如何在同时储备有红酒、果汁和水的商店中凭视觉辨别出一瓶啤酒,这个人很可能会从高度、直径、形状、纹理、颜色和图案上来描述这瓶啤酒的显著特征。一些描述语可能包含比喻,例如“缎面般光洁”或者“橙皮般的纹理”。每个特点都基于且局限于我们人类的感觉和感知。然而这一特征列表无法包含我们大脑用于将一个物体同其他物体区别开的所有因素,因为大部分过程都是潜意识的。
如果我们使用人类的特征列表作为识别啤酒瓶算法的基础,我们很可能得到糟糕的结果。因此,取而代之的是,我们向深度神经网络馈送了成千上万张各式各样的瓶子的图像,以及能够说明每个图像是否展示了一个啤酒瓶的元数据。通过一系列复杂的学习运算,网络最终能够独立地确定相关特征。许多类似的实验已经表明,神经网络能够辨认出任何人都很难想到的特征。计算机的显著特征列表虽然令人困惑,却通常能够获得卓越的表现。
在涉及图像处理和模式识别的任务中,之前提到过的深度神经网络子类型——卷积神经网络——被证明是最具潜力的方法。该方法采用一些巧妙的手法来减少理解图像所需的繁重计算任务。
计算机科学家燕乐存于20世纪80年代在AT&T的贝尔实验室创建了第一代卷积神经网络,将它们用于可识别手写文字(例如信封上的邮政编码)的计算机视觉系统。(目前燕乐存是脸谱网人工智能部门的研究主任。)但是直到2012年,卷积神经网络的潜力才真正被发掘出来。当时多伦多大学的研究生阿莱克斯•克里泽夫斯基(Alex Krizhevsky)和他的合作者使用卷积神经网络在图片识别挑战赛中获胜。该竞赛要识别1000个不同类别的140万张物体的图片。他们使用的AlexNet程序的错误率比之前的获奖程序低50%以上。该程序可以方便快捷地识别出气压计、理发店、气泡、棒球选手、子弹头列车、饰扣式领带、墨西哥卷、浴巾和波士顿狗。这些只是字母B项下单词类别中的一些例子。(克里泽夫斯基和他的几个团队伙伴现在在谷歌工作。)
在这一颠覆性的展示之后,卷积神经网络开始迅速发展。在(训练这些神经网络所需的)高性能计算机相对低廉的价格的推动下,许多涉及图像的应用都已经采用了卷积神经网络。
医疗领域的潜力令人兴奋。例如,瑞士人工智能实验室IDSIA的尤尔根•施米德胡贝(Jürgen Schmidhuber)最近从真实的病理学报告中提取了乳腺癌细胞的图像,并使用卷积神经网络来识别作为侵袭性肿瘤标志物的分裂细胞——即便对于经过训练的专家来说,这一检测任务也具有挑战性。他之前的演示仅是一项概念验证,但我们现在已经到达了可以将研究项目转化为辅助临床治疗工具的关键时刻。
在一个卷积神经网络中,多个层次的人工神经元执行大量基本运算,并将结果以一种简化的方式进行前向馈送。卷积神经网络的能力——及其超过其他神经网络之处——源自这些简单步骤的巧妙安排,使计算负荷保持在合理的范围以内。
每个卷积神经网络中的神经元都可以被视为一个滤波器,每个神经元扫描图像以获取某个特定特征。为理解某一图像——无论卷积神经网络是在试图区分啤酒瓶和汽水瓶,还是健康的宫颈和癌变的宫颈——都可以使用分布在多个层级中的数千个滤波器来共同进行数十亿次计算。
第一层滤波器在像素级上查看数字图像,接收每个像素的红色、绿色和蓝色通道的数值。一个滤波器可能探测竖线,而另一个滤波器则可能寻找某一特定颜色。每个滤波器都在一个个可控制的小块内检查图像,寻找每一块中的特殊特征,之后再在特征图中用数值代表其发现结果。这些简单的特征图被向前馈送,每张图都被用作下一层滤波器的输入。下一层的滤波器将负责检查稍微大一点的或者更加抽象的特征,例如某一物体的边缘或者特定的肤色。
这一过程继续进行,每一层都能够比前一层识别出更加复杂的形状或图案。最终,有一层将其输出结果发送至一个“完全相连”层。这一层会将这些特征图作为整体来查看,而非继续执行块状扫描。典型的卷积神经网络会以几个着眼于大图(事实上只是许多数值)的完全相连层而结束,并决定该物体在多大程度上符合卷积神经网络中某一物体的模板。这一整体认识使最终层能够宣布:这是一个啤酒瓶,或者,这是一个健康的宫颈。尽管人类程序员从来没有告诉网络该使用哪些滤波器,但人工智能在训练中自己就可以做出决定。
不过,人类程序员并非只是观察者。我们通过设定每层的滤波器数量和层数来建立卷积神经网络的计算架构。我们探索多种组合:增加滤波器可以使卷积神经网络注意到更多精确的细节,增加层数可以使从原始图像到抽象分类的进程更加平稳。我们检查每个架构的结果,做出一些改进,然后再次运算。我们用于训练的图像集对于卷积神经网络的成功同样重要:训练图像必须代表并覆盖在真实世界中将会遇到的图像,且必须正确地归入标记的类别。糟糕的图像集会产生糟糕的结果。
为了训练我们的卷积神经网络用于宫颈癌筛查,我们输入了约10万张宫颈图像。这些图像被分成健康组织、良性炎症、癌前病变和疑似癌症等类别。我们得到了合作伙伴美国国家癌症研究所的协助,其允许我们访问其高质量的、带注释和匿名化的图像数据库。我们正在用这些“理想”的图像来训练卷积神经网络,之后将转为使用临床获得的更复杂的图像。
我们现在正在使用由加州大学伯克利分校开发的名为Caffe的软件程序,作为卷积神经网络的训练框架。我们首先定义卷积神经网络架构,然后Caffe利用一套滤波器将我们的图片集在卷积神经网络中过一遍。之后,它会检查其分类系统的表现。此后,Caffe会调整卷积神经网络的滤波器以试图改进系统的整体正确度。这就像一个有数百万个自动调整旋钮的黑盒子:我们理解它所关注的一些特点,比如颜色和线条,但还有许多关注点我们完全无法理解。Caffe不停地旋转旋钮,直到卷积神经网络达到某种稳定的性能,或者明显表明这是一次失败的运行。只有这时我们人类才会进行干预,以尝试一个新架构。
一旦我们的卷积神经网络看似可以熟练分辨图像了,我们就会让它挑战区分那些从未在训练中使用过的宫颈图像。这是一个重要的验证步骤,因为卷积神经网络在分辨类似的图像时效果会很好,但可能在面对全新数据集时出现较大差错。在今年晚些时候进行到这一步时,我们将使用单独存放在国家癌症中心的图像子集。
卷积神经网络的训练需要很高的计算能力。当Caffe让卷积神经网络完全运行一次,它要进行将近1万亿次简单的数学计算,如果采用高端多核中央处理器(CPU)机器,这样的计算量需要花上数周甚至数月。但若使用用于高端视频游戏和仿真的图形处理器(GPU)进行计算,则可以极大地提升数字运算的速度。在Global Good,我们使用两个装满GPU的高性能计算机集群,来对这些存储在海量磁盘阵列中的图像进行迭代运算。一次训练需要大约72个小时。在卷积神经网络的世界,一次为期3天的运行已经算很快了。
最终的挑战是让我们训练有素的系统进行实地操作,以确定它能否辨别出在各种条件下捕捉到的图像。使用MobileODT的EVA镜来进行检查的医疗工作者会使用窥阴器和照明灯来查看子宫颈。我们的人工智能仪器将接受忽略窥阴器和光反射的训练。但它还必须能够应对使用移动设备来拍照时产生的各种变化,比如照明、校准、稳定性和焦点的不规则性。我们的系统必须接受这些来自实地筛查的图像的训练,以理解这些不一致之处。当今年晚些时候我们在埃塞俄比亚进行实验时,我们会将智能系统的诊断结果与医疗专家的诊断和实验室的病理化验结果进行比对,来评估设备的表现。
为使偏远的农村医疗诊所能够实践这一技术,智能EVA镜不需要连接至云端来对图像进行评估。卷积神经网络在训练期间将进行大量计算,但一旦系统被部署之后,评估图像就无需大量的处理能力了。EVA镜将使用与其相连的智能手机应用程序来进行运算处理。
我们已经在展望未来的下一代技术。目前,基于机器学习的诊断工具在被部署前都会使用初始数据集进行训练,但在实地使用之后就不再进行学习。我们希望最终开发一个可以基于其接诊病例和患者,不断提高其技能的人工智能系统,以适应不断变化的条件,并改善诊断能力。这一适应无需基础训练所需的繁重的计算能力,因为卷积神经网络一次只会向其数据集中添加一些图像。如果我们能够设计出可在运行期间进行调整的人工智能,就可以减少初始训练所用的时间和精力。
我们当前的努力也许只是机器学习诊断工具的开始。许多其他依赖于图像医学的检查,例如X射线和核磁共振扫描,也可采用智能工具来对图像进行分类、找出模式和异常数据。我们还可以使用卷积神经网络来探测难以发现的罕见目标。例如,我们的团队现在正在开展一个研究如何诊断疟疾的项目,需要在显微镜下对血液样本进行检查以找出微小的疟原虫。对于寄生虫感染水平低的人群来说,这一挑战无异于在足球场中间找出一小把弹珠。
在许多方面,机器学习依然处于婴儿期。一个3岁小孩只需看一些猫的图片就能领会“猫”这个概念,而卷积神经网络需要看数百万张才行。但在医疗领域,人类和机器的较量在未来的数十年期间就会反转,因为程序使用的是我们无法理解的特征来扫描医学影像并得出结论。机器可能会超越医生,但如果它们可以为人类服务,我们会接受的。
作者:Cary Champlin, David Bell, Celina Schocken
>>>本文为原创,转载请回复。<<<
往期推荐