查看原文
其他

将连接组学提高一个数量级

Google 谷歌开发者 2018-12-15

文 / 研究科学家兼技术主管 Viren Jain 和 Google 的 Connectomics 软件工程师 Michal Januszewski


连接组学旨在全面地映射神经系统中发现的神经元网络的结构,以便更好地理解大脑如何工作。该过程需要以纳米级分辨率(通常使用电子显微镜)对 3D 脑组织进行成像,然后分析所得到的图像数据,追踪大脑的神经节并识别各个突触连接。 由于成像的高分辨率,即使是 1 立方毫米的脑组织也可以产生超过 1,000TB 的数据!再加上这些图像中的结构可能非常微妙和复杂,构建大脑映射的主要瓶颈并不是获取数据本身,而是自动解释这些数据。


今天,我们与德国马克斯普朗克神经生物学研究所的研究人员合作,在 Nature Methods 中发表了 “使用 Flood-Filling 网络高效自动重建神经元” 一文,展示了一种新型的递归神经网络如何提高自动解析连接组数据的准确性。与先前的深度学习技术相比,将连通组学数据提高了一个数量级。biorXiv(2017)也提供这项工作的开放版本。


使用 Flood-Filling 网络进行三维图像分割

在大规模电子显微镜数据中追踪神经节是一个图像分割问题。传统算法将过程分为至少两个步骤:使用边缘检测器或机器学习分类器找出神经节之间的边界,然后使用 watershed 或 graph cut 等算法,将未被边界分隔的图像像素分组组合在一起。 2015 年,我们开始尝试基于递归神经网络的替代方法,将这两个步骤统一起来。 该算法在特定像素位置播种,然后使用递归卷积神经网络不断地 “填充” 一个区域,该网络会预测哪些像素是与初始像素属于同一个物体。 自 2015 年以来,我们一直致力于将这种新方法应用于大规模的连通组数据集,并将其准确性严格量化。


在 2D 中分割物体的 Flood-Filling 网络。 黄点是当前焦点区域的中心; 随着算法不断迭代,检查整个图像,分割区域不断扩展(蓝色)



通过预期的运行长度测量精度

我们与马克斯普朗克研究所的合作伙伴合作,设计了一个度量标准,我们称之为 “预期运行长度”(ERL),用于测量以下内容:在大脑的 3D 图像中给定一个随机的神经元,在跟踪出错前,能够对其追踪多长距离? 这是一个典型的故障间隔时间度量问题,不过在这个问题中,我们测量的是故障之间的空间量,而不是时间量。 对于工程师来说,ERL 吸引人的地方在于,它可以将线性物理路径长度与算法出现的个别错误的频率联系起来,以便于直接计算。 对于生物学家来说,ERL 的特定数值可以与生物学相关的量存在相关性,例如神经系统不同部分中的神经元的平均路径长度。


采用 ERL 方法(蓝线)的结果表现最好。 红线表示 “合并率”,即两个单独的神经元被错误地当成一个目标进行追踪的频率; 将合并率保持在一个很低的水平,对于研究人员实现手动识别和纠正其他错误具有很重要的意义



斑胸草雀连接组学

我们使用 ERL 方法测量了 100 万立方微米的斑胸草雀大脑扫描图像中的神经元真实数据集,结果表明,新方法比以往使用同样数据集的其他深度学习途径的表现更好。


ERL算法追踪斑胸草雀大脑中的一个神经元


我们使用新的 Flood-Filling 网络,对斑胸草雀大脑中的一小部分神经元作了划分,如下所示:


https://v.qq.com/txp/iframe/player.html?vid=v0764atpes7&width=500&height=375&auto=0


通过将这些自动化结果与少量额外的修复剩余错误所需人力相结合,马克斯普朗克研究所的合作者们现在能够研究鸣禽类的连接组,从而了解斑马雀鸟如何演绎它们的歌曲,以及关于它们如何学习唱歌的测试理论。



下一步

我们将继续改进连接组学重建技术,目的是将突触级分辨率连接组件完全自动化,并为马克斯普朗克研究所以及其他地方正在进行的连接组学项目做出贡献。 为了帮助更大的研究社团推进与该连接组学技术相关的研究,我们还开放了用于 Flood-Filling 网络方法的 TensorFlow 代码,以及我们开发的用于帮助理解和改进重建 3D 数据集的 WebGL 可视化软件。


更多 AI 相关阅读:

· Android Smart Linkify 支持机器学习

· MnasNet:迈向移动端机器学习模型设计的自动化之路

· 全新 AIY Edge TPU 开发板惊艳亮相


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存