其他
人脑就像一台施了魔法的纺织机,在不停地编织着与外在世界相关联的图样,把一个图样拆散了之后又重新编织起来,发明出其他的世界,创造出一个缩小的宇宙[1]。——查尔斯·谢林顿,1941一个世纪以前,人们以神秘的魔法形象,描述着大脑复杂、精妙的运作。短短百年过去,我们已能逐一揭示这魔法的秘密,并将脑自身的图样一一勾画,俨然迎来了“创造”大脑的新局面。在这图样的绘制中,我们已把大脑的魔法降维到可理解的层面。小到神经元,从1907年的积分放电神经元模型,到2013年用于类脑的TrueNorth模型,我们已能模拟超20种的神经元行为;大到脑图谱,从1909年基于观察的布罗德曼的脑分区图谱,2016年的人类连接组计划的多模态脑图谱,再到欧洲和美国的脑图谱计划、艾伦人脑图谱库涌现出的高精度图谱,我们对人脑的全面结构和功能的了解,以及相关数据的积累都已有了质的飞跃。图1(上):神经元模型发展史[2]图2(下):脑图谱发展史[3]然而,随着我们能破解的脑魔法越来越多,我们所面临的问题也越来越棘手。随着检测技术的提升及人口老龄化的发展,阿尔茨海默病、帕金森病、中风、抑郁症等脑疾病,带来了巨大的医疗和社会压力,成为了全球公认的重大问题。尽管神经科学发展日新月异,但仍然缺乏行之有效的预防与治疗手段。反观传统的神经生物学研究,大都延续着半世纪前的技术,冒着只攻一点,埋头苦干四五年,硕博毕业无期限的风险,费时费力,产出微弱,转化困难,已无法满足时代的需求。幸运的是,人工智能和计算机科学的蓬勃生机,为神经科学带来了新的生命,我们也得以创造前人不可想象的魔法。以哺乳动物新皮质回路模拟为例,随计算机及其软件的进步,该领域涌现出了大批模拟与开发大脑的工具(图3蓝色部分)。这让复杂的神经元模型开始简化,可用数据的数量和质量也呈爆炸式增长,进而促进关注一块膜的H-H模型发展为详细模拟整个皮质区域的皮质电路。更甚的是,借助人工智能的魔法,我们已能在宏观尺度,初步模拟大脑的行为和机制。譬如,Izhikevich和Edelman提出的丘脑皮层系统模型,已表现出与正常大脑活动相似的行为特征;由250万个神经元组成的SPAUN,则已能够模拟大脑利用不同脑区协同展示多个认知功能的能力。图3:利用基于电导的空间扩展神经元模型,对皮层回路进行详细网络建模的历史进步。神经活动的开创性研究(绿色),各种神经元(黄色)和神经网络(红色)的发展以及计算建模基础工具(蓝色)[4]。随着越来越多的神经科学数据库的创建与公开,大脑图谱相关数据逐步积累,人工智能算法算力的全面发展,全脑仿真的构建也日益引人瞩目。近10年来全球各国都在脑模拟研究上进行了大规模布局,无论是欧盟脑计划、美国脑计划的发展、还是日本Brain/MINDS计划,中国脑计划的出台,都预示着我们正站在这历史的交叉点上。用图计算构建脑仿真脑仿真本身,并不新鲜。自1943年的人工神经元模型,到如今的脉冲神经网络,都为脑仿真迈出了结实的步伐。然而,技术的发展赋予了脑仿真新的使命。以往的脑仿真系统常用的架构,大多停留在20年前的数据量、计算机能力和生物学对脑的理解。我们需要一个全新的脑仿真架构,来容纳更大量的数据、提供更宏伟的算力,从而实现更精确的仿真和预测。用于数据挖掘的图计算技术,与神经元和脑仿真有着天然的相似。基于图计算技术搭建的高精度脑仿真架构,有望为揭示大脑的秘密提供一种新的研究方法和手段。什么是图计算图(graph),是一种表示对象之间关联关系的数据结构,由节点和边构成。例如在实际生活中,以火车站为点,站与站之间的距离为边的道路网络是图;以人为点,人与人之间的关系为边的社交网络是图。可以说,只要关系在,图就在。社交网络就是典型的图数据而我们的大脑,也是由神经元连接而成的复杂网络,其神经元间的信息传递机制,与图有着天然的相似性。将这种相似性应用于神经科学,便是把神经元视为节点,把神经元之间的连接视作边,将大脑建模成图。其中根据情景的不同,边可以有多种类型,以满足神经元连接的不同需求。如基于连接是否携带方向信息(因果关系),可以分为有向图和无向图;根据连接是否具有不同的权重,可以分为无权图和加权图。此外,这个图将提供所有节点和边关系的完整映射,也就构成了神经网络的拓扑结构。使用图进行复杂脑网络研究,可以追溯到人类连接组计划。而基于图的网络分析,可以揭示有关人脑网络拓扑结构的不同信息[5],如聚类系数(图4A),能判断神经元间聚集性;社团挖掘,能找到相似的神经元种类;最短路径长度(图4B),测量两神经元间最短距离;小世界性(图4C),以较少的路径连接到目标神经元;同配性、异配性(图4D),判断神经网络鲁棒性,反映神经网络能抵抗的故障程度;网络中心性,识别神经网络的枢纽(图5A)、桥梁、访问速度、连接质量(图5B)等[5,6]。图4(上):应用图论识别人脑网络连接模式[5]图5(下):应用图论识别人脑网络连接模式网络中心性的特征[5]从图计算到图神经网络所谓图计算,就是将数据建模为图结构的算法模型。它试图将问题解法转化为图结构上的计算问题,以对大规模数据的关系与模式进行挖掘,实现知识推理、事件溯源、决策、预测和推荐等功能。在日常生活中,社交媒体公司可以使用图计算,理解用户社区的形成和发展,更好地定位广告;生物学家可以使用图计算,探究蛋白质相互作用,找到新的药物治疗方案。在图计算中,又以处理非欧几里得特性的图神经网络(GNN)最为热门,其中的图卷积网络(GCN)已在脑图预测、缺失的脑图整合、疾病分类和识别生物标志物中发挥着重要作用[7]。一般来说,传统的人工智能方法主要是从某种“固定”结构编码的对象中提取信息。然而这与大脑神经网络的特性并不相符。毕竟,由神经元构成的图数据,并无固定的节点排列顺序,每个节点的连接也是可变化的。图卷积网络则通过整合中心节点和邻居节点的特征和标签信息,给出图中每个节点的规整表达形式,并将其输入到传统的卷积神经网络中,组成更高层次的表达,以有效利用图结构信息和属性信息。[8]图6:一个标准的空间图卷积处理流程[8]当我们在医院做磁共振成像(MRI)扫描时,医院往往只对你进行一次扫描。而这一次扫描的结果,通常并不完整。而基于图计算衍生出的生成对抗网络几何深度学习框架,可以从源图预测目标形态脑图,从功能图预测结构脑图(图7A-1);从单个形态图合成功能和结构脑图(图7A-2),以帮助医生判断。此外,在神经影像学数据中,我们获取的脑图质量可能参差不齐,其中不乏低分辨率的图片。利用图U-自编码器,引入基于图特征分解的超分辨传播规则,可以生成具有更多节点和连接的高分辨率图(图7B),进而帮助数据收集和整理。此外,基于图神经网络,我们还可以生成代表性的大脑连接模板(图7C);时间序列脑图(图7F);发现脑图中存在的区分性生物标志物(图7D);预测被试状态,进行疾病分类(图7E)等。[7]图7:基于网络神经科学,利用现有的图神经网络方法能实现的功能示意图。[7]图计算的优势故而,随算法的不断发展,基于图计算进行脑仿真,得天独厚,势在必行。不同于以往传统神经影像学的仿真模式,图计算呈现出更鲜明的特色。1)图计算的核心“图”,拥有独特的节点连接结构,可以通过节点和边存储大量的信息,能实现更高精度的仿真架构;2)图计算允许科学家创建和处理任意拓扑结构的网络,通过对节点和边进行灵活处理(如增加、删除或修改),来更准确地反映大脑的真实结构,也能模拟神经元的动态变化,计算更多更复杂的关系;3)介于神经网络存在着数十亿个节点,若以单一系统处理无疑是痴人说梦,而图可以实现分布式计算,节省了大量计算量,降低了时间复杂度;4)相关模型的搭建,能帮助硅基空间的脑仿真虚拟实验平台的构建,以辅助药物、脑科学的研究和开发,为药物研究早期靶点筛选提供硅基模型。但同样,基于图计算进行脑仿真,也存在一些急需突破的地方。1)将具有树状结构的神经元视为节点,势必会造成信息的遗漏,而这可能需要通过网络动力学来进行状态更新以弥补损失;2)图的结构和属性可能随时间变化,这使得计算和分析难度陡然提升,这不仅需要我们开发新的算法来应对,同时也对存储和算力带来了巨大的挑战;3)要实现实时或近实时的动态图分析,对计算和处理速度都有着较高要求;4)无论模拟方式是基于时间切片,还是基于事件驱动,所需的总体成本都颇为昂贵。蚂蚁携手复旦,破壁图计算与脑仿真近日,蚂蚁技术研究院图计算实验室,与复旦大学脑科学研究院神经药理实验室的合作——“基于图计算的脑仿真架构项目”,正式启动,为该领域带来了新的生机。在图计算这片沃土上,蚂蚁早在2015年就开启了深耕。蚂蚁自主研发分布式图数据库、流式图计算等图相关技术,为支付宝实现信贷风控、反洗钱、反欺诈、资金追踪、营销推荐等提供强大的支持。荏苒七载,借力支付宝、芝麻信用等业务,蚂蚁得以在世界级的图计算场景历练。而这推动着蚂蚁在算法层面、大规模数据处理等逐步突破。而其联合清华大学自主研发的高性能图数据库TuGraph,更是凭借优异的表现,多次登顶行业权威测评LDBC榜首,成为世界纪录的保持者。虽然金融数据与生物学数据相去甚远,但在图计算上,蚂蚁拥有的丰富的经验与技术积累不容小视。这些都将帮助蚂蚁快速开发和迭代图计算工具,以更高速度与质量适配到脑仿真领域。这次蚂蚁技术研究院与复旦大学脑科学研究院的产学研合作,不同于常见的校企合作。蚂蚁技术研究院不仅提供深厚的技术支持和强大的计算能力,还将有多名专攻图计算领域的蚂蚁技术研究院研究员深度参与。复旦承担生物学实验部分,蚂蚁负责图计算部分。具体来说,这一项目先通过生物实验,将中隔区的神经连接如实还原,再结合现有的在线脑图谱数据,利用图计算构建仿真框架,透过模型验证实验,将生物实验和仿真实验形成一个自我完善的“环”。接着,他们希望能通过中隔区-海马-皮层,逐步递进,实现高精度脑仿真,为未来的脑模拟研究提供高精度的仿真和预测,并最终为相关的脑研究提供一个工具平台。-