他们自愿钻进学术“天坑”,只为解开这道最复杂的数学题|追问观察
长久盘桓在张洁内心的孤独感消失了。
“就是有种,第一次见到活的同类的感觉!”即使已经在夏校待了半个多月,她的语气里依然有种新鲜的兴奋感。
粉墙黛瓦、太湖石、松竹、漏窗,冷泉港亚洲中心随处可见的园林元素,提示着这里的地点:苏州。波光粼粼的独墅湖透过教室巨大的落地窗映入眼帘。湖上桨板、湖边慢跑的身影,给传统的建筑环境添了一分国际化的气息。
2023年的这个夏天,张洁从南开大学硕士毕业,学的是人工智能(AI)专业。2018年,在AlphaGo的余波激荡下,包括南开大学在内的一批国内高校新设了人工智能学院。
和大部分同学一样,张洁跟着导师用AI模型进行影像识别、参加国际顶尖的学术会议和机器人比赛,但渐渐地,她觉得沿着这条康庄大道走,并不能抵达内心真正想要追求的目标。尤其是看到那些最前沿的机器人依然和人类智能有很大差距时,张洁掩饰不住自己的失望。
她隐隐觉得,是否能回归到某一处原点,从更本质的角度去切入,也就在这时,她偶然接触到有关大脑模拟的研究。
“或许要真正地提升机器智能,必须真正地了解人类的大脑。” 张洁找到了那条隐藏的小路,蜿蜒曲折,没入未知的密林深处。
这条路叫做计算神经科学。顾名思义,就是用计算和量化,而不仅仅是实验的方式探究人脑的奥秘和智能的本质。它把大脑,视作最为复杂的一道“数学题”。
勇气:“即使走错路,探索的本身就是意义”
即便在实验室里找不到一个能互相切磋的人,张洁仍旧自己构建了一个RNN(Recurrent Neural Network, 递归神经网络)来模拟大脑神经元的工作记忆,并以此完成了硕士毕业论文。期间,除了查询相关论文,她也在网上搜索领军学者的讲座课程。
也是从纽约大学杰出全球神经科学教授、斯沃茨理论神经科学中心主任汪小京教授的一个讲座视频中,她了解到,中国每年都会开设“计算与认知神经科学夏校”,便决定去申请试试。
这个“夏校”坐落于苏州冷泉港亚洲中心,自2011年首届举办以来,声名鹊起。由陈天桥、雒芊芊夫妇创建的天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)也是主要的支持方之一。
自成立以来,天桥脑科学研究院就始终致力于推动跨学科研究及交叉学科人才培养,持续主办了美国加州理工学院-天桥脑科学研究院神经科学数据科学与人工智能夏校(Caltech Chen Institute Data Science and AI for Neuroscience Summer School)、FENS-天桥脑科学研究院NeuroLéman夏校(The FENS - Chen Institute – NeuroLéman 2023 Summer School)等国际跨学科人才培养项目。研究院还自办“AI for Brain Science系列学术会议”及“AI问脑”科普讲座,邀请全球人工智能和脑科学领域学者和从业者分享观点,促进脑科学与AI的跨学科交流与知识宣教。
2023届的“计算与认知神经科学夏校”共收到了将近150封申请,绝大多数的申请者来自世界顶级名校。为保持小班的授课质量,会务组最终筛选出了30名学生,竞争不可不谓激烈。
▷图注:2023年冷泉港计算与认知神经科学夏校开学首日的第一堂课,由汪小京教授授课
张洁在她的Personal Statement(个人陈述)中展现的专业知识和热情打动了包括上海交通大学自然科学研究院、数学科学学院教授李松挺在内的招生评委。
“尤其是从数学、计算机学院来的学生,除了考察他们的编程能力和数理基础,我会特别想要了解他们到底为什么要做脑科学。”
李松挺强调,对计算神经科学家而言,不能只是停留在让AI跑出一个较好的结果上,而是要打开“黑盒”去看看里面的原理,甚至在未来我们可以设计出类似大脑的“白盒”AI。
而第一步打开“黑盒”,这正是张洁想要突破自己对AI原有认知的地方。
在为期22天的课程里,她不仅如愿“找到组织”,见到了“活的”计算神经科学学者,迅速找到了课题的合作者,更加坚定了继续从事大脑研究的决心。
由于从业人数众多、就业范围受限,按照一些功利主义的说法,生物学已经从“21世纪最有前景的专业”沦为“天坑专业”代表。而大脑研究更是堪称人类目前最为复杂、最难攻克的一门学科。
但张洁不害怕从炙手可热的“好专业”AI里跳出来,并跳入这个“天坑”。
“它是一个探索性的学科,前面全都是未知,没有一个固定的方向指引着你。很可能你走过的大部分路都是有问题的,但不能说这些研究都没有意义。探索的本身就是意义。”
她的话令人想起弗罗斯特那首著名的小诗:
“一片林子里分出两条路,
而我选了人迹更少的一条,
因此走出了这迥异的旅途。”
选择:“神经科学到了需要建立理论的时刻”
就在20多年前,这所夏校的联合创始人吴思经历了与张洁极其相似的抉择。吴思教授目前是北京大学心理与认知科学学院院长,麦戈文脑科学所研究员,计算神经科学家。
只是后辈适逢AI的盛夏,而前辈见证过AI的寒冬。
“如今的你们恐怕都想象不到AI的寒冬到底有多冷!”吴思教授对“追问”记者表示。
那是1995年,吴思新晋为物理学博士。但学习完广义相对论等物理理论之后,他对自己是否要以物理学作为学术生涯的开端毫无头绪。物理学大厦发展成熟、根基牢固,若想更上一层楼,要解决的又是些巨大且困难的理论问题。相比起来,AI显得有趣多了。
囿于算力和数据的限制,那个时代的AI还没有“杀手级应用”,公众乃至学界都普遍对此持怀疑态度。至于机器学习,更是小众,如今的“AI教父”Geoffrey Hinton、 Yann LeCun等,当时也被学术界漠视,他们作的研究报告甚至一度无人问津。
“为了避免被人叫‘骗子’,我那时候的简历里面都不会提到人工智能。”吴思笑着摇摇头。
但兴趣驱使着吴思继续“偷偷”做着他的研究。到了2000年左右,他很自然地想到要彻底地研究一下人脑这个宇宙中鲜活的智能样本,从中汲取能让AI发展更进一步的灵感。
吴思觉得,这也是神经科学发展的必然结果。正如经过数百年对辰宿列张和自然运动的观察,物理学家们总结出了万有引力和广义相对论。吴思认为,神经科学也必然会从实验观测走向量化分析和理论归纳。
与吴思同时代的计算神经科学先驱,有三分之二都拥有物理学背景,其中就包括夏校的另一位创始人汪小京。他1987年毕业于比利时布鲁塞尔自由大学。这所大学是普利高津学派的发源地,也自然成为了跨学科人才的一方热土。俄罗斯犹太裔物理学家伊利亚·普利高津(Ilya Prigogine)正是在这里把热力学定律的应用范围扩大到更广泛的化学、生物学领域,也因此获得了1977年的诺贝尔化学奖。
1980年代,汪小京还被一项特别具有科学美感的研究吸引:Hopfield神经网络模型。这是美国物理学家约翰·霍普菲尔德(John Hopfield)受到物理学领域研究复杂系统的“自旋玻璃”(Spin glass)模型启发,开发出的真正具有一定规模和灵活连接关系的多层次神经网络。
玻璃看似简单透明,实有很复杂的微观结构。“自旋玻璃”模型被用来描述微观世界中粒子组成的集体状态。
正如“球总往低处滚”,在“自旋玻璃”模型中,众多无序粒子的动态连接导致它们所构成的磁性材料整体趋向一个能量最小化的稳定状态,而这竟然和人类大脑逐渐形成长期记忆的过程极为相似。
这篇在数学和实验验证上都堪称极致的论文,在当时的学生之间广泛传阅,也激励汪小京走上了这条当时甚至还没有正式学科名称的小路。至今在夏校上作开学演讲,他都会着重介绍这项研究工作,并且现场提问年轻的学子们有否读过。
横跨极大的专业知识差异,涉足一个甚至还没有名字的新领域,其艰难可想而知。对于这段转型经历,对学生们,汪小京会郑重地告诫其做好准备。
35年前的汪小京最终是幸运的。他选择转型的次年,也就是1988年,计算神经科学领域就发生了两件大事:
其一,Science杂志上发表了一篇名为Computational Neuroscience的文章[1],堪称计算神经科学的“独立宣言”;其二,世界上的首个计算神经科学暑期学校由美国麻省的海洋生物实验室(Marine Biological Laboratory)举办。
正是这个夏校,让汪小京开始真正了解数学模型背后的生物学知识,从神经科学角度出发去思考问题,同时也结识了领域内的领军人物。
“要是没有那时的偶然机遇,我可能会面临一个完全不同的未来,甚至计算神经科学这个领域对我来说都可能不存在。”汪小京感慨。
2010年,他在中国科学网发表了一篇文章专门介绍计算神经科学[2],并决定把夏校模式也带到中国,带给更多与他做出类似选择的年轻人。
交叉:“多跟做实验的人聊聊吧!”
“再强调一下,这里是面向生物学背景同学的数学助教课哦,如果你原来是学数学、物理学或者计算机科学的,请去楼上的生物助教课,别在这里‘羞辱’我们的数学啦。”一位助教在上课前半开玩笑地下了“最后通牒”。
夏校开幕仪式结束后,学生们进行了一次自助式的分班。楼下教室开设的是针对生物背景学生的数学课,楼上的教室则平行向计算背景的学生普及神经科学知识,从0开始,一步步引导学生们在学科的交叉路口相遇。
虽然助教这么说,但张洁依然选择留在了数学课上。她和生物学背景的室友决定打一个配合,反其道而行之,双方各自去对口背景的助教课,更容易掌握,晚上回到房间再给对方补课。
▷图注:计算与生物学的自助式选课成为了夏校的一大特色(同一时间,一楼教室开数学课、二楼教室开生物课)
很难再找出一个像计算神经科学这么大跨度的学科。夏校里有一半学生是数学、物理、计算机等专业出身,另一半学生则来自生物实验室,甚至是心理学专业。那么,如何让前者不再惧怕看到那些生物学名词,同时又让后者学会量化他们的实验结果?
2010年,带着这个目的,汪小京和吴思一同邀请了另两位计算神经科学领军人物担任夏校的共同创始人,一位是印度计算神经科学带头人Upinder Bhalla,另一位是有拥有丰富学术资源的神经科学家Zach Mainen,选址在同年启用的冷泉港亚洲总部。
夏校聚焦本世纪才发展起来的针对高级认知的神经机制研究,而非此前学界主要关心的初级感觉(比如视觉)和运动行为的脑系统,第一届就邀请到了包括7位美国科学院及英国皇家学院院士在内的师资阵容。
这四位创办者希望,夏校邀请国内外院士和知名科学家,不仅仅是来做讲座,而是停留更长时间与学生一起就餐、运动、畅谈。
吴思出生在7月中旬,正逢每年夏校的举办期间。“我有整整十年的生日都是在夏校度过的。现在回头想,真是无意中做了一件超出自己预期的事,一件对中国计算神经科学领域有意义的事。”吴思感慨。
▷图注:夏校的老师与助教会长时间地与学员们待在一起
即便张洁觉得助教课上涉及的数学都比较基础,但她依然收获到不少。从计算神经科学的视角重温这些课本上的公式和推导,她第一次穿透数字和符号,“看到”数字背后的生命本质。
此后的正式课程里,每个受邀讲课的老师都会讲两节课,往往在第一节课抛出一个具体的神经科学问题,第二节课讲如何用计算的方式去分析和解决这个问题。
课程之后又安排了助教课,带学生立马做一些巩固练习。值得一提的是,本次夏校安排的5名助教均来自于世界顶尖实验室的博士生或者博后,有些就来自于授课老师的实验室,或是参与过前几届夏校的老校友。
“他们很耐心,甚至有一次他们几乎就是把助教课内容在课后又从头到尾给我讲了一次。”张洁说道。
夏校希望,这种平等互动的交流,能让学生逐步习惯表达自己的观点,甚至敢于挑战学术权威。
一次课后用餐时,张洁忍不住问了汪小京一个问题:“您刚才课上提到的那个研究,一开始到底是怎么想到这种思路的?”
这其实是汪小京偶然和一位实验生物学家在开放性讨论中得出的灵感。因此,他鼓励这位后辈学生:“多跟做实验的人聊聊吧!”
对此,李松挺深表赞同。他当时在夏校的室友就是实验神经科学背景,两人在夏校学习之后一起完成了很多理论与实验结合的研究工作。
提问:“要找到自己愿意做一辈子的问题”
7月19日,夏校倒数第三天,“追问”记者再次探访现场。
学生们已经结束了白天的课程,分散在休息室,大多忙于准备毕业项目的设计。
此时的张洁在夏校已经找到了她的“实验合作伙伴”,只聊了一次,一拍即合。她们决定基于去年发表在Science上的重磅论文《序列工作记忆在猕猴前额叶表征的几何结构》[3],考察RNN网络在不同长度序列间的迁移学习能力。
休息室内,李贤发音纯正的英语在中国学生中尤其突出。与她交谈后记者了解到,她本科的专业是英语文学,即使在人均跨界的计算神经科学领域,这么大的跨度也令人吃惊。
李贤在本科出国交流的一年期间,自主选择了许多STEM课程,她对神经科学尤其感兴趣,由此开始了这段转型之旅。如今,她正在准备博士毕业论文,专注于人类记忆的编码和解码过程,对她来说,这个领域仍然同第一天接触时一样令人着迷。
相较而言,被热情活泼的李贤硬拉过来接受采访的陈为身上带着一种“冷幽默”。本科读软件工程时,他对AGI(通用人工智能)十分着迷。他曾一脸兴奋地问AI课老师AGI能否实现,结果被泼了一盆冷水。
“老师说你别想了,现在是第三次AI寒冬。于是我就转去做神经科学了。现在我了解了更多大脑的奥秘,了解了人之智能和机器智能有多大的不同,最重要的是了解了神经科学不能解决所有问题。我得想想办法,再转回去做AI。”陈为风趣的叙述引发了一阵笑声。
无论如何,AI是今年逃不开的话题。在课程内容方面,夏校除了介绍单细胞、神经网络、感知模型、语言模型、认知地图等前沿方向,也结合产业界热点,邀请了微软的专家来介绍如何用认知神经科学的方法研究ChatGPT的推理能力,对照其与人类大脑的相似性。
AI强大的数据处理能力,给解码神经活动、理解大脑机制提供了有力的帮助,而神经科学实验也能反向验证AI模型的能力。但只有通过神经科学的方法去定义人的思维和智力,理解思维和智力的神经机制,才能考察AI与人的差距。
“现在年轻人关心的一个热点当然是AI,但今天的AI系统与人脑仍相距甚远。我们对人的智能生物机制了解还很不够,基础研究需要长期的努力。有人激情在技术开拓,有人更潜心基础研究,也有人热衷于用神经科学来发展精神医学。”汪小京说道。
“年轻人寻找自己真正一辈子热爱做的事情,每个人的答案都是不一样的。如果是研究一个自己认为很有意思的问题,就可以静下心来,不必抢赶时髦。”
汪小京坚信,夏校所带给学生的最大价值就是提问精神:“一个聪明的、有想象力的学生,要让他知道怎么问问题,这比回答问题更重要。”
汪小京还记得,李松挺是夏校第二届的学生,当时他的提问就能体现出其思考的深度。另一个留下深刻印象的“好奇学生”是夏校历史上招收的第一个本科生杨光宇,他如今是麻省理工学院的助理教授。
夏校存在的十多年,也是国内外计算神经科学高速发展、走向显学的十多年。单一的实验已难描绘从基因到细胞到神经网络再到宏观行为的系统神经科学,只有搭建计算模型和理论,才能跨越如此多层次捕捉到认知的本质。
如今,许多当年的学生已成长为国际知名学者,构成计算神经科学界强劲的新势力,包括李松挺、杨光宇、陈为在东京大学神经智能国际研究中心的导师蔡明博,还有耶鲁大学终身副教授Alan Anticevic、Meta研究员Jean-Rémi King、OpenAI研究员Francis Song等等。
这离不开夏校13年来探索与求知精神的传承。
当问起陈为,他有没有这样一个想研究一辈子的问题,“冷幽默”消失了。这个26岁的年轻人没有一秒钟犹豫,脱口而出、语气坚定:“我想用AI找出精神分裂症的起源。”
参考文献:
1. Sejnowski, T. J., Koch, C. & Churchland, P. S. Computational Neuroscience. Science 241, 1299–1306 (1988).
2. 汪小京. 21世纪的中国计算神经科学展望. 《科学时报》(Science Times), 2010年8月25日.
3. Yang Xie et al. Geometry of sequence working memory in macaque prefrontal cortex. Science375, 632-639 (2022). DOI:10.1126/science.abm0204
End
关于TCCI
天桥脑科学研究院(Tianqiao and Chrissy Chen Institute,TCCI)是由陈天桥、雒芊芊夫妇私人出资10亿美元创建的,旨在聚焦AI+脑科学,支持、推进全球范围内脑科学研究,造福全人类,目前已经成为知名的支持人类脑科学研究的科研机构。
TCCI一期投入5亿元人民币支持中国的脑科学研究,与上海周良辅医学发展基金会合作成立上海陈天桥脑健康研究所(又名TCCI转化中心),致力于提升脑健康和脑疾病治疗研究和成果转化。后又与华山医院、上海市精神卫生中心等建立战略合作,设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室。在国际上,TCCI与加州理工学院合作成立TCCI加州理工研究院,设脑机接口、社交与决策神经科学、系统神经科学、分子与细胞神经科学、大脑成像、神经科学教育等多个中心,重点关注大脑基础研究。TCCI还在北美、亚洲、欧洲、大洋洲主办、资助了200多场高质量的学术会议。