查看原文
其他

【完整版】人类唯一的出路:变成人工智能

Tim Urban 鹤啸九天 2022-04-26

注:由于平台篇幅限制,以下是局部,全文参考:

英文版:https://waitbutwhy.com/2017/04/neuralink.html

中文完整版文档:https://share.weiyun.com/5y4D89d

waitbutwhy.com官方中文内容源


本文作者Tim Urban:

Wait but Why的作者Tim Urban 是埃隆马斯克(特斯拉/SpaceX创始人)强烈推荐的科技博主。他写的AI文章是全世界转发量最高的。他的粉丝还包括:Facebook创始人马克扎克伯格,Facebook COO谢丽桑伯格等。Tim也是TED演讲平台上有史以来最受欢迎的演讲者之一

在一个由人工智能和“其他所有生物”组成的未来, 人类只有一条出路:“变成人工智能。

Tim Urban,之前火热的文章《为什么有很多名人让人们警惕人工智能》也是出自他手,英文原文刊载于waitbutwhy.com,点击文末的阅读原文可以跳转到原文链接。


本翻译版本由谢熊猫君提供,全文共六万字。两百余张图片,分成六个章节,将分成五篇推送完成。


第一章:人类巨灵 (约7000字)简述人类语言、智能和人类巨灵的崛起

第二章:大脑 (约8000字)简述大脑结构,为了解脑机接口提供基础知识

第三章:脑机接口(约12000字)讲述脑机接口的基本原理和目前的技术水平

第四章:挑战(约8000字)讲述目前脑机接口跨越到全脑接口所要面临的挑战

第五章:魔法纪元(约13000字)全脑接口实现后未来的人类会是怎样

第六章:大融合(约10000字)人类唯一的出路:变成人工智能


Elon mush本人的评价:


本次推送是总过五篇推送中的第一篇,包括了以上第一章和第二章的内容,约15000字,100张图,会占用您10MB左右的流量,阅读完全文约20分钟,读到一半需要退出回微信的话建议先收藏。







2017年3月,我接到一个电话....

好吧,其实谈话不是这么简单,图中描述的也不是我们的实际用词。但是当我明白了埃隆 马斯克的新公司的目的后,我突然发觉,埃隆真的就是要造一顶魔法帽。

我在之前的文章里面谈论特斯拉和SpaceX的时候,我明白了当你要真正的了解一些特定的公司的时候,你需要开启两种视角——微观视角和宏观视角。微观视角用来关注工程师们面对的技术挑战,而宏观视角用来关注人类这个种族所面对的存亡挑战;微观视角用来解读现下这个世界的剪影,宏观视角用来解读我们如何走到了现下的这一步,以及遥远的未来会变成怎样。

在接触了Neuralink之后六个星期,我意识到它不只是埃隆的新创业公司,它在激进程度、工程创举和任务的宏大程度上,都要超越特斯拉和SpaceX。特斯拉和SpaceX想要重新定义未来的人类会做什么,Neuralink则想要重新定义未来的人来会是怎样。

Neuralink的使命所开的脑洞之大,再配合上人脑迷宫般难以想象的复杂程度,使得这次我接触了一些很难完全理解的一些概念。但是这也是我最感振奋的一次。在花了足够的时间在微观和宏观两个视角上思考后,我终于理解透彻了。这种感觉就好像乘坐时光机去了一趟未来,然后再回到当下来和各位读者解释,其实未来比我们预期的还要不可思议。

但是在我带你乘上这台时光机之前,我们先要用从微观和宏观视角观察一下——根据我的亲身体验来说,埃隆的魔法帽计划需要很多的背景知识才能了解。

 所以放空你的大脑,忘记它对自身和大脑未来的了解,换一身舒适的服装,然后随笔者一起跳进这思维的漩涡吧。





第一章



人类巨灵


六亿年前,所有生物都是无所事事的。.



因为任何生物都没有神经。没有神经就不能动,甚至不能思考,或者处理任何信息。所以生物只是存在,然后等待死亡,如此往复。

直到水母出现。


水母是第一个意识到神经是个好东西的动物,它有世界上最早的神经系统——一个神经网。


水母的神经网使得水母能够从周围环境中收集重要信息,比如物件、食物和捕食者的位置。收集了这些信息后,神经网通过电话网络式的方式,把信息传递到身体的各个部位。相比漫无目的的漂浮着,水母能够收集和处理信息,意味着水母能够随着环境的变化而做出反应,从而能够更好的生存。



稍后,另一个动物带来了一个更酷的点子。


这种叫扁形虫的动物,发现如果在神经系统中有一个为一切做决策的“人”,一个神经系统大佬,整个神经系统会更有效率。这位大佬活在扁形虫的头部,并且设定了一条规则——所有神经收集到的任何新信息,都需要直接传递给大佬。于是,扁形虫的神经系统就不再是一张网,而是一个以大佬为中心,有着无数信使在大佬和其它神经之间快速传递信息的传输体系,我们在这里把它称作大佬快传体系:


扁形虫的大佬快传体系,是世界上最早的中枢神经系统,而扁形虫头部的大佬,就是世界上最早的脑。

很快,神经系统大佬这个超酷的点子流行了开了,地球上有了成千上万的动物有了脑。

随着动物们开始演化出各种错综复杂的身体系统,大佬的工作也变得日益繁忙。


又过了一段时间,哺乳动物出现了。在那之前的动物王国,生命是个很复杂的东西——动物们的心脏要跳动,肺也要呼吸。但是哺乳动物远比这些基本的生存功能要复杂,除了生存之外,哺乳动物还要接触复杂的感觉,比如爱、愤怒和恐惧。

对于爬行动物的脑来说,它们原本只需要和其它爬行动物或者更简单的生物打交道 ,但是哺乳动物太复杂了。于是,第二个大佬出现在了哺乳动物的身体里,和原本的大佬搭档,专职处理新的需求,大佬二号就是世界上最早的边缘系统(limbic system)。


在接下来的一亿年里,哺乳动物的生活变得越来越复杂,直到有一天,两位大佬发现一个新的住户搬进了它们的指挥大厅。






这个新的住户看起来只是一个随机产生的婴孩,但事实上,它是新皮质(neocortex)的原型。虽然它一开始什么都不说,但是随着生物界演化产生了灵长类和大猿(great ape),以及早期原始人(hominids),这个婴孩逐渐长成了小孩,进而长成了一个青年,也开始有了自己的行事规则。


青年大佬的点子非常有效,于是它变成了造工具、狩猎策略以及和其他原始人的合作等事务的默认决策者。

在接下来的几百万年中,青年大佬变得年长和睿智,它的点子变得越来越棒。它学会了穿衣服,使用火焰,和制造狩猎长矛。


但是它最酷的点子是“思考”。它把每一个人类的头部变成了一个独立于外界的小小世界,使得人类能够思考复杂的想法,能够通过决策来推导,能够制定长期规划。



 然后,又过了大概10万年,它有了一个更大的突破。


人类的脑已经进化到了能够理解“石头”这两个字的读音虽然不是一块石头,但是可以被用来指代石头——这意味着,人类发明了语言

到大约公约前5万年前的时候,更多用来指代物件的词汇被创造出来了,人与人之间能够用完整和复杂的语言互相交流。

新皮质把人类变成了魔法师。它不但把人类的头部变成了一个充满了复杂思想的海洋,它所发明的语言还能够把这些复杂的思想通过空气振动造成的符号式的声音传达给其他人类,这些符号式声音的接收方,能够把这些声音解码,并且把这些声音后面包含的思想导入到自己思想的海洋中。人类的新皮质已经思考这种思想很久了,现在它终于能把这些思想与人交流。

接下来就是新皮质们的派对。新皮质彼此之间分享各种事情:过去的故事,编出来的段子,自成的观点,未来的计划。但最有用的,还是分享他们学到的东西。如果一个人类通过试错学到了吃某种浆果会拉肚子两天的惨痛经验,他可以把这个经验用语言分享给整个部落的人,就好像把经验复印了一遍,然后分发给了每个人。部落的人们会把这个经验用语言转达给他们的孩子,他们的孩子会转达给再下一辈的孩子。同样的错误,不会被不同的人重复,一个人从经验中得来的智慧,会穿越时间和空间,来保护每个人不用遭遇同样的痛苦经历。

同样的过程,会在每一个新颖的窍门被发现的时候再重复一遍。一个天赋异禀的猎人,能够很好的观察星象和动物的年度季节迁徙,创立出一种观察夜空来预测猎物回归的时间的体系,然后他会把这种体系与其他的猎人分享。虽然能够自己创立这种体系的猎人非常罕见,但是通过口耳相传,这种猎人所在部落的所有后辈猎人们,都会从这个祖先的聪慧中获益——每一个猎人探索的突破,都会成为未来所有猎人的起点。

这种知识上的进步会让狩猎季更加有效率,这就给了部落成员更多的时间来改进武器,经过几代人的积累,也许后辈中又会有一个格外聪慧的猎人,发现一种制造更轻、更坚固的矛的方法,让猎人扔矛变得更精确。于是,部落里每一个现在的和未来的猎人都会用上更有效的矛。

语言,让最聪明的人最棒的灵感,经过数代人的积累,聚成了一座小小的部落知识之塔——一份他们所有祖先的“屌爆了”时刻排行榜。每一代后辈都能够把这座知识之塔装进自己脑中,成为自己人生的起点,走向更好的发现,把这座知识之塔越建越高。语言就是以下这条曲线

跟这曲线区别的关键


两条曲线巨大的不同源自两个方面。有了语言,一代人之内可以互相学习很多知识,把这些个人的知识点结合起来。同时,代与代直接可以通过语言把更多的知识传递给下一代,使得知识在历史中留存更久。

 


 

当知识能够被分享,它就变成了一个巨大的跨代合作工程。几百代人以后,“不要吃那种浆果”这个小贴士,变成了一整套常年大规模种植适合人类食用的浆果的体系。最初关于猎物迁徙的观察,变成了野山羊驯化的体系。矛,在几万年的时间里经过成百上千次的改进,变成了弓和箭。

 

 

语言,使得一群人类能够像一个集体智能一样运作,而这个集体智能远比任何一个单体的人类的智能要强大。同时,这群人类中的每一个个体都能从这个集体智能中受惠,好比这些知识都是由这个个体自己想出来的一样。我们现在觉得弓和箭是很原始的科技,但是如果你把婴儿爱因斯坦丢去一个没有关于弓箭知识的原始社会,然后让原始社会长大的爱因斯坦发明他能想到的最好的狩猎工具,我敢打赌他的知识、技能、和智慧根本不足以发明弓和箭。只有人类的集体智慧,才能从无到有发明弓箭。

 

语言让人类能够构建复杂的社会结构,这一切,配合着农作物种植和动物驯化等高端科技,使得小部落逐渐在固定地点长期定居,然后逐步合并成大型部落,而知识之塔也合并成了知识巨搭。大规模合作提升了所有人的生活质量,到了公元前一万年左右,最早的城市出现了。


有个计算机网络定律叫梅特卡夫定律,该定律告诉我们:一个网络的价值与联网的用户数的平方成正比。参考下面的这个图:


这个定律对人同样有效。两个人能组建1个对话,三个人能组建4个不同的对话(3个双人对话,以及1个三人对话),五个人能组建26个对话,二十个人能组建1048555个对话。

 

所以,知识巨塔不只让一个城市的市民们受益。梅特卡夫定律同时意味着人与人之间组建对话的可能性达到了一个前所未有的数量级。更多的对话意味着更多的点子互相碰撞,更多的发现互相协同,同时,创新的步幅也越来越快。

 

 

人类很快掌握了农业,使得更多人不用参与作物种植,而能空出时间来思考别的点子。不久之后,一个新的大创新出现了——文字。

 

历史学家认为人类最早的文字出现在五、六千年前。在那之前,知识的巨塔只存在人类记忆的网络里,而对于这些知识的检索只能通过口耳相传的交流。这个方式在小部落里没有问题,但是当巨量的知识需要在庞大的人群里分享的时候,单靠记忆就显得力不从心了,很多的知识会应此丢失。

 

 

语言让人类能把思想从一个人传递到另一个人,文字则让人类能把思想记在物理物件上——比如石刻。这使得知识能够长久留存。当人们开始在羊皮卷或者纸上开始写字的时候,原本需要数周才能口耳相传的知识,被压缩成一本书或者一个能握在手中的卷轴。人类的知识巨塔开始以物理形式存在于城市的图书馆和大学里的书架上。

 

这些书架变成了人类对于万物的使用指南。它们指引着人们进行新的发明和探索,而新的发明和探索变成新的书来反哺壮大这些书架。这些使用指南教会了我们精妙的利用贸易和货币,制造船只和大厦,研究医学和天文。每一代人都能从一个比上一代人更高的知识和技术起点出发,进步的步伐持续加速。

 

 



然而,呕心沥血而成的手写书就像宝藏一样,只有顶尖的精英才能染指。15世纪初,整个欧洲只有约三万本书。然后,下一个大突破出现了——印刷机。

 

 15世纪的时候,大胡子约翰内斯.古腾堡发明了一种给一本书创造多份完全一致的拷贝的办法,这个新方法前所未有的快速和廉价。更重要的是,这种复制方法还非常准确。其实在古腾堡出生的时候,人类已经搞明白印刷机95%的前期技术,古腾堡以这些知识为起点,完成了最后的5%,所以古腾堡并没有发明印刷机,中国人比古腾堡早了几百年。其实很多你所熟知的世界各地的发明,很

可能都是在中国内最早发明的。古腾堡的印刷机的原理是这样的:



我找到了一个关于古腾堡的印刷机的工作原理的视频,看完感觉也就一般般。我原本以为古腾堡造出来的是个天才机器,然而事实上他只是创造了一堆字母和标点的活字印章,然后手动的把它们摆成段落,接着手动在印章上面刷上墨水,最后把一张纸压在印章上面,就成了一页书了。每次他手动排完一页印章后,他就会印好多份,然后他会花很久时间再排下一页,然后重复这个过程。他最早的项目是印180本圣经,而这个项目花了他和他的员工们两年的时间。

 

这堆活字印章这就是古腾堡的技术?我看完视频后感觉我好像也能轻易想出这个点子,人类居然花了五千年才想出来活字印章。所以,其实我不是针对古腾堡,我是觉得全人类好像都一般般。




好吧,虽然古腾堡的印刷机不是想象中那么天才,但是它是人类传播知识能力的一大步。接下来的几个世纪,印刷技术突飞猛进,从古腾堡时期一个小时能够印25页,到19世纪初一小时能够印2400页。

  

大规模印刷的书籍让信息像野火一样传播。同时书籍的造价也越来越低,教育不再是精英的特权,数以百万计的人能够阅读书籍,识字率也大规模上升。一个人的思想能够传播给数百万人,大众传播的时代开始了。

 

书籍的雪崩式涌现,让知识越过了边境,原本全世界各个区域的知识终于融合成了一个直冲云霄的全人类知识巨搭

 

我们在大规模尺度上沟通的能力越强,我们作为一个种族越能像一个联合体一样行动。人类的知识巨塔,作为这个联合体的脑,而每一个人类就像这个联合体的一个神经元或者一条肌肉纤维。随着大众传播时代的到来,这个种族联合体——我们称之为人类巨灵,也出现了。


因为有全人类所有的知识作为脑,人类巨灵开始发明一些任何人做梦都没法单独发明的东西,这些东西对于仅仅几代人之前的人类来说就好像荒诞的科幻小说一般。

  

人类巨灵,把牛力车发展成了火车,马拉车变成了铁皮汽车,灯笼变成了电灯泡,手写信变成了电话通信,工厂工人变成了工业机器。我们飞越了天际,进入了太空。随着广播和电视的出现,“大众传播”被重新定义——一个人脑子里的想法,可以即时被传达给数十亿人。

  

如果一个人类个体的核心驱动力是传递他自己的基因,使得种族可以延续,那么在宏观经济的作用力下,人类巨灵的核心驱动力就是创造价值,具体来说就是发明更新更好的技术。每次有更新更好的技术发明出来,巨灵就变成一个更好的发明家,从而能更快的发明新东西。




 

而到了二十世纪中期,人类巨灵开始创造他最有野心的发明。

  

巨灵早早就发现,最好的创造价值的方法就是发明出能创造价值的机器。在很多领域,机器比人类更加厉害,这就产生了很多能够创造价值的新资源。更重要的是,机械劳动力能够解放人类的大块时间和能量,也就是说巨灵本身会有更多的精力来专注于创新。在此之前,巨灵通过脑力把人类上肢的工作通过工厂机械来替代,人类下肢的工作通过车辆来替代,现在,如果把人类大脑的工作也由机器来代替呢?

 

最早的数字计算机出现在二十世纪四十年代。

 

有一种计算机能够代替的大脑工作是信息存储——计算机很擅长记忆。我们早就学会用书本来代替人脑记忆,就好像我们用汽车(在更早之前则是马)来替代我们腿的工作。

 

电脑起初也是用来替代人脑记忆的,是书本的一个升级,就好像汽车是马的升级一样。

 

信息处理就是另一回事了,我们一直没想过能怎样把信息处理这一脑力劳动给外包出去。人类巨灵的信息处理工作一直都是自己来处理的,直到计算机改变了这一切。

 

工厂机械让我们外包了物理流程,我们把材料放进机械,机械处理材料,然后产出成果。计算机能够做同样的事情,只不过处理的不是材料而是信息。一个软件程序做的就是像机械处理材料一样处理信息。

 

计算机这个信息储存、整理、处理的机器非常有用,计算机作为企业和政府日常工作的核心工具逐渐流行起来。到二十世纪八十年代末,个人都开始拥有个人计算机这种大脑助手了。

 

然后人类又迈了一大步

 

九十年代初的时候,我们教会了数百万的大脑-大脑助手(计算机) 节点如何与其它的节点交流。这些节点组成了一个世界范围的计算机网络,而一个新的联合体就产生了——我们称它为计算机巨灵


计算机巨灵和它的网络,对于人类巨灵的效用,就好像菠菜对于大力水手的效用一样。

 

如果每一个人类个体的脑就像人类巨灵的神经元和肌肉纤维一样的话,那么互联网给了人类巨灵一个正经的神经系统。每个神经系统的节点都是和其它所有的节点互联的。信息能在这个系统里以光速传播,让人类巨灵的思考变得更快更顺滑。

 

互联网使得数十亿人类能够实时、自由、轻易地检索整个人类的知识巨搭(现在巨塔比之前高了很多,甚至越过月球了)。这让人类巨灵变成了一个更聪明更快的学习者。

 

如果个体的计算机变成了个人、公司和政府大脑的延伸, 计算机巨灵则是整个人类巨灵的大脑的延伸。

有了计算机巨灵这个真正的神经系统、升级版的大脑和强大的工具,人类巨灵能够以前所未有的方式发明新事物。而同时人类巨灵意识到计算机这个帮手很强大的时候,他也把一大块的精力放在发展计算机技术上面。

 

他学会了用更低的价格造出更快的计算机,把互联网变得更快而且无线,使得计算机芯片越来越小,使得每个人的口袋里都能装下智能手机这个强大的计算机。

 

每个创新,都好像给人类巨灵喂了一整车菠菜。


但是今天,人类巨灵有了一个比菠菜更加宏大的点子。计算机已经改变了人类的格局,使得人类能够把脑相关的任务外包出去,并且能帮助人类像一个单体一样运作。但是现在还有一类脑力劳动是计算机不能代理的——思考。

 

计算机可以计算、组织,还能运行复杂的软件,有些软件甚至能自己学习。然而计算机不能像人类一样思考。人类巨灵深知自己创造的一些,都源自于人类能够独立和有创造性的思考,而大脑的终极扩展,其实是一个能够自己思考的工具。人类巨灵还不知道的,是如果计算机巨灵睁开慧眼,自行思考的话,世界会变成怎样。但是要记住,人类巨灵的核心目标是创造价值和推动技术不断追求极限,人类巨灵是怀着巨大的决心要探索出一个结果的。





我们在后文再继续探讨以上的问题。在那之前,我们先补充点背景知识。

 

笔者曾经在以前的文章提过,知识就像一株树,如果你学习一个课题相关的树枝或者树叶,但是没有树干这个根基,这个知识是学不进去的。树枝和树叶没有可以依附的基础只会被风吹走。

 

我们前面说了,埃隆 马斯克想做的是给大脑造一顶魔法帽。那么理解为什么他要这么做,就是了解Neuralink的根基,也是了解我们的未来可能会是什么样子的根基。

 

但是除非我们明白这个魔法帽究竟是什么、戴着魔法帽会有什么效果,以及我们怎样从现在到达这个目标,前面所说的根基将会难以理解。

 

而关于这一些前提知识的讨论的基础,就是先明白什么是脑机接口,脑机接口怎么工作,以及现在的脑机接口技术水平是怎样的。

 

而脑机接口本身也不是树干,而只是一根比较大的树枝而已。要真正了解什么是脑机接口和它的功用,我们先要了解大脑。大脑是怎么工作的,才是我们需要最先掌握的树干。





02第二章



大脑


这一段会让大家明白为什么我平常喜欢把大脑画成这样一个可爱的样子:



因为写实的大脑非常的不可爱,让人起鸡皮疙瘩。


但是为了写这篇文章,我过去一个月在谷歌图片搜索上看了太多血淋淋的照片,所以各位读者也要看一些啦


我们从头的外面开始。生物学研究有一点好,很多研究让人看了很有满足感,而脑本身有很多让人很满足的东西,其一就是人的头部其实跟个俄罗斯套娃一样。


我们的理解是,最外面是头发,下面是头皮,然后就是头部。其实不是这样的,头皮和头骨之间其实隔了19层东西。



而头骨下面,还有很多东西,然后才是大脑。



头骨下面,有三层膜包裹着大脑:


最外层的,叫硬脑膜,一层紧实、凹凸不平的防水层。硬脑膜紧贴着头骨。据说,大脑本身不能感知痛觉,但是硬脑膜可以,硬脑膜几乎和脸部的皮肤一样敏感。置于硬脑膜上的压力,或者硬脑膜的瘀伤是很多人头痛的原因。


硬脑膜下面是蛛网膜,是由一层皮和一层结缔组织组成的。我原以为我的脑是漂浮在一些头骨里面的一些液体里面的,然而其实头骨和脑之间唯一的空隙,其实就是蛛网膜的结缔组织间的孔。这些结缔组织使脑不会过多移动,当你的头撞到别的东西时能够起到减震的作用。这些空间里面充满了脊髓液,脊髓液的密度和水相近,所以大脑几乎是漂浮在其中的。


最后一层是软脑膜,一层柔软的和脑外部贴合在一起的皮。当你看到脑的照片的时候,很多时候脑都是被一层恶心的血管包裹住的,而这些血管其实并不是处在脑的表面,而是嵌在软脑膜里面。


下图是一个(应该是)猪头的三层膜的总览:



从左往右,分别是皮肤(粉色部分),然后两层头皮,然后头骨,接着才是硬脑膜、蛛网膜和软脑膜,最右边的是大脑。


当我们把外面这些东西都剥去后,剩下的就是这个:

这个看起来很荒唐的东西是宇宙里我们已知的最复杂的东西,重约三磅,功率约等于20瓦,相比之下,一个同等强大的计算机的功率约是24百万瓦。Tim Hanson教授把大脑称为“已知的信息密度最大、最有结构性,并且最能够自我构建的物质”


MIT教授Polina Anikeeva把大脑称为“能用勺子舀的布丁。”脑外科医生Ben Rapoport则更准确的把材质描述为“介于布丁和果冻之间”。Ben还解释说,如果把一个大脑放在桌上,重力会让它变形,变扁一点,就像个水母一样。我们的印象中脑不是这么湿软的,因为我们看到的脑常常悬浮在水中。


当你照镜子的时候,你看到自己的身体和脸,然后觉得那就是你,但其实你的肉体只是“你”所乘坐的一台机器。实际上,你就是这块布丁——希望你不要为此感到压抑。


大脑是如此的奇怪,以至于亚里士多德、古埃及人,还有很多其他人,都假设其实大脑是没什么意义的“颅内填充物”而已。亚里士多德甚至认为心脏才是智慧的中心。


最后,人类还是发现了大脑的真相,但也不是发现的很彻底。


Krishna Shenoy教授把我们对大脑的认知类比人类在16世纪时对世界地图的认知一般。


而Jeff Lichtman教授,则更为犀利点。他在开课之前会问他的学生:“如果我们需要了解的大脑的知识是一英里那么长,那么我们现在处在什么距离上呢?”他的学生会给出四分之三英里,半英里,四分之一英里等答案,但是他觉得正确的答案应该是“三英寸”左右。


第三个教授,神经科学家Moran Cerf, 跟我分享了一个神经科学的老说法,意指任何试图完全了解大脑的行为都类似第22条军规:“如果人类的大脑简单到我们都能够理解它,那它也会太简单,使得我们没有足够的脑力来做到这件事。”


也许有了我们正在建造的知识巨塔的帮助,我们会达到那个目标。但是现在,我们只能从我们所掌握的关于我们脑的理解开始了——先从粗略的说起。


大脑,拉远了看。


我们先通过一个脑半球切片来看一下大脑的几个主要部分:



我们把大脑从头部取出,然后移除左半球,然后我们就能好好看看内部了。



神经科学家Paul MacLean做了一个简单的图,来阐述我们前面提到的爬虫类脑最早出现——然后是哺乳动物对脑进行了完善——最后又进行了完善后成为了我们现在的大脑三元件的理论。



这就是我们的脑的大概分布:


我们分部分来看 :

爬虫类脑:脑干和小脑

这是我们大脑里最古老的一部分



就是图中青蛙大佬所占据的那部分。事实上,一个真的青蛙的脑和人类脑的这一部分是非常相似的,下图是青蛙脑的照片。



当你理解这部分脑的功能后,这部分脑的“古老”就显而易见了——这部分脑能做到的功能,青蛙和蜥蜴也能做到。

延髓基本上做着那些让你不要死的工作。它控制那些无人赏识但是至关重要的无意识行为,好像心脏的跳动、呼吸、血压,以及当它觉得你中毒的时候让你呕吐。


脑桥则是这也做点,那也做点的百搭。脑桥控制吞咽、膀胱、脸部表情、拒绝、唾液、泪水和体态。


中脑则比脑桥更杂。中脑的地位其实很尴尬,它的每一个功能都和大脑另外某个部位的功能重复。中脑涉及视觉、听觉、运动控制、警觉、体温控制,以及其它若干个由脑的其它部位已经在做的事情。大脑对于中脑也不是很买账,整个大脑可以分为前脑、中脑和后脑,前脑和后脑都由多部分组成,范围很大,唯有中脑是孤立的一小块。



脑桥和中脑有一个值得单独提出的功能是它控制眼球的自主移动,所以如果你现在在转动你的眼球的话,其实就是脑桥和中脑帮你达成的。


小脑保证你能够平衡、协调和正常的移动。



古哺乳动物脑: 边缘系统

脑干上方的就是边缘系统,也正是边缘系统让人类如此神经质。



边缘系统是一套生存系统。一般来说,当你做任何你的宠物狗也会做的事情的时候,比如:吃,喝,做爱,打架,躲藏,逃跑等,背后都是你的边缘系统在控制。不管你的个人感觉是怎么样的,当你在做这些事情的时候,你都处在一种原始的生存模式中。


边缘系统也是情绪产生的地方,归根结底来说,情绪也是和生存有关的。情绪是更高级的生存机制,对于生活在复杂社会结构中的动物是很必要的。


笔者在以前的作品中提到“及时行乐猴”、“社交生存猛犸”和其它人类的动物性具象的时候,说的其实都是边缘系统。任何时候你的脑子里产生内部斗争的时候,其实都是边缘系统在催促你去犯下一桩桩你之后会后悔的事情。


我非常确定控制好自己的边缘系统,是一个人成熟的定义,也是人类的核心斗争任务。这并不是说没有边缘系统我们会变得更好,人之所以为人,有一半要归功于边缘系统,而生命中绝大多数的快乐都是和情绪或者满足自身动物欲相关的。然而,这里要强调的是边缘系统并不知道你生活在一个文明社会,如果你让边缘系统过多干涉你的生活,它会很快毁了你的生活。


不管如何,我们还是要仔细看看边缘系统。边缘系统里面有很多小组件,我们这里就只关注那些最重要的啦:


杏仁体就是人类情绪的车祸现场。杏仁体负责焦虑、悲伤以及对恐惧的反应。杏仁体有两个,很奇怪的是,左边的那个更加平衡,有时会在负面情绪外产生一些正面感觉,但是右边那个杏仁体却一直是在糟糕的情绪中的。


海马体就好像记忆的草稿本。当老鼠开始记忆迷宫中的方向的时候,它们的记忆就是被编码存储在海马体里的。处在迷宫中的不同位置的时候,老鼠的两个海马体的不同部位会各自产生不同的反应。但是如果在记住一个迷宫之后,这只老鼠又被派去干了些别的任务,在一年后再把这只老鼠放回原本的迷宫中,它就很难记得迷宫的方向了。这是因为海马体这个草稿本上的记忆很多被擦除掉,从而腾出空间来给其它新的记忆了。


电影《记忆碎片》中主角的症状是真实存在的一种病,叫作顺行性遗忘症。这种症状就是海马体的损害导致的。阿尔兹海默症也是从海马体开始发病,然后蔓延到脑的其它部位,所以在阿尔兹海默症的所有症状中,记忆力衰退是最早出现的。


丘脑位于整个脑的中间位置,干的也是感官信息中间人的角色。丘脑接收到感官器官发来的信息,然后把信息传递到皮质去处理。当你睡着的时候,丘脑也会入睡,也就意味着传递感官信息的中间人下班了。所以在沉睡的时候,声音、灯光、触摸有时不会把你唤醒。如果你想要把一个沉睡的人唤醒,动作要激烈到把他的丘脑唤醒。


这里唯一的例外是你的嗅觉,嗅觉是唯一不经过丘脑的感官。所以给昏迷的人闻盐是一个常用的唤醒手段。顺带一提,嗅球(olfactory bulb)是最古老的感官。与其它感官不同,嗅觉位于边缘系统的深处,和海马体与杏仁体合作紧密,所以嗅觉才会与记忆和情绪紧密关联。



新哺乳动物脑: 皮质(Cortex)


终于,我们要开始讨论皮质了。它还有其它一些称呼大脑皮质(cerebral cortex),新皮质(neocortex),大脑(cerebrum),皮层(pallium)


很尴尬的是我们对于整个脑中最重要的这部分的称呼非常混乱。下面是一些背景知识:


大脑(cerebrum)是脑的整个外部的部分,当然它其实也包括一些内部的部分。

皮质(cortex)是拉丁文里树皮的意思,它也被用来称呼许多其它器官的外层。比如小脑的外层叫作小脑皮质,而大脑(cerebrum)的外部就被叫作大脑皮质。只有哺乳动物才有大脑皮质,爬行动物脑的外层叫作皮层(pallium)


新皮质这个称呼和大脑皮质基本可以换着用,但是其实它是专指那些更发达的哺乳动物才有的大脑皮质的特殊外层,大脑皮质剩下的部分叫异型皮质(allocortex)


下文中,我们将主要谈论新皮质,但是简单起见,我们还是把它叫做皮质吧。


皮质负责几乎所有处理相关的事情——你看到、听到和感觉到的东西,以及语言、运动、思考、计划和人格。


它总共分成四叶:



要描述这四叶分别做什么是件很恼人的事情,因为每一叶都做很多事情,并且互相之间的功能有重叠,但是极端简化的来说:


额叶(frontal lobe)掌管你的人格,以及很多思考相关的东西,比如理论、计划和执行功能。这里要指出,你的很多思考,是在额叶的前端进行的,这部分叫作前额皮质(prefrontal cortex)。前额皮质是那些内心斗争中另一个会出现的角色,那个理性的决策者,那个推动你好好做事的人,那个告诉你不要在意别人想法的真诚的声音,那个希望你能有大格局的领路人。


额叶还负责你身体的运动,额叶最上面的一带,是你的运动皮质。



接着是顶叶(parietal lobe),顶叶控制触觉,这一部分功能主要在体感皮质实现,体感皮质在运动皮质旁边。



运动和体感皮质很有趣,因为它们和人体的对应关系非常工整。神经科学家清哪楚地知道每个皮质的各部位分别对应身体的那些部分, 下面我们要放出本文中最奇怪的一张图:何蒙库鲁兹(homounculus)



何蒙库鲁兹由神经外科医生Wilder Penfield创造,用来呈现运动和触感皮质如何对应到人体部位。图中的人体部位越大,代表运动和触感皮质中有越多的部分是与该部位对应的。这张图有一些有趣的点:



首先,皮质中负责脸和手的运动和触感的部分,比全身其它部分加起来都要大。当然这不难想通,人脸需要能做出各种微妙的表情,而手需要能够无比的灵巧。而身体的其它部位,比如肩膀、膝盖、背部,在移动和触感上可以粗糙很多。所以人们用手指,而不是脚趾,来弹钢琴。


其次,运动和触觉皮质各自对于不同身体部位的分配比例基本是一致的。也就是说人体中越是需要灵活运动的部位,也越是触觉最灵敏的。


最后,如果我们把何蒙库鲁兹3D化的话,它应该长这样: 



继续

颞叶(temporal lobe)是你的记忆储存的地方,而因为颞叶离耳朵很近,它也包括了听觉皮质。


头后方的是枕叶(occipital lobe),这里包括了你的视觉皮质,而枕叶几乎是完全为视觉服务的。


一直以来,我觉得这四个是几个组成大脑的大块,但其实皮质只是大脑最外层两毫米的物质,和一个硬币差不多厚,皮质下面的那些“肉”基本上是连接线。


我们之前讨论过了,大脑的演化是一个向外构建的过程,它不断在已有的模型上加上新的更酷的功能。但是往外建造有它的极限,因为人的出生需要通过母亲的阴道,而这就限制了我们的头能长到多大。


所以演化过程就另辟蹊径。因为皮质很薄,增加表面积就能增加它的数量,所以加入了很多折叠后,脑的体积基本不变,但是表面积能够增加几乎三倍。当胎儿还在子宫中 ,胎儿的大脑刚开始形成的时候,大脑是光滑的,大脑表面的折叠基本上是在孕期的最后两个月形成的。



如果你能把皮质从大脑上取下来,你获得的其实是2毫米厚,2000-2400平方厘米的一块物质,大概是48厘米见方的一块餐巾的大小。


这块餐巾就是你脑内大部分行为发生的地方,它让你能够思考、移动、感知、看、听、记、说话和理解语言。真是块很酷的餐巾。


还记得之前我说你是个果冻吗?其实“你”基本上就是你的皮质,也就是说你其实是块餐巾。


当我们把一个大脑,和我们的餐巾做对比,就能看出来折叠的巨大效果了。


所以现代科学对大脑的理解虽然不完美,但是对于一些大概念的理解还是不错的。当然对于一些小概念我们的理解也不错,下面我们来说一下:


虽然我们很早就知道了大脑是我们智慧的基座,但科学家直到最近才知道大脑是由什么组成的。科学家们知道身体是由细胞组成的,在19世纪后期,意大利医生Camillo Golgi发现了一个用染色来研究脑细胞结构的方法,结果非常让人惊讶:



细胞不应该长这样的。虽然自己还不知道,但是Golgi医生发现了神经元。


科学家们很快发现,神经元是几乎所有动物的脑和神经系统里巨大的通信网络的核心元件。


但直到二十世纪五十年代,科学家才知道神经元之间是怎样互相沟通的。


神经元用来承载信息的长条物轴突(axon),一般来说直径都很小,所以直到最近科学家才能对他们做测试。在二十世纪三十年代,应该动物学家发现鱿鱼可以改变我们的认知,因为鱿鱼体内有一根非常大的轴突可以供我们做实验。二十几年后,靠着鱿鱼的大号轴突,科学家Alan Hodgkin和Andrew Huxley发现了神经元是怎样传递信息的——动作电位。它的工作原理是这样的:

  


神经元有很多种:




但为了简单的叙述,我们只讨论最简单的一种—— 锥体细胞。要画一个神经元,我们可以先画一个小人:


然后我们给他多画几条腿,一些头发,去掉他的手臂,再把他拉长,我们就画好了一个神经元小帅了。


然后我们再画几个神经元。



动作电位的工作原理比较复杂,里面很多技术信息很无趣,而且和我们的讨论关系不大,所以我们就用一个简单的模式来谈论一下吧。


神经元小帅的身体,也就是轴突,有一个负的静息电位,当轴突休息的时候,它的电荷是负的。好多神经元的脚会触碰到神经元小帅的头发(树突),这些脚会把神经传递素传递到小帅的头发上,神经传递素会经过小帅的头,然后根据传递素的不同,提高或者降低轴突的电荷。



当足够多的神经传递素把小帅的电荷提高过了一个点——阈电位的时候,这时就会产生一个动作电位,而小帅此时就被电击了。 



这是一个二元的情况,神经元小帅要么没事,要么被完全电击。他不能被半电击,或者过度电击,他每次都是被完全电击。


当电击发生时,一个电流脉动会从小帅的身体到达他的脚,当动作电位到达他的脚的时候,脚会向所接触的别的神经元的头发传递化学物质,这些化学物质可能会也可能不会导致别的神经元产生电击。




这其实就是信息在神经系统中传递的方式,化学信息在脚和头发之间传递,然后形成电力信息穿过神经元。当然,在身体需要非常快的传递信息的时候,神经元之间的连接可能本身就是电的。

  

动作电位的移动速度在1-100米每秒。这个不确定范围的产生原因是神经系统里面的另一种细胞(雪旺细胞)会一直把一些轴突包裹在厚厚的髓鞘中。


除了保护和绝缘外,动作电位在髓鞘包裹的轴突中传播的更快。



一个关于速度差的例子是这样的,当你不小心踢到了自己的脚趾,你会先意识到自己踢到了脚趾,然后痛感才会出现。这里发生了两件事,你的脚趾踢到东西的信息和所伴随的锋利痛感,通过髓鞘包裹的轴突快速传递到了脑中。而顿挫的疼痛没有没有通过髓鞘包裹的轴突传播,所以以每秒一米的速度慢慢的到达了脑。



神经网络


神经元就好像电脑晶体管一样,它们通过二元的方式传递信息,1就是动作电位,0就是没有动作电位。但和晶体管不同的是,脑内的神经元是不断在变化的。


有没有过这种体验,有时候你学会一个新技能,然后第二天再试的时候又生疏了?这是因为让你一开始学会新技能的是神经元之间化学物质的浓度的调整。重复的练习能不断的调整这些化学物质,这也帮助你能够进步。但是第二天,当这些化学物质回归原来样子的时候,这些进步就消失了。


但是如果你继续练习,你会长久的擅长一项技能。因为长久的练习后,你告诉大脑:“这是我想要一直存在的一个东西”,然后脑就会在结构上改变神经网络,使得这些技能能能够长久存在。在这些改变中,神经元改变了自己的形状、位置,加强或者削弱了各种连接,使得一条关于这项技能的通路会一直存在。


神经元对于自身的化学、结构、甚至功能的改变,使得脑内的神经网络能不断针对外部世界优化自己,这叫作神经可塑性。婴儿的脑的神经可塑性最强。当一个婴儿诞生的时候,它的脑并不知道自己要变成一个擅长冷兵器作战的中世纪勇士,或是一个擅长拨弦琴的十七世纪音乐家,还是一个需要存储和整理大量信息并且掌握复杂社会构建的现代知识分子。但是一个婴儿的脑为所有的可能性做好了准备。


婴儿是神经可塑性的巨星,但是神经可塑性在人的一生中都存在,所以人类才能成长、转变和学习新东西。所以我们才能形成新习惯,打破旧习惯——一个人的习惯是脑内回路的外在表现。如果你想要改变习惯,你需要很强的毅力来克服脑内的神经通路,但是只要你能坚持够久,你的脑早晚会明白你的意图然后改变那些通路,而新的习惯将不再需要毅力来维持。你的脑会在物理结构上帮你建立一个新习惯。


总共,大脑内有大约1000亿个神经元来组成这个难以想象的复杂网络,这个数量和银河系里的恒星数量相近。大约150-200亿的神经元在皮质中,其它的在你的爬行动物脑和古哺乳动物脑中,神奇的是,小脑里面的神经元数量有皮质里的三倍多。


接下来,我们退出去,再看一下脑的横切面,这次不是从前往后切,而是从中间切。



大脑的材料可以分为灰质和白质。灰质看上去颜色更深,由神经元的细胞组成,白质则主要由链接轴突组成。白质之所以是白色是因为这些轴突通常被髓鞘包裹着。


灰质主要有两个部分——边缘系统的内部和脑干,以及皮质外层硬币那么厚的部分。剩下来的大块的白质主要就是皮质神经元的轴突组成的了。皮质就像一个指挥中心,把很多命令通过白质中的轴突传播下去。


对于这个概念最酷的展现是Greg A. Dunn博士 和Brian Edwards博士绘制的图:



这些皮质轴突可能是在把信息传递给皮质的另一部分,或者是去到大脑的下部,或者通过脊髓直接到身体的其它部位。


接着我们来看看整个神经系统。



神经系统分为中枢神经系统(脑和脊髓)和周围神经系统。


大部分的神经元都是中间神经元,也就是和其它神经元沟通的神经元。当你思考的时候,有很多中间神经元互相通信,中间神经元大部分在脑内。


另外两种神经元是感觉神经元和运动神经元。这些神经元在脊髓和周围神经系统里面。这些神经元可以长达一米。




还记得前面提到的运动皮质和体感皮质吗?




这两条皮质是周围神经系统发起的地方。 感觉神经元的轴突从体感皮质出发,通过大脑的白质,进入脊髓,然后到达身体的各个部分。你皮肤的每一部分都是体感皮质发起的神经相连。对了,神经其实就是数根轴突绑在一起。


我们用苍蝇飞到你手上的例子来说明一下神经系统的工作方式:


苍蝇碰触到了你的皮肤,然后刺激了一些感觉神经。神经里面的轴突端子开始行动和产生动作电位,把信号传导到脑里。信号先是进入脊髓,然后进入体感皮质。体感皮质然后告知负责肩部的运动皮质说现在手上有一只苍蝇,需要做点什么。连接到手臂肌肉那部分的运动皮质于是开始产生动作电位,把信号通过脊髓再发送到手臂的肌肉里。手臂肌肉附近的神经元的轴突端子开始行动,于是你抖动手来甩脱苍蝇,然后苍蝇(经过了苍蝇自身的神经系统的一系列反应后)就飞走了。


然后你的杏仁体意识到发生了事情,于是杏仁体告诉你的运动皮质这个时候要开始尴尬的跳起。如果落到你手上的是一只蜘蛛,那么杏仁体还会告诉你的声带要不自主的喊出来,给周围人留下你怕虫子的印象。


所以至今为止我们好像还蛮了解大脑的,是吧?那为什么之前我们提到如果我们需要了解的脑的知识是一英里的话,我们现在只是了解了三英寸呢。


是这样的。


比如说我们对互联网是有个大致的了解的,比如大概有多少网名,有哪些大网站,最近流行什么。但是对互联网中间发生的那些东西,互联网整个的内部工作机制,我们其实是很迷糊的。


又比如经济学家能够告诉你一个个体消费者的行为,也能告诉你宏观经济学的概念来帮你理解背后的种种操控力,但是没有哪个人能够真正的告诉你经济体是怎样运作从而来预测明年的经济会是怎样的。


大脑就和这些东西是一样的。我们知道了一些细节的东西,比如神经元怎么运作,我们也知道了一些宏观的东西,比如大脑里有多少个神经元,有那些主要的脑叶,以及各自的控制结构,和脑的大致耗能。但是中间的那些东西,比如大脑的每个部分具体是怎么做到这些事情的,我们就不得而知了。


真正让我们理解我们的无知有多深的,就是听一下神经科学家对于我们目前最了解的大脑部位的理解。


譬如视觉皮质,我们理解的就不错。


科学家Paul Merolla这样跟我描述:


“视觉皮质在解剖和结构上都很工整。当你看到视觉皮质的时候,就像看地图一样。当你的视野的特定位置出现一个东西的时候,你能看到视觉皮质的那一部分亮起来。而当那个东西开始移动的时候,对应皮质周围的细胞会展现出对应的图形测绘。这就好像现实世界的笛卡尔坐标能够对应到视觉皮质的极坐标一样。你可以从视网膜开始追溯,经过丘脑,到达视觉皮质,然后能够看到视觉空间中位置与视觉皮质中位置的对应。”

这么看来好像还行嘛,但是Paul接着跟我解释:

“这种位置对和视觉皮质互动来说很有用,但是视觉皮质有很多区域,如果你深入研究视觉皮质,就会发现整个事情变得越来越模糊,之前的图形对照不再行得通了。脑里有很多不同层次的事情在发生,而视觉感知是其中一个例子。我们看着这个世界,我们看到的只是个3D的物理世界。比如你看着一个杯子,你看到的就是个杯子,但是你的眼睛看到的真的只是一些像素,而当你看向视觉皮质的时候,这个图像被解析成了20-40个图。我们把第一个负责这些图的区域称作V1,V1负责追踪边缘和颜色等。其它的区域则观测到了一些更复杂的物件,于是在你的脑的表面,产生了很多很多不同的展现。但是最后这些复杂的的信息被绑在一起,然后经过一些编码,让你相信你看到的只是一个简单的物件。”

运动皮质是另一个我们理解的比较好的区域,但是运动皮质的理解会比视觉皮质更难。虽然我们知道运动皮质如何对应到各个身体部分的,但是单个的神经元们在运动皮质上的位置不是拓扑分布的,而神经元们怎么合作产生身体运动我们也不知道。Paul这么跟我们解释:

“每个人的神经“语言”都不太一样,神经元可不会对着手说普通话“手,你动一下”,也没有一个统一的电位规律来做这一些,所以每个人都不太一样。而这个“语言”本身要求很高,神经元需要能够无缝的告诉手“你把手往左边移动,然后往上,抓那个东西,抓的时候用这么多力道,用这么快的速度去抓”等等。当我们移动手的时候,我们不会这样去想这一系列动作,但是我们能够毫无困难的完成这一切。所以每一个大脑和肌肉沟通的时候用的语言都是不一样的。”

神经可塑性也很难理解,因为每个大脑本身的工作机制都与脑自身的可塑形相关,也和这个人生活的环境与生活经验有关。


而这已经是我们了解的最深入的大脑部分了,按照专家的说法,“当我们要探讨一些更复杂的东西,比如语言、记忆、数学,的时候,我们就真的不明白了。”比如对于“母亲”的概念,对于每一个人来说,都是用不同的编码方式存储在脑的不同位置。而额叶,也就是前面提到最重要的脑叶,根本就没有任何拓扑。


然而,这些困难都不是一个有效的脑机接口的制造难点。脑机接口之所以难,是因为工程上的挑战非常巨大。要和大脑进行物理的交互,使得脑机接口是工程行为上最难的一件事。


现在我们知道了关于脑的背景知识这个树干,下一章谈一下第一根树枝——脑机接口。

03第三章



脑机接口


首先,让我们回到公元前五万年,绑架一个人,然后把他带回2017年。



这位是老王。老王,我们很感谢你和你的伙伴们发明了语言。



为了感谢你,我们想带你看看你们的神奇发明所带来的成果。


然后我们带老王看一下飞机,然后看一下潜水艇,然后去一下迪拜塔的楼顶。然后我们在看看望远镜、电视机和iPhone。然后我们再让老王玩一下互联网。


好啦,老王你觉得怎样?



呵呵,我们猜到你会被这一切吓尿的。好了,最后,让我们给你展示一下我们现在是怎么互相沟通的。   



老王会被人类学会语言后发明的这些“魔法”所震惊,但是当我们真的用语言和彼此交流的时候,好像与老王那个时代的人彼此交流没什么差别。当人们说话沟通的时候,他们其实是在使用已经有五万年历史的技术。


同样的,在一个充满了神奇机器的世界,造出这些机器的人类日常的身体和老王那个时代的人的肉体也没啥区别。为啥会这样呢?



这就是为什么脑机接口这个神经工程学的子领域(神经工程学本身是生物技术的一个子领域),会是一个这么充满诱惑的产业。我们用我们的技术反复征服了这个世界,但是对于我们最核心的工具“脑”,整个技术世界好像没有什么建树。


所以我们还在用老王那个时代就发明的技术“语言”在交流,所以当我写这段话的时候,我的打字速度大概是我思考速度的二十分之一,也是为什么大脑疾病对人们生活造成很大的困扰和影响。


但是在发明语言五万年后的今天,这一切也许就将改变。脑的下一个大跃进,可能就将在它自身体现。



脑机接口有很多种,各自会有不同的功能。不过所有脑机接口领域的人,基本上都是在以下两个问题上努力:

1)我怎样把正确的信息从大脑里取出来?

2)我怎样把正确的信息发给大脑?

问题一是关于接受大脑的输出——记录神经元的话

问题二是关于把信息传入大脑的神经流,或者改变神经流,也就是关于刺激神经元。


这两样事情本身是在你的大脑内自然发生的。现在你的眼睛正在做一些水平运动,使得你能看完这句话。这就是大脑的神经元把信息输出给机器(也就是你的眼睛),而机器收到了这些信息,做出了适当的反应。而随着你眼睛的移动,光子进入你的视网膜,刺激枕叶里的神经元,使得这些字的图像进入你的思想。这个图像又刺激了大脑其它部位的神经元使得你能处理储存在这些图像里的信息,进而了解这句话的意思。


输入和输出信息是大脑神经元的本职工作,脑机接口领域就是想参与到这项工作里面去。

粗看,这个事情好像不怎么难。大脑不就是是个果冻球嘛,而皮质不就是块餐巾嘛。而且这块餐巾还很巧的就在脑的最外层,很容易就接触到。皮质里面有大约200亿的神经元,如果我们能学会这200亿个神经元的工作方式,与它们合作,就能让我们从更高的高度掌控我们的生活、健康,以及这个世界。


我们能做到吗?虽然神经元很小,但是我们连怎样拆开一个原子都知道,神经元的直径可是有原子的十万倍大呢。如果原子是一个玻璃球大小,那神经元的直径类比之下应该是一公里,所以尺寸应该不是问题对吧?

所以问题究竟是啥?


好吧,上面这段逻辑其实是有可取之处的,正因为这段逻辑中的那些想法,这个行业有着很大的前景。


但当你能够真正理解大脑内发生的事情的时候,你才会意识到搞懂这一切可能是人类能做到的最难的一件事。


在我们开始谈论脑机接口之前,我们先来仔细看看这些试图制造脑机接口的人面对的困难吧。最好的解释方式就是先把大脑放大一千倍来看看。


回到我们的皮质餐巾的方式吧。


如果我们把这块餐巾放大一千倍,那么餐巾大概是六个曼哈顿街区见方,你绕着四周走一圈大概要花25分钟。而脑本身大概会占据一个两个街区见方的空间,大概和麦迪逊广场花园差不多。(注:此处指长度和宽度与麦迪逊广场花园,放大一千倍的脑的高度应该是麦迪逊广场花园的两倍高。)



那我们就把大餐巾和脑铺到曼哈顿吧。住在曼哈顿的几十万人大概是不会介意的......吧



我选择一千倍这个倍率,一是因为计算方便,每一毫米的脑现在就相当于一米,而每个神经元现在大概相当于一毫米;其次,皮质这个时候就很符合人类尺寸了,原本只有二毫米的皮质,现在和一个二米高的人一般了,也就是说这块餐巾现在是二米厚。


现在,我们从这块餐巾里面切出一块一立方米的方块来研究一下,帮助我们理解一立方毫米的皮质中所发生的事情。


我们在这一立方米的皮质中会看到一团糟,我们先把里面的东西倒出来,然后再逐一放回去。


首先,我们把神经元的胞体们放回去。


胞体的大小各异,神经科学家们表示皮质里的神经元的胞体直径一般是10-15微米,也就是说如果把7-10个神经元胞体排一列,这一列的长度大概会有头发丝的直径一般。在我们放大一千倍的世界里,胞体的直径大概是1-1.5厘米,和玻璃球差不多。


整个皮质的体积大概是50万立方毫米,这个空间中存在着约200亿个神经元胞体,也就是说每立方毫米大概存在四万个神经元。所以,我们的一立方米的方块中大概有四万个玻璃球。如果我们把一立方厘米的方块均分成四万份,每一块约是三厘米边长的小立方体,胞体就存在与每个小立方体的正中间,与周围其它胞体的距离也正好是三厘米。


至今为止还听得懂吗?此时你的脑中是否能够想象出一个一立方米的方块,里面悬浮着四万个玻璃球?


下图是胞体在皮质中的显微镜照片。



目前为止问题还不大。可是胞体只是神经元的一小部分,从每一个胞体出发的是弯曲分叉的触突,在我们放大一千倍的世界里,这些触突会向不同方向伸展三到四米,而和触突接触的轴突可能有一百米长(轴突可能要直接延伸到皮质的其它部分),甚至一千米长(一些触突可能要直接到达脊髓或者身体其它部位)。而每个触突、轴突都只有一毫米厚,这些线状物把皮质变成了一团杂乱又无法解开的毛线球。


而这团毛线球里面有很多事情在发生。每个神经元会和上千个甚至上万个其它神经元接触。整个皮质里面的200亿个神经元,组成了大概20兆(20,000,000,000,000)个神经连接,而整个脑里面的神经连接可以多达千万亿个(1,000,000,000,000,000)。在我们手头的一立方米方块中,大概会有2000万个神经连接。


还不止如此,我们的四万个玻璃球不只每个都会伸出多根毛线,还有成千上万的来自皮质其它部位的毛线会穿过我们这个方块。也就是说,如果我们试图去记录我们这个立方米方块里的信号的话,会遇到很大的阻碍,因为在一堆毛线球面前,很难分清楚哪些毛线源自这个立方米方块里的玻璃球。


当然,不要忘了神经可塑性这个东西。每个神经元的电压是会不断变化的,每秒钟可以变化数百次。而我们的立方米方块里那几千万个神经连接是会经常改变大小、消失或者出现的。


这还没完呢。脑里还有一种叫做神经胶质细胞的东西,胶质细胞有很多类型,承担很多不同的功能,比如清扫神经连接释放出来的化学物质,或者把轴突包裹在髓鞘里,以及充当脑的免疫系统。下面是几种常见的胶质细胞:



皮质里有多少胶质细胞呢?大概和神经元数量差不多。所以我们要往我们的立方米方块中再加四万个这些奇形怪状的东西。


最后,还有血管。每立方毫米的皮质里,有大概一米长的毛细血管。也就是说在我们的立方米方块里有一千米长的血管,看起来大概是这样的: 



神经科学界有一个了不得的项目叫人类连接组计划。项目里的科学家在试图创建整个人脑的详细地图,在此之前从没有这样规模的人脑图谱工作。


这个项目把人脑切成了不可思议薄的切片,每片大约30纳米厚,也就是一毫米的三万三千分之一。


项目中产生了很多好看的代表轴突的丝带图。



人类连接组计划帮助人们从视觉上理解脑内是有多么的拥挤和繁杂。下面展示的是一小片小白鼠脑里面包含的东西(还不包括血管哦) :


上图中,E是整个切片的样子,F到N是组成E的不同部分。

  

所以我们的立方米方块非常拥挤,电荷乱飘,而且无比复杂。然后,让我们提醒自己,这个立方米方块里面的一切,在现实的脑里,只是一立方毫米而已。


而脑机工程师们要做的是搞清楚那一立方毫米里的胞体传递的信息是什么,或者用正确的方法刺激正确的胞体,来达成工程师们想要的目的。


祝这些工程师们好运吧。


即使在一个完全平铺开,并且被放大一千倍的皮质餐巾是,做这一切都无比困难,而事实上,这块餐巾是深深的折叠在麦迪逊广场花园上面的。只有不到三分之一的皮质是露在脑的表面的,大部分的皮质都被埋在深深的折叠之中。


而且,工程师们可不是在一些被取出来的脑上工作,这些脑可是被俄罗斯套娃般一层层掩盖起来的。如果把头骨放大一千倍,就有七米厚。而且大部分人是不愿意让你打开他们的头骨来研究的,工程师的工作得尽量无创。


然而以上说的这些,都是假设我们是研究皮质而已。而很多的脑机接口研究,都是研究更深层的结构,假设你站在麦迪逊广场花园顶部的话,这些研究专注的是表面往下50-100米的东西。


更不要忘了,我们的立方米方块,只是皮质的五十万分之一而已。如果把这五十万个立方米方块排成一直线,大概能从曼哈顿排到五百公里外的波士顿。走完这段路程要花100多个小时,在这整段路程里,你随时停下来,身边都会有一个复杂无比的立方米方块。这所有所有的复杂加起来,就是你的脑里正在发生的事情。


我现在确实很庆幸不用为这样复杂的事情操心



那么科学家和工程师是怎么面对这些问题的呢?


他们用他们现在有的工具来尽量做到最好,这些工具用来记录神经元信息,或者刺激神经元。 


根据现在的工作进展,有三个标准用来衡量记录工具的优劣:

1)规模——能记录多少神经元

2)分辨率——工具收集到的信息有多细。分辨率有两种,空间性(记录的信息能多准确的反应单个神经元的动向),以及时间性(能够多准确的确认所记录行为发生的时间)

3)创伤性——是否需要手术,如果需要,到什么程度。

远期的目标是能够同时达成三个目标。不过,现在的情况基本是“哪一个或两个标准我们愿意完全舍弃”。工具之间不是简单的升级和降级,而是权衡取舍。


我们来看下目前使用的一些工具:


功能性磁共振成像(fMRI)

规模: 高,能展示全脑的信息

分辨率: 空间性中低,时间性非常低

创伤性: 无创

fMRI通常不是用来做脑机接口研究的,但是它本身是个很好的记录工具,它能够给你提供脑内正在发生的事的信息。


fMRI使用磁振造影技术。二十世纪七十年代发明的磁振造影技术,是X光CT的升级。磁共振不用X光,而是用磁场(以及其它电波和信号)来生成身体和脑的影像。



挺厉害的技术。


fMRI使用磁振造影追踪血液流动的变化。为什么要这么做呢?因为当大脑的特定部位变得活跃的时候,那个部位就需要更多的能量,也就需要更多的氧气,所以那些部位的血流会增加来传递更多的氧气。fMRI的扫描是这样的:



当然,大脑的各处时刻都有血液流过,这张图显示的是血流增加的部分(红橙黄)和减少的部分(蓝)。因为fMRI扫描的是整个大脑,所以结果是3D的。



fMRI有很多医学应用,比如告知医生病人中风后脑的各个部位是否运行正常。它也教会了神经科学家很多东西,包括大脑的哪些区域参于哪些功能。fMRI扫描也能帮助提供整脑在给定时刻的整体情况,并且很安全,而且完全无创。


一个大的缺陷是分辨率。fMRI扫描和电脑屏幕一样是有个实际的分辨率的,只不过像素点是3D的。


随着技术的进步,fMRI的像素点也在缩小,不断提高空间性分辨率。现在的fMRI像素点能够小到约1立方毫米。脑的总体积约是一百二十万立方毫米,所以一台高性能的fMRI能够把脑细分成一百万个小方块。问题在于,在神经元的级别上,这还是太大了,每个像素点包含了成千上万的神经元。所以fMRI展现的,最好也就是每四万个左右神经元区域的平均血液流量。


更大的问题是时间性分辨率。fMRI扫描血液流量,这是很不准确,并且有大概一秒的延迟。一秒对于神经元来说是个太长的时间了。



脑电图描记器(EEG)

规模: 高

分辨率: 空间性非常低,时间性中高

创伤性: 无创

EEG有将近一个世纪的历史,而它其实就是在头上摆好多电极的那个东西:



对于一个2050年的人来说,EEG肯定是个很原始的科技了,但是现在来看,它是仅有的能够无创的和脑机接口合作的工具之一了。EEG记录大脑不同区域的电活动,然后把结果像这样呈现出来:



EEG图能够获取关于癫痫等疾病的医学信息,追踪睡眠规律,或者用来确认麻醉剂的效果。


不过和fMRI不同的是,EEG的时间性分辨率很好,能够即时的获取脑内电信号的产生。当然头骨对于时间性分辨率的准确性还是会有一定影响,因为骨的导电性不好。


EEG的主要弱势是空间性分辨率,在这方面EEG基本谈不上分辨率。每个电极只是记录一个很粗略的平均值,所有这个电极覆盖范围内的数百万到数亿个神经元的电量的矢量总和,而这个值还是受到了头骨影响后的。


如果把大脑想象成一个棒球场,每个神经元是现场的一个观众,而把我们想要从脑获取的电信息类比成每个观众的声带的振动。在这样的情况下,EEG的效果就好像放在棒球场外的一堆麦克风,透过棒球场的外墙,麦克风可以听到观众的欢呼声,并且能够大致推断出他们为什么在欢呼。你甚至能够从一些蛛丝马迹中听出两队正在交换攻防,或者比分是否咬的很紧,你甚至能够察觉到是否有不寻常的事情发生。


但也就止步于此了。



脑皮层电图描记法(ECoG)

规模:高

分辨率:空间性低,时间性高

创伤性:有创

ECoG和EEG类似,同样是利用表面电极的,只不过它是把电极放到了头骨下面,直接放到了脑的表面。



听这样的描述是不是有种说不出来的恶心?但是这个做法很有效,至少比EEG有效很多。没有头骨的干扰,ECoG能够获得更高的空间性分辨率(精确到1厘米)和时间性分辨率(精确到5毫秒)。ECoG的电极可以被放置于硬脑膜上方或者下方。



用回我们上面的棒球场的比喻。ECoG用的麦克风在球场里面,而且离观众比较近,所以获得的声音也比EEG从球场外获得的声音更加清晰,并且ECoG麦克风能够更好的区分各个独立区域的观众声音。


但是这种改进是有代价的,ECoG需要在有创手术的前提下操作。当然,在有创手术的领域,这还不是很糟糕,一个神经外科医生的曾这样跟我描述:“你能够相对不那么有创的把东西放到硬脑膜下面,虽然还是要先在头上钻一个洞,但是相对来说创伤不大。”



局部场电位(Local Field Potential,LFP)

规模:低

分辨率:空间性中高,时间性高

创伤性:非常有创

从LFP开始,我们不再用表面电极,而是用微电极了,微电极就是外科医生扎进脑里面的小针头。


脑外科医生Ben Rapoport跟我描述过他的父亲,一位神经学家,曾经是怎样制造微电极的。

“我父亲需要造微电极的时候,都是手工做出来的。他用的都是直径只有10-30微米的非常细的金线、铂金线或者铱线,把这些细线塞进直径只有1毫米左右的玻璃毛细管中,然后他会把这块玻璃管放在火焰上烤软,然后他把玻璃管拉长到玻璃边的非常薄,把这时候的玻璃管从火焰上移开,然后敲碎。


这时候的玻璃管内部就紧贴着里面的细线了。玻璃是绝缘体,而细线是导体,于是完成品就是一个有玻璃绝缘外层的坚硬的电极,电极的尖头只有几十微米粗。”

现在,虽然有些电极还是手工做出来的,但新技术已经能够利用硅晶元做原材料,制作工艺也是借鉴了集成电路产业的做法。


LFP的做法很简单:把这些超级细的带有电极头的针插入皮质1-2毫米,这样每个电极就能收集到附近一定范围内的神经元电量的平均值。


LFP拥有fMRI般还可以的空间性分辨率,同时又具有ECoG的高时间性分辨率,在分辨率这个角度来看算是鱼和熊掌兼得了。可惜在其它标准上做的还是比较糟糕的。


与前面提到的fMRI、EEG和ECoG不用,微电极LFP的规模性很低,它只能采集电极附件一小块区域的信号,而且LFP的侵入性非常强,它实际上已经进入了脑的内部。


用回棒球场的比喻的话,LFP就是一个悬挂在单块座位上方的单个麦克风,它能采集到那块区域的声音,甚至有可能时不时采集到单个观众的声音,但是大部分时间还是只能获得一个大概。


这个领域最新的进展就是多电极阵列技术,本质和LFP一样,区别是它会在单个皮质区域(大约4毫米见方)同时使用上百个LFP。




单细胞记录(Single-Unit Recording)

规模:非常小

分辨率:非常高

创伤性:非常有创

在使用LFP的时候,为了能够收集到较广的区域,电极的头是略微磨圆了的,这样能够让电极的表面积更大,把电阻降低(注:此处使用“电阻”便于读者理解,实际的技术称呼并不是电阻)。这样能让更大范围内的弱信号都能被收集到,结果就是电极这个麦克风会收集到附近区域的大合唱。


单细胞记录同样使用针状电极,但是把电极头磨的非常锋利,来大大提高电阻。这能够阻绝大部分的噪音,使得电极几乎采集不到任何东西,直到电极和一个神经元非常接近(大约相距50微米左右),在这个距离下神经元的信号足够强,所以能够越过电极头的高电阻。因为能够收集到单个神经元的信号,并且没有背景噪音,这个电极现在能够用来窥视单个神经元的“隐私”。这是最小的规模,也是最大的分辨率。


有些电极技术则是更近一步,采用了一种叫膜片钳的技术。膜片钳直接去掉了电极头,只留下个叫作玻璃微量吸管的小管子。膜片钳会把神经元的细胞膜的一小块吸进管子里,来达到更准确的测量。



不同于上面提到的所有方法,膜片钳还有个优势,那就是它和神经元产生了物理接触,所以它不但能够记录,还能刺激单个神经元,比如通过输入电流或者控制电压来进行一些测试。其它的方法虽然也能刺激神经元,但是只能批量的做。


最后,还有些电极能够直接穿过神经元的细胞膜,更进一步的侵入神经元,这种技术叫作尖锐电极记录。只要电极头足够尖,就不会损伤细胞,因为细胞膜会在电极周围闭合。这使得刺激神经元和记录神经元内外电压差变得非常容易。不过这种技术的使用时间有限,一个被刺穿的神经元是存活不了太久的。


在我们的棒球场比喻里,单细胞记录是个挂在一位观众衣领上的指向性麦克风。膜片钳就是一个在观众喉咙里的麦克风,它能够记录声带的每个动作。这种技术能够很好的记录这个观众在球赛现场的体验,但是却记录不到任何背景信息,并且你无从得知这个观众的声带发出的声音和动作,和球场上正在发生的事情是否有关。


以上就是我们目前常用的所有技术手段了。这些对我们来说是难以置信的先进,但是对于未来人类来说,可能又像石器时代技术一样原始——必须在分辨率和规模之间做取舍,而想要真正高质量的读取和写入大脑信息,居然要打开头骨。



我们已经有的脑机接口


虽然这些工具有它们各自的局限,但是它们已经帮助我们了解了很多关于大脑的知识,并且帮忙创造出了一些神奇的早期脑机接口。以下我们来看看我们已经有的脑机接口吧


1969年,研究员Eberhard Fets把一只猴子脑中的一个神经元连接到了这只猴子面前的仪表转盘上。当这个神经元触发的时候,仪表转盘就会动。每当猴子的思考触发了那个神经元,使得转盘转动的时候,它就会获得一个香蕉味嚼片作为奖励。


经过一段时间后,为了获得更多的嚼片,猴子变的很擅长玩这个游戏了。这只猴子学会了怎样让那个特定的神经元触发,并且不经意间成为了第一个脑机接口的使用主体。


之后的几十年,这个领域的进展很慢,不过到了90年代中期,进展开始出现。从那时开始,这个领域一直在默默发力加速发展。


因为我们对于大脑的理解,以及我们的电极设备都还比较原始,我们一直以来所作的努力都是集中在建设与我们理解最透彻的大脑部位的接口,比如运动皮质和视觉皮质对应的接口。


同时,因为人体实验只有在那些想要通过脑机接口来对抗残疾的人身上才真的有可操作性,并且目前的市场需求也是这个方向,所以我们至今为止的努力也几乎完全是关注于恢复残疾人士的受损能力上面。


未来那些会给予人类魔法超能力并且改变世界的大型脑机接口产业,目前都还在孕育阶段。我们现在可以先看看他们在做的事情,来体会一下2040年,2060年或2100年的世界可能会有多神奇。


比如,我们来看下这个:



这是图灵在1950年建造的电脑,它叫作Pilot ACE,在当时真的是尖端科技。


再看看这个:



在读下面的这些例子的时候,我希望你能够一直做下面这个类比:

Pilot ACE 之于 iPhone 7

就好像

这个脑机接口 之于 ________

然后在做这个类比的时候,想想空格处的东西会是怎样,我们会在后面再来讨论空格处的东西。


根据我所读到的,和与这个领域的人讨论到的,目前脑机接口领域主要有三个大类的工作方向:

早期脑机接口类型一:把运动皮质变成遥控器

早期脑机接口类型二:人造耳朵和人造眼

早期脑机接口类型三:深脑刺激


早期脑机接口类型一:把运动皮质变成遥控器


防止你忘了几千字前的内容,运动皮质是下面这个:


脑的所有部位对我们来说都是天书,但是运动皮质稍微不那么难懂一些。更重要的是,它和身体各部位的对应关系很好,也就是说运动皮质的特定部位是对应特定身体部位的。(还记得前面那个恶心的何蒙库鲁兹吗?)


同样很重要的是,运动皮质是控制我们输出行为的区域之一。当一个人做一些事情的时候,运动皮质几乎都有参于,而且至少它会参于物理运动的那部分。所以,其实人脑不需要学习怎么把运动皮质当遥控器用,因为一直以来,运动皮质都是人脑的遥控器。


试着举起你的手,然后再把手放下。发现没?你的手就好像玩具无人机一样,而你的脑就是拿起来运动皮质这个无人机遥控器,在控制着你举起和放下手。


基于运动皮质的脑机接口的目的就是能够接入运动皮质,这样当这个遥控器发出一些命令的时候,脑机接口能够收集到这个命令,然后把命令传达给一些机械,让机械做出和你的手类似的反应。神经连接你的运动皮质和你的手,而脑机接口就负责连接你的运动皮质和一台计算机,就是这么简单。


一些雏形的脑机接口,能够让一个人(通常是高位瘫痪或者截肢人士)能够通过意念就移动屏幕上的鼠标。


这种效果的实现,基于植入使用主体运动皮质的100针多电极阵列来实现。一个瘫痪了的人的运动皮质通常是没问题的,出问题的多是作为运动皮质和身体的中间人的脊髓。电极阵列植入运动皮质后,研究员会让使用主体尝试把手往不同方向移动。虽然他们的手不会真的动起来,但是运动皮质还是会正常触发的。


当一个人移动他的手臂的时候,他的运动皮质会产生一系列的行动,但是每个神经元通常只关注一个类型的运动——某个神经元可能在这个人每次把手臂往右移的时候都会触发,但是手臂往其它方向移的时候就不那么活跃了。这单个神经元,其实就能告诉计算机这个人什么时候想要把手臂往右移,什么时候又不想。但单个神经元能做到的也就是这样了。


不过随着电极阵列的接入,100个单细胞电极各自采集100个不同神经元的信息。当研究员们做测试的时候,比如研究员让测试主体把手往右边移,假设100个电极中有38个采集到各自对应的神经元触发,而当主体试图把手往左边移的时候,41个电极采集到各自对应的神经元触发。经过一系列这样的不同方向和速度的测试后,计算机能把从电极处收集到的信息分析合成为一种对于触发规律的理解,知道怎样的触发规律对应怎样的二维坐标系移动。


而当我们把这些合成结果连接到一个计算机屏幕时,测试主体就能通过“想”移动鼠标,来真正的控制鼠标,在实际操作中这种方法是可行的。经过运动皮质脑机接口的先驱BrainGate公司的努力,真的有人能够靠“想”来玩游戏。


100个神经元能够告诉我们测试主体想怎样移动鼠标,它们也完全可以告诉我们测试主体想要拿起一杯咖啡喝一口。一个四肢瘫痪的女士可以在飞行模拟中控制一架F-35战斗机。最近,有只猴子还用意念控制轮椅的移动。


而且这种控制 不止于手臂。巴西脑机接口先驱Miguel Nicolelis和他的团队就打造了一整套外骨骼,让一位瘫痪人士为巴西世界杯开球。

不要忘了本体感知


控制这些“神经义肢”的关键是记录神经元信息,但是要让它们真的高效运作起来,不能只倚赖单向的信息传输,需要一个信息采集和刺激的双向闭环。虽然我们不会注意到,但是你能够拿起一件物品,很大程度上依赖于手的皮肤发送回脑的触觉信息,也就是本体感知。


在我见过的一个视频中,一位女士的手指麻木,但没有其它残疾,而当她试图点燃火柴的时候,她做的非常困难。在另一个视频中,一位有着完好的运动皮质但是失去了本体感知的男士,也有着很严重的不便。所以要让仿生义肢真的能够像人的手臂一样运作,我们还需要让这些义肢能够把信息发送回脑里。


然而,刺激神经元比记录神经元难多了。研究员Flip Sabes是这么跟我解释的。

“好比我记录一些行为规律,但不代表我们能够轻易重现把这些规律。就好像我们的太阳系一样,你可以观测行星的移动,并且记录它们的轨迹。但如果你把太阳系打乱,然后试图重现一个行星的原本轨迹,你可不是简单的把这个行星放回它原本的轨道这么简单,因为它的行动受到其它所有行星的影响。


同样的,神经元不是独立工作的,这个过程本质上是不可逆的。同时,因为大量轴突和树突的存在,要刺激你想要刺激的神经元而不影响到其它东西,也是很难的。”

Flip的实验室尝试让脑本身来帮忙克服这些挑战。前面提到了,如果每当猴子的一个特定神经元触发后,你就给这个猴子一些奖励的话,猴子最终会学会触发这个神经元。这时,这个神经元就能被当作一种遥控器来用。也就是说,利用寻常的运动皮质的指令只是控制机制的一种可能性。


同样的,在脑机接口技术足够成熟到能够进行刺激的时候,你能把脑的神经可塑性作为一个捷径。如果让一个人的仿生手指发送回触觉信息太难实现的话,仿生义肢完全可以发送一些其它信息给脑。最初,主体对于这些信号可能不太适应,但是长此以往,脑会学会把这些信号诠释成一种新的新的触觉。这个把脑作为脑机接口的助手的概念叫作感官替代。


掩藏在这些进展之下的,是未来的技术突破,例如脑对脑沟通。


Nicolelis设计了一个实验,试验中有一只在巴西的老鼠,这个老鼠能够触摸到笼子内的两个开关,并且它知道其中一个开关能够给它带来一份小食。这只巴西老鼠的运动皮质通过互联网,连接到了一只在美国的老鼠的运动皮质。美国的老鼠处在和巴西老鼠一样的实验环境和笼子中,只不过它并不知道两个开关中哪个可以给它带来小食,并且它能收到巴西老鼠的脑发来的信号。


在实验中,如果美国老鼠做出了和巴西老鼠一样的正确选择,两只老鼠都能获得小食,而如果美国老鼠选择了错的开关,两只老鼠都得不到小食。神奇的是,经过一段时间,两只老鼠学会了合作,虽然它们不知道彼此的存在,但是两只老鼠像同一个神经系统一样工作。在完全随机的情况下,美国老鼠的成功率应该是50%,但是因为它能收到巴西老鼠发来的信号,它的成功率达到了64%。


类似的实验在真人测试中也可行。两个待在不同楼里的两个人,一起玩一个游戏,其中一个人能够看到屏幕,而另一个手握控制手柄。用简单的EEG设备,能够看到屏幕的那个玩家能够在不移动手的情况下,用意念“想”按动射击按钮。而因为两个玩家的脑设备在互相通信,手握控制手柄的玩家会感觉到手指的颤抖,然后按下射击按钮。



早期脑机接口类型二:人造耳朵和人造眼


让失聪的人恢复听觉和让失明的人回复视力是比较可控的脑机接口领域,之所以这样,是因为以下的原因:

首先,和运动皮质一样,我们对感官皮质的了解也还不错,这部分归功于感官皮质和身体部位的对应关系也比较好。


其次,在很多的早期应用中,我们不需要直接和大脑打交道,我们只需要和耳朵/眼睛连接大脑的部分打交道就可以了,因为功能丧失基本都是在这些部位发生的。

同时,运动皮质相关的工作都是通过记录神经元行为来把信息从脑取出来,人造感官则是另一个方向——刺激神经元,把信息发回脑中。


具体到人造耳的领域,近几十年我们已经在人造耳蜗领域已经有了非常长足的进展。

当你以为你“听到”声音的时候,其实整个过程是这样的:


声音其实是你的头附近的空气分子的振动。当吉他的弦,或者某人的声带,或者风,或者其它任何东西发出声音的时候,是因为发声的东西在振动,使得其周围的空气分子产生类似的振动。这种振动于是以球形传播开来,就好像你触碰到水后,水面会扩散出圆形水波一样。


你的耳朵就是把这些空气振动转化为电信号的机器。当空气(或者水,或者其它分子会振动的媒介)进入你的耳朵时,你的耳朵把空气振动的方式转化成一种电码转述给相连的神经末梢。这使得神经产生一系列的动作电位,把这些信息传送到听觉皮质里进行处理。你的脑因此就会收到这些信息,而我们把接收这类信息的体验叫作“听到”。


大多数失聪或者有听力障碍的人并没有神经问题或者听觉皮质问题,他们通常只是耳朵有问题。他们的脑和其他人的脑一样可以把电子信号转换为“听”,只是因为耳朵这个电子信号转换机器出了问题,导致他们的听觉皮质根本就没收到这些电子信号。


耳朵有很多部分组成,而耳蜗是做转换的关键部件。当分子振动进入到耳蜗内的液体的时候,振动会带动耳蜗内数千的小毛发的振动,与这些毛发相连的细胞会把振动的机械能转化为电子信号,刺激听觉神经。


耳蜗还会根据频率对声音进行分类。下面这个图解释了为啥低频声音是在耳蜗尽头处理,而高频声音是在开头处理,以及为什么耳朵能听到的声音频率会有上下限。



人造耳蜗就是一个小计算机,它的一端是个贴在耳朵上的小麦克风,另一端则是一条连接安装在耳蜗中的电极的电线。



声音进入到麦克风,然后进入那个褐色的组件,褐色组件会去除不是那么有用的频率范围,然后把剩下的信息通过皮肤的电传导传到计算机的另一个组件,这个组件会把信息转化成电子信号然后送入耳蜗。耳蜗里的电极和耳蜗里的毛发一样按照频率过滤脉冲信号,然后刺激听觉神经。从外面看,人造耳蜗长这个样子。



也就是说,这就是一个人造耳,这个人造耳做“声音——脉冲——听觉神经”的处理,就和人耳一样。人造耳的声音一般听起来都不怎样,为什么呢?因为要达到和人耳一样的处理效果,需要大概3500个电极,大部分人造耳蜗只有16个电极,太粗糙了。


我们现在还处在Pilot ACE时代,当然会比较粗糙了。


能让失聪的人听到声音,并且与人进行对话,这本身就是很大的进步了。


很多失聪婴儿的父母都会在婴儿一岁左右的时候把人造耳蜗植入到婴儿耳中。


在视觉领域,同样的革命也在发生,对应的例子就是人造视网膜。


失明通常是视网膜疾病造成的。这种情况中,人造视网膜能够像人造耳蜗协助听力一样协助视觉。人造视网膜取代视网膜做眼睛本身会进行的操作,然后把电子脉冲信号传达给视觉神经。


人造视网膜是比人造耳蜗更复杂的脑机接口。第一例被美国食品药物监督管理局(FDA)批准的人造视网膜出现在2011年,它叫作Argus II,由Second Sight公司生产,它长这样:

这个人造视网膜有60个传感器,相比人类视网膜的一百万个左右的神经元,太粗糙了。不过能够看到模糊的边缘和形状,以及亮、暗的差别,怎么也好过什么都看不见了。令人振奋的是,其实我们不需要一百万个传感器来获得还过得去的视觉,模拟运算显示,600到1000个电极就能产生足够阅读和进行人脸识别的视觉。



早期脑机接口类型三:深脑刺激


早在上世纪八十年代末,深脑刺激就作为一个粗糙的工具开始改变很多人的生活了。


这个类型的脑机接口不和外部世界交流,它们是通过内部改造来治疗或者改善人体机能。


深脑刺激通常有一到两根电线,连接四个不同位置的电极,然后会插入到脑中,绝大部分会被插入到边缘系统里。然后一个连接了这些电极的小起搏器会被安装到胸口的位置,像下面这位:



当需要的时候,电极就能产生一些刺激,继而引发一些比较重要的行为发生,例如:

  • 减低帕金森患者的抖动

  • 减轻癫痫发作的强度

  • 安抚强迫症


实验上(因为还未经FDA批准),这些设备还能减缓一些慢性疼痛,比如偏头痛和幻肢痛,治疗焦虑、抑郁和创伤后应激障碍,甚至可以结合身体其它部位的肌肉刺激来修复中风或神经疾病造成的神经损伤。


以上就是早期脑机接口行业的情况,也是埃隆马斯克进入这个行业时候的行业现状。对于埃隆和Neuralink来说,今天的脑机接口行业就是A点。我们讲到现在都一直在讲过去,一直讲到了现在这个节点。下一步就是谈谈未来,聊一下B点是怎样的,以及我们怎样才能从A走到B。

“太长不看”版概要:


1、其实你已经是一个半机械人了。例如当你已离不开手机,你已经被这个数字时代赋予了双重身份:物理实体的你(通过生物器官和物理环境互动)& 数字实体的你(通过数字器官和数字世界互动)


2、埃隆马斯克的观点是,决定一个人是不是半机械人的是组件的功能,而不是这个组件在身体里面或者外面


3、身为数字化半机械人,趋势就是升级,从低带宽升级为高带宽全脑接口就是提升输出的契机


4、人类使用语言沟通的流程是:将脑中的思想用“大脑压缩算法”压缩成低传输速率的语言或文字,对方收到这类“文件”后进行解压缩,再经脑算法形成最终的理解。繁杂的流程将极大降低人类沟通的效率,脑机接口的作用就在于还原高分辨率的思维细节


05第五章


魔法纪元


脑机接口这个新兴行业将是改变一切的革命种子。但在很多方面来说,脑机接口的未来不是刚开始发生的新事情。如果退后一步看,更像是一场已经在发生的大变革的下一个大篇章。


语言花了很久时间才变成文字,而文字花了很久时间才变成印刷,而印刷出现的时候1750年的老王也已经出生了。然后出现了电力,接着一切开始变快了,电话、广播、电视、计算机相继出现,于是每个人的家里都变得很神奇。


随后电话变成了无绳电话,又变成了移动电话。计算机从工作和游戏为目的的设备变成了数字世界的窗口,而我们都是这个数字世界的一部分。


然后电话和计算机合并成了一个万能的智能手机,把家里才有的那些神奇功能放进了你的口袋里,甚至变成智能手表戴在我们的手腕上。


我们现在处在虚拟现实(VR)和增强现实(AR)革命的早期,这场革命将用同样的神奇把我们的眼睛和耳朵包围,把我们的整个人都带入数字世界。


即使你不是个未来学家,你也能看到这一切的发生。


魔法已经从工业设施进入到我们家中,又从家中到了我们口袋里,很快就会包围我们的脑袋,而很自然的下一步,就是进入我们的脑中。


而这一步发生的方式就是全脑接口,也就是我们一直提到的魔法帽——一个完整、流畅、生物包容、高带宽的脑机接口,能够像皮质和边缘系统一样作为脑的一部分。


全脑接口能够让你的大脑无线地和云端、计算机或者任何和你使用相同接口的人的大脑交流。这种大脑和外部世界的信息流将会毫不费力,就好像大脑内的思考一般。


虽然我们一直在用脑机接口这个称呼,但是我认为这个称呼并没有很好地诠释全脑接口所包含的“一切的一切”这个概念。所以下面开始,我们干脆直接称呼它为魔法帽吧。



现在,为了能完全明白在脑内装一顶魔法帽能给你带来的改变,你首先需要明白两点事情:

1)这是个很难理解的想法

2)这是个超级疯狂且难理解的想法

我们在这一部分先谈一下第一点,等你消化完第一点后我们再在最后一章谈第二点。


埃隆马斯克把全脑接口和它能实现的功能叫作“数字的第三层”,这个说法有两层意思,与我们上面的两点相互呼应。


第一层意思指的是大脑的实际组成。我们前面提到了脑有三层:脑干(青蛙),边缘系统(猴子)和皮质(理智思考者)。谈背景知识的时候我们力求全面,但是在接下来的讨论中我们将不再讨论青蛙,因为它完全是本能功能性的,并且通常都在幕后运作。


当埃隆马斯克提到“数字的第三层”的时候,他认为我们的脑有两层:动物性的边缘系统(第一层)和更先进的皮质(第二层)。魔法帽,则是我们的第三层,一个充实了其它两层的新组件。


如果这个说法让你不适,那么我们试试用埃隆马斯克的说法:

“某种意义上,我们已经有了数字的第三层,因为你有计算机、智能手机和应用软件。你可以向谷歌提问并且立刻获得答案,你可以阅览任何书籍和音乐。用一个电子表格,你就能进行复杂的运算。如果你把帝国大厦塞满手持计算器的人,整个帝国大厦的计算能力都比不上一个拿着笔记本电脑的人。


你可以免费地和世界另一端的人视频聊天,曾几何时,这样的能力可是要被当作巫术被烧死的。你可以拍摄带声音的视频,拍摄无数的照片,给他们打上人名和地点等标签。你可以通过社交网络免费地同时向数百万人广播信息。这些能力,在短短二十年前,连美国总统都无法做到。”

现在的人们没有意识到的一件事情,就是其实他们已经是半机械人了。你和二十年前的你,甚至十年前的你已经是不一样的生物了。其实你是可以有些体会的,比如被问到“你可以离开你的手机多长时间”这种问题的时候。尤其如果你是个二十多岁的年轻人的话,离开手机一天都是很痛苦的事情。没带手机就和少带了一条腿一样难受。我觉得其实人们已经在某种意义上和他们的手机、计算机和应用软件合为一体了。


这个观点很难消化,因为我们并不觉得自己是半机械人。我们总觉得自己是使用设备的人类而已。但是想想数字化的你自己,当你在网上和人互动,或者跟人视频聊天的时候,或者出现在一个YouTube视频里的时候,数字的你就是你,就好像物理的你也是你一样,不是吗?


唯一的区别是你没有物理地在哪里,你用魔法把自己通过电线、卫星和电磁波以光速把自己传送到了一个很远的地方,唯一不同的东西只是媒介而已。


语言出现前,想把一个想法从你的脑里传到我的脑里是很难的。早期的人类发明了语言这个技术,把声带和耳朵变成了世界上最早的沟通设备,而空气是最早的沟通媒介。我们在与人当面交流的时候还是在用这些设备。它的工作原理是这样的:

在这基础之上,我们迈了一大步,又添加了一层设备,这层设备自带媒介,让我们能够远程交流:



或者




在这个意义上,你的手机就是“你”的一部分,它的性质和你的声带、耳朵、眼睛是你的一部分一样。简单来说,这些东西都是把思想从一个脑传递到另一个脑的工具,至于这个工具是拿在手里,藏在喉咙里,还是在眼窝里,又有什么区别呢?


数字时代让我们有了双重实体:一个物理实体通过生物器官和物理环境互动,一个数字实体通过数字器官和数字世界互动。


但是因为我们平常不这么想,所以我们觉得如果一个人把手机植入到脑中或者喉咙中,他就是半机械人,而把手机拿在手里,贴在耳边打电话的人不是半机械人。埃隆马斯克的观点是,决定一个人是不是半机械人的是组件的功能,而不是这个组件在身体里面或者外面


我们已经是半机械人了,我们有超能力,我们也花很长的时间待在数字世界里。如果你这么想的话,你会意识到升级我们和世界间的媒介是个理所当然的事情。这就是埃隆马斯克相信的当魔法进入我们脑中后会发生的改变。


你已经是个数字超人了。真正会变化的是一个通往你的数字实体的高带宽接口。现在的问题是,现在的接口带宽不够高,尤其在输出这个方面。用手指点屏幕,或者用语言(听写软件或者打字打出来的),都很慢。事实上,输出的速度反而倒退了,原本打字这种最常见的输出方式是用十个手指完成的,现在在手机上只用两手的拇指了。太慢了!有了直连的神经接口后,我们至少能把这个速度提升几个数量级。


也就是说,把技术放到我们脑中不是关于变成半机械人是好事还是坏事。事实上,我们已经是半机械人,并且会继续做半机械人,既然如此,就应该把自己从原始的低带宽的半机械人升级成现代的高带宽的半机械人。


全脑接口就能实现这个升级。它把我们从第一层和第二层存在于头颅内,第三层存在于口袋里或者桌子上的生物 :



变成了三层都存在与一个地方的生物:




你的生活中充满了各种设备,包括你正用来阅读的眼睛。魔法帽能把你的脑也变成一个设备,让你脑内的想法直接进入到数字世界。


而这不绝不仅仅会改革人机交流。


现在,人类之间是这样交流的:



从人类能交流开始我们就是这么交流的,但是在魔法帽的世界里,我们的交流会是这样的:



每次谈起魔法帽的时候,埃隆马斯克都会强调带宽。接口带宽决定了图片是否是高清的,声音是否是高保真的,以及动作是否被严格地控制。而带宽同样是交流中的关键因素。如果信息是杯奶昔的话,带宽就是吸管,今天交流的带宽大概是这样的:


也就是说计算机能用很粗的水管吸奶昔,而人类自我思考的时候能用一根比较粗的吸管,而语言则是小小的咖啡搅拌勺,计算机打字(更不用提手机打字了) 就好像用针管喝奶昔一样——一分钟能喝一滴就不错了,


Moran Cerf收集了神经系统不同部位的带宽,并制成了图,然后和计算机的带宽做比较:


可以看到,我们的交流(打字只有每秒30比特的速度)和思考的带宽差距是非常大的,比之前那张图的差距更加明显。


而当我们的大脑也变成设备后,那些细细的吸管就被淘汰了,把所有的这些:


全部变成了这个:



这样保证了所有信息的完整,还省去了不必要的麻烦,把前面的图变成了这样:



我们还是在用吸管,只不过这些吸管更粗更有效。


而带宽对于交流的提高不只是速度,埃隆马斯克指出交流的细节和准确度也会提升。


你脑里有很多想法,而脑会把这些信息压缩成很低码率(注:码率,数据传输速率)的语言或者打字,语言的本质就是你的脑把思想和思想传输通过压缩算法压缩后的成果。同样的还有听别人说话,当你听到别人说的东西的时候,还要做一下解压缩,这也会造成信息的丢失。


所以,当你解压缩语言的时候,你是在试图理解语言的同时,以对方的心理状态建模,来理解对方真实的意图,然后把对方的意图在自己脑中重新组合,来理解对方说的是什么。如果两个脑都有接口的话,完全可以进行未经压缩的思想直连。



这其实是说得通的,思维的细节其实就是高分辨率的思考,大文件如果通过小吸管来传递的话就太慢了。小吸管使得你只有两个选择:花很多时间说很多话来真实地描述思维的细节,或者用简短的语言略过细节来节省时间。但是最后的结果肯定是无法成功的把细节传递出去。


让这个问题更加难对付的是语言本身就是个很低分辨率的媒介。一个词语只是思想的近似表述——很多相似但是略有不同的思想能够用同一个词来代表。如果我看了部恐怖片然后想向你描述的话,我能用的就是一些很低分辨率的词语“吓人”、“可怕”、“一身冷汗”和“全程紧绷”。我对于那部特定恐怖片的印象是很特别的,和我对其它恐怖片的感受是不一样的。


但是语言这个粗糙的工具使得我只能用最近似的词汇来描述,而你能收到的信息也就是这些近似的词汇,而不是我的思想,而我对于那部恐怖片的具体印象的思维细节究竟是怎样的,你只能通过这些近似的词汇来猜测了。你会把我的描述“吓死我了”解压缩成一个高分辨率的想法,然后结合成自己脑中“吓死我了”对应的思维细节,而这份思维细节不可避免地基于你观看其它恐怖片的经历和你个人的性格。


最终的结果是很多的信息在压缩和解压缩中丢失了,而这恰恰是用低分辨率媒介和低分辨率工具来快速传输高分辨率文件所带来的必然结果。这也是为什么埃隆 马斯克认为语言数据传输是“失真”的。


我们总是尽力减少这些限制,我们用稍微高分辨率的格式,比如视频,来协助语言传输充满细节的图像思维;也会用音乐来帮助传输充满细节的情绪。但是比起脑中那些独特并充满细节的想法,以及我们思维内部的高带宽吸管,所有人和人之间的交流都是非常失真的。



从本质上来思考下交流这个现象,其实无非就是脑和脑直接分享东西,你见到的交流的历史不是这样的:



而是这样的:



或者这样的:



可以说,交流的第二个纪元,十万年左右的间接脑交流,就快走到它的尽头了。宏观地看整条时间线,很可能在过去的150年里,我们突然开始提升交流的媒介,这在未来人类看来可能就是第二纪元到第三纪元的过渡期。我们很可能生活在时间线的那条分割线上。



而因为间接沟通需要其他身体器官或者数字组件的参与,未来回顾第二纪元的时候,可能把它看做使用物理设备的纪元。而脑成为设备的那个纪元里,你其实不需要带任何设备。你只需要带着自己的身体,穿着衣服(如果你想穿的话),就够了。


当埃隆马斯克谈到魔法帽的时候,他通常都在谈交流带宽和分辨率。我们会在第六部分谈到为什么。


但是首先,我们先说一下脑作为设备这个神奇的概念,并且谈谈有了魔法帽的世界会是怎样的。



请记住,在接下来的思考过程中,我们谈到的东西都不会是突然出现的。你不会从脑内没有外物就突然有了数字的第三层,就好像人们不会前一秒还在用上世纪八十年代的苹果个人电脑,下一秒就用上微信一样。魔法纪元的降临是个逐渐的过程,而当转换真的开始的时候,我们对于那些技术肯定已经习以为常了。


一个能够支持这种想法的证据就是,我们其实已经踏上了通往魔法纪元的台阶,而你都没察觉到。现在有成千上万的人脑内有电极,或者在使用人造耳蜗、人造视网膜或者深脑植入物,这些人都是早期脑机接口的受益者。


通往魔法纪元的台阶剩下的部分,还是会专注于恢复失去的身体机能,最先被数字脑技术改变生活的是残疾人。随着更多脑机接口能解救更多的残疾,脑植入物的概念会从难以接受变成习以为常——如果今天你朋友告诉你关于他刚刚做了激光近视矫正的事情,或者你的长辈装了一个心脏起搏器,你不会觉得有什么不正常。


埃隆马斯克提到有几类人是早期脑机接口可以帮助到的:

“脑机接口技术最先的应用是修复中风、切除癌变脑组织等造成的脑损伤。这些脑损伤中,受损伤的人都会失去一部分认知功能。脑机接口还能帮助四肢瘫痪或者截瘫的人提供一条从运动皮质到全身的分流信道,使得肌肉能再度被控制。它还能帮助那些随着年纪增长而面临记忆力衰退的人,这些人可能会记不得自己孩子的名字,但是记忆增加能够使他们在生命晚期也能够更好地生活。解决这些问题带来的医学进展的收益是很明显的,因为我们所有人都会老,不是吗?”

我的祖父在去世前的五年的时间里一直与失忆斗争,听到脑机接口能做到的事情,我很激动。


随着接口带宽的提高,现在影响百万人生活的残疾会快速减少。完全失明和完全失聪,不管是感官疾病,还是脑的问题造成的,都在被解决的过程中。只要有足够的时间,视觉和听觉的丧失肯定会被完美的修复。


人造义肢,以及更好用的穿在衣服下面的全身外骨骼,也会出现。这些义肢会从脑接受运动功能信号,也会把触觉信号传递回脑,瘫痪和截肢对人的生活长期将不会有太大的影响。


而对于阿尔兹海默症(注:又名“老年痴呆“)患者,因为记忆本身并不太会丢失,常常只是通往这些记忆的桥梁断了而已。先进的脑机接口能够修复这些桥梁,或者自身变成新的桥梁。


当这些都开始发生的时候,脑机接口会被没有残疾的人们所接受。早期使用脑机接口的人可能都是富人,但早期的手机用户也都是富人。



这是电影《华尔街》里的角色Gordon Gekko。在1983年,这样一台两斤重的大哥大售价约等于今天的9000美元。而今天,世界上超过一半的人都有一台手机,所有人的手机都比Gordon的好很多很多。


随着手机变得便宜并且更好用,它们也从充满未来感的高级玩意儿变成了满大街都有的东西。脑机接口经历过这样的过程后,更多好玩的事物会出现。


根据我和埃隆马斯克, Ramez和十几位神经科学家学到的东西,我们来看看几十年后的世界会是怎么样的。时间并不确定,下面这些进展的发生顺序也不一定准确。当然,很多的预测会大大偏离现实,也会有很多这个领域的进展不会出现在我们的预测中,因为我们现在根本还没有办法想象未来会有什么。


但是很多这些预测的某些版本可能会发生,而且很多会出现在你的有生之年。


所有这些预测,大概可以分成两类:

交流能力

内部增强



魔法纪元:交流



运动交流


这部分提到的交流可以是人与人,也可以是人与计算机的。运动交流是关于人与计算机的,也就是前面提到的“把运动皮质当作遥控器来用”,但是现在谈到的版本比之前的要激进很多。


和很多未来的脑机接口的分类可能性一样,运动交流将会从修复残疾人丧失的运动机能开始,而当这个领域的进展持续打开各种可能性,这部分的技术将会用来增强非残疾人的机能。能帮助四肢瘫痪的人用意念来遥控仿生臂移动的技术,同样可以被任何人用来用意念移动任何东西。这么说有点歧义,此处的任何东西不是广义的任何东西,而是任何大脑能遥控的东西。当然,在魔法纪元,很多东西都能被大脑遥控。


你的汽车(或者到时人们会使用的其它交通工具)会自动停到你家门口,你的意念会把车门打开。当你走向家门口的时候,意念会解锁并打开家门(到时所有的门都能接受运动皮质的指令)。当你想喝咖啡的时候,咖啡机会开始煮咖啡。当你走向冰箱时,冰箱门会打开,等你取完东西后冰箱门又会自动关上。到了睡觉时间,你会决定打开暖气并关灯,暖气和灯会感知到你的决定,然后自行操作。


这一切都不需要你费力去思考,我们会很适应这种方式,这一切都会非常自动而下意识地发生,就好像你不需要费力思考就能控制眼球读完这句话一样。


人们会用意念弹钢琴、造大楼和控制车辆。事实上,如果你在开车的时候前方突然出现一个物体,按照神经科学家的理解,你的大脑在你的意识知道发生了什么之前或者双手拨转方向盘前就已经看到这个物体,而当控制车辆的是你的大脑的时候,你会在意识到发生了什么之前就绕开那个物体了。


思想交流


这是我们上面讨论过的,但是你可不要本能地认为思想交流就和平常的语言交流一样是在脑内听到对方的声音。按我们之前讨论的,词汇是思维经过压缩后的近似表述。我们既然可以直接交流,何必再去做压缩和解压缩,来传输失真的信息呢?当你看电影的时候,脑子里充满了各种想法,但是你的脑内会产生一个压缩过的语言会话吗?应该不会吧,你只是直接想而已,而思想交流和这种情况是类似的。


埃隆马斯克说:

“如果我要把一个概念传达给你,我们其实是进行了一场两厢情愿的心灵感应。你不需要使用语言,除非你想给这场交流加入一些其它元素(比如笑声)。整个交流会是概念的互动,而这种互动的层次是现在难以想象的。”

这就是关键了,现在很难理解和别人一起“想”是这样的一种感觉,因为我们从未能够真正地做到这件事。我们和自己用思想交流,和别人用思想的符号化表述(比如语言和文字)交流,而这就是我们想象力的极限了。


更难以想象的是集体思考这个概念。魔法纪元的集体头脑风暴大概会是这样的:



当然,他们不需要在同一间屋子里。这组人可以在四个不同的国家,无需任何外置设备就完成这一切。


Ramez撰文描述过集体思考可能给世界带来的影响。

“这种交流对于创新步伐的影响是很大的,科学家和工程师们可以更加流畅地合作。对于公共领域的改变也是很有可能的,就好像电子邮件、博客、微博都成功地改变了公共对话。”

今天“合作”这个概念意味着两个或者更多的大脑一起工作,创造出这些大脑单独无法创造出的东西。很多时候,这样的合作还挺不错,但是如果考虑到语言传输过程中造成的失真,你就会知道集体思考是会比现在的合作方式更加有效很多的。


我问了埃隆马斯克一个每个人第一次听到思想交流这个概念时都会想到的问题:“那是不是每个人都会知道我在想什么?”


他向我保证这种担忧是多余的:

“别人是没有办法直接读到你的思想的,你首先要允许。如果你不允许,思想交流就不存在。就好像如果你不让你的嘴说话,你的嘴就不会说话。”

你还可以和计算机一起思考。这种思考不是简单地下发命令,而是真的和计算机一起头脑风暴。你可以和计算机一起规划事情,甚至谱曲。Ramez提到我们可以把计算机当作一个想象的合作者:

“你可以先想象一些东西,然后更加擅长预测或者分析物理模型的计算机可以帮你补充限制条件,而这个过程能够给你带来反馈信息。”

另一个当人们提到思想交流时会提出的顾虑就是个性的丧失。这种思想交流是否会把我们变成一个集体的蜂群,而每个人的大脑只是一只没有独立思想的蜜蜂呢?几乎所有和我交流过的专家都认为事实会和这完全相反。我们当然可以在对自己有利的时候像一个个体般共同思考,但是迄今为止技术一直是在提升人类个体的个性的。


想象一下,今天的你和50年前、100年前或者500年前的人比起来,在表达自己的个性和定制自己的生活上面,是不是更加容易?我们没有任何理由相信技术的进步会带来这种趋势的逆转。


多媒体交流


多媒体交流和思想交流类似,但是想象一下,如果你能直接把思想传送给另一个人,那么向别人描述一个梦、一段音乐或者一段记忆,那该是多简单的事情啊?用埃隆马斯克的话来说,

“我可以在脑中非常清晰地想象一束花的样子,但是如果要用语言向你描述这束花的话,需要讲很久,而你依然只能听明白这束花大概长什么样子。”

和现在的工程制图比起来,如果一群工程师、建筑师和设计师,能够直接把脑内的想象投影到屏幕上,而团队其他人可以直接用意念对图像进行调整,那么设计一座桥或者一栋楼或者一件新衣服是不是会快很多?更不用提这种方式可以避免工程制图中无可避免的信息失真。


如果莫扎特能够直接把脑内的音乐记录在纸上,他能够比原本多创作多少交响乐?世界上有多少有莫扎特般天分的人,因为没有机会好好学习乐器而不能把他们脑中美妙的音乐记录下来?


不久前我看了一部很有趣的动画短片。短片的制作者Felix Colgrave说这个短片花了他两年的时间。这两年时间里有多少时间是用来进行艺术的想象,又有多少时间是用来痛苦地把脑内的想象输入到动画制作软件里面?也许几十年后,我能够直接从Felix的脑中直接收看实时想象出来的动画片呢。


情感交流


情感是一个典型的语言没法准确描述的概念。如果十个人都说“我很难过”,这十个人可能经历着不同的情绪。在魔法纪元,你可能有办法很快的理解每个人各自独特的情感,因为每个人的情感就和外表一样是独特的。


这种交流是可行的,当一个人交流自己的情感的时候,另一个人能通过自己的情感中心体会到对方的感觉。这对一个更充满同情心的未来的建立肯定是有帮助的。情感交流还可以被用在娱乐上面,比如看一部电影的时候,电影可以直接向观众的边缘系统广播特定的情感。电影配乐其实就是起到这种广播情感的作用,只是情感交流能让这种行为更加直接。


感官交流


这个就有点厉害了。


现在,能作为你的听觉皮质的收音麦克风的设备只有你的两个耳朵;能作为你的视觉皮质的摄像机的设备只有你的两个眼睛;你唯一的触觉器官只有皮肤;唯一能让你感受味觉的是你的舌头。


但就像我们现在能植入人工耳蜗一样,未来我们可以让任何地方的感官输入信息直接无线进入你的魔法帽,然后直接进入你的感官皮质里面。在未来,感觉器官只是所有感官信号的入口之一,而它们和其它可能的入口比起来,还不是特别厉害的那些。



那么输出呢?


现在,耳朵收录的信号的唯一听众是你的听觉皮质,眼睛信号唯一的观众是你自己,能感觉到皮肤触感的也只有你,因为只有你能接触到那些相应的感官皮质。有了魔法帽后,把这些输入信号传输出去就变得很简单了。


所以你不但会有感觉输入能力,还会有感官输出能力,或者两者同时具备,而这能带来很多神奇的可能性。


假如你在一个风景秀丽的地方徒步,然后想给你的爱人展现一下路边风景——没问题,你只要用意念尝试和他建立一个脑连接就好了。他接受了你的脑连接请求后,你就能把你的视网膜信号直接传给他的视觉皮质,而他就能直接看到你的眼睛能看到的东西。他可能会要求你提供其它感官信息给他,让他更好地体验,于是你把其它的感官信息也传输给他,他就能听到远处瀑布的声音,感受到微风拂面,闻到草木的香味,甚至会被突然跳到手臂上的虫子吓一跳。


在这个只有三十秒的共享中,你们完成了五分钟左右的关于风景的讨论,包括你最喜欢的部分和这些风景勾起的你的回忆,还顺便聆听了你的爱人今天生活中发生的事情。分享完后他说他要继续去工作了,于是切断了除了视觉之外的感官信息,然后他把你的视觉信息缩小成为一个画中画,置于他自己的视觉旁边,这样他可以时不时回来看看远足途中的风景。


外科医生可以不再用手握手术刀,而是用自己的运动皮质控制一把机械手术刀,而同时那把手术刀会像她的第十一根手指一样,给她返回触觉信息。这样一来,就好像她自己的手指是把手术刀一样,她可以不用握着任何工具就能做手术,这样的切割会更加精准。一个没有经验的外科医生做手术的时候可以带着她的导师一起来,导师可以同步查看她的视觉信息,并且用意念给出建议。一旦手术出了意外,导师可以立刻接手,把自己的运动皮质连上新手医生的输出信号,直接控制她的手来操作。


屏幕也就不再需要了,因为你可以直接让一个屏幕出现在你的视觉皮质中,或者带着自己所有的感官进入一场VR电影中。提到了VR,那顺便说下,造出了Oculus Rift的脸书正在研究这方面的技术。在我和脸书创始人Mark Zuckerberg的一场关于VR的访谈中,我们的对话一度谈到了脑机接口。Mark告诉我:“触觉能帮你获得输入信息,这是触觉反馈的一小部分。长期来看,我们未必真的需要手握控制手柄,也许比起按按钮,直接用意念想会更好。”


能够记录感官信息意味着你也可以记录记忆,或者分享记忆,因为记忆本来就是一份不那么精确的感官记录而已。你甚至可以把记忆当作现场体验来回放,也就是说电视剧《黑镜》里面的场景可能会成真。


一个NBA球星可以向粉丝发出直播邀请,这样在比赛时粉丝们就能透过球星的眼睛和耳朵来体验整场比赛,而那些错过直播的完全可以看回放。


你甚至可以把美妙的性经历上传到云端反复回味,如果你不是那么注重隐私的话,你甚至可以把这段经历和朋友分享。(可以预料,色情产业在数字脑时代一定会蓬勃发展



现在,你可以在YouTube上免费看到几乎所有事情的第一手资料,这是能把1750年的老王吓尿的超能力。但是到了魔法纪元,你能够免费地体验到几乎所有的事情。“优雅的体验只限于富人才能享受”,这种现象将成为历史。


Moran Cerf想象出来的另一个点子:“也许因为美国橄榄球联盟的运动员经常脑受伤会让未来的橄榄球规则改变,未来的运动员只需要坐在场外,然后用运动皮质控制人造身体,用人造身体的眼睛和耳朵来参于比赛。”


我很喜欢这个点子,而且这个点子也许比看起来的更可能实现。你依然会需要优秀的运动员来参于比赛,因为一个优秀运动员真正优秀的是他的运动皮质、肌肉记忆和决策力。而优秀运动员的另一个组成部分——优秀的身体,将变成人造的。组委会可以让所有的人造身体都一模一样,这样反而能够看出来哪个运动员的技术是最优秀的。或者,组委会也可以要求人造身体和运动员的身体一模一样。不管采用哪种方式,如果这种改变发生,那我们再回头看就会发现现在运动员们带着自己脆弱的大脑在场上比赛是件多么不靠谱的事情了。


我可以继续谈下去,但是这个讨论是说不完的。魔法帽的世界里,交流的可能性是没有尽头的,尤其是当这些可能性组合起来的时候,想想就好玩。



魔法纪元:内部控制


涉及到信息流入和流出,脑的交流,只是魔法帽能做的事情的其中一样。


全脑接口可以用任何方法刺激你的脑的任何部位,这是必须的,不然是无法实现上面提到的信息输入脑的功能的。这个功能还能让你更好的控制你的脑,以下是未来的人们会用到的一些应用:


脑中实现双赢


通常来讲,脑中前额皮层和边缘系统的斗争的根源,是两个系统都想为你好,只是边缘系统通常是错的,因为边缘系统觉得我们还生活在五万年前的某个部落里。


你的边缘系统让你连吃九块水果糖不是为了欺负你,而是因为它觉得

A) 任何那么甜那么有嚼劲的东西肯定富含卡路里

B) 你可能在接下来的四天里都没有东西吃,所以有机会吃高卡路里的食物的时候最好多吃点

而你的前额皮层则是满脸惊恐:“我们这是在搞什么鬼!”


而Moran Cerf认为一个好的全脑接口能够解决这个问题。

“比如我们吃一块巧克力蛋糕,我们边吃边把数据传给认知器官。这些数据让我们获得美食的愉悦,而这份愉悦并不存在于蛋糕里面,而是我们的一种神经体验。把我们的感官欲望(吃蛋糕的经历)和生存目的(营养)剥离,将很快可以被实现。”

如果真的能实现的话,感官剥离这个概念就太有用了。你能获得吃垃圾食品的快感,但不用真的去吃垃圾食品。Moran解释道:“你真正需要吃的,是根据个人的基因、微生物群和其它因素定制出来的营养摄入。饮食将从欲望的统治中被释放出来。”


同样的原则也适用于性、毒品、酒精和其它能给人带来健康问题或其它问题的享乐形式。


Ramez Naam还提到了全脑接口能够帮助我们更加守时:

“我们知道刺激脑的相应部位能够引发睡意或者警惕感、饥饿感或者饱腹感、悠闲或者舒适感,而这些感觉的激发都非常得快。有了这些,你就能像运行程序一样守时(“Siri,让我睡到早上七点半,除了高优先级事件外不要打扰我。让我中午左右开始感到饥饿,但是到时不要让我想吃糖分。”)”


控制情绪失控


Ramez还强调,科学证据显示情绪和失控和我们脑内化学物质的反应有关。现在我们通过服用药物来影响这些化学物质,而Ramez认为直接的神经刺激是个更好的选择: 

“药物进入脑后是随机散开的,接触到哪个感受器就是哪个。神经接口,则能够逐个区域地进行刺激,可以实时控制,还能记录正在发生的事情的信息。”

如果我们能更好的控制我们的脑,抑郁、焦虑、强迫症和其它的失控症状都会变得很容易根除。


搞乱你的感官


想透过狗的听觉听一下这个世界?容易。我们的耳蜗会限制我们能听到的频率范围,但是超过耳蜗接受范围的声音可以被直接送入声音皮质。


或者你想获得一种新的感官。比如说你喜欢观鸟,你想要能够随时感觉到身边是否有鸟。于是你买了一架通过热源信息来探测鸟的位置的望远镜,你把望远镜和你的脑机接口相连,当望远镜检测到鸟的时候,就会用特定的方式刺激你的神经元来让你察觉到鸟的位置。我没法描述这种新的感官会是什么感觉,所以我用“看”、“感觉”能词汇,因为我们的想象受限于我们仅有的五种感官。但是在未来,会有很多新的词汇来描述其它有用的感官。


你也可以减弱或者关闭部分感官,比如关闭对痛的感知。痛是身体告诉你要注意的一种方式,但是在未来,我们也许可以用稍微不那么糟糕的方式来获得这种信息。


增长知识


小白鼠实验显示,通过让一些神经元建立长期连接,脑的学习速度是可以被提高两倍甚至三倍的。


你的脑将能随时访问全世界所有的知识。我和Ramez讨论了从云端获取知识的可行性。我们把这个过程分成了四个等级,等级越高需要的脑机接口的性能也就越高:

第一级:我想知道一个事实。我访问云端,就好像用脑做了一次谷歌搜索查询一样,答案以文字的形式出现在我脑中。这和现在的谷歌查询没有差别,只不过是在脑内完成的。


第二级:我想知道一个事实。我访问云端,一秒后我就知道了。我不需要阅读文字,这个过程就好像我回忆起一些本来就知道的事情一样。


第三级:在我想要知道一件事情的那一秒我就知道了。我都分不清这个信息来自于云端还是本来就在我的脑内。我能把整个云端当作我的脑。我不知道其中的所有信息,因为我的脑没法储存所有的信息,但是任何时候只要我想知道一件事情,那件事情就会被快速无缝的下载到我的意识里面,就好像它原本就在我脑内一样。


第四级:不只是了解事实,我可以用复杂的方式深度理解任何我想理解的事情。我们用《白鲸记》这部小说作为例子,我能够把这本书从云端下载到我的记忆里,然后就像真的读过整本书一样,有感想和观点,甚至能够背诵相关段落,和讨论小说的主体。

Ramez认为只要时间足够,这四种级别都可能被实现,当然第四级本身如果真的能实现,也需要很久时间才行。



所以带上魔法帽能给我们带来大概许多潜在的好事情,下面我们说一些不是那么好的事情。



魔法帽让人担忧的一面


一如既往的,当魔法纪元降临的时候,社会上的那些混蛋又会出来捣乱。


但是这次,风险格外的大,因为有这些事情需要我们操心:


键盘侠们会更加嚣张。自从互联网出现以来,那些有键盘侠人格的乌合之众们就非常嚣张,他们自己估计都不会预料到网络让他们如此肆意妄为。但是有了脑机接口后,他们会更加嚣张。人与人之间更好的互联意味着一些好事,比如接触更多人后产生的更多的同情心;但也意味着一些坏事情。和互联网一样,坏人们会有更多的机会散播仇恨或者组建仇恨组织。对于恐怖组织ISIS来说,互联网是个招募新人的绝佳工具,而有了脑机接口的世界,招募新人恐怕会更容易。


计算机会死机,程序会有bug。通常这不是什么大问题,因为计算机可以重启,而就算真的修不好了,你还可以再买一台。但是你不可能再长一个头出来,要做的预防工作要比现在丰富很多才行。


黑客会来黑你的计算机,而未来,黑客可以直接窃取你的思想、感官信息和记忆。这可是很糟糕的。


卧槽,黑客会来黑你的计算机啊!上面说的只不过是坏人偷取你脑内的信息,但是脑机接口还允许信息被输入到脑中。也就是说一个聪明的黑客可以改变你的思想、选票、身份,或者让你做一些你本来完全不会做的坏事。而你对这些根本不会有察觉。也许你会想投票给一个总统候选人,但也会担忧你的这种投票倾向有没有受到别人的干扰。最糟糕的情况是像ISIS这样的组织,通过改变思想的方式招募数百万人加入组织。这段话是本文最吓人的一段了,不再展开了。



虽然有很多混蛋,但是魔法纪元依然会是个好事情


物理学的进步让坏人也能造出原子弹;生物学的进步让坏人也能造出生化武器;汽车和飞机每年的事故造成上百万人丧生;互联网使得假新闻能够传播,让我们容易被黑客攻击,让恐怖分子招募新人更容易,让坏人更加嚣张。


然而,人们会选择把我们对于科学的理解都消除掉,让社会变回到骑马代步,划船渡江的时代,来废除掉互联网吗?


应该不会。


有些人可能想废掉互联网,但是我想如果我们告诉这些人互联网帮助的人数远多过它伤害的人数的话,他们应该会改变自己的想法的。


新技术总是伴随着新的危险,并且总是会伤害到很多人。但是新技术帮助到的人却总是多过被伤害的人。总的来说,技术的发展几乎总是一个正面的事情。


人们总是对新技术有一些抵触,因为他们担心新技术不健康,或者会让我们失去一部分人性。但是即使是这些人,如果有的选的话,多半也是不愿意让社会倒退回1750年的老王的时代的。那个时代,一半的小孩活不到五岁,几乎所有人都不太可能做长途旅行,有远比现代多的人间惨剧发生,全世界的女性和少数族裔拥有很少的人权,有远比现在多的人不识字或者生活在贫困线以下。


人们是不愿意回到1750年那个人类技术大规模爆发之前的时代生活的,人们对于科技还是很感恩的。然而他们依然对于技术有意见,觉得技术在摧毁我们的生活,觉得以前的人更加睿智,觉得世界在越变越糟。我觉得这群人是没有想清楚。


所以虽然魔法纪元会有很多的危险出现,这些危险是很糟糕的,并且很多会持续糟糕下去,在坏人手里,这些危险会变成大的暴行或者灾难。但是魔高一尺,道高一丈。好人们会一如既往地讨伐那些混蛋,一个新兴的“大脑安全”行业会诞生。我敢打赌,有的选的话,魔法纪元的人肯定不愿意回到2017年生活。



 时间线


每当专家们的观点互相矛盾的时候,我就总是觉得人类根本不知道一些事情的真正走向。


我们通往魔法纪元的时间线就是这样的一个情况,因为没人知道我们能把史蒂文森定律变得多接近摩尔定律。


我和专家们的讨论产生了很多关于时间线的观点。一位神经科学家认为我有生之年就能看到全脑接口,马克扎克伯格说:

“如果25年内我们不能在脑机交流上做出一些进步,我会很失望的。”

Ramez Naam的预测比较保守,他认为人们开始为了修复残疾以外的原因安装脑机接口可能要等到50年之后了,而大规模的脑机接口推广可能要更久。


Ramez希望自己的预测是错的,他希望埃隆马斯克加速这个发展曲线。


当我问埃隆马斯克他的时间线的时候,他说:

“我觉得8到10年左右,我们就能开始让没有残疾的人使用我们的技术了。当然,这取决于监管审核的时机,以及我们的设备对残疾人的帮助究竟有多大。”


在另一次讨论中,我问他为什么他要进入生物科技的这个分支,而不是遗传学,他回复到:

“遗传学太慢了。婴儿变成成年人需要二十年时间,我们等不起。”

很多人出于各种不同的动机进入这个领域,但是埃隆马斯克是唯一一个因为时间紧迫这个动机而参与进来的。


埃隆马斯克急着要把我们带进魔法纪元,其实解开了Neuralink的谜题,为我们填上了最后一个空格:



埃隆马斯克的公司总是存在一个“目标达成的结果”,这才是他创办一家公司的真实原因,这块内容把一家公司的目标和人类美好的未来联系起来。对于Neuralink来说,我们需要在很宏观的角度才能理解这一块内容。


前面几万字的铺垫已经足够了,我们能够开始谈谈人类变成人工智能这件事了,敬请期待最后一篇推文——大融合,揭晓一下为什么至今为止一直在强调带宽,以及为什么变成人工智能可能是人类唯一的出路。

“太长不看”版概要:


1. 五万年前的人类与如今并无本质上的差异,而沉淀了千年知识与智慧的人类巨灵已经达到了一个前所未有的高度:如今的人类,可能会见证生物技术把人类寿命从自然意志中解放出来,交回到每个个体手中。


2. 人类巨灵将人类置于多个变革临界点上,埃隆马斯克认为研发会思考的超人工智能将是人类迄今为止可能面对的最大的生存危机,最小化危机的策略就是推动人工智能朝“民有、民治、民享”的方发展


3. 应当警惕的是:人类试图创造的人工智能进化到不再满足于一直作为人类思想的延展,将可能摆脱人类的控制,使人类沦为“其他生物”的一员


4. 在一个由人工智能和“其它所有生物”组成的未来,我们只有一条出路:“变成人工智能“。唯有实现人类和人工智能的融合共生,人工智能才是真正属于我们的,而我们与人工智能的整合程度也将是我们在充满人工智能的未来能过的多好的关键因素。


第六章——篇幅超了,略

-------

篇幅所限,此处仅罗列部分,全文参考:

英文版:https://waitbutwhy.com/2017/04/neuralink.html

中文完整版文档:https://share.weiyun.com/5y4D89d


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存