蔡恒进,蔡天琪|人的意识可以“上传”吗?
蔡恒进教授
实际上,人类的复杂程度并不足以构成机器难以超越的高墙。“基础模型”(Foundation Models,是指在大规模的广泛数据上进行训练并且可以调整以适应广泛的下游任务的任何模型,例如BERT、GPT-3和CLIP等)的研究报告显示,从技术角度来看,基础模型是基于深度神经网络和自我监督学习技术。这两种技术已经存在了几十年,然而在近几年里,基础模型的规模和范围扩张如此之快,让我们不断刷新对未来的期望值。例如,2020年6月发布的GPT-3有1750亿个参数,2021年6月发布的“悟道2.0”的参数量更是达到了1.75万亿。自监督训练使得基础模型对显式注释的依赖性下降,也带来了智能体基本认知能力(如常识推理)的进步,但与此同时也导致了基础模型的“涌现”与“同质化”特性。“涌现”意味着一个系统的行为是隐性推动的,而不是显式构建的;“同质化”指基础模型的能力即为智能的中心与核心,模型的任何一点改进都会迅速覆盖整个社区,其缺陷也会被下游模型所继承。尽管基础模型逐渐被广泛应用,但我们目前还不清楚它们是如何工作的,何时会失败以及它们的涌现特性将赋予它们什么样的能力。
有学者认为,在自然人现有的心灵基础上改造和进化起来的新智慧生命之间构建的政治秩序会不同于纯硅基强人工智能的“单一”与“共存”两极,有可能形成一个多元智能生命体的“共和”状态。还有学者表示,在政治哲学的层面上,我们所需要聚焦与面对的是专用人工智能已经开启的“竞速统治”。人类作为行动元的介入能力正在被迅速边缘化,意味着我们必须要以“加速主义”的方式重构政治共同体及其所需要的政治哲学。
一方面,技术发展速度不断加快,在不同专业领域中的应用效果也在被持续快速刷新,但作为AI技术的设计者,人类目前无法解答AI模型的可解释性、可迁移性和鲁棒性问题;另一方面,对AI的发展有正确的预计:人工智能是否能够、何时将以主体的形式参与对世界的认知与改造,人机能否融合,究竟是让人更像机器,还是让机器更像人,我们应当鼓励发展何种人工智能,以应对未来的社会治理问题。
很多业内外人士寄希望于通用人工智能(AGI)的突破,AGI有别于专用人工智能,其主要专注于研制像人一样思考、像人一样具有多种技能的机器。要想找到人类继续发挥超越性的优势,实现AGI的突破,就要求我们必须从根本上剖析人机认知的差异,正确审视生命主体与物理世界的关系,厘清意识与智能的关系,才有可能对这些问题做出回答。
每个人都拥有意识,人可以随时随地、毫不经意地感受和使用意识,但意识的起源与本质却是一个千古难题。意识难以被定义清楚,也并不是物理世界中的实在物,但带给人的感受又是如此真实。西方哲学中,从尼采、海德格尔直到马克思,逐步将人与动物划清界限,研究者将人的意识从神的赋予转变为一种理性的存在、自由自觉的活动,也逐渐放弃了从生命的角度、从“自我”的维度去探索人类意识的本源。哲学家大卫·查默斯认为,容易的问题(Easy Problem)看似复杂但可以解决,所需要的只是指定一种能够执行该功能的机制。而看似简单的意识问题才是难题(Hard Problem)。意识的难题是要求解释我们如何以及为什么有感质(qualia)或现象体验,感觉(如颜色和味道)是如何获得特征的问题。
本文在理解意识特征的基础上探讨意识上传的问题。人的意识世界可以看作一个个意识单元的集合,我们主张先有原意识(对“我”的意识),而后才有意识,有了意识,智能才有必要与可能。当我们讨论是否、能否以及如何将意识上传给机器等问题,实际上是期待机器能够习得并像人一样运用甚至创造出意识单元,而不是仅仅将意识单元存储在机器上。那么,我们首先要解决机器的“原意识”问题,也就是赋予机器最初的对“自我”的意识,有了自我意识,机器才可能自如地统摄其他意识单元。现在机器的主程序可以看作微弱的“我”,但还不足以形成对其他意识单元和环境的统摄,还需要通过人类赋予机器一个更强的“我”的原型,来实现这种统摄。
海德格尔曾谈到希腊思想的基本特征。早期希腊思想家已经认识到,事或物的显现方式由境域(视域)决定。在个人的境域(私人世界)中,个体往往陷入局部认知,只有在共同境域(共同世界)中,才更完整地揭示自己。赫拉克利特说人不可能两次踏入同一条河流,就是全能视角的论述。对于人来说,“我”可以很多次踏入同一条河流,太阳每天都会升起,即使有时会被云遮挡。在生命视角下,生命个体从自己的角度认知世界,形成不同的坎陷世界以及对世界的不同认知;在全能视角下,全知全能者看到的是共同境域,能够知晓一切实事。
还原主义主张意识、智能都可以被完全还原,处于物理过程之中,但最终是一种幻觉、一种随附,而不是本质。从全能视角来看,这种还原可以成立,但从生命视角来看,强还原主义就有问题。在生命个体看来,世界是无限的,即便宇宙中的粒子数量有限,但个体面对的未来世界可以是无穷的,因此对生命而言,需要意识与智能来帮助自己应对无穷的环境可能,假如是全知全能者,就不需要智能,因为一切都已清晰明了。过去的相变是空间结构或者二维的相变,而生命可以看作有时间维度的相变。这与“时间晶体”不同,因为时间晶体是周期性的,会回到严格意义上的原点。生命这种相变带来一种新的特征,就是“我”的意识。一开始“我”的意识非常微弱,对世界的影响很小,但随着代际传承,主体间、主体与外界的相互作用,“我”就会变得越来越强大,越来越有影响力。复杂性科学对意识的研究还是全能视角,但我们将自我意识放在非常重要的地位,主张从生命视角来理解意识与智能,这是与复杂性科学的根本不同。西方科学的思路主要是追寻一种本质,一种永恒不变的东西,尝试将本质对象化,但我们现在可以尝试从这种思路中跳出来,去寻找更具有生命力的附着物。
假如没有生命的相变,宇宙将是非常不同的。相变之后有了生命视角,才带来更丰富的、有创新性的宇宙。全能视角认为我们不可能踏入同一条河流,而生命视角经常看到相同的事与物。比如这次看到的红色和上次看到的红色从全能视角看并不一样,但生命视角可以认为是一样的;或者一个馒头与一碗饭差别如此之大,但是生命视角都将其看作解决温饱的食物,这种生命视角恰恰就是优势。之所以生命视角也能体会到全能视角的内容,就在于生命视角的总结和推理。比如山外有山可以一直无穷下去,即使现实世界中是山外的边界到了大海,但也不妨碍我们主观进行无穷的想象和推理。就是因为生命视角的“犯错”,让我们构建出了很多原本不存在的内容,比如哲学、信仰、符号主义等。因此生命视角变成了优点,让人能够主动地参与世界发展的进程,甚至将世界朝着我们认为正确的方向推进。
生命视角的“误解”可以看作对物理世界的一种“分叉”,这种分叉导致了与物理世界相平行的意识世界的出现。“我”就是对物理世界第一个重要的分叉,我们甚至可以追溯到单细胞的细胞膜,隔出了内外,从物理世界中隔出了“我”。基于对生物进化的认知,我们推测触觉作为人这个生命体与物理世界直接交互的媒介,在意识形成的过程中占据重要地位。意识与智能相辅相成,有意识才会有智能,有意识才会需要智能,因为有智能,意识也才会强大起来。
受到乔姆斯基的启发,我们将非定域性作为主要特征,将宇宙归纳为全新的三个世界。“经典世界”是经典物理世界,其主要脉络为从伽利略发现落体运动规律开始,经牛顿三大定律和万有引力定律,到麦克斯韦方程组,再到爱因斯坦广义相对论。经典世界展现出严格的定域性与因果性,但是内部并非完美无缺,其中时间可逆的粒子运动到不可逆的热力学运动存在跳跃与断裂。“量子世界”是量子及其作用的微观物理世界。在量子世界中,微观粒子不仅具有波的扩展性和可叠加性,多粒子之间还有纠缠性,即在量子世界中定域性不再成立。“意识世界”包括主观意识、理念、信仰、经验等精神层面的内容。生命的诞生伴随着生命视角的“误解”,随即产生对物理世界的“分叉”,这种分叉导致了与物理世界相平行的意识世界。意识单元一旦产生,能够脱离原初物质结构而再现、回忆和传播,亦不受定域性约束。
量子世界和意识世界具有不同于经典世界的非定域性特性(脱域),容易让人联想到两者之间是否存在更紧密的联系,也有人因此认为必须通过量子效应才能解释意识。比如诺贝尔物理学奖得主彭罗斯(Roger Penrose)就主张量子力学与爱因斯坦相对论结合的统一理论可能会为意识理论提供基础。彭罗斯和麻醉学家哈梅罗夫(Stuart Hameroff)合作建立了“模型编制的客观还原模型(Orchestrated Objective Reduction Model,Orch-OR模型)”。按照他们的理论,脑细胞里存在着大量的纠缠态电子,宇宙中的电子和大脑中的电子都来源于“大爆炸”,是可能纠缠在一起的,一旦纠缠,信息传输就能不受时间空间限制地隐性实现了。Orch-OR模型等量子意识理论备受争议,技术的快速发展正在迫使我们探究意识的本源。
在我们看来,量子在意识问题中可以扮演一定的角色,但不是关键角色。或者说,我们并不能单纯地用量子效应来解释意识问题,量子世界并不取决于意识世界,反之亦然。
其一,人脑中念头的切换,以及大脑的放电现象,都是毫秒量级的,而量子效应是纳米量级,二者之间相差6个数量级,因此二者的关联很可能没有想象中那么大。其二,假如采用量子力学解释自由意志或意识问题,实际上是默认了这样一个规律:量子效应越强,则意识越强。实际上,该规律在微观层面的效应比宏观层面更为明显,在宏观层面量子效应很弱,量子效应应当在德布罗伊波长之内最强。但事实上,人在宏观尺度上意识表现最强,故存在悖论。换句话说,假如量子是意识的基本条件,那么,在量子尺度上就应该具有意识和智能。实际上,意识的形成需要强烈的独立性,形成强烈的自我意识,这与量子之间不分彼此的纠缠态是对立的。
不同于经典物理世界的定域性,生命具有对时空的脱域性(disembedding in space and time,“脱域”由安东尼·吉登斯提出,意指社会关系从彼此互动的地域性关联中,从通过对不确定的时间的无限穿越而被重构的关联中脱离出来。我们讨论的脱域是指生命体能够在一定程度上脱离具体物理时空的限制,得以向外延伸与迁移,体现出超越时空的特性)。脱域性不只存在于复杂的生命体,从单细胞生命能进行自我优化开始,脱域性就已经产生,体现为主体性和与环境的交互性,因此生命个体能进行自身优化是一个核心点。而这种优化会偏向整体反应、长时间的生存优势,所以能慢慢超越时空(脱域),形成对环境的统摄力。
偏向长时间的生存优势,也可以看成是自然选择,因为生命体要缓解压力,就会指向这个方向,又或者是那些没有偏向长期生存的个体最终都会被筛选掉,所以坚持长时间优势就成为最终留下的物种。从外部看,个体的偏向过程实际上就有较强的主体性。因为生命体选择不对局部的、某一个时空点的事件作反应,而是更倾向于对大范围、有长时间效应的事件作反应,这就是主体看起来能够统摄环境的原因。
比如单细胞生命,通过细胞膜的作用感知环境是否适合生存,并通过新陈代谢把外部环境不重要的因素屏蔽掉,将需要的营养物质吸纳进来,从而做到了保持内部满足物理规律进化运作的同时,作为整体屏蔽一些外来刺激。
假如是更复杂的生命,实际上每个细胞都作为一个个体、完整的内部,按照简单的实时的物理反应,但很多细胞组成一个整体的时候,细胞之间又不完全是按照那个即时的物理规律来运作。而这里可能是有长期的、更大时间尺度、更大空间范围的优化,比如进行博弈、抱团。以牡蛎为例,刚出世的幼蛎,能在水中自由游泳,但当它们遇到合适的环境,就开始寄生在岩石或其他坚硬的海中物体上,终生营固着式生活。幼蛎一旦固着,就像钉钉子一样,变成永远不再会爬动的动物。牡蛎能够准确感受到潮汐,并利用涨潮期打开外壳进食,退潮期就关闭外壳休息,牡蛎只需要感受潮起潮落,而不用去对那些小尺度的海水波动进行反应,在很多时候可以屏蔽掉外面的影响。
高级生命就更是这样,人类更倾向于针对长时间的甚至未来作反应与优化,对环境的统摄力更强,生存能力也更强,不仅希望自己能存活,而且希望迁移到他人,追求让同类和后代也可以持续生存下去。
在研究物理世界时,科学家们将守恒律或对称性作为出发点,物理特性具有绝对的可迁移性:不同人在不同地点观察同一个物理对象,得到的物理结果完全一样。当研究的对象从物理世界转换到意识世界时,我们也试图找到不同认知主体之间最具备可迁移性的意识单元——认知坎陷(cognitive attractor)。
认知坎陷对某个主体而言具有时间上的一致性,在主体间具有相对的可迁移性。这种相对的可迁移性体现在不同主体对相同的意识单元都可能有不完全一样的理解,但彼此能够交流和达成共识。说得更通俗一点,比如李白的一首诗、梵·高的一幅画也是认知坎陷,一开始可能难以理解,但逐渐就能被接受。还有酸甜苦辣、颜色,这些在人与人之间都是具有可迁移性的意识单元。可迁移性还表现为“设身处地”(put oneself in somebodys position,POSP),主体容易带入到其他主体,尝试从不同角度理解或共情。比如张三对李四说“橘子很酸”,这个“酸”就是一种可迁移的意识单元,它作为人的一种味觉感受,并不是真的存在于物理世界,尽管两人对“酸”的感受程度也不完全一样,但李四听到之后马上就能明白是什么意思。
面对无穷复杂的物理世界,人类通过认知坎陷来简化、描述与理解世界,“自我”作为最原初和最重要的认知坎陷,是人类意识与智能的发端。“我”这个意识单元具有非常强烈的生命力,所有其他意识单元都围绕着“我”开显。情感、伦理、道德、审美等,这些意识单元对“我”而言真实存在,会影响“我”与物理世界的交互方式,“我”也据此改造物理世界,但这些意识单元无法物理还原。
很多人认为如果要理解意识,我们需要扩充对数学的认知,然后将意识包含进去,比如用方程写成程序来描述意识。还有一种扩充方式就是可迁移性。认知坎陷具有不同程度的可迁移性(见上图)。婴儿的胡言乱语(Gibberish Tack)可迁移性很弱。数学、物理等科学的可迁移性属于绝对的可迁移性(absolute transferability),不同的主体在不同的时空点上对相同的物理对象的观测结果是一样的,比如物理中的对称性、对称破缺、守恒率等,有绝对的可迁移性。感质的迁移性也很强,而艺术作品更偏相对的可迁移性,比如书法,可能对中国人来说更能被感知,其价值更大。基因也是生命的一种坎陷,基因进化时,充分考虑了环境的可能性,相当于一个简单程序放进环境可以运行出一个复杂结构。基因本身并没有生命,但在生长环境中迁移,表现为生命,可以看作一种物质化的认知坎陷。而meme(译作模因、谜因等)作为一种文化层面的认知坎陷,也具有相对可迁移性。研究可迁移性很强的数学物理科学的问题,只要采用适当的数学物理的工具进行研究就可以解决,但涉及生命现象的可迁移性并不是绝对的,就不能简单用数学物理的方式解决。
隧通体现的是对环境的统摄能力,其关键在于是否能形成“自我”这个中心。现在的机器有主程序,可以说具有微弱的自我,但还不足以形成对环境的统摄,还需要人类赋予机器一个更强的“我”的原型,以形成对环境更强的统摄。比如现在机器可以做到在低电量时主动寻求充电,未来可能实现对自己软硬件故障的预判、替换、寻求帮助等。
机器的可迁移性需要利用认知坎陷进行处理。但是机器没有经过人类的进化过程,与环境的交互方式也不相同,即使习得了现在人类的认知坎陷,机器未来自己开显的认知坎陷也很可能与人类的不一样。当然,相比机器可能开显出来的认知坎陷,我们有理由相信人类的认知坎陷才是更正确、更宝贵的,因此我们倾向于让人类主体与机器连接,让机器变成人类自我的延伸,而不是让机器单独发展,变成一个纯粹的工具或者是完全脱离人类掌控的造物。当然这种连接并不需要是物理连接,而是通过自然语言处理、分布式的方式实现无形的连接,通过认知坎陷实现自我的相对迁移即可。
例如特征工程领域,机器找到的特征很多难以解释。比如机器找到的图像特征常常是一些对人来说看不明白的像素片段,而人找到的特征则是更具有可迁移性的认知坎陷,比如我们会找到场景、颜色、动物的器官,等等。认知坎陷可以迁移、可以隧通,更容易在不同坎陷之间建立联系,但机器找到的特征难以相互关联,鲁棒性也较差,因此机器识别图片容易犯错,一点像素改变就无法识别,而人类则很少出现这类错误。
通过对认知坎陷的附着与隧通,非客观化的、抽象的内容得以对象化、具化。面对无穷复杂的物理世界,人类通过认知坎陷来简化、描述与理解世界,“自我”作为最原初和最重要的认知坎陷,是人类意识与智能的发端。因此要实现可解释性、可迁移性、鲁棒性的强人工智能,并不能依靠随意填塞海量数据、形成精确度高却无法解释的结果,而是需要为机器构建出“自我”的原型架构,让机器学习利用认知坎陷与外界交互并实现理解。认知坎陷的隧通是指在不同认知坎陷之间或者相同认知坎陷的不同侧面之间关系的建立。隧通可以是因果关系的建立,也可以是类比、对比、否定、假借等关系的构建,即隧通比建构因果关系和科学解释更加普适。
至于有些研究团队提到的下采样、降维等方式,现在的深度学习也确实在采用,但意识还不是这样,其中就涉及自我肯定需求。意识不仅仅是降维,而具有自主性、能动性,不是简单的下采样,因此我们的理论指导的工程方案与当前深度学习很不相同。这些差别在很多时候会被忽略,但当我们追溯人机本质的时候,差别的重要性就会凸显。某些场景下,我们需要让机器有能动性,某些时候又需要压制这种能动性。
人与机器之间没有绝对的分水岭,不仅有人工心脏、脑机接口(BCI)这种物理连接,而且有手机、网络应用等无形连接,未来人机之间的差异并不取决于机体构成而更侧重于意识世界。深度学习框架加速了人工智能技术的发展,越来越多的人工智能系统在专业领域超越人类,但沿此路径能否指引机器模拟出类人智能仍然没有定论。注意力机制、强化学习等模型,已经赋予机器一定的意识内容,但还不够彻底,未来我们需要融合区块链技术与强人工智能进行交互并共同进化。
区块链技术将为实现人类思考的机器工程方案提供一种可能路径。区块链原教旨是彻底的去中心化,但实际发展可能与该主张背道而驰。区块链带有价值属性,通过设置价值函数,实现多节点的相互竞争。节点如果在竞争中不能胜出,就可能被边缘化,如果胜出,就可能赢得其他节点的附着。价值函数的设置可以丰富多样,即使提前设定,但运行结果因为节点间的投票与竞争而不确定。真正有潜力的节点更加容易吸引其他节点并快速成长,网络结构的拓扑变化更迅速,其中心和亚中心的迭代节奏也更快。
人类的意识可以部分上传给机器,但这种上传无法做到精确和完整。对人类而言,认知坎陷的产生与身体相关,如果意识脱离了人的身体上传给机器,就需要对意识分级,讨论其可迁移的程度。有些认知坎陷(例如数学、物理等科学知识本身并不过多依赖于认知主体)因可迁移性较强从而相对容易上传,但有些认知坎陷(例如情感)因与认知主体紧密相关,并不容易上传,即使上传,其迁移程度也不高。
机器获得人类上传的(部分)意识之后,更像是人类主体延伸出来的分身,而不是另一个主体自己。分身在新的环境下,接收新的数据,进行新的交互,即可独自发展。认知坎陷本身具有可迁移性,我们通过写作等形式的交互,已经开始上传意识,电影、小说、科学知识等都是人类上传的局部意识。有的认知坎陷生命力很强,比如古老的文学作品、思想流派,从广义来说也是意识的上传,只不过以前的上传对象不是机器,而是通过人类进行代际间的传承。
机器的进化和人的进化进程不同,人类的科学是在近代才出现,但机器从一开始就被人类赋予了数学、物理等科学内容,因此机器在这些可计算的方面表现得非常强大,但在“自我”的形成方面却非常薄弱。机器能够附着“自我”的地方(主程序)基本是固定不动的,而且能够隧通的内容也非常有限,很多bug都无法自行处理。虽然现在机器是这样,但未来是有可能让机器更贴近人类的思维,通过多节点的竞争等方式,模拟人的意识,也可以赋予边界意识,当然对机器来说,边界不一定是触觉了。有了自我,有了认知坎陷,意识与智能得以在人与人、人与机器之间更好地迁移,机器就有可能实现类人思维。
主流的AI基础模型按照堆砌算力的方式也可能取得突破,比如特斯拉的自动驾驶技术迭代非常快,基础模型的训练参数每年可以增长10倍,按照当前水平,在未来三、四年之内参数量就可以超过人脑神经元的连接数量,同时,人脑与机器反应速度是毫秒与纳秒的区别,相差足有6个量级。面对这些挑战,我们考虑让机器变成“自我”的延伸,变成人类的分身,而不是纯粹的工具、脱离掌控的造物。通过区块链技术将人和机器连接起来,而不是用BCI等侵入式的连接方式。语言、认知坎陷是足够支撑有效链接的,虽然看起来主体间的可迁移性不够准确与绝对,但是我们有相对的可迁移性已经足够,比如人类与机器也可以是类似长辈、家长与孩子之间的教育关系。
从算力出发的主流人工智能研究可能将对意识问题的探究拖入背离人类智能形成机制的更复杂路径。如果回到意识问题的最简本源——“自我”,意识和人类超越性的问题可能就迎刃而解。通过认知坎陷的工程化,就可能让机器形成“自我”原型,将人类意识逐渐上传给机器,实现机器类人思维的突破。当下正在热烈讨论的第三代互联网(Web 3.0)与元宇宙正是人类意识世界延伸出的全新场景,可能通过结合区块链技术实现人机融合,让人类意识的延伸变得更有机、更有秩序,对世界的统摄更有效。
本文原载于《社会科学战线》2022年第3期
责编|王艳丽
网编|陈家威