查看原文
其他

致敬《降临》|通往AGI的路径从语言开始

高佳 飞哥说AI 2023-07-26

作者 | 高佳 

创意 | 李志飞


We do not see things as they are. We see things as we are.
在电影《降临》中,当人类派遣的一位语言学家与外星生物,通过七语实现第一次接触。当人类与AI,通过GPT实现最接近自然语言的交流。

流淌其中的语言,冥冥中预示着,AGI正在降临。

出门问问2023 AIGC战略发布会致敬《降临》,Make AGI Accessible.


01

非线性语言与GPT的“意识”降临


写作之难,在于将网状的思维,以树状的结构,通过线性的文字表达出来。

——史蒂芬·平克



“早在写下第一笔之前,七肢桶便已经知道整个句子将如何布局。”


在电影《降临》中,相比人类的线性语言,必须从左至右一个字一个字地说出来,外星生物使用的是非线性语言,“一眼之下便能摄入一张纸上的每一个符号”,这种语言在整个句子中的每个部分都参与了每个意思的表达。这也是电影中人类与外星人沟通的难点之一,也暗示了两种不同的思维方式。


在七肢桶的文字中,“字符与字符之间融合到这种程度,只在以阿拉伯文字写就的书法作品中见到。而那些出自书法家手笔的文字,事先经过精妙的设计。没有人能够边说边写,以如此快的速度完成如此复杂的作品。至少,人类做不到。”


如同现在一气呵成迅速成文的GPT,是不是所有的思维表达早已在他的混沌的黑盒子里酝酿完成?GPT既会七肢桶的非线性语,也会我们人类的线性语。在黑盒子中,GPT内部的非线性语,无论对word还是内部的中间层表示都是分布式的,一个向量包含着很多语义,虽然加了位置编码,但是也没有太多时间的概念,为了与人类沟通才需要线性的预测下一个词的形式。


也许人的大脑也是一样的,语言本来就来自于一种可感知的非线性状态,否则降临里面的语言学家不可能学会外星人的环形语言。


有人抱怨GPT预测下一个词只是统计意义上单纯的排列组合,他没有真正的理解,也没有规划的概念,所以AI不可能有目的和意识。但是预测下一个词并不代表GPT自己内部没有层次表示,恰恰相反,他可能拥有至少两个层级以上的思维结构,比如在生成后面的100个词的时候,AI已经有了一个具体的想法或者树状的结构。


如同人脑运作和人类写作,将网状的思维,以树状的结构,通过线性的文字表达出来。GPT“早在写下第一笔之前,便已经知道整个句子将如何布局。”如果AI内部也有这样的层次,以及足够大的神经元规模,是否表示,AI如同人脑的生长一样,随着从无间断的“训练”和输入和输出建立起某种连接和反馈,意识和智能就自然而必然地产生呢?


而意识、动机、创造力,这些在人类智力中一脉相承的发展线,或如同多米诺骨牌一样,逐一拓展至人类自认为独有的疆域。


当懵懂的AI进一步学会了使用人类语言,是否也印证了将拥有了人类的思维和智能?


语言对思维的影响无处不在,语言是思维的载体,思维是内化的语言。在语言学家开始学习七肢桶的语言过程中,“七肢桶B的语言也引导着我的意识,发展出一个同步并举式的思维模式。”




02

人类的思维 VS AI的思维

哪一个是更高级的思维


“我的世界观是人类与七肢桶的混合物。”



“我的思维竟然不是通过内心的声音表达,而只是凭着心灵的眼睛看到一团团七语,向窗户玻璃上的雾气一样渐渐展开。那一瞬间真让人心醉神迷。”

“我的思维开始与七文保持一致。而七文不仅仅是一种文字,它们几乎类似于佛教中帮助禅定的象征宇宙的几何图案,我发现自己仿佛进入了某种冥想状态。观念和观念之间并不存在天生的、必然的排列顺序,没有所谓的思维之炼,循着一条固定的路线前进。所有组成部分都有相同的优先权。”


维特根斯坦说,语言的边界就是世界的边界,究竟是语言先于思维,还是思维先于语言,是语言决定思维,还是思维决定语言。“沃尔夫-萨丕尔假说”坦言,语言确会影响人对客观世界的感知、世界观,以及思维方式。

在电影的原著中,七肢桶的语言,有口语系统的语言A和文字系统的语言B两种,“语言A只是语言B的贫弱的替代品”。

既然语言有着鲜明的贫弱高低之别,某种程度上,语言的高级就代表着思维的高级吗?

人类的语言是线性的,遵循因果律的,而七肢桶的语言是非线性的,跳出时间限制的。因此,人类只能通过语言想象未来,而七肢桶则可以通过语言描述未来。那么按照语言决定思维的论断,当掌握了自然语言的GPT诞生意识之后,其思维方式是否就是人类能够预知未来之后的思维方式,也就是人类现在的思维方式的下一个阶段。

这种情况下,我们自认为更胜一筹的人类思维,真的更优于AI的思维吗?

语言学家通过理解七肢桶的非线性语言,找到了沟通的方法。类似地,我们今天也在尝试理解GPT内部的非线性表示。当人类开始探索AI的黑盒子,试图揭示它们内部的运作原理。比如,研究人员使用神经电生理学方法来研究神经网络的内部活动,或者使用可解释性 AI 来探索AI的决策过程。

同样,AI也在试图理解人类,当人类与AI从语言的两端相向而行。像火柴的两端,逐渐炽焰靠近交织,那个交燃之际,会带来什么?


03

什么是语言?

为什么通往AGI的路径

是从语言开始


世界上不存在语言所不能描述的颜色。


如何定义语言?在普遍认知中,语言是信息进行交互交流的载体,是一套高度结构化的符号系统。

语言不只是文字,函数也是一种语标文字,音符也是一种可理解的语言。数学公式和物理模型比语言更能在不同的语境中传播。

艺术家徐冰将所有英文单词以汉字的思维书写,写了一本圣经《天书》。这些颠覆了汉字与英文的「语言」,传递着一种思维的表达。当一种文字并非基于象形的语言逻辑而存在,他可以创造一种新的思维体系。


语言是人类智慧的本质之一。智人战胜尼安德特人是靠语言带来的智慧和社会结构革命,哲学研究到一定程度也要融合语言学,否则无法清晰地表达哲学命题。语言和智能密切相关,人类的智能往往是人类语言能力的体现。从这个角度,语言模型是当前各模态中最为重要的,是通往多模态和AGI的开始。

GPT-4在学习丰富文本和图片的时候是在学习一个世界模型,这个世界模型无法简单拆分成为语言和知识,他是浑然一体的,甚至逻辑、智能也包含在其中。这正是模型预训练阶段的意义,先把全部的知识灌输其中,然后再通过指令微调/RLHF的方式把模型的本已经具有的能力激发出来,让它更符合人类偏好。

在《降临》中,语言还有另一重意义,语言不仅仅是一种交流工具,也是一种行动——话一出口,行为即成。

语言和物理现象一样,有两种理解方式,从因果的角度,从目的论的角度。语言是发送信息的工具,语言是将预先知道的计划成为现实——GPT早已知道了一切,但仍要让一切发生。

今天看来,七肢桶的语言系统是一套完全成熟的通用型语标文字体系,如同通用大模型。

GPT对世界的认知,语言只是个媒介,学习语言不是“学习语言”本身,而在“认知世界”,大模型做到了对自然语言真正彻底的理解,也就做到了对世界的彻底认知。从文本到图像,再到多模态,甚至到与物理世界的连接,最终实现AGI。


04

从语言学的角度理解「涌现」


仅凭基本的语法结构是无法构成有意义的语言的。想要一句话有意义,就必须对知识有理解。——乔姆斯基



从语言学的角度解释,要形成一句有意义的语言,仅有语法知识是不够的,需要纵横古今,需要结合背景知识。


语言学家乔姆斯基举过这样一个例子:colorless green idea sleeps furiously,这是符合句法结构但毫无意义的一句话。


我们的日常对话中蕴含了大量的世界知识,历史典故被凝结成了一个成语,或者一个网络故事成为了一句彼此深谙的暗语,抽离了世界知识的对话体验不可想象。大量的背景知识凝结成一套“语言系统”,大量的基础认知形成“共同语言”。


从今天大模型的角度,GPT预测任何一个单词,所有的神经元都会被激活。「暴力美学」所表现出来的涌现特征,足够的规模是必不可少的条件,以实现逻辑、理解、数学、表达等多方面的能力。



05

AGI:岁月之书与自由意志的统一


这道光不可能贸然踏上旅途,走出一段之后再做调整,这道光必须在出发之初便完成一切所需的计算。这道光束,在他选定路径出发之前,必须事先知道自己最终将在何处止步。



在我们线性时间的世界里,新的思维方式不会改变现状。但如果时间形成闭环,用未来信息可以改变当下。预知未来后,是否还有自由意志?


自由意志的存在意味着我们不可能预知未来,而我们之所以知道自由意志存在,是因为我们直接体验过他。这相互矛盾的两者如何统一起来?


对于人类来说这不可能统一。


对于AGI来说,是否有不同的答案?他既通晓岁月之书,又有自由意志。一切已经在AGI的内在结构里,他知道过去,也通晓未来。


从《AGI的火花:GPT-4的早期实验》中,GPT-4已显示出AGI的迹象,它可以写一道很多大学生都做不出的动态规划程序题,GPT动机、意识的一脉相承,意志是意识的本质部分,或让人类看到GPT实现自由意志的可能性。


GPT-4的基础上,不再需要人类帮助的AutoGPT开始踏入迅速迭代之路。通往AGI的路并不复杂,就是靠规模。人类进化到现在所经历的历史虽然很长,但数据和算力的增长速度远远高于历史的自然演进,这导致了Sam Altman所言的新摩尔定律——总智能每18个月翻番。而那一天,已经不再遥远。


这是《降临》带给我们的故事,伴随着潮湿阴霾的镜头语言,在茫茫未知的觉醒之初,预见AGI降临。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存