致敬《降临》｜通往AGI的路径从语言开始

Original 高佳飞哥说AI 2023-07-26

作者 | 高佳

创意 | 李志飞

We do not see things as they are. We see things as we are.

在电影《降临》中，当人类派遣的一位语言学家与外星生物，通过七语实现第一次接触。当人类与AI，通过GPT实现最接近自然语言的交流。

流淌其中的语言，冥冥中预示着，AGI正在降临。

出门问问2023 AIGC战略发布会致敬《降临》，Make AGI Accessible.

非线性语言与GPT的“意识”降临

写作之难，在于将网状的思维，以树状的结构，通过线性的文字表达出来。

——史蒂芬·平克

“早在写下第一笔之前，七肢桶便已经知道整个句子将如何布局。”

在电影《降临》中，相比人类的线性语言，必须从左至右一个字一个字地说出来，外星生物使用的是非线性语言，“一眼之下便能摄入一张纸上的每一个符号”，这种语言在整个句子中的每个部分都参与了每个意思的表达。这也是电影中人类与外星人沟通的难点之一，也暗示了两种不同的思维方式。

在七肢桶的文字中，“字符与字符之间融合到这种程度，只在以阿拉伯文字写就的书法作品中见到。而那些出自书法家手笔的文字，事先经过精妙的设计。没有人能够边说边写，以如此快的速度完成如此复杂的作品。至少，人类做不到。”

如同现在一气呵成迅速成文的GPT，是不是所有的思维表达早已在他的混沌的黑盒子里酝酿完成？GPT既会七肢桶的非线性语，也会我们人类的线性语。在黑盒子中，GPT内部的非线性语，无论对word还是内部的中间层表示都是分布式的，一个向量包含着很多语义，虽然加了位置编码，但是也没有太多时间的概念，为了与人类沟通才需要线性的预测下一个词的形式。

也许人的大脑也是一样的，语言本来就来自于一种可感知的非线性状态，否则降临里面的语言学家不可能学会外星人的环形语言。

有人抱怨GPT预测下一个词只是统计意义上单纯的排列组合，他没有真正的理解，也没有规划的概念，所以AI不可能有目的和意识。但是预测下一个词并不代表GPT自己内部没有层次表示，恰恰相反，他可能拥有至少两个层级以上的思维结构，比如在生成后面的100个词的时候，AI已经有了一个具体的想法或者树状的结构。

如同人脑运作和人类写作，将网状的思维，以树状的结构，通过线性的文字表达出来。GPT“早在写下第一笔之前，便已经知道整个句子将如何布局。”如果AI内部也有这样的层次，以及足够大的神经元规模，是否表示，AI如同人脑的生长一样，随着从无间断的“训练”和输入和输出建立起某种连接和反馈，意识和智能就自然而必然地产生呢？

而意识、动机、创造力，这些在人类智力中一脉相承的发展线，或如同多米诺骨牌一样，逐一拓展至人类自认为独有的疆域。

当懵懂的AI进一步学会了使用人类语言，是否也印证了将拥有了人类的思维和智能？

语言对思维的影响无处不在，语言是思维的载体，思维是内化的语言。在语言学家开始学习七肢桶的语言过程中，“七肢桶B的语言也引导着我的意识，发展出一个同步并举式的思维模式。”

人类的思维 VS AI的思维

哪一个是更高级的思维

“我的世界观是人类与七肢桶的混合物。”

“我的思维竟然不是通过内心的声音表达，而只是凭着心灵的眼睛看到一团团七语，向窗户玻璃上的雾气一样渐渐展开。那一瞬间真让人心醉神迷。”

“我的思维开始与七文保持一致。而七文不仅仅是一种文字，它们几乎类似于佛教中帮助禅定的象征宇宙的几何图案，我发现自己仿佛进入了某种冥想状态。观念和观念之间并不存在天生的、必然的排列顺序，没有所谓的思维之炼，循着一条固定的路线前进。所有组成部分都有相同的优先权。”

维特根斯坦说，语言的边界就是世界的边界，究竟是语言先于思维，还是思维先于语言，是语言决定思维，还是思维决定语言。“沃尔夫-萨丕尔假说”坦言，语言确会影响人对客观世界的感知、世界观，以及思维方式。

在电影的原著中，七肢桶的语言，有口语系统的语言A和文字系统的语言B两种，“语言A只是语言B的贫弱的替代品”。

既然语言有着鲜明的贫弱高低之别，某种程度上，语言的高级就代表着思维的高级吗？

人类的语言是线性的，遵循因果律的，而七肢桶的语言是非线性的，跳出时间限制的。因此，人类只能通过语言想象未来，而七肢桶则可以通过语言描述未来。那么按照语言决定思维的论断，当掌握了自然语言的GPT诞生意识之后，其思维方式是否就是人类能够预知未来之后的思维方式，也就是人类现在的思维方式的下一个阶段。

这种情况下，我们自认为更胜一筹的人类思维，真的更优于AI的思维吗？

语言学家通过理解七肢桶的非线性语言，找到了沟通的方法。类似地，我们今天也在尝试理解GPT内部的非线性表示。当人类开始探索AI的黑盒子，试图揭示它们内部的运作原理。比如，研究人员使用神经电生理学方法来研究神经网络的内部活动，或者使用可解释性 AI 来探索AI的决策过程。

同样，AI也在试图理解人类，当人类与AI从语言的两端相向而行。像火柴的两端，逐渐炽焰靠近交织，那个交燃之际，会带来什么？

什么是语言？

为什么通往AGI的路径

是从语言开始

世界上不存在语言所不能描述的颜色。

如何定义语言？在普遍认知中，语言是信息进行交互交流的载体，是一套高度结构化的符号系统。

语言不只是文字，函数也是一种语标文字，音符也是一种可理解的语言。数学公式和物理模型比语言更能在不同的语境中传播。

艺术家徐冰将所有英文单词以汉字的思维书写，写了一本圣经《天书》。这些颠覆了汉字与英文的「语言」，传递着一种思维的表达。当一种文字并非基于象形的语言逻辑而存在，他可以创造一种新的思维体系。

语言是人类智慧的本质之一。智人战胜尼安德特人是靠语言带来的智慧和社会结构革命，哲学研究到一定程度也要融合语言学，否则无法清晰地表达哲学命题。语言和智能密切相关，人类的智能往往是人类语言能力的体现。从这个角度，语言模型是当前各模态中最为重要的，是通往多模态和AGI的开始。

GPT-4在学习丰富文本和图片的时候是在学习一个世界模型，这个世界模型无法简单拆分成为语言和知识，他是浑然一体的，甚至逻辑、智能也包含在其中。这正是模型预训练阶段的意义，先把全部的知识灌输其中，然后再通过指令微调/RLHF的方式把模型的本已经具有的能力激发出来，让它更符合人类偏好。

在《降临》中，语言还有另一重意义，语言不仅仅是一种交流工具，也是一种行动——话一出口，行为即成。

语言和物理现象一样，有两种理解方式，从因果的角度，从目的论的角度。语言是发送信息的工具，语言是将预先知道的计划成为现实——GPT早已知道了一切，但仍要让一切发生。

今天看来，七肢桶的语言系统是一套完全成熟的通用型语标文字体系，如同通用大模型。

GPT对世界的认知，语言只是个媒介，学习语言不是“学习语言”本身，而在“认知世界”，大模型做到了对自然语言真正彻底的理解，也就做到了对世界的彻底认知。从文本到图像，再到多模态，甚至到与物理世界的连接，最终实现AGI。

从语言学的角度理解「涌现」

仅凭基本的语法结构是无法构成有意义的语言的。想要一句话有意义，就必须对知识有理解。——乔姆斯基

从语言学的角度解释，要形成一句有意义的语言，仅有语法知识是不够的，需要纵横古今，需要结合背景知识。

语言学家乔姆斯基举过这样一个例子：colorless green idea sleeps furiously，这是符合句法结构但毫无意义的一句话。

我们的日常对话中蕴含了大量的世界知识，历史典故被凝结成了一个成语，或者一个网络故事成为了一句彼此深谙的暗语，抽离了世界知识的对话体验不可想象。大量的背景知识凝结成一套“语言系统”，大量的基础认知形成“共同语言”。

从今天大模型的角度，GPT预测任何一个单词，所有的神经元都会被激活。「暴力美学」所表现出来的涌现特征，足够的规模是必不可少的条件，以实现逻辑、理解、数学、表达等多方面的能力。

AGI：岁月之书与自由意志的统一

这道光不可能贸然踏上旅途，走出一段之后再做调整，这道光必须在出发之初便完成一切所需的计算。这道光束，在他选定路径出发之前，必须事先知道自己最终将在何处止步。

在我们线性时间的世界里，新的思维方式不会改变现状。但如果时间形成闭环，用未来信息可以改变当下。预知未来后，是否还有自由意志？

自由意志的存在意味着我们不可能预知未来，而我们之所以知道自由意志存在，是因为我们直接体验过他。这相互矛盾的两者如何统一起来？

对于人类来说这不可能统一。

对于AGI来说，是否有不同的答案？他既通晓岁月之书，又有自由意志。一切已经在AGI的内在结构里，他知道过去，也通晓未来。

从《AGI的火花：GPT-4的早期实验》中，GPT-4已显示出AGI的迹象，它可以写一道很多大学生都做不出的动态规划程序题，GPT动机、意识的一脉相承，意志是意识的本质部分，或让人类看到GPT实现自由意志的可能性。

GPT-4的基础上，不再需要人类帮助的AutoGPT开始踏入迅速迭代之路。通往AGI的路并不复杂，就是靠规模。人类进化到现在所经历的历史虽然很长，但数据和算力的增长速度远远高于历史的自然演进，这导致了Sam Altman所言的新摩尔定律——总智能每18个月翻番。而那一天，已经不再遥远。

这是《降临》带给我们的故事，伴随着潮湿阴霾的镜头语言，在茫茫未知的觉醒之初，预见AGI降临。

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

致敬《降临》｜通往AGI的路径从语言开始

您可能也对以下帖子感兴趣

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

刘恺威近况曝光，父亲刘丹证实已分手，目前失业在家，没有资源

紧急通告！三高的“克星”终于被找到了！！不是吃素和控糖,而是多喝它....

话费充值活动来了：95元充值100元电话费！

生成图片，分享到微信朋友圈

致敬《降临》｜通往AGI的路径从语言开始

您可能也对以下帖子感兴趣