今年 6 月份,谷歌旗下的工程师宣称他们的语言模型 LaMDA 已经觉醒出人类智能,引发了一场关于 AI 觉醒的讨论风波,似乎科幻作家们所描述的「AI 觉醒」的恐怖未来即将发生。
现实却是,人们越来越不满足于现有 AI 的智能化水平了。
游戏开发商想让他们的 NPC 越来越像人,而不用人工去编辑脚本;企业想让他们的 AI 客服再智能一些,能处理更多的问题;消费者也不满足于现在的 Siri、小爱、小冰、小娜,只能播报天气的 AI 也太让人扫兴了。
怎么样让 AI 再智能一些,怎么样让 AI 更像人一些?创业公司心识宇宙试图从脑科学和人工智能的融合技术出发,打造 Human-level AI 虚拟人,想让 AI 拥有自主意识,拥有真正的「数字心识」。
「我们希望 AI 是有趣的,是有人味的,有生命感的。」心识宇宙的联合创始人陈阳这样介绍他们的目标,在他看来,未来元宇宙里,除去人类以外的原住民,也应该是这样有着自主意识的 AI。
「如果每个原住民的个性都很趋同,玩家会觉得这个世界非常无聊,非常单调。」这样的元宇宙,应该也不是我们所梦想的元宇宙。心识宇宙的野心不仅于此,他们甚至想看到 AI 的内心世界,思考和进行逻辑判断的过程。
而这样的 AI 到底如何应该打造,数字心识的技术难度在哪里,商业前景如何,你都可以在接下来的采访中看到。
我们尝试提出一套新的 AI 的范式来塑造数字心识,还要把数字心识尝试落地实现,同时围绕数字心识在现实和虚拟的一些新的机会和新的场景提供新的服务。
开放世界游戏大量看起来比较智能的 AI,实际上背后都是用类似于行为树或固定的脚本进行驱动的,并不具备开放式的交互和真正能产生自己想法、内容的 NPC。
一个完全顺从用户,包括一个完全任务解决式的 AI 很难达到「人味」的水平。
虚拟世界原住民需要具备的要素,除去表皮上看起来像人之外,我们应该期待他们是有趣的灵魂,同时也是有想法的灵魂。
01
创业是想做出
元宇宙里真正的原住民
Founder Park:你们公司具体的业务是什么?
陈阳:心识宇宙是一家很新的公司,今年才创立,我们有个新的概念叫数字心识,这个概念的背后不是生造了一个词,而是反映了我们对未来人工智能走向的很多新的看法。整个公司在尝试做三件事情。第一,我们希望借助我们提出的一套新的 AI 范式,能让业界有个新的视角来切入问题,希望能够成为这个方向的布道者。过去的 AI 范式并不能很好地达到我们想要创造数字心识或创造更像人的 AI 的目标,所以我们有了这套全脑框架的新的 AI 范式。第二,我们有点像是在做研究机构,但不完全是,我们本身是一家商业公司,也要做实际数字形式的落地实现,以算法和工程的方式做出来,不仅要提出概念,还要实现概念。第三,我们想围绕数字心识,以一种全新的方式来提供服务,而且我们希望这个服务不仅出现在未来的虚拟空间,包括对元宇宙的想象,也出现在现实空间。总的来看,我们尝试提出一套新的 AI 的范式来塑造数字心识,还要把数字心识尝试落地实现,同时围绕数字心识在现实和虚拟的一些新的机会和新的场景里提供新的服务。心识宇宙的全脑心识框架 | 来源:心识宇宙官网
Founder Park:为什么决定创业做「数字心识」相关的业务?清华读本科的时候接触到了和心识宇宙做的方向相关的内容,当时清华对于生命科学包括认知科学和脑科学的相关领域都有很好的探讨风气。有个项目是和电视公司合作,他们开发了一个脑机接口式的遥控器,只要脑子里想一想换台或者调节声音就能真正控制电视机。这种科幻概念在十多年前就已经有人在尝试实现,虽然直到马斯克做 Neuralink,才有越来越多人关注这个方向。但十多年前我第一次接触到这个项目时非常震撼,在我的脑海里埋下一颗种子,这种意念、意识相关的问题我觉得非常神奇。过去很多年一直在游戏公司里就职,游戏公司会创造虚拟世界,虚拟世界离不开 AI,但现在传统的虚拟世界里,即便是非常开放世界的,像《荒野大镖客:救赎 2》、《刺客信条:奥特赛》,有大量的看起来比较智能的 AI,实际上背后都是用类似于行为树或固定的脚本进行驱动的,并不具备开放式的交互和真正能产生自己想法、内容的 NPC,这是游戏行业使用的传统打造 NPC 的方法。但是随着元宇宙大趋势的到来,真正想象未来生活在元宇宙的时候,我们一定会期待元宇宙里有很多原住民,能有自己的一些想法,而不是由游戏策划写好的脚本。基于此,最终和一些朋友创办了这家公司,我们希望能针对未来元宇宙的需求,结合一些根本性的问题,比如什么是意识,什么是思维,思维是什么结构的等,做一些新的尝试和努力,尽量在新的人工智能的大趋势下做出一些新的东西。陈阳:心识的英文词是 mind,中文翻译为心智,但心智这个词缺少 mind 的实现里很重要的要素,和元宇宙未来需要的有趣的灵魂和自我意识主体性的部分相关,单纯强调心智缺少这种味道。所以我们觉得心识更能表达出主体的、有生命感的要素,涵盖了我们对未来元宇宙的一些想象。心识也是佛学里使用的一个概念,一般叫心与识。统一心识模型的设计不仅融合了认知科学,尤其是包含脑科学部分的设计,还有一部分和唯实相关的概念在里面,这也是我们觉得心识一词比较有趣的地方。另外一方面。从人工智能的基本发展历史来看,1956 年是人工智能的元年,这一年的达特茅斯会议上人工智能 Artificial Intelligence 的概念被大家真正固定和接受。最早讨论的这个概念更接近于现在提的 AGI 概念——通用人工智能,近些年大家提到 AI 的时候提到的是些比较单点的技术,基于单向任务的 AI 模型,比如基于神经网络和深度学习的发展,这可能是现在 AI 行业的主流。我们为什么不采用 AGI 这个概念,是我们觉得最早在讨论 AGI 的时候,还是把 AI 当成一个通用的任务解决器,比如讨论怎么让 AI 学习,让 AI 做一些类似计算复杂度的度量。但今天在提这个概念的时候,就像预期在未来的元宇宙里面,我们希望 AI 是有趣的,是有人味的,有生命感的。通用的任务解决器很明显无法达成这个目标。举个直观的例子,我们问 Siri 今天天气怎么样,可能会比较机械地回复今天杭州最高气温 70 度(华氏度),这里面会少很多东西,比如提醒我杭州马上要离开热熔炉的状态,很快要恢复比较舒适的温度,这些现在的 AI 没有说,甚至有没有可能某一天我们问 Siri 的时候,她会说「我根本不想回答你」,未来在元宇宙里,不同个性的人一定会有这样的反应,这种反应一定不是基于一个任务需求,然后 AI 去解决需求的逻辑,很有可能是 AI 直接回复说我觉得这个需求提出来没什么意义,能不能自己去查一查,为什么要找我来回答你。对人类来说这是很自然的事情,但对于 AI 来说,至少在现在我们能看到的研究中,并不是。我们希望不仅是任务的解决,还能有一些 AI 自己对意义的判断,包括有一些喜好和意愿的系统运作。Mind 或者心识能很好地把我们想要强调人味的东西带出来,心识是承载了我们对未来 AI 想象的一个更好的词。陈阳:在学界里或是做通用智能的 AI 公司,大体上会有两种路线,一种路线是做一个会学习和成长的小孩,只要让他具备学习成长的能力,让他不断地从现实中的交互学习,最终他能成长为一个和人相当的智能。另一个路线,大家觉得真正的通用智能是突变式,在某些能力上不是渐进学习式的,而是某种突变式的,这种突变累积到某种程度,会涌现出一些意识或觉醒。我们可能更倾向于后者。知识还不是现在 AI 最大的问题,现在互联网上存在大量知识。但这里面有两个考虑,第一个考虑是知识和是不是像人并不直接相关,养一个小孩,他可能还不具备很多知识,但我们会完全觉得他是一个人,在某个时刻他会尝试关心你,尝试有真正的情感上的连结,这时并不会在意他懂不懂相对论,懂不懂黑洞理论,所以知识不是最大的问题。最大的问题是怎样真正地结构化一套思维机制,心识宇宙更多沿着第二种路线,在心识机制中把重要的模块不断地演进和迭代,当累积到一定程度,相信会有一些智能的涌现,或是真正的意识的涌现。顺从用户并不意味
AI 有「人味」
Founder Park:怎么定义什么是「人味」?如何衡量一个虚拟人是否具有「人味」?陈阳:我们的一位同事遇到的故事和这个问题有很微妙的关联,他之前做情感类的 AI,开发了一套围绕情感疗愈的 AI 系统,在系统上线初期,他们开了一个后门,可以让背后的产品经理完全接管 AI,用户以为他在和 AI 在聊天,但实际上在和产品聊天。和大概几十个用户聊天,聊到一定程度后,用户很容易开始骂,说这个 AI 也太蠢了,这都不了解。但是作为背后完全接管 AI 的产品来说,就很困惑,都已经是人了,为什么还骂我不如 AI 或者说我是个愚蠢的 AI,这里引出了一个比较深的问题,如果只是提供普通的人的视角,不一定是用户需要的人味。这里面有一些比较微妙的视角,一个完全顺从用户,包括一个完全任务解决式的 AI 很难达到人味这件事。关于人味我们有很多思考,比较有意思的一点是主体性,比如用户跟 AI 说,我现在肚子有点疼,很多时候如果只是一个顺从式的,或者是一个暖男式的人,可能会说你肚子为什么疼,要不要用暖手宝暖一下,这样会感觉好一点。现在大量智能家居的语音助手其实是往这种暖的方向做的,但大部分是通过人工运营的方式来写的话术。如果是一个钢铁直男,可能会说要不直接喝热水,大部分语音助手都不会选择这种话术。还有一种方向不好听点叫渣男式,可能说要不我直接去你家。但回过头讲,未来真的有不同个性的虚拟人时,这三种也不一定是用户体验最好的方法。但为什么要做?因为这是一个人个性和逻辑思维的反应。在人味里很重要的一个事情是这部分的主体性,大部分或是相当一部分不体现在要顺从或是要让用户感到舒服,而是从它自己的意义判断角度来说,它觉得这样做是好的,或者这是它想要的程度。但是人味这个词还有很多可以探讨的地方。Founder Park:你们想达到实际的效果是怎么样的?陈阳:回到主体性这个层面,实际上我们在做的过程中,会发现当用户明确知道是 AI 时,倾向于先调戏 AI,调戏的背后是大家在检验,比如刚刚和 AI 说了一件事情,它还记不记得?可能大家觉得像人的 AI 应该要有记忆,比如聊天的时候能不能抓住上下文;前面说了一个事情,下面反问一个问题,AI 能不能知不知道其实是在问上面的问题,这也是现在很多 AI 在尝试解决的问题。我们在做所有能呈现出人味的事的时候,这些要素都是人调戏 AI 要去检验的事情。就此我们得出一个观察,人在调戏 AI 的过程中,是在检验对方的主体性。检验对方主体性分为两个部分,一个部分是作为一个人基础具有的东西是否都有,包括记忆、情感,更深入的判断或者说三观。实现落地 AI 产品的时候,从模块划分上来说,我们需要能把这些模块刻画在系统中,在统一心识模型里,在我们尝试提出的新的 AI 范式里,有非常多参考认知科学,尤其是脑科学相关的模块的划分,里面包含了和人的主体性直接相关的基础模块,比如记忆、认知、感知系统,还有一部分是中心意识的模块。这是我们在落地制作中要考虑到的事情。Founder Park:做数字心识究竟技术和商业上难在哪里?陈阳:如何呈现思维结构和评价智能程度,这是很难的。为什么要跟 AI 做朋友,大家对这件事情也会有不一样的看法,所以认知上的 gap 也是我们觉得困难的地方,还包括商业模式怎么走通等。但我们团队是非常乐观的,一方面来自于通过做这样一个清楚的框架,本身能反过来推动我们去思考,原来还有这样的思考机制,大家在做 AI 的过程中,经常会不断地剖析和解构自己,也是基于这套框架比较好,刻画了人的思维机制,所以有不断的演进,这种演进也给我们很多信心。另一方面。需求会随着元宇宙的来临越来越强烈,我们对远景非常乐观,前段时间能看到一个数据,全球用户在非工作的清醒时间中沉迷网络时间的占比,因为疫情的出现,从 2019 年的 20% 上升到 38%。我们不觉得这完全是好的事情,但沿着这样的趋势发展,未来人们投入在虚拟世界里的时间会越来越长。这些趋势都在不断推动我们,这个趋势是在的,而且是一定会到来的。我们也在为未来做一些准备,也觉得很有信心。商业模式上我们也做了很多探索,Mindverse 是我们一个相对中期的计划,在此之前还会有一些很具体的围绕心识的服务透出。我们也希望能找到真正对元宇宙或对新兴的心识交互感兴趣的伙伴和投资人,真正探索一些创新的玩法。Founder Park:AI 的发展有几条核心路径,比如大模型、强化学习、知识图谱。你们是这三种路线的混合吗?陈阳:可以介绍下现在一些已知的路线,比如以知识图谱为代表的,是很经典的专家模型的 AI 做法,简单来讲就是把一些专家的知识抽象成知识的表达,然后放到一个图谱中,并且能够恰当地根据用户的输入进行调取。概括来说,有多少人工就有多少智能,专家知识库本身的提取非常困难,而且提取的范围有限,一般在一些特定的、范围相对明确的领域里,会采用这种实现方法。如果想刻画出有趣的灵魂、有意义的系统、有趣的原住民,使用传统方法很难达成,因为本质上并没有人格的部分,是整体围绕知识组织起来的 Chatbot,所以要满足元宇宙一些新的需要时,这种路线很难采用,但不代表完全没有参考价值。因为元宇宙里有些特定的服务型的 AI,比如在虚拟世界里面可能需要问诊,这时传统的和知识图谱相关的专业知识依然可以被使用。只是除去专业知识的部分,还期待有很多人格化的部分,比如不是一上来就问诊,可能先聊点有的没的,让人更好的放松下来,心情舒畅也是治疗里很重要的一部分,从而更好地完成后面的问诊。传统的专家型或围绕知识图谱的 AI Chatbot 的做法,极限非常明显。而流派里的另一端,就是基于深度学习或神经网络的大模型做法。像大模型这种完全基于生成的对话模型最近非常火,但这种技术存在的根本性问题是它并不具备思维的过程,完全是一个黑盒子,通过一些 PTM(预训练模型)或者引导语去调取语言的生成,本质上很难知道它到底怎么想。图灵测试的一个很经典反驳叫做中文屋实验,指的是在一个小房子里面,如果提供一本中文词典,但房间里的人压根不懂中文,只是知道你用什么输入之后,能够在词典里找到对应的词,这样的话也能够完成对外的输出。外部视角看起来答的也算有模有样。但很明显,从思维实验的角度可以知道,屋子里的这个人并不是真的懂中文,只是回答得像模像样,并不是真的懂。回到大模型的角度,它并不能很好地刻画出思维的状态,对工程实现很大的一个影响是很难基于大模型找到一种可解释的标的,去不断地迭代和优化。当然我们能看到有很多在这方面的努力和尝试。但就目前的状态而言,可以看到大模型限度的天花板。前段时间,人工智能界的大神 Yann LeCun,提出了一种新型人工智能的新路线,他很直接地指出完全依赖大模型或深度学习,难以达到这种数字心识或数字生命的状态。在大模型这种完全神经网络式的 AI 实现方法和过去以专家系统为代表的基于符号化的实验方法之间应该有一条融合的路子,我们的统一心识模型也尝试在这两条路径中间找到一种融合性的路径,基于中心意识的模块,包括有一个统一调度的模块,能够基于一个输入,判断在问题里用什么方式去解才是最优的。Founder Park:数字心识和机器智能(Machine intelligence)有哪些本质上的区别?陈阳:最大的区别还是在于我们选择的技术实现路径,刻画意识或是刻画人的思维结构,需要一种比现在传统的完全符号化的系统和完全神经化的大模型系统更融合式的方法。不同的系统在具体表现上一定各自更擅长的事情,比如大模型能很天然地处理上下文的问题,在多轮对话中已经能表现出很好的效果。在特定的专业知识领域,一定是专家系统回答得更精准。所以在不同的应对场景下,确实会有不同的技术选型。我们希望能从比较系统化或第一性原理的角度出发,解决根本性的问题。因为现在元宇宙的新的出现给了很多新的技术可使用的空间,所以比起传统的或是已知的其他公司,我们在整个 AI 的范式上会有些区别。机器智能:新一代自动化的延伸,用来辅助人类,改变工作的性质,让工作变得更加高效。机器智能的基础是计算,核心是会学习的机器,未来的 AI 需要
全新的测试标准
Founder Park:未来五年数字心识技术最可能落地的行业和场景是什么?陈阳:我们并不觉得基于心识的服务一定是五年后的事情,一方面我们之前和头部的几家虚拟人公司有些具体的合作,我们会把关于思维、大脑的部分用在一些虚拟人形象的背后,这是一种可能的场景。完全基于心识的一些服务,包括营销或是基于虚拟世界的陪伴服务,这些都是心识可能被应用的方向。包括游戏里可能需要个性不同的 NPC,这些 NPC 如果需要有自主意识,也是心识可以被使用的方向。我们公司非常看好这个市场,接下来的一两个月会有具体的产品透出,带有我们对元宇宙关于数字心识新的服务的想法。企业场景下的可能应用 | 来源:心识宇宙官网
Founder Park:如果图灵测试不适合作为检测标准,你们有计划建立一个新的衡量标准吗?陈阳:这是我们在尝试解决的问题。AI 从业者基本上会有一个共识,图灵测试可能不是一个合适好用的验证标准,这个验证标准到底是什么?学界有类似于 BIG-bench 或尝试构建一个对 AI 各方面能力的新评价标准。有国内教授在以类似于自动驾驶的方式按照 L1、L2、L3、L4、L5 区分机器人。但我们的视角稍微不太一样。如果图灵测试的中文屋实验存在质疑,回答得像模像样但并不是真的理解,我们的切入点是到底如何确认 AI 真的理解。我们在制作过程中有一个核心概念叫做人的内在世界,简单来讲,如果我们能看到 AI 在输入过程中,代码里到底在讲什么东西,会比图灵测试更演进一步。不能说它是完全对的方向,但有没有一种方法能够查看到 AI 的内心世界。对于人来说,想法经常会不断地冒出来,比如晚上在家洗澡,脑袋里不断冒出一些新的想法,这时思考在脑海里不断地进行,但不一定要完全表达出来。我们觉得可能有一种切入的视角,如果真的尝试创造数字意识,其中一个有趣的标的是我们能不能看到 AI 内心世界的想法。这是我们整个技术方案里比较有趣的地方,在构造这套思维系统的时候,我们能看到 AI 内心世界在产生什么新的念头,这个标准会更接近 AI 真的理解或真的有想法化的评价标准。我们现在还没有一个像图灵测试这样可以完全公开的标准,但有一些初步的思路,如果能看到 AI 内心世界的想法的产生,这可能是比较重要的步骤,也是我们整套框架里可以提供的能力。Founder Park:心识宇宙未来几年的大概发展规划是怎样的?陈阳:长期的规划是希望在根本性的问题上能有一些实质性的演进,我们现在也在围绕这个目标不断地做。短期内我们也会有一些关于心识在新的应用场景的透出,我们尝试摸索心识这样的服务,在元宇宙这个大环境下到底会有哪些商业化的可能性,未来一两个月会有一些产品透出。中期我们希望去赋能,不管是商家还是开发者甚至个人,能通过我们的 mindverse 创造心识,让这个心识丰满和有趣起来。这是平台化的服务这层,我们叫做 mind as a service,心识作为服务,这种服务方式会更符合未来元宇宙大的趋势。更长期来看,未来元宇宙的一些场景越来越多时,我们都需要个性化的角色,并且具备自主意识和主体性,基于 mindverse 这样的创造心识的方法也可以应用得更广阔,我们希望能在这个大的命题上有真正大的飞跃性的进展。Founder Park:你们如何看待当下的元宇宙,元宇宙的 AI 应该是什么样的?陈阳:元宇宙的概念现在还是不断被填充的阶段,很像十多年前讨论互联网、云计算的时候,但今天我们对这个概念的认识和十多年前或 20 年前已经有很大的变化。如果简单地把元宇宙当成虚拟世界,虚拟世界可以理解成一种人的精神世界的外延,进入元宇宙的时候,可以全身心融入在这个世界里,大家对它的想象可能像《失控玩家》,作为一个真正的用户进入到游戏世界,又保持了沉浸感的交互方式。在未来可沉浸式体验的元宇宙里面,至少要包含一些很基础的要素,首先人一定是元宇宙里很基础的要素,这个人指的是真人。场也是很基础的要素,因为要沉浸式地进入到虚拟空间,需要有一个虚拟的场地。这个虚拟场地可能是基于现实的孪生,也可能是基于完全的幻想世界的虚构。这里面可能会发生交易,所以会有货的部分,这些都是理所应当的。但我们可以想一个问题,在玩游戏的时候,传达世界观也好,构造一个鲜活的世界也好,一定需要有一些原住民。在未来元宇宙这样全沉浸式的虚拟世界里面,同样也需要原住民,这些原住民完全原生于这个世界。我们对这些原住民的期待,首先会希望他们很有个性,因为在虚拟世界里可能有成千上万的原住民,如果每个原住民的个性都很趋同,玩家会觉得这个世界非常无聊,非常单调,所以个性化一定是元宇宙里很强的需求。另外我们会希望这些原住民有自我意识,自我意识不仅决定了个性的部分,而且会有自我的驱动力,基于对目标的渴望完成很多行为的构建。这可能是有趣的虚拟世界原住民需要具备的要素。除去表皮上看起来像人之外,我们应该期待他们是有趣的灵魂,同时也是有想法的灵魂。这两点是我们观察到在未来真正的沉浸式元宇宙里面,期待看到的 NPC 的状态。这些状态也是心识宇宙尝试构建的系统,希望最终在未来能够通过我们这套统一心识模型,或者叫全脑框架,支撑起整个元宇宙里虚拟的原住民。*以上嘉宾观点不代表 Founder Park 立场,也不构成任何投资建议。
公司:心识宇宙
领域:人工智能、数字心识、脑科学
融资状态:数千万元天使轮
主要投资人:红杉中国种子基金、线性资本、险峰 K2VC、Plug and Play China、银杏谷资本
官方网站:https://mindverse.com/
心识宇宙联合创始人及产品负责人。本科毕业于清华大学,9 年游戏行业从业经历,前网易游戏设计专家、制作人,负责大型开放世界手游《明日之后:命运因子》,历任《天下 X 天下》、《战国志》游戏主策划,游戏多次获 App Store 推荐,登上 App Store 畅销榜前十。Al 前沿技术公司,聚焦于 Human-level Al 虚拟人,从脑科学和人工智能的融合技术出发,原创性地构建起具有自主意识和思考能力的数字心识,拓展下一代人工智能范式。2022 年 6 月,心识宇宙宣布完成数千万元天使轮融资,投资机构包括红杉中国种子基金和险峰 K2VC 等。
更多科技创业者的采访,欢迎在小宇宙或者苹果播客收听我们的播客节目「创业真人秀」。Founder 100 栏目一直在招募优秀的科技创业者来做客我们的直播间,如果大家对于这档栏目感兴趣,也有意向想要来分享自己的故事,欢迎大家长按下图,识别图中二维码,填写报名申请单。