这是粥左罗的第 3289 期分享
来源 l L先生说(ID:lxianshengmiao)
分享 l 粥左罗(ID:fangdushe520)最近许多朋友的生活中,可能或多或少都被 ChatGPT 刷屏了。
你或许已经看过了许多相关的文章。它们或许从商业角度出发,告诉你 ChatGPT 引发了怎样的商业浪潮;或许从技术角度出发,告诉你 ChatGPT 的原理和技术有多厉害;又或者,直接向你推销各种各样的类似产品,告诉你这些产品多么有前途……但很些,离我们的生活都有些遥远。你可能看了很多文章,依然没有搞明白,ChatGPT 究竟是什么,它跟我有什么关系?如果你对 ChatGPT 从未听闻,那希望能告诉你一些新信息;如果你对此感兴趣但不熟悉,那希望能为你提供一点指引。ChatGPT 实际上不是一个新事物。它是2022年11月推出的,刚推出的时候我就使用了,还在知乎发了一条想法吐槽了一下。没想到,时隔两个月之后,随着微软及一票商业公司的入场,它又开始火了,火得家喻户晓。从原理上来讲,ChatGPT 其实也不是新事物,它背后的基础,是母公司 OpenAI 在几年前发布的自然语言模型 GPT。对人工智能有所了解的朋友一定知道,OpenAI 于 2018 年发布了 GPT-1,首次让人工智能能够让人类一样「理解文字」、写出文字。随后几年里,OpenAI 陆续推出了 GPT-2、GPT-3,用更庞大的参数实现了更精细的学习。通俗来说,就是让人工智能更「像人」了。目前 GPT-3 已经用在了很多场合。像国外已经有用 GPT-3 来写新闻的应用,至于用 GPT-3 写小说、生成游戏台词、生成代码,也都在探索中了。而 ChatGPT,就是在 GPT-3 的升级版 GPT-3.5 (目前最高版GPT-4.0)的基础上,进行一定的包装、微调、优化,所做出来的产品。过往的 GPT-3 只是一个底层引擎,必须接入到一个软件中才能使用。而 ChatGPT,可以理解为 OpenAI 自己为 GPT 做了这么一个软件,让用户可以直接使用它。所以它才叫 ChatGPT,也就是「可以聊天的 GPT」。那么,GPT 又是什么呢?它的全称是 Generative Pre-trained Transformer,生成式预训练转换器。简单来说,它的原理是:先给它提供一个庞大的语料库(通常是直接从互联网上抓来的),让模型通过上千亿个参数对这些文本进行打散、标记、学习,构建起一个复杂的预测模型。然后再依据这个预测模型,判断一个单词在这个情境下应该接哪一个单词。就这样一个一个单词串起来,形成一段话,或者一篇文章。这种预测的模式,其实跟我们大脑的学习和加工模式是非常相似的。因此,这也是它能够更「像人」的一个重要原因。- 这个模型背后无需人工参与的「无监督」式预训练自学习原理,或者说让模型像大脑「自由生长」的过程,就是它的动力层;
- 借由这个原理所完成的 GPT-3.5,就是一个结构层,是 ChatGPT 起作用的主要基础;
- 而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT,就是一个交互层,它的本质就是加了一层更友好的用户界面和交互方式,让个人用户能够更容易地应用它。
了解完 ChatGPT 的原理,我们自然会关心一个问题:就目前而言,ChatGPT 究竟能做什么?这可能是 ChatGPT 最简单的应用。你在聊天界面里向它提问,比如「波粒二象性是什么意思」,它就会用流畅的语言向你解释,把这个概念讲解得非常清楚。就我试用的体验而言,效果非常好,简洁晓畅,表达能力胜过许多人。你可以向它提要求,让它按照你的要求撰写一篇文章。这是我去年做的一个实例,大家可以看看:你可以让它撰写一封邮件,告诉客户你的报价,并且用礼貌、恳切的语言去表述。它写出来的作品保证用词精确,句子流程,比一般人写的要好;你可以给它一个主题,再给一些背景和指引,让它撰写一份策划方案,甚至让它帮你想创意、提供各种不同方向的点子和灵感。这可以帮你节省大量时间精力;你可以给它一些数据,让它根据这些材料撰写一份报告。它会非常智能地组合这些材料,生成一份文质兼美、结构清晰的报告,省去你斟酌文字的大量功夫;你可以给它一个选题,让它生成大量内容、风格和行文都截然不同的文章,发布在各个平台上。据说已经有一些营销号开始这么干了;你甚至可以让它按照老师的要求写一篇论文。实际上,国外已经有许多学生开始用 ChatGPT 完成作业了,也开始有大学教授跟 ChatGPT 「斗智斗勇」,比如要求学生现场写作,要求学生解释每段话的意思,等等。老师对 ChatGPT 说:请帮我想一个题目;学生对 ChatGPT 说:请按照这个题目帮我写一篇文章;助教对 ChatGPT 说:请帮我给这些文章写评语并打分。ChatGPT 还有一个非常强的能力,就是对输入的材料进行总结提炼。比如:你可以给它输入一篇文章,让它概括文章大意;或者给它输入一段讨论,让它总结主要观点和论证。现在也已经出现了一些产品,利用 ChatGPT 背后的 GPT 构建,能够实现这样的效果:你输入一个视频、一个播客,AI帮你收听,听完,用简洁的语言总结出视频或播客的要点,呈现给你。许多程序员朋友盛赞 ChatGPT 的一点,在于它的代码能力非常强。你提一个要求,比如「如何实现XXXX效果」,ChatGPT 会告诉你几种可行的方案,并提供这些方案的主要函数和算法;你向它提问,比如「在XXXX情况下出现了一个bug,为什么」,ChatGPT 会告诉你几种可能的原因,并告诉你如何处理每一种可能性。我自己试了一下,我觉得它写代码的能力比我强多了,大概有100倍吧。之所以 ChatGPT 能够掀起这么大的热潮,一大原因是因为它太「像人」了。你会感觉,跟你对话的似乎不是一台机器,而是一个非常聪明,几乎无所不知、无所不能,并且能满足你任何要求的人。这一点,令许多人欲罢不能。1)每一次跟 ChatGPT 聊天时,只要你不关闭窗口,你说的每一句话都会成为它的「上下文」。换言之,你可以像跟真人对话一样,不断问它「然后呢?」「还有吗?」,或者表达你的态度,它会给出像真人一样的回应,无需你不断重复、补充、完善问题。举个例子:你抛出一个话题,它回答,你对它的回答里有个地方不太满意,可以直接指出来,它会道歉,然后给出一个更好的、满足你要求的回答。这个过程非常自然、流畅,你就像在跟一个真人对话,它能完全理解你的每一句话,并给出合乎逻辑的回应。2)得益于海量的训练参数(GPT-3 有 1750 亿个参数)(GPT-4更大),ChatGPT 的文字生成能力非常精细,质量极佳。它写的文章,表达能力甚至强于许多不擅长写作的普通人。我有时向它提几个问题,它给出的回答会让我感到「有启发」,或者是一个新的角度,或者是一个完善的框架,这已经非常有价值了。如果我们用乐观的眼光去看待,它对我们的生活,会带来什么样的改变呢?互联网发明之前,我们的信息获取可以说是搜索1.0时代。那时,我们只能到图书馆去查阅资料,用卡片和笔记本做笔记,通过摄影或手抄的方式记录,繁琐,麻烦,成本又高。因此,「做研究」成了一件阳春白雪的事情,只有少数人有能力去做。后来,有了互联网,有了搜索引擎,大量的信息被电子化,放到网络上。我们获取信息的方式被大大拓宽了。只需要输入关键词,就能看到刊载在各种期刊上面的文献,存放在图书馆里面的资料,看到别人的分析、观点和见解。我们迎来了一个信息爆炸的搜索2.0时代。而有了 ChatGPT 等 AIGC 工具的辅助,我们可能会迎来搜索3.0的时代。搜索2.0迫切需要解决的问题是什么呢?信息太多了。如何有效地筛选、提炼、整合这些信息,就成了一个难题。但 AIGC 可以解决这个问题。我们向它提问,给出一个关键词,它快速整合知识库里相关的信息,总结提炼出最符合我需求的答案,呈现给我们。整个过程流畅,自然,舒适,可以省去我们在大量信息间来回穿梭、整理的时间,极其便捷 —— 这就是搜索3.0。现在已经有一些类似这样的工具了。比如我在用的学术搜索引擎 Elicit,就是使用人工智能检索我想要的论文,不过还停留在比较初级的阶段。也许等有了更成熟 GPT 的加持,会再上升一个台阶。因此,ChatGPT 也吸引了许多巨头的关注。目前最受关注的,应该就是微软和谷歌了。微软已经直接投资了 OpenAI,并且计划在自己的搜索引擎必应和浏览器 edge 中嵌入 ChatGPT。目前,ChatGPT 版必应已经在国外向少量媒体开放,个人使用可能还要等一段时间。你可以登录必应国际版,会有一个加入等待清单的提示。谷歌也宣布将一个人工智能 Bard 嵌入 Google 搜索之中。Bard 背后依托的是谷歌自己开发的人工智能模型 LaMDA,跟 GPT 效果相似但不同。前面提到,ChatGPT 有总结提炼的能力。这一点,可能彻底改变我们阅读和学习知识的方式。试想一下:未来我们会如何学习一个新概念?你向人工智能提问,它直接把概念详细讲解给你。不懂的地方可以继续追问,它会进一步向你解释。那么,你还需要去到处找资料、看教材、听课程吗?不需要了。有人工智能就够了。未来我们会如何阅读一本书?也许你可以把它导入人工智能,它会自己帮你总结提炼出书里最有价值的内容。可能是作者的观点,可能是方法论和步骤,可能是案例或论据……你想要什么,就向它下达什么指令,让它帮你「脱水」,呈上一份完善的摘要。未来我们会如何看视频、听播客?或许我们也不用看、不用听了,直接导入人工智能,它会帮我们总结出其中的要点,甚至可以帮我们写一份妙趣横生、文采飞扬的阅读报告,让我们能轻松愉快地摄入知识。未来,我们可能每个人都有拥有属于自己的专属医生、律师、财务经理……无论我们想要咨询什么问题,直接问人工智能就好,它会给出最新、最全面、最准确的答案。当然,上面说的这些,现在的人工智能还远远不能做到。但很可能我们离这一天也不会多遥远了。我们不再需要自己字斟句酌去写邮件,只需要给它一个指令,人工智能就会自动帮我们写好一份邮件。我们不再需要自己写材料、写报告,只需要给它足够的信息,人工智能就会自动帮我们整理好文字,并且文笔上乘。我们不再需要把大量的精力耗费在撰写方案、文档上面,而只需要思考,想出各种各样的创意、主题、想法……再把这些想法告诉人工智能,它就可以自动帮我们把这些繁琐的事务全都搞定。甚至,连思考本身都可以让人工智能来辅助 —— 你可以给它一个话题,让它帮你寻找素材、案例、参考资料;或者让它帮你头脑风暴,提供各种各样的点子供你参考……在这些应用之中,最令我感兴趣的,其实是微调(fine-tuning)。什么意思呢?它指的是:在人工智能本身的基础上,你再喂给它一些独特的、专属于你自己的材料,把它训练成一个属于你自己的人工智能,让它能够回答一些更具针对性的问题,满足你独特的需求。国外有人分享了一个实例:她把自己童年时的日记上传到一个人工智能模型中,让程序去学习她的思维、经历和文字,从而制造出了一个「童年的自己」。然后,跟这个「童年的自己」交谈。把自己遇到的问题,产生的困惑,面临的抉择向她询问,从自己的内心中寻找答案。同样,如果把一位作家的所有作品输入进去,或许再加上他的生平和经历,这个人工智能就能用作家的口吻去回答一些相关问题。国外有人做了这么一个尝试,向 ChatGPT 输入《反脆弱》作者塔勒布的作品,让它煞有介事地回答问题,使得塔勒布本人不得不出来纠正。那么,如果把《红楼梦》以及明清的各种史料喂给一个更成熟的人工智能,它有没有可能续写出《红楼梦》?我想,这是可能的。我感兴趣的点在于:通过微调,我们完全可能创造出一个专属于我们自己的人工智能 —— 只需要把我们所有的笔记,工作中产生的材料,平时的思考和日记……都喂给它,就可以了。在这个情况下,它就是你,甚至它比你自己还更接近你自己 —— 因为许许多多你可能已经忘却了的记忆,它都能够忠实地保留着,并依据一套算法完善自己的预测模型,做出更符合你内心和需求的选择。换言之,这就是一个专属于我们的「内脑」。当我们有疑惑时,当我们需要搜寻信息时,当我们需要分析问题、做出判断时,都可以参考它的意见。不过,目前的 ChatGPT 似乎还不提供微调的功能,但 OpenAI 官网是有几个模型提供微调的,只不过需要一定的技术能力。感兴趣的朋友可以试一试。另外,现在有些工具也在往这个方向尝试。比如有一些新兴工具,尝试记录你在电脑上浏览过的一切信息;以及知名笔记软件 Notion 也推出了 Notion AI,能够提供类似 ChatGPT 的功能。那么,如果在我们的电脑中内置一个人工智能助手,或者在笔记软件中内置一个人工智能,把我们摄入和记录的信息都作为语料喂给它,似乎并不是遥不可及的事情。到时也许可以出现这样的事情:你闲来无事,向它提问:最近有没有什么适合我看的电影?它会向你推荐一个清单。上面的内容来自哪里呢?来自它对你打过分的电影、读过的小说、有感而发的想法、平时搜索的内容、甚至跟朋友聊天的信息……这些数据进行综合分析之后,所推断出的你的喜好。它甚至会告诉你:这部电影用到了你三年前偶然想到的一个点子,处理得非常好,有没有兴趣看一下?这部电影探讨了一个议题,正好是你前段时间一直感兴趣的,不妨参考一下……当然,这个「内脑」无法绕开的,就是隐私安全的问题。如何确保我们的隐私不被别人所获得?我们愿意付出多少隐私作为代价来换取这样一个内脑?我们又能否接受它的存在,如何理解它与我之间的同一性?不过,我的答案依然是比较乐观的。就目前来看,甚至就上文所述的近未来来看,ChatGPT 等 AIGC 工具,什么都不会替代 —— 它只会提升我们的效率。原因很简单:AIGC 的定位不是一项「职能」,而是一种「工具」。什么叫职能?比如有一款人工智能,功能是帮助你看X光片,那这是一项职能,它可能会替代掉一部分医生的功能;但 AIGC 的功能是搜索、阅读、写作,这是所有职业都需要的基础技能。它本质上是辅助性的,是一种辅助的工具。AIGC 可以帮我们做到的是什么呢?我们不需要再给每个 NPC 写一堆重复的台词了,而是可以设计 NPC 的背景,让 AIGC 自动生成他们的台词,甚至产生任务和剧情;我们也不再需要给小说中的每个人物设定人设了,可以先做好背景框架,再让 AIGC 生成一大堆人物,我们从中挑选,润色一下就好……因此,有了 AIGC 的存在,我们能够想象的未来是:搜索信息更准确了,阅读效率更高了,得到的专业建议有了更多的渠道可以参考对比,游戏的剧情和任务可以更丰富了,小说和影视剧可以更多元化了,新闻可以更加实时地推送给我们……所有的创作型职业都应该为此感到开心,因为困扰着他们的最大障碍 —— 无聊的、繁琐的、劳动密集型的操作性工作,可以被 AIGC 替代掉了。那么,面对 ChatGPT 等 AIGC 工具,最需要、可能也是最重要的一项能力是什么呢?—— 是明确自己想要什么,并且能够表达清楚自己想法的能力。能够提出一个好问题,有时候比能够解决一个问题更重要。ChatGPT 的出现,更加清楚地表明了这一点。你对自己的清晰认知,对外部世界的独特见解,深入事物本质的洞察力,以及将其表达出来的沟通能力。这四点,会是我们在面对一个由人工智能驱动的世界时,更加潇洒自如的武器。随着 ChatGPT 等 AI 工具的发展,我们还需要记笔记吗?未来我们该如何管理知识?ChatGPT 等 AI 工具,能够替代的是绝大部分的一,以及一部分二。也就是它能替代客观信息库,以及我们对客观信息的总结。但二里面我们自己的思考加工, 以及三里面我们的实践记录,是没有办法被替代的。实际上,这也是让每个人的知识体系和知识结构真正有别于其他人的地方:重要的不是你收集和掌握到了多少信息,而是你对这些信息有着怎样的理解、形成了哪些自己的看法。随着 AI 的发展,未来更好的形态,可能是一个「公用的外脑+私人的内脑」。我们可以接入这个公用的外脑,询问客观知识库所存在的一切信息和资料,包括论文、互联网文章、书籍、视频,等等。而每个人基于他所记录的思考和项目实践,可以有一个经过自己微调和训练的内脑,让它学习自己的生活和思考方式,通过向它提问获得更加私人的、针对自己需求的答案,成为自己的秘书。到时所谓的「记笔记」,可能就会变成向这个内脑喂材料和微调的过程。而每个人的大脑+内脑,可能就会变成一个专属于他的思考机器,也是将每个人区分开来的方式。之前写的文章(上文)讲了 ChatGPT,引发了许多关注和讨论。限于篇幅,有些想法没有在文章里写得很清楚,我想在这里补充一下。许多人似乎都把着眼点放在「ChatGPT 能写出什么样的内容」上面,认为这是它最大的价值。比如有读者开玩笑地问「这篇文章是不是用 ChatGPT 写的」。这很正常,因为媒体就是这样宣传的,我的文章里也讲了很多它在写作方面的应用。科幻作家、《降临》的原作者特德·姜最近发表了一篇文章,认为:ChatGPT 相当于互联网的一种「模糊的有损压缩」。它产出的内容是它对互联网上各种信息的「改写」,跟一个人听完一堆资料之后转述给你没什么区别,本质上是一种二手信息。既无法确保准确性,又难以溯源。实际上,ChatGPT 的真正价值,并不在于能够写出什么样的内容 —— 毋宁说这只是它的一个副产品而已。它真正的价值,在于改变了我们跟信息交互的方式。我在文章里提到两个最重要的东西。一个是搜索3.0,另一个是微调。在传统的搜索1.0时代,信息以文字的形式存在,我们只能通过书籍去获取;在搜索2.0时代,信息以数据的形式存在,我们通过搜索引擎和其他种种服务,去获取这些数据。而到了搜索3.0时代,信息依然以数据的形式存在,但我们获取、抵达、加工信息的方式被改变了。ChatGPT 帮助我们搜集和整理信息,把整理好的信息呈现给我们。我们对信息的获取,从「我们去寻找信息」,变成了「信息来寻找我们」。换言之,有了 ChatGPT,散落在全世界各地各种渠道、障壁之后的信息,变得更容易被我们获取了。每一个缺乏时间、精力和渠道的人,都可以通过类似的服务和接口抵达全世界的信息,信息的不对称和门槛很可能被打破。这才是它的真正意义所在:它解决的是「信息太多」和「注意力太少」之间的矛盾。我们要决策,要学习一个领域,要采取行动、创造一个产品,在搜索2.0的时代,需要自己动手查找大量资料,自己去分析、整理、提炼信息,形成自己的结论。这是一道非常高的门槛,它造就了智力的垄断,形成了智力的壁垒。但随着 ChatGPT 的发展,它有可能打破这道门槛。未来的愿景,也许是每个人都能够接入一个涵盖全世界客观知识的「外脑」,能够从知识和科技的发展中受益,打破知识的不平等。另一方面,通过对 ChatGPT 进行微调,使之成为能够适配每个人的「内脑」,则可以让我们把自己所摄入的一切、所思考的一切、所经历的一切充分地利用起来,拥有一个比我们更了解自己的助理。试考虑一个最简单的应用场景:你想找一部适合自己的电影。最传统的做法,可能是通过你喜欢的演员、导演、流派去搜,查一查有哪些作品,然后看它们的简介,看影评网站的评分,看别人的评论,挑出几部试阅一下,看看能不能看下去……有了智能算法,它可能会向我们推荐「你可能喜欢的电影」,但它推荐的依据,依然是简单粗暴的「打标签」。把你按照行为打上标签,分析跟你同类型的人喜欢看什么内容,再把这些内容推给你。依然没有办法做到真正的「个性化」和「千人千面」。而一旦有了一个完善的「内脑」,它做出推荐的依据,就可能是我们过往的经历和数据。可能是你随手记下的一个有趣的点子,可能是你跟朋友讨论过的议题,可能是你近期一直在关注的领域,也可能是你读过的一系列相关的书籍和文章。它可能会告诉你:这部电影用到了你三年前偶然想到的一个点子,处理得非常好,有没有兴趣看一下?这部电影探讨了一个议题,正好是你前段时间一直感兴趣的,不妨参考一下……当然,上面所说的这些,包括外脑和内脑,现在的 ChatGPT 以及类似的产品还远远达不到,有待更成熟的形态 —— 但我相信,这是一个并不遥远的愿景。那么,这一技术的发展是不是纯然乐观,毫无问题呢?其实也不是。ChatGPT 具备极强的总结提炼信息的能力,因此,也许有许多人会放弃自己去阅读、理解和学习,而依赖于 AI 提供结论。但是,过度依赖AI 给出答案,其实相当于把自己思考的权利让渡给了 AI,放弃了思考的过程。AI 就像一个黑箱,我们输入数据,它输出答案。我们知道这个答案很可能是对的,但并不知道它是如何「知道」答案的。长此以往,我们就很容易放弃对于答案的追问,而让 AI 代替我们做决定、下结论。这是一件很可怕的事情。因为它预示着我们主体性的消失。AI 或许能够更快、更高效地为我们提供答案,但很多时候,我们需要的并不仅仅是答案,而是得到答案的过程,也就是信息跟我们大脑之间的碰撞、联想、火花……一条信息能够给予我们的启发和思考,也许比这条信息本身更为重要。读一篇文章,有了 AI 的辅助,我们也许可以更快地了解这篇文章的大意 —— 但问题是:很多时候,我们不仅仅想知道文章讲了什么,我们更想要的是,在阅读这篇文章过程中,它跟我们已有知识体系的振荡和共鸣。它令我想到了什么?帮助我产生什么想法?给了我什么启发和思考?这可能是更为重要的,也是 AI 所无法给予的。我们可能会反复多次、从不同的位置和顺序读一篇文章、一个章节、一本书,目的不在于了解它的大意,而在于寻求它能够跟自己产生共鸣和振荡的瞬间。这种瞬间是模糊的,美妙的,转瞬即逝的。它必须依赖于大脑全方位的投入和思考。这既是一种思维训练,也是一种让大脑跟外界交流的方式,是智性之美。一段文本,当它被 AI 所咀嚼和浓缩之后,它一定会丢失大量的信息 —— 但恰恰是这些所丢失的信息本身,可能才是更为重要的。因此,我的观点是:AI 对于我们来说,应该是辅助,而不是主导;是拓展,而不是替代。我们应该让 AI 成为我们的手和眼睛,让它告诉我们新的概念,拓展我们的视野,给我们提供来源,为我们收集资料,帮我们查漏补缺,完成重复机械事务,让我们的思维能够打破边界的束缚 —— 这一切都有一个前提:AI 只是帮我们拓展触及信息的能力,处理信息和做出决策的人依然是我们自己。而不是依赖于它给出的解释和答案,让它替代我们去决策和判断。一旦我们放弃了思考,而依赖外界(包括 AI)给予我们答案,我们作为人类的主体性其实也就不复存在。总结一下:
1)ChatGPT 及相关产品,最核心的价值不是它能产出什么内容,而是它能够打破信息的壁垒,解决「信息太多」与「注意力太少」的矛盾。2)这种解决方式,在未来或许会以「外脑」+「内脑」的方式加以实现。3)但是,过度依赖 AI 告诉我们答案是危险的,我们应当把它作为拓展信息触及的渠道,辅助我们做出判断,而不是依赖它帮我们思考和决策。希望今天这份加更,能够帮助你更好地理解 ChatGPT,以及它所可能带来的趋势和变化。你好,我是粥左罗,ChatGPT社群越来越多,如果非得加入一个,那就选择个靠谱的。
我的“粥左罗·ChatGPT变现圈”,3月21日晚上8点开放,到今晚不到三天整,已经超过5000人加入。预计明天突破6000人......
定价599元!目前给大家早鸟价,超过5500人、6000人、7000人时...都会涨一次价格,直到涨到原价599元!(会很快的)