查看原文
其他

为什么大模型 LLM 不会取代软件?

捡起来 2023-07-25
自 2023 年一月份以来,这个世界似乎发生了翻天覆地的变化,但似乎我们的生活又没什么变化。颠覆性的技术给人的感官冲击很大,人们往往高估了短期的影响而忽略了长期的影响。无论如何,我们都可以预见这次 AI 的突破将给人类生活带来巨大的变化,几乎所有行业的从业者都在努力拥抱这次的变化。ChatGPT 的“无所不能”让很多人开始质疑我们是不是以后不再需要软件。作为软件行业的从业者,一度也很焦虑,现在冷静下来看 LLM 跟软件就是两个物种,不存在取代一说。

- 认识 AI,缓解焦虑 -

我刚开始接触 ChatGPT 的时候,说实话对它有误解。我最初的理解,ChatGPT 只是一个更直接的搜索,直到我看到了两个 ChatGPT 的对话案例,一个是教 ChatGPT 打麻将,一个是让 ChatGPT 模拟 Linux Terminal(我尝试去找我刚出看的这两个文章但是没找到)。我跟着这两个案例,用 ChatGPT 实践了一遍,彻底改变了我对这个技术的看法:这东西有逻辑,并且能遵循指令。然后,我开始了长达两个月的焦虑之旅,每天晚上睡不着觉,疯狂的看资料,跟 ChatGPT 玩,试图去理解这到底是个什么东西,它的边界在哪里。也就是这两个月,微软的 Office Copilot 发布了,Adobe Firefly 发布了,BloombergGPT 发布了,GPT4 发布了,ChatGPT Plugin 发布了……每天醒来,感觉这个世界昨晚被颠覆了一遍,每天都在质疑自己的工作还有没有意义,直到我想明白了 AI 和这个世界的关系,也就是这张图:
这张图的核心是我们如何看待 AI(LLM)这个新事物。虽然 AI 由代码构成,但是我没有把它归类为软件(Software)。我这里定义的软件是指有程序逻辑的代码,它的特点是 Deterministic。而 AI 的代码并没有程序逻辑,只是黑盒参数,AI 是训练出来的不是写程序写出来的,它的特点是 Probabilistic——它跟我定义的软件有根本性的区别。在 AI 出现之前,这个世界有三个物种,人类,软件,物理世界(包含一切动物)。这三个物种之间是相互影响的,比如你可以搬动一把椅子,可以通过 12306 定一张火车票,也可以通过小爱同学打开一个电灯。现在一个新的物种 AI 出现了,它将如何跟现有的物种交互呢?最先出现的交互式人类跟 AI,比如类似于 ChatGPT 这样的产品,人类跟 AI 通过语言相互影响。其实有这一层交互,AI 已经可以间接影响软件和物理世界。比如你问 ChatGPT 如何安装路由器,它会告诉你要做 1,2,3,4,然后你充当了 AI 的手和脚去影响了物理世界。再比如你问 ChatGPT 如何修改 Mac 电脑的分辨率,它会告诉你1,2,3,4,然后你去帮 AI 点鼠标。这似乎有点傻,我们想要的是让 AI 干活,而不是替 AI 干活。于是一堆人琢磨“Enable AI to Take Actions”这个事情,然后就有了 ChatGPT plugin 这种产品,以及微软最新发布的 AI 版 Windows 系统,你可以告诉 AI 需要调分辨率,而不是按照 AI 的指令去调分辨率。这种能力使得 AI 可以跟现有的软件进行交互,进而影响人类和物理世界。至于 AI 能否直接操作物理世界,目前还没有看到成品,但有很多机器人公司在努力。

- ChatUI -

在交互形式上,ChatGPT 为我们带来了一种全新的交互形态:ChatUI。曾经有一度,行业对于 ChatUI 的讨论非常火热,甚至迷恋,认为 Chat 要统治世界了,但现实啪啪打脸。

ChatUI 在很多场景上非常符合人类直觉,很好用,但也不能解决一切问题。未来一定是多种 UI 并存。我这里的分类不一定完全合理,但可以理解个意思:
Chat UI:适合业务导向的需求,例如打车,买票,用户要的是结果,也就是最适合秘书干的活。
Traditional UI:适合体验导向的需求,例如淘宝,抖音,用户要的是过程,秘书可以帮你买东西,但是不能代替你逛街。
Super UI:所有生产力工具都会增加 AI 能力,跟 AI 的交互包括但不限于聊天。
人类在传递信息的时候,语言只是手段之一,有很多场景语言是无法描述的,但一个手势或者一个眼神却能解决问题,这类问题可以简单归类为调色板问题:你用手指三秒钟就能选中你要的颜色,但是你却无法用语言描述那个带点蓝色的紫。

事实上你去看很多生产系统中的 LLM 应用,聊天并不是主要交互界面,比如 Github Copilot。我们还是要冷静客观的看待 ChatUI 这个新事物。

-  编程的终结?-

我们先来看两个怂人听闻的观点:“大模型吞噬一切”,“编程的终结”。这两个观点的本质是一样的,就是大模型什么都能干。
https://cacm.acm.org/magazines/2023/1/267976-the-end-of-programming/fulltext
以上截图来源于 ACM 的一篇文章,大概逻辑就是以后再也不需要写程序了,我们只需要训练模型。我不是搞 AI 的专家,但是就目前 LLM 的原理以及实践来看,大模型取代传统程序是不可能的,这两类是完全不同的东西。你可以把大模型比作人脑,传统程序比作计算器。虽然人脑也能做加减乘除,但是人脑能取代计算器吗?大家都知道神经网络模拟的是人脑,虽然现在还不能完全作证这个模拟到了什么程度,但起码出发点是模拟人脑,那按理说人脑有的缺点大模型也会有。目前的实践也证明了大模型不善于计算,无法精准的存取信息,存在随机性,这些恰恰也是人脑的弱点,而正好是传统程序的强项。
所谓程序,其实就在干两件事“数据的存储,数据的处理”,无它。为什么数据库软件这么牛逼,赚这么多钱?因为数据的存储和处理少不了数据库。人类创造的大量高价值软件都是某个行业的信息系统,比如航空机票,铁路调度,ERP,银行账户,股票交易等等都极大的依赖数据库以及精准的数据处理。我很难想象把 12306 干掉,放一个大模型在那里,所有人订票都跟 12306 聊天,然后这个大模型记录了一切。起码在目前的 AI 范式下面,这个事情不可行。所以大模型更多的是取代人脑,而不是取代软件。要让大模型很好的工作,需要给它工具,软件工具,正如 ChatGPT Plugin 所做的那样。所以编程不会被终结,反而会越来越重要,因为不光要给人做软件,还要给 AI 做软件
软件和模型的区别大致可以总结为:确定的交给程序,动态的交给模型。但这个格局会不会发生变化?以我目前的认知来看,我认为两件事情的发生会打破这个格局。

On-deman UI即 UI界面可以按需实时生成。例如你在 ChatGPT 聊天过程中,它不但会用语言,图片,视频回应你,还会给你弹出一个界面让你做一些操作,例如在调色板上选取你心仪的颜色。再比如文字编辑场景,实时生成一个编辑器让你设置段落和文字样式。On-deman UI 的出现,可以根据当下的场景,实时生成具有交互能力的界面,充分利用摄像头,麦克风,键盘鼠标等交互能力
Model as Database,指大模型彻底解决了“记忆力”的问题。大模型可以像数据库一样实时的,高效的,精准的存取数据,相当于大模型内置了一个数据库,或者你想象一下你的脑子里面植入了一个数据库。
这两个技术的出现可以让我们彻底抛弃现有的软件,这才是编程的终结。我不知道怎样才能发展出来这两样技术,但起码对于目前的 AI 来讲需要新一轮的范式升级才有可能实现。未来的事情 who knows,关注当下,软件依然重要,比以前更加重要。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存