对话蓝湖任洋辉:从GUI到LUI,自然语言交互将重塑软件
面对大模型,软件业的进取方向就是「向死而生」。
文 | 张鹏
去年,设计协作软件赛道因为 Figma 以 200 亿美元被收购而被更多人看到,蓝湖和 MasterGo 作为这个赛道上的头部公司,也受到更多关注。
但今年整个软件赛道因为大模型的到来,似乎又有新的变化。前段时间,我也带着好奇跟蓝湖和 MasterGo 的创始人任洋辉探讨了不少关键话题。比如:
软件行业的价值会如何被大模型影响?
软件的交互会发生怎样根本性的改变?
软件企业的使命和目标是不是现在就需要被重写?
和任洋辉聊到了很多对于软件行业富有前瞻性和启发性的观点,比如从他的视角来看,大模型对软件和交互都带来了巨大的变革。对软件而言,需要直面 AI 吞噬软件的现状,重新思考软件在大模型时代下的新目标。
而对于交互,这恰恰是让他感到兴奋的变化,有很多东西值得重建。他认为,大模型对交互层带来的最大影响是 LUI(Language User Interface,语言交互界面)。GUI(图形界面)主导的软件,正在让位于 GUI(图形界面)和 LUI(语言界面)混合的交互形式。
这并不只是因为用户可以用自然语言表达需求,更重要的是,它使得软件不再只是一个工具,而是扩展到端到端的结果,直接向用户交付价值,通过把 AI 作为生产力,来放大人的价值。因为 LUI 是以人为中心的。
当然最让我有收获的,是任洋辉提出的软件行业应该有「向死而生」的心态,这样才有新生的机会。在这个时刻,把软件和软件行业的思维惯性放下来,看到根本性的变革和冲击会是什么,而「向死而生」不是一种悲观,而是一种进取的方式。
虽然是一次私下的非系统性交流,但是我认为我们的探讨值得拿出来引发更多探讨。所以还是征询了他的同意,释放出绝大部分内容与大家共享。
以下是对话正文:
GPT 的本质是计算的变化,
给软件交互带来重大影响
张鹏:今年是不是一转过年来整个战略和人生都被巨大的技术变革冲击?
任洋辉:去年 GPT3.5 出的时候,我觉得它的表现体感友好。但是真正意识到这个事情到底有多深刻,还是了解它的技术底层——核心是对语言的解构。大多数人可能觉得 ChatGPT 是个 ChatBot(聊天机器人),但本质上还是计算方式改变了它对于语言的构建和理解能力。
这个东西一旦有了之后,衍生价值会非常大,不管是带来对编程语言的变化,还是应用层的所有东西,完全不一样。它其实远远不是移动互联网级别的变革,类似于计算机革命,非常 fundamental(根本性的变革)。
这个变革和我们其实有两个交差点,一个交差点是软件,一个交差点是交互。交互的话,我们原来用图形界面——Graphic UI,来设计人机交互。这次带来了自然语言的交互界面,也就是 Language UI(语言用户界面),影响是非常大的。
LUI 最大的改变是:
从开发者主导到用户主导
张鹏:计算发生变化,交互可能会跟着变化,至少历史上看是这样。
任洋辉:这确实会给软件交互和未来整个商业经营带来很大变化。
现在很多的产品本质上来讲,其实是把很多产品或者应用的能力封装到一个 Graphic UI 里面,用户按照产品规则点击,实现某种能力。我怎么去画这个界面、界面之间的关系,怎么塑造这个迷宫,用户就要怎么来。所以 GUI 本质是以构建者为主导的一种模式。
但是 LUI 完全是 User centered experience(需求者主导的模式)。有了 LUI,现在通过 GUI 封装的能力,未来不一定会封装在所有应用里,这种能力更容易被 API(应用程序接口)化,在不同的应用里被调用。
图片来源:MasterGo
打个类比,现在的软件很像电商时代之前,各个城市的线下商店。在一个地方有货、有人流量,就有生意做。但是电商来了,可以把原来所有的货物,提炼到统一的界面里,基本上你可以在一个地方拿到自己所有的需求。LUI 给软件带来的变化,就像电商给门店带来的变化。
另一方面,对未来整个商业经营会有很大的变化。用户输入的需求可能会非常广泛,软件能够接收到很多潜在的需求;相应地,现在很多用户研究、客户反馈系统都不需要了。软件的赢家效应会越来越强。
张鹏:所以你的观点是:GUI 和 LUI 本质的差别会带来结果上的变化,构建者主导和用户主导是两个不同的东西。这个逻辑是怎么推演出来的?
任洋辉:本质还是,用户输入自然语言进来,人的意图被解读的能力变成了一个通用能力,所有人都可以被解读。意图解读完,其实就对应到不管是应用内的 API,还是应用外的 API 去提供这样的能力。用户意图被理解,应用本身提供的服务被 API 和能力化,这两件事情解离开了。
原来的计算能力下,(软件)没有办法解读你的意图,所以用 GUI 预设你的意图,或者说把你的意图展示出来。每个展示的界面背后,就对应相应的 API。但这是一种固定的方式。
现在有了 LUI,它能够解读你输入的所有意图,进而灵活匹配所有的 API。我觉得未来所有的能力可能都会均匀化,比如说你在任何的 APP 都可以买货、都可以订机票、可以订酒店……只要你讲就可以了。这个 API 哪怕本应用里没有,它其实可以调用 API 市场里的,随时可以抽取。
原来的软件就像一格一格的世界。但我觉得,LUI 把所有格都推倒了,基本上用户跟他(她)的需求之间会非常近。交互不再是被预设的,而是以用户为中心的;不再是被人工抽象过的,而是自然的。
对软件的变化
——重新洗牌
张鹏:LUI 是一种更自然的交互方式,相应地,它可能会让软件变得更通用,或者越来越 API 化。
任洋辉:我觉得 API 化是所有的东西,不光软件,也包括现在的生产工具、APP。
现在每个 APP 里封装很多能力,这些能力也越来越会被 API 化。任何一个 APP 里面都可以调用更多的能力。所以未来有哪些 APP 会留存,其实跟现在的逻辑不完全一样。
张鹏:你觉得会怎么变化?
任洋辉:原有软件其实是按照角色和场景拆分出来的:什么样的角色,在什么样的场景下用什么样的软件。现在,这个流转逻辑会非常复杂。
现在看起来,如果一个软件服务的是单角色、单场景,大模型很容易把它击穿掉,这个软件很容易变成通用型的能力。如果是多角色、多业务流在组织内的协作软件,它会相对更复杂一些。这是一个判断点,单角色还是多角色。
另外,它是一个完全用户侧的产品,还是能够黏住在客户侧的产品,也不一样。用户侧的产品冲击很大,能交付价值的东西可能很快就会被干掉。因为用户的切换成本非常低,有变化,用户很快就变了。这里面,不管是平面、翻译,甚至还有一些数据分析的用户侧软件,都会非常非常危险。
但是,客户的切换成本是很高的,所以越靠近客户侧的产品,它其实越能承载 AI 带来的这些变化。因为它在客户内的协同网络越复杂,反而变成加强它价值厚度的一种可能。
单链还是多链,
决定冲击速度
张鹏:用户侧的产品切换成本低,客户侧的切换成本高,后者切换成本高在哪?
任洋辉:数据肯定是一个很重要的点。
另外,客户侧的产品,影响决策的要素多。特别是多角色、跨部门的时候,往往要共同去做决定,这对组织来讲是有成本的。用户的话,好不好用、谁便宜,自己就定了,不需要开会商量,是一个消费品的逻辑。所以客户侧的产品是可以相对容易守得住,可以承载变化的。
但是那种做单角色、特别 C 端化的产品,去赌爆品的机会,也有可能成功,只是赢率太低了。有可能大模型再进展,或者垂类模型再进展,又把你覆盖了,这个循环可能会持续存在很久。
张鹏:你觉得这一波变化出来,对纯创意内容生产的工具公司是好事还是坏事?
任洋辉:我觉得中长期来看利空会更多,如果现有玩家不能很好的结合客户场景和商业场景进一步进化,现有工具仅有的内容生产能力一定会被大模型带来的内容生产范式覆盖掉。即便现在在积极地加大模型的功能,但是本质来讲,像平面这一侧,未来就是通用能力化,3D 侧其实也是通用能力化。
所有内容本身的生产或者创造的范式会完全变化。它不再需要那么复杂的专业门槛——从 0 开始调参去产生。
通过 prompt(提示词)的方式产生之后,再通过比较简易的方式去调整产生,这是完全不一样的。因为内容最难的是:这个结构是什么样的,你画一个原画,这个头多大,结构是很难的。但是结构出来去调整它,相对容易很多。
张鹏:原来的内容是 code engineering(代码工程)出来的,但是现在是 prompt engineering(提示工程)出来的。
任洋辉:内容生产流程变化了,平面、3D 都是这样。原来从 0 到 1 出来,每个过程对专业化要求非常高。现在可能从 80 分调一下,这个要求降的非常大。以前是要无中生有,现在可以有中求精。而且,可能现在 prompt 出来的是 80 分,未来再进展到 85 分、90 分,已经绝大程度击穿了大多数人的消费能力了,到了那个成绩的内容其实就 OK 了。
从这个角度去看,内容产品如果是单链,是有风险的。
我们做的跟内容稍微有一点区别,现在的 GUI 里,内容是比较少的,本质上它承载的是一系列动作,是业务逻辑。虽然是图象,但是本质上是业务流。各种按钮点击背后,是非常复杂的业务流和脑图 visio。
张鹏:怎么定义单链和多链,协同办公产品算是多链或者「长链」吗?
任洋辉:在 AI 的面前,所谓的协同和合作,就是单链和多链的概念。如果是个人去表达,并没有复杂的业务流,可能是短链。有协同的至少是二链或者三链。
软件本质上要有最佳实践。涉及到人跟人的交互、人跟人的合作时,就有最佳实践。什么是最好的方式,它的工具是要承载最好的方式这个定义的。但是对于个人,最佳实践这个定义是比较薄的。
从软件本身来看,确实存在着这种视角去看它未来的发展前景:涉及到复杂链条的、企业级决策的、跟生产力相关的,缓冲多一点。
张鹏:如果非常单链条的事情,别人很容易就把你 OTT(Over The Top,是指互联网公司越过运营商,发展基于开放互联网的各种视频及数据服务业务。)了,直接调你一下,反正不调你,调别人也行。
任洋辉:LUI 最底层有两个价值。一个是让用户用得很爽;第二就是把 APP 的墙和软件的墙推倒了,你没有能力防住的话你就是 API,这是挺残酷的,完全改变了现在做 APP、软件的这种范式。
LUI 使得软件
走向聚合时代
张鹏:拉个时间窗,5-10 年内软件肯定会变化,刚才探讨了一些可能性,谁在攻、谁在守,谁有利、谁不利。在这种基于大语言模型的能力之上,你觉得未来还能有较大发展空间的软件,会有什么样的特性?
任洋辉:过去,云和协作,是让软件拆分的过程。只要找到一个场景,找到一个角色,就有机会扩散。但是我觉得 AI 带来的变化,其实是一个新的聚合的时代。
从软件的角度来讲,它的数据增强的优势会更明显,用户侧的 LUI 的 input(输入)会有更多样的需求。它的应用货架理论上会更无限,可以提供的能力也会更多。
其实它会带来不光是领域之内的优势的强化——有数据,可以提供更好的产品。它也会带来跨领域的竞争,比如说未来我们想做平面,一定是可以做的,并且不再需要做这个功能,就可以直接上了。甚至可以做 3D,只要我们的技术结构可以支持,就可以上。所以这种跨领域的竞争会越来越大。
张鹏:边界就可以被非常低成本地迅速扩展,去解决广泛的问题,因为它比原来简单了。
任洋辉:对,只要用户是一个有多元需求的用户。现在,我们的客户的组织架构是叫数字设计部,只管数字设计;未来融合成一个整体的设计,又管 3D、又管平面等等,可能会有一个完整型的产品的需求。我们就能提供这样的能力,所以会让各种垂类东西的边界延展,可以处理的越来越多。这是一种变化的可能,垂类的一定会聚合,跨领域的也会聚合,未来需要的软件其实不需要那么多。
还有一个比较重要的变化,未来大概 10 年之内也会慢慢看到,使用软件的角色从占比上来讲,跨领域的人才会越来越多。好的工具出来之后,其实本质上也是让工具背后重复性的工作减少的过程,这个趋势在大模型的时代会越来越快。就像蓝湖和 Mastergo 这个领域,未来既懂产品设计、又懂工程的人,其实会越来越多,这样才能定义好的产品;同时,这样的人自然而然就会需求更 all in one(一体化)的东西,也会带来产品的聚合。所以不管从软件自身的构建能力上,还是从用户的需求侧,都会带来更大的聚合。
现在 AI 出来,大家很多事可以做,加 copilot(副驾驶,即 AI 助手),加各种事情。再过 12 个月大家慢慢的会感觉到,竞争的加速会更大,大家的紧张感、焦虑感会越来越强。因为领域内和跨领域的竞争会越来越激烈。
张鹏:以前是井水不犯河水,现在一看未来都是江河湖海,就看你是不是那个最大的湖。
任洋辉:现在,你的用户多,不一定意味着就是能守住的机会,这其实没有绝对关系,反而可能很危险。因为这个地盘看着很丰沃,会有很多人来抢,会有第三方把这个东西做成能力提供给更多人。除非用户使用这类产品产生的数据,帮助垂类模型迭代的曲线非常高,数据飞轮非常高,可能持续构建优势。
所以规则确实在重新发生变化。理论上大家都有可扩展的可能,但是,势能的高和低,你是短链还是长链,你的业务的数据飞轮的曲线是不是足够高等等,会导致结果不同。有点残酷的是,就算你知道了也没什么好选的,因为你的赛道其实几年前就选好了,只是这个时候大家重新抽一次牌。
本质上,还是要识别大模型的能力边界在哪里。原来的逻辑是你能抓到那个用户、那个场景,能够更好地 Go to Market、提供更便宜的价、更好的服务,你就能聚出来一个你自己的湖泊。现在大家全部一拆,聚到哪里重新洗牌。
张鹏:会不会有一批新的玩家进来,他们更加没有负担,更可以做符合这个时代的选择?
任洋辉:我觉得一定是,但他要足够地 AI native(AI 原生),去做可能靠近用户侧的那些变化。
对于现在有客户资源的、有场景的人去接受,它的复杂度可能太高;对于现在这些特别贴近用户的、单链的,很危险。但对于 AI native 的产品,贴近用户的、单链条的,反而也是机会,只是赢率可能比较小。
同时还是要看,数据飞轮是不是能做足够高,如果不高的话,可能再过一个浪又把你碾掉。我觉得现在 AI 这个变化里面,陷阱确实还是非常多。
未来交互层是
LUI 和 GUI 的混合
张鹏:交互会变得非常简单,原来在所谓的UI这一层,可能未来大道至简了。反而不像原来有那么多地儿可以研究——比如说原来一堆按钮,从形状到颜色到空间、到摆布的位置有很多讲究。
任洋辉:从 UI 的角度,input 一定未来是 LUI,因为它是最高效率。现在 input 是圆的、长的、点的、让你输入的……这都是 input,这些东西未来一定是 LUI。
GUI 可能是确认、可能是一些选择,比如一下特别多选择,你不可能全讲回来,一定是一种混合式的过程。
张鹏:UI层初始的 input 不是 GUI,但确认环节可能可以是 GUI。
任洋辉:分发可能是 GUI。input 如果有太多的选择、有太多分岔的东西,可能通过 GUI 选择,其实是 output 的一种形式,你说你帮我把周边的餐馆推荐一下,但是有 7 个选择,你通过文字展示还是读给我,都很麻烦,形成一个界面点击一下是最高效的。
张鹏:但比如说写文章,让人们特别清晰定义我要啥其实挺难的,如果 LUI 的起点就是对话框,内心可能会很崩溃。一个过度通用的 LUI 是不是也是有问题?
任洋辉:不管是现在的 APP,还是生产软件,我觉得它一定会是 LUI 和 GUI 的混合态。
其实大家进入到一个应用之前,本身就带有一个诉求。这个诉求就是这个 APP 解决的场景,不管是打车、餐厅什么的,只要把这个诉求讲出来。这是相对清晰的,会更高效一些。
但 input 是完全的 LUI,可能不适合一个类型——涉及到架构能力的任务,因为架构能力是非常复杂的。比如写文章、哪怕是内容消费类——看文章、创造一个软件等场景。
张鹏:跟我们用一个工具要解决的问题本身有关系。像写文章这种类型的问题,上来就「拿嘴喷」,可能这事启动都启动不了。
任洋辉:我们不会用 LUI 的方式去创造一个应用,这个对用户来说太难了。但是进入到这个应用里,通过 LUI 的方式去讲用户诉求其实是很简单的。UI 本质上还是解决自己需求的界面。
LUI 不止影响 input,
output 的变化更值得注意
张鹏:如果比如说具象到 Mastergo 这样的形态,它未来的交互你觉得怎么混合呢?怎么把 LUI 搁进去会比原来的效能更好?但它又能够不要变成一个被别人 API 化的东西。
任洋辉:第一阶段是我们让自己的软件在用户使用过程中把 LUI 加进去,这肯定是要做的。现在,我们的软件本身是 GUI,用户通过点击菜单,非常复杂,70% 的功能用户可能都没用过。
第二,我们现在还是一个比较面向纯粹的 GUI 场景,混合式的 UI 本质上是怎么跟 API 之间能够形成直接的链接,就是你的 output(输出)怎么能快速变成 action(行动),这个之间是要构建价值的。这个事我们未来一定会尝试,现在也在思考。
张鹏:不止是跟用户之间的 input 这个层面,是在 output 这个层面上怎么能够带来更有效率的结果,这也是 LUI 的一个组成部分。
任洋辉:其实理解 UI 这件事情,本质上要回答 UI 到底是一个图还是 action(行动)。如果理解 UI 是 action 的话,那(不被 API 化)这件事情就是有解的。
LUI、GUI 的核心都是解决用户的问题,给他他要的结果。用户要的就是那个结果。这是一个完整的价值交付的体系。本身 GUI 也是既有范式下价值交付的一个业务链,核心是把 GUI 和 action 能够链接到一起。
未来软件可能就是被整合到系统里面的一些 API 能力,一些最佳实践的 agent,它会被拆散成在不同的方式里去解决。最重要的是:input 你的东西,然后 output 出你要的结果。
张鹏:操作系统可能会永存,因为永远要IO,把算力等各种东西组织起来需要有一个系统。但是系统的另一种方式有可能是一个助理。未来操作系统会不会就是助理的这个形态?通过 agent 助理去系统性地调用所有的解决方案,所有的软件能力未来全变成了一种可被调用的API?
任洋辉:我有两个角度,现在软件公司的价值或者现在应用公司的价值,包括滴滴运力、顺丰运力、一些履约能力,这些能力可能会被 API 化,软件公司的一些能力也会被 API 化,有些东西可能会被 agent 化,这些是在 IO 背后,他们怎么去组织的问题,但他们现在的能力还是会被留存下来的。
但是从另外一个角度来讲,如果是一个纯市场和资本的逻辑,我相信 AI 带来的变化一定会越来越集中,它背后虽然是现在的公司在组织不同的能力,但是未来可能越来越容易变成是某一家公司,它集中的效率会越来越大。
拿电商的领域举个例子,比如说今天在网上购物,几通几达对我来讲是无感的,我通过淘宝买,淘宝自然分配谁来上门送货,我甚至都不知道是哪家快递来送。但是这个生态存在,他们作为一家独立公司也能赚钱,甚至也能上市,但是本质上是被调用的。这里,阿里就好比一个操作系统,在电商领域调用从金融到物流、到商品、到检索、到推荐等各种能力之后,它再去分配,帮用户解决问题。
所以未来在数字化的领域里,可能越来越倾向于一种可能:它有一个大前端的操作系统或者是一个 agent,在后面调用更广的能力。但是在用户面前,根本不知道这些 API 和 agent 是谁。
重新理解软件的
Go to Market
张鹏:反过来讲,未来如果大家都是通过API、作为功能被调用,产品和 Go to Market(市场化)这两件事是不是要重新理解?
任洋辉:对,我觉得长期来讲一定是这样的。但另外还会有变化,最终的 I/O 界面可能并不是一个,或者很长的阶段里并不是一个。未来也有可能会有很不一样的职业,比如很创意性的职业和 sales 的职业,可能也会有不同的 I/O 界面。
但大家都会认为我应该有机会成为某一个之中的部分,这个过程当中谁能抢到这个机会其实跟 Go to Market 还是有关系的。长期来讲,大多数公司应该都是会被能力化或者 agent 化,一定会到那个阶段——大家会认为我能构建一个很好的 API、一个很好的能力、一个很好的 agent 就是非常有价值的事情。
但是认命的过程可能很长,花很久才能认这个命。
对软件公司的「再组织」
张鹏:软件这个事如果放在美国去看,算得通,都挺不错的,但放到中国环境里面就有点痛苦,商业循环链条很长很复杂,不光要有行业认知、工程能力,还要有效率、品牌能力,能 Goto market、能服务客户。但未来API化可能就是三个人做了一个全世界被调用一亿次的 API,很赚钱。
任洋辉:从这个角度来讲软件行业认命速度会加快。
另外的一种角度是,软件公司的目标可能也会变化:到底是为了规模一年好几百个亿但是赔钱,还是规模一年就挣一个亿,但是有 8000 万的利润。
大模型的影响可能是体系性的,它不光是产品技术,甚至对于组织也一定是非常巨大的影响。
可能数字世界也会慢慢过了大家谁都能开一个店的那个阶段了。有点像,从人人都要开一个店,变成我们怎么被组织起来。它实际上是站在整个人类的生产力角度重新组织,意味着如果创业公司是人类生产力的一种组成部分,肯定会被重新组织,这是更本质的。
LUI 会让产品开发更简单,
从串行到并行
张鹏:原来 GUI 的时代里,没有办法去更加端到端地帮用户更好地解决问题,只能提供一个工具箱,提供功能。而在今天我可以提供一个自动化工厂,API就是工厂的自动化能力,交付的价值上升了,但它本质上也是因为有了大语言模型的能力之后,让 API 更好地能够成为一个自动化整合到工作的链条里去提供解决方案,上一个时代做不到这一点。
任洋辉:假如 UI 这个范式出来以后,整个产研工作的世界观也都要发生变化,原来 GUI 核心就是我们画迷宫,一个图接一个图,巨大的迷宫让用户一步一步去点击。整个产业的工作其实也是强串行的,很多工作我把这儿开发完之后是为了解决这个任务,这个任务需要这个任务开发,它不是基于用户的单线链条。
比如说大众点评要上线一个商家的应用,我可能就是要解决预定的问题、优惠券的问题、所有的问题,需要把商家的数据库建起来,所有的这些放优惠券、订餐所有东西要做起来,然后把前面的每一个 GUI、每个流转页面、详细页、主页都建起来,把每个逻辑调通、测试做完,我才能上线这个功能,但这只举了一个功能,每个 GUI 里面承载了巨大的功能,它是超级复杂的网。
它是无数个任务串在一起的界面,这里面都不能错,都必须要能调参、是能通的,它才能应用。但 LUI 带来的变化是你未来如果上线的话,我认为用户第一个阶段就是订餐,我只需要识别用户的订餐需求,把这个订餐的 API 做上就可以了,这个链条就通了。我再做优惠券,我可以并行去做,业务的复杂度就被完全解离开了,整个技术架构也完全发生变化了,就是不需要那么复杂的技术架构,不需要那么复杂的测试用力,不需要那么复杂的产品设计文档,我可以非常非常简单,一条一条做就可以了。
张鹏:为什么它会变得比原来简单?GUI 就是串行,LUI 的时候有可能是并行的,可以一层一层地去解决。什么东西导致了这个根本的变化?
任洋辉:因为原来你要提供给用户的就是一个超级大卖场,所有东西都要展示出来,所有之间的逻辑你都是要跑通,才能把这个东西交付给用户,但是新的方式其实就是用户的意图能识别清楚,我就解决这一个意图就好了,这一个链条跑通就可以了。
张鹏:新增加的功能对我来讲也API化了,以前要放到一个系统里,需要整个系统从头跑通。现在等于是在原有系统增加了一个能力,这个能力就像一个 API。
任洋辉:所以整个产品迭代的方式都会发生变化,迭代会更快。它不是高耦合的架构里面再增加,在原 GUI 里面它也是 API 化,但它跟所有的业务流程都是耦合的,你要告诉用户你这个需求我是可以满足的,然后把流程走完。
现在它们「解耦」了,它上线的复杂度就简单了。用户需求识别出来,API 对上,这个流程就走完了。这显然会改变了原来开发的复杂度。现在串行的开发方式跟软件一样,也是人类的阶段性模式,都会改变。本质上还是技术这些底层带来的变化,但最终都是能解决用户的问题最重要,没有什么流程、工具、甚至产业会永恒不变。
软件是历史长河
的阶段性产物
张鹏:未来是在长链里面通过API的体系,更完整地解决用户的问题。这种在长链条里的 all in one(一体化)的能力,是不是也意味着未来有很多软件没有品牌,甚至变成一个功能了?
任洋辉:我的结论是软件一定是人类历史上的一个阶段性的概念。某种阶段下,因为人和人交互有最佳实践,被封装成一个数字产品。但是未来随着人的参与度、链条的变化,人机协作的变化,机器的变化,软件的概念本身就要发生变化。
本来就是通过 input、output 的方式产生一个内容,或者产生一个 action,现在能做到就可以了。至于是不是要这个封装的过程,其实并不是最重要的。
未来看好什么软件
张鹏:你原来也做过投资,假定今天不是一个创业者,你是专注于投资软件领域的早期投资人,你会看好什么样的机会?
任洋辉:这个其实完全可以套用过去中美发生的所有的技术变革里,最好的机会是什么。我们最早做蓝湖、MasterGo 的时候,大家也没有太理解,但是可能国外出来一批 Figma 这些,一下百亿美金,国内一下都理解了。因为美国市场天然就是全球视野,它的 marketing、语言就是全球通行,它的人才也是全球最好的,资本也是最乐观的,因为可以赚全球的长周期的钱。它是一个非常强的、持续化带来的优势。
AI 这次其实也是一样,对于早期的投资,中国的创业者有两条路。
一条就是进入到全球范围内的变化里,更本质地理解大模型的底层价值是什么,边界是什么,在技术层和应用层最大的价值变化是什么。包括前面讲的 LUI,你在全球市场就可以拿到更根本性的、更长周期的价值。
但是如果一开始你就不是做全球市场的,而是在中国市场做 AI,那一定是你的应用在什么场景,解决什么具体商业问题,ROI 是什么,是不是能够构建中长期的竞争壁垒。如果你聚焦在中国的话,就要这样思考;聚焦在全球就要思考更 AI native(AI 原生)的机会。
AI native,
机机交互可能是终极形态
张鹏:你怎么定义AI native,它跟以前最大的变化是什么?
任洋辉:现在所有软件本质上来讲还是人机的交互在协作。一个更激进的思路,未来机机交互可能是主流,只有少数是人机的对话,所有的东西可能就是 agent(机器助理)对 agent。现在解决专项问题的公司,可能变成某一个 agent,agent 跟 agent 之间进行交互,解决相应的问题,我觉得这是一个比较原生的思考。
另外,AIGC 有一个角度,未来整个数字世界可能 99% 的像素都是由 AI 生成的,跟我们现在完全不一样。这也是比较原生的。核心是你相信未来整个数字界的主体到底是人还是机器,这个拉得更远,不是 10 年的话题了,10 年、20 年以后。
张鹏:未来数字世界里的核心建设者应该是AI,不是人。
任洋辉:人是消费者。
张鹏:机机交互为主会给软件的体系带来核心的变化是什么,只是API的问题吗?
任洋辉:这个对软件的变化,确实要拉到更长,可能 20 年。
我觉得,人机的交互界面会非常少,只有非常少数的架构的人,对架构有天然的理解。他的理解可能超越了大多数人正态分布能解决的问题,他需要有一个架构者去提升一些东西进去,只有少数架构能力的人才真正需要人机交互的界面。本身的界面应该会非常非常少。
蓝湖和 Mastergo 的使命
张鹏:回到 LUI,你觉得 LUI 带来的一系列变化会改变软件公司的使命吗?
任洋辉:就像你前面提到的,当年的软件解决的问题是一个工具箱,用户需要用这个工具创造价值,今天 LUI 使得 output 结果更重要,本质上软件会变成一个工厂,帮用户 OEM(委托代工生产)了,用户要哪些,工厂都能做出来。软件的定位从一个工坊到一个创新工厂这种的演进,给用户解决问题的使命发生了变化。
AI native 的角度去想,大多数组织想抓最终的 I/O 界面这个事情一定是不靠谱的,大多数组织应该想明白,自己不管是在现有的场景、现有的数据、现有的用户客户侧带来核心的价值是什么,你给这个网络里最终提供的价值是什么,比如 agent 能力。这个时代,每个组织可能要重新想自己的使命和愿景,确实有很大变化。
张鹏:你有没有想过AI时代蓝湖的新使命?
任洋辉:我们原来的愿景是:让创造数字世界的团队和产品更成功,但大模型时代这两个主体——团队和产品可能都会发生变化。
我觉得至少在某一个阶段下,我们的价值如果能够更好地推进整个数字世界从一个非常 GUI 主导,更快地进入到 GUI 和 LUI 混合式的生态,对用户来讲就是好的。
MasterGo AI 概念产品,由 LUI 和 GUI 混合的交互界面|图片来源:MasterGo
它需要在生产力工具、资源等各种方面共同推动。所以这件事情一定是很难的,但最终用户的体验一定是更好的,用的时候会更爽。
其实人机的互动、机器的互动、还是人跟人的互动,每个阶段最佳实践陈列的方式是不一样的。现在软件的阶段是解决这样的问题:数字化复杂度到一定程度,它牵涉到多角色,它就需要处理协同的问题。
但我觉得更长期来看,协同只是最佳实践的一种承载方式,应该不是一个持续性的命题。大模型和软件有两个交叉点,一个是软件的交叉点,一个是交互的交叉点。
相对来讲,我觉得软件的交叉点被冲击的速度可能是更快的,软件的交叉点被冲击主要是因为 API 化、集中化,未来不需要那么多的生产软件。但大家可能都去抢那少数几个机会。
交互这个事情也会被冲击,但反而是更有机会的。交互的变化从纯 GUI 变成 GUI+LUI 主导,怎么跟 API 更好地产生 action,这个范式本身并没有人来定义,这是我觉得很值得去探索的新目标。
「向死而生」,
抓住新生的机会
张鹏:是不是可以理解为,LUI 对于软件本质上是让它的使命发生变化,不止是我给你一个工具,而是给你更好的结果,释放你更大的价值。
任洋辉:这跟 AI 带来的能力是匹配的,因为它是以人为中心的,非常根本性的变化。它可以把所有的现在以场景为中心、以公司为中心构建的所有东西都有机会能够推倒。以场景为中心、公司为中心、行业为中心这都是片段。是生产力不够的时候阶段性的生产关系。
张鹏:我觉得它本质上是一个进步,不是一个塌缩。并不意味着软件这个事未来没有价值了,也没有挑战性了。
任洋辉:是的,理论来讲大家现在都有机会,但本质上来讲这件事情考验的,真的还是那个哲学三问题,你是谁、你从哪里来、你要去哪里,你现在做这个事情的机会一定是各种产业交叉之后产生的机会,大的变化各个产业在轮动,一定是有路径到别的机会。
归根结底还是要帮助人和组织去创造更大价值,把 AI 作为新的生产力有效地组织起来,通过更好的 output,但它本质上又是 LUI 这条线带来的能力变化,能看到这个领域里面有新的向上的变化。
虽然看起来是一种「向死而生」,但还是会有新生的可能。一个企业能看到它可能会怎么死,它才有机会找到那个新生的路。因为能想明白怎么死本身,也是个很难的事情。很多人会觉得向死而生说得很沉重,我觉得一点都不沉重。
*头图来源:蓝湖
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
直播预告
苹果 WWDC23 发布会时间确定!
6 月 5 日(周一)晚上 12 点,极客公园「开始连接」直播间请到资深果粉兼特邀主播Jesse,与XR行业资深产品经理刘鹏一起,和大家边看边聊此次发布会上苹果有哪些重磅发布内容,同时盘点近几年来苹果产品的整体趋势走向。
赶快点击下方按钮👇预约精彩直播吧!