查看原文
其他

关于AI大模型的10个暴论(上)

李光华DavidLee David的AI全景图 2023-11-22
《ChatGPT全景图》系列写作告一段落之后,考虑到相关科普信息爆炸,但深度思考和原创内容较少,笔者开始在小报童发布《大模型暴论系列》。篇章相对短小,主要表达个人对大模型相关的思考片段。一些观点可能会引起争议,故冠以“暴论”之名,缓解一下发表观点的压力,哈哈,enjoy~

#01 从机器翻译看大模型应用落地

大模型正在经历的周期,就是几年前机器翻译经历的。
作为NLP(自然语言处理)中发展最成熟的技术,机器翻译走过的技术演变、产品落地和商业化,可作前车之鉴。
7年前谷歌神经网络机器翻译横空出世,机器翻译突然“说人话”了。统计机器翻译的词语堆叠,突然间流畅通顺。偶尔有疯子式的过译和漏译,但效果足够惊艳。我还记得那个被惊艳到的下午,还发了个朋友圈。
2017年前后,国内一批机器翻译创业公司出现了,大厂也开始组建机器翻译团队,腾讯翻译、阿里翻译、火山翻译、360翻译、金山翻译……
两三年间,出现一大批机器翻译产品,我兴奋地写下《机器翻译产品全景图》
2020年后,机器翻译公司开始祛魅。技术门槛降低,业务起家的“传统”公司进入,并且做得比纯机器翻译公司更接地气,更落地。
现在的大模型公司顶着光环,好像想象力无限,但一看应用,清一色的对话加上一批大同小异的预置prompt。
随着Llama2等开源大模型的出现,也许用不了2年,大模型也会经历祛魅过程。当然,在这个过程中,一大批尝试性的产品会出现。
然后,“传统”公司进入,把大模型能力直接装进自己的服务中。大模型技术成功业务落地的同时,也意味着大模型公司的分化,可能会倒下一批,还有一批融合到垂直业务,变成一家家从大模型切入的垂直业务公司。
日光之下,并无新事。

#02 行业大模型是否是一个伪命题

几点思考:
• 加拿大计算机科学家里奇·萨顿那篇著名的《The bitter lesson》总结得好:只要增大模型,就可以大力出奇迹,大即是好。
• 从数据角度:一些私有数据大的领域,或者公开数据明显少于私有数据的领域,比如金融,医疗,jungong领域,不知数据优势能大到何种程度,但对于大部分领域来说,互联网的数据其实是更多的。
• 从类比人的角度:对于大部分行业来说,优秀的本科生短时间学习行业知识,比高中生学行业知识,会有更高的认知和应用。比如传统的nlp技术,其实就类似在初中高中就分流,比如中专大专、卫校技校。
• 智能某种程度上就是对现实建模,并且建模的准确度高,能迅速反馈和解决问题。这种能力就是通用的。
• 类比识人:如果一个人在一个领域有成就,往往在别的领域也会有成就。一个人只能在一个领域有成就,底层能力不可迁移,说明不是一流高手。大模型也如是。
通用大模型正在eating垂直模型:垂直/行业模型一段时间的积累,被通用大模型的升级吃掉,如此循环往复。
#03 如何看待国产大模型既卷模型,又卷上层应用?

国内大模型厂商几十家,欧美叫得出名字的一只手能数过来。有的朋友开始骂国内大模型厂商不争气:不务正业,不卷技术,模型都没做好,开始来卷上层应用。

我认为有几个原因:
• 国人对科技的态度确实重实用而轻科研,有点“务实”过头的文化和风气。
• 目前模型层和应用层之间似乎看起来很薄,除了类似Dify(模型私有化)和LangChain(中间件)、Zilliz(向量数据库)的中间层,看起来似乎还是太薄,还没有太多中间层的空间。另外,还有jasper.ai这样应用层被击穿的前车之鉴。
• 大模型的应用虽多,目前看起来也远算不上百花齐放。应用层考验对模型和场景的深度理解,以及打破互联网惯性的ai-native思维,极其考验产品经理的产品力。
• 电刚刚发明的时候,大家应该也在卷电灯行业(我瞎猜的,没有考证)。
正好昨天有朋友问我建议,我能分享的是:
• 大模型公司一定会做应用,这个传统在机器翻译时代就存在了。谷歌翻译插件不就是一个杀手级应用吗?所以,接受模型公司会下场的事实。
• 有人把大模型类比于操作系统,类比于个人电脑。认为大模型之上会叠加很多层。比如芯片上面的服务器,数据库,硬件,软件,甚至软件也分层。大语言模型上面会是厚厚的一层。
• 这种类比有一定借鉴意义,但第一性原理告诉我们,类比是危险的,基于事实的层层推理才符合物理。
• 大模型上面有多厚,现在没人知道,但值得尝试在上面盖房子。开始了才会看到下一层是什么,行动产生信息。
• 吊诡的是,从另一角度看,大模型的边界已经显现(王建硕的观点,非常认同),就像window95奠定了Windows的格局,iphone4定义了智能手机(回想一下,从iphone5到iphone15的十一代,和iphone4有什么实质区别吗?并没有。
• 一面是模糊,一面是清晰。上一层可能在当下很薄,在未来很厚。我们现在最缺乏的,是一种“自律的自由”:一方面是对大模型边界的认知,一方面是从旧桎梏中释放的自由和想象力。

#04 大模型预示着脑力时代的终结?

写专利的时候,简单写了个规则,请GPT4给我设计了一个算法,算法有模有样,我试着请它写专利交底书提纲,它也写得有模有样。

今天的大模型就是这样——没有一项精通,但在几乎所有领域都有模有样。

想象你开了一个巨大无比的公司,以极低成本招来了各行各业人才,并且达到了行业中等水平……再把范围扩大,整个社会突然涌入几乎无限的“中等人才”供给……这难道不是一个巨变的开始吗?

“搬砖”的工作在未来不会再有了,考虑到Agent之类智能体的组合能力,未来的世界,如果不能在一个领域做到极致,仅仅因为每个公司都需要那么一个岗位(这是目前大部分机构的招人逻辑),这样的岗位早晚要自动化。

我们的世代,很难想象秦朝组织数十万人,肩扛手推修万里长城的方式,有多浪费人力。未来的时代,也很难想象今天的白领和程序员,处理成批的文档和代码,有多浪费脑力。用四个字形容:暴殄天物。

脑力劳动的时代在渐渐远去,创造力的时代徐徐来临——不论前景是好是坏,纵观人类历史,这无疑是一个巨大的终止符和未知的开始。

#05 打造一家三年后的主流公司

• GPT3阅读了24T、3000亿词的文本语料,覆盖了几乎所有行业岗位从业者的岗位知识。除了少部分没有联网的职业,大模型角色扮演几乎覆盖所有职业。

• 想象你开了一家100人的公司,除了你,其他99个是AI。AI产品、AI设计、Ai开发、AI测试、AI项目经理、AI客服、AI市场、AI销售、AI财务(只是不需要行政和人力:)

• 当然这99个AI有三个问题:

◦ 能力中等:都不是专家,但经过微调能达到中位数水平。
◦ 信任问题:他们可能会出错,有幻觉,恐怕每个岗位要增加一个对应的岗位QA(监工)。
◦ 如何协作:虽然有Agent的概念,实际落地还有点远,可以放到AI agent的话题谈。

• 目前大部分公司,都在依靠人力杠杆产生的规模效应。特别是大规模的流水线项目,比如翻译,编程,设计,研究,文案,编辑,那种密密麻麻的大片工位……可能有巨大的AI红利未被释放。

• 如果不是一个公司,某些平台也可能失去竞争力,比如Upwork、猪八戒网,这类职业和技能大军组成的平台。未来可能会出现虚拟数字人版的upwork和猪八戒网。

• 今天正处于虚拟个体到虚拟组织的演进阶段。三年后,虚拟和人类混合组织就是主流公司,甚至虚拟为主。

-END-

这是过去几个月在小报童发布的#大模型暴论系列的整理。如果有兴趣,欢迎理性订阅~

【往期精选】
David的产品笔记 06|记性最好的大模型对话产品Kimi
David的产品笔记 05 | 阅读助手会读Readflow
David的产品笔记 04|高颜值个人助理Pi
David的产品笔记 03|AI数字员工Chato
David的产品笔记 02|PPT神器Gamma
David的产品笔记 01|数字人Call Annie
ChatGPT全景图 | 回应吴军"ChatGPT不算技术革命”
ChatGPT全景图 | 产品+商业篇
ChatGPT全景图 | 背景+技术篇 

ChatGPT全景图 | 竞争格局篇(上)

ChatGPT全景图 | 竞争格局篇(下)

继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存