ChatGPT搜索风暴
搜索引擎的市场格局已经有二十年没有什么大的变化,如今,Google和微软两大巨鳄的交锋再度上演。ChatGPT风靡之时,搜索成为大型语言模型(LLM)应用之争的最大战场。
在LLM技术进程方面,Google的相关大模型研发实际上与OpenAI的ChatGPT差不多齐头并进。但刚刚仓促推出的Bard显得很被动,Google官方的解释是,他们需要考虑新技术对社会的影响,不想推出一个漏洞百出的搜索系统。
不过,作为商业公司,任何行为的背后都要考虑经济成本。要知道,搜索中广告市场份额的1个百分点的变化,都可能带来至少数亿美元营收上的幅度波动。Google要将应用效果还不是很好的LLM作为基础技术,引入到全球市场占比92%的搜索引擎业务中,如果没有外部对手发起的强大挑战,很难进行大胆革新。
另一方面,自我革命是一件严重违背人性的事,更何况大厂还有所谓的“大企业病”,畏首畏尾在所难免。
这恰好是微软Bing的可乘之机,全球市场份额目前占比不到3%,历史包袱很小,New Bing要推出的消息让Google急不可耐。
ChatGPT的用户已经到1亿了,可想而知,如果Google搜索这次不跟LLM,还是按照自己的节奏去逐步更迭,其搜索业务的老底存在被倾覆的巨大风险,要是Google跟了LLM,要承受用户体验不佳的风险,还必须得在已有搜索成本上大出血——大约还要支出300亿美元的成本。
当然,Google与微软双方高层比任何人都清楚这一点,只是前者更多是焦虑不安,后者则是兴奋不已。
综合考虑风险后,Google只能硬着头皮迎战,于是就有了Bard。Bard的意思是“流浪诗人”,根据百度的结果,这类诗人通常行事半调子而不拘小节,样样通而样样松,还别说,这个作风倒是挺符合现在LLM模型目前的能力特质。相较之下,微软New Bing现在像是个牛气哄哄的“拼命三郎”,就想干一票大的,毕竟在某种程度上,Bing已经没什么可失去的了,而且这次很可能还要触底反弹。
那么,ChatGPT究竟会如何影响现在搜索架构以及相关业务成本?此前,OneFlow发布了《ChatGPT背后的经济账》,文章从经济学视角推导了训练大型语言模型的成本。本文则从LLM搜索架构和成本分析出发,探讨了微软Bing和OpenAI利用大型语言模型 (LLM) 对搜索业务的潜在颠覆性,并分析了LLM在搜索中的演进和发展情况。
(以下内容经授权后由OneFlow编译,译文转载请联系OneFow获得授权。原文地址: https://www.semianalysis.com/p/the-inference-cost-of-search-disruption)
New Bing会让谷歌坐立不安,我想让大众知道我们正是让谷歌按捺不住的助推器。——Satya Nadella,微软CEO
当然,这种情况永远不会发生,在软件/硬件方面改进之前,这只会是一种有趣的假设。
1 搜索业务
New Bing将融合一款新的下一代OpenAI大型语言模型。该模型针对搜索业务进行了定制,汲取了ChatGPT和GPT-3.5的重要经验和成果,速度更快、更准确且功能更强大。——微软
2 ChatGPT的成本
3 使用ChatGPT的搜索成本
从现在开始,搜索的[毛利率]将一直呈下降趋势。——Satya Nadella, 微软CEO
在搜索广告市场中,每增加一个百分点的份额,我们的广告业务就有可能获得20亿美元的收入。——微软
我认为我们双方都会受益匪浅。我们将逐步发掘出这些大模型的潜能,但如果搜索业务被垄断,发展停滞不前,在这种情况下如何从搜索和广告中营利都会是一个问题,并且我们还要应对可能出现的短暂下行压力,这种情况是我所不愿看到的。
大模型的发展潜力巨大,难以想象我们不知道该如何利用它们来发家致富。——OpenAI CEO Sam Altman
4 谷歌的应对措施
Bard将世界知识的广度与大型语言模型的力量、智慧和创造力相结合,并利用网络提供及时、优质的回答。谷歌Bard由LaMDA轻量级模型版本提供支撑,这种小型模型需要的算力更少,可以辐射到更多用户,获得更多反馈。——谷歌
5 LLM在搜索中的发展
爬虫
索引
相关性排序:可以使用模型基于相关性对索引中的页面进行排序,以便首先返回用户搜索查询最相关的页面。
聚类:可以使用模型将索引中的相似页面进行分组,让用户更容易地找到相关信息。
异常检测:模型可以检测索引并删除其异常页面或垃圾页面,进而提高搜索结果的质量。
文本分类:可以使用模型基于内容和上下文对索引中的页面进行分类。
主题建模:模型可以识别索引页面涵盖的主题,每个页面对应一个或多个主题。
查询处理器
广告引擎
总体而言,过去4年,谷歌搜索结果的顶部页面有80%的结果没有任何广告。此外,目前只有一小部分(不到5%)的搜索中有四个排名靠前的文本广告。——谷歌
6 根本性转变
快速前行,打开局面。——马克 扎克伯格,2011
在这种情况下,谷歌可能会迷失方向,反而限制了本该用于扩展和测试新应用模式的模型发展和创新。相反,微软和OpenAI更具冒险精神,更可能大刀阔斧地对搜索堆栈的四个元素进行彻底改造。
Bard将与LaMDA的轻量级版本一起发布。这个小得多的模型需要的算力更少,所以我们能将其扩展到更多的用户,从而获得更多的反馈。——谷歌