查看原文
其他

重返搜索,百度的失落与挑战

撑迟 银杏科技 2023-07-25



新技术掀起的风潮与焦虑,唤醒了人们对搜索引擎这一领域的重新关注。


ChatGPT还在创造新的记录。其月活跃用户在1月末超过1亿,距离它上线只过去了3个月,成为史上用户增长速度最快的消费级应用程序。


此前最快突破1亿月活的产品纪录是由TikTok创造的,用时9个月,再往前是Instagram,花了2年半的时间。


这种增长不但让海外巨头微软、谷歌侧目,也让国内的百度焦急万分。巧合的是,几者都将新技术的落点放在了搜索上。


微软计划把ChatGPT与必应搜索深度融合,百度将在3月份推出类似ChatGPT的人工智能聊天机器人服务,并将其嵌入百度主要的搜索服务中。


搜索从未过时。作为互联网服务的关键基础入口,从全局搜索引擎,到电商、长短视频、新闻资讯的内嵌搜索窗口,搜索功能一直是连接用户、内容、服务的核心纽带。



二十年前的互联网没有丰富的产品与体验,第一代网民从搜索开始认识数字新世界。百度正是倚靠着搜索服务发家,逐步扩张为综合性互联网科技公司。


时至当下,ChatGPT的成功反复暗示着人们,技术革命将再次袭来,改造依然会从搜索这一基础入口开始。


但技术在进步,受众也在改变。如今的用户需要什么样的搜索服务?互联网的具体搜索场景发展到了何种程度?


需求更迭,让互联网的新贵与老钱们,在新机会面前都不甘落于人后。



新环境,新变量


搜索引擎被长期忽视,是因为移动互联网时代流量的重心转移到了各大平台,商业机会也随之倾斜。


2000-2010一直被看做是百度的黄金十年,因其扎实的技术基底与对搜索引擎的本土化改造,百度得以挤掉竞争对手,明确了付费推广的搜索流量商业模式。


转折发生在2010年前后,3G技术与移动终端基本普及,移动互联网的冲击让百度在PC时代的优势被消解。


往后十年,从微信、微博到抖音、快手、小红书,移动互联网时代各类平台涌现,抢占了用户使用PC搜索的时间。


信息逐渐在各大App内形成闭环,数据与资源也不互通不开放,平台之间的“互不联网”将用户圈在不同的App里。


中国互联网络信息中心于2019年发布的调研报告显示,受到手机垂直应用分流的影响,过去五年新增搜索用户规模逐渐低于新增网民规模。2014和2015年新增搜索用户与新增网民的比例均超过100%,2016和2017年则下降至80%与95%之间,并在2018年进一步下降至75%以下。


移动互联网时代后半段,App强势占据着用户使用时长,垂直应用为用户提供了更加便捷的信息获取渠道,使得新用户对搜索引擎的需求有所降低。


但需要强调的是,用户的搜索需求并没有消失,“通过发起请求匹配到想要的信息”依然是媒介消费行为中的刚需。


“百度一下”、“试试手气”被浏览器默认搜索替代,而搜索行为变得越来越多元化,比如智能设备的语音交互。


导致搜索变化的结构性因素在于,过去的搜索引擎等待被用户触发,过程可以简单描述为“输入关键词后呈现结果”。而现在,搜索行为的发起方,与信息内容本身都有变化。


一方面,互联网用户媒介素养提高,其上网行为更熟练,目标更明确,对搜索效率的要求也随之提高。另一方面,移动互联网加速了信息的爆炸式增长,新增的互联网内容不仅在数量上是PC时代的几万倍,其更新速度更为夸张。


由此可以推出,新时代的搜索需求强调两点:匹配要更精准,最好有提纲挈领的内容反馈以对抗信息冗余;信息要更动态,因为瞬息万变的物质社会使得“旧知识”不断被废弃,上一秒还在实用的经验下一秒就有可能一文不值。


简而言之,一是需要更注重个体用户的特定需求,二是尽可能让数据库的覆盖范围更广。



平台入场


手握注意力资源,平台的内置搜索功能,正在挑战传统全局式搜索引擎的地位。


如何消化用户新的搜索需求,并将其内化为流量变现资源,平台们试图用社交关系网络或UGC内容去解题。



平台搜索的共性在于,用户的数字化生存会为App提供大量行为数据,平台可以利用智能技术为其推送个性化、定制化的信息。


这种搜索机制为用户屏蔽了许多“噪音”,以免目标信息被竞价排名广告和过于宽泛的反馈结果稀释。这一定程度上解决了内容匹配的问题。


在此前提下,不同类型的互联网平台在各自擅长的领域内构建垂类数据库。


社交类平台如微信,根据每个人的社交关系图谱为其提供特定的搜索结果。比如在文章搜索中只显示已关注公众号文章,这种模拟人际传播的说服效果远胜于大众传播。


用户更加信任自主选择的关系网,信息在社交渠道分发的触达率更高,用户对搜索结果的评价也更好。


相对专业的、资讯类信息的获取,微信已然颇具话语权。内置搜索引擎后,公众号与视频号共同构建了微信的知识体系。


凡有新闻,先查微信,再配合朋友圈微信群的转发与互动,一个由搜索触发的内容循环生态已经稳定确立。


内容类平台如小红书,正在利用沉淀已久的UGC内容,让其内置搜索呈现的结果更为丰富与动态。


UGC内容保证了“新知”的时效性,其表现为一种包括了新闻资讯、评论与生活经验的动态信息。小红书以“笔记”的形式鼓励用户输出生活方式与消费决策。处于同一现实空间中的个体们互相消费对方生产出的实时内容,在小红书上,你可以搜索出突发新闻的舆论走向、影视文娱的相关评论、与真实生活的经验分享。


生活类信息的检索,小红书开始显露优势。大众逐渐有了新的认知,查攻略、薅羊毛、找办事指南,与这些事物相关的搜索小红书比传统搜索引擎更实用。


平台的搜索引擎因此显得更“懂”用户,解决问题的能力更强。即便不同平台各自为政,用户也更愿意游走其间,只为获得真正符合要求的搜索结果。


不过值得一提的是,微博曾经也是互联网平台中最具备搜索潜质的产品。用户生产优质内容,形成意见领袖,实时评论与转发,这些都是微博曾经的长处。


这两年微博搜索逐渐式微,部分因为其广告泛滥、审核日严,但最根本还是在于,平台搜索自有局限。


各个平台如同孤岛,单个应用能提供的信息内容总有上限。


若要保证搜索服务的高质量,则只能将优势圈定在垂类范围,若想扩大业务范围,便容易走向传统搜索引擎的老路。



百度靠AI自救?


如何应对新的搜索需求,百度也在谋划一条更面向未来的出路。


百度并不是第一次寻求搜索服务转型。自互联网进入下半场以来,内容生产和传播不断向独立平台迁移,这导致了一个更加分散的搜索市场。


与各平台越发丰富的内容生态相比,百度自身内容池的吸引力不足。平台间信息的不互通也让百度的数据库出现盲区,降低了综合性搜索引擎的功能性。


为了留住有效的搜索内容,百度开始布置自己的内容生态,这也是百家号当初被大力扶持的背景。


2018年3月,百度将“手机百度”改成“百度”,对自己的描述从“全球最大的中文搜索引擎平台”改成“7亿用户首选的搜索和资讯客户端”,也是在强调其“搜索+信息流”的内容新模式。


只不过百家号的转型让百度搜索的处境更为难堪。2019年,一篇《搜索引擎百度已死》将百度推上风口浪尖,指责其沦为了“百家号站内搜索”。风波不断,用户信任度一落千丈,搜索业务也从台上转入台下。


而现在,AIGC技术让搜索服务有了迭代的可能,对于在智能技术领域耕耘已久的百度而言,这也许是最好的机会。


据澎湃新闻报道,百度计划在3月推出类似于ChatGPT的AI聊天机器人服务,百度文心(Ernie)大模型将成为其基础。


百度搜索杰出架构师辜斯缪1月初曾表示,百度搜索今年在技术上最重要的工作就是要把整个检索系统变成检索+生成双模系统。


人工智能的“生成”就是在提供一种高级的自然语言服务。用户向搜索引擎发出的检索指令,会得到一个经由人工智能处理后的,结构化的信息结果。这种升级服务提供了满足新需求的第二种解法。


搜索结果不再是凌乱和混杂的,人工智能会直接分析用户的搜索指令,把复杂结果转译成自然语言,“回答”给用户,并且回答内容可以被讨论、被质疑,有更大的延展空间。



用更直白的话来说,更精准的内容匹配,更丰富的结果呈现,百度希望用人工智能来实现这些需求,并把它整合为新的全局搜索服务。


今年的Create大会上,百度展示了一种可能的AI搜索场景。在百度App 上搜索 “北京和上海的 GDP 谁高”,百度搜索引擎不会只返回谁高谁低的结果,而是生成两座城市历年 GDP 走势折线图,当用户手指沿时间轴滑动时,能显示不同年份的 GDP 差值。


那么百度搜索能完全靠AI迎来第二春吗?截至目前,百度的技术储备看起来相对充足。


比如对搜索引擎而言非常关键的语义匹配技术。在中文领域,百度有领先的语义模型,以及基于全网内容的深度问答技术,这可以让搜索引擎变得更善于理解查询关键词背后的含义,满足用户的口语化问答需求。


又如在语音和视觉查找方面,百度App的视频理解和检索技术、视频智能摘要技术一直在保持更新,以求适应视频消费时代用户对影像内容查找的需求。


只是从ChatGPT这几个月的市场反馈来看,实用层面,AI还有几大问题没有解决。


一是数据时效性,受制于模型训练方式,AI的数据还没有办法实时更新。ChatGPT的信息模型收集截至2021年,对于不断更新的现实世界,AI的生成结果存在一定滞后性。


二是成本问题。单次搜索的成本过于高昂,投入远高于产出将阻碍其商业变现。


三是内容真实性。统计学模型产生的内容会出现“逻辑自洽”的错误结果,还需要人工介入并纠正。


不过这些问题都可以视作特定AI产品的问题,还有技术修整与进步的空间。


更大的不确定性来自商业层面,新的搜索服务势必会颠覆过去以竞价排名为主的盈利模式。


怎样搭建新的商业框架?如何引导流量?技术之外,百度还得拿出一套成熟的产品方案。


END



往期推荐



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存