谷歌搜索的下一步:情境为王,给你更多参考
作者:Dieter Bohn
译者:李玉婷
原文标题:GOOGLE SEARCH’S NEXT PHASE: CONTEXT IS KING
最近的Search On 活动中,谷歌推出了几项新功能,总体上讲,这是它迄今为止最努力的尝试——让用户能做的不仅仅是在搜索框中输入几个词这么简单。
通过小范围利用其新的多任务统一模型(MUM)机器学习技术,该公司希望开启一个良性循环:它将提供更多细节和语境丰富的答案,同时,它也希望用户会询问更详细和语境丰富的问题。
最终,谷歌希望能提供更丰富、更深入的搜索体验。
谷歌高级副总裁 Prabhakar Raghavan 负责监管搜索以及助理、广告和其他产品。他的一句口头禅是,“搜索不是一个已解决的问题” 。
探索用户提出的问题
根据展示,重新设计的谷歌搜索会显示“要知道的事情”(Things to know)一栏,给你提供不同的子主题。
例如,购物搜索结果将开始显示附近商店的库存,甚至与你的搜索相关的不同款式服装。
谷歌正在提供超越文本框的新搜索方式。以它正在积极推广其图像识别软件 Google Lens为例。Google Lens 将被内置于 iOS 系统上的谷歌应用程序内,以及台式电脑上的谷歌浏览器中。通过 MUM,谷歌希望让用户做的不仅仅是识别鲜花或地标,而是直接使用 Google Lens 提问和购物。
“这是一个我认为会不断升级的循环,”Raghavan 说。“更多的技术会带来更多的用户可供性,为用户带来更好的表现力,并且在技术上会要求我们更多。”
以上两个方面都旨在开启谷歌搜索的下一阶段,通过直接组织和呈现信息,优化其机器学习算法。
在这方面,人工智能语言处理的进步将为谷歌提供极大地助力。得益于被称为大型语言模型的系统(MUM 就是其中之一),机器学习在映射单词和主题之间的联系方面做得更好了。谷歌就正在利用这些技能使搜索不仅更准确,而且更具探索性,且能提供更多帮助。
谷歌的另一个例子同样有启发性。
可能不知道自行车的零件叫什么名字,但如果它坏了,你就得搞清楚。Google Lens 可以在视觉上识别换挡件(挂在后轮附近的变速装置),而不是只给你不相关的信息。它允许你直接提出关于修理这个东西的问题,给你更多的信息(比如,优秀的 Berm Peak 的Youtube 频道)。
多模式搜索需要来自用户的全新输入
让更多用户更频繁地打开 Google Lens 的努力本身就有自己的优点,但更大的图景是关于谷歌试图收集更多关于你查询内容的语境。
Raghavan 说,更复杂的、结合文本和图像的多模式搜索需要“我们供应商必须拥有的完全不同的级别的语境,这样它才能更好地帮助我们拥有尽可能多的语境。”
很长一段时间以来,谷歌搜索一直在显示信息框、图像结果和直接答案。未来,谷歌提供的信息不仅仅是相关信息的排名,还是其机器通过抓取网络内容进行的理解和提炼。
在某些情况下——比如购物,这种提炼意味着你可能产生更多的浏览量。
和 Lens 一样,这一趋势值得关注:谷歌搜索越来越多地将你推向谷歌自己的产品,但也有更大的风险。
这一事实直接加重了谷歌已有的问题:如何不带偏见地表达。
在这里,指的是两种不同意义上的偏见。
一个是技术性的:谷歌想要用来改进搜索的机器学习模型存在有据可查的种族和性别偏见问题。它们是通过阅读大量网页来接受训练的,因此倾向于采用令人讨厌的说话方式。在这一点上,谷歌人工智能伦理团队对这一问题也有所记录,在两名首席研究人员发表了一篇关于这个主题的论文后,谷歌解雇了他们。
正如谷歌搜索副总裁 Pandu Nayak 的表态,谷歌知道所有语言模型都有偏见,但公司认为它可以避免“将其直接放出来给人们消费”。
这也许是可行的(但显然,也可能并不可行),它回避了另一个重要的问题和另一种类型的偏见。当谷歌开始直接告诉你更多它自己合成的信息时,它的角度是什么?谷歌的观点是什么?当 Google 尝试使用自动化系统为人们提供简明的答案时,它会不会传播不良信息?
在说到这个问题时,Raghavan 指出了现代语言模型的复杂性。
“如果去了解一下的话,就会发现几乎所有的语言模型都是高维空间中的嵌入。这些空间的某些部分往往更具权威性,而某些部分则不。我们可以轻易地机械评估这些事情,”他说。
接下来的挑战是如何向用户呈现这种复杂性,而又不会让他们感到难以忍受。
谷歌直接向用户提供答案,它还能保持中立吗?
就目前而言谷歌正在竭力避免面对其搜索引擎立场的问题,避免可能被指控的领域,正如 Raghavan 所说,即“过度编辑。”
在与谷歌高管谈论这些偏见和信任问题时,他们通常会关注那些高维空间中更容易定义的部分,比如“权威性”。
例如,当有人搜索谷歌认为“特别有害/敏感”的东西时,谷歌的“要知道的事情”框就不会出现。尽管一位发言人说,谷歌不是“允许或禁止特定的类别,而是我们的系统可以灵活理解这些是否被触发的主题。”
谷歌搜索、它的输入、输出、算法和语言模型都变得难以想象的复杂。
当谷歌告诉我们它现在能够理解视频的内容时,我们理所当然地认为它具有实现这一目标的计算能力——但现实是,即使只是标示如此庞大的语料库也是一项艰巨的任务,使早期网络索引相形见绌。
通常,当与计算机科学家交谈时,会出现旅行商的问题。这是一个著名的难题,你试图计算给定数量的城市之间的最短路线,这同时也是思考计算机如何施展诡计的丰富隐喻。
“如果你把世界上所有的机器都给我,我可以解决相当多的问题,”Raghavan 说。但是对于搜索问题,他说它是未解决的,并且可能无法通过投入更多的计算来解决。因此,谷歌需要提出新的方法,比如 MUM,以更好地利用谷歌可以实际创造的资源。
谷歌理解信息的新方法令人印象深刻,但挑战在于它将如何处理信息以及呈现信息。
旅行推商问题的有趣之处在于,似乎没有人停下来问这件事情到底是什么,当他挨家挨户的推销时,他向客户们展示了什么?
参考链接:
https://www.theverge.com/2021/9/29/22698504/google-search-on-event-ai-mum-google-lens-update-changes