SIGIR 2021｜用于搜索多样化的意图图建模

Original 金金 PaperWeekly 2022-07-04

收录于合集 #机器学习 86个

©PaperWeekly 原创 · 作者 | 金金

单位 | 阿里巴巴研究实习生

研究方向 | 推荐系统

简介

本文由中国人民大学发表于 SIGIR 2021。搜索结果的多样化旨在提供涵盖尽可能多的意图的多样化文档。大多数现有的隐式多样化方法都是通过间接和不自然的文档表示相似性来建立多样性模型。为了更准确地处理多样性，本文通过意图覆盖范围的相似性来衡量文档的相似性。

论文标题：

Modeling Intent Graph for Search Result Diversification

论文来源：

SIGIR 2021

论文链接：

http://playbigdata.ruc.edu.cn/dou/publication/2021_SIGIR_IntentGraph.pdf

具体来说，作者建立了一个分类器，根据文档的内容判断两个不同的文档是否包含相同的意图。然后，作者构造一个意图图来表示文档和查询之间的复杂关系。在意图图上，如果文档相似，则将它们连接起来，而根据文档选择结果，将查询和文档逐渐连接起来。然后，作者使用图卷积网络（GCN）通过汇总其邻居来更新查询和每个文档的表示。通过这种方式，作者可以在文档选择过程中通过动态意图图获得上下文感知的查询表示和意图感知的文档表示。

此外，作者将这些表示和意图图特征与多样性特征融合在一起。结合传统的相关性功能，该模型获得了平衡相关性和多样性的最终排名分数。实验结果表明，这种隐式多样化模型明显优于所有现有的隐式多样化方法，并可以击败最新的显式模型。

模型

本文通过已有的相关性特征计算相关性分数，并通过图神经网络建模得到候选文档和已选择文档的不相关性分数（即多样性分数），并计算二者加权和得到文档最终得分。

具体来说，作者首先使用 BERT 获得文档表示，并训练分类器判断两个文档在图中是否应该存在连边。

然后作者使用图神经网络得到各个节点的表示，query 的表示以及整个图的表示，从而计算多样性得分。另外，在文档选择的过程中，采用贪心策略依次选择得分最高的文档，每次选择文档后，都将该文档和 query 相连，而断开和其他文档的连接，从而更新 query 的表示，来表达已经被覆盖的 intent。

实验

经实验证明，本文提出的方法显著优于已有的隐性建模的多样化算法，而相比于显性建模的算法，也取得了更好的效果。同时也通过消融实验，证明了各个模块的有效性。

结论

在本文中，作者提出了一种隐式监督方法，该方法可利用图结构来模拟多个文档对的关系，以实现搜索结果的多样化。作者进一步使用图卷积网络来提取包含局部和全局信息的多样性特征。为了捕获查询的动态信息需求，作者为意图图设计了一种图更新算法，以便在文档选择过程中及时呈现情况。

实验结果证实，本文的动态意图图对于在多样化任务中为文档生成多样性特征是有益且有意义的。将来，作者计划通过结合更多信息来提高分类器的准确性，并将意图图应用于明确的搜索结果多样化方法。

更多阅读

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个，让知识真正流动起来。

📝 稿件基本要求：

• 文章确系个人原创作品，未曾在公开渠道发表，如为其他平台已发表或待发表的文章，请明确标注

• 稿件建议以 markdown 格式撰写，文中配图以附件形式发送，要求图片清晰，无版权问题

• PaperWeekly 尊重原作者署名权，并将为每篇被采纳的原创首发稿件，提供业内具有竞争力稿酬，具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道：

• 投稿邮箱：hr@paperweekly.site

• 来稿请备注即时联系方式（微信），以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信（pwbot02）快速投稿，备注：姓名-投稿

△长按添加PaperWeekly小编

🔍

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

中美友好合作故事——十万名中国弃婴长大了

不仅要看已抓谁，还须一直抓到没

因为家暴终身挂着粪袋的她，在等一个死刑！

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

SIGIR 2021｜用于搜索多样化的意图图建模

您可能也对以下帖子感兴趣

中美友好合作故事——十万名中国弃婴长大了

不仅要看已抓谁，还须一直抓到没

因为家暴终身挂着粪袋的她，在等一个死刑！

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

生成图片，分享到微信朋友圈

SIGIR 2021｜用于搜索多样化的意图图建模

您可能也对以下帖子感兴趣