美团技术团队-算法系列文章
知识图谱问答(Knowledge-based Question Answering, KBQA)是指给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案。美团在平台服务的售前、售中、售后全链路的多个场景中都存在大量的咨询问题。我们基于问答系统,以自动智能回复或推荐回复的方式,来帮助商家提升回答用户问题的效率,同时更快地解决用户问题。本文结合KBQA在美团场景中的具体实践,以及发表在EMNLP 2021上的论文,介绍了KBQA系统整体设计、难点突破以及端到端问答的探索,希望能对从事相关研究的同学有所帮助或者启发。
KDD 2021|美团联合多高校提出多任务学习模型,已应用于联名卡获客场景
SIGIR 2021 | 广告系统位置偏差的CTR模型优化方案
美团到店广告平台算法团队基于多年来在广告领域上积累的经验,一直在数据偏差等业界挑战性问题不断进行深入优化与算法创新。在之前分享的《KDD Cup 2020 Debiasing比赛冠军技术方案与广告业务应用》一文中,团队分享了在KDD Cup比赛中取得冠军的选择性偏差以及流行度偏差的解决方案,同时也分享了在广告业务上偏差优化的技术框架。
本文基于这一技术框架进行继续介绍,聚焦于位置偏差问题的最新进展,并详细地介绍团队在美团广告取得显著业务效果的位置偏差CTR模型优化方案,以该方案为基础形成的论文《Deep Position-wise Interaction Network for CTR Prediction》也被国际顶级会议SIGIR 2021录用。CVPR 2021 | 基于Transformer的端到端视频实例分割方法
尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。
在过去十年,机器学习在学术界取得了众多的突破,在工业界也有很多应用落地。美团很早就开始探索不同的机器学习模型在搜索场景下的应用,从最开始的线性模型、树模型,再到近两年的深度神经网络、BERT、DQN等,并在实践中也取得了良好的效果与产出。
在美团搜索AI化的过程中,比较核心的两个组件是模型训练平台Poker和在线预估框架Augur。本文主要与大家探讨Augur的设计思路、效果,以及它的优势与不足,最后也简单介绍了一下Poker平台的价值。希望这些内容对大家有所帮助或者启发。美团搜索是美团 App 连接用户与商家的一种重要方式,而排序策略则是搜索链路的关键环节,对搜索展示效果起着至关重要的效果。目前,美团的搜索排序流程为多层排序,分别是粗排、精排、异构排序等,多层排序的流程主要是为了平衡效果和性能。其中搜索核心精排策略是 DNN 模型,我们始终贴近业务,并且结合先进技术,从特征、模型结构、优化目标角度对排序效果进行了全面的优化。为进一步优化美团搜索排序结果的深度语义相关性,提升用户体验,搜索与 NLP 部 算法团队从 2019 年底开始基于 BERT 优化美团搜索排序相关性,经过三个月的算法 迭代优化,离线和线上效果均取得一定进展。本文主要介绍探索过程以及实践经验。深入各个产业已经成为互联网目前的主攻方向,线上和线下存在大量复杂的业务约束 和多种多样的决策变量,为运筹优化技术提供了用武之地。作为美团智能配送系统最 核心的技术之一,运筹优化是如何在美团各种业务场景中进行落地的呢?本文根据美 团配送技术团队资深算法专家王圣尧在 2019 年 ArchSummit 全球架构师峰会北京 站上的演讲内容整理而成。本文根据美团配送资深技术专家郑艳伟在 2019 SACC(中国系统架构师大会)上的 演讲内容整理而成,主要介绍了美团配送技术团队在建设一站式机器学习平台过程中 的经验总结和探索,希望对从事此领域的同学有所帮助。命名实体识别NER是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要的地位。
本文介绍了O2O搜索场景下NER任务的特点及技术选型,详述了在实体词典匹配和模型构建方面的探索与实践。KDD Cup 2020 Debiasing比赛冠军技术方案及在美团的实践
ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域的国际顶级会议。
美团到店广告平台搜索广告算法团队基于自身的业务场景,一直在不断进行前沿技术的深入优化与算法创新。团队的坚强、胡可、漆毅、曲檀、明健、博航、雷军与中科院大学唐兴元共同组建参赛队伍Aister,参加了Debiasing、AutoGraph、Multimodalities Recall三道赛题,最终在Debiasing赛道中获得冠军(1/1895),在AutoGraph赛道中也获得了冠军(1/149),并在Multimodalities Recall赛道中获得了季军(3/1433)。
本文将介绍Debiasing赛题的技术方案,以及团队在广告业务中偏差消除的应用与研究。KDD Cup 2020 AutoGraph 比赛冠军技术方案及在美团的实践
近些年来,图神经网络(GNN)在广告系统、社交网络、知识图谱甚至生命科学等 各个领域都得到了越来越广泛的应用。广告系统中存在着较为丰富的 User-Ad、Query-Ad、Ad-Ad、Query-Query等结构化关系,搜索广告算法团队成功地将图 表示学习应用于广告系统上,业务效果得到了一定的提升。此外,基于广告系统上图 学习的技术积累,团队在今年 KDD Cup 的 AutoGraph 赛道中斩获了第一名。本文将介绍 AutoGraph 赛题的技术案,以及团队在广告系统中图表示学习的应用与研 究,希望对从事相关研究的同学能够有所帮助或者启发。KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用
跟其它电商公司一样,美团业务场景中除了文本,还存在图片、动图、视频等多种模 态信息。同时,美团搜索是典型的多模态搜索引擎,召回和排序列表中存在POI、图 片、文本、视频等多种模态结果,如何保证Query和多模态搜索结果的相关性面临 着很大的挑战。鉴于多模态召回赛题(Multimodalities Recall)和美团搜索业务的挑 战比较类似,本着磨炼算法基本功和沉淀相关技术能力的目的,美团搜索与NLP组建团队参与了该项赛事,最终提出的“基于ImageBERT和LXMERT融合的多模 态召回解决方案”最终获得了第二名(2/1433)(KDD Cup2020 Recall 榜单)。本文 将介绍多模态召回赛题的技术方案,以及多模态技术在美团搜索场景中的落地应用。KDD Cup 2020多模态召回比赛季军方案与搜索业务应用
要处理自然界、生活中多种模态纠缠、互补着的信息,多模态学习是必由之路。随着 互联网交互形态的不断演进,多模态内容如图文、视频等越发丰富;在美团的搜索广算法告系统中,也体现出同样的趋势。搜索广告算法团队利用多模态学习相关技术,已在 业务上取得了不错的效果,并在今年KDD Cup的 Multimodalities Recall赛道获得了第三名。本文将介绍 Multimodailites Recall赛题的技术方案,以及团队在广告业务中多模态 学习相关技术的应用与研究,希望对从事相关研究的同学能够有所帮助或者启发。行人轨迹预测问题是无人驾驶技术的重要一环,已成为近年来的一项研究热点。在机 器人领域国际顶级会议 ICRA 2020 上,美团无人配送团队在行人轨迹预测竞赛中夺 冠,本文系对该预测方法的一些经验总结,希望能对大家有所帮助或者启发。CIKM 是信息检索、知识管理和数据库领域中顶级的国际学术会议,自 1992 年以 来,CIKM 成功汇聚上述三个领域的一流研究人员和开发人员,为交流有关信息与知 识管理研究、数据和知识库的最新发展提供了一个国际论坛。大会的目的在于明确未 来知识与信息系统发展将面临的挑战和问题,并通过征集和评估应用性和理论性强的 顶尖研究成果以确定未来的研究方向。
今年的 CIKM 大会原计划 10 月份在爱尔兰的 Galway 举行,由于疫情原因改为在线 举行。美团 AI 平台 / 搜索与 NLP 部 /NLP 中心 / 知识图谱组共有六篇论文(其中 4 篇长文,2 篇短文)被国际会议 CIKM 2020 接收。
这些论文是美团知识图谱组与西安交通大学、中国科学院大学、电子科技大学、中国 人民大学、西安电子科技大学、南洋理工大学等高校院所的科研合作成果,是在多模 态知识图谱、MT-BERT、Graph Embedding 和图谱可解释性等方向上的技术沉淀 和应用。希望这些论文能帮助到更多的同学学习成长。
基于微软大规模真实场景数据的阅读理解数据集MS MARCO,美团搜索与NLP中心提出了一种针对该文本检索任务的BERT算法方案DR-BERT,该方案是第一个在官方评测指标MRR@10上突破0.4的模型。
本文系DR-BERT算法在文本检索任务中的实践分享,希望对从事检索、排序相关研究的同学能够有所启发和帮助。在仿真平台的建设中,团队发现公开道路测试和仿真测试看似相似,实际上差异巨大:在车载环境下,为了确保系统的稳定运行,通常要保证一定资源处于空闲状态;仿真环境则不同,如何高效利用资源,如何实现压榨资源的同时确保仿真结果与路测结果一致成为了关键目标。在 应对这些挑战的过程中,美团提出了无人车引擎的概念,将车载与离线环境的差异隔离起来:功能模块无需任何更改便可以满足两种场景的需要。本文首先会介绍无人车引擎的概念,并以仿真环境面临的挑战为线索介绍美团无人车引擎的核心设计。美团无人配送 CVPR2020 论文 CenterMask 解读
计算机视觉技术是实现自动驾驶的重要部分,美团无人配送团队长期在该领域进 行着积极的探索。不久前,高精地图组提出的 CenterMask 图像实例分割算法被 CVPR2020 收录,本文将对该方法进行介绍。
CVPR 的全称是 IEEE Conference on Computer Vision and Pattern Recogni- tion,IEEE 国际计算机视觉与模式识别会议,它和 ICCV、ECCV 并称为计算机视 觉领域三大顶会。本届 CVPR 大会共收到 6656 篇投稿,接收 1470 篇,录用率为 22%。在WSDM 2020国际网络搜索与数据挖掘会议上,由微软研究院发起了一项学术评测任务Citation Intent Recognition,要求参赛者根据论文中对某项科研工作的描述,从论文库中找出与该描述最匹配的Top3论文,本次评测属于经典的文本检索排序任务。
美团搜索与NLP部与国内两所高校组队,提出了一种基于BERT和LightGBM的多模融合检索排序解决方案,拿下了WSDM Cup 2020 Task 1榜单的第一名。本文系获奖作者的经验总结文章。目标导向的视觉对话是“视觉-语言”交叉领域中一个较新的任务,它要求机器能通过多轮对话完成视觉相关的特定目标。该任务兼具研究意义与应用价值。日前,北京邮电大学王小捷教授团队与美团AI平台NLP中心团队合作,在目标导向的视觉对话任务上的研究论文《Answer-Driven Visual State Estimator for Goal-Oriented Visual Dialogue-commentCZ》被国际多媒体领域顶级会议ACMMM 2020录用。
该论文分享了他们在目标导向视觉对话中的最新进展,即提出了一种响应驱动的视觉状态估计器(Answer-Driven Visual State Estimator,ADVSE)用于融合视觉对话中的对话历史信息和图片信息,其中的聚焦注意力机制(Answer-Driven Focusing Attention,ADFA)能有效强化响应信息,条件视觉信息融合机制(Conditional Visual Information Fusion,CVIF)用于自适应选择全局和差异信息。该估计器不仅可以用于生成问题,还可以用于回答问题。在视觉对话的国际公开数据集GuessWhat?!上的实验结果表明,该模型在问题生成和回答上都取得了当前的领先水平。
ICDM 论文:探索跨会话信息感知的推荐模型
会话推荐(Session-Based Recommendation)是推荐领域的一个子分支 , 美团平 台增长技术部也在该领域不断地进行探索。不久前,该部门提出的跨会话信息感知的 时间卷积神经网络模型(CA-TCN)被国际会议 ICDM NeuRec Workshop 2020 接 收。本文会对论文中的 CA-TCN 模型进行介绍,希望能对从事相关工作的同学有所 帮助或者启发。在自然场景中,人脸检测技术挑战极大,美团AI平台视觉智能中心从底层算法模型和系统架构两个方面进行了改进,开发了高精度人脸检测模型VICFace。目前,该模型已经在美团各业务线使用,高度满足业务的性能需求。在自动驾驶行业的经典控制方案中,横向控制与纵向控制的求解是模型解耦的独立算法。这种“横纵分离”的控制方案虽然可行,但显然不符合人类的驾驶方式,也不符合横向、纵向紧密联系这一客观事实。本文介绍了一种横纵一体的无人车控制实现方案,在描述车辆横纵耦合、考虑横纵联合约束、统筹横纵跟踪性能方面更具优势。