查看原文
其他

美团技术团队-算法系列文章

求真、务实的 美团技术团队 2022-05-14


各位伙伴好,欢迎关注「美团技术团队」微信公众号。在这里,已经有32万小伙伴与大家一起学习成长。本文系算法系列文章汇总,我们也会不断更新这里的内容,点击下面的各个标题就可以查看原文了,Enjoy!

细粒度情感分析在到餐场景中的应用

经典的细粒度情感分析(ABSA,Aspect-based Sentiment Analysis)主要包含三个子任务,分别为属性抽取、观点抽取以及属性-观点对的情感倾向判定三个级联任务。本文介绍了美团到店到餐应用算法团队通过结合学界最先进的阅读理解、注意力机制等方面的实体抽取、情感分析经验,解决到餐(菜品,属性,观点,情感)四元组抽取问题,并在多个业务场景应用落地,希望能对从事相关工作的同学有所帮助或启发。

预训练技术在美团到店搜索广告中的应用

搜索广告在优化流量变现效率等商业指标之外,也需要重点优化用户体验,降低不相关广告对用户体验的损害,这样才能保证平台生态的健康发展。本文对预训练技术在广告相关性的落地方案进行了介绍,既包括训练样本上的数据增强、预训练及微调阶段的BERT模型优化等算法探索层面的工作,也包括知识蒸馏、相关性服务链路优化等实践经验。

美团搜索多业务商品排序探索与实践

首页搜索是美团App上十分重要的模块,每天服务于数千万用户。美团搜索在商品类业务上的相关技术也在不断迭代,排序模块作为整个搜索系统的重要组成部分,极大地影响着用户最终的搜索体验。本文介绍了美团搜索在商品多业务排序上相关的探索以及实践。

美团知识图谱问答技术实践与探索

知识图谱问答(Knowledge-based Question Answering, KBQA)是指给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案。美团在平台服务的售前、售中、售后全链路的多个场景中都存在大量的咨询问题。我们基于问答系统,以自动智能回复或推荐回复的方式,来帮助商家提升回答用户问题的效率,同时更快地解决用户问题。本文结合KBQA在美团场景中的具体实践,以及发表在EMNLP 2021上的论文,介绍了KBQA系统整体设计、难点突破以及端到端问答的探索,希望能对从事相关研究的同学有所帮助或者启发。

情感分析技术在美团的探索与应用

2021年5月,美团NLP中心开源了迄今规模最大的基于真实场景的中文属性级情感分析数据集ASAP,该数据集相关论文被自然语言处理顶会NAACL2021录用,同时该数据集加入中文开源数据计划千言,将与其他开源数据集一起推动中文信息处理技术的进步。本文回顾了美团情感分析技术的演进和在典型业务场景中的应用,包括篇章/句子级情感分析、属性级情感分析和观点三元组分析。在业务应用上,依托情感分析技术能力构建了在线实时预测服务和离线批量预测服务。截至目前,情感分析服务已经为美团内部十多个业务场景提供了服务。

广告深度预估技术在美团到店场景下的突破与畅想

后深度学习时代下,技术迭代全面进入深水区,以提升模型复杂度为主体的广告预估模型优化已经不再奏效。美团到店广告质量预估团队紧密结合业务特点,发挥深度模型结构灵活多变的优势,实现了进一步破局。本文先介绍了美团业务的LBS空间距离约束和长周期性两大挑战,然后介绍了上下文、用户、广告、训练方式四个维度的应对方案,具体如下四个技术突破:a.基于位次组合的上下文偏差感知预估;b.基于时空依赖的超长序列建模;c.广告候选动态化;d.灾难遗忘与持续学习,带动线上指标显著提升的同时,整理为论文发表在SIGIR、CIKM等国际顶级会议。最后,基于新一轮理解,提出推理量级动态化、评估指标差异化等预估技术新趋势。

美团智能客服核心技术与实践

客服是在用户服务体验不完美的情况下,尽可能帮助体验顺畅进行下去的一种解决办法,是问题发生后的一种兜底方案。而智能客服能让大部分简单的问题得以快速自助解决,让复杂问题有机会被人工高效解决。在用户服务的全旅程中,美团平台/搜索与NLP部提供了问题推荐、问题理解、对话管理、答案供给、话术推荐和会话摘要等六大智能客服核心能力,以期达到低成本、高效率、高质量地与用户进行沟通的目的。本文主要介绍了美团智能客服核心技术以及在美团的实践。

小样本学习及其在美团场景中的应用

美团的各个业务有着丰富的NLP场景,而这些场景中模型的构建需要很多的标注资源,成本很高。小样本学习致力于在数据资源稀少的情况下训练出比较好的模型。本文从主动学习、数据增强、半监督学习、领域迁移、集成学习&自训练几个方向介绍了现有的一些方法,并在美团场景进行了实验,效果上也取得了一定的提升。希望能对从事相关研究的同学有所帮助或者启发。

KDD 2021|美团联合多高校提出多任务学习模型,已应用于联名卡获客场景

很多应用通常都需要用定向展示广告来进行获客,对信用卡广告来说,由于用户转化存在较长的链路,持续有效的获客比传统广告更具挑战性。本文结合美团联名信用卡业务中的具体实践,以及今年发表在KDD 2021上的论文,介绍了一种自适应信息迁移多任务(AITM)框架,通过该框架可建模用户多步转化之间的序列依赖关系,并提高端到端获客转化率。希望能对从事相关研究的同学有所帮助或者启发。

ACL 2021 | 一文详解美团技术团队7篇精选论文

ACL是计算语言学和自然语言处理领域最重要的顶级国际会议。据谷歌学术计算语言学刊物指标显示,ACL影响力位列第一,是CCF-A类推荐会议。美团技术团队共有7篇论文(其中6篇长文,1篇短文)被ACL 2021接收,这些论文是美团技术团队在事件抽取、实体识别、意图识别、新槽位发现、无监督句子表示、语义解析、文档检索等自然语言处理任务上的一些前沿探索及应用。

本地生活综合性需求图谱的构建及应用

本地生活综合性需求图谱(GENE: lifestyle GEneral NEeds net),是从用户需求视角出发,深入挖掘本地生活场景下用户多样化的需求,并将其与多行业、多类型的供给形成关联的知识图谱,旨在提升平台供需匹配效率,助力业务增长。本文介绍了本地生活综合性需求图谱的背景、体系设计和涉及的算法实践,并展示了在美团多个业务线的应用落地,希望给大家带来一些帮助或启发。

多业务建模在美团搜索排序中的实践

美团首页的搜索是美团 App 上各类生活服务最大的流量分发入口,每天为数千万的用户提供各种服务。而搜索排序是一个典型的多业务混合排序建模问题,这种多业务场景搜索存在很多挑战。本文聚焦到店商家多业务场景的多业务排序建模优化工作,希望能对从事相关工作的同学有帮助。

常识性概念图谱建设以及在美团场景中的应用

常识性概念图谱,是围绕常识性概念建立的实体以及实体之间的关系,同时侧重美团的场景构建的一类知识图谱。本文介绍了美团常识性概念图谱构建的Schema,图谱建设中遇到的挑战以及建设过程中的算法实践,最后介绍了一些目前常识性概念图谱在业务上的应用。

SIGIR 2021 | 广告系统位置偏差的CTR模型优化方案

美团到店广告平台算法团队基于多年来在广告领域上积累的经验,一直在数据偏差等业界挑战性问题不断进行深入优化与算法创新。在之前分享的《KDD Cup 2020 Debiasing比赛冠军技术方案与广告业务应用》一文中,团队分享了在KDD Cup比赛中取得冠军的选择性偏差以及流行度偏差的解决方案,同时也分享了在广告业务上偏差优化的技术框架。

本文基于这一技术框架进行继续介绍,聚焦于位置偏差问题的最新进展,并详细地介绍团队在美团广告取得显著业务效果的位置偏差CTR模型优化方案,以该方案为基础形成的论文《Deep Position-wise Interaction Network for CTR Prediction》也被国际顶级会议SIGIR 2021录用。

CVPR 2021 | 基于Transformer的端到端视频实例分割方法

实例分割是计算机视觉中的基础问题之一。目前,静态图像中的实例分割业界已经进行了很多的研究,但是对视频的实例分割(Video Instance Segmentation,简称VIS)的研究却相对较少。而真实世界中的摄像头所接收的,无论是自动驾驶背景下车辆实时感知的周围场景,还是网络媒体中的长短视频,大多数都是视频流信息而非纯图像信息。因而研究对视频建模的模型有着十分重要的意义。


本文系美团无人配送团队在CVPR 2021发表的一篇Oral论文的解读。本届CVPR大会共收到7015篇有效投稿,最终共1663篇论文被接收,论文录用率为23.7%,Oral的录用率仅为4%。ACL 2021|美团提出基于对比学习的文本表示模型,效果提升8%

尽管基于BERT的模型在NLP诸多下游任务中取得了成功,直接从BERT导出的句向量表示往往被约束在一个很小的区域内,表现出很高的相似度,因而难以直接用于文本语义匹配。


为解决BERT原生句子表示这种“坍缩”现象,美团NLP中心知识图谱团队提出了基于对比学习的句子表示迁移方法——ConSERT,通过在目标领域的无监督语料上Fine-tune,使模型生成的句子表示与下游任务的数据分布更加适配。在句子语义匹配(STS)任务的实验结果显示,同等设置下ConSERT相比此前的SOTA大幅提升了8%,并且在少样本场景下仍表现出较强的性能提升。

美团外卖美食知识图谱的迭代及应用

本文系外卖美食知识图谱系列的第一篇文章,这篇文章系统地介绍了美团外卖美食知识图谱的标签体系结构,包括菜品类目标签、标准菜品名、美食基础属性(食材、口味、菜系等)和美食业务主题属性(商家招牌、类目经典等)。在技术层面,举例对标签体系的具体构建方法进行介绍,例如基于BERT预训练的分类模型。在应用方面,介绍了美食知识图谱在美团外卖业务的具体应用,包括支撑套餐搭配的菜品表征、提升搜索和商家推荐等业务的用户体验。

外卖商品的标准化建设与应用

外卖菜品命名个性化程度高,为运营分析、召回排序、后台管理等业务带来一定的困难。本文系外卖美食知识图谱系列的第二篇文章,介绍了外卖从零到一建设菜品标准化体系的过程及方案,涉及的主要技术包括NLP领域的实体抽取、文本匹配、关系分类,以及CV领域的图像匹配等。最后,通过标准名在外卖业务中的应用实践,验证了标准名体系建设的价值和意义。

外卖套餐搭配的探索和应用

本文系外卖美食知识图谱系列的第三篇文章,从技术层面我们会介绍外卖套餐搭配的技术方案,包括离线、实时的套餐搭配的迭代,套餐质量评估方案,同时会介绍套餐搭配的业务应用。

智能搜索模型预估框架 Augur 的建设与实践

在过去十年,机器学习在学术界取得了众多的突破,在工业界也有很多应用落地。美团很早就开始探索不同的机器学习模型在搜索场景下的应用,从最开始的线性模型、树模型,再到近两年的深度神经网络、BERT、DQN等,并在实践中也取得了良好的效果与产出。

在美团搜索AI化的过程中,比较核心的两个组件是模型训练平台Poker和在线预估框架Augur。本文主要与大家探讨Augur的设计思路、效果,以及它的优势与不足,最后也简单介绍了一下Poker平台的价值。希望这些内容对大家有所帮助或者启发。

Transformer 在美团搜索排序中的实践

美团搜索是美团 App 连接用户与商家的一种重要方式,而排序策略则是搜索链路的关键环节,对搜索展示效果起着至关重要的效果。目前,美团的搜索排序流程为多层排序,分别是粗排、精排、异构排序等,多层排序的流程主要是为了平衡效果和性能。其中搜索核心精排策略是 DNN 模型,我们始终贴近业务,并且结合先进技术,从特征、模型结构、优化目标角度对排序效果进行了全面的优化。

BERT 在美团搜索核心排序的探索和实践

为进一步优化美团搜索排序结果的深度语义相关性,提升用户体验,搜索与 NLP 部 算法团队从 2019 年底开始基于 BERT 优化美团搜索排序相关性,经过三个月的算法 迭代优化,离线和线上效果均取得一定进展。本文主要介绍探索过程以及实践经验。

美团智能配送系统的运筹优化实战

深入各个产业已经成为互联网目前的主攻方向,线上和线下存在大量复杂的业务约束 和多种多样的决策变量,为运筹优化技术提供了用武之地。作为美团智能配送系统最 核心的技术之一,运筹优化是如何在美团各种业务场景中进行落地的呢?本文根据美 团配送技术团队资深算法专家王圣尧在 2019 年 ArchSummit 全球架构师峰会北京 站上的演讲内容整理而成。

一站式机器学习平台建设实践

本文根据美团配送资深技术专家郑艳伟在 2019 SACC(中国系统架构师大会)上的 演讲内容整理而成,主要介绍了美团配送技术团队在建设一站式机器学习平台过程中 的经验总结和探索,希望对从事此领域的同学有所帮助。

美团搜索中 NER 技术的探索与实践

命名实体识别NER是信息提取、问答系统、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要的地位。

本文介绍了O2O搜索场景下NER任务的特点及技术选型,详述了在实体词典匹配和模型构建方面的探索与实践。

KDD Cup 2020 Debiasing比赛冠军技术方案及在美团的实践

ACM SIGKDD(国际数据挖掘与知识发现大会,简称 KDD)是数据挖掘领域的国际顶级会议。

美团到店广告平台搜索广告算法团队基于自身的业务场景,一直在不断进行前沿技术的深入优化与算法创新。团队的坚强、胡可、漆毅、曲檀、明健、博航、雷军与中科院大学唐兴元共同组建参赛队伍Aister,参加了Debiasing、AutoGraph、Multimodalities Recall三道赛题,最终在Debiasing赛道中获得冠军(1/1895),在AutoGraph赛道中也获得了冠军(1/149),并在Multimodalities Recall赛道中获得了季军(3/1433)。

本文将介绍Debiasing赛题的技术方案,以及团队在广告业务中偏差消除的应用与研究。

KDD Cup 2020 AutoGraph 比赛冠军技术方案及在美团的实践

近些年来,图神经网络(GNN)在广告系统、社交网络、知识图谱甚至生命科学等 各个领域都得到了越来越广泛的应用。广告系统中存在着较为丰富的 User-Ad、Query-Ad、Ad-Ad、Query-Query等结构化关系,搜索广告算法团队成功地将图 表示学习应用于广告系统上,业务效果得到了一定的提升。此外,基于广告系统上图 学习的技术积累,团队在今年 KDD Cup 的 AutoGraph 赛道中斩获了第一名。本文将介绍 AutoGraph 赛题的技术案,以及团队在广告系统中图表示学习的应用与研 究,希望对从事相关研究的同学能够有所帮助或者启发。

KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用

跟其它电商公司一样,美团业务场景中除了文本,还存在图片、动图、视频等多种模 态信息。同时,美团搜索是典型的多模态搜索引擎,召回和排序列表中存在POI、图 片、文本、视频等多种模态结果,如何保证Query和多模态搜索结果的相关性面临 着很大的挑战。鉴于多模态召回赛题(Multimodalities Recall)和美团搜索业务的挑 战比较类似,本着磨炼算法基本功和沉淀相关技术能力的目的,美团搜索与NLP组建团队参与了该项赛事,最终提出的“基于ImageBERT和LXMERT融合的多模 态召回解决方案”最终获得了第二名(2/1433)(KDD Cup2020 Recall 榜单)。本文 将介绍多模态召回赛题的技术方案,以及多模态技术在美团搜索场景中的落地应用。

KDD Cup 2020多模态召回比赛季军方案与搜索业务应用

要处理自然界、生活中多种模态纠缠、互补着的信息,多模态学习是必由之路。随着 互联网交互形态的不断演进,多模态内容如图文、视频等越发丰富;在美团的搜索广算法告系统中,也体现出同样的趋势。搜索广告算法团队利用多模态学习相关技术,已在 业务上取得了不错的效果,并在今年KDD Cup的 Multimodalities Recall赛道获得了第三名。本文将介绍 Multimodailites Recall赛题的技术方案,以及团队在广告业务中多模态 学习相关技术的应用与研究,希望对从事相关研究的同学能够有所帮助或者启发。

ICRA 2020 轨迹预测竞赛冠军的方法总结

行人轨迹预测问题是无人驾驶技术的重要一环,已成为近年来的一项研究热点。在机 器人领域国际顶级会议 ICRA 2020 上,美团无人配送团队在行人轨迹预测竞赛中夺 冠,本文系对该预测方法的一些经验总结,希望能对大家有所帮助或者启发。

CIKM 2020 | 一文详解美团6篇精选论文

CIKM 是信息检索、知识管理和数据库领域中顶级的国际学术会议,自 1992 年以 来,CIKM 成功汇聚上述三个领域的一流研究人员和开发人员,为交流有关信息与知 识管理研究、数据和知识库的最新发展提供了一个国际论坛。大会的目的在于明确未 来知识与信息系统发展将面临的挑战和问题,并通过征集和评估应用性和理论性强的 顶尖研究成果以确定未来的研究方向。

今年的 CIKM 大会原计划 10 月份在爱尔兰的 Galway 举行,由于疫情原因改为在线 举行。美团 AI 平台 / 搜索与 NLP 部 /NLP 中心 / 知识图谱组共有六篇论文(其中 4 篇长文,2 篇短文)被国际会议 CIKM 2020 接收。

这些论文是美团知识图谱组与西安交通大学、中国科学院大学、电子科技大学、中国 人民大学、西安电子科技大学、南洋理工大学等高校院所的科研合作成果,是在多模 态知识图谱、MT-BERT、Graph Embedding 和图谱可解释性等方向上的技术沉淀 和应用。希望这些论文能帮助到更多的同学学习成长。

MT-BERT在文本检索任务中的实践

基于微软大规模真实场景数据的阅读理解数据集MS MARCO,美团搜索与NLP中心提出了一种针对该文本检索任务的BERT算法方案DR-BERT,该方案是第一个在官方评测指标MRR@10上突破0.4的模型。

本文系DR-BERT算法在文本检索任务中的实践分享,希望对从事检索、排序相关研究的同学能够有所启发和帮助。

美团无人车引擎在仿真中的实践

在仿真平台的建设中,团队发现公开道路测试和仿真测试看似相似,实际上差异巨大:在车载环境下,为了确保系统的稳定运行,通常要保证一定资源处于空闲状态;仿真环境则不同,如何高效利用资源,如何实现压榨资源的同时确保仿真结果与路测结果一致成为了关键目标。在 应对这些挑战的过程中,美团提出了无人车引擎的概念,将车载与离线环境的差异隔离起来:功能模块无需任何更改便可以满足两种场景的需要。本文首先会介绍无人车引擎的概念,并以仿真环境面临的挑战为线索介绍美团无人车引擎的核心设计。

美团无人配送 CVPR2020 论文 CenterMask 解读

计算机视觉技术是实现自动驾驶的重要部分,美团无人配送团队长期在该领域进 行着积极的探索。不久前,高精地图组提出的 CenterMask 图像实例分割算法被 CVPR2020 收录,本文将对该方法进行介绍。

CVPR 的全称是 IEEE Conference on Computer Vision and Pattern Recogni- tion,IEEE 国际计算机视觉与模式识别会议,它和 ICCV、ECCV 并称为计算机视 觉领域三大顶会。本届 CVPR 大会共收到 6656 篇投稿,接收 1470 篇,录用率为 22%。

WSDM Cup 2020 检索排序评测任务第一名经验总结

在WSDM 2020国际网络搜索与数据挖掘会议上,由微软研究院发起了一项学术评测任务Citation Intent Recognition,要求参赛者根据论文中对某项科研工作的描述,从论文库中找出与该描述最匹配的Top3论文,本次评测属于经典的文本检索排序任务。

美团搜索与NLP部与国内两所高校组队,提出了一种基于BERT和LightGBM的多模融合检索排序解决方案,拿下了WSDM Cup 2020 Task 1榜单的第一名。本文系获奖作者的经验总结文章。

对话任务中的“语言-视觉”信息融合研究

目标导向的视觉对话是“视觉-语言”交叉领域中一个较新的任务,它要求机器能通过多轮对话完成视觉相关的特定目标。该任务兼具研究意义与应用价值。日前,北京邮电大学王小捷教授团队与美团AI平台NLP中心团队合作,在目标导向的视觉对话任务上的研究论文《Answer-Driven Visual State Estimator for Goal-Oriented Visual Dialogue-commentCZ》被国际多媒体领域顶级会议ACMMM 2020录用。

该论文分享了他们在目标导向视觉对话中的最新进展,即提出了一种响应驱动的视觉状态估计器(Answer-Driven Visual State Estimator,ADVSE)用于融合视觉对话中的对话历史信息和图片信息,其中的聚焦注意力机制(Answer-Driven Focusing Attention,ADFA)能有效强化响应信息,条件视觉信息融合机制(Conditional Visual Information Fusion,CVIF)用于自适应选择全局和差异信息。该估计器不仅可以用于生成问题,还可以用于回答问题。在视觉对话的国际公开数据集GuessWhat?!上的实验结果表明,该模型在问题生成和回答上都取得了当前的领先水平。

ICDM 论文:探索跨会话信息感知的推荐模型

会话推荐(Session-Based Recommendation)是推荐领域的一个子分支 , 美团平 台增长技术部也在该领域不断地进行探索。不久前,该部门提出的跨会话信息感知的 时间卷积神经网络模型(CA-TCN)被国际会议 ICDM NeuRec Workshop 2020 接 收。本文会对论文中的 CA-TCN 模型进行介绍,希望能对从事相关工作的同学有所 帮助或者启发。

自然场景人脸检测技术实践

在自然场景中,人脸检测技术挑战极大,美团AI平台视觉智能中心从底层算法模型和系统架构两个方面进行了改进,开发了高精度人脸检测模型VICFace。目前,该模型已经在美团各业务线使用,高度满足业务的性能需求。

技术解析 | 横纵一体的无人车控制方案

在自动驾驶行业的经典控制方案中,横向控制与纵向控制的求解是模型解耦的独立算法。这种“横纵分离”的控制方案虽然可行,但显然不符合人类的驾驶方式,也不符合横向、纵向紧密联系这一客观事实。本文介绍了一种横纵一体的无人车控制实现方案,在描述车辆横纵耦合、考虑横纵联合约束、统筹横纵跟踪性能方面更具优势。

持续更新中......


----------  END  ----------

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存