查看原文
其他

KDD 2019 | 从上千篇投稿脱颖而出,这三篇论文你不可错过!

点击上方“滴滴科技合作”,选择“置顶公众号

精彩资讯,即刻送达



一年一度的KDD将于8月4日至8日在美国阿拉斯加安克雷奇市举行。作为数据挖掘的国际顶级会议,今年KDD吸引了全球范围内约1900篇论文投递,ADS track收到约700篇论文投递,其中入选45篇Oral论文、100篇Poster论文;Research track收到约1200篇论文投稿,其中入选110篇Oral论文、60篇Poster论文,接收率仅为14%。


在过去的几年中,滴滴多次亮相KDD,包括KDD 2016、KDD 2017KDD 2018 (可直接点击链接阅读),持续就交通领域科学问题与学界进行交流,这对滴滴有两方面的意义,一是推进人工智能最前沿研究的发展,同时紧密地把学术与应用场景结合起来;而滴滴拥有海量数据和独特的应用场景,这些技术从研究到落地有助于改善城市交通出行、提速智慧交通的进程。


本文简要介绍滴滴入选KDD 2019的三篇Oral论文,给大家分享数据挖掘+人工智能是如何进行订单指派、智能客服领域的应用、模仿学习和GAN在环境重构的探索。


01

基于深度价值网络的多司机订单指派模型

A Deep Value-network Based Approach for Multi-Driver Order Dispatching



本文提出一种新的基于深度强化学习与半马尔科夫决策过程的智能派单应用,在同时考虑时间与空间的长期优化目标的基础上利用深度神经网络进行更准确有效的价值估计。


针对派单应用中的关键时空及情景式特征输入,我们专门设计了全新的多精度分布式状态表达模块(Hierarchical Geocoding with Cerebellar Embedding),能自适应于训练数据时空上的分布特性,增强泛化以及学习有效性。进一步提出在价值迭代训练中使用Lipschitz正则化来约束价值函数的Lipschitz常数。我们发现这种正则化能有效去除价值估计中的异常估计,并且能增强价值迭代稳定性加快MDP策略收敛。最后,我们提出了专门针对派单的迁移学习方法,能有效提升多城市的训练学习任务。


系统的离线模拟实验以及在滴滴平台的在线AB实验证明,我们提出的这种基于深度强化学习的派单算法相比现有最好的方法能进一步显著提升平台各项效率及用户体验指标包括应答率,完单率以及司机收入。


「滴滴还将在KDD期间作特邀演讲教程(Tutorial) Deep RL with Applications in Transportation,分享强化学习在交通领域的最新进展和技术探索。」



02

客服对话摘要自动生成

Automatic Dialogue Summary Generation for Customer Service



滴滴客服每天需要处理大量进线咨询,对于每一个进线咨询,客服都需要记录工单摘要,以方便其它客服以及客服质检同学了解用户的问题,客服的处理方案以及用户的反馈等信息。纪录工单摘要占用了客服大量的时间,因此自动生成工单摘要可以大大提高客服工作效率。摘要需要有完整性,逻辑性与正确性,之前的研究很少考虑这些要求。


本文提出了引入要点序列这个辅助信息来解决这些问题。要点序列描述了摘要的逻辑关系,并涵盖关键信息。对于训练数据,我们利用基于规则从摘要中提取要点序列,在并训练过程中采用多任务学习的方法,让模型同时学习如何生成要点序列与工单摘要。对于测试数据,模型首先生成要点序列,然后在其指导下生成相应的摘要序列。我们设计Leader-Writer网络来完成这个工作。


在滴滴数据集上的实验表明,Leader-Writer网络,不仅在BLEU与ROUGE-L得分上优于其它模型,并且生成的摘要在逻辑性,完整性以及正确性上表现更优。


03

基于强化学习的隐藏混淆因子的环境重构

Environment Reconstruction with Hidden Confounders for Reinforcement Learning based Recommendation


环境重构是在现实世界中应用强化学习算法很重要的一种手段。有了重构的环境,在训练策略的时候可以避免和真实环境交互产生的学习成本和减少不稳定因素。但是真实世界中的环境和应用往往比较复杂而难以模拟,并且还有很多不可见的数据和混淆因子(confounder)的存在,来共同影响决策的效果。


滴滴AI Labs与南京大学周志华团队俞扬研究组合作,联合提出了一种基于模仿学习和对抗生成网络(GAN)的方法(DEMER),考虑到不可见混淆因子存在的情况下,来重构现实世界中的应用环境。该方法把不可见的混淆因子视为一种隐藏策略,把环境和决策者视为另外两个智能体,重构三个智能体之间的相互影响和联系,借助模仿学习和对抗生成网络的方法来重构环境以达到仿真的效果。


在滴滴平台的真实场景进行了验证,将该算法用于司机活动推荐的场景,来提升司机的收入和优化平台的效率。通过大量离线和在线AB测试表明,本文提出的框架相比于现有最好的方法有了显著提升。



小编注:目前KDD官网还未提供论文下载,未来我们将邀请作者为大家更为详尽地解析论文思路和研究成果。敬请期待!


相关阅读

数据挖掘前沿追踪:滴滴在KDD 2017

滴滴KDD分享AI新成果 盖亚数据开放计划扩大


编辑 | 洛羽

视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存