查看原文
其他

解读 | 盖亚青年学者科研基金:机器学习与深度学习篇

孟一平 滴滴科技合作 2021-09-05

点击上方“蓝色字体”,选择“置顶公众号

精彩内容,即刻送达


盖亚青年学者科研基金

中国计算机学会(CCF)-滴滴大数据联合实验室发布“盖亚青年学者科研基金”。本项目旨在积极支持青年学者开展前沿科研工作,通过良好的合作机制,助力产学研发展。依托滴滴出行平台,为广大青年学者提供最真实的业务场景,脱敏数据与计算资源,促进高质量学术成果的产出,加速研究成果的产业落地与应用。


为了进一步加速产学研一体化深度融合,本年度“盖亚青年学者科研基金”在延续开放数据资源、计算资源的基础上,深入挖掘业务场景,聚焦研究话题。此次发布“盖亚青年学者科研基金”涵含机器学习与深度学习,计算机视觉,地理信息技术,运筹学与经济学,以及开放性课题等多个研究方向的真实业务场景,通过把工业界的挑战与场景开放给学界,希望和青年学者共同发展与成长。


本年度“盖亚青年学者科研基金”预申报书提交截止日期为11月22日。请您关注项目关键时间节点,选定申报命题后提前完成申报工作。项目官方网址:https://outreach.didichuxing.com/youthfunding


本期我们将介绍机器学习与深度学习方向课题,希望大家可以找到与自己研究方向匹配的研究方向。


机器学习、深度学习专题
课题一:基于深度强化学习的路线生成决策引擎

研究方向

深度强化学习,时空感知决策,路径规划

课题背景

在滴滴出行业务场景,分单依赖的司机到乘客的接驾路线,和乘客上车点到终点的送驾路线等,这些路线质量是直接影响整个出行平台体验和效率的重要因素之一,滴滴出行场景对路线的需求更加复杂,需要基于司机、乘客、平台三方博弈给出最佳路线。


传统的路线规划,被定义为在大规模复杂的路网数据中寻路的图论问题,常用的图论算法有Dijkstra,A*,CH算法,这种方法虽然一定程度上可以得到高质量路线,但是这些算法的固定的启发式代价函数,和高度依赖的边代价体系,都难以在整个路线搜索过程中充分利用丰富有效的上下文环境信息,而单纯基于深度神经网络的监督学习虽然可以有效提取环境信息,仅仅能用在基于路线候选集的路线选择上,无法充分利用司机轨迹等上下午文信息,此外监督学习缺乏有效的探索能力,倾向给出大家常走的路线,无法准确满足更多变的环境下的路线需求。


深度强化学习的范式作为一种有效的基于用户与系统交互过程建模和最大化过程累积收益的学习方法,可以充分利用司机的订单轨迹等上下文数据,融合图论路线搜索算法和深度学习的优点,给出更优雅和更合理的路线,这能持续有效地提高预估价格,分单,接送驾的体验和效率。


综合以上,滴滴业务场景的路线生成与决策还需要考虑出行多个环节的多样性需求,基于深度强化学习路线生成决策引擎系统能够对变幻莫测的用户行为以及瞬息万变的外部环境进行完整地建模,滴滴拥有的大规模的车流轨迹数据以及司乘交互信息、订单信息也是完成引擎构建的基石。

研究目标

目标1 基于动态环境的时空代价预测模型

路线生成需要重点考虑的核心要素是不断变化的时空环境,这也是衡量路线起终点之间代价的重要组成部分,获取准确的环境信息,并通过建模,提取丰富准确的环境的信息,提高预测准确率。借助神经网络模型有效学习环境信息,进而得到准确的代价函数。


目标2 模拟环境构建

路线生成过程中,获取实时上下文环境信息,构建准确有效的环境反馈信息,包括实时轨迹流信息、路况信息、用户位置信息、司机和乘客的实时行为信息等。实现一种合理的环境信息表达方式,确保代价预测模型基于准确的环境信息不断更新模型效果。


目标3 实现基于代价函数的高效搜索算法

结合课题一和课题二的产出,对问题建模后,定义合理的价值函数和奖励函数,基于全路网进行两点之间路线搜索,设计合理高效的搜索算法,有效缩小搜索空间,兼顾效果和效率。

参考文献

1. Human-level control through deep reinforcement learning.

Nature 518, 7540 (2015), 529.

2. Mastering the game of Go with deep neural networks and tree search. Nature 529, 7587

(2016), 484.

3. Mastering the game of Go without human knowledge. Nature 550(7676):354-359

4. Empowering A∗ Search Algorithms with Neural Networks for Personalized Route Recommendation

5. Monte-Carlo Beam Search

6. Parallel Monte Carlo Tree Search on GPU

7. Finding time period- based most frequent path in big trajectory data

8. Constructing popular routes from uncertain trajectories.


课题二:融合地理画像和用户行为的上车点推荐

研究方向

深度学习,推荐系统,计算机视觉

课题背景

上车点推荐是滴滴业务场景中关键的一环。在打车的业务场景下,上车点推荐是否合理直接影响到司乘碰面的难易,影响和制约了司机的接单效率,乘客乘车的体验口碑。而上车点推荐引擎历经多年的迭代,仍存在一些难解的问题,一是过于依赖用户历史行为,地理画像特征薄弱,导致在非热门场景推荐不合理率较高;二是随着业务发展,上车点推荐衡量指标不仅要考虑发单后用户体验,也要兼顾发单成本、司机违停成本、接驾效率等指标,原有的建模方式面临挑战。


乘客定位周边的环境刻画与上车点的推荐密切相关,例如乘客到达成本,司机是否可停靠等。由于真实物理世界的复杂性,如天桥、栅栏、围墙、地下通道、违停摄像装置等的存在,这些信息的采集和表达有很大的困难,现有推荐引擎主要依赖历史行为特征。而在非热门城市或场景,用户历史打车行为稀疏,行为特征置信度不够,所以通常只能基于乘客定位和上车点间的球面距离进行推荐。球面距离不能真正刻画用户的真实步行代价,在冷门场景推荐不合理率较高。


如今,深度学习越来越强大,利用原始地理拓扑信息,包括路网/道路属性特征/POI等,融合用户的行为特征,通过复杂的深度网络的表示学习,可以表征出地理环境对打车的影响。在NLP和计算机视觉等领域,特征表示共享的多目标优化也取得了很大的突破。基于这些技术,在热门场景用户打车的行为可以迁移到冷门的场景,同时兼顾多个优化目标的建模方法,可以提升上车点推荐的合理性。


本项目旨在利用深度学习技术,优化地理环境建模和多目标优化的推荐,目标是实现融合用户行为和地理环境,多目标优化的推荐引擎,提升上车点推荐的合理率,改善司乘接驾环节的体验。

研究目标

目标1 融合地理画像的推荐引擎

地理画像要解决的问题是,利用用户定位位置周边的路网拓扑/道路属性/POI信息,刻画用户打车行为的偏好。这个过程中涉及的问题包括:冷门场景定点率不高,如何选择训练样本?如何利用选择特征刻画地理场景?网络结构如何选型?如何把地理和行为特征融合?如何达到提升定点率的效果?


目标2 基于多目标优化的推荐

多目标优化要解决的问题是:上车点推荐中,评价司乘体验的指标是多元的,定点距离,异常通话,是否跨路以及发单的操作成本。整个过程中涉及的问题包括:部分优化目标如通话的不可完全观测的隐式表示,如何将多个优化目标放到统一的损失函数中,进行合理的优化,达到用户体验的最优。


项目中产出的方法具备较强的实用性,包括以下几个方面:• 可行性——该方法是可以落地上线的,离线和在线的性能符合要求• 创新性——该方法或技术在出行领域上独创和领先


课题三:网约车司乘纠纷判责研究

 研究方向

在线纠纷判决,多任务学习,深度学习,NLP,意图识别,法律知识图谱,模型可解释性

课题背景

滴滴作为全球领先的网约车以及智慧交通平台,已经在深刻改变着人们的出行乃至生活方式。但是在网约车平台上也出现了一些不美好的现象,比如:乘客投诉司机、乘客/司机取消订单,我们统称这些投诉/取消为司乘纠纷。这些纠纷对乘客有体验的损伤,因此平台会对司机的服务进行管控。
但是发生纠纷的原因可能很多,背后的事实也可能不同,司机/乘客/平台都可能有责任,因此在对司机管控之前需要对责任归属方进行判责,判责可以由人工/机器来实现。机器和人工判责需要综合考虑时空信息、司/乘/平台三方交互、订单实时场景、司乘历史行为等作出综合性的决策,与平台规则相对应,并进行合理的解释。

研究目标

通过(不仅限于)以下方式,提升判责的准确率和可解释性:1、 标注数据扩充/清洗:对可能的弱标记数据进行清洗/提纯,或者进行端到端的建模;2、 连续行为建模:可能包括订单从接单到结束、司机从出车到收车、一个周期内的司机和乘客的订单投诉记录等等;3、 司乘意图理解:基于司机对乘客投诉、乘客对司机投诉、司乘沟通对话,理解司机和乘客的意图;4、 判责可解释性:判责对应的原因、认定的事实说明,与平台规则的对应关系。

参考文献

Zhou X, Zhang Y, Liu X, et al. Legal Intelligence for E-commerce: Multi-task Learning byLeveraging Multi-view Dispute Representation[C]//Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2019: 315-324.


注意

1.更多项目信息,请关注主题研究计划官方主页:

https://outreach.didichuxing.com/youthfunding

2.项目组邮件通知:

gaia@didichuxing.com 

3.学术合作官方微信账号:

滴滴科技合作



相关阅读

CNCC 2019 | CCF-滴滴大数据联合实验室2岁了

CNCC 2019 | 观点篇:未来,智能驾驶将驶向何方?


编辑 | 贺贺


阅读原文,

了解关于青年学者科研基金更多信息!


视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存