解读 | 盖亚青年学者科研基金:机器学习与深度学习篇
点击上方“蓝色字体”,选择“置顶公众号”
精彩内容,即刻送达
盖亚青年学者科研基金
研究方向
深度强化学习,时空感知决策,路径规划
课题背景
在滴滴出行业务场景,分单依赖的司机到乘客的接驾路线,和乘客上车点到终点的送驾路线等,这些路线质量是直接影响整个出行平台体验和效率的重要因素之一,滴滴出行场景对路线的需求更加复杂,需要基于司机、乘客、平台三方博弈给出最佳路线。研究目标
目标1 基于动态环境的时空代价预测模型
路线生成需要重点考虑的核心要素是不断变化的时空环境,这也是衡量路线起终点之间代价的重要组成部分,获取准确的环境信息,并通过建模,提取丰富准确的环境的信息,提高预测准确率。借助神经网络模型有效学习环境信息,进而得到准确的代价函数。目标2 模拟环境构建
路线生成过程中,获取实时上下文环境信息,构建准确有效的环境反馈信息,包括实时轨迹流信息、路况信息、用户位置信息、司机和乘客的实时行为信息等。实现一种合理的环境信息表达方式,确保代价预测模型基于准确的环境信息不断更新模型效果。目标3 实现基于代价函数的高效搜索算法
结合课题一和课题二的产出,对问题建模后,定义合理的价值函数和奖励函数,基于全路网进行两点之间路线搜索,设计合理高效的搜索算法,有效缩小搜索空间,兼顾效果和效率。参考文献
1. Human-level control through deep reinforcement learning.
Nature 518, 7540 (2015), 529.
2. Mastering the game of Go with deep neural networks and tree search. Nature 529, 7587
(2016), 484.
3. Mastering the game of Go without human knowledge. Nature 550(7676):354-359
4. Empowering A∗ Search Algorithms with Neural Networks for Personalized Route Recommendation
5. Monte-Carlo Beam Search
6. Parallel Monte Carlo Tree Search on GPU
7. Finding time period- based most frequent path in big trajectory data
8. Constructing popular routes from uncertain trajectories.
课题二:融合地理画像和用户行为的上车点推荐
研究方向
深度学习,推荐系统,计算机视觉
课题背景
上车点推荐是滴滴业务场景中关键的一环。在打车的业务场景下,上车点推荐是否合理直接影响到司乘碰面的难易,影响和制约了司机的接单效率,乘客乘车的体验口碑。而上车点推荐引擎历经多年的迭代,仍存在一些难解的问题,一是过于依赖用户历史行为,地理画像特征薄弱,导致在非热门场景推荐不合理率较高;二是随着业务发展,上车点推荐衡量指标不仅要考虑发单后用户体验,也要兼顾发单成本、司机违停成本、接驾效率等指标,原有的建模方式面临挑战。研究目标
目标1 融合地理画像的推荐引擎
地理画像要解决的问题是,利用用户定位位置周边的路网拓扑/道路属性/POI信息,刻画用户打车行为的偏好。这个过程中涉及的问题包括:冷门场景定点率不高,如何选择训练样本?如何利用选择特征刻画地理场景?网络结构如何选型?如何把地理和行为特征融合?如何达到提升定点率的效果?目标2 基于多目标优化的推荐
多目标优化要解决的问题是:上车点推荐中,评价司乘体验的指标是多元的,定点距离,异常通话,是否跨路以及发单的操作成本。整个过程中涉及的问题包括:部分优化目标如通话的不可完全观测的隐式表示,如何将多个优化目标放到统一的损失函数中,进行合理的优化,达到用户体验的最优。课题三:网约车司乘纠纷判责研究
研究方向
在线纠纷判决,多任务学习,深度学习,NLP,意图识别,法律知识图谱,模型可解释性课题背景
滴滴作为全球领先的网约车以及智慧交通平台,已经在深刻改变着人们的出行乃至生活方式。但是在网约车平台上也出现了一些不美好的现象,比如:乘客投诉司机、乘客/司机取消订单,我们统称这些投诉/取消为司乘纠纷。这些纠纷对乘客有体验的损伤,因此平台会对司机的服务进行管控。但是发生纠纷的原因可能很多,背后的事实也可能不同,司机/乘客/平台都可能有责任,因此在对司机管控之前需要对责任归属方进行判责,判责可以由人工/机器来实现。机器和人工判责需要综合考虑时空信息、司/乘/平台三方交互、订单实时场景、司乘历史行为等作出综合性的决策,与平台规则相对应,并进行合理的解释。
研究目标
通过(不仅限于)以下方式,提升判责的准确率和可解释性:1、 标注数据扩充/清洗:对可能的弱标记数据进行清洗/提纯,或者进行端到端的建模;2、 连续行为建模:可能包括订单从接单到结束、司机从出车到收车、一个周期内的司机和乘客的订单投诉记录等等;3、 司乘意图理解:基于司机对乘客投诉、乘客对司机投诉、司乘沟通对话,理解司机和乘客的意图;4、 判责可解释性:判责对应的原因、认定的事实说明,与平台规则的对应关系。参考文献
Zhou X, Zhang Y, Liu X, et al. Legal Intelligence for E-commerce: Multi-task Learning byLeveraging Multi-view Dispute Representation[C]//Proceedings of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2019: 315-324.
注意
1.更多项目信息,请关注主题研究计划官方主页:
https://outreach.didichuxing.com/youthfunding
2.项目组邮件通知:
gaia@didichuxing.com
3.学术合作官方微信账号:
滴滴科技合作
编辑 | 贺贺