其他
一文看懂什么是强化学习?(基本概念+应用场景+主流算法+案例)
导读 本文将深入探讨强化学习的相关内容。
主要内容包括:1. 强化学习算法
2. 强化学习经典算法—DQN 算法
3. 强化学习推荐算法提升短视频留存
4. 强化学习未来挑战
黄世宇博士 前第四范式强化学习科学家
编辑整理|王振甲
内容校对|李瑶
出品社区|DataFun
01
2. 基础数学模型:马尔可夫决策过程(MDP)
3. 强化学习的应用
强化学习经典算法—DQN 算法
强化学习推荐算法提升短视频留存
1. 短视频推荐中的用户留存
2. 基于无限域请求的马尔可夫决策过程
3. 用户留存算法的强化学习
4. 离线和在线实验
强化学习未来挑战
分享嘉宾
INTRODUCTION
蔡庆芃 博士 快手高级算法专家
黄世宇 博士 前第四范式强化学习科学家
往期推荐
字节跳动基于 DataLeap 的 DataOps 实践
大模型分布式训练的第四种境界
OPPO大数据AI湖仓一体实践
哪里人才紧缺,哪里就有大模型
阿里云 DataWorks 湖仓融合数据治理与大模型应用探索
阿里通用多模态大模型 OFA 研究实践
国内卷废了?生成式AI+出海了解下!
袋鼠云在实时数据湖上的探索实践
58用户画像数据仓库建设实践
点个在看你最好看
SPRING HAS ARRIVED