548页MIT强化学习教程，收藏备用【PDF下载】 | 自由微信 | FreeWeChat

反向激励，在加速这个社会的黑化

官媒发声：反对调休的声音不能装聋作哑！这不是放假，是“假放”（五一假期）

券商大佬卸任，曾任多家券商及公募基金一把手！

有些秘密注定只被少数人知道.....2024我们不再错过

豪放女乘客扯掉裤子当场“硬要”，的哥乖乖“束手就擒”……

548页MIT强化学习教程，收藏备用【PDF下载】

机器学习算法与Python学习 2019-06-11

本书分为三个部分。

第一部分根据马尔可夫决策过程定义强化学习问题。
第二部分提供了基本的解决方案：动态规划，蒙特卡罗方法和时差学习。
第三部分提出了解决方法的统一视图，并结合了人工神经网络，资格跟踪和规划。

最后两章介绍了案例研究，并考虑了强化学习的未来。

第二版的网站：

http://incompleteideas.net/book/the-book-2nd.html

python实现的代码:

https://github.com/ShangtongZhang/reinforcement-learning-an-introduction

课程资料：

http://incompleteideas.net/609%20dropbox/

完整教程下载

关注公众号，后台回复

20181011

今日推荐

《强化学习》

您可能也对以下帖子感兴趣

文章有问题？点此查看未经处理的缓存