查看原文
其他

548页MIT强化学习教程,收藏备用【PDF下载】

本书分为三个部分。

  • 第一部分根据马尔可夫决策过程定义强化学习问题。

  • 第二部分提供了基本的解决方案:动态规划,蒙特卡罗方法和时差学习。

  • 第三部分提出了解决方法的统一视图,并结合了人工神经网络,资格跟踪和规划。

最后两章介绍了案例研究,并考虑了强化学习的未来。


第二版的网站:

http://incompleteideas.net/book/the-book-2nd.html


python实现的代码:

https://github.com/ShangtongZhang/reinforcement-learning-an-introduction


课程资料:

http://incompleteideas.net/609%20dropbox/


完整教程下载

关注公众号,后台回复

20181011



今日推荐

《强化学习》

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存