强化学习圣经:《强化学习导论》第二版(附PDF下载)
今天推荐 Richard S. Sutton 教授与 Andrew G. Barto 教授合著的《强化学习导论(第二版)》, Richard S. Sutton 就职于iCORE大学计算机科学系,是强化学习领域的专家,其在强化学习领域的著作“Reinforcement Learning”一直是认为是强化学习方面的圣经,本书官网为:
http://www.incompleteideas.net/book/the-book.html
可以在官网直接下载该书第二版PDF电子版及相关资料,总计有80多M,548页,需要的同学也可以按照以下方式获取:
关注下方公众号,后台回复 RLBook 即可获取百度网盘地址:
该书有一份对应的 Python 代码实现,感兴趣的同学可以参考(GitHub链接):
https://github.com/ShangtongZhang/reinforcement-learning-an-introduction
作者介绍
Richard S. Sutton是加拿大的一个计算机科学家,当前任职于iCORE大学计算机科学系。Sutton是强化学习领域巨擘,在temporal difference learning, policy gradient methods, the Dyna architecture等方面都有重大贡献。自2003年起,Sutton就出任iCORE大学计算机科学系的教授,在这里他领导了强化学习和人工智能实验室(RLAI)。
https://www.ualberta.ca/science/about-us/contact-us/faculty-directory/rich-sutton
Andrew Barto 是Massachusetts大学Amherst分校的教授, 已于2012年退休.
退休前, 他是Massachusetts大学Amherst分校自治学习实验室主任.
目前, 他是Massachusetts大学神经科学和行为项目的准会员, Neural Computation 副主编, Machine Learning Research杂志顾问, Adaptive Behavior的编辑.
Barto教授是美国科学促进会会员,IEEE Fellow, 以及神经科学学会会员.
他因强化学习领域的贡献而获得2004年IEEE神经网络协会先锋奖, IJCAI-17杰出研究奖.
他在期刊,书籍,会议和研讨会中发表论文一百多篇。他与Richard Sutton共同编写了 "Reinforcement Learning: An Introduction," MIT Press 1998,迄今已收到超过25,000次引用。本书的第二版已发布。
履历:
Massachusetts大学的计算机科学系主任----- 2007-2011年
Massachusetts大学的计算机科学系教授----- 1991年
Massachusetts大学的计算机科学系副教授----- 1982年
Massachusetts大学的计算机科学系博士后----- 1977年
获Michigan大学数学专业学士学位----- 1970年
获Michigan大学计算机科学专业博士学位----- 1975年
http://www-all.cs.umass.edu/~barto/