河南南阳收割机被堵事件:官员缺德,祸患无穷

极目新闻领导公开“记者毕节采访被打”细节:他们打人后擦去指纹

突发!员工跳楼!只拿低保工资!央企设计院集体罢工!

退休后的温家宝

突发!北京某院集体罢工!

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

北大张志华教授强化学习课程分享

统计之都 2023-01-25

强化学习(Reinforcement Learning)是人工智能的一个重要领域,是一个代表性的机器学习方法。它同时又和马尔可夫决策过程(Markov Decision Processes) 和动态规划(Dynamic Programming)紧密相关。这门课程内容主要包括线性与非线性规划、马尔可夫决策过程、最优控制和随机规划等。


课程视频链接:http://resource.pku.edu.cn/index.php?r=course/detail&id=303(点击“阅读全文”,进入课程视频链接)


(此课程视频版权属于讲授者,他人只能用作个人学习目的,不得用作商业相关用途。其他网站转载需要事先获得授权。)

文章有问题?点此查看未经处理的缓存