问国家卫健委和国务院联防联控机制四个问题

这样的标准上海市疫情防控工作领导小组也好意思发布出来?

伊朗著名美女明星、奥斯卡影后被捕!

母子乱伦:和儿子做了,我该怎么办?

阳了后,14亿人民才发现集体被忽悠了!

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

【AAAI2023】基于序图的因果结构强化学习

专知 2022-11-28


学习描述观测数据因果关系的有向无环图(DAG)是一项非常具有挑战性但又非常重要的任务。由于观测数据的数量和质量有限,以及因果图的不可识别性,几乎不可能推断出单个精确的DAG。一些方法通过马尔可夫链蒙特卡罗(MCMC)逼近DAG的后验分布来探索DAG空间,但DAG空间具有超指数增长的性质,准确刻画DAG空间的整体分布是非常棘手的。本文提出了一种基于序图的因果结构强化学习(RCL-OG)方法,该方法使用序图代替MCMC来建模不同的DAG拓扑顺序,从而减小问题的规模。RCLOG首先用一种新的奖励机制定义强化学习,以效能的方式近似排序的后验分布,并使用深度Q学习在节点之间更新和传递奖励。其次,得到顺序图上节点的概率转移模型,并计算不同顺序的后验概率。这样我们就可以在这个模型上进行抽样,得到高概率的排序。在综合数据集和基准数据集上的实验表明,RCL-OG提供了精确的后验概率逼近,并取得了比Baseline因果发现算法更好的结果。

https://www.zhuanzhi.ai/paper/c90518730875122693a9e8cdefab601a


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“RCSL” 就可以获取【AAAI2023】基于序图的因果结构强化学习》专知下载链接

                       
专知,专业可信的人工智能知识分发,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“阅读原文”,了解使用专知,查看获取100000+AI主题知识资料

文章有问题?点此查看未经处理的缓存