RLCN

ITS等国际期刊和ICML/NeurlPS/IJCAI/AAMAS/AAAI等国际会议上发表学术论文100余篇，主持科研项目20余项，获最佳论文奖3次。担任SCI期刊IEICE

2023年10月17日

还可以在其他的setting下，比如说可以把语言模型当做一个策略网络去执行一些决策的任务，它可能从环境中做一些多步的决策之后获得一些反馈，我可以拿这些反馈，通过一些强化学习的算法，进一步去提高

2023年6月25日

的优化）还有芯片设计（比如布局布线）也是类似的问题，很难构造一个高效且真实的仿真器。以自动驾驶为例，目前学术界和业界做基于强化学习的自动驾驶工作非常多，但是大部分都是停留在仿真器阶段，或者简单的实车

2023年3月21日

公众号的一个栏目，以采访的形式记录学者对科研工作的思考。导读本篇推文主要介绍对南洋理工大学计算机科学与工程学院安波副教授的采访，按照实验室介绍、个人经历、学术见解、福利时间分为

2021年9月9日

的联系是另外有一个希腊人，就是我导师和我的师弟，建了一些联系，但是进一步的推动其实是在离散不动点上。那么我们后来主要的工作就是通过这两个联系推动了这件事情的最终证明。我们后面也借助不动点在比如说

RLCN -

2021年6月16日