其他
深度强化学习的风吹到了电网
导读本文将介绍安全强化学习(SafeRL),及其在电网调度中的应用。
主要内容包括以下几大部分:1. SafeRL 介绍
2. 电网调度介绍
3. SafeRL 在电网调度中的应用
4. 数据与数学双决策引擎开发平台介绍
5. 问答环节
分享嘉宾|杨超 阿里巴巴达摩院 高级算法专家
编辑整理|王琳娜
内容校对|李瑶
出品社区|DataFun
SafeRL 介绍
1. 深度强化学习(DRL)
强化学习:通过试错的方式去寻找最优策略; 深度学习:能够处理高维数据,有很好的感知能力,近似最优的 function; Markov Decision Process (MDP):通过数学化的形式表示,最终找到平均收益最大的策略。
2. 安全强化学习
电网调度介绍
SafeRL 在电网调度中的应用
每一时刻 state-wise 做到安全; Worst-case 下做到安全; 在线部署时做到 safety; 提升训练效率。
1. State-wise 安全性
2. Worst-case
3. 在线部署中保障安全
4. 提升训练效率
数据与数学双决策引擎开发平台介绍
问答环节
分享嘉宾
INTRODUCTION
杨超
阿里巴巴达摩院
高级算法专家
杨超,现任阿里巴巴达摩院决策智能实验室高级算法专家,过往工作包括深度学习、强化学习、数值计算等技术的研发与应用,曾于 2021 年带队获得过国家电网举办的电力调度 AI 大赛冠军,目前负责决策智能实验室强化学习相关技术的研发,以及数学与数据双决策引擎在电网调度中的落地应用。
往期优质文章推荐
往期推荐
DataFun
点个在看你最好看