查看原文
其他

【精彩论文】基于RG-DDPG的直流微网能量管理策略

中国电力 中国电力 2023-12-18






观点凝练





摘要:针对分布式能源的随机性和间歇性给直流微网能量管理带来的巨大挑战,提出一种基于奖励指导深度确定性策略梯度(reward guidance deep deterministic policy gradient,RG-DDPG)的直流微网能量管理策略。该策略将直流微网的优化运行描述为一个马尔科夫决策过程,利用智能体与直流微网环境间的持续交互,自适应地学习能量管理决策,实现直流微网能量的优化管理。在策略训练过程中,采用基于时序差分误差(temporal difference error,TD-error)的优先经验回放机制减少RG-DDPG在直流微网运行环境中学习、探索的随机性和盲目性,提升所提能量优化管理策略的收敛速度。同时,在训练回合间利用累计奖励的大小构造直流微网能量管理的优秀回合集,加强RG-DDPG智能体在训练回合间的联系,最大化利用优秀回合的训练价值。算例仿真结果表明:所提策略能够实现直流微网内能量的合理分配。相较于基于深度Q网络(deep Q-network,DQN)和粒子群算法(particle swarm optimization,PSO)的能量管理策略,所提策略能使直流微网日平均运行成本分别降低11.16%和7.10%。
结论:针对直流微网的优化运行问题,本文提出一种基于RG-DDPG的直流微网能量管理策略。该策略将负荷和储能电池视为智能体构建直流微网能量管理的马尔科夫决策过程,通过对智能体进行训练实现所建直流微网模型的最优能量管理,主要结论如下。

1)提出基于TD-error的经验回放机制,采用经验池回放的方式,选择性重复使用历史数据以减少数据间的相关性,加快智能体的学习和训练过程。

2)提出基于累计奖励的优秀回合集模块,通过概率从优秀回合集中抽取优秀回合训练的方式最大化优秀回合的学习价值,加快智能体的收敛速度。

3)避免了DQN动作和状态空间离散化带来的信息缺失问题及PSO算法易陷入局部最优的问题,能够对直流微网内各主体的能量进行合理调度,进而提高直流微网运行的经济性。


引文信息

李建标, 陈建福, 高滢, 等. 基于RG-DDPG的直流微网能量管理策略[J]. 中国电力, 2023, 56(7): 85-94.LI Jianbiao, CHEN Jianfu, GAO Ying, et al. Strategy for dc microgrid energy management based on RG-DDPG[J]. Electric Power, 2023, 56(7): 85-94.


欢迎点击文后“阅读原文”跳转期刊官网,获取更多信息!





 往期回顾 


《中国电力》2023年第10期目录【精彩论文】基于语义信息距离解耦的变电运维多类别缺陷图像检测【精彩论文】面向电网调控信息智能检索的知识图谱构建及应用【精彩论文】基于K-means和BPNN的风机状态识别【精彩论文】考虑馈线交叉规避的海上风电场海缆路径优化◀ “面向现代智慧配电网的二次系统规划”专栏征稿启事◀ “面向电力基础设施的跨域攻击威胁与防御”专栏征稿启事◀ “面向新型电力系统的城市电网关键技术”专题征稿启事【征稿启事】“分布式智能电网的规划、运行和电力交易”专栏征稿启事

编辑:于静茹
校对:王文诗

审核:方彤

声明
根据国家版权局最新规定,纸媒、网站、微博、微信公众号转载、摘编《中国电力》编辑部的作品,转载时要包含本微信号名称、二维码等关键信息,在文首注明《中国电力》原创。个人请按本微信原文转发、分享。欢迎大家转载分享。
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存