工劳快讯:汕尾美团骑手罢工取得阶段性胜利

记者调查泉州欣佳酒店倒塌曝惊人“案中案”:曾是卖淫场所,50名老板、官员卷入其中

退出中国市场的著名外企名单

去泰国看了一场“成人秀”,画面尴尬到让人窒息.....

【少儿禁】马建《亮出你的舌苔或空空荡荡》

生成图片,分享到微信朋友圈

自由微信安卓APP发布,立即下载! | 提交文章网址
查看原文

合作竞争公共物品博弈的无人机集群动态资源分配

SCIS 中国科学信息科学 2022-09-25


王浩淼, 段海滨, 魏晨. 基于合作竞争公共物品博弈的无人机集群动态资源分配. 中国科学: 信息科学, DOI: 10.1360/SSI-2021-0416


研究意义


随着作战环境信息化、网络化和智能化的不断发展, 为实现更为复杂的任务指标, 以无人机集群为基础的多无人机协同控制技术引起了广泛关注. 未来战场的高动态性和不确定性, 包括作战任务快速调整、无人机个体状态和能力变化、无人机通信拓扑改变以及敌方或环境等外界因素的干扰, 对无人机集群协同资源分配方法设计提出了更高的要求. 
高效的资源分配方法对提高无人机协同执行任务能力起到重要作用, 通过对无人机执行任务时所需资源进行合理分配, 能够实现以最小全局代价或最大全局收益完成任务. 

然而,无人机作为异质性智能个体, 在进行资源分配和任务规划时存在个体利益与群体利益之间的冲突. 如何设计面向多无人机协同任务的动态资源分配机制, 成为具有现实应用价值的技术挑战.
多无人机协同资源分配本质上是一类组合优化问题, 具有自组织性、涌现性、非线性和不可预测性等复杂系统的特征. 目前常见的研究方法包括数学规划方法、启发式方法、群体智能方法以及强化学习等. 然而这些研究方法侧重于对群体的宏观约束而非个体的策略调控, 忽视了个体利益与群体利益之间的冲突,并且难以适应动态变化的任务场景.



主要工作


已有研究说明公共物品博弈能够提供一种可靠的集群自主协同控制框架, 将博弈思想应用在无人机集群的资源分配问题中, 将无人机作为有限理性的个体, 在重复迭代的过程中不断更新策略和状态, 最终达到稳定结果



本文提出了一种基于合作竞争机制的动态资源分配方法, 建立了基于无人机拓扑网络的博弈模型, 通过设计针对特殊个体的调控规则, 达到提升系统平均收益的目的. 

设计了基于合作机制与竞争机制的两种博弈策略, 合作机制通过对完全合作者的奖励制度实现, 而竞争机制通过引入孤立状态实现, 根据外界条件以及系统内部的演化规律自适应地实现全局收益最大化, 体现无人机群体智能的特性.

引入合作与竞争激发机制后, 系统中个体的状态转换机制如图2所示, 其中, p为普通个体根据Fermi规则计算模仿邻居策略的概率, 而特殊个体转换需要满足特定的条件.



仿真结果


通过无人机博弈模型的仿真实验, 根据网络结构、模型参数以及不同激发机制下系统的稳态结果, 验证本文所提无人机动态资源分配方法的可行性和有效性.

无人机集群规模为1000, 进行1000次迭代过程, 采用仿真结果中的稳态值, 包括合作频率、平均收益、不同策略比例等变量在迭代过程最后10%的平均结果作为演化博弈模型的评价指标.



研究结果表明,引入合作竞争激发机制可以显著提高系统的平均收益, 竞争机制在增益系数较低时起到了主要作用; 随着增益系数的增加, 合作机制开始涌现, 采用竞争机制的个体逐渐消失; 增益系数进一步增加, 系统中不同状态个体比例基本保持稳定.


本文内容可能会与最终出版文章有微小差异,点击下方阅读原文按钮,快速获取文章最新版本。


《中国科学:信息科学》| SCIENCE CHINA Information Sciences

及时报道计算机科学与技术、控制科学与控制工程、通信与信息系统、微电子与固体电子学等领域基础与应用研究方面的原创性成果.

英文版投稿:https://mc03.manuscriptcentral.com/scis

中文版投稿:https://www.scicloudcenter.com/SSI/login/index

快速访问:http://scis.scichina.com/



文章有问题?点此查看未经处理的缓存