合作竞争公共物品博弈的无人机集群动态资源分配
王浩淼, 段海滨, 魏晨. 基于合作竞争公共物品博弈的无人机集群动态资源分配. 中国科学: 信息科学, DOI: 10.1360/SSI-2021-0416
已有研究说明公共物品博弈能够提供一种可靠的集群自主协同控制框架, 将博弈思想应用在无人机集群的资源分配问题中, 将无人机作为有限理性的个体, 在重复迭代的过程中不断更新策略和状态, 最终达到稳定结果.
本文提出了一种基于合作竞争机制的动态资源分配方法, 建立了基于无人机拓扑网络的博弈模型, 通过设计针对特殊个体的调控规则, 达到提升系统平均收益的目的.
设计了基于合作机制与竞争机制的两种博弈策略, 合作机制通过对完全合作者的奖励制度实现, 而竞争机制通过引入孤立状态实现, 根据外界条件以及系统内部的演化规律自适应地实现全局收益最大化, 体现无人机群体智能的特性.
引入合作与竞争激发机制后, 系统中个体的状态转换机制如图2所示, 其中, p为普通个体根据Fermi规则计算模仿邻居策略的概率, 而特殊个体转换需要满足特定的条件.
通过无人机博弈模型的仿真实验, 根据网络结构、模型参数以及不同激发机制下系统的稳态结果, 验证本文所提无人机动态资源分配方法的可行性和有效性.
无人机集群规模为1000, 进行1000次迭代过程, 采用仿真结果中的稳态值, 包括合作频率、平均收益、不同策略比例等变量在迭代过程最后10%的平均结果作为演化博弈模型的评价指标.
研究结果表明,引入合作竞争激发机制可以显著提高系统的平均收益, 竞争机制在增益系数较低时起到了主要作用; 随着增益系数的增加, 合作机制开始涌现, 采用竞争机制的个体逐渐消失; 增益系数进一步增加, 系统中不同状态个体比例基本保持稳定.