查看原文
其他

FITEE 2022年第7期摘要(“多智能体系统的组织化和体系化博弈”专题)

编辑部 信息与电子工程前沿FITEE 2023-03-17

【FITEE 2022年第7期推出“多智能体系统的组织化和体系化博弈”专题中国电科电子科学研究院陆军院士担任专题主编,中科院王飞跃研究员任执行主编,中国电科电子科学研究院董琦高级工程师、中国科学技术大学孙启彬教授、中科院自动化研究所魏庆来研究员、南方科技大学姚新教授任客座编辑。包含2篇观点类文章和6篇研究论文,扫描二维码即可下载全文PDF。】


“多智能体系统的组织化和体系化博弈”专题

社论:

1. 中国电科陆军等 | 多智能体系统的体系化和组织化博弈

观点:

2. 中国电科陆军等 | 博弈的存在与实践:对多智能体博弈发展的思考

3. 海军航空大学何友等 | 多智能体协作与博弈展望:挑战、技术和应用

研究:

4. 中国科学院自动化所李洪阳、魏庆来 | 输入饱和下多智能体系统最优一致性控制:一类非零和博弈方法

5. 北京航空航天大学段海滨等 | 具有外部干扰和障碍物的无人机编队分布式博弈策略

6. 中国科学技术大学赵鉴等 | 针对意外崩溃智能体的教练辅助多智能体强化学习框架

7. 北京航空航天大学董希旺等 | 基于多智能体微分博弈的数据驱动协同一致控制

8. 北京科技大学宋睿卓等 | 基于离散系统滑模控制的有限时间领导-跟随一致性

9. 清华大学芦维宁等 | 基于融合任务信息图神经网络的多智能体系统协同规划


1. Institutionalized and systematized gaming for multi-agent systems

多智能体系统的体系化和组织化博弈


陆军1,王飞跃†2,董琦†‡1,魏庆来

1中国电子科学研究院,中国北京市,100049 

2中科院自动化研究所,中国北京市,100049


摘要:广泛存在于军事智能、信息网络、无人系统、智慧交通和智能电网等领域的多智能体博弈问题具有体系化和组织化特点,它要求多智能体系统在复杂动态环境中进行感知和行动,同时在系统内达成个体利益的平衡和群体利益的最大化。这其中存在系统结构复杂、博弈环境不确定、决策信息不完整以及结果不可解释等问题,使得多智能体博弈的研究从传统简单博弈转变为面向高维连续复杂环境的博弈,对组织化和体系化博弈(institutionalized and systematized gaming, InSys gaming)提出迫切需求。在此背景下,针对多智能体系统的体系化和组织化博弈的研究呈现出以下几方面的研究趋势: 

1. 分析多智能体系统的博弈演化规律,建立多智能体组织化体系化博弈理论模型 

2. 运用并结合多种人工智能学习算法,实现多智能体系统的协同决策 

3. 采取分层任务规划与决策行动架构,降低协同决策算法复杂度

4. 建立算法模型的鲁棒性分析框架,解决数据驱动方法与实际场景存在的模型偏差 

博弈理论已成为战略政治、军事对抗、市场经济等领域中解决问题的基本分析框架,所分析对象具备复杂的体系化和组织化特点,得到学术界和产业界高度关注。利用多智能体系统对组织化和体系化博弈建模,结合人工智能方法解决博弈决策问题,为该领域的理论、方法、技术的发 展提供新思路。

在此背景下,《信息与电子工程前沿(英文)》 期刊组织了“多智能体系统的组织化和体系化博弈”专题。主要内容关于多智能体演化博弈、无人机编队控制、多智能体自主规划、多智能体协同控制、群体智能以及多智能体强化学习框架设计等。经严格评审,录用 8 篇文章,包括 2 篇观点类文章和 6 篇研究论文。


https://doi.org/10.1631/FITEE.2240000



2. Existence and practice of gaming: thoughts on the development of multi-agent system gaming

博弈的存在与实践:对多智能体博弈发展的思考

1,吴镇宇1,2,陆军1,孙凤松1,3,王锦宇1,3,杨焱煜1,尚晓舟1
1中国电子科学研究院,中国北京市,100049
2北京理工大学信息与电子学院,中国北京市,100081
3北京邮电大学信息与通信工程学院 ,中国北京市,100876

摘要:博弈是宇宙中的一种普遍存在。本文从人类对博弈的认识过程出发,探讨了博弈的存在与实践,阐述了多智能体博弈研究难点,并基于演化思想,从系统论的角度出发,提出多智能体演化博弈理论框架。以下一代预警探测系统为例,介绍了多智能体演化博弈的应用实践。构建了多智能体自组织博弈决策模型和多智能体强化学习方法,对研究高维复杂环境下的组织化、体系化博弈行为具有重要意义。

关键词:博弈;多智能体系统;多智能体演化博弈;预警探测
https://doi.org/10.1631/FITEE.2100593



3. Prospects for multi-agent collaboration and gaming: challenge, technology, and application

多智能体协作与博弈展望:挑战、技术和应用


刘瑜1,李徵2,姜智卓2,何友1
1清华大学电子工程系,中国北京市,100084
2清华大学深圳国际研究生院,中国深圳市,518055


摘要:近年来,多智能体系统在解决复杂环境中各种决策问题方面取得显著进步,并已实现与人类相似甚至更好的决策性能。本文从任务挑战、技术方向和应用领域3个角度简要回顾多智能体协作和博弈相关技术。首先回顾近期多智能体系统工作中的典型研究问题和挑战,然后进一步讨论关于多智能体协作和游戏任务的前沿研究方向,最后对多智能体协作与博弈的应用领域进行重点展望。


关键词:多智能体;博弈论;集体智能;强化学习;智能控制

https://doi.org/10.1631/FITEE.2200055



4. Optimal synchronization control for multi-agent systems with input saturation: a nonzero-sum game

输入饱和下多智能体系统最优一致性控制:一类非零和博弈方法


李洪阳1,2,魏庆来1,2,3
1中国科学院大学人工智能学院,中国北京市,100049
2中国科学院自动化研究所复杂系统管理与控制国家重点实验室,中国北京市,100190
3澳门科技大学系统工程研究所,中国澳门特别行政区,999078


摘要:本文针对输入饱和下的多智能体系统,提出一种最优一致性控制方法。引入多智能体博弈理论,将最优一致性控制问题转化为多智能体非零和博弈。之后,通过求解具有非二次输入能量项的耦合Hamilton–Jacobi–Bellman(HJB)方程,实现Nash平衡。提出脱策强化学习方法,在系统模型未知情况下获得Nash平衡解;引入评判神经网络和执行神经网络实现所提方法。理论分析显示迭代控制律收敛到Nash平衡。仿真实验验证了所提方法的有效性。

关键词:最优一致性控制;多智能体系统;非零和博弈;自适应动态规划;输入饱和;脱策强化学习;策略迭代
https://doi.org/10.1631/FITEE.2200010



5. Distributed game strategy for unmanned aerial vehicle formation with external disturbances and obstacles

 具有外部干扰和障碍物的无人机编队分布式博弈策略


袁洋1,邓亦敏1,罗斯达2,段海滨1,3
1北京航空航天大学自动化科学与电气工程学院虚拟现实技术与系统国家重点实验室,中国北京市,100083
2北京航空航天大学机械工程及自动化学院,中国北京市,100191
3鹏城实验室,中国深圳市,518000


摘要:本文研究了具有外部干扰和障碍物的无人机编队分布式博弈策略,该策略基于分布式模型预测控制(MPC)框架和基于Levy飞行的鸽群优化算法(LFPIO)。首先,提出一种非奇异快速终端滑模观测器(NFTSMO)估计无人机受扰动的影响,并利用Lyapunov函数证明该观测器在固定时间内收敛。其次,设计一种基于拓扑重构的避障策略,使无人机能够以较小能量消耗安全通过障碍物。然后,建立一个分布式MPC框架,该框架中每架无人机仅与邻居交换消息,通过设计分布式MPC代价函数,将无人机编队问题转化为博弈问题,并利用基于Levy飞行的鸽群优化算法求解纳什均衡。最后,利用数值仿真对比实验验证所提策略的有效性。

关键词:分布式博弈策略;无人机;分布式模型预测控制;基于Levy飞行的鸽群优化算法;非奇异快速终端滑模观测器;避障策略
https://doi.org/10.1631/FITEE.2100559



6. Coach-assisted multi-agent reinforcement learning framework for unexpected crashed agents

针对意外崩溃智能体的教练辅助多智能体强化学习框架


赵鉴1,赵有朋1,王维埙2,阳明宇1,胡迅晗1,周文罡1,郝建业2,李厚强1
1中国科学技术大学信息科学技术学院,中国合肥市,230026
2天津大学智能与计算学部,中国天津市,300072


摘要:多智能体强化学习在实际场景中很难应用,一部分原因在于模拟环境和现实环境之间存在差距。造成这种差距的一个原因是,模拟系统总是假设智能体可以一直正常工作,而实际上,由于不可避免的硬件或软件故障,一个或多个智能体可能会在合作过程中意外“崩溃”。这样的崩溃会破坏智能体之间的合作,导致系统性能下降。本文中,我们给出了意外崩溃情况下合作多智能体强化学习系统的正式定义。为增强系统应对崩溃时的鲁棒性,提出教练辅助多智能体强化学习框架,其在训练过程中引入一个虚拟教练智能体,以调整系统的崩溃概率。为教练智能体设计了3种教练策略和重采样策略。据我们所知,这是研究多智能体系统中意外崩溃情况的首项工作。在网格环境和星际争霸微管理任务上的大量实验表明,相比固定崩溃概率和课程学习的教练策略,自适应策略更加有效。消融实验进一步展现了重采样策略的有效性。


关键词:多智能体系统;强化学习;意外崩溃智能体
https://doi.org/10.1631/FITEE.2100594



7. Multi-agent differential game based cooperative synchronization control using a data-driven method

基于多智能体微分博弈的数据驱动协同一致控制


石宇1,化永朝2,于江龙1,董希旺1,2,任章1
1北京航空航天大学自动化科学与电气工程学院,中国北京市,100191
2北京航空航天大学人工智能研究院,中国北京市,100191


摘要:本文研究了多智能体微分博弈问题及其在协同一致控制中的应用。提出系统化的多智能体微分博弈构建和分析方法,同时给出一种基于强化学习技术的数据驱动方法。首先论证了由于网络交互的耦合特性,典型的分布式控制器无法充分保证微分博弈的全局纳什均衡。其次通过定义最优对策的概念,将问题分解为局部微分博弈问题,并给出局部纳什均衡解。构造了一种无需系统模型信息的离轨策略强化学习算法,利用在线邻居交互数据对控制器进行优化更新,并证明控制器的稳定性和鲁棒性。进一步提出一种基于改进耦合指标函数的微分博弈模型及其等效的强化学习求解方法。与现有研究相比,该模型解决了多智能体所需信息的耦合问题,并实现分布式框架下全局纳什均衡和稳定控制。构造了与此纳什解对应的等价并行强化学习方法。最后,仿真结果验证了学习过程的有效性和一致控制的稳定性。

关键词:多智能体系统;微分博弈;一致控制;数据驱动;强化学习
https://doi.org/10.1631/FITEE.2200001



8. Finite-time leader-follower consensus of a discrete-time system via sliding mode control

基于离散系统滑模控制的有限时间领导-跟随一致性


宋睿卓1,2,邢适1,2,许镇3

1北京科技大学自动化学院,中国北京市,100083
2北京市工业波谱成像工程技术研究中心,中国北京市,100083

3北京科技大学土木与资源工程学院,城镇化与城市安全研究院,中国北京市,100083


摘要:研究了离散时间二阶多智能体系统在外部干扰约束下的有限时间领导-跟随一致性问题。首先利用自适应滑模控制理论,设计了一种新的有限时间一致性方案。自适应控制律是在传统滑模趋近律基础上改进设计的,其优点是减少抖振并保持对干扰的不变性。此外,通过给出一个离散李雅普诺夫函数,证明了离散时间二阶多智能体系统的有限时间稳定性。最后,数值模拟结果验证了理论分析的有效性。


关键词:有限时间;领导-跟随一致性;自适应滑模控制;多智能体系统

https://doi.org/10.1631/FITEE.2100565



9. Cooperative planning of multi-agent systems based on task-oriented knowledge fusion with graph neural networks

基于融合任务信息图神经网络的多智能体系统协同规划


戴汉奇1,2,芦维宁2,李祥隆3,杨君1,孟德山4,刘衍泽5,梁斌1
1清华大学自动化系,中国北京市,100084
2清华大学北京信息科学与技术国家研究中心,中国北京市,100084
3天津大学科学技术发展研究院,中国天津市,300350
4中山大学航空航天学院,中国深圳市,518107
5诺丁汉大学电气与电子工程系,中国宁波市,315154


摘要:协同规划是多智能体系统博弈领域的关键问题之一。本文聚焦每个智能体只有一个局部观测范围和局部通信情况下的协作规划。提出一种新型协同规划框架,该框架将图神经网络与融合任务信息采样方法相结合。本文的两个主要贡献是基于与前期工作的比较:(1)使用图采样与聚合方法(GraphSAGE)实现动态近邻智能体信息融合,这是该方法首次用于处理协同规划问题;(2)提出一种面向任务的采样方法,从特定方向聚合知识,使所提模型获得高效、稳定的训练过程。实验结果证明了所提方法的有效性。

关键词:多智能体系统;协同规划;图采样与聚合(GraphSAGE);融合任务信息
https://doi.org/10.1631/FITEE.2100597




10. Light field imaging for computer vision: a survey

用于计算机视觉任务的光场成像技术综述


贾晨1,2,石凡1,2,赵萌1,2,陈胜勇1,2
1天津理工大学学习型智能系统教育部工程研究中心,中国天津市,300384
2天津理工大学计算机视觉与系统教育部重点实验室,中国天津市,300384


摘要:光场成像因其解决计算机视觉问题的能力而备受关注。本文首先简要回顾了近年来计算机视觉的研究进展。对于影响计算机视觉发展的大多数因素来说,视觉信息获取的丰富性和准确性起着决定性作用。光场成像技术利用照相机或微透镜阵列记录光线位置和方向信息,获取完整三维场景信息,为计算机视觉研究做出巨大贡献。光场成像提高了深度估计以及图像分割、融合和三维重建的精度。光场成像还被创新地应用于虹膜和人脸识别、材料和虚假行人识别、极平面图像采集和形状恢复以及光场显微镜。我们进一步总结了光场成像技术在计算机视觉研究中存在的问题和发展趋势,如光场数据集的建立和评估、在高动态范围条件下的应用、光场增强和虚拟现实。光场成像在各种研究中取得巨大成功。在过去25年,超过180篇文献报道了光场成像在解决计算机视觉问题上的能力。我们梳理了这些文献,使研究人员更容易搜索有关解决方案的详细方法。

关键词:光场成像;相机阵列;微透镜阵列;极平面图像;计算机视觉
https://doi.org/10.1631/FITEE.2100180



11. Enhanced solution to the surface–volume–surface EFIE for arbitrary metal–dielectric composite objects

任意金属–介电混合体面体面电场积分方程(SVS-EFIE)的增强解


王涵,庞铭杰,林海
浙江大学计算机辅助设计与图形学国家重点实验室,中国杭州市,310027


摘要:利用矩量法求解面体面电场积分方程(SVS-EFIE),公式复杂,实现困难,算法复杂度高。本文提出求解任意金属–介电混合体电磁散射问题的通用矩阵方程(GME),并给出该方程的增强解。矩量法只考虑包含3个区域的金属–介电混合体,且SVS-EFIE的两步过程导致两个积分符号,难以实现且算法复杂度高。为解决该问题,本文首次提出能够用于分析均匀介质体和超过3个区域金属–介电混合体的GME方法。提出基于耦合度和子区域间距相关的GME加速求解策略,并自适应设置耦合度标准以平衡精度和效率。将变形后的加法定理用于强耦合情况,将迭代法用于弱耦合情况。并行性可以方便地应用于该增强解。数值结果表明,与直接解相比,该方法平均只需11.6%的内存和11.8%的中央处理器时间。

关键词:混合体;积分方程;矩量法;加法定理;迭代
https://doi.org/10.1631/FITEE.2100387



12. Cellular automata based multi-bit stuck-at fault diagnosis for resistive memory

基于元胞自动机的电阻存储器多比特固定型故障诊断


Sutapa SARKAR1, Biplab Kumar SIKDAR2, Mousumi SAHA3
1Seacom工程学院电子与通信工程系,印度西孟加拉邦豪拉市,711302
2印度工程科学与技术学院计算机科学与技术系,印度西孟加拉邦豪拉市,711303
3国立技术学院计算机科学与工程系,印度西孟加拉邦杜尔加普尔,713209


摘要:本文提出一种用于可变电阻式存储器(ReRAM)、基于组的动态固定型故障诊断方案。传统的静态随机存取存储器、动态随机存取存储器、NAND和NOR闪存受可扩展性、功率、封装密度等限制。可变电阻式存储器这类下一代存储器被认为具有多种优势,如高封装密度、非易失性、可扩展性和低功耗,但单元可靠性一直是个问题。不可靠的内存操作是由于大量使用写入或内存密集型工作负载而导致的永久性固定型故障。越来越多的固定型故障也限制了芯片寿命。因此,本文提出一种基于元胞自动机(CA)的动态消除固定型故障设计,以解决不可靠的电池功能和不稳定的电池寿命问题。引入可扩展的块级故障诊断和恢复方案,以确保在出现多比特固定型故障情形下仍可读取数据。该方案是一种新颖方法,因其目标是消除一般故障条件下对固定型故障的数量和性质的限制。所提方案基于Wolfram零边界和周期性边界CA理论。引入多种特殊类别CA--单长循环单吸引子元胞自动机(SACA)、单长循环双吸引子元胞自动机(TACA)和单长循环多吸引子元胞自动机(MACA)--以实现完全容错。目标微架构单元设计具有最佳空间开销。

关键词:电阻存储器;电池可靠性;块级故障诊断;单长循环单吸引子元胞自动机;单长循环双吸引子元胞自动机;单长循环多吸引子元胞自动机
https://doi.org/10.1631/FITEE.2100255



13. Efficient decoding self-attention for end-to-end speech synthesis

一种端到端语音合成中的高效解码自注意力网络

赵伟1,2,许力1,2
1浙江大学电气工程学院,中国杭州市,310027
2浙江大学机器人研究院,中国余姚市,315400


摘要:自注意力网络由于其并行结构和强大的序列建模能力,被广泛应用于语音合成(TTS)领域。然而,当使用自回归解码方法进行端到端语音合成时,由于序列长度的二次复杂性,其推理速度相对较慢。当部署设备未配备图形处理器(GPU)时,该效率问题更加严重。为解决该问题,提出一种高效解码自注意力网络(EDSA)作为替代。通过一个动态规划解码过程,有效加速TTS模型推理,使其具有线性计算复杂度。基于普通话和英文数据集的实验结果表明,所提EDSA模型在中央处理器(CPU)和GPU上的推理速度分别提高720%和50%,而性能几乎相同。因此,在GPU资源有限的情况下,该方法可使此类模型的部署更加容易。此外,所提模型在域外语言处理上可能比基线Transformer TTS性能更好。

关键词:高效解码;端到端;自注意力网络;语音合成
https://doi.org/10.1631/FITEE.2100501



往期目录


FITEE 2022年第6期

FITEE 2022年第5期(“软件数据智能分析”专题)

FITEE 2022年第4期(“人工智能在空间环境和航天器中的应用”专题)

FITEE 2022年第3期

FITEE 2022年第2期

FITEE 2022年第1期(“智简无线网络理论与技术”专题)

FITEE 2021年第12期

FITEE 2021年第11期

FITEE 2021年第10期

FITEE 2021年第9期

FITEE 2021年第8期
FITEE 2021年第7期
FITEE 2021年第6期
FITEE 2021年第5期(首期“视觉知识”专栏)
FITEE 2021年第4期(“高通量毫米波无线通信”专刊)
FITEE 2021年第3期(“超快低维材料器件及其调控”专题)
FITEE 2021年第2期
FITEE 2021年第1期(“复杂网络和系统的分布式滤波与控制”专刊)

期刊动态

中国科协发布《高质量科技期刊分级目录总汇》,FITEE入选信息通信领域T1目录!

首期信息与电子工程领域青年学术前沿论坛成功举办,段宝岩院士领衔

2021最新影响因子公布 FITEE首次突破2.0

FITEE影响因子提升55%,首次跨入Q2区

FITEE 发布首届优秀论文/专题、杰出编委/通讯专家名单!

FITEE主编、编委文章列表(2019.1~2021.8)

FITEE通讯专家文章列表(2019.1~2021.8)

聚焦先进集成电路技术与产业创新,“中国工程院信息与电子工程前沿论坛”第5期成功举办!

中国工程院发布信息电子领域10+10全球工程前沿

FITEE微信上线新功能,不需下载PDF,即可阅览每期中英文摘要和全文

《信息与电子工程前沿(英文)》(FITEE) 第二届编委会2020年度扩大会议顺利召开

FITEE首批通讯专家聘任仪式暨第一次会议在浙江大学举行

FITEE第二届编委会第一次会议在浙江大学召开





关于本刊

Frontiers of Information Technology & Electronic Engineering(简称FITEE,中文名《信息与电子工程前沿(英文)》,ISSN 2095-9184,CN 33-1389/TP)是信息电子类综合性英文学术月刊,SCI-E、EI收录,最新影响因子2.526,位于JCR Q2分区。前身为2010年创办的《浙江大学学报英文版C辑:计算机与电子》,2015年更为现名,现为中国工程院信息与电子工程领域分刊。覆盖计算机、信息与通信、控制、电子、光学等领域。文章类型包括研究论文、综述、个人视点、评述等。现任主编为中国工程院院士潘云鹤、卢锡城。实行国际同行评审制,初次转达意见一般在2~3个月内。文章一经录用将快速在线。

2019年,荣获中国科协等七部委推出的中国科技期刊卓越行动计划项目资助(梯队期刊)。2021~2022年,先后入选信息通信领域(中国通信学会组织评选)和计算领域(中国计算机学会组织评选)高质量科技期刊分级目录,均被列为最高的T1级别。


官网http://www.jzus.zju.edu.cn

期刊Springer主页

http://www.springer.com/computer/journal/11714

在线投稿

http://www.editorialmanager.com/zusc

微信加群

为方便广大科研人员交流讨论,本平台建有以下学科微信群。有需要加群的用户,请加小编个人微信号fitee_xb,并留言想要加入的群,小编会拉您进群。营销广告人员请勿扰。

计算机科学与技术学术群

光学工程与技术学术群

控制科学与技术学术群

信息与通信学术群

电力电子学术群

人工智能学术


加关注  ID: fitee_cae

本公众号为中国工程院院刊《信息与电子工程前沿(英文)》(SCI-E、EI检索期刊)官方微信,功能包括:传播期刊的学术文章;为刊物关联学人(读者、作者、评审人、编委,等)提供便捷服务;发布学术写作、评审、编辑、出版等相关资讯;介绍信息与电子工程领域学术人物、学术思想、学术成果,展示该领域科学研究前沿进展;为该领域海内外学者提供友好互动平台。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存