《导航定位与授时》2022年第6期“飞行器智能导航与控制技术”专栏出版预告

智绘科服 2022-11-20

本文内容转载自微信公众号：导航定位与授时，版权归原作者及刊载媒体所有，所刊载内容仅供交流参考使用，不代表本刊立场。

随着军民领域对各类飞行器导航、制导与控制性能要求的不断提升，以及飞行器所要执行的任务以及所处环境复杂程度、不确定性的不断增加，传统基于精确线性或非线性数学模型的制导、控制以及滤波理论面临不断挑战。另一方面，人工智能领域的蓬勃发展促使基于数据的学习、推理以及基于专家知识的推理、决策方法层出不穷。将各类机器学习、推理、分类、预测方法与传统的导航、制导与控制理论相结合必能推动飞行器导航、制导与控制领域的进一步发展，具有重要的工程应用与理论学术价值。在该领域，近些年来国内外专家学者展开了大量研究工作，取得了众多成果。

为了推动人工智能技术与传统飞行器导航、制导与控制技术的深度融合，《导航定位与授时》编辑部特邀哈尔滨工业大学班晓军教授、南京航空航天大学郁丰教授、中科院自动化研究所赵冬斌研究员担任专栏主编，拟在2022年第6期正式推出“飞行器智能导航与控制技术”专栏。热忱欢迎相关研究领域的专家学者关注此次专栏的出版。

专栏主编

班晓军

班晓军，哈尔滨工业大学航天学院控制科学与工程学科教授、博士生导师，控制理论与制导技术研究中心副主任，中国空间学会空间光学与运动体专业委员会委员，《导航定位与授时》第一届青年编辑委员会委员。从事自适应自学习控制、模糊逻辑控制、参数状态估计理论及在运动体制导控制和运动信息估计中的应用研究。

专栏共同主编

郁丰

郁丰，南京航空航天大学航天学院控制工程系教授、博士生导师，光电探测与感知工信部重点实验室副主任，中国自动化学会平行控制与管理专业委员会委员。主要从事航天器自主导航与定位、微纳卫星控制与仿真技术的研究，发表论文40余篇，授权发明专利20余项。

专栏共同主编

赵冬斌

赵冬斌，中国科学院自动化研究所，研究员、博士生导师、IEEE Fellow。任计算智能领域权威期刊IEEE CIM, IEEE TCyb, IEEE TAI, IEEE TCDS编委等。任权威国际会议的大会主席（IEEE CoG 2022, CIFEr 2019），程序委员会主席（IJCNN 2019）等多次。出版学术著作5本、译著1本。在国内外重要期刊会议上发表论文300余篇（SCI收录100余篇），其中优秀/热点/好评/ESI高被引论文 20 余篇，包括IEEE TASE/TETCI/TCDS期刊年度唯一优秀论文奖等。目前主要研究方向为人工智能和深度强化学习的理论和方法，及其在智能游戏/博弈、智能车辆、机器人、自动机器学习等方面的应用。

专栏文章摘要

人工智能可解释性评估研究综述

李瑶^1,3，左兴权^2,3，王春露^1,3，黄海²，张修建⁴

（1. 北京邮电大学网络空间安全学院,北京 100876；2. 北京邮电大学计算机学院,北京 100876；3. 可信分布式计算与服务教育部重点实验室,北京 100876; 4. 北京航天计量测试技术研究所,北京 100076）

摘要：近年来,可解释人工智能(explainable artificial intelligence, XAI)发展迅速,成为当前人工智能领域研究热点,已出现多种人工智能解释方法。如何量化评估XAI的可解释性以及解释方法的效果,对研究XAI具有重要意义。XAI的可解释性评估涉及主、客观因素,是一个复杂且有挑战性的工作。本文综述了XAI的可解释性评估方法；首先,介绍了XAI的可解释性及其评估的概念、分类；其次,总结和梳理了一些可解释性的特性；在此基础上,从可解释评估方法和可解释性评估框架两方面,综述和分析了当前可解释性评估工作；最后,总结当前人工智能可解释性评估研究的不足,并展望了未来发展方向。

关键词：可解释性评估；人工智能可解释性；主观评估；客观评估；评估方法；神经网络；深度学习

基于深度强化学习的无人机栖落机动控制策略设计

黄赞，何真，仇靖雯

（南京航空航天大学自动化学院,南京 211106）

摘要：无人机栖落机动飞行是一种无需跑道的降落方法，能够提升无人机在复杂环境下执行任务的适应能力。针对其具有高非线性、多约束特性的无人机栖落机动过程，提出了一种基于模仿深度强化学习的控制策略设计方法。首先，建立了固定翼无人机栖落机动的纵向非线性动力学模型，并设计了无人机栖落机动的强化学习环境。其次，针对栖落机动状态动作空间大的特点，为了提高探索效率，通过模仿专家经验的方法，对系统进行预训练。然后，以模仿学习得到的权重为基础，采用近端策略优化方法，学习构建无人机栖落机动的神经网络控制器。最后，通过仿真验证了上述控制策略设计方法的有效性。

关键词：栖落机动；深度强化学习；固定翼无人机；神经网络

基于单视图的非合作航天器三维体素重构算法

郭鹏宇¹，胡庆雷^1,2，欧阳真超²

（1. 北京航空航天大学自动化科学与电气工程系，北京 100190；2. 北京航空航天大学杭州创新研究院(余杭)，杭州 310023）

摘要：空间对抗态势下，针对非合作航天器的快速高精度智能感知、意图识别与威胁评估等在轨相对导航任务，均依赖精准的目标三维模型先验信息。但星载传感器感知视场有限，传统基于多帧图像的模型重构算法存在流程复杂、实时性差及恢复精度低等问题。为此，本文提出了一种基于单视图的航天器三维体素重构算法，能够高效地基于单帧图像恢复目标的空间三维信息。首先，针对空间航天器视觉感知任务研究普遍存在的“饥饿问题”，通过整理航天器三维模型，利用图像渲染技术构建了小规模本地数据集，包括航天器三维模型、对应体素和多视角采样图像三部分。接着，设计了基于单视图的三维重建模型，使用单帧非合作航天器图像作为输入，通过2D-3D混合卷积完成“编码-解码-调优”三个子模块计算，实现对目标三维体素结构的恢复。最后，在本地数据集上进行网络模型的训练和评估，验证了当前模型能够实时精确重建目标航天器三维体素模型，并在现有数据上取得了0.895的值；同时，网络对不同航天器的重建效果体现了模型具有强大的泛化能力。

关键词：非合作航天器；模型重构；航天器数据集；体素；深度学习

基于深度Q网络的多智能体逃逸算法设计

闫博为¹，杜润乐²，班晓军¹，周荻¹

（1. 哈尔滨工业大学航天学院, 哈尔滨 150000；2. 试验物理与计算数学国家级重点实验室, 北京 100076）

摘要：当前多智能体追逃博弈问题通常在二维平面下展开研究，且逃逸方智能体运动不受约束，同时传统方法在缺乏准确模型下存在设计控制策略困难的问题。本文针对三维空间中逃逸方智能体运动受约束的情况提出了一种基于深度Q网络(Deep Q-Network, DQN)的多智能体逃逸算法。算法采用分布式学习的方法，逃逸方智能体通过对环境的探索学习得到满足期望的逃逸策略。为提高学习效率，根据任务的难易程度将智能体策略学习划分为两个阶段，通过设计相应的奖励函数引导智能体探索满足期望的逃逸策略。仿真结果表明，该算法所得逃逸策略效果稳定，并且该算法具有泛化能力，在改变一定的初始位置条件后逃逸方智能体也可成功逃逸。

关键词：逃逸算法；深度强化学习；多智能体；深度Q网络

星座碰撞规避的迭代学习构型保持方法

陶昊宸^1,2,3，龙嘉腾^1,2,3，朱圣英^1,2,3，聂涛^1,2,3

（1.北京理工大学宇航学院，北京 100081；1.深空自主导航与控制工信部重点实验室，北京 100081；3.飞行器动力学与控制教育部重点实验室，北京 100081）

摘要：针对低轨卫星星座运行中地球引力摄动的周期特性，基于迭代学习控制(Iterative Learning Control, ILC)方法，提出了星座碰撞规避的迭代学习构型保持方法。该方法由反馈控制和ILC控制两部分构成，分别抑制卫星运行过程中的非周期摄动和周期摄动对构型保持精度的影响，进而在地球非球形引力摄动未知条件下，通过相对构型的精确保持，实现对星座卫星碰撞的有效规避。仿真结果表明，在地球J2摄动影响下，与传统反馈控制相比，ILC方法以更小的控制输入实现了轨道保持精度的显著提升，进而在星座卫星轨道高度相近的情形下显著降低碰撞风险，且控制器可在保证收敛性能的前提下，实现启动时间的灵活选择。

关键词：碰撞规避；迭代学习控制；星座；构型保持；轨道保持

基于T-S模糊模型的非线性分布参数系统极点配置P-sD控制

党爱然^1,2,3，栾秀春^1,2,3，孙贺涛^1,2,3，王俊玲^1,2,3，周杰^1,2,3，杨志达^1,2,3

（1. 哈尔滨工程大学黑龙江省核动力装置性能与设备重点实验室，哈尔滨 150001；2. 哈尔滨工程大学核安全与先进核能技术工信部重点实验室，哈尔滨 150001；3. 哈尔滨工程大学核安全与仿真技术国防重点学科实验室，哈尔滨 150001）

摘要：采用Lyapunov直接法讨论分布参数系统的稳定性，建立分布参数系统的Lyapunov函数。为保证分布参数系统稳定，应使Lyapunov函数对时间的微分小于0。由于分布参数系统中的空间一次微分项与二次微分项，Lyapunov函数对时间的微分中将出现常数项与积分项，针对常数项，引入空间一次微分项来抵消，针对积分项，引入对应的状态反馈来使系统稳定。通过利用边界条件来量化Lyapunov函数对时间的微分中的各项，从而来设计控制器，这样是一种新的设计P-sD状态控制的方式。其中状态反馈的部分采用极点配置的方法来设计，当分布参数系统中出现状态变量的非线性函数时，采用T-S模糊模型表达，可以通过状态变量的线性组合精确描述非线性项，以便极点配置设计状态反馈。针对两个非线性分布参数数学模型进行仿真，结果证明设计的P-sD状态控制器可以使分布参数系统稳定，并达到期望的效果。

关键词：分布参数系统；Lyapunov稳定性；T-S模糊模型；P-sD状态控制

基于导航姿态解算的光纤陀螺平台低频角振动测试方法研究

张金云^1,2，姜欢^1,2，景立博^1,2，王汀^1,2

（1.北京航天控制仪器研究所，北京 100854；2.超精密航天控制仪器技术实验室，北京 100039）

摘要：为准确评价光纤陀螺平台的低频角振动特性，提出一种基于导航姿态解算的光纤陀螺平台低频角振动测试方法。首先通过角振动台精确模拟载体的低频角振动状态，并通过光纤陀螺平台飞行导航过程中的断调平差分信号实现平台框架角度信号与角振动台激励角度信号的数据同步；然后利用平台式惯导系统的导航姿态解算方法实时解算低频角振动过程中光纤陀螺平台的台体姿态，并通过坐标系转换得到平台基座系相对于地理系中的实时姿态；最后通过对光纤陀螺平台稳定回路的幅相特性分析得到低频角振动激励下稳定回路的幅值和相位特性，实现对光纤陀螺平台角动态特性的准确评估。

关键词：光纤陀螺平台；低频角振动；导航姿态解算

基于信任域策略优化的末制导控制量学习算法

刘士荣，王天一，刘扬

（哈尔滨工业大学计算学部，哈尔滨 150001）

摘要：近年来,深度强化学习在解决序列决策问题取得了很大进展，无模型强化学习算法在与环境不断交互的过程中学习策略，不需要提前对环境建模，使其适用于许多问题。针对以往使用强化学习进行末制导策略学习的训练不稳定问题，我们使用信任域策略优化算法直接学习末制导控制量，同时设计了一种新颖的奖励函数，可以提高训练稳定性和算法表现。在二维环境下进行了实验，结果表明，该算法具有良好的训练稳定性，并达到很好的命中效果。

关键词：末制导控制量;学习算法；深度强化学习；末制导；信任域策略优化

《导航定位与授时》（双月刊）是由中国航天科工集团有限公司主管，北京自动化控制设备研究所及中国宇航出版社主办的学术性期刊。中国标准连续出版物号：CN10-1226/V，ISSN2095-8110。期刊于2014年7月创刊，并于2018年入选中国科技核心期刊，2020年入选RCCSE中国核心学术期刊(A)，2021年入选中国科学引文数据库(CSCD)。期刊注重学术性、实用性和前瞻性，紧密跟踪国内外导航定位与授时技术发展前沿和研究热点，主要刊载惯性导航、卫星导航、组合导航、定位技术、飞行控制、守时及授时技术等技术领域的新成果、新概念、新方法、新理论和新数据。常设栏目：特约专栏、导航与控制、定位与授时、仪表与部件、仿真与测试等。

全彩印刷，不收版面费和审稿费。

欢迎广大专家学者及工程技术人员踊跃投稿！

联系电话：010-88532644/010-68377087

邮箱：PNT333@126.com

网址：pnt.ijournals.cn

微信号：dhdwyss

地址：北京市丰台云岗北区西里1号院东门《导航定位与授时》编辑部

初审：张艳玲

复审：宋启凡
终审：金君

往期推荐

资讯