合成孔径雷达(SAR)图像目标识别是实现微波视觉的关键技术之一。尽管深度学习技术已被成功应用于解决SAR图像目标识别问题,并显著超越了传统方法的性能,但其内部工作机理不透明、解释性不足,成为制约SAR图像目标识别技术可靠和可信应用的瓶颈。深度学习的可解释性问题是当前人工智能领域的研究热点和难点,对于理解和信任模型决策至关重要,其旨在对模型的决策给出令人能够理解的清晰概括和指示,从而帮助人们理解模型从数据中学到了什么,针对每一个样本是如何决策的,决策是否合理和可靠等。例如,一个简单的具有5层卷积模块(Conv2d-ReLU-MaxPool2d)的卷积神经网络在MSTAR测试集上的识别准确率可以达到93.80%(图1(d)),针对图1(a)输入样本能够正确判断其类别(图1(c)),但是基于Grad-CAM(Gradient-Class Activation Mapping)方法提取的决策显著性区域(图1(b))显示决策并不完全依赖于目标区域,还有部分背景区域对最终决策也有重要影响,其背后的决策合理性还需要结合SAR机理和特性进行分析和评估。这样决策不透明和缺乏可解释性的SAR目标识别技术在军事目标侦察、精确打击等高风险应用中隐藏着一定的决策风险,在应用中难以取得用户的信任。
图1 一个简单CNN分类器在T72 SAR图像的梯度-类激活映射(Grad-CAM)
针对SAR图像目标识别的可解释性问题,同济大学郭炜炜博士和上海交通大学张增辉副研究员等从SAR目标认知解译所面临的挑战和技术瓶颈出发,在对目前深度学习可解释性问题的研究进展进行总结的基础上,从模型理解、模型诊断和模型改进等3个方面对SAR图像目标识别的可解释问题进行了探讨,以启发研究人员对此问题开展进一步地探索和研究。这对于剖析SAR目标认知机理,提升SAR图像目标识别能力具有参考意义。
图2 SAR目标识别面临的挑战
图3 SAR目标识别的可解释性研究
该工作拟发表在《雷达学报》2020年第3期“雷达遥感应用”专刊“SAR图像目标识别的可解释性问题探讨”(郭炜炜,张增辉,郁文贤,孙效华),现已网络优先出版。