查看原文
其他

基于小样本光时序信号分类问题上的数据增强手段 | 张学智等

SCIS 中国科学信息科学 2023-02-25


Zhang X Z, Sun H N, Jiang J F, et al. Optical time-series signals classification based on data augmentation for small sample. Sci China Inf Sci, 2022, doi: 10.1007/s11432-022-3615-1

研究意义

深度学习模型一直以来在大数据样本上都表现出强大的性能,因而在传感监测等需要对复杂信号进行分析的领域中同样被认为具有广阔的应用前景。然而在实践中,时序信号的采集是一项庞大的工程,深度学习模型常常因为传感信号样本少、不均衡而出现严重的过拟合现象。因此,需要研究数据增强方法来抑制过拟合问题。

本文工作

为了解决上述问题,本文提出了在一维时序信号上进行时序随机缩放检测以及随机擦除的数据增强策略,以抑制深度模型在小样本上的过拟合问题。首先搭建了可用于探测复杂超声信号的高灵敏度光纤光栅传感系统,可调谐窄带激光器以及相移光纤光栅的使用提高了本系统的探测灵敏度;其次在合金铝板上搭载数量不同的砝码产生微小形变来模拟不同损伤状况,以压电陶瓷作为声发射激励源,利用信号发生器驱动产生2 ms 时长500 MHz 的瞬时信号来模拟实际声发射信号状况;最终,在一维卷积的深度模型上实现损伤类别的分类和识别。其中,时序随机缩放剪裁和随机擦除的数据增强方法被作用在数据集上,使得最终模型在测试集上获得了良好表现。具体工作流程可见图1。
本文创新点如下:
  • 利用高灵敏度的光纤传感系统实现了特征复杂一维信号的采集,保证了信号质量;
  • 利用一维卷积神经网络搭建监督学习框架,实现对损伤类别的识别;
  • 提出了在一维序列上适用的数据增强手段,缓解了模型过拟合问题。


图1 本文工作流程框架


实验结果


本文采用了高灵敏度光纤光栅传感系统实现了对复杂表征的高频超声波信号进行探测采集,并设计了不同损伤类别状况,如图2所示,不同类别的信号得以完好采集,且它们表现出复杂的特征。为实现分类,采用一维卷积神经网络作为基本框架,并使用数据增强手段来抑制过拟合问题。如图3,采用数据增强前后训练的模型在测试集上表现出不同的分布状况,在模型过拟合时,数据在空间中仅有几类样本可以被很好分类,说明模型过分学习了一些特征。而采用数据增强后,一些数据点在空间中的分布被“拉回”,但各个类别数据不再堆积,说明数据增强手段抑制了模型对一些特征的过分学习,从而缓解了在一定样本上表现良好,在另一些样本上表现差的问题。

 

图2 采集到的信号

图3 数据增强训练的模型对数据分布的影响


相关阅读

◆ SCIS通信学科最新文章总目录 | 可免费下载全文 基于机器学习的光网络故障管理技术 | 综述 峰值功率受限光通信系统的灵活离散多音信号优化 多通道自适应信号检测基本理论与文献综述

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存