查看原文
其他

【源头活水】EEGdenoiseNet:使用神经网络进行EEG去噪

“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注。

作者:知乎—亲爱的大脑

地址:https://www.zhihu.com/people/qin-ai-de-da-nao

文章信息

Zhang H, Zhao M, Wei C, et al. EEGdenoiseNet: A benchmark dataset for deep learning solutions of EEG denoising[J]. arXiv preprint arXiv:2009.11662, 2020.

一言以蔽之

作者通过预处理后的脑电、眼电和肌电,通过线性叠加后的信号来模拟带噪声的样本,作为模型输入,输出拟合未叠加眼电或肌电的脑电。以此,训练网络对眼动和肌肉运动产生伪迹的去除。

01

摘要
深度学习网络越来越受到各个领域的关注,包括脑电(EEG)信号处理。这些模型提供了与传统技术相当的性能。但是,目前缺乏具有特定基准的结构良好和标准化的数据集,限制了针对EEG去噪的深度学习解决方案的开发。在这里,我们介绍了EEGdenoiseNet,这是一个基准EEG数据集,适用于训练和测试基于深度学习的降噪模型以及适用于各模型之间的性能比较。EEGdenoiseNet包含4514个干净的EEG段,3400个眼电段和5598个肌电段,从而使用户可以将带噪声的EEG段与真实的干净EEG进行合成。我们使用EEGdenoiseNet评估了四个经典网络(全连接的网络,简单和复杂的卷积网络以及递归神经网络)的去噪性能。我们的分析表明,即使在高噪声污染下,深度学习方法也具有很大的潜力进行脑电去噪。我们希望通过EEGdenoiseNet,加速基于深度学习的EEG去噪的新兴领域的发展。

02

数据预处理

EEG的预处理

数据来自运动想象脑机接口,即包含想象左右手运动也包含真实运动时的脑电。EEG数据集包含64通道(使用国际10-10系统,并以512 Hz采样)的EEG,用于左右手的虚构和真实运动条件。数据在1至80 Hz之间进行带通滤波,并以电力线频率陷波,然后重新采样至256 Hz;然后使用 ICLabel 处理64通道信号以减弱伪像。然后将脑电信号分割为2秒的片段。

EOG的预处理

对于眼部伪影段(图1b),从开放获取EEG数据中收集了多个数据集。将数据集的水平和垂直眼电(EOG)信号在0.3和10 Hz之间进行带通滤波,然后重采样至256 Hz;然后重新采样。然后将信号分段为2秒。

EMG的预处理

对于肌肉电活动伪迹,使用了面部肌电图(EMG)数据集。选择面部肌电图是因为它们是肌肉电活动伪迹的主要来源。EMG信号在1至120 Hz之间进行带通滤波,并在电力线频率处陷波,然后重新采样至512 Hz;然后将信号分段为2秒。
对于所有类别,通过减去平均值并除以标准差来对片段进行标准化,然后由专家进行目视检查。最终获得了4514个EEG段,3400个EOG段和5598个EMG段。上图显示了干净的EEG,水平EOG,垂直EOG和EMG的示例。

03

数据使用
通过下式来生成线性混合了EOG或EMG噪声的EEG:
其中y是混合了EEG和伪迹的信号,x为干净的EEG,n表示伪迹信号,lambda为噪声水平。信噪比可以通过调整lambda来更改。

04

深度学习算法

准备模拟噪声信号

对于眼动产生的伪迹模拟,使用3400对EEG和EOG,80-10-10比例划分训练、验证和测试集。采用10种信噪比水平,在训练集内随机结合EEG和EOG,将样本量扩充10倍。在验证集和测试集内也采用同样的操作。
对于肌肉运动产生伪迹的模拟,使用4514个EEG样本和5598个EMG样本,将EEG样本在时域上采样到512 Hz,同时对EEG样本进行过采样实现5598个EEG样本。80-10-10比例划分训练、验证和测试集。采用10种信噪比水平,在训练集内随机结合EEG和EMG,将样本量扩充10倍。在验证集和测试集内也采用同样的操作。

网络结构

(a)全连接网络(b)简单CNN(d)RNN
图(a)全连接网络包含四个隐藏层,激活函数为ReLU。每层的神经元数等于输入信号的采样数(眼动伪迹512,肌肉干扰伪迹1024)。Dropout用于减少过拟合。输入为噪声的EEG,输出为去噪后的EEG。
图(b)简单CNN包含四个1D卷积层,核1 * 3,strid=1,64 feature map(k3n64s1)。每个1D卷积层之后是批处理归一化层(BN)和ReLU激活函数。使用全连接层从最后一个卷积层恢复信号维度并输出。
图(c)复杂CNN基于一维残差卷积神经网络(1D-ResCNN)模型。引入了具有跳过层连接的ResNet以避免梯度爆炸。为了提取多尺度特征,网络重复堆叠了使用多个尺度的1 * 3、1 * 5、1 * 7卷积核的残差块两次,并并行排列了三组残差块分支。
图(d)RNN网络基于长短期记忆(LSTM)网络,将每个EEG样本顺序输入到LSTM单元,并通过全连接的网络从每个单元的状态获得输出。该RNN模型初始化为具有1个隐藏状态,并且输出网络是三层完全连接的网络。

05

训练和评价
模型使用MSE损失函数来训练拟合输出的模型去噪后的EEG和预处理后的EEG。
评价指标
06
结果
不同信噪比下不同模型的测试性能
不同模型与两种传统方法进行对比的结果

07

评价
本文的思路很直接,也相对有效,但是并没有提出确实的科学问题或者应用场景。
类似于使用深度学习方法来进行EEG预处理,最终目的一定是服务于后续的分类任务,所以在性能评估方面,下游的分类任务的比较是需要。

本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。


“源头活水”历史文章


更多源头活水专栏文章,

请点击文章底部“阅读原文”查看



分享、在看,给个三连击呗!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存