查看原文
其他

【源头活水】一种极简的深度子领域自适应方法DSAN

The following article is from 王晋东不在家 Author 王晋东

“问渠那得清如许,为有源头活水来”,通过前沿领域知识的学习,从其他研究领域得到启发,对研究问题的本质有更清晰的认识和理解,是自我提高的不竭源泉。为此,我们特别精选论文阅读笔记,开辟“源头活水”专栏,帮助你广泛而深入的阅读科研文献,敬请关注。

来源:知乎—王晋东不在家
地址:https://zhuanlan.zhihu.com/p/254856261
本文作者:朱勇椿,中国科学院计算技术研究所博士生,研究方向为数据挖掘和迁移学习。
本期我们将为大家介绍一种极为简单的深度子领域自适应的方法(DSAN),在大多数方法都使用很多项loss相加、越来越复杂的大环境下,这篇文章仅使用一个分类loss和一个自适应loss,方法极为简单,但是效果却非常不错,几乎在所有的主流DA数据集(office-home, office31, Image-CLEF,VisDA-2017, digits)上均有不错的效果。
这篇文章近期发表在一区期刊IEEE Transactions on Neural Networks and Learning Systems (IEEE TNNLS)上,主要作者团队来自中科院计算所与微软亚洲研究院。文章相关链接:
IEEE链接:https://ieeexplore.ieee.org/document/9085896
PDF:http://jd92.wang/assets/files/a24tnnls20.pdf
代码:https://github.com/easezyc/deep-transfer-learning/tree/master/UDA/pytorch1.0/DSAN

01

背景介绍
近年来无监督领域自适应(unsupervised domain adaptation, UDA)吸引了众多研究者的注意。Deep UDA的方法通常将目标领域数据和源领域数据通过一个深度神经网络提取特征,然后在这个特征空间中对两个领域的特征进行对齐(alignment),希望通过特征对齐减少两个领域间的特征差异。特征对齐的方法通常有两大类,metric-based和adversarial-based。在早期的研究中,大多数方法都进行全局对齐(不考虑任何细粒度的信息,比如标签),最近几年,开始出现了很多更细粒度的方法,这些方法将标签信息纳入考虑。
这些细粒度的方法通常是adversarial-based,众所周知,基于对抗的方法通常面临收敛速度慢,收敛难的问题,并且会使用一长串loss,非常复杂。
这里介绍的这篇工作解决了上述一系列问题。首先,定义了子领域的概念,一个领域下可以依据一些条件,将相似的样本划分到一个子领域,比如使用类标签作为划分依据,同一类放到一个子领域(这篇文章采用类别作为划分依据)。接着不再进行全局对齐,而是分别对相关的子领域进行对齐。
子领域自适应的思想如图所示。

subdomain adaptation
基于子领域自适应的思想,这篇文章提出了一种极为简单的方法——深度子领域自适应网络(Deep Subdomain Adaption Network, DSAN)。DSAN方法使用一种**Local MDD(LMMD)**来对齐分布,取得了近几年metric-based方法中最好的效果。

02

方法介绍
DSAN方法非常之简单,如下图所示:只使用LMMD在不同的层进行对齐。

DSAN

我们使用类别划分来定义子领域,一个子领域就是一个类别,所以LMMD的定义如下:

注意,这里的w在这篇文章中是根据类别定义,实质上,w的定义是非常灵活的,这个部分很容易扩展,比如使用多个相近的类来定义子领域。权重w的定义如下:

这里源领域数据使用真实标签,而目标领域数据使用网络预测的概率分布。LMMD的展开式如下:

整个网络使用如下损失函数进行优化:

上述第一项使用交叉熵作为分类损失,第二项使用LMMD作为自适应损失。可以看到优化目标相比于大多数UDA的方法来说是非常简单的。

03

实验效果
这篇文章的思想非常简单,但是效果却超越了大多数复杂的方法,在5个数据集上效果如下。
ImageCLEF:

ImageCLEF

Office31:
Office31
OfficeHome:
OfficeHome
VisDA-2017:
Visda
digits:
digits
DSAN取得了当前metric-based UDA方法最好的效果。和比较著名的JAN进行了一些分析实验:
analysis
并且将DSAN和现有的细粒度对齐的方法进行了比较,可以看出DSAN不使用对抗,并且loss少,超参数少,运行时间更快,达到的效果也更好:

comparison

04

总结
近年来,越来越多的研究者为了解决DA问题,倾向于提出一些越来越复杂的方法。但是事实上,越简单的方法往往是越有效果的。因为它关注了DA的本质性问题,而不会被各种新颖的loss冲昏头脑不知道自己到底在干什么。DSAN是就是这样一种非常简单有效的细粒度方法。在未来,读者可以基于DSAN做很多扩展,也希望更多的研究者去做简单但抓住问题本质的方法,回归研究的本质,而不是一味地堆叠各种炫酷的模块来达到目的。

References

[1] Zhu Y, Zhuang F, Wang J, et al. Deep Subdomain Adaptation Network for Image Classification[J]. IEEE Transactions on Neural Networks and Learning Systems, 2020.

本文目的在于学术交流,并不代表本公众号赞同其观点或对其内容真实性负责,版权归原作者所有,如有侵权请告知删除。


“源头活水”历史文章


更多源头活水专栏文章,

请点击文章底部“阅读原文”查看



分享、在看,给个三连击呗!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存