ICCV 2019 | 基于关联语义注意力模型的图像修复
作者丨薛洁婷
学校丨北京交通大学硕士生
研究方向丨图像翻译
论文引入
图像修复问题的关键是维持修复后图像的全局语义一致性以及破损区域的细节纹理合理性。近期关于图像修复问题的研究主要集中于通过使用空间注意力机制或利用原始图像的有效像素去预测缺失区域两种策略,这两种方法由于忽略破损区域的语义相关性和特征连续性,经常会产生模糊纹理或结构混乱的问题(如图 1)。
▲ 图1. 现有图像修复算法比较
为了解决这一问题作者借鉴人工修复图像的过程提出了基于关联语义注意机制的图像修复模型,该模型不仅能修复不规则缺失图像而且能保证修复后图像的全局一致性。
模型介绍
基于关联语义注意机制的图像修复模型主要由两部分组成,首先图像经过一个粗略的修复网络(Rough Network),该网络基于 U-Net 架构。之后将 Rough Network 修复后的图像结合原破损图像作为更细致的修复网络(Refinement Network)的输入进行进一步的修复。最后作者通过 feature 鉴别器以及 patch 鉴别器与修复网络进行对抗,具体架构如图 2 所示。
▲ 图2. 模型架构
主要过程分为搜索和生成两部分(如图 3 所示),首先在已知区域的特征映射
之后将
由于第一个像素块没有前向相邻像素块,因此第一个像素块的信息完全来自于
▲ 图3. CSA层
▲ 图4. 互信息
作者在编码过程中嵌入了 CSA 层,为了能在解码时重建 M 作者定义了注意力映射矩阵 A,并在解卷积中复用该矩阵,整个过程的伪代码如图 5 所示。
▲ 图5. CSA伪算法
▲ 图6. feature discriminator架构
实验结果
作者使用了 Places2,CelebA 以及 Paris StreetView 数据集进行实验,选取 Contextual Attention (CA),Shift-net (SH),Partial Conv (PC) 以及 Gated Conv (GV) 作为 baseline 进行比较。部分实验结果如图 7 所示,可以看出其他方法会产生或多或少的结构混乱或细节缺失问题,CSA 模型应用在不规则缺失图像修复上的效果也优于其他 baseline 模型。
▲ 图7. 修复效果比较
总结
作者提出了一种新颖的关联语义注意力图像修复模型,该模型将图形修复分为粗修复和精修复两部分,综合考虑时间成本以及修复效果,作者将关联语义注意力层 CSA 嵌入精修复网络的第四层编码-解码中,通过 ablation 研究发现 CSA 层确实可以提高模型的修复效果,产生更加合理的修复结果。
点击以下标题查看更多往期内容:
让你的论文被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得或技术干货。我们的目的只有一个,让知识真正流动起来。
📝 来稿标准:
• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)
• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接
• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志
📬 投稿邮箱:
• 投稿邮箱:hr@paperweekly.site
• 所有文章配图,请单独在附件中发送
• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
关于PaperWeekly
PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。
▽ 点击 | 阅读原文 | 下载论文 & 源码