查看原文
其他

计算机视觉中的深度学习专题(2020)简介

The following article is from 中国科学杂志社 Author 中国科学信息科学

深度学习技术在许多研究领域都取得了巨大的成功, 尤其在计算机视觉领域取得了显著的进展. SCIENCE CHINA Information Sciences从2019 年起持续组织出版“Special Focus on Deep Learning for Computer Vision" (计算机视觉中的深度学习专题), 旨在报道利用深度学习解决重要视觉任务的新思路.


本专题第二批共录用了6篇论文和4篇短文, 涵盖了语义分割、目标检测、图像合成、文本识别、年龄估计等有挑战性的重要视觉任务, 发表在 SCIENCE CHINA Information Sciences 2020年63卷第2期上.

01

Progressive rectification network for irregular text recognition

Yunze GAO, Yingying CHEN*, Jinqiao WANG & Hanqing LU

专题论文|PRN:面向不规则文字识别的渐进矫正网络

提出了一种渐进式矫正网络, 可将不规则形状的文本迭代转换为水平排列的规则视图, 从而显著提升了文本识别的精度. 

02

Ordinal distribution regression for gait-based age estimation

Haiping ZHU, Yuheng ZHANG, Guohao LI, Junping ZHANG* & Hongming SHAN

通过尝试将年龄的顺序关系作为一个重要线索, 设计了一种新的序数分布损失函数, 能有效用于基于步态的年龄估计. 该方法具有一定的通用性, 同样适用于基于人脸的年龄估计. 

03

FACLSTM: ConvLSTM with focused attention for scene text recognition

Qingqing WANG, Ye HUANG, Wenjing JIA, Xiangjian HE, Michael BLUMENSTEIN, Shujing LYU & Yue LU*

论文介绍|面向场景文本识别的带聚焦注意力机制的convLSTM

提出了一种命名为ConvLSTM文本识别模型, 能够从二维空间直接识别场景文本. 在此基础之上, 该方法引入了注意力机制和字符中心位置来进一步对文本识别精度进行了提升. 

04

CGNet: cross-guidance network for semantic segmentation

Zhijie ZHANG & Yanwei PANG*

提出了一个新的网络框架CGNet, 能够同时进行语义分割、边缘检测和显著性检测三种视觉任务. 在边缘检测与显著性检测子网络的引导下, CGNet的语义分割性能能获得显著提升.

05

SynthText3D: synthesizing scene text images from 3D virtual worlds

Minghui LIAO, Boyu SONG, Shangbang LONG, Minghang HE, Cong YAO & Xiang BAI*

提出了一种通过三维虚拟世界产生场景文本图像的特别思路. 通过三维虚拟环境产生的文本图像数据具有理想的视觉效果, 涵盖了透视变换、光照与遮挡等多种变化, 可用于训练更鲁棒的文本检测模型.

06

Preserving details in semantics-aware context for scene parsing

Shuai MA, Yanwei PANG*, Jing PAN & Ling SHAO

通过嵌入丰富低层语义信息来改进语义分割网络的空间解码过程. 该方法能够更精确地获取语义分割所需要的细节特征.


此外, 4篇短文也带来了在不同视觉任务中的积极进展. Gao等提出了一种判别式自动编码器, 能够学习得到更加鲁棒的特征表示. Wang等探讨了跨模态商品图像搜索中的注意力机制. Cui等研究了基于单步检测网络的小目标定位问题. Wang等介绍了如何有效利用三维混合形状信息来提升人脸表情识别精度.


点击"
阅读原文
"下载文章原文!

您可能还感兴趣:计算机视觉中的深度学习专题简介
观点与争鸣 | 探究平均准确度AP指标的缺陷及其影响

零样本图像分类十年进展


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存