查看原文
其他

专题综述 | 高效的视觉识别: 最新进展及类脑方法综述

MIR编辑部 机器智能研究MIR 2022-12-11

Machine Intelligence Research

视觉识别是当前计算机视觉、模式识别乃至人工智能领域中最重要、最活跃的研究领域之一。它非常重要且具有强烈的工业需求。特别是现代深度神经网络(DNNs)和一些脑启发的方法,凭借大量的训练数据和新的高性能计算资源,在许多具体任务中极大地提高了识别性能。虽然识别精度通常是最新研究的首要关注点,但效率对于学术研究和工业应用有时显得更为重要且关键。


腾讯伍洋专家研究员、中科院自动化所李国齐研究员、西安交通大学王鼎衡博士、西安电子科技大学董伟生教授和宾夕法尼亚大学史建波教授团队首次综述了使用DNNs的高效视觉识别算法,特别是包括事件数据和SNNs的脑启发方法。文章旨在从多个方面对该领域研究进展及趋势进行系统性的综述,涵盖多种主要视觉数据类型、各种识别模型、网络压缩算法以及高效推理等内容。全文已开放发表于Machine Intelligence Research第五期专题中。




图片来自Springer



全文下载:

Efficient Visual Recognition: A Survey on Recent Advances and Brain-inspired Methodologies

Yang Wu, Ding-Heng Wang, Xiao-Tong Lu, Fan Yang, Man Yao, Wei-Sheng Dong, Jian-Bo Shi, Guo-Qi Li

① Springer主页:

https://link.springer.com/article/1‍0.1007/s11633‍-022-1340-5‍

② MIR官网:

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1340-5 

(如链接无法打开,请复制网址至浏览器打开)


全文导读


深度神经网络(DNNs)在许多视觉识别任务中取得了巨大成功,极大地改善了长期存在的相关问题,如手写数字识别、人脸识别图像分类等。DNNs还可以拓展新的应用领域边界,包括图像和视频字幕的研究身体姿势估计以及其他许多相关研究。然而,这些成功通常需要大量高质量的手工标记训练数据和最新最先进的计算资源。


显然,这两个条件在多数对成本敏感的应用中通常难以满足。即使在大量数据标记工作者的努力下使人们确实拥有了足够高质量的训练数据,但如何在有限的资源和可接受的时间内训练出有效的模型也是一个巨大的挑战。


假设模型可以通过某种方式最终被训练好(不计成本的情况下),如何恰当的在终端用户的实际应用场景下完成模型部署也绝非易事。这主要是因为运行时的推理必须适配可用的或负担得起的资源,并且运行速度必须满足实时甚至更高的实际需求。因此,除了学术界最关心的准确性之外,效率是另一个重要问题,也是大多数情况下实际应用中不可或缺的要求。


尽管大多数使用DNN进行视觉识别任务的研究都集中在准确性上,但在效率方面,尤其是最近几年,仍有许多令人鼓舞的进展。例如,当前已经发表了一些关于DNNs效率问题的综述文章,详见原文第1.1节。


然而,没有一篇论文主要关注视觉识别任务,尤其缺乏有效处理视觉数据的研究,而视觉数据有其自身的属性。同时,受人脑启发的、所谓的第三代高效神经网络模型,即脉冲神经网络(SNN),也缺乏相关讨论和研究。


实际上,有效的视觉识别必须是一个系统性的解决方案,不仅要考虑紧凑/压缩网络、有效的动态推理和硬件加速,还要考虑对视觉数据的适当处理,这些数据可能以各种形态存在(如图像、视频、点和脑启发的事件),具有截然不同的属性。


于是,本文首次综述了使用DNNs的高效视觉识别算法,特别是包括事件数据和SNN的脑启发方法。文章基于作者的专业性及研究经验,旨在从多个方面对该领域研究进展及趋势进行系统的综述,涵盖多种主要视觉数据类型、各种识别模型、网络压缩算法以及有效推理等内容。



全文下载:

Efficient Visual Recognition: A Survey on Recent Advances and Brain-inspired Methodologies

Yang Wu, Ding-Heng Wang, Xiao-Tong Lu, Fan Yang, Man Yao, Wei-Sheng Dong, Jian-Bo Shi, Guo-Qi Li

① Springer主页:

https://link.springer.com/art‍icle/1‍0.1007/s11633-022-1340-5‍

② MIR官网:

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1340-5 

(如链接无法打开,请复制网址至浏览器打开)


【本文作者】


伍洋

王鼎衡

路小同


杨帆

姚满

董伟生


史建波

李国齐





纸刊免费寄送Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接或扫描下方二维码填写收件地址,编辑部将在7个工作日内为您免费寄送纸版全文!

收件信息登记:

https://www.wjx.cn/vm/rfQWEKc.aspx 


特别感谢本文通讯作者、中科院自动化所李国齐研究员对以上内容的审阅和修改!




关于Machine Intelligence Research


Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等数据库收录。



好文推荐Top综述集锦 | 进化计算、知识挖掘、自然语言处理、人脸素描合成、机器人辅助手术...
戴琼海院士团队 | 用以图像去遮挡的基于事件增强的多模态融合混合网络ETH Zurich重磅综述 | 人脸-素描合成:一个新的挑战综述:从远程操作到自动机器人辅助显微手术
主编谭铁牛院士寄语, MIR第一期正式出版!华南理工詹志辉团队 | 综述: 面向昂贵优化的进化计算
北科大殷绪成团队 | 弱相关知识集成的小样本图像分类
东南大学张敏灵团队 | 基于选择性特征增广的多维分类方法联想CTO芮勇团队 | 知识挖掘:跨领域的综述中科院自动化所何晖光团队 | 一种基于RGEC的新型网络最新好文 | 基于因果推断的可解释对抗防御
复旦邱锡鹏团队 | 综述:自然语言处理中的范式转换
精选综述 | 用于白内障分级/分类的机器学习技术



数据库收录信息喜报 | MIR被 ESCI 收录!喜报 | MIR 被 EI 与 Scopus 数据库收录新春喜报!MIR入选“中国科技核心期刊


点击"阅读原文"下载全文

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存