查看原文
其他

海康威视研究院浦世亮等 | 基于场景自适应概念学习的无监督目标检测

浦世亮,谢迪,等 信息与电子工程前沿FITEE 2022-10-01

内容介绍


中文摘要:

目标检测是机器视觉领域最热门的研究方向之一,在学术界已取得令人瞩目的成果,在工业界也存在许多有价值的应用。然而,主流的检测方法仍有两个缺陷:(1)即使是经过大量数据有效训练的模型,仍然无法很好地泛化到新场景中;(2)模型一旦部署到位,则无法随着不断累积的无标注数据自主进化。为克服上述问题,受视觉知识理论启发,提出一种场景自适应进化的无监督视频目标检测算法,该算法可利用目标群体概念,降低场景变化带来的不利影响。首先通过预训练检测模型从无标注数据中提取大量候选目标,然后对候选目标聚类,构建目标概念的视觉知识字典,其中各个聚类中心代表一种目标原型。其次,通过研究不同目标簇和不同群体目标信息之间的关系,提出基于图的群体信息传播策略以判断目标概念的归属,可有效区分候选目标。最终,利用收集到的伪类标微调预训练模型,实现算法对新场景的自适应。算法的有效性得到多个不同实验的验证,且性能提升显著。


关键词:

视觉知识;无监督视频目标检测;场景自适应学习


作者:

浦世亮1,赵暐1,陈伟杰1,杨世才1,谢迪1,潘云鹤2


单位:
1海康威视研究院,中国杭州市,310051
2浙江大学计算机科学与技术学院,中国杭州市,310027

本文引用格式:
Shiliang PU, Wei ZHAO, Weijie CHEN, Shicai YANG, Di XIE, Yunhe PAN, 2021. Unsupervised object detection with scene-adaptive concept learning. Frontiers of Information Technology & Electronic Engineering, 22(5):638-651.
 https://doi.org/10.1631/FITEE.2000567


本文精要导读:

点击下方“阅读全文”,下载全文PDF


相关阅读:
潘云鹤院士 | 论视觉知识
FITEE 2021年第5期摘要(首期“视觉知识专栏”)
潘云鹤院士|视觉知识的五个基本问题
浙江大学庄越挺教授|视觉知识:智能创意初探
天津大学韩亚洪等 | 面向视觉常识推理的有向视觉连接



关于本刊

Frontiers of Information Technology & Electronic Engineering(简称FITEE,中文名《信息与电子工程前沿(英文)》,ISSN 2095-9184,CN 33-1389/TP)是信息电子类综合性英文学术月刊,SCI-E、EI收录,最新影响因子1.604,进入JCR Q2分区。前身为2010年创办的《浙江大学学报英文版C辑:计算机与电子》,2015年更为现名,现为中国工程院信息与电子工程学部唯一院刊。覆盖计算机、信息与通信、控制、电子、光学等领域。文章类型包括研究论文、综述、个人视点、评述等。现任主编为中国工程院院士潘云鹤、卢锡城。实行国际同行评审制,初次转达意见一般在2~3个月内。文章一经录用将快速在线。

2019年,荣获中国科协等七部委推出的中国科技期刊卓越行动计划项目资助(梯队期刊)。


官网http://www.jzus.zju.edu.cn

期刊Springer主页

http://www.springer.com/computer/journal/11714

在线投稿

http://www.editorialmanager.com/zusc


更多信息,请见:FITEE影响因子提升55%,首次跨入Q2区

微信加群

为方便广大科研人员交流讨论,本平台建有以下学科微信群。有需要加群的用户,请加小编个人微信号fitee_xb,并留言想要加入的群,小编会拉您进群。营销广告人员请勿扰。

计算机科学与技术学术群

光学工程与技术学术群

控制科学与技术学术群

信息与通信学术群

电力电子学术群

人工智能学术


加关注  ID: fitee_cae

本公众号为中国工程院院刊《信息与电子工程前沿(英文)》(SCI-E、EI检索期刊)官方微信,功能包括:传播期刊的学术文章;为刊物关联学人(读者、作者、评审人、编委,等)提供便捷服务;发布学术写作、评审、编辑、出版等相关资讯;介绍信息与电子工程领域学术人物、学术思想、学术成果,展示该领域科学研究前沿进展;为该领域海内外学者提供友好互动平台。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存