查看原文
其他

ICCV Tutorial 强势来袭,邀你共襄计算机视觉研讨盛会!

OpenMMLab 2024-04-23

The following article is from 上海人工智能实验室 Author Shanghai AI Lab

2023年度计算机视觉国际大会(International Conference on Computer Vision, ICCV)召开在即,上海人工智能实验室(上海AI实验室)将举办ICCV Tutorial研讨会,以OpenMMLab: Open-source Platform for Vision, Language and Generative AI为主题,诚邀人工智能领域研究者共话AI领域开源的变革与趋势,共同探讨AI开源算法与数据平台等相关课题。


ICCV是计算机领域世界顶级的学术会议之一,与CVPR、ECCV并称计算机视觉三大顶会,每两年举办一次。会议上将颁发最佳论文奖(Marr Prize)和最佳论文提名奖。本届会议将于10月2日至6日在法国巴黎举行。


今年7月,ICCV公布本届大会论文收录结果,共计2160篇论文入选。在开源社区HuggingFace已展示的1142篇入选论文中,50篇论文涉及的研究成果基于OpenMMLab系算法库产生。

活动时间

UTC+8 中国:15:00 - 17:45(10月2日)

UTC+2 法国:09:00 - 11:45(10月2日)

活动地址

Paris Convention Center, @Room P02 | Paris, France

活动详情

https://openmmlab.com/community/iccv2023-tutorial

(点击文末阅读原文直达)




分享主题




Talk 1

OpenMMLab:视觉、语言与生成式人工智能开源平台

Kai Chen

上海AI实验室

青年科学家

所负责的OpenMMLab开源项目在GitHub上获得了超过9.2万个星标,是深度学习时代极具影响力的计算机视觉开源算法体系,用户遍及110个国家和地区,获国内600余家企业和高校使用,在学术界和工业界产生了广泛影响。在计算机视觉顶级会议和期刊上发表了三十余篇论文,谷歌学术引用超过8000次,并多次在国际学术竞赛中获奖。


分享内容

第一部分:OpenMMLab总体介绍,包括整体架构、模块设计及其影响力。
第二部分:工具箱的基本使用,包括训练和模型部署,以及运用 OpenMMLab 进行研究和生产的实践。
第三部分:书生·浦语(InternLM)开源体系介绍。


Talk 2

OpenMMLab基础模型研究进展

Songyang Zhang

上海AI实验室

青年研究员

在基础模型相关方向开展的算法研究和开源平台建设,带领团队开发并维护了OpenMMLab中的多模态算法库MMPreTrain、以及大模型评测平台OpenCompass。在计算机视觉领域的顶级会议和期刊上发表了约20篇论文,谷歌学术论文引用1000余次。


分享内容

将分享视觉基础模型与多模态模型的最新进展,并介绍相关的开源算法库。内容分为以下四个部分:

1. 第一部分:深度学习基础模型库(MMPreTrain)。将展示该基础模型发展的里程碑工作,并详细展示该模型库的整体设计和特点。
2. 第二部分:多模态学习的最新进展。本部分将首先介绍多模态学习的社区进展,并分享如何使用MMPreTrain进行多模态学习。
3. 第三部分:使用基础模型进行图像分类和自监督学习实践,并展示如何使用MMPreTrain来进行图像分类任务和自监督学习。
4. 第四部分:介绍如何使用OpenCompass开展基础模型的评测与分析工作(包括视觉模型、大语言模型和多模态模型)。


Talk 3

MMDetection:从通用目标检测迈向多模态智能体

Wenwei Zhang

上海AI实验室

青年研究员

负责OpenMMLab计算机视觉算法开放体系中算法库基础架构的整体设计、MMDetection和MMDetection3D等算法库的设计与开发。在顶级会议和期刊上发表论文约20篇,曾2019年目标检测领域权威学术竞赛COCO 比赛第一名,2020年3D目标检测领域权威竞赛nuScenes比赛 Best PKL Award。


分享内容

高效运用MMDetection 3.0进行与目标检测相关的研究项目。

第一部分:目标检测、实例分割和全景分割。深入探讨上述领域的问题定义、挑战和代表性方法,展现目标检测全景。
第二部分:MMDetection,即OpenMMLab检测工具箱和基准测试、目标检测中最受欢迎的工具箱之一,也是MMDetection3D和MMTracking等许多工具箱的基础。深入讲解MMDetection 3.0的模块化设计和模型库。
第三部分:智能体工具箱Lagent,该工具箱实现了基于大语言模型的智能体系统,能够支持大语言模型调用MMDetection提供的目标检测器。本部分将介绍Lagent的简洁设计以及它如何使用目标检测器完成多模态智能体的任务。


Talk 4

MMagic —— 图像与视频生成、编辑及增强工具库

Yanhong Zeng

上海AI实验室

青年研究员

研究方向为图像和视频的生成与编辑,在顶级国际学术期刊与会议上发表多篇论文,包括CVPR/ECCV/NeurIPS/TVCG,同时担任多个国际顶级会议和期刊的审稿人,包括ICML/ICLR/NeurIPS/CVPR/TIP/TVCG等。


分享内容

前沿开源工具箱MMagic及图像与视频生成、编辑和增强领域的先进研究成果。

第一部分:介绍图像和视频生成、编辑和增强任务。分享该领域中经典和主流任务、挑战以及最新研究成果。
第二部分:将从整体设计和实现的角度介绍MMagic开源工具箱。MMagic支持图像及视频生成、编辑和增强领域的各种任务(如图像超分辨率、文本到图像等)和模型(如GAN、扩散模型等),为相关任务提供了统一灵活的解决方案。
第三部分:将介绍如何使用MMagic快速运行预训练模型,以及如何为不同任务设计全新模型。


Talk 5

OpenDataLab —— 一个面向人工智能的开放数据平台

Bin Wang

上海AI实验室

青年研究员

带领算法团队进行多模态大模型数据相关的算法研究,曾于ICCV、MICCAI和IJCAI等学术顶会上发表系列论文并在多个国际赛事中获得奖项。代表工作有 《V3Det: Vast Vocabulary Visual Detection Dataset》(ICCV 2023)、《Boundary perception guidance: A scribble-supervised semantic segmentation approach》(IJCAI 2019)。


分享内容

第一部分:OpenDataLab整体介绍,包括开放数据集平台、开源数据处理工具箱和数据集描述语言(DSDL)。
第二部分:OpenDataLab支持的开源数据工具包相关研究工作。
第三部分:探索定义数据集描述语言以及如何使用它来规范不同任务、格式和模态的数据集。

诚邀相关领域研究者参与研讨会,填写下方的问卷获取更多参会信息。



PyTorch 源码解读之流水线并行

2023-09-27

三模态版ChatGPT震撼来袭,OpenAI卷起来了

2023-09-26

如何在秋招脱颖而出,从理论到实战的经验分享 |《offer来了》第2期

2023-09-22


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存