讲座预告丨AI 论文背后的故事 - 系列讲座第二期
AI 论文背后的故事
AI Paper Story Sharing(PaSS)
2022
系列讲座第二期
Seminar
01
讲座信息
讲座题目
自监督预训练之视觉掩码预测:方法、机理与数据可扩展性
Swin Transformer (ICCV 2021 Best Paper)与SimMIM (CVPR 2022)背后的故事
讲座时间
2022年7月8日周五 14:00-15:30
讲者
曹越,微软亚洲研究院视觉计算组主管研究员
组织机构
香港中文大学(深圳)理工学院,GAP-Lab,未来智联网络研究院
主持
香港中文大学(深圳)理工学院在读博士生吴毓双,闫子正
语言
中文
线上直播链接(B站直播)
https://live.bilibili.com/25109461
02
讲座摘要
人工智能领域的发展是一个关于走向统一的故事,2018年BERT的出现使得掩码预测任务作为自监督预训练席卷自然语言处理领域,近期,视觉掩码预测任务(Masked Visual modeling)在视觉学习中被逐渐发掘出潜力,这也使得计算机视觉与自然语言两个领域进一步走向统一。在本次报告中,将从三个方面介绍对于图像掩码预测作为自监督预训练任务的研究:如何设计一种简单而有效的图像掩码预测方法;如何理解图像掩码预测有效性背后的机理;图像掩码预测方法是否具有数据的可扩展性。
03
讲者介绍
曹越
微软亚洲研究院
视觉计算组主管研究员
曹越,现任微软亚洲研究院视觉计算组主管研究员,分别于 2014 年和 2019 年在清华大学软件学院获得本科和博士学位,代表作有Swin Transformer、GCNet与VL-BERT等,曾于 2017 年获微软学者奖学金、2018 年获清华大学特等奖学金与林枫辅导员奖,2021年获 ICCV 最佳论文奖—马尔奖。至今在 CVPR, ICCV, ICLR, ICML, NeurIPS等国际顶级会议和期刊中发表论文30余篇,其中有四篇入围 PaperDigest Most Influential Papers榜单,谷歌引用一万余次。目前主要的研究兴趣是自监督学习、多模态学习和Transformer建模。
04
关于GAP-Lab
The GAP lab is based on School of Science and Engineering (SSE) and Future Network of Intelligence Institute (FNii) at The Chinese University of Hong Kong, Shenzhen (CUHK-SZ), led by Dr. Xiaoguang Han. We are aiming to identify and bridge the research gaps, in the area of generalizing and analyzing images, videos and 3D content (e.g., points and meshes). The research field covers computer vision, computer graphics and machine learning. We are also doing applied research on intelligent medical image analysis and image-based weather forecasting.
For more details, please refer to http://gaplab.cuhk.edu.cn/
关注GAP-Lab公众号
点击以下链接,进入理工时刻:
科研速递 | 理工学院唐本忠院士团队赵征教授受邀在《中国科学:化学》发表综述
Long Feng Science Forum Seminar Series | Seminar #1
翔龙鸣凤科学论坛研讨会系列 | 界面问题的模型、理论与算法国际研讨会