2023领先科技奖之声｜当计算机模拟人类眼睛……

世界互联网大会

2024-07-22

如何模拟大脑的认知机制，实现高效且层次化的视觉内容感知，一直是计算机视觉领域的重大挑战。北京交通大学信息科学研究所所长赵耀表示，“多年来，我们一直致力于研究计算机的视觉基础问题，包括图像分类、物体检测和语义分割等内容，经过不断探索，成功用深度学习的方式解决了图像的多标签分类问题。”

北京交通大学信息科学研究所所长

赵耀

2023年世界互联网大会乌镇峰会期间，15项世界互联网大会领先科技奖在现场发布。其中，由北京交通大学、南开大学联合申报的基础研究组项目“视觉媒体的层次化内容感知”荣获奖项。

赵耀介绍，该成果以视觉媒体为主要研究对象，系统深入地研究了视觉内容层次化感知的相关理论和方法，形成了从图像级、物体级到像素级粗粒度及细粒度的递进感知理论和解决方案，回答了“图像有何物体，物体有何像素，像素是何类别，类别如何细分”的系列问题。

该项目成果的Google引用已超6000次，包括来自图灵奖获得者及100多位IEEE Fellow的引用。“未来，团队还将在基础研究方面借助基础大语言模型等能力，不断探索层次化内容感知的边界。”赵耀表示。

· 点击视频，了解更多

“视觉媒体的层次化内容感知”发布现场 →

✦

相关阅读

✦

✦

关注我们

✦

戳我~ 一键进入官网

继续滑动看下一个

世界互联网大会

向上滑动看下一个