查看原文
其他

【直播】智能信息处理前沿技术及应用学术会议

KouShare 蔻享学术 2022-07-11





直播信息

会议名称

2022全国科技工作者日活动智能信息处理前沿技术及应用学术会议

报告时间

2022年6月12日 8:30

主办方

中国电子学会信号处理分会

中国仪器仪表学会信号处理分会

直播二维码


会议介绍

智能信息处理是当前科学技术发展中的前沿学科,同时也是新思想、新观念、新理论、新技术不断出现并迅速发展的新兴学科,具有非常广泛的应用领域。本次活动邀请了5位智能信息处理领域的知名专家,分别针对当前人工智能中的红外智能制导、类脑感知与学习、跨模态智能分析、细粒度多模态分析与生成以及多模态深度学习等方面展开深入探讨。


会议议程


报告嘉宾

题目:强干扰复杂场景的红外智能制导


李波,北京航空航天大学计算机学院长江学者特聘教授、杰青,北航人工智能研究院常务副院长。兼任国务院学位委员会软件工程学科评议组成员、教育部人工智能科技创新专家组工作组副组长、军委装备发展部人工智能装备应用基础技术专家组成员。当前主要研究方向为计算机视觉、机器学习、知识推理、嵌入式智能系统。已主持国家、省部级课题40余项,是国家重点研发计划项目“公共安全监控视频安全共享与特征分析关键技术研究”项目负责人、国家973计划项目“数字媒体理解的理论与方法研究”首席科学家,原总装“十五”、“十二五”某边海防视频系统型号总设计师。在本领域重要期刊和国际学术会议发表学术论文100余篇,有国内外发明专利80余项,获国家技术发明二等奖1项、国家科技进步二等奖1项。
摘要:现代化战争中导弹开局已成为首选,而在强干扰复杂场景下智能制导面临目标检不准、区域跟踪跟不上、检测跟踪结果不可信等挑战问题;本报告根据具体场景应用的需要,提出了抗干扰的弹载轻量目标检测模型、场景自适应区域跟踪、数据学习与常识推理结合的结果确认等技术,实现了强干扰复杂场景的红外智能制导。此外,报告还介绍了当前人工智能在常识推理、不确定性推理、跨时空尺度的内容分析等方面面临的难题。

题目:神经科学启发的深度学习模型及其在视觉时空信息感知与理解中的应用

胡卫明,中国科学院自动化研究所模式识别国家重点实验室研究员(二级)、博士生导师、视频内容安全研究团队负责人,国家杰出青年科学基金获得者、中组部万人计划科技创新领军人才入选者、科技部中青年科技创新领军人才入选者、人社部百千万人才工程国家级人选、国家有突出贡献中青年专家、享受国务院政府特殊津贴、国家863重点专项项目首席专家,IEEE Trans. on Cybernetics的Associate Editor。目前研究方向为网络多媒体敏感内容识别、视觉运动分析等,主持了国家自然科学基金重点项目、国家863重点专项项目、目标导向类课题等四十余项科研项目。已在PAMI、IJCV等国际刊物、国内一级刊物以及ICCV、ECCV、CVPR等重要国际学术会议上发表论文300余篇,获授权发明专利50余项。带领团队完成的敏感图像视频识别等技术应用于五十余家企事业单位,已在实战发挥作用,取得了显著的经济效益和社会效益。以第一完成人获国家自然科学二等奖、北京市科学技术(技术发明类)一等奖、北京市发明专利一等奖和吴文俊人工智能科学技术一等奖。
摘要:分析神经科学与计算机视觉之间的关系。从以几方面总结神经科学对计算机视觉的启发点:A) 基本视觉皮层的特征;B) 初级视皮层的原理扩展到高级区域;C) 顺向、逆向、侧向联接;D) 视觉神经分层认知机制;E) 视觉神经系统的选择性注意机制;F) 动态信息的选择性记忆机制。介绍本团队在基于各向异性膨胀网络的物体检测、基于深度时空自组织神经网络的运动检测、基于编解码孪生神经网络的目标跟踪、基于时空金字塔注意力神经网络的行为理解和长短时记忆序列卷积神经网络的行为语义描述等方面的研究工作。介绍本团队在手机特定视频检测装备、互联网交换机端异质媒体监测设备和网络直播智能审核系统等实际应用方面的工作。

题目:Cross-Media Intelligence



Distinguished Professor Heng Tao Shen, Fellow of ACM/IEEE/OSA and Clarivate Highly Cited Researcher, is Dean of School of Computer Science and Engineering at UESTC, Dean of Sichuan AI Research Institute, and Chief Scientist of Vision Intelligence at Peng Cheng Laboratory. He obtained his BSc with First Class Honours and PhD from Department of Computer Science at National University of Singapore in 2000 and 2004 respectively. He was a professor at the University of Queensland before joining UESTC. His research has made contributions to the field of hashing big multimedia data, from hashing theory, to algorithms and applications, and he has led the charge to address the challenging problem of cross-media intelligence. He has published 350+ peer-reviewed papers, including 130+ IEEE/ACM Transactions, and 250+ CCF-A ranked papers. He has received 8 Best Paper Awards, including  ACM Multimedia 2017, ACM SIGIR 2017, and IEEE Transactions on Multimedia 2020. He is General Co-Chair of ACM Multimedia 2021, TPC Co-Chair of ACM Multimedia 2015, Associate Editor-in-Chief of Journal of Computer Applications,  Associate Editor of ACM Transactions of Data Science, IEEE Transactions on Image Processing, IEEE Transactions on Multimedia, IEEE Transactions on Knowledge and Data Engineering, Pattern Recognition, and Journal of Software.
摘要:Nowadays applications typically acquire and analyse data of different media types together for intelligent process and decision making, such as robotics, self-driving, medical diagnose, smart city,  meta universe, and so on. It has been shown that heterogeneous multimedia data gathered from different sources in different media types can be often complementary and correlated in the knowledge space.  Towards cross-media intelligence, cross-media accessibility,  connectivity, interactivity and reliability have attracted huge amount of attention due to its significance in both research communities and industries. In this talk, we will introduce the state of the art on this topic and discuss its future trends.

题目:细粒度多模态分析与生成

彭宇新,北京大学二级教授、博雅特聘教授、国家杰出青年科学基金获得者、国家万人计划科技创新领军人才、科技部中青年科技创新领军人才、863项目首席专家、中国人工智能产业创新联盟专家委员会主任、中国工程院“人工智能2.0”规划专家委员会专家、北京图象图形学学会副理事长、中国图象图形学学会会士、副秘书长、提名与奖励委员会副主任。主要研究方向为跨媒体分析、计算机视觉、机器学习、人工智能。以第一完成人获2016年北京市科学技术奖一等奖和2020年中国电子学会科技进步一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然科学基金重点等30多个项目,发表论文160多篇,包括ACM/IEEE Trans和CCF A类论文70多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任IEEE TCSVT等期刊编委。


摘要:互联网数据具有图像、文本、视频、音频等多模态并存的特点,而现有多模态分析与生成技术通常聚焦于粗粒度的大类,难以满足医疗、农业、海洋、交通等诸多领域的精细化需求。而细粒度多模态分析与生成旨在使计算机能够对多模态内容进行精细化分析与生成,例如将皮肤病图像细分为黑色素瘤、黑素细胞痣等各种子类别,根据细粒度文本描述自动生成各种鸟类图像。其挑战在于不同类别差异小,相同类别差异大。如何借鉴人脑的认知机理,模拟注意力机制学习多粒度的辨识性特征,突破细粒度多模态分析与生成难题,对于提高计算机的感知和认知能力至关重要。本报告将介绍我们在细粒度多模态分析与生成上的相关研究进展,包括细粒度图像分类、细粒度跨媒体检索、细粒度文本到视觉内容生成。


题目:通用多模态学习


俞俊,杭州电子科技大学教授、博士生导师,国家杰出青年基金获得者。主要研究方向为跨媒体分析技术。相关工作发表于SCI源期刊论文100余篇,包括ACM汇刊与IEEE汇刊及CCF A类会议40余篇。论文的Google Scholar引用次数7000余次。10余篇论文入选ESI高被引/热点论文;近年来主持国家自然科学基金重点项目、国家自然科学基金面上项目等,2015、2016、2017连续获得IEEE TMM、TIP、TCYB最佳论文奖,2018年教育部自然科学二等奖,2021年浙江省自然科学一等奖。担任多个国际期刊的副编辑。


摘要:使用深度神经网络对视觉、语言等不同模态信息进行统一建模的多模态深度学习是近年来的研究热点,在跨媒体检索、视觉内容描述、视觉问答等典型的多模态深度学习任务上均取得了显著的进展。得益于深度自注意力网络模型Transformer和预训练方法BERT在自然语言领域的快速发展,多模态深度学习的研究逐渐由各个任务“分而治之”向“通用统一”的方向演变,即使用单个框架适配多种类型不同的多模态任务。本报告首先对多模态深度学习发展过程中的代表性工作进行简要介绍;然后对当前通用多模态深度学习领域的三类代表性方法:基于多模态多任务联合学习、多模态神经架构搜索、多模态预训练的若干代表性工作进行详细介绍;最后,对通用多模态深度学习未来的发展进行展望和反思。


执行主席

赵耀,长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才。现任北京交通大学信息科学研究所所长,“现代信息科学与网络技术”北京市重点实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数媒体内容安全,媒体内容分析与理解,人工智能等。主持了国家重点研发计划、973计划等课题30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获北京市科学技术奖一等奖等省部级奖励4项。指导的博士生7人获北京市和中国计算机学会优秀博士论文奖。受邀担任了 IEEE Transactions on Cybernetics、IEEE Transactions on Circuits and Systems for Video Technology等多个国际杂志编委。他是国务院学科评议组成员,科技部重点研发计划云计算与大数据专项总体组专家。


毋立芳北京工业大学教授,博士生导师,CSIG理事,BSIG常务理事兼副秘书长,CCF杰出会员,CCF计算机视觉专委会常务委员兼副秘书长,CSIG视觉大数据专委会常务委员。CCF多媒体技术专委会委员,CSIG多媒体技术专委会、机器视觉专委会委员,中国电子学会信号处理分会委员。主要研究方向图像视频内容分析、智能3D打印、人脸活体检测等。近年来承担科技部重点专项课题、国家自然科学基金、北京市科技计划项目、北京市基金重点项目等20余项,在PR、IEEE TCSVT、Neurocomputing、PRL等发表论文100余篇,获授权发明专利40余项。获省部级以上科技奖3项,获中国电子学会优秀科技工作者称号。《信号处理》、《中国科技论文信息卷》、《中国图象图形学报》编委,ICME2017,ICPR2018等国际会议程序委员会委员,参与组织CCCV2017、PRCV2019、NCIG2020、ChinaMM2020等。
魏云超,北京交通大学教授、博导。曾在新加坡国立大学、美国伊利诺伊大学厄巴纳-香槟分校、悉尼科技大学从事研究工作。入选MIT TR35 China,百度AI华人青年学者榜单,国家级青年人才计划,澳大利亚人TOP 40 Rising Star,曾获ImageNet目标检测冠军。Google引用10300多次。主要研究方向包括面向非完美数据的视觉感知和多模态数据分析。

扩展阅读

 

1. AI未来·第四届北京高校人工智能学术论坛

2.【姑苏材料论坛】王一舟研究员:人工智能的传统技术和深度学习技术的结合、 落地和产业方向探索

3.【博士创『芯』说】艾鹏程:用于探测器前端电子学的人工智能专用芯片

4.【未来·有AI 】信息学与人工智能教育专场

5.《科学公开课》系列课程之科幻电影中的人工智能

编辑:黄琦

蔻享学术平台,国内领先的一站式科学资源共享平台,依托国内外一流科研院所、高等院校和企业的科研力量,聚焦前沿科学,以优化科研创新环境、传播和服务科学、促进学科交叉融合为宗旨,打造优质学术资源的共享数据平台。



版权说明:未经授权严禁任何形式的媒体转载和摘编,并且严禁转载至微信以外的平台!


原创文章首发于蔻享学术,仅代表作者观点,不代表蔻享学术立场。

转载请在『蔻享学术』公众号后台留言。


点击阅读原文~发现惊喜!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存