【直播】智能信息处理前沿技术及应用学术会议
直播信息
会议名称
2022全国科技工作者日活动智能信息处理前沿技术及应用学术会议
报告时间
2022年6月12日 8:30
主办方
中国电子学会信号处理分会
中国仪器仪表学会信号处理分会
直播二维码
会议介绍
会议议程
报告嘉宾
题目:强干扰复杂场景的红外智能制导
摘要:现代化战争中导弹开局已成为首选,而在强干扰复杂场景下智能制导面临目标检不准、区域跟踪跟不上、检测跟踪结果不可信等挑战问题;本报告根据具体场景应用的需要,提出了抗干扰的弹载轻量目标检测模型、场景自适应区域跟踪、数据学习与常识推理结合的结果确认等技术,实现了强干扰复杂场景的红外智能制导。此外,报告还介绍了当前人工智能在常识推理、不确定性推理、跨时空尺度的内容分析等方面面临的难题。
题目:神经科学启发的深度学习模型及其在视觉时空信息感知与理解中的应用
摘要:分析神经科学与计算机视觉之间的关系。从以几方面总结神经科学对计算机视觉的启发点:A) 基本视觉皮层的特征;B) 初级视皮层的原理扩展到高级区域;C) 顺向、逆向、侧向联接;D) 视觉神经分层认知机制;E) 视觉神经系统的选择性注意机制;F) 动态信息的选择性记忆机制。介绍本团队在基于各向异性膨胀网络的物体检测、基于深度时空自组织神经网络的运动检测、基于编解码孪生神经网络的目标跟踪、基于时空金字塔注意力神经网络的行为理解和长短时记忆序列卷积神经网络的行为语义描述等方面的研究工作。介绍本团队在手机特定视频检测装备、互联网交换机端异质媒体监测设备和网络直播智能审核系统等实际应用方面的工作。
题目:Cross-Media Intelligence
Distinguished Professor Heng Tao Shen, Fellow of ACM/IEEE/OSA and Clarivate Highly Cited Researcher, is Dean of School of Computer Science and Engineering at UESTC, Dean of Sichuan AI Research Institute, and Chief Scientist of Vision Intelligence at Peng Cheng Laboratory. He obtained his BSc with First Class Honours and PhD from Department of Computer Science at National University of Singapore in 2000 and 2004 respectively. He was a professor at the University of Queensland before joining UESTC. His research has made contributions to the field of hashing big multimedia data, from hashing theory, to algorithms and applications, and he has led the charge to address the challenging problem of cross-media intelligence. He has published 350+ peer-reviewed papers, including 130+ IEEE/ACM Transactions, and 250+ CCF-A ranked papers. He has received 8 Best Paper Awards, including ACM Multimedia 2017, ACM SIGIR 2017, and IEEE Transactions on Multimedia 2020. He is General Co-Chair of ACM Multimedia 2021, TPC Co-Chair of ACM Multimedia 2015, Associate Editor-in-Chief of Journal of Computer Applications, Associate Editor of ACM Transactions of Data Science, IEEE Transactions on Image Processing, IEEE Transactions on Multimedia, IEEE Transactions on Knowledge and Data Engineering, Pattern Recognition, and Journal of Software.
摘要:Nowadays applications typically acquire and analyse data of different media types together for intelligent process and decision making, such as robotics, self-driving, medical diagnose, smart city, meta universe, and so on. It has been shown that heterogeneous multimedia data gathered from different sources in different media types can be often complementary and correlated in the knowledge space. Towards cross-media intelligence, cross-media accessibility, connectivity, interactivity and reliability have attracted huge amount of attention due to its significance in both research communities and industries. In this talk, we will introduce the state of the art on this topic and discuss its future trends.
题目:细粒度多模态分析与生成
彭宇新,北京大学二级教授、博雅特聘教授、国家杰出青年科学基金获得者、国家万人计划科技创新领军人才、科技部中青年科技创新领军人才、863项目首席专家、中国人工智能产业创新联盟专家委员会主任、中国工程院“人工智能2.0”规划专家委员会专家、北京图象图形学学会副理事长、中国图象图形学学会会士、副秘书长、提名与奖励委员会副主任。主要研究方向为跨媒体分析、计算机视觉、机器学习、人工智能。以第一完成人获2016年北京市科学技术奖一等奖和2020年中国电子学会科技进步一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然科学基金重点等30多个项目,发表论文160多篇,包括ACM/IEEE Trans和CCF A类论文70多篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频样例搜索比赛,均获第一名。主持研发的跨媒体互联网内容分析与识别系统已经应用于公安部、工信部、国家广播电视总局等单位。担任IEEE TCSVT等期刊编委。
摘要:互联网数据具有图像、文本、视频、音频等多模态并存的特点,而现有多模态分析与生成技术通常聚焦于粗粒度的大类,难以满足医疗、农业、海洋、交通等诸多领域的精细化需求。而细粒度多模态分析与生成旨在使计算机能够对多模态内容进行精细化分析与生成,例如将皮肤病图像细分为黑色素瘤、黑素细胞痣等各种子类别,根据细粒度文本描述自动生成各种鸟类图像。其挑战在于不同类别差异小,相同类别差异大。如何借鉴人脑的认知机理,模拟注意力机制学习多粒度的辨识性特征,突破细粒度多模态分析与生成难题,对于提高计算机的感知和认知能力至关重要。本报告将介绍我们在细粒度多模态分析与生成上的相关研究进展,包括细粒度图像分类、细粒度跨媒体检索、细粒度文本到视觉内容生成。
题目:通用多模态学习
俞俊,杭州电子科技大学教授、博士生导师,国家杰出青年基金获得者。主要研究方向为跨媒体分析技术。相关工作发表于SCI源期刊论文100余篇,包括ACM汇刊与IEEE汇刊及CCF A类会议40余篇。论文的Google Scholar引用次数7000余次。10余篇论文入选ESI高被引/热点论文;近年来主持国家自然科学基金重点项目、国家自然科学基金面上项目等,2015、2016、2017连续获得IEEE TMM、TIP、TCYB最佳论文奖,2018年教育部自然科学二等奖,2021年浙江省自然科学一等奖。担任多个国际期刊的副编辑。
摘要:使用深度神经网络对视觉、语言等不同模态信息进行统一建模的多模态深度学习是近年来的研究热点,在跨媒体检索、视觉内容描述、视觉问答等典型的多模态深度学习任务上均取得了显著的进展。得益于深度自注意力网络模型Transformer和预训练方法BERT在自然语言领域的快速发展,多模态深度学习的研究逐渐由各个任务“分而治之”向“通用统一”的方向演变,即使用单个框架适配多种类型不同的多模态任务。本报告首先对多模态深度学习发展过程中的代表性工作进行简要介绍;然后对当前通用多模态深度学习领域的三类代表性方法:基于多模态多任务联合学习、多模态神经架构搜索、多模态预训练的若干代表性工作进行详细介绍;最后,对通用多模态深度学习未来的发展进行展望和反思。
执行主席
赵耀,长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才。现任北京交通大学信息科学研究所所长,“现代信息科学与网络技术”北京市重点实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数媒体内容安全,媒体内容分析与理解,人工智能等。主持了国家重点研发计划、973计划等课题30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获北京市科学技术奖一等奖等省部级奖励4项。指导的博士生7人获北京市和中国计算机学会优秀博士论文奖。受邀担任了 IEEE Transactions on Cybernetics、IEEE Transactions on Circuits and Systems for Video Technology等多个国际杂志编委。他是国务院学科评议组成员,科技部重点研发计划云计算与大数据专项总体组专家。
扩展阅读
2.【姑苏材料论坛】王一舟研究员:人工智能的传统技术和深度学习技术的结合、 落地和产业方向探索
3.【博士创『芯』说】艾鹏程:用于探测器前端电子学的人工智能专用芯片
编辑:黄琦
蔻享学术平台,国内领先的一站式科学资源共享平台,依托国内外一流科研院所、高等院校和企业的科研力量,聚焦前沿科学,以优化科研创新环境、传播和服务科学、促进学科交叉融合为宗旨,打造优质学术资源的共享数据平台。
版权说明:未经授权严禁任何形式的媒体转载和摘编,并且严禁转载至微信以外的平台!
原创文章首发于蔻享学术,仅代表作者观点,不代表蔻享学术立场。
转载请在『蔻享学术』公众号后台留言。
点击阅读原文~发现惊喜!