【预告】“生物特征生成与安全”讲习班开始报名
主办单位
中国图象图形学学会
承办单位
学术主任
上课时间及地点
2021年4月24日-25日
日程安排
特邀讲者
陶建华: 语音合成与鉴别
简介:陶建华,中国科学院特聘研究员,CCF常务理事,国家杰出青年基金获得者,科技部中青年科技创新领军人才,模式识别国家重点实验室副主任研究员,中科院自动化所所长助理,中欧信息、自动化与应用数学联合实验室中方主任。先后负责和参与国家级项目(863计划、国家自然科学基金、国际合作)40余项,在包括IEEE Transaction on ASLP、ICASSP、ICSLP、ICCV、ICIP等国内外学术期刊和会议上发表论文300余篇,申请国内发明专利36项,完成多项国家和国际标准。论文和成果曾获国内外学术会议奖励。国际主要期刊IEEE Trans. on Affective Computing 指导委员会委员、Speech Communication 责任编辑、Journal on Multimodal User Interface编委等。所研制的语音识别、语音合成和情感识别产品,分别应用在腾讯、百度、Nuance、联想、搜狗、三星、诺基亚、西门子、东芝、宝马、法国电信、意大利电信等四十余家大型跨国公司产品中,在语音云平台、智能手机和导航设备中获得广泛的应用。研究成果同时还应用在MIT、CMU、Cambridge、清华、中科院计算所等三十多所国内外科研机构的科研项目中。
摘要:近年来语音合成技术取得很大的进展,在特定条件下特定人物的合成语音已接近真人。语音合成与鉴别作为一组“攻”与“防”的耦合技术, 引起了学术界与工业界的广泛关注。本报告拟对语音合成与鉴别的发展进行了梳理与阐释。针对语音合成的适用场景与关键技术点, 分别对身份风格合成、音色与韵律合成、语音模拟三大核心语音合成技术的基本概念、发展历程、优势与不足进行梳理与分析。针对语音合成的应对技术语音鉴别技术, 首先介绍整理了针对性较强、面向参数式语音合成、拼接式语音合成与语音模拟技术框架的应对技术, 在此基础上介绍具有普适性更强的基于深度鉴别网络的语音鉴别研究进展。
操晓春:网络空间视觉内容生成与识别
简介:操晓春,中国科学院信息工程研究所研究员,主要从事计算机视觉基础研究和网络空间内容安全应用研究;国家杰出青年、优秀青年基金获得者,入选国家“万人计划”青年拔尖人才支持计划、中国科学院“百人计划”择优支持(结题优秀);主持科技创新2030“新一代人工智能”重大项目、国家自然科学基金重点/联合基金重点项目数项,兼任IEEE TIP、IEEE TMM、IEEE TCSVT的编委(SAE或AE)、ICCV/CVPR/IJCAI/ICPR Area Chairs、英国工程技术学会(IET) Fellow、中国计算机学会杰出会员、中国电子学会青年科学家俱乐部会员;指导博士生获得CCF优博论文和中科院优博论文各1篇;获得省部级一等奖和二等奖各1项。
孙哲南: 虹膜图像获取与识别
简介:孙哲南,中国科学院自动化研究所副总工程师、研究员和博士生导师、中国科学院大学人工智能学院岗位教授、天津中科智能识别产业技术研究院院长、国际模式识别学会IAPR Fellow和IAPR生物特征识别技术委员会主席、中国人工智能学会模式识别专委会副主任、中国图象图形学学会机器视觉专委会副主任、中国生物识别产业技术创新战略联盟秘书长,国际期刊IEEE Transactions on Biometrics, Behavior, and Identity Science编委,主要研究方向人工智能、生物特征识别、模式识别、计算机视觉,主持国家级科研项目10余项,发表国际期刊和会议论文300多篇,其中包括11篇IEEE TPAMI论文和4篇IJCV论文,获得超过10000次Google学术引用和2000次SCI他引,H因子50,授权发明专利50项,虹膜识别和人脸识别技术孵化了三家高科技企业并在军事、公安、煤矿、手机、银行等领域推广应用,科研成果获得国家技术发明二等奖和中国专利优秀奖,入选国家级领军人才。
摘要:虹膜纹理特征因人而异、稳定不变、安全可靠,是理想的身份认证标识信息。从上世纪90年代以来科研人员一直在探寻获取和识别虹膜图像的有效途径,虹膜识别学科领域经过20年的发展积累了丰富的理论和方法。本报告系统介绍虹膜图像获取、预处理、特征提取与匹配、活体检测、技术应用等方面进展,最后展望可感、可知、可信虹膜识别的发展趋势。
王井东: Human Pose Estimation: HRNet and DEKR
简介:Jingdong Wang is a Senior Principal Research Manager with the Visual Computing Group at Microsoft Research Asia, Beijing, China. He received the B.Eng. and M.Eng. degrees from the Department of Automation at Tsinghua University in 2001 and 2004, respectively, and the PhD degree from the Department of Computer Science and Engineering, the Hong Kong University of Science and Technology, Hong Kong, in 2007. His areas of interest include neural network design, human pose estimation, large-scale indexing, and person re-identification. He is/was an Associate Editor of the IEEE TPAMI, the IEEE TMM and the IEEE TCSVT, and is an area chair of several leading Computer Vision and AI conferences, such as CVPR, ICCV, ECCV, ACM MM, IJCAI, and AAAI. He was elected as an IAPR Fellow, an ACM Distinguished Member, and an Industrial Distinguished Lecturer Program (iDLP) speaker of the IEEE Circuits and Systems Society. His representative works include deep high-resolution network (HRNet), interleaved group convolutions, discriminative regional feature integration (DRFI) for supervised saliency detection, neighborhood graph search (NGS, SPTAG) for large scale similarity search, composite quantization for compact coding, and so on. He has shipped a number of technologies to Microsoft products, including Bing search, Bing Ads, Cognitive service, and XiaoIce Chatbot. The NGS algorithm developed in his group serves as a basic building block in many Microsoft products. In the Bing image search engine, the key color filter function is based on the salient object algorithm developed in his group. He has pioneered in the development of a commercial color-sketch image search system. More information about Dr. Jingdong Wang can be found at https://jingdongwang2017.github.io/.
摘要:Human pose estimation is a problem of predicting the keypoints of each person from images. I will introduce the SOTA backbone architectures for top-down pose estimation: HRNet (CVPR 2019) and its lightweight version Lite-HRNet (CVPR 2021) . In addition, I will present two bottom-up pose estimation solutions: HigherHRNet - a high-quality keypoint heatmap estimation scheme (CVPR 2020), and HRNet-DEKR – a disentangled keypoint regression scheme (CVPR 2021).
王楠楠:异质人脸图像合成与识别
简介:王楠楠,男,华山学者特聘教授,博士生导师。西安电子科技大学综合业务网理论及关键技术国家重点实验室智能信息处理中心主任。近年来从事计算机视觉和统计机器学习方面的研究,在图像跨域重建与识别方面进行了深入研究,内容包括画像-照片合成与识别,图像/视频超分辨率重建、图像恢复,行为分析与识别,行人重识别等。在IEEE TPAMI、IJCV、CVPR、NeurIPS等国际顶级期刊和会议上发表学术论文100余篇,获得国家自然科学基金委优秀青年基金,入选中国科协青年人才托举工程,获教育部自然科学一等奖、陕西省科学技术一等奖、中国图象图形学学会自然科学奖二等奖、中国人工智能学会优秀博士学位论文、陕西省优秀博士学位论文奖等奖项。
摘要:异质人脸图像主要是指处在不同模态或形态的人脸图像,例如线条画、素描画像,近红外、热红外图像与可见光图像,低分辨与高分辨图像,人脸动画以及不同的人脸面部表情等,正面人脸图像与侧面人脸图像。异质人脸图像合成主要是指可见光图像与这些不同模态和形态图像之间的相互转换。异质人脸图像合成的出发点是因为现实中经常存在缺少某一种图像的情况,例如刑侦破案等公共安全领域,急需重建出高清晰的人脸图像。本报告将介绍现有的异质人脸图像合成方法中的典型方法,特别地,将以人脸素描画像和照片的合成为例,对异质人脸合成的关键原理进行阐述。报告内容涉及计算机视觉、机器学习以及图形学等相关方向。
黄迪: 人脸老化模拟
简介:黄迪,教授,博士生导师,电气和电子工程师协会(IEEE)高级会员,中国计算机学会(CCF)高级会员。分别于2005年和2008年在北京航空航天大学计算机学院获得学士和硕士学位,2011年在法国里昂中央理工大学获得博士学位。研究兴趣包括模式识别、计算机视觉、图像处理、机器学习等方向,具体研究工作涉及生物特征识别(二维/三维人脸识别、步态识别、静脉识别),智能图像/视频处理(物体检测/跟踪/识别、动作识别、行为分析)及情感计算(人脸表情分析、视觉情感分类)等。曾主持国家自然科学基金(优青/面上/青年等)、北京市自然科学基金(面上)、教育部博士点基金等基础研究项目和微软、阿里达摩院、美团等企业的合作应用项目,还作为主要成员参与了国家重点研发计划、新一代人工智能重大专项、国家973/863计划、法国科研署计划等多项国内外研究任务。已在IEEE TPAMI、IJCV、CVPR、AAAI等领域内重要期刊和会议发表论文八十余篇,Google Scholar引用3800余次;获授权发明专利七项。曾获2013国际多媒体会议(ACM MM)情感计算竞赛(AVEC)第1名,2016国际生物特征识别会议(IEEE ICB)最佳墙报论文奖,2016中国生物特征识别会议(CCBR)最佳论文奖,2017 国际计算机视觉大会(IEEE ICCV)Workshop(AMFG)最佳论文奖。研究成果应用于网安、公安、医疗、体育等多个国家重要行业,取得了显著的社会效益。目前承担《计算机科学方法论》、《机器学习》等本科生和研究生课程的教学工作。曾获中国人工智能学会杰出贡献奖、北京市教学成果一等奖等荣誉。现任中国人工智能学会理事和智能交互专委会秘书长、中国计算机学会人工智能与模式识别专委会和计算机视觉专委会委员;是IEEE TPAMI、IJCV等十余个学术期刊审稿人,多次担任CVPR、ICCV、AAAI、IJCAI、MM等CCF-A类会议的领域主席或程序委员。
李晓龙: 虚假人脸检测的研究进展
简介:1999年本科毕业于北京大学数学科学学院,2006年博士毕业于法国卡尚高等师范学校。2007年初进入北大计算机所(现王选所),研究方向涉及信息隐藏和图像处理。2016年11月,进入北京交通大学计算机与信息技术学院信息科学研究所,任职教授,研究方向涉及可逆信息隐藏、隐写和隐写分析、数字取证等。共发表学术论文百余篇;所发表SCI论文中包含8篇ESI高被引;主持国家自然科学基金联合基金重点项目一项、面上项目两项;获得省部级二等奖一次(排名第三)、三等奖一次(排名第六);获得12项中国发明专利授权。据Google Citation统计,学术成果已经被国内外同行引用6800余次。
邓伟洪:真实世界人脸识别的潜在问题和挑战
简介:邓伟洪,北京邮电大学人工智能学院教授,博士生导师,教育部“青年长江学者”。长期从事模式识别与计算机视觉的基础理论研究,并应用到人脸识别、表情识别、行人再识别、细粒度图像检索等。近年来主持国家重点研发计划课题和国家自然科学基金等项目二十余项,与华为、中兴、腾讯、阿里、滴滴、佳能等科技企业开展广泛的技术合作,曾三次指导学生获得图像识别类的国际算法竞赛第一名,担任IJCAI 2020、ICPR 2020、ICME2020 领域主席和高级程序委员,担任IEEE Transactions on Biometrics, Behaviors, and Identity Science和Image and Vision Computing客座编委,《中国图象图形学报》青年编委。在IEEE TPAMI、TIP、TIFS、IJCV、PR等国际期刊以及ICCV、CVPR、ECCV、NIPS、AAAI等国际会议发表论文100多篇,谷歌学术引用近5700多次。曾入选北京市优秀博士学位论文、教育部“新世纪优秀人才”、北京市“科技新星”等。
摘要:海量标注数据和深度学习技术推动了视觉识别的巨大进步,现有模型在许多数据集上的性能已经超越人类。然而,在实际应用中,训练和测试的环境差异、地域差异、文化差异、伪造和对抗攻击等挑战导致大部分视觉识别应用的准确率和稳定性仍不理想,甚至造成“种族偏见”等伦理问题。本报告将从数据集建设、深度学习算法和性能评价三个角度,汇报近期在以下方面的研究进展:1)当前人脸识别的鲁棒性及CA/CPLFW数据集;2)当前人脸识别的安全性及TALFW数据集;3)当前人脸识别的公平性及RFW数据集;4)真实世界表情识别及RAF-DB/RAF-ML/RAF-AU数据集。
报名及注册费
本期讲习班限报200人,根据缴费先后顺序录取,报满为止。
2021年4月23日(含)前注册并缴费:CSIG会员1600元/人,非会员报名同时加入CSIG 2000元/人(含1年会员费);现场缴费:会员、非会员均为3000元/人;CSIG团体会员参加,按CSIG会员标准缴费;同一单位组团(5人及以上)报名,均按CSIG会员标准缴费。
注册费包括讲课资料和2天会议期间午餐,其它食宿、交通自理。
即日起至2021年4月23日,请登录会议注册网站注册。
会议主注册网址:http://confm.csig.org.cn/fair-detial.html?id=388
联系方式
中国图象图形学学会
2021年4月6日