查看原文
其他

【直播】文档图像微沙龙21-02期:数据困境下的文字识别

蔻享学术 2022-07-08

以下文章来源于中国图象图形学报 ,作者CSIG文档专委会



直播二维码

CSIG文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)将于2021年10月12日(周二19:00)举办第2期活动,邀请华南理工大学罗灿杰博士分享报告:数据困境下的文字识别——无标签图像去噪、自适应数据增广及手写样本合成,华南理工大学张鑫副教授担任主持人。


文档图像微沙龙


文档图像微沙龙是中国图象图形学学会文档图像分析与识别专业委员会发起主办的系列学术交流活动,旨在探讨文档图像分析与识别、计算机视觉、机器学习领域的前沿技术挑战和研究进展,加强产学研交流与合作。


文档图像微沙龙活动预计安排为每月一次,根据具体情况采用线上或线下形式,每次邀请一位或多位嘉宾做主题报告,并进行互动交流。报告内容包括但不限于分享顶会顶刊论文研究进展、竞赛夺冠经验以及行业技术动态。文档图像微沙龙为相关领域的专家学者、技术研发人员提供了解学术前沿动态的平台,以期促进学术界和企业界的共赢发展。

01微沙龙组织机构

主办单位

中国图象图形学学会(CSIG)

承办单位

CSIG文档图像分析与识别专委会

协办单位

中国图象图形学报

组委会

彭良瑞 副教授,清华大学

陈善雄 副教授,西南大学

金连文 教   授,华南理工大学


CSIG文档图像分析与识别专委会公众号


02微沙龙报告



报告题目:

数据困境下的文字识别——无标签图像去噪、自适应数据增广及手写样本合成



报告摘要:


深度学习时代,数据驱动的模型取得了突破性的进步,然而,在一些应用场景下很难获取足够的标注数据,此外数据标注需要高额的成本。本报告从三个方面讲述数据困境下的方案:1)无标签的文本行图像去噪。该方法利用注意力机制提取每个字符,与单字符模板进行生成对抗训练,从而去除背景噪声。同时该方法根据识别结果微调字符,从而生成更利于识别的图像,进一步降低识别难度;2)文本行图像的自适应增广。该方法使用多个控制点实现更灵活的弹性变换,并在训练过程中挖掘困难样本,丰富数据的多样性,提高识别器的稳健性;

3)手写体的合成。相比标准字体,手写体合成的自由度更高,难度更大。本报告将通过Demo演示的形式,展现手写体合成的重要性。



报告文献:


[1]  Canjie Luo, Qingxiang Lin, Yuliang Liu, Lianwen Jin, Chunhua Shen. Separating content from style using adversarial learning for recognizing text in the wild. International Journal of Computer Vision, 2021, 129(4): 960-976.

[2] Canjie Luo, Yuanzhi Zhu, Lianwen Jin, Yongpan Wang. Learn to augment: Joint data augmentation and network optimization for text recognition. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 13746-13755.





报告人:罗灿杰


华南理工大学博士研究生,师从金连文教授。博士期间主要从事计算机视觉中的文字识别方法研究。在读期间发表IJCV、PR等国际权威期刊和CCF A类会议论文共12篇(其中3篇第一作者),已获国际专利授权两项。在开源社区Github的两个项目受到广泛关注,累计900+Star,其中图像增广方法被不少互联网头部企业采用。在竞赛方面,参加了文字识别领域旗舰会议ICDAR主办的系列国际竞赛,获得ICDAR 2019街景广告招牌文字识别冠军(负责人);以文字识别为主题,参加了第六届中国国际“互联网+”大学生创新创业大赛,获得总决赛金奖(负责人)。


谷歌学术主页:

https://scholar.google.com/citations?user=AY1sME0AAAAJ&hl=zh-CN


GitHub主页:

https://github.com/Canjie-Luo


03微沙龙主持





主持人:张鑫


华南理工大学电子与信息学院副教授,于美国俄克拉荷马州立大学电子与计算机学院获得硕士和博士学位。主要研究领域包括机器学习、计算机视觉等。主持包括国家自然基金、广东省科技计划基金,广东省自然科学基金等多项科研项目。已发表高水平学术论文近50篇,申请国家发明专利十余项。现兼任CCF计算机视觉专业委员会委员、CAAI模式识别专业委员会委员、CAA模式分析与机器智能专业委员会委员等职。


《中国图象图形学报》创刊于1996年,月刊,是中国科学院主管,中国科学院空天信息创新研究院、中国图象图形学学会、北京应用物理与计算数字研究所主办的国内唯一一本全面报道与计算机图像图形学相关研究成果的专业学术期刊。主要报道方向有图像理解和计算机视觉、计算机图形学、图像分析和识别、图像编码和处理、遥感图像处理与GIS、医学图像处理、虚拟现实/3D可视化、多媒体技术和系统仿真等。是Scopus、EBSCO、JST等国际数据库收录期刊,北大中文核心、CSCD、CAJD等国内数据库收录。是CCF推荐中文期刊,中国国际影响力优秀学术期刊,中国精品科技期刊,并荣获中国最美期刊、华文出版物艺术设计大赛银奖等奖项。
专题直播&回放链接https://www.koushare.com/topicIndex/i/zgtxtx


文章内容来源于“ 中国图象图形学报”公众号

编辑:苏苗苗



为满足更多科研工作者的需求,蔻享平台开通了各科研领域的微信交流群。进群请添加微信18019902656(备注您的科研方向)小编拉您入群哟!
蔻享网站www.koushare.com已开通自主上传功能,期待您的分享!

欢迎大家提供各类学术会议或学术报告信息,以便广大科研人员参与交流学习。

联系人:李盼 18005575053(微信同号)

戳这里,观看精彩直播哟!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存