查看原文
其他

[学术报告视频回播] 2022年OCR学术前沿及产业应用高峰论坛(第1集)

CSIG-DIAR CSIG文档图像分析与识别专委会 2022-07-25

2022年4月24日,由中国图象图形学学会、中国自动化学会、《中国图象图形学报》联合主办,CSIG文档图像分析与识别专委会、CAA模式识别与机器智能专委会、《中国图象图形学报》联合承办的OCR学术前沿及产业应用高峰论坛成功在线举办,来自学术界及工业界17名特邀专家做了精彩报告,通过播平台参加及观看本次学术报告会的人数超过8000人次,反响热烈。本期带来本次论坛的第1-3个特邀报告的视频录播。

特邀报告1: 文档分析与识别中的前沿研究问题

特邀讲者:刘成林(中科院自动化研究所/中国科学院大学,研究员)

点击上图播放视频

报告摘要:文档图像(包括印刷和手写文档、场景文本图像、联机手写文档等)分析与识别的任务包括版面分析、文本识别、图形符号识别、语义信息提取等。近年来,得益于深度学习方法的发展和应用,文档分析与识别的性能快速提升,技术在文档数字化、票据处理、笔迹录入、智能交通、文档检索与信息提取等领域得到广泛应用。然而,实际应用也表明,现有技术在识别精度和可靠性、可解释性、自适应性等方面还有明显不足;从文档信息抽取与利用的角度来说还有一些技术缺口;从系统生成的角度来说还有学习能力的不足。本报告对文档分析与识别技术现状做简要回顾和分析,从主要任务性能、应用扩展、学习能力的角度指出当前技术的不足,并由此提出一些值得重视的研究问题和方向。

特邀报告2: 文档分析与识别中的前沿研究问题

特邀讲者:白翔(华中科技大学,教授)

点击上图播放视频
报告摘要:编解码网络已经在文本行识别取得了显著的进展,然而这些方法在处理复杂结构的文字(如手写公式,艺术字)时有着非常大的限制。在此报告中,我将介绍课题组在离线手写公式识别的新进展,重点探讨处理复杂排列结构的文字与主流文字识别方法的异同,及未来值得关注的问题。

特邀报告3: 文档分析与识别中的前沿研究问题

特邀讲者:崔磊(微软亚洲研究院,高级研究员)

点击上图播放视频
报告摘要:文档智能是近年来蓬勃发展的学术研究课题和工业界需求,其中涉及了自动阅读、理解和分析商业文档的相关技术。由于文档图像布局和格式的多样性、噪音信息的普遍性以及结构的复杂性,理解商业文档是一项非常具有挑战性的任务。本报告将主要介绍文档智能前沿技术最新发展,包含文档智能预训练模型以及基于Transformer架构OCR技术的相关进展与突破,并展望未来文档智能领域的发展趋势。





往期精彩内容回顾



欢迎加入中国图象图形学学会!(附入会攻略)


征稿启事:本公众号将不定期介绍文档图像分析与识别及相关领域的论文、数据集、代码等成果,欢迎自荐或推荐相关领域最新论文/代码/数据集等成果给本公众号审阅编排后发布 (联系Email: eelwjin@scut.edu.cn)。




扫描二维码,关注我们:




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存