[学术报告视频回播] 2022年OCR学术前沿及产业应用高峰论坛（第1集）

Original CSIG-DIAR CSIG文档图像分析与识别专委会 2022-07-25

2022年4月24日，由中国图象图形学学会、中国自动化学会、《中国图象图形学报》联合主办，CSIG文档图像分析与识别专委会、CAA模式识别与机器智能专委会、《中国图象图形学报》联合承办的OCR学术前沿及产业应用高峰论坛成功在线举办，来自学术界及工业界17名特邀专家做了精彩报告，通过直播平台参加及观看本次学术报告会的人数超过8000人次，反响热烈。本期带来本次论坛的第1-3个特邀报告的视频录播。

特邀报告1: 文档分析与识别中的前沿研究问题

特邀讲者：刘成林（中科院自动化研究所/中国科学院大学，研究员）

（点击上图播放视频）

报告摘要：文档图像（包括印刷和手写文档、场景文本图像、联机手写文档等）分析与识别的任务包括版面分析、文本识别、图形符号识别、语义信息提取等。近年来，得益于深度学习方法的发展和应用，文档分析与识别的性能快速提升，技术在文档数字化、票据处理、笔迹录入、智能交通、文档检索与信息提取等领域得到广泛应用。然而，实际应用也表明，现有技术在识别精度和可靠性、可解释性、自适应性等方面还有明显不足；从文档信息抽取与利用的角度来说还有一些技术缺口；从系统生成的角度来说还有学习能力的不足。本报告对文档分析与识别技术现状做简要回顾和分析，从主要任务性能、应用扩展、学习能力的角度指出当前技术的不足，并由此提出一些值得重视的研究问题和方向。

特邀报告2: 文档分析与识别中的前沿研究问题

特邀讲者：白翔（华中科技大学，教授）

（点击上图播放视频）

报告摘要：编解码网络已经在文本行识别取得了显著的进展，然而这些方法在处理复杂结构的文字（如手写公式，艺术字）时有着非常大的限制。在此报告中，我将介绍课题组在离线手写公式识别的新进展，重点探讨处理复杂排列结构的文字与主流文字识别方法的异同，及未来值得关注的问题。

特邀报告3: 文档分析与识别中的前沿研究问题

特邀讲者：崔磊（微软亚洲研究院，高级研究员）

（点击上图播放视频）

报告摘要：文档智能是近年来蓬勃发展的学术研究课题和工业界需求，其中涉及了自动阅读、理解和分析商业文档的相关技术。由于文档图像布局和格式的多样性、噪音信息的普遍性以及结构的复杂性，理解商业文档是一项非常具有挑战性的任务。本报告将主要介绍文档智能前沿技术最新发展，包含文档智能预训练模型以及基于Transformer架构OCR技术的相关进展与突破，并展望未来文档智能领域的发展趋势。

往期精彩内容回顾

欢迎加入中国图象图形学学会!（附入会攻略）

征稿启事：本公众号将不定期介绍文档图像分析与识别及相关领域的论文、数据集、代码等成果，欢迎自荐或推荐相关领域最新论文/代码/数据集等成果给本公众号审阅编排后发布 (联系Email: eelwjin@scut.edu.cn)。

扫描二维码，关注我们:

六大火药桶：世界种种动荡背后的历史逻辑

中介费比税还贵，贝壳赚钱太狠了

这得要多「憨厚老实」，才能「收留」女硕士13年啊

“顺为系”资本继续减持南芯科技，快充芯片龙头面临过于依赖大客户压力

八段锦“毒害”了多少中国女人，还有很多人不知道……

[学术报告视频回播] 2022年OCR学术前沿及产业应用高峰论坛（第1集）

[AAAI 2022] BROS：一种专注于文本和版面信息的预训练语言模型，用于更好地抽取文档关键信息（有源码）

[CVPR 2022] Mobile-Former: Bridging MobileNet and Transformer

[CVPR 2022] TATT：用于场景文本图像超分辨率的文本注意力网络

[CVPR2022] CG-GAN: 基于部件级感知的one-shot字体生成

[CVPR 2022] 通过字符上下文解耦的开放集文本识别新方法（有源码）

[CVPR 2022] SimAN: 基于生成式模型的文本图像自监督表征学习

[AAAI 2022] 用于场景文本识别的视觉语义辅助文本推理（有源码）

[ACM MM 2021] JokerGAN: 低参数量的具有文本行感知的手写文本生成模型

[CVPR 2022] 基于场景文字知识挖掘的细粒度图像识别算法（有源码）

[CVPR 2022] 特征采样与分组：基于Transformer的场景文字检测方法

[AAAI 2022 Oral] ABM: 基于注意力聚合和双向交互学习的手写数学公式识别（有源码）

欢迎加入中国图象图形学学会!（附入会攻略）

您可能也对以下帖子感兴趣

六大火药桶：世界种种动荡背后的历史逻辑

中介费比税还贵，贝壳赚钱太狠了

这得要多「憨厚老实」，才能「收留」女硕士13年啊

“顺为系”资本继续减持南芯科技，快充芯片龙头面临过于依赖大客户压力

八段锦“毒害”了多少中国女人，还有很多人不知道……

生成图片，分享到微信朋友圈

[学术报告视频回播] 2022年OCR学术前沿及产业应用高峰论坛（第1集）

您可能也对以下帖子感兴趣