史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)
本文整理了近年来场景文字识别领域里56篇代表性论文,20份开源代码,330个实验结果以及超过1800个统计信息。Github资源链接见文末。
自然场景中的文字识别,因其文字展现形式极为丰富,背景复杂,分辨率低,易受环境噪声影响,使得其难度远大于扫描文档图像中的文字识别。近年来,随着深度学习的迅猛发展,越来越多的优秀方法被提出并取得了的显著效果。
英文规则场景文本识别评测数据集:
英文非规则场景文本识别评测数据集:
双语场景文本识别评测数据集(中英文,中文为主):
合成数据集:
对比内容包括各数据集语种,图片数量(训练/测试),样本数量(训练/测试),词典,标签及类型等。详细介绍及相关下载请详见文末资源链接。
注:“Reg”, "Irreg","Seg", "Extra", "CTC" 和 "Attn" 分别代表是否是规则文本数据集,是否是非规则文本数据集,该方法是否基于分割,该方法是否使用额外数据集,该方法是否基于CTC算法以及是否基于Attention算法。
1、英文规则场景文本识别评测数据集识别结果
本小节整理并对比了场景文本识别领域38篇重要论文的识别方法在英文规则场景文本识别评测数据集的识别结果。详细介绍及相关下载请详见文末资源链接。
2、英文非规则场景文本识别评测数据集
本小节整理并对比了场景文本识别领域38篇重要论文的识别方法在英文非规则场景文本识别评测数据集的识别结果。详细介绍及相关下载请详见文末资源链接。
本小节整理并对比了双语场景文本识别评测数据集的识别结果,详细介绍及相关下载请详见文末资源链接。
注:比赛数据集仅列出前三名识别结果,相关评估指标请查看相应的比赛官网。
Scene Text Recognition: https://github.com/HCIILAB/Scene-Text-Recognition
作者及资源整理者介绍:陈晓雪,华南理工大学电子与信息学院在读硕士生。
免责声明:本文仅代表作者观点,不代表本公众号立场。
(长按识别上图二维码加关注)