技术科普 | 揭开手写文本识别“最先进”的秘密
The following article is from 国际翻译动态 Author 李春郁
热
点
在人工智能(AI)时空错乱的怪现象中,人们也许很快就能看到西班牙黄金时代最重要的作家之一洛佩·德·维加(Lope de Vega)的新剧作。而这并不是ChatGPT过度应用的又一个事例——这是剧作家本人写的。
《法国女人劳拉》(La francesa Laura)可能不是维加最伟大的作品之一,但今年早些时候消息传出时,这部作品的发现经过引起了众多关注。人工智能再次成为英雄,将手写文本数字化从而进行文体分析,缓解了难以确定作者身份的难题。
正是READ-COOP SCE的Transkribus算法,帮助并支持Álvaro Cuéllar和Germán Vega对黄金时代的作者身份进行研究。Transkribus是一个先进的文本识别平台,旨在彻底改变查看历史文档的渠道。它正迅速得到一部分图书馆和档案馆的青睐,这些机构想对某些一手资料进行数字化处理,以进行大规模的研究和分析。
使印刷文本具备机器可读性并非首创。几十年来,光学字符识别(OCR)一直在取代手动数据输入,将打印文档转换为可检索、可搜索的格式,便于进行查询和转换。其最初的应用不太涉及解析历史记录,而是关注盲人阅读辅助和自动邮件分类等难题。
如今,这项技术无处不在,为不计其数的业务自动化提供支持,以便更高效地开出停车罚款或拒绝保险索赔。您还可能与OCR有更直接的接触,用它将扫描文档转换为可编辑的格式,或使用Google Lens将某个标志翻译成熟悉的语言。其广泛应用使得文本识别在金融服务、医疗保健和物流等领域发挥至关重要的作用。它甚至可以将扫描文档转换为低资源语言的训练语料库,以帮助解决自然语言处理(NLP)中的数据稀缺问题。
可提升空间
近几十年来,机器学习方法已经看到OCR的进步,超越了基本的模式匹配算法,该算法将扫描的字符图像与内部数据库进行比对,以提取出更精细化的特征,使模型能扩大至涵盖没见过的字体和手写体样式。然而,文本识别这一领域仍在积极开展研究,有相当大的提升空间,特别是涉及到较低资源语言及字母系统、多语言文本和手写文本。
即使对于英文印刷文本,OCR也容易犯一个经典错误,就是混淆小写“l”、大写“I”和数字“1”。常见问题还包括将撇号视为重音符(反之亦然),以及错误分割单词,而它们又会影响后面的任务。为避免人工审核,可以使用具备拼写词典或语言模型功能的纠错技术来改进OCR转录。
虽然纠错可以显著提高文本识别的准确性,但也有其缺点。这一过程可能会与词汇表之外的行话、俚语或命名实体发生冲突,并可能因将原始文件中存在的错误加以规范化而影响转录的忠实性。手写文本的自动标记等应用较为棘手,因为它们需要通过识别纠错获得高精度,同时又要保留相关的拼写错误作为反馈。
手写文本式微?
寻找著名剧作家的新剧作并不是手写识别的唯一好处。手写笔记以不同于打字的方式激活大脑中的记忆和学习中心,并可能会提高记忆力。但打字输入的笔记更易于编辑、存储和搜索。借助先进的手写文本识别,您可以获得两全其美的体验。
日益涌现的产品可以支持这一论述,许多产品使用在线手写识别,通过跟踪触摸屏或数字笔上的笔画信息来识别文本。谷歌Gboard、微软OneNote和与Apple Pencil相结合的苹果Scribble,都可以将一部分文字的手写体转换为文本。
具有讽刺意味的是,虽然计算机越来越擅长识别手写文本,但各个学校正在争论是否要费心教授花体字。天晓得,随着更先进的识别功能以及诱人的涂鸦工具出现,导致手写文本式微的技术可能又会成为其复兴的动力。
原文网址:
https://slator.com/unpacking-state-of-the-art-handwritten-text-recognition/
-END-
转载编辑:Amelia
往期回顾
行业动态1.论坛预告 | 语言服务40人论坛之东盟语言服务专题论坛广西翻译协会2023年年会暨外语专业研究生论坛2.活动预告 | 第二十届全国科技翻译研讨会(1号通知)
3. 论坛预告|中外语言文化比较学会知识翻译学专业委员会成立大会暨首届知识翻译学学术年会4. 论坛预告 | 中国式现代化与长三角区域一体化语言能力建设高层论坛暨长三角语言服务竞争力报告发布会
行业洞见
行业观察 | 高频术语视角下计算机辅助语言学习领域的热点研究 行业观察 | 陈毅强:融会贯通,口译技能持续升级 行业观察 | 郭海波:探索计算机辅助翻译的本质 精彩回顾 | 首届全国翻译技术大赛赛后沙龙,听听获奖选手怎么说
行业技术
技术应用|快速提高“搜商”之桌面搜索工具“Everything” 技术应用|8大人工智能API平台——打造超智能APP 技术应用 | 4万字+50幅图一网打尽Transformer ChatGPT | 文献阅读小帮手:New Bing 如何使用trados生成客户要求的clean和unclean文件?
精品课程
资源干货
资源干货 | 机器学习入门导读(文章汇总) 资源干货 | 英语外刊获取途径、网站推荐 ChatGPT | AI外语写作助手,助力高效写作 双语干货 | 谢锋大使向中美媒体发表讲话 资源宝库|译者用“典”,多多益善——精选31款在线词典
招聘就业1. 招聘快报 | 中国外文局翻译院“外语职业体验实习营”项目招聘实习生
2.博硕星睿 | 办公室实习助理招聘(北京)3. 招聘快报 | 中国旅游出版社招聘英文编辑(北京)4. 招聘快报 | CNBC财经电视台上海分公司招聘发行部助理实习生5. CATTI备考在即,备考实习两不误,硬核语言专业线上实习机会来了!