从手机到电脑,究竟哪款OCR图片文字识别软件最好用?
阿虚同学
读完需要
7分钟速读仅需 4 分钟
OCR是什么 ?
OCR (Optical Character Recognition,光学字符识别)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
说白了就是识别图片上的文字,然后提取出来,变成可编辑的文档
今天阿虚介绍、推荐一些好用的OCR网站、软件。
文章偏长,阿虚先给个目录
一、前言
而由于技术门槛相当的高,能做中文OCR识别的公司并不多,所以那些独立开发者开发的OCR软件,一般都是借用大公司的API接口。(比如好评如潮的「白描」,使用的其实是百度的OCR接口),所以这种时候认准大公司、老牌公司一般没错。
本文参考了多篇网上的评测(参考文章链接均在下方注明),和别人的使用感想,阿虚也对大部分进行了实际测试。
为了不使文章显得过于冗长,就不展示测试过程了,直接上结果
正文不提供软件使用教程,而且均为中文软件,几乎无操作难度,部分软件的使用教程会在文末的下载方式中给出。
二、网页版
网站有很多,暂且推荐两个
1.OCR Space
网址:https://ocr.space/
之前推荐过的截图软件ShareX,就是用这个引擎,而且ShareX可以截图OCR,可谓方便不少。
使用说明:网站全英文,OCR前请自行选择上传图片中的对应语言。
不正经星少女M,知乎
https://www.zhihu.com/question/33631951/answer/347636295
2.极客OCR
网址:http://www.gkocr.com/
每日免费限10张图像,每次识别需输入验证码,但识别效果还是挺不错的
3.效果一般的
诚华OCR
https://zhcn.109876543210.com/
最大限10MB,不能在线看结果,需要下载转换后的文件
Onnline OCR
https://www.onlineocr.net/
最大限15M,中文识别垃圾,英文识别完美
New OCR
https://www.newocr.com/
中文识别垃圾,英文识别完美
OCR Maker
http://www.ocrmaker.com/
识别效果一般
Super Tools在线文字识别转换
http://ocr.wdku.net/
效果垃圾
三、浏览器扩展
对扩展支持最好的是Chrome浏览器,其次是Firefox,阿虚也是十分推荐使用这两个浏览器的
1.取字
官网:http://willingstudio.com/
国人制作的Chrome扩展,平常对网页OCR需求比较高的话,这款扩展会很方便。
2.CopyFish
官网:https://a9t9.com/copyfish (打开速度较慢)
打开官网,下载对应浏览器的扩展
除Chorme谷歌、火狐浏览器之外,360、QQ、搜狗、UC、2345、百度、115、Cent、Yandex 等支持谷歌插件的浏览器都可以使用
如果不会安装插件,可以参考一下:《知道WIFI万能钥匙,那你知道云盘万能钥匙吗?》这篇教程中的插件安装办法
xlrocket,知乎
https://zhuanlan.zhihu.com/p/48595042
四、电脑端
以下如果无特殊说明,均只支持Windows,支持Mac的软件均会备注
1.天若OCR开源版(WIN)
天若OCR文字识别开源版是吾爱破解论坛的 @shelher 基于 @天若幽心 开源的代码 进行完善制作而成。
软件下载方式请看文末
作者表示天若OCR开源版不再进行维护。
由于采用了第三方OCR接口,所以必须联网才能识别,识别效果非常不错,不满意可以尝试换接口。
无需安装直接可以使用。
shelher,吾爱破解论坛
https://www.52pojie.cn/thread-876331-1-1.html
马小帅的回答 - 知乎
https://www.zhihu.com/question/19593313/answer/455872101
2.树洞OCR(WIN / MAC)
此软件的作者也是@shelher,是他基于开源的天若OCR开发的跨平台版应用,支持MAC,MAC用户首推这个
软件下载方式请看文末
相当于天若OCR的升级版,且推出了Mac版,因为作者表示天若OCR开源版不再进行维护,其实比起天若OCR,更推荐大家用这个。
同样的必须联网才能OCR识别。
shelher,吾爱破解论坛
https://www.52pojie.cn/thread-912949-1-1.html
3.天若批量文字识别(WIN)
软件支持jpg,jpeg,png,bmp以及pdf几种格式,识别文字之后自动转换成word文件,支持简单的排版。
软件下载方式请看文末
同样的必须联网才能OCR识别。
天若幽心,吾爱破解
https://www.52pojie.cn/thread-754074-1-1.html
4.汉王OCR(WIN)
汉王是国内中文识别的老字号了,推出的软件也是十分给力的。
软件下载方式请看文末
阿虚提供一个汉王OCR单文件版,无需安装就能直接使用,无需联网就能使用,准确率还很高
5.文通TH-OCR(WIN)
文通和汉王一样,是国内老牌的做中文识别公司了,尽管很久没更新了,但是识别率相当不错!无需联网即可OCR,下图的测试图片识别率100%(包括拼音)
软件下载方式请看文末
每日可识别100页,也不怕用完,因为解决这个其实很简单,点击电脑桌面右下角把系统时间改一下,马上又能识别100页了
6.其他推荐
软件下载方式请看文末
OmniPage(WIN)
Nuance OmniPage Ultimate 19.0 Multilingual (ISO),据说是世界最强英文OCR,辨识率超过 99%。但软件特别大(3G),如果对英文识别要求特别特别高的可以试试这款软件。
OneNote(WIN / Mac )
微软官网免费下载:http://www.onenote.com/download/
在OneNote中插入一张图片,然后右键点击图片区域选择「复制图片中的文本」,即会完成OCR,接着在其他地方「Ctrl+V」粘贴即可。
微软出品,其实效果很不错,只是操作麻烦了点。
iText(MAC)
App Store直接搜索接可以下载。但关于这个软件使用上的“小技巧”,请查看文末后在公众号上回复
iText 是 macOS 平台的 OCR 工具,自带截图功能,选择屏幕任意区域,即可识别其中的文字。
Cisdem = PDF Element > Acrobat
以上排名是对PDF的OCR效果
Cisdem PDF Converter OCR(Mac)
PDFElement Pro(WIN / Mac)
Adobe Acrobat DC(WIN / Mac)
评测详情可以看:蜜蜂软件说,公众号
PDFElement、FineReade、Adobe Acrobat DC、Cisdem (Mac 单系统)对比评测
https://mp.weixin.qq.com/s/7EQy_inoPmmZ09olfOjVUg
7.关于PDF识别
在阿虚看来:PDF识别其实是个伪需求
如果是一般的PDF,那么你的需求应该是PDF转WORD,而不该是PDF文字识别。
PDF转WORD的软件我已经分享过了,请去看《两个软件,解决你所有的PDF转换问题》
而且实际上很多PDF编辑软件也能直接导出WORD格式的文件,比如之前教程中提到的Adobe Acrobat DC,和上面提到的 PDFElement 都是可以完美把PDF导出为word格式的
如果是扫描版的PDF,你也不该是需求PDF识别,因为难免OCR识别会有错误,那么你识别完之后依然需要挨着每页对比查错,那和你一页一页识别有什么差别呢?
所以推荐用上面介绍的树洞OCR挨着截图进行识别。或者把你PDF导出为一张张的图片,再用软件一张张识别、对比查错。
五、移动端
QQ的扫一扫(腾讯OCR)、有道云笔记、Office lens、全能扫描王实测效果一般,甚至说不佳,Adobe Scan,安卓手机需装Google服务(门槛较高)这几个就不推荐了
针对不同需求,阿虚推荐以下4个软件
1.白描、Textgrabber(安卓 / IOS)
白描受众人所捧,其实使用的是百度的OCR接口,众所周知百度目前的核心是发展AI技术,OCR做的不错也是理所应当的。(百度的OCR接口不免费,这也是白描收费的原因之一)
而Textgrabber是ABBYY公司出品的,可想而知,识别效果不会差。
白描、Textgrabber安卓版下载方式请看文末
IOS用户直接在App Store搜索即可下载
中文识别率排名:白描>Textgrabber>扫描全能王
英文识别率排名:Textgrabber>扫描全能王>白描
中英文混排识别率排名:Textgrabber>白描>扫描全能王
总的来说,识别中文文档推荐白描,识别英文文档推荐 Textgrabber。
马小帅,知乎
Textgrabber、扫描全能王、白描对比评测
https://www.zhihu.com/question/19593313/answer/455872101
2.ABBYY FineScanner(IOS)
这款软件App Store搜索即可下载
Vanilla(少数派)写了一篇关于ABBYY FineScanner、Scanner Pro 和 Scanbot的评测,简单直接可以看出差别:
Vanilla,少数派
ABBYY FineScanner、Scanner Pro 和 Scanbot对比评测
https://sspai.com/post/44944
3.猫图鹰(安卓 / IOS)
Android猫图鹰下载方式请看文末,IOS在App Store搜索即可下载
白描和猫图鹰对拍摄清晰的印刷体识别率基本上能达到准确率100%
对手写字的识别上,白描和猫图鹰都很强,识别率很高了。
猫图鹰依然是会员制,但日常使用其实足够,毕竟能批量OCR呢。
麦麦吃饭饭,公众号:海上罗欣
扫描全能王、白描、猫图鹰对比评测
https://mp.weixin.qq.com/s/rJd-JlgVCM3kbg20f9gXDQ
六、微信小程序
微信——发现——小程序——搜索小程序名
1.传图识字
一周进步,知乎
https://www.zhihu.com/question/34873811/answer/465257494
2.微软AI识图
_ 方方面_,微博
https://weibo.com/2168219490/H7Lxu23LW
3.来降重
免费额度计算用完也是仍能继续免费识别的。
测试了很多小程序,只有这一款能把左边这段文字完美一字不差(符号也不差)的识别出来。
4.不推荐的小程序
迅捷文字识别
识别完之后只能看到识别结果,看不到原图,不方便对比查错
图片文字识别
识别效果不错(文字100%正确,部分符号识别有点问题)
每天有限定次数,但是可以每日签到获取次数
七、下载方式
以上提到的所有Windows、Mac、Android软件的下载地址
请关注微信公众号:阿虚同学
在公众号聊天窗口发送:OCR
后台即会自动回复下载地址
总结一下:
联网情况下,电脑上推荐用树洞OCR(Windows+Mac)
未联网情况下,电脑上推荐汉王OCR(无需安装)或者文通OCR(需要安装)
手机端,中文识别推荐白描,英文识别推荐Textgrabber
对手写识别有需求推荐用白描、猫图鹰、汉王OCR、文通OCR
轻度用户推荐网页版ocr.space、gkocr.com 或者 微信小程序:传图识字、微软AI识图、来降重
最近后台留言很多粉丝在问图片文字识别、文字提取的问题,毕竟帮大多数人一次性解决问题是我做公众号的一个目标,所以花了大概整整5天吧,终于把这篇文章写出来。
评测、整理文章思路、排版、上传分享软件、全一个人搞…差不多整个清明节假期前后都在写这篇,
最近阿虚也挺忙的,暂时不会写这么深的评测和软件推荐了,一个人搞全平台软件推荐什么的还是太累人了。
希望做一个:不是很万能的万能公众号
资源:4WPPT模板、1W8电子书、18G字体、50G高清贴图、东野圭吾全集
软件:数据恢复、天气预报、视频播放器、截图、拼图、录屏、PDF转换、PDF去水印、Office、WPS、网络修复、记英语、屏蔽广告、有道云笔记、视频剪辑、云盘万能钥匙
其他:省钱、摄影、手机阅读、漫画、男装穿搭、网盘推荐、学术论文下载、网盘搜索引擎、腾讯优酷爱奇艺转码、网页视频下载、百度搜索去广告、解决垃圾短信
“写这一篇快累死,点一下广岛君支持下?”