我突然决定换掉用了3年的OCR工具...
阿虚同学
读完需要
5分钟速读仅需 3 分钟
我在19年的时候写过一篇OCR工具的评测推荐
其中力荐了「天若OCR」这款软件,我也的确用这个软件很久了,从它18年刚出来不久就在用
不过天若OCR早已经不对旧版本维护更新,4.49版本是其开源的最后一个版本
而目前你在百度到的「天若OCR官网」提供的版本,不再开源,且对免费版限制诸多
而其最大的问题就是不能自己填写接口
这里就要说一下了
OCR文本识别这种「依靠于样本大数据才能提高准确率」的东西,个人是难有能力做的,你能见到的诸多个人开发的OCR工具,无不都是调用大公司的数据接口
所以用OCR工具其实都不那么重要,重要的是看它支持哪些OCR接口
阿虚在之前后台回复的下载链接中推荐的「天若OCR 5.0开源版」是 @AnyListen 基于 @天若幽心 开源的代码进行完善制作而成
之所以推荐的原因,就是这个5.0开源版还能自己填写百度的接口
不过随着最近对于OCR需求的增加,阿虚也决定换掉它了——毕竟它也有2年没更新了
主要原因肯定是因为我发现了更强大的软件啦
1
PandaOCR下载
PandaOCR这款软件唯一的发布更新地址在Github:https://github.com/miaomiaosoft/PandaOCR
由于作者更新较勤,最新版大家就自己到 Github 上下载吧(作者五一期间都还更新)
▲点击Releases下载
目前 Github 处于半墙状态,如果你对其访问有困难,请复习阿虚的这篇文章:
2
运行前需要进行的操作
软件为绿色版,下载解压后即用
但为了在高分辨率的屏幕上也能正常使用,通常你需要以下步骤二选一来进行
❶种办法是右键 PandaOCR.exe 程序,选择属性 » 兼容性 » 更改高DPI设置 » 勾选替代高DPI缩放行为 » 选择应用程序
旧版本WIN10可能只有「高DPI设置时禁用显示缩放」这个选项,勾选这个也行
❷种办法也可以在程序内选择「高级」,把截图模式切换为「高级截图」来解决,最后记得点击保存
不过高级截图相比默认的方式多了「需要手动确认」的一步,所以,以上两种办法怎么选,大家就用的时候根据自己体验来选吧
3
PandaOCR功能介绍
然后就能正常使用软件了,软件的主界面如下图
这款软件不仅支持文字识别,还同时支持识别后翻译,还带语音朗读,同时对公式、表格也都支持!!!
而最强大的地方在于它支持几乎市面上的所有识别接口
虽然会有点长,为了让你体会到软件的强大,阿虚还是决定把其支持的功能列在这里:
支持识别引擎:搜狗+腾讯+百度+有道+阿里+京东+华为+网易+讯飞+金山+灵云+飞桨+合合+网校+易道+薪火+必应+SpaceOCR+Yandex
支持公式识别:微软+百度+腾讯+Mathpix+网校+阿里
支持表格识别:有道+百度+腾讯+阿里
支持翻译引擎:搜狗+腾讯+百度+有道+谷歌+词霸+必应+沪江+奇虎+海词+小牛+彩云+福昕+欧米+微软+阿里+云译+欧路+灵云+Deepl+PaPaGo
支持朗读引擎:搜狗+腾讯+百度+京东+有道+知声+讯飞+谷歌+必应
以上还只是主要功能,其他一些大大小小的功能还未列出
而在如此强大的功能背后,更 “ 恐怖 ” 的是,这款软件还是完全免费的!!
4
关于演示版和API版引擎接口
软件下载后默认是「演示版」即=试用版=体验版
演示版提供的功能,通常来自于引擎服务商提供的公共体验服务
缺点就很明显,由于演示版是公共接口,每月请求次数是有限的
所以随着使用这款软件的人不断增多,自然很容易会出现不够用的情况
所以如果有空,最好是能自己去申请一些接口自己使用
不少识别接口个人账号就能免费申请,同时赠送的使用额度,对于个人使用而言几乎是用不完的!
而这里建议大家就算现在不用,也去申请一个百度的OCR识别服务
因为百度最近将对免费额度进行调整(完整公告地址:https://ai.baidu.com/support/news?action=detail&id=2390)
以阿虚9年义务教育的语文水平帮大家理解一下,大概意思应该是:
在2021年5月27日前登陆百度智能云实名认证并使用过该接口,即可保持每天5万次的额度
超过时间,未实名,则降为每月200次
超过时间,就算这时再实名,也将只有每月1000次的免费额度!
明显只要错过这次机会,百度OCR就一点也不香了...
5
百度通用场景OCR识别接口申请
这里简单介绍一下百度OCR接口申请的步骤
注册并登录百度智能云:https://cloud.baidu.com/?from=console
然后点击产品 » 人工智能 » 找到通用场景文字识别 » 点击立即使用
点击创建应用
然后接口选择默认,文字识别包名不需要,应用归属选个人,应用名称和应用描述随意填写
创建好之后点击查看应用详情
然后就获取到 API Key 和 Secret Key 了
6
在PandaOCR中配置接口
然后我们现在到 PandaOCR 中配置一下自己的API接口
配置方法的话,我比较推荐你下图这样操作
然后会弹出一个文件让你编辑,我们先在里面往下翻,找到百度OCR那一条
将默认的API替换为你自己申请的
然后我们往上翻,找到百度OCR功能选择的地方
你申请了1个KEY,但具体调用的时候又分了API版、API高精度版、API手写版、API网络版
之所以有这些,是因为每个API免费的调用次数限制是不同的(其中手写识别每天只有50次!)
通常情况下我用的是高精度版,500次/天完全够用了,所以版本那里填的是2
总之以上都配置完之后,务必记得 Ctrl+S、Ctrl+S、Ctrl+S 保存使配置生效!
然后你就能尽情使用啦~
▲默认截图识别快捷键是F4
7
其他接口申请
由于PandaOCR支持的接口太多,阿虚也不可能说每一个接口怎么申请都给一个详细教程
加之其实申请接口的步骤并不难,基本上就是注册好账号之后,在网站上找到你需要的接口点击使用,接着随便创建一个应用就能获取(参考上文百度智能云接口的申请方式)
所以以下接口的申请大家就自己尝试吧
▲没你想的那么难
点击查看全文
除了百度,腾讯也算挺良心的,如果有表格、公式识别的需求,建议去申请腾讯一个的接口
7.1
百度
OCR:https://cloud.baidu.com (50000次/天免费)
翻译:http://api.fanyi.baidu.com (免费)
公式:https://cloud.baidu.com (只有1000次免费)
表格:https://cloud.baidu.com (50次/天免费)
7.2
腾讯
OCR+公式+表格:https://cloud.tencent.com/ (1000次/月免费 | 腾讯云接口),开通服务:https://console.cloud.tencent.com/ocr/general(工商营业执照可以不上传),申请秘钥:https://console.cloud.tencent.com/cam/capi
OCR+翻译:https://ai.qq.com/v1/ (免费 | 腾讯AI 旧版接口,翻译不推荐,质量不如腾讯云)
OCR:https://open.youtu.qq.com/ (500次/天免费 | 腾讯优图接口)
翻译:https://cloud.tencent.com (5百万字符/月免费 | 腾讯云接口)
7.3
SpaceOCR
OCR:https://ocr.space/OCRAPI (25000次/月免费)
7.4
网校(学而思/好未来)
OCR:https://ai.100tal.com (10万次/天免费 | 10秒间隔/次)
7.5
搜狗
OCR:http://deepi.sogou.com (送100、200元体验金 | 可能需要先充点钱才能用)
翻译:http://deepi.sogou.com (送100、200元体验金)
7.6
有道
按实际使用量付费
OCR:http://ai.youdao.com (送50元体验金)
翻译:http://ai.youdao.com (送50元体验金)
7.7
阿里
购买后限次,以下为最低价格,最低价格不可重复购买
OCR:https://market.aliyun.com/products/57124001/cmapi020020.html (通用版 | 500次/0.01元)
OCR:https://market.aliyun.com/products/57124001/cmapi028554.html (高精度 | 500次/0.01元)
OCR:https://market.aliyun.com/products/57124001/cmapi00040832.html (手写版 | 500次/免费)
OCR:https://market.aliyun.com/products/57124001/cmapi00040847.html (多语种 | 500次/免费)
表格:https://market.aliyun.com/products/57124001/cmapi024968.html (500次/0.01元)
7.8
讯飞(体验服务)
OCR:https://www.xfyun.cn/services/textRecg (10万次/免费,有效期90天)
公式:https://www.xfyun.cn/services/formula-discern(可直接在此网站上传图片来识别)
7.9
Deepl
翻译:https://www.deepl.com/translator (付费且服务器延迟较高)
7.10
Mathpix
公式:https://dashboard.mathpix.com (1000次/月免费丨登录之后点"Accept",然后输入信用卡信息,完成账号激活(点"Accept"没反应的可以换个浏览器试试,还不行的话可能需要富强上网)激活后,将会显示API的ID和KEY)
申请这个需要有双币信用卡,如果你还是大学生,可以到「学姿势」这个网站详细了解大学生信用卡申请方法(阿虚也是在读书期间就申请到了)
:https://www.xuezishi.net/
写完还是想说一句
对于百度,大家骂归骂,但该用还是用
人家AI技术也是真滴强,而且这么良心让你白嫖,香也是真的香