我突然决定换掉用了3年的OCR工具...
阿虚同学
读完需要
速读仅需 3 分钟
我在19年的时候写过一篇OCR工具的评测推荐
其中力荐了「天若OCR」这款软件,我也的确用这个软件很久了,从它18年刚出来不久就在用
不过天若OCR早已经不对旧版本维护更新,4.49版本是其开源的最后一个版本
而目前你在百度到的「天若OCR官网」提供的版本,不再开源,且对免费版限制诸多
而其最大的问题就是不能自己填写接口
这里就要说一下了
OCR文本识别这种「依靠于样本大数据才能提高准确率」的东西,个人是难有能力做的,你能见到的诸多个人开发的OCR工具,无不都是调用大公司的数据接口
所以用OCR工具其实都不那么重要,重要的是看它支持哪些OCR接口
阿虚在之前后台回复的下载链接中推荐的「天若OCR 5.0开源版」是 @AnyListen 基于 @天若幽心 开源的代码进行完善制作而成
之所以推荐的原因,就是这个5.0开源版还能自己填写百度的接口
不过随着最近对于OCR需求的增加,阿虚也决定换掉它了——毕竟它也有2年没更新了
主要原因肯定是因为我发现了更强大的软件啦
1
PandaOCR下载
PandaOCR这款软件唯一的发布更新地址在Github:https://github.com/miaomiaosoft/PandaOCR
由于作者更新较勤,最新版大家就自己到 Github 上下载吧(作者五一期间都还更新)
▲点击Releases下载
目前 Github 处于半墙状态,如果你对其访问有困难,请复习阿虚的这篇文章:
2
运行前需要进行的操作
软件为绿色版,下载解压后即用
但为了在高分辨率的屏幕上也能正常使用,通常你需要以下步骤二选一来进行
❶种办法是右键 PandaOCR.exe 程序,选择属性 » 兼容性 » 更改高DPI设置 » 勾选替代高DPI缩放行为 » 选择应用程序
旧版本WIN10可能只有「高DPI设置时禁用显示缩放」这个选项,勾选这个也行
❷种办法也可以在程序内选择「高级」,把截图模式切换为「高级截图」来解决,最后记得点击保存
不过高级截图相比默认的方式多了「需要手动确认」的一步,所以,以上两种办法怎么选,大家就用的时候根据自己体验来选吧
3
PandaOCR功能介绍
然后就能正常使用软件了,软件的主界面如下图
这款软件不仅支持文字识别,还同时支持识别后翻译,还带语音朗读,同时对公式、表格也都支持!!!
而最强大的地方在于它支持几乎市面上的所有识别接口
虽然会有点长,为了让你体会到软件的强大,阿虚还是决定把其支持的功能列在这里:
支持识别引擎:搜狗+腾讯+百度+有道+阿里+京东+华为+网易+讯飞+金山+灵云+飞桨+合合+网校+易道+薪火+必应+SpaceOCR+Yandex
支持公式识别:微软+百度+腾讯+Mathpix+网校+阿里
支持表格识别:有道+百度+腾讯+阿里
支持翻译引擎:搜狗+腾讯+百度+有道+谷歌+词霸+必应+沪江+奇虎+海词+小牛+彩云+福昕+欧米+微软+阿里+云译+欧路+灵云+Deepl+PaPaGo
支持朗读引擎:搜狗+腾讯+百度+京东+有道+知声+讯飞+谷歌+必应
以上还只是主要功能,其他一些大大小小的功能还未列出
而在如此强大的功能背后,更 “ 恐怖 ” 的是,这款软件还是完全免费的!!
4
关于演示版和API版引擎接口
软件下载后默认是「演示版」即=试用版=体验版
演示版提供的功能,通常来自于引擎服务商提供的公共体验服务
缺点就很明显,由于演示版是公共接口,每月请求次数是有限的
所以随着使用这款软件的人不断增多,自然很容易会出现不够用的情况
所以如果有空,最好是能自己去申请一些接口自己使用
不少识别接口个人账号就能免费申请,同时赠送的使用额度,对于个人使用而言几乎是用不完的!
而这里建议大家就算现在不用,也去申请一个百度的OCR识别服务
因为百度最近将对免费额度进行调整(完整公告地址:https://ai.baidu.com/support/news?action=detail&id=2390)
以阿虚9年义务教育的语文水平帮大家理解一下,大概意思应该是:
在2021年5月27日前登陆百度智能云实名认证并使用过该接口,即可保持每天5万次的额度
超过时间,未实名,则降为每月200次
超过时间,就算这时再实名,也将只有每月1000次的免费额度!
明显只要错过这次机会,百度OCR就一点也不香了...
5
百度通用场景OCR识别接口申请
这里简单介绍一下百度OCR接口申请的步骤
注册并登录百度智能云:https://cloud.baidu.com/?from=console
然后点击产品 » 人工智能 » 找到通用场景文字识别 » 点击立即使用
点击创建应用
然后接口选择默认,文字识别包名不需要,应用归属选个人,应用名称和应用描述随意填写
创建好之后点击查看应用详情
然后就获取到 API Key 和 Secret Key 了
6
在PandaOCR中配置接口
然后我们现在到 PandaOCR 中配置一下自己的API接口
配置方法的话,我比较推荐你下图这样操作
然后会弹出一个文件让你编辑,我们先在里面往下翻,找到百度OCR那一条
将默认的API替换为你自己申请的
然后我们往上翻,找到百度OCR功能选择的地方
你申请了1个KEY,但具体调用的时候又分了API版、API高精度版、API手写版、API网络版
之所以有这些,是因为每个API免费的调用次数限制是不同的(其中手写识别每天只有50次!)
通常情况下我用的是高精度版,500次/天完全够用了,所以版本那里填的是2
总之以上都配置完之后,务必记得 Ctrl+S、Ctrl+S、Ctrl+S 保存使配置生效!
然后你就能尽情使用啦~
▲默认截图识别快捷键是F4
7
其他接口申请
由于PandaOCR支持的接口太多,阿虚也不可能说每一个接口怎么申请都给一个详细教程
加之其实申请接口的步骤并不难,基本上就是注册好账号之后,在网站上找到你需要的接口点击使用,接着随便创建一个应用就能获取(参考上文百度智能云接口的申请方式)
所以以下接口的申请大家就自己尝试吧
▲没你想的那么难
写完还是想说一句
对于百度,大家骂归骂,但该用还是用
人家AI技术也是真滴强,而且这么良心让你白嫖,香也是真的香