查看原文
其他

我突然决定换掉用了3年的OCR工具...

砺心 阿虚同学 2022-04-30

阿虚同学

读完需要

5分钟

速读仅需 3 分钟

我在19年的时候写过一篇OCR工具的评测推荐

其中力荐了「天若OCR」这款软件,我也的确用这个软件很久了,从它18年刚出来不久就在用

不过天若OCR早已经不对旧版本维护更新,4.49版本是其开源的最后一个版本

而目前你在百度到的「天若OCR官网」提供的版本,不再开源,且对免费版限制诸多

而其最大的问题就是不能自己填写接口

这里就要说一下了

OCR文本识别这种「依靠于样本大数据才能提高准确率」的东西,个人是难有能力做的,你能见到的诸多个人开发的OCR工具,无不都是调用大公司的数据接口

所以用OCR工具其实都不那么重要,重要的是看它支持哪些OCR接口

阿虚在之前后台回复的下载链接中推荐的「天若OCR 5.0开源版」是 @AnyListen 基于 @天若幽心  开源的代码进行完善制作而成

之所以推荐的原因,就是这个5.0开源版还能自己填写百度的接口

不过随着最近对于OCR需求的增加,阿虚也决定换掉它了——毕竟它也有2年没更新了

主要原因肯定是因为我发现了更强大的软件啦


1

 

   

PandaOCR下载

PandaOCR这款软件唯一的发布更新地址在Github:https://github.com/miaomiaosoft/PandaOCR

由于作者更新较,最新版大家就自己到 Github 上下载吧(作者五一期间都还更新)

▲点击Releases下载

目前 Github 处于半墙状态,如果你对其访问有困难,请复习阿虚的这篇文章:


2

 

   

运行前需要进行的操作

软件为绿色版,下载解压后即用

但为了在高分辨率的屏幕上也能正常使用,通常你需要以下步骤二选一来进行

❶种办法是右键 PandaOCR.exe 程序,选择属性 » 兼容性 » 更改高DPI设置 » 勾选替代高DPI缩放行为 » 选择应用程序

旧版本WIN10可能只有「高DPI设置时禁用显示缩放」这个选项,勾选这个也行

❷种办法也可以在程序内选择「高级」,把截图模式切换为「高级截图」来解决,最后记得点击保存

不过高级截图相比默认的方式多了「需要手动确认」的一步,所以,以上两种办法怎么选,大家就用的时候根据自己体验来选吧

3

 

   

PandaOCR功能介绍

然后就能正常使用软件了,软件的主界面如下图

这款软件不仅支持文字识别,还同时支持识别后翻译,还带语音朗读,同时对公式、表格也都支持!!!

而最强大的地方在于它支持几乎市面上的所有识别接口

虽然会有点长,为了让你体会到软件的强大,阿虚还是决定把其支持的功能列在这里:

  • 支持识别引擎:搜狗+腾讯+百度+有道+阿里+京东+华为+网易+讯飞+金山+灵云+飞桨+合合+网校+易道+薪火+必应+SpaceOCR+Yandex

  • 支持公式识别:微软+百度+腾讯+Mathpix+网校+阿里

  • 支持表格识别:有道+百度+腾讯+阿里

  • 支持翻译引擎:搜狗+腾讯+百度+有道+谷歌+词霸+必应+沪江+奇虎+海词+小牛+彩云+福昕+欧米+微软+阿里+云译+欧路+灵云+Deepl+PaPaGo

  • 支持朗读引擎:搜狗+腾讯+百度+京东+有道+知声+讯飞+谷歌+必应

以上还只是主要功能,其他一些大大小小的功能还未列出

而在如此强大的功能背后,更 “ 恐怖 ” 的是,这款软件还是完全免费的!!

4

 

   

关于演示版和API版引擎接口

软件下载后默认是「演示版」即=试用版=体验版

演示版提供的功能,通常来自于引擎服务商提供的公共体验服务

缺点就很明显,由于演示版是公共接口,每月请求次数是有限的

所以随着使用这款软件的人不断增多,自然很容易会出现不够用的情况

所以如果有空,最好是能自己去申请一些接口自己使用

不少识别接口个人账号就能免费申请,同时赠送的使用额度,对于个人使用而言几乎是用不完的!

而这里建议大家就算现在不用,也去申请一个百度的OCR识别服务

因为百度最近将对免费额度进行调整(完整公告地址:https://ai.baidu.com/support/news?action=detail&id=2390)

以阿虚9年义务教育的语文水平帮大家理解一下,大概意思应该是:

  • 在2021年5月27日前登陆百度智能云实名认证并使用过该接口,即可保持每天5万次的额度

  • 超过时间,未实名,则降为每月200次

  • 超过时间,就算这时再实名,也将只有每月1000次的免费额度!

明显只要错过这次机会,百度OCR就一点也不香了...


5

 

   

百度通用场景OCR识别接口申请

这里简单介绍一下百度OCR接口申请的步骤

注册并登录百度智能云:https://cloud.baidu.com/?from=console

然后点击产品 » 人工智能 » 找到通用场景文字识别 » 点击立即使用

点击创建应用

然后接口选择默认,文字识别包名不需要,应用归属选个人,应用名称和应用描述随意填写

创建好之后点击查看应用详情

然后就获取到 API Key 和 Secret Key 了

6

 

   

在PandaOCR中配置接口

然后我们现在到 PandaOCR 中配置一下自己的API接口

配置方法的话,我比较推荐你下图这样操作

然后会弹出一个文件让你编辑,我们先在里面往下翻,找到百度OCR那一条

将默认的API替换为你自己申请的

然后我们往上翻,找到百度OCR功能选择的地方

你申请了1个KEY,但具体调用的时候又分了API版、API高精度版、API手写版、API网络版

之所以有这些,是因为每个API免费的调用次数限制是不同的(其中手写识别每天只有50次!)

通常情况下我用的是高精度版,500次/天完全够用了,所以版本那里填的是2

总之以上都配置完之后,务必记得 Ctrl+S、Ctrl+S、Ctrl+S 保存使配置生效!

然后你就能尽情使用啦~

▲默认截图识别快捷键是F4

7

 

   

其他接口申请

由于PandaOCR支持的接口太多,阿虚也不可能说每一个接口怎么申请都给一个详细教程

加之其实申请接口的步骤并不难,基本上就是注册好账号之后,在网站上找到你需要的接口点击使用,接着随便创建一个应用就能获取(参考上文百度智能云接口的申请方式)

所以以下接口的申请大家就自己尝试吧

▲没你想的那么难

点击查看全文

除了百度,腾讯也算挺良心的,如果有表格、公式识别的需求,建议去申请腾讯一个的接口

7.1

 

  

百度

OCR:https://cloud.baidu.com (50000次/天免费)

翻译:http://api.fanyi.baidu.com (免费)

公式:https://cloud.baidu.com (只有1000次免费)

表格:https://cloud.baidu.com (50次/天免费)

7.2

 

  

腾讯

OCR+公式+表格:https://cloud.tencent.com/ (1000次/月免费 | 腾讯云接口),开通服务:https://console.cloud.tencent.com/ocr/general(工商营业执照可以不上传),申请秘钥:https://console.cloud.tencent.com/cam/capi

OCR+翻译:https://ai.qq.com/v1/ (免费 | 腾讯AI 旧版接口,翻译不推荐,质量不如腾讯云)

OCR:https://open.youtu.qq.com/ (500次/天免费 | 腾讯优图接口)

翻译:https://cloud.tencent.com (5百万字符/月免费 | 腾讯云接口)

7.3

 

  

SpaceOCR

OCR:https://ocr.space/OCRAPI (25000次/月免费)

7.4

 

  

网校(学而思/好未来)

OCR:https://ai.100tal.com (10万次/天免费 | 10秒间隔/次)

7.5

 

  

搜狗

OCR:http://deepi.sogou.com (送100、200元体验金 | 可能需要先充点钱才能用)

翻译:http://deepi.sogou.com (送100、200元体验金)

7.6

 

  

有道

按实际使用量付费

OCR:http://ai.youdao.com (送50元体验金)

翻译:http://ai.youdao.com (送50元体验金)

7.7

 

  

阿里

购买后限次,以下为最低价格,最低价格不可重复购买

OCR:https://market.aliyun.com/products/57124001/cmapi020020.html (通用版 | 500次/0.01元)

OCR:https://market.aliyun.com/products/57124001/cmapi028554.html (高精度 | 500次/0.01元)

OCR:https://market.aliyun.com/products/57124001/cmapi00040832.html (手写版 | 500次/免费)

OCR:https://market.aliyun.com/products/57124001/cmapi00040847.html (多语种 | 500次/免费)

表格:https://market.aliyun.com/products/57124001/cmapi024968.html (500次/0.01元)

7.8

 

  

讯飞(体验服务)

  • OCR:https://www.xfyun.cn/services/textRecg (10万次/免费,有效期90天)

  • 公式:https://www.xfyun.cn/services/formula-discern(可直接在此网站上传图片来识别)

7.9

 

  

Deepl

翻译:https://www.deepl.com/translator (付费且服务器延迟较高)

7.10

 

  

Mathpix

公式:https://dashboard.mathpix.com (1000次/月免费丨登录之后点"Accept",然后输入信用卡信息,完成账号激活(点"Accept"没反应的可以换个浏览器试试,还不行的话可能需要富强上网)激活后,将会显示API的ID和KEY)

申请这个需要有双币信用卡,如果你还是大学生,可以到「学姿势」这个网站详细了解大学生信用卡申请方法(阿虚也是在读书期间就申请到了):https://www.xuezishi.net/




写完还是想说一句

对于百度,骂,但该用还是用

人家AI技术也是真滴强,而且这么良心让你白嫖,香也是真的香



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存