16k+ stars 超实用的 OCR文字识别 开源项目!
每天给大家带来网站工具、开源社区项目、开源软件、安卓&IOS软件等黑科技!
公众号推送改版,请务必点击【爱编程爱技术】右上角【设为星标🌟】,这样才不会错过最新的文章推送。
如果你们有什么好的建议,也可以在后台留言。
创作不易,希望大家给一点鼓励,给文章点下"赞"和"在看",谢谢大家!每日持续更新,望宝子们多多支持~
🎨️ 最新版的功能特性
支持 win7 x64 及以上的系统,附带多国语言识别库 免费:本项目所有代码开源,完全免费。 灵活:支持命令行、HTTP接口等多种调用方式。 方便:解压即用,离线运行,无需网络。 高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。 功能:截图OCR、批量OCR、 二维码、条形码、 数学公式识别(测试中)
🧰 下载安装
1、在 GitHub 发行页下载最新版本
打不开GitHub的小伙伴可参考文章:Github 绝版开源加速器
开发者提供了 Paddle 和 Rapid 两个版本,差别仅 OCR 引擎插件不同,其它功能完全一致。
Paddle 版性能好,速度快,占用率高,适合高配机器。 Rapid 版速度稍慢,内存占用低,适合低配机器,兼容性好
3、全局设置
一键添加快捷方式或设置开机自启 更改界面语言。Umi支持繁中、英语、日语等语言 切换界面主题。Umi拥有多个亮/暗主题 调整界面文字的大小和字体 切换OCR插件 渲染器:软件界面默认支持显卡加速渲染。如果在你的机器上出现截屏闪烁、UI错位的情况,请调整界面和外观 → 渲染器 ,尝试切换到不同渲染方案,或关闭硬件加速。
🍄 功能体验
添加标签页
标签栏左上角可以切换窗口置顶。右上角能够锁定标签页,以防止日常使用中误触关闭标签页。
截图OCR
左侧的图片预览栏,可直接用鼠标划选复制。
右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。
也支持在别处复制图片,粘贴到Umi-OCR进行识别。
段落合并
单行:合并同一行的文字,适合绝大部分情景。 多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景,如上图所示。 多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。 竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。
支持批量导入本地图片并识别。
识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
支持文本后处理技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。
没有数量上限,可一次性导入几百张图片进行任务。
支持任务完成后自动关机/待机。
忽略区域
在批量识别页的右栏设置中可进入忽略区域编辑器。
如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。
按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。
请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。
可截图/粘贴/拖入本地图片,读取其中的二维码、条形码。还支持输入文本,生成二维码、条形码。支持一图多码。支持19种协议和纠错等级等参数。
支持的协议包括:Aztec、Codabar、Code128、Code39、Code93、DataBar、DataBarExpanded、DataMatrix、EAN13、EAN8、ITF、LinearCodes、MatrixCodes、MaxiCode、MicroQRCode、PDF417、QRCode、UPCA、UPCE。
🔥 安装数学公式识别插件
3、重启 Umi-OCR 软件
5、截图测试
目前该插件仍在测试中,这个精度已经很好了,期待后续版本的优化改良!
附项目的链接:
GitHub 开源地址:
https://github.com/hiroi-sora/Umi-OCR
插件库地址:
往期推荐: