16k+ stars 超实用的 OCR文字识别开源项目！

Original 小晨爱编程爱技术 2024-02-24

每天给大家带来网站工具、开源社区项目、开源软件、安卓&IOS软件等黑科技！

公众号推送改版，请务必点击【爱编程爱技术】右上角【设为星标🌟】，这样才不会错过最新的文章推送。

如果你们有什么好的建议，也可以在后台留言。

创作不易，希望大家给一点鼓励，给文章点下"赞"和"在看"，谢谢大家！每日持续更新，望宝子们多多支持~

小编今天为大家分享一个最近特别火的 OCR文字识别开源项目：Umi-OCR。开源、免费、无需联网，解压即用。支持截屏/粘贴/批量导入图片、段落排版/排除水印、扫描/生成二维码、条形码。内置多国语言库。

该项目在 GitHub 上已斩获 16.2 Kstars，非常受欢迎。

🎨️ 最新版的功能特性

支持 win7 x64 及以上的系统，附带多国语言识别库
免费：本项目所有代码开源，完全免费。
灵活：支持命令行、HTTP接口等多种调用方式。
方便：解压即用，离线运行，无需网络。
高效：自带高效率离线OCR引擎。只要电脑性能足够，可以比在线OCR服务更快。
功能：截图OCR、批量OCR、二维码、条形码、数学公式识别（测试中）

🧰 下载安装

1、在 GitHub 发行页下载最新版本

打不开GitHub的小伙伴可参考文章：Github 绝版开源加速器

开发者提供了 Paddle 和 Rapid 两个版本，差别仅 OCR 引擎插件不同，其它功能完全一致。

二者区别如下：

Paddle 版性能好，速度快，占用率高，适合高配机器。
Rapid 版速度稍慢，内存占用低，适合低配机器，兼容性好

重要提示：如果执行 OCR 时报错 [Error] OCR init fail，大概率是 CPU 不兼容 Paddle，请换用 Rapid 版本。

2、解压安装

.7z.exe 为自解压包，直接双击运行，然后解压到指定的目录即可。

双击【Umi-OCR.exe】启动软件。

3、全局设置

一键添加快捷方式或设置开机自启
更改界面语言。Umi支持繁中、英语、日语等语言
切换界面主题。Umi拥有多个亮/暗主题
调整界面文字的大小和字体
切换OCR插件
渲染器：软件界面默认支持显卡加速渲染。如果在你的机器上出现截屏闪烁、UI错位的情况，请调整界面和外观 → 渲染器，尝试切换到不同渲染方案，或关闭硬件加速。

🍄 功能体验

添加标签页

可按照自己的喜好，点击【+】添加需要的标签页。

标签栏左上角可以切换窗口置顶。右上角能够锁定标签页，以防止日常使用中误触关闭标签页。

截图OCR

可用快捷键【win+alt+c】唤起截图，识别图中的文字。

左侧的图片预览栏，可直接用鼠标划选复制。
右侧的识别记录栏，可以编辑文字，允许划选多个记录复制。
也支持在别处复制图片，粘贴到Umi-OCR进行识别。

段落合并

OCR文本后处理，可以整理OCR结果的排版和顺序，使文本更适合阅读和使用。

预设方案：

单行：合并同一行的文字，适合绝大部分情景。
多行-自然段：智能识别、合并属于同一段落的文字，适合绝大部分情景，如上图所示。
多行-代码段：尽可能还原原始排版的缩进与空格。适合识别代码片段，或需要保留空格的场景。
竖排：适合竖排排版。需要与同样支持竖排识别的模型库配合使用。

批量OCR

支持批量导入本地图片并识别。
识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。
支持文本后处理技术，能识别属于同一自然段的文字，并将其合并。还支持代码段、竖排文本等多种处理方案。
没有数量上限，可一次性导入几百张图片进行任务。
支持任务完成后自动关机/待机。

忽略区域

批量OCR中的一种特殊功能，适用于排除图片中的不想要的文字。

在批量识别页的右栏设置中可进入忽略区域编辑器。
如上方样例，图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片，水印会对识别结果造成干扰。
按住右键，绘制多个矩形框。这些区域内的文字将在任务中被忽略。
请尽量将矩形框画得大一些，完全包裹住水印所有可能出现的位置。

二维码

可截图/粘贴/拖入本地图片，读取其中的二维码、条形码。还支持输入文本，生成二维码、条形码。支持一图多码。支持19种协议和纠错等级等参数。

支持的协议包括：Aztec、Codabar、Code128、Code39、Code93、DataBar、DataBarExpanded、DataMatrix、EAN13、EAN8、ITF、LinearCodes、MatrixCodes、MaxiCode、MicroQRCode、PDF417、QRCode、UPCA、UPCE。

🔥 安装数学公式识别插件

最新 v2.0.1 版本支持数学公式识别，能够识别既包含文字又包含数学公式的混合图片。

该功能需要安装插件 Pix2Text ，插件解压后 1.7GB 大小，无此类需求的不建议安装。

具体操作步骤如下：

1、下载插件【win7_x64_Pix2Text.7z】

插件库地址：

https://github.com/hiroi-sora/Umi-OCR_plugins/releases

2、解压到 UmiOCR-data/plugins 目录下

3、重启 Umi-OCR 软件

全局设置→文字识别→当前接口改为Pix2Text→点击应用修改

4、回到截图/批量标签页，正常使用即可

注：首次 OCR 任务，可能需10~60s时间加载，耐心等待，后续OCR速度将恢复正常。

5、截图测试

6、效果预览

目前该插件仍在测试中，这个精度已经很好了，期待后续版本的优化改良！

访问不了 GitHub 的宝子，获取软件及插件可后台私信留言关键词：umiocr

附项目的链接：

GitHub 开源地址：
https://github.com/hiroi-sora/Umi-OCR

插件库地址：

https://github.com/hiroi-sora/Umi-OCR_plugins

往期推荐：

27K+ stars 开源的Docker容器管理工具

3K+ stars 国产轻量级动态线程池开源项目

22k+ stars 搭建个人私有云盘的开源神器

13k+ Stars 功能强悍，群控手机，开源无需root

点关注不迷路，每日分享优秀开源项目

继续滑动看下一个

16k+ stars 超实用的 OCR文字识别开源项目！

Original 小晨爱编程爱技术

爱编程爱技术

向上滑动看下一个

中美友好合作故事——十万名中国弃婴长大了

因为家暴终身挂着粪袋的她，在等一个死刑！

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

16k+ stars 超实用的 OCR文字识别开源项目！

每天给大家带来网站工具、开源社区项目、开源软件、安卓&IOS软件等黑科技！

如果你们有什么好的建议，也可以在后台留言。

创作不易，希望大家给一点鼓励，给文章点下"赞"和"在看"，谢谢大家！每日持续更新，望宝子们多多支持~

🎨️ 最新版的功能特性

🧰 下载安装

🍄 功能体验

添加标签页

截图OCR

🔥 安装数学公式识别插件

16k+ stars 超实用的 OCR文字识别开源项目！

您可能也对以下帖子感兴趣

中美友好合作故事——十万名中国弃婴长大了

因为家暴终身挂着粪袋的她，在等一个死刑！

【资源分享】【收集不易多多分享】【2024年12月29日】宝山区区面试流程和结构化真题20道其中5题幼儿（独家请老师给参考答案）

《鱿鱼游戏2》今天下午四点开播，网友无心上班了，导演悄悄剧透

人民日报征集“中美友好合作故事”，令人感奋

生成图片，分享到微信朋友圈

16k+ stars 超实用的 OCR文字识别 开源项目！

每天给大家带来网站工具、开源社区项目、开源软件、安卓&IOS软件等黑科技！

如果你们有什么好的建议，也可以在后台留言。

创作不易，希望大家给一点鼓励，给文章点下"赞"和"在看"，谢谢大家！每日持续更新，望宝子们多多支持~

🎨️ 最新版的功能特性

🧰 下载安装

🍄 功能体验

添加标签页

截图OCR

🔥 安装数学公式识别插件

16k+ stars 超实用的 OCR文字识别 开源项目！

您可能也对以下帖子感兴趣

16k+ stars 超实用的 OCR文字识别开源项目！

16k+ stars 超实用的 OCR文字识别开源项目！