实际工作和生活中,经常会遇到 PDF 文件不可编辑、文字无法中,或者需要识别图片中的文字和公式等情况。
虽然有不少的工具或者网站可以免费实现 PDF OCR 识别,但是要么速度很慢,要么就是对文件的大小有限制,用起来多少是不方便的。
今天就给大家推荐一个功能完善的 OCR 识别软件,不仅可以实现 PDF ORC 识别,还可以从图片中提取文字,识别并提取公式,功能非常强大,还可以离线部署,免费使用。
软件简介
Umi-OCR 是一款优秀的文字识别工具,自带高效的 OCR 引擎,内置多种识别语言,可以满足不同的文本识别需求,而且不需要联网,解压即用,支持截图 OCR、PDF OCR 识别,批量 OCR 等功能,功能非常强大。
软件特点
Umi-OCR 无需联网,解压即用,适合在没有的联网的环境中使用,可以很好的保证隐私性和信息安全,而且具备丰富的 OCR 功能,比如截图 OCR,PDF OCR,批量 OCR 识别等。
-
免费开源:所有代码都是公开的,用户可以自由使用和修改。 -
便捷性:软件无需安装,解压后即可使用,适合在没有网络的环境中运行。 -
高效性:内置高效的 OCR 引擎,能够快速准确地识别文字。 -
多语言支持:内置多种语言的识别库,支持不同语言的文字识别。 -
灵活性:支持命令行和 HTTP 接口调用,方便与其他软件或系统进行集成。 -
多功能:提供截图 OCR、批量 OCR、PDF 识别、二维码识别以及数学公式识别等多种功能。


Source Forge
可以同时下载源码和 exec 安装包,也是非常的方便
如果你使用的是 windows 系统,也可以通过 Scoop 命令进行安装,执行如下命令:
scoop bucket add extras
scoop install extras/umi-ocr (可选 1)安装 Umi-OCR(自带 Rapid-OCR 引擎,兼容性好)
scoop install extras/umi-ocr-paddle (可选 2)安装 Umi-OCR(自带 Paddle-OCR 引擎,速度稍快)
上述两个二选一即可,同时安装会存在覆盖的情况。
软件功能展示
以 windows 操作系统为例,下载压缩包解压后,点击 Umi-OCR.exe
即可启动程序。
软件在第一次启动时,会根据系统自动选择语言。如果想切换语言,可以在设置中操作。
切换操作语言:
截图 OCR 功能
截图 OCR 功能需要手动打开。开启后就可以使用快捷键唤起截图,识别图片中的文字。OCR 后的文字不仅可以保持原来的格式,而且还能复制到粘贴板,方便后续操作。
文本后处理
Umi-OCR 还提供了 OCR 文本后处理功能,比如多栏-按自然段换行,可以自动识别多栏布局,按自然段规则进行换行,能够适应大部分场景。
批量 OCR
当你有大量的图片需要 OCR 时,就可以使用这个功能。支持多种图片格式,jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff,而且可以将识别的结果输出为多种格式,比如 txt, jsonl, md, csv。
文档识别
除了支持 PDF 文档外,还支持 xps, epub, mobi, fb2, cbz 文档格式。不仅可以提取原有文本,也可输出为 双层可搜索 PDF 。如果 OCR 任务时间太长,也可以设置任务完成后 自动关机/休眠。
除了上面的介绍的功能之外,Umi-OCR 还支持扫描二维码以及输入文本生成二维码等功能。
小结一下
Umi-OCR 是一款功能强大的 OCR 识别软件,具备丰富的 OCR 识别功能,内置多种识别语言库,无需联网,解压即用,可以满足多样的使用需求。
https://github.com/hiroi-sora/Umi-OCR