一蓑烟雨

不知道选择哪一款OCR工具，进来让我告诉你

小帅

OCR，即文字识别

你看见的文字，都应该是字符

图片、电子书、扫描件、公式等所有无法选中的文字，都可以通过 OCR 提取转化为字符

不想通读全文的，可以直接浏览下面的导图，然后选择其中推荐指数较高的软件进行阅读

甚至不想阅读文章就要直接获取所有软件，OK，文章中出现的所有软件（包括未提供官网/开源地址的），请在公重號「小帅随笔」回复：ocr

一. 在线版+离线版

1.1 eSearch(win/mac/linux)

官网：https://lify.app

开源：https://github.com/xushengfeng/eSearch

使用方法：默认快捷键「alt+c」截取文字，然后按下「enter」键可进行 OCR 识别

eSearch 提供了离线 OCR 和其他在线 OCR，可以在设置中选择。

离线版识别效果如下图所示，准确率较高。

eSearch 目前支持的在线 OCR 服务是百度 OCR 和有道 OCR，调用第三方在线接口可能需要付费。

百度 OCR 教程（免费领取）：https://cloud.baidu.com/doc/OCR/s/dk3iqnq51

获取 API Key 和 Secret Key，并填入设置中。

有道 OCR 教程（付费）：https://ai.youdao.com/doc.s

获取应用 ID 和密钥，并填入设置中。

其它功能：

搭配搜索引擎，让文字可被搜索
聚合多家翻译，支持多个引擎同时翻译
支持以图搜图（Yandex、Google、百度），轻松得到图片的更多信息
轻松录制屏幕，并通过 FFmpeg 转化为多种格式（mp4、gif、mkv、webm……）

下方的图片是小帅个人习惯的默认引擎和快捷键：

1.2 OCR工具集(win)

官网：https://fm323.

吾爱大佬「fm32」开发，软件完全免费。

使用方法：「快捷键 F4 」或者「双击任务栏图标」，鼠标左键绘制出需要识别的区域，松开鼠标，软件开始自动识别。

在线版：搜狗 OCR 识别（准确率比较高）

这个 OCR 功能在搜狗输入法中也内置，在输入法的工具栏中有一个「文字识别」功能。

搜狗公司在2021年被腾讯收购，所以说现在的产品都是腾讯旗下。

离线版：RapidOCR 识别（准确率一般，支持简体中文、繁体中文、日文、韩文、英文5种语言）

二. 在线版

其实电脑在联网时，如果只是最基本的文本识别，很多人更倾向于使用 QQ 或者微信的 OCR 工具。

电脑端使用方法：打开其自带的截图工具，截取页面，然后选择「提取文字」按钮

手机端使用方法：长按带有文字的图片，然后选择「提取文字」

下面以电脑端的 OCR 识别进行举例。

2.1 QQ(全端)

QQ 自带截图工具的启动快捷键需要在设置里面查看

小帅把快捷键设置为：「ctrl+alt+q」

我还测试了一款从 QQ9.5.4 版本提取出来的截图工具，发现中文识别效果比最新版的要好一些。

2.2 微信(全端)

微信自带截图工具的启动快捷键需要在设置里面查看

小帅把快捷键设置为：「ctrl+alt+w」

经过测试，QQ 和微信的识别效果几乎没有什么差别。

2.3 天若OCR官方版(win)

官网：https://ocr.

使用方法：「快捷键 F4 」或者「双击任务栏图标」，鼠标左键绘制出需要识别的区域，松开鼠标，软件开始自动识别。

免费版支持最基本的文本识别，专业版永久 59￥只是能使用高级功能，但是并不包含付费的接口

2.4 PandaOCR(win)

PandaOCR普通版：https://github.com/miaomiaosoft/PandaOCR

PandaOCR专业版：https://github.com/miaomiaosoft/PandaOCR.Pro

普通版支持最基本的文本识别，但 PandaOCR 专业版不花钱也可以使用普通版的功能，如要使用直接建议下载专业版，因为普通版的识别效果真的很差，如下图所示：

而使用专业版的免费功能识别后中文全部正确。

2.5 千百图片识别(win)

官网：http://spf.cn/ocr

调用的百度的 OCR 接口，使用作者提供的每天可以免费识别6次，并且每个月要获取一下 token，想要不限量推荐自己申请一个百度OCR 接口，然后在此软件「百度接口」->「添加独立接口」填入即可。

百度 OCR 教程（免费领取）：https://cloud.baidu.com/doc/OCR/s/dk3iqnq51

使用方法：「快捷键 ctrl+alt+d 」或者在软件中选择「屏幕截图」，鼠标左键绘制出需要识别的区域，接着鼠标左键双击这个区域使其加载到软件中，最后点击「开始识别」。

PS：

填入自己申请的接口后，记得开启「高精度识别」以获得更好的体验。
每次的设置关闭软件后都会重置，使用起来不太方便。

该软件还有很多其它功能，比如：繁体竖排识别、图片尺寸处理、识别文字并翻译等。

2.6 OCR文字识别(win)

该软件最后一版是 2018.5.2 开发，目前有道OCR和有道翻译仍可使用，OCR文字提取效果还不错

三. 离线版

3.1 平平OCR(win)

吾爱大佬「zbb2012」开发，软件完全免费。识别准确率比较高。

使用方法：「快捷键 Alt+Q 」或者「双击任务栏图标」，鼠标左键绘制出需要识别的区域，松开鼠标，软件开始自动识别。

本 OCR 为离线识别，使用 CPU 推理，识别速度取决于你的 CPU 性能。

截图的功能和天若 OCR 一样都使用的是 ShareX 开源组件库。

后期版本更新中作者会逐步加上一些高级功能，例如：批量证件的识别并导出到表格。值得一用。

3.2 天若OCR本地版(win)

唉可悲修改版：https://gitee.com/wanglifree/tianruoocr-cl

使用方法：「快捷键 F4 」或者「双击任务栏图标」，鼠标左键绘制出需要识别的区域，松开鼠标，软件开始自动识别。

识别效果：会有个别字出现问题，整体来说还可以。

该软件支持自定义百度 OCR 接口和百度翻译 API 接口。

百度 OCR 教程（免费领取）：https://cloud.baidu.com/doc/OCR/s/dk3iqnq51

百度翻译 API (可免费使用)：http://api.fanyi.baidu.com/api/trans/product/index

3.3 傻木摄影_表单识别(win)

文字识别，使用方法：点击「开始截图」，鼠标左键绘制出需要识别的区域，松开鼠标，软件开始自动识别。

OCR表单识别效果也不错，识别完成后会自动生成一个 xls 文件并打开。

3.4 Umi-OCR(win)

开源： https://github.com/hiroi-sora/Umi-OCR

使用方法：「快捷键 win+alt+c 」或者「右击任务栏图标选择-屏幕截图」，鼠标左键绘制出需要识别的区域，松开鼠标，软件开始自动识别。

识别效果：会有一些中文字出现问题，有一点差强人意。

四. 特殊OCR

4.1 图片批量识别重命名(win)

吾爱大佬「echocccc」开发，改软件通过批量扫描图片并提取图片上的文字，然后将提取到的文字作为图片的名称。

用途：图片（如：证件照等）不能直接搜索，通过此工具修改名称后，接着用 everything 软件即可实现快速搜索。

使用方法：将图片拖拽至软件左侧，依次执行「本地OCR部署」->「列表文件OCR」->「批量重命名」，每次打开软件都需要先点击「本地OCR部署」，等待旁边出现绿色的圆形按钮才能进行 OCR

4.2 PDF文件OCR(win)

测试了几款，最终发现 ABBYY_FineReader 效果最好。

使用方法：鼠标左键绘制一个需要识别的区域，然后根据区域右下角出现的三个功能进行操作：

由于这个图片里是表格，这里我们使用「复制为表格」，下面是粘贴到 excel 中的效果：

五. OCR排版

其实现在的很多 OCR 工具识别后都内置了排版功能，但毕竟不是全部，因此这款文字排版工具也可以收藏一下。

5.1 OCR排版伴侣(win)

吾爱大佬「海洋之心专用」开发，软件的功能可以看一下原作者的演示：

该工具可用于处理 OCR 识别的文字或部分网页或 pdf 复制出现的“非正常断行”现象。

打包获取本文所有软件，关注公重號：小帅随笔，后台发送以下关键词：ocr

编辑于 2023-07-31 23:08・IP 属地河南