不知道选择哪一款OCR工具,进来让我告诉你
OCR,即文字识别
你看见的文字,都应该是字符
图片、电子书、扫描件、公式等所有无法选中的文字,都可以通过 OCR 提取转化为字符
不想通读全文的,可以直接浏览下面的导图,然后选择其中推荐指数较高的软件进行阅读
甚至不想阅读文章就要直接获取所有软件,OK,文章中出现的所有软件(包括未提供官网/开源地址的),请在公重號「小帅随笔」回复:ocr
一. 在线版+离线版
1.1 eSearch(win/mac/linux)
开源:https://github.com/xushengfeng/eSearch
使用方法:默认快捷键「alt+c
」截取文字,然后按下「enter
」键可进行 OCR 识别
eSearch 提供了离线 OCR 和其他在线 OCR,可以在设置中选择。
离线版识别效果如下图所示,准确率较高。
eSearch 目前支持的在线 OCR 服务是百度 OCR 和有道 OCR,调用第三方在线接口可能需要付费。
百度 OCR 教程(免费领取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51
获取 API Key 和 Secret Key,并填入设置中。
有道 OCR 教程(付费):https://ai.youdao.com/doc.s
获取应用 ID 和密钥,并填入设置中。
其它功能:
- 搭配搜索引擎,让文字可被搜索
- 聚合多家翻译,支持多个引擎同时翻译
- 支持以图搜图(Yandex、Google、百度),轻松得到图片的更多信息
- 轻松录制屏幕,并通过 FFmpeg 转化为多种格式(mp4、gif、mkv、webm……)
下方的图片是小帅个人习惯的默认引擎和快捷键:
1.2 OCR工具集(win)
吾爱大佬 「fm32
」 开发,软件完全免费。
使用方法:「快捷键 F4
」或者「双击任务栏图标
」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。
在线版:搜狗 OCR 识别(准确率比较高)
这个 OCR 功能在搜狗输入法中也内置,在输入法的工具栏中有一个「文字识别
」功能。
搜狗公司在2021年被腾讯收购,所以说现在的产品都是腾讯旗下。
离线版:RapidOCR 识别(准确率一般,支持简体中文、繁体中文、日文、韩文、英文5种语言)
二. 在线版
其实电脑在联网时,如果只是最基本的文本识别,很多人更倾向于使用 QQ 或者 微信 的 OCR 工具。
电脑端使用方法:打开其自带的截图工具,截取页面,然后选择「提取文字
」按钮
手机端使用方法:长按带有文字的图片,然后选择「提取文字
」
下面以电脑端的 OCR 识别进行举例。
2.1 QQ(全端)
QQ 自带截图工具的启动快捷键需要在设置里面查看
小帅把快捷键设置为:「ctrl+alt+q
」
我还测试了一款从 QQ9.5.4 版本提取出来的截图工具,发现中文识别效果比最新版的要好一些。
2.2 微信(全端)
微信 自带截图工具的启动快捷键需要在设置里面查看
小帅把快捷键设置为:「ctrl+alt+w
」
经过测试,QQ 和微信的识别效果几乎没有什么差别。
2.3 天若OCR官方版(win)
官网:https://ocr.
使用方法:「快捷键 F4
」或者「双击任务栏图标
」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。
免费版支持最基本的文本识别,专业版永久 59¥只是能使用高级功能,但是并不包含付费的接口
2.4 PandaOCR(win)
PandaOCR普通版:https://github.com/miaomiaosoft/PandaOCR
PandaOCR专业版:https://github.com/miaomiaosoft/PandaOCR.Pro
普通版支持最基本的文本识别,但 PandaOCR 专业版不花钱也可以使用普通版的功能,如要使用直接建议下载专业版,因为普通版的识别效果真的很差,如下图所示:
而使用专业版的免费功能识别后中文全部正确。
2.5 千百图片识别(win)
调用的百度的 OCR 接口,使用作者提供的每天可以免费识别6次,并且每个月要获取一下 token, 想要不限量推荐自己申请一个 百度OCR 接口,然后在此软件「百度接口
」->「添加独立接口
」填入即可。
百度 OCR 教程(免费领取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51
使用方法:「快捷键 ctrl+alt+d
」或者在软件中选择「屏幕截图
」,鼠标左键绘制出需要识别的区域,接着鼠标左键双击这个区域使其加载到软件中,最后点击「开始识别
」。
PS:
- 填入自己申请的接口后,记得开启「
高精度识别
」以获得更好的体验。 - 每次的设置关闭软件后都会重置,使用起来不太方便。
该软件还有很多其它功能,比如:繁体竖排识别、图片尺寸处理、识别文字并翻译等。
2.6 OCR文字识别(win)
该软件最后一版是 2018.5.2 开发,目前有道OCR和有道翻译仍可使用,OCR文字提取效果还不错
三. 离线版
3.1 平平OCR(win)
吾爱大佬 「zbb2012
」 开发,软件完全免费。识别准确率比较高。
使用方法:「快捷键 Alt+Q
」或者「双击任务栏图标
」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。
本 OCR 为离线识别,使用 CPU 推理,识别速度取决于你的 CPU 性能。
截图的功能和天若 OCR 一样都使用的是 ShareX 开源组件库。
后期版本更新中作者会逐步加上一些高级功能,例如:批量证件的识别并导出到表格。值得一用。
3.2 天若OCR本地版(win)
唉可悲修改版:https://gitee.com/wanglifree/tianruoocr-cl
使用方法:「快捷键 F4
」或者「双击任务栏图标
」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。
识别效果:会有个别字出现问题,整体来说还可以。
该软件支持自定义百度 OCR 接口 和百度翻译 API 接口。
百度 OCR 教程(免费领取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51
百度翻译 API (可免费使用):http://api.fanyi.baidu.com/api/trans/product/index
3.3 傻木摄影_表单识别(win)
文字识别,使用方法:点击「开始截图
」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。
OCR表单识别效果也不错,识别完成后会自动生成一个 xls 文件并打开。
3.4 Umi-OCR(win)
开源: https://github.com/hiroi-sora/Umi-OCR
使用方法:「快捷键 win+alt+c
」或者「右击任务栏图标选择-屏幕截图
」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。
识别效果:会有一些中文字出现问题,有一点差强人意。
四. 特殊OCR
4.1 图片批量识别重命名(win)
吾爱大佬「echocccc
」开发,改软件通过批量扫描图片并提取图片上的文字,然后将提取到的文字作为图片的名称。
用途:图片(如:证件照等)不能直接搜索,通过此工具修改名称后,接着用 everything 软件即可实现快速搜索。
使用方法:将图片拖拽至软件左侧,依次执行「本地OCR部署
」->「列表文件OCR
」->「批量重命名
」,每次打开软件都需要先点击「本地OCR部署
」,等待旁边出现绿色的圆形按钮才能进行 OCR
4.2 PDF文件OCR(win)
测试了几款,最终发现 ABBYY_FineReader 效果最好。
使用方法:鼠标左键绘制一个需要识别的区域,然后根据区域右下角出现的三个功能进行操作:
由于这个图片里是表格,这里我们使用「复制为表格
」,下面是粘贴到 excel 中的效果:
五. OCR排版
其实现在的很多 OCR 工具识别后都内置了排版功能,但毕竟不是全部,因此这款文字排版工具也可以收藏一下。
5.1 OCR排版伴侣(win)
吾爱大佬「海洋之心专用
」开发,软件的功能可以看一下原作者的演示:
该工具可用于处理 OCR 识别的文字 或 部分网页 或 pdf 复制 出现的“非正常断行”现象。

打包获取本文所有软件,关注公重號:小帅随笔,后台发送以下关键词:ocr