分享

一蓑烟雨

 默默无闻的狂人 2023-10-25 发布于江西
不知道选择哪一款OCR工具,进来让我告诉你

不知道选择哪一款OCR工具,进来让我告诉你

OCR,即文字识别

你看见的文字,都应该是字符

图片、电子书、扫描件、公式等所有无法选中的文字,都可以通过 OCR 提取转化为字符

不想通读全文的,可以直接浏览下面的导图,然后选择其中推荐指数较高的软件进行阅读

甚至不想阅读文章就要直接获取所有软件,OK,文章中出现的所有软件(包括未提供官网/开源地址的),请在公重號「小帅随笔」回复:ocr

一. 在线版+离线版

1.1 eSearch(win/mac/linux)

官网:https://lify.app

开源:https://github.com/xushengfeng/eSearch

使用方法:默认快捷键「alt+c」截取文字,然后按下「enter」键可进行 OCR 识别

eSearch 提供了离线 OCR 和其他在线 OCR,可以在设置中选择。

离线版识别效果如下图所示,准确率较高。

eSearch 目前支持的在线 OCR 服务是百度 OCR 和有道 OCR,调用第三方在线接口可能需要付费。

百度 OCR 教程(免费领取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51

获取 API Key 和 Secret Key,并填入设置中。

有道 OCR 教程(付费):https://ai.youdao.com/doc.s

获取应用 ID 和密钥,并填入设置中。

其它功能:

  1. 搭配搜索引擎,让文字可被搜索
  2. 聚合多家翻译,支持多个引擎同时翻译
  3. 支持以图搜图(Yandex、Google、百度),轻松得到图片的更多信息
  4. 轻松录制屏幕,并通过 FFmpeg 转化为多种格式(mp4、gif、mkv、webm……)

下方的图片是小帅个人习惯的默认引擎和快捷键:

1.2 OCR工具集(win)

官网:https://fm323.

吾爱大佬 「fm32」 开发,软件完全免费。

使用方法:快捷键 F4 」或者「双击任务栏图标」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。

在线版:搜狗 OCR 识别(准确率比较高)

这个 OCR 功能在搜狗输入法中也内置,在输入法的工具栏中有一个「文字识别」功能。

搜狗公司在2021年被腾讯收购,所以说现在的产品都是腾讯旗下。

离线版:RapidOCR 识别(准确率一般,支持简体中文、繁体中文、日文、韩文、英文5种语言)

二. 在线版

其实电脑在联网时,如果只是最基本的文本识别,很多人更倾向于使用 QQ 或者 微信 的 OCR 工具。

电脑端使用方法:打开其自带的截图工具,截取页面,然后选择「提取文字」按钮

手机端使用方法:长按带有文字的图片,然后选择「提取文字

下面以电脑端的 OCR 识别进行举例。

2.1 QQ(全端)

QQ 自带截图工具的启动快捷键需要在设置里面查看

小帅把快捷键设置为:「ctrl+alt+q

我还测试了一款从 QQ9.5.4 版本提取出来的截图工具,发现中文识别效果比最新版的要好一些。

2.2 微信(全端)

微信 自带截图工具的启动快捷键需要在设置里面查看

小帅把快捷键设置为:「ctrl+alt+w

经过测试,QQ 和微信的识别效果几乎没有什么差别。

2.3 天若OCR官方版(win)

官网:https://ocr.

使用方法:「快捷键 F4 」或者「双击任务栏图标」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。

免费版支持最基本的文本识别,专业版永久 59¥只是能使用高级功能,但是并不包含付费的接口

2.4 PandaOCR(win)

PandaOCR普通版:https://github.com/miaomiaosoft/PandaOCR

PandaOCR专业版:https://github.com/miaomiaosoft/PandaOCR.Pro

普通版支持最基本的文本识别,但 PandaOCR 专业版不花钱也可以使用普通版的功能,如要使用直接建议下载专业版,因为普通版的识别效果真的很差,如下图所示:

而使用专业版的免费功能识别后中文全部正确。

2.5 千百图片识别(win)

官网:http://spf.cn/ocr

调用的百度的 OCR 接口,使用作者提供的每天可以免费识别6次,并且每个月要获取一下 token, 想要不限量推荐自己申请一个 百度OCR 接口,然后在此软件「百度接口」->「添加独立接口」填入即可。

百度 OCR 教程(免费领取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51

使用方法:「快捷键 ctrl+alt+d 」或者在软件中选择「屏幕截图」,鼠标左键绘制出需要识别的区域,接着鼠标左键双击这个区域使其加载到软件中,最后点击「开始识别」。

PS:

  • 填入自己申请的接口后,记得开启「高精度识别」以获得更好的体验。
  • 每次的设置关闭软件后都会重置,使用起来不太方便。

该软件还有很多其它功能,比如:繁体竖排识别、图片尺寸处理、识别文字并翻译等。

2.6 OCR文字识别(win)

该软件最后一版是 2018.5.2 开发,目前有道OCR和有道翻译仍可使用,OCR文字提取效果还不错

三. 离线版

3.1 平平OCR(win)

吾爱大佬 「zbb2012」 开发,软件完全免费。识别准确率比较高

使用方法:「快捷键 Alt+Q 」或者「双击任务栏图标」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。

本 OCR 为离线识别,使用 CPU 推理,识别速度取决于你的 CPU 性能。

截图的功能和天若 OCR 一样都使用的是 ShareX 开源组件库。

后期版本更新中作者会逐步加上一些高级功能,例如:批量证件的识别并导出到表格。值得一用。

3.2 天若OCR本地版(win)

唉可悲修改版:https://gitee.com/wanglifree/tianruoocr-cl

使用方法:「快捷键 F4 」或者「双击任务栏图标」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。

识别效果:会有个别字出现问题,整体来说还可以。

该软件支持自定义百度 OCR 接口 和百度翻译 API 接口。

百度 OCR 教程(免费领取):https://cloud.baidu.com/doc/OCR/s/dk3iqnq51

百度翻译 API (可免费使用):http://api.fanyi.baidu.com/api/trans/product/index

3.3 傻木摄影_表单识别(win)

文字识别,使用方法:点击「开始截图」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。

OCR表单识别效果也不错,识别完成后会自动生成一个 xls 文件并打开。

3.4 Umi-OCR(win)

开源: https://github.com/hiroi-sora/Umi-OCR

使用方法:「快捷键 win+alt+c 」或者「右击任务栏图标选择-屏幕截图」,鼠标左键绘制出需要识别的区域,松开鼠标,软件开始自动识别。

识别效果:会有一些中文字出现问题,有一点差强人意。

四. 特殊OCR

4.1 图片批量识别重命名(win)

吾爱大佬「echocccc」开发,改软件通过批量扫描图片并提取图片上的文字,然后将提取到的文字作为图片的名称。

用途:图片(如:证件照等)不能直接搜索,通过此工具修改名称后,接着用 everything 软件即可实现快速搜索。

使用方法:将图片拖拽至软件左侧,依次执行「本地OCR部署」->「列表文件OCR」->「批量重命名」,每次打开软件都需要先点击「本地OCR部署」,等待旁边出现绿色的圆形按钮才能进行 OCR

4.2 PDF文件OCR(win)

测试了几款,最终发现 ABBYY_FineReader 效果最好。

使用方法:鼠标左键绘制一个需要识别的区域,然后根据区域右下角出现的三个功能进行操作:

由于这个图片里是表格,这里我们使用「复制为表格」,下面是粘贴到 excel 中的效果:

五. OCR排版

其实现在的很多 OCR 工具识别后都内置了排版功能,但毕竟不是全部,因此这款文字排版工具也可以收藏一下。

5.1 OCR排版伴侣(win)

吾爱大佬「海洋之心专用」开发,软件的功能可以看一下原作者的演示:

动图封面

该工具可用于处理 OCR 识别的文字 或 部分网页 或 pdf 复制 出现的“非正常断行”现象。


打包获取本文所有软件,关注公重號:小帅随笔,后台发送以下关键词:ocr

编辑于 2023-07-31 23:08・IP 属地河南

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多