14.6K star！最好用的OCR文字识别项目，没有之一！

doctorwangfovn 2023-12-31 发布于山东

展开全文

大家好，我是开源君！

伙伴们，平时都会用到文字识别吧？

最近，开源君在Github上发现了一个厉害的开源OCR项目——Umi-OCR，真的很强大，而且还可以离线使用，现在已经有了14.6k 的星标。

下面是项目在Github上的官方介绍。

项目是基于PaddleOCR开发的，支持截图识别、批量导入识别、个性化识别等功能。

整个项目都是用Python编写的，所以win7系统的朋友们可能用不了。推荐使用Win10 x64及以上版本。

直接在releases中选择合适的版本，下载解压即可。

下面就是工具的界面。

接下来给大家展示一下它的亮点功能：

这个功能很适合在一些不能复制的网页上使用，速度很快，准确率也很高。

也就是说，你可以一次性截取所有的图片，然后再从记录板里复制所有识别出来的文字，不需要一张一张地截取和复制。

如果有很多图片需要识别，这个功能非常好用。

只需要将所有的图片导入，然后点击开始任务，就可以批量识别了。

完成之后，识别的内容会保存在一个txt文档中。

如果你不喜欢txt，需要md、jsonl 的格式，它一样可以满足你。

这个功能是Umi-OCR的一大亮点，可以指定识别的内容区域，或者屏蔽掉不需要识别的区域。

比如说，我有三张和下图类似的图片，我只希望提取出发票号码。

只需要在设置里点击打开忽略区域编辑器，将不需要的内容用红框框起来。

然后点击开始任务即可。

更多细节功能，可以自行去项目地址探索~

GitHub地址：https://github.com/hiroi-sora/Umi-OCR

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： doctorwangfovn > 《待分类》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多