分享

EasyOCR-支持40多种语言的即用型OCR python库

 CNStudent 2021-01-03

EasyOCR是用于从图像提取文本的python模块。它是一种通用的OCR,可以读取自然场景文本和文档中的密集文本。我们目前支持70多种语言并正在扩展。

支持的语言

我们目前支持40多种语言,请参阅支持的语言列表。

安装

安装使用pip以获得稳定的版本:

pip install easyocr

您还可以通过网盘下载easyocr的源代码文件手动安装。

注意1:对于Windows,请按照https://pytorch.org上的官方说明先安装Torch和Torchvision 。在pytorch网站上,请确保选择正确的CUDA版本。如果仅打算在CPU模式下运行,请选择CUDA = None。

注意2:我们还在这里提供Dockerfile 。

用法

import easyocr
reader = easyocr.Reader(['ch_sim','en']) # need to run only once to load model into memory
result = reader.readtext('chinese.jpg')

输出将采用列表格式,每个项目分别表示边界框,文本和置信度。

注意1:['ch_sim','en']是您要阅读的语言列表。您可以一次传递几种语言,但并非所有语言都可以一起使用。英语与每种语言兼容。共享公共字符的语言通常相互兼容。

注意2:除了filepath chinese.jpg,您还可以将OpenCV图像对象(numpy数组)或图像文件作为字节传递。原始图像的URL也可以接受。

注3:该行reader = easyocr.Reader(['ch_sim','en'])用于将模型加载到内存中。这需要一些时间,但只需要运行一次。

您也可以将detail= 0设置为更简单的输出。

reader.readtext('chinese.jpg', detail = 0)

结果:

['愚园路', '西', '东', '315', '309', 'Yuyuan Rd.', 'W', 'E']

示例

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多