基于Python实现图像文字识别OCR工具

gjzh090 2022-01-17

展开全文

前言：

在工作、生活中常常会用到，比如票据、漫画、扫描件、照片的文本提取。本文主要介绍了基于PyQt + PaddleOCR实现的一个桌面端的OCR工具，用于快速实现图片中文本区域自动检测+文本自动识别，需要的朋友可以参考一下

小编基于 PyQt + PaddleOCR 写了一个桌面端的OCR工具，用于快速实现图片中文本区域自动检测+文本自动识别。

识别效果如下图所示：

所有框选区域为OCR算法自动检测，右侧列表有每个框对应的文字内容；

点击右侧“识别结果”中的文本记录，然后点击“复制到剪贴板”即可复制该文本内容。

功能列表

文本区域检测+文字识别
文本区域可视化
文字内容列表
图像、文件夹加载
图像滚轮缩放查看
绘制区域、编辑区域
复制文本识别结果

OCR部分

图像文字检测+文字识别算法，主要是借助 paddleocr 实现。

创建或者选择一个虚拟环境，安装需要用到的第三方库。

① 安装框架

如果你没有NVIDIA GPU，或GPU不支持CUDA，可以安装CPU版本：

如果你的GPU安装过CUDA9或CUDA10，cuDNN 7.6+，可以选择下面这个GPU版本：

② 安装 PaddleOCR

安装paddleocr：

版面分析，需要安装 Layout-Parser：

③ 测试安装是否成功

安装完成后，测试一张图片--image_dir ./imgs/11.jpg，采用中英文检测+方向分类器+识别全流程：

输出一个list：

④ 在python中调用

from paddleocr import PaddleOCR, draw_ocr # Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`ocr = PaddleOCR(use_angle_cls=True, lang='ch')  # need to run only once to download and load model into memoryimg_path = './imgs/11.jpg'result = ocr.ocr(img_path, cls=True)for line in result:    print(line)

输出结果是一个list，每个item包含了文本框，文字和识别置信度：