pytesseract是google维护的具有学习功能的OCR引擎,3.0以后支持中文识别。 安装: 1. 安装tesseract-ocr组件;记得同步下载简体中文与英文语言包。 2. 安装PIL,需注意Windows64位版本 3. pip install pytesseract 使用: image = Image.open('1.jpg') # 打开图片
image.load() # 加载一下图片,防止报错,此处可省略 image.show() # 调用show来展示图片,调试用,可省略 tessdata_dir_config = '--tessdata-dir 'C:\\Program Files (x86)\\Tesseract-OCR\\tessdata'' vcode = pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config) print vcode |
|