分享

Github获星3000 ,文字识别开源神器,超轻量级中文OCR!

 格瑞思n5c5alhf 2020-03-21
随着人工智能发展,OCR可以说是应用最多的技术之一。不管是身份证信息录入、车牌识别、快递单识别、还是拍照翻译都离不开它。

OCR,即Optical Character Recognition,光学字符识别,是指利用如扫描仪、数码相机等电子设备检查纸上打印的字符,并确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

近日,Github上开源了一个超轻量级中文OCR 项目chineseocr_lite,目前已获星 3000+。

chineseocr_lite 基于 chineseocr 与 psenet 实现了中文自然场景文字检测及识别,它支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅 17M。此外,该项目支持linux/macos/windows 平台。

项目地址:
https://github.com/ouyanghuiyu/chineseocr_lite

   支持的功能

  • 提供轻量的 backone 检测模型
    • psenet(8.5M)

    • crnn_lstm_lite (9.5M)

    • 行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向
  • crnn\crnn_lite lstm\dense 识别
  • 支持竖排文本识别
  • ncnn 实现 (支持lstm) nihui大佬实现的crnn_lstm推理 
  • 提供竖排文字样例以及字体库(旋转90度的字体)
  • psenet ncnn核扩展实现,有效解决粘连文本检测问题
   竖排字体样式


   生成的竖排文本样例



   识别效果展示


   ncnn 检测识别展示



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多