分享

开源的OCR库,Opensourced OCR library — Windows Liv...

 西北小子 2010-05-13
 
3月8日

开源的OCR库,Opensourced OCR library

突然想起如何做一个论坛的发帖机,但是现在多数都要图片认证,需要一个OCR库来识别图片。于是在网上找了找,还真是有很多实现:
  1. OCRE, OCR Easy, http://lem.eui./ocre.html
  2. Clara OCR, http://directory./claraocr.html
  3. Ocrad, based on a feature extraction, http://directory./ocrad.html
  4. GOCR, http:///projects/jocr
  5. OCRchie: Modular Optical Character Recognition Software, http://http.cs./~fateman/kathey/ocrchie.html
  6. sf.net上还有很多正在进行的项目,不过大多数还停留在设想阶段

现在的问题,是测试这些库。不过猜测,这些OCR对付国内的网站还行,像MSN这样的图片肯定无效了。

下载这些程序分别测试了一下,

gocr和ocrad稍作修改可在Windows下编译运行。gocr用vc6, ocrad用gcc。

OCRE,OCRchie和clara OCR需要X window或gtk不太好编译。

测试了一下sina, baidu, taobao,他们都或多或少做了干扰噪音,所以基本不能识别。

用gocr能够正确识别的最好情况是能够正确识别4个数字中的3个。

 

看来在没有对图片作预处理之前,这种识别方式基本不可行。

还没有开始就已经结束了。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多