分享

文本捕捉软件

 hoper023 2007-03-30
   具体过程:
1、首先想到的是将文字用print键截屏,然后用ocr软件识别,花了很多周折,发现一款叫miniocr的软件识别率很高,几乎可以说这款软件就是为识别截屏的图片上的文字而设计的。呵呵,那些将自己的文字做成图片的“版权爱好者”们,看来要换新的手段了,同样,加密的pdf文件也可以这样去识别。
2、记得有个软件可以直接复制图片上的文字,将ocr整合在图像捕捉功能中。于是又四处寻找,在GOOGLE上换了好多关键字,最后使用“文字捕捉”找到很多资料,但是直接整合orc功能的没有找到,好像什么清华紫光的一款orc软件和一款叫“金童图霸”的软件有这样的功能,但它们是商业软件,要注册码甚至加密狗,网络上也找不到破解版。但我意外发现很多图像捕捉软件已经自带了文字捕捉功能,如:HyperSnap、Aqua Deskperience、SnagIt等等。需要说明的是这个文字捕捉并不是采用orc,而是直接用鼠标钩子函数拦截API而获取系统文字的。经过比较,Aqua Deskperience的表现是最好的。
3、很多资料中说office2003已经提供了类似的ocr功能,但遗憾的是不管我怎么操作,Microsoft Office Document Imaging总是提示执行ocr不成功(未找到文本),而网络上找不到任何解决的办法,想想自己并不是office的正版用户,这个功能用处也不大,于是就没有深究下去。但因此发现office2003自带的打印机:Microsoft Office Document Image Writer还是很有用的,很简单就把文档转换成tif文件。
 结语:
第二种解决方法让显忠很满意,他在我那里仅仅呆了5分钟就表示问题解决了,但我实际上花的时间却超过了一个上午。回忆自己的收获并不是解决显忠的一个几何画板的问题,而几乎是总结了文本捕捉问题的常见解决办法。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多