配色: 字号:
OCR如何将图片的文字转换成为文档
2012-08-21 | 阅:  转:  |  分享 
  
ABBYYFineReader是世界排名第一的OCR文字识别工具,提供高效和精准的文档识别、数据提取解决方案,支持多国字符和彩色文件识别,主要用于将扫描图像、图片型PDF转化成可编辑的文本。http://dl.dbank.com/c0mehgygx0

这个是网盘,你需要简单注册下,然后才可以下载。



下好后的软件



将此软件解压到指定位置,得到文件夹



里面有大量的文件,眼睛要放亮了。







在这些文件里,首先要运行破解文件,图标是这个

运行后如图

点击安装。



点击确定后软件会开始运行,但是会出现如下错误对话框





因为是破解版的,所以会出现这个问题,点击确定。下次就不会再出现了。只会在安装破解文件的时候出现这个问题。不影响程序正常使用。

在刚才的文件夹中找到程序执行文件



双击运行它。如果是经常用,可以往桌面发送个快捷方式。

软件打开后界面如图所示:





















看到了吧,功能狠好狠强大的软件。

注意,凡是上面标明扫描仪的选项,必须要配备扫描仪,相机代表图片格式。文件夹代表PDF格式文件。

下面我们进行测试,功能比较多,我们选择几项进行测试。

我们选择公共选项或者是WORD选项里面的



这个是大家最常用也会经常用到的选项。把一些扫描好的图纸文件上的字重新录入,生成电子版。

我从网上DOWN了一张药品说明书。



这说明书大小560K左右,一般扫描仪的话,也就是200PI的分辨率,所以质量较差,图片如下。



下面用软件进行转换:

在主界面里面选择:









出现如下选择项,挑选要转换的文件:







选定文件,选择打开,出现如下



耐心等待分析完成,软件会自动生成WORD文档,全部完成后会自动打开,

因为系统自己生成的WORD文件文字较小,所以我调整了下字体,截图给大家看看,你们自己对比一下:









汉字采集基本正确,但是碰到一些标点符号以及因为字母单位的时候就出错了。这个是无法避免的,如果是纯粹文字性的东西,会好很多。

转换的文件是可操作的,如图,会出现如下标题框:



但是我试验了一下,效果不明显,机会没有什么用,系统第一次默认的范围,你更改了也起不到多大的效果。这可能和原图片质量有关系。你可以选择范围,比如红头文件的头你可以不要,只要正文。

有什么不对的地方敬请指教。

我用一样的图和PS以及汉王还有其他的OCR软件做过对比,确实这软件在汉字识别上优于其他软件。

祝大家工作顺利,事事顺心!

献花(0)
+1
(本文系宋姗姗姗姗首藏)