OCR如何将图片的文字转换成为文档

来自：宋姗姗姗姗 > 馆藏分类

配色：

字号：大中小

OCR如何将图片的文字转换成为文档

2012-08-21 | 阅：转： | 分享

ABBYYFineReader是世界排名第一的OCR文字识别工具，提供高效和精准的文档识别、数据提取解决方案，支持多国字符和彩色文件识别，主要用于将扫描图像、图片型PDF转化成可编辑的文本。http://dl.dbank.com/c0mehgygx0

这个是网盘，你需要简单注册下,然后才可以下载。

下好后的软件

将此软件解压到指定位置，得到文件夹

里面有大量的文件，眼睛要放亮了。

在这些文件里，首先要运行破解文件，图标是这个

运行后如图

点击安装。

点击确定后软件会开始运行，但是会出现如下错误对话框

因为是破解版的，所以会出现这个问题，点击确定。下次就不会再出现了。只会在安装破解文件的时候出现这个问题。不影响程序正常使用。

在刚才的文件夹中找到程序执行文件

双击运行它。如果是经常用，可以往桌面发送个快捷方式。

软件打开后界面如图所示：

看到了吧，功能狠好狠强大的软件。

注意，凡是上面标明扫描仪的选项，必须要配备扫描仪，相机代表图片格式。文件夹代表PDF格式文件。

下面我们进行测试，功能比较多，我们选择几项进行测试。

我们选择公共选项或者是WORD选项里面的

这个是大家最常用也会经常用到的选项。把一些扫描好的图纸文件上的字重新录入，生成电子版。

我从网上DOWN了一张药品说明书。

这说明书大小560K左右，一般扫描仪的话，也就是200PI的分辨率，所以质量较差，图片如下。

下面用软件进行转换：

在主界面里面选择：

出现如下选择项，挑选要转换的文件：

选定文件，选择打开，出现如下

耐心等待分析完成，软件会自动生成WORD文档，全部完成后会自动打开，

因为系统自己生成的WORD文件文字较小，所以我调整了下字体，截图给大家看看，你们自己对比一下：

汉字采集基本正确，但是碰到一些标点符号以及因为字母单位的时候就出错了。这个是无法避免的，如果是纯粹文字性的东西，会好很多。

转换的文件是可操作的，如图，会出现如下标题框：

但是我试验了一下，效果不明显，机会没有什么用，系统第一次默认的范围，你更改了也起不到多大的效果。这可能和原图片质量有关系。你可以选择范围，比如红头文件的头你可以不要，只要正文。

有什么不对的地方敬请指教。

我用一样的图和PS以及汉王还有其他的OCR软件做过对比，确实这软件在汉字识别上优于其他软件。

祝大家工作顺利，事事顺心！

献花(0)

(本文系宋姗姗姗姗首藏)

类似文章 更多

发表评论：