分享

Summer 大讲堂第 2 期:如何高效的从图中提取文字?

 CharlizeHuang 2017-08-05

某天,Boss 说:某某,把这份文件打成 Word。然后,有的同学可能会拿起纸质稿打开 Word 开始「啪啪」打字......


那么,是否有更快捷的方法呢?答案是有的。这时候,我们需要利用 OCR(光学字符识别),具体的方法有很多,此处介绍三种。


假设我们需要将以下图片转成文字:




然后,我们逐一介绍这三种方法:


1
Office 工具


对于安装了 Office 2003 的同学们,可以使用其中的 Microsoft Office Document Imaging 功能。


第一步,我们使用 Microsoft Office Picture Manager 打开图片:




第二步,文件→打印→选择虚拟打印机 Microsoft Office Document Image Writer,如下:




然后,点击下一步→下一步→保存→完成,系统会自动调用 Microsoft Office Document Imaging,如下:




接着,我们选择「工具」→使用 OCR 识别文本」,完成后,选择下方的「将文本发送到 Word」,系统会自动调用 Word,就可以获得图像中的文字了:




内容稍作修改即可。


而在 Office 2010 中呢,木有 Microsoft Office Document Imaging 功能,我们需要借助于 OneNote 图片,将图片插入 OneNote,如下:




然后选中图片,右键→复制图片中的文本:




OK,就这么简单,软件已经完成了识别工作,我们新建 Word,粘贴即可:




此外,值得一提的是,不知大家有没有注意刚才 OneNote 中右键菜单的最后一项「使图像中的文本可搜索」,我们选中它,会发现在右上角搜索栏键入一个搜索词后,图片中的文字变成可搜索的了:




OK,Office 就讲这么多,下面介绍使用 Adobe Acrobat X 进行 OCR 。


2
Acrobat 工具


开始前,确保安装了 Acrobat。如果原文件是 PDF,那么我们可以直接打开 PDF;如果是图片,我们首先需要将图片转换成 PDF,方法很简单,选中图片→右键→转换为 Adobe PDF:




Acrobat 会自动打开生成的 PDF 文件,如下:




我们点击右侧「工具」→识别文本→在本文件中,会发现图片已经转换为文本,可进行复制了:




直接复制到 Word 即可。


3
ABBYY FineReader 工具


FineReader 图片是一个专业的 OCR 软件,此处特别推荐第 11 版,Look:




它功能强劲,还可以选择文档语言,并进行组合,有兴趣的话大家可以自己去摸索,此处只做简要演示。


我们选择第二个选项「文件(PDF/图像)至 Microsoft Word,打开图片,软件即可自动完成识别:




最后软件会把结果发送至 Word:




OK,将图片转化成文字就先简单介绍到这,我们下周见。



文章编辑:大师兄

图片来源:Summer

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多