分享

如何把纸质文档转化为word?

 大眼W 2017-10-19

闲着没事来一发测试好了,看了答友们的答案,有一个很热门的选择就是手机端的全能扫描王。我平时有一些文字提取也会用到全能扫描王,但是全能扫描王的识别率受PDF文件的影响很大,有时候表现很好有时候很差。

一、手机端

我们以显示器以及纸质版拍照生成的PDF文件来做一下测试。

1、显示器

我用全能扫描王从显示器上拍了《出师表》,之后截取一部分出来进行识别。

通过全能扫描王的OCR识别,对于一些增强锐化后的文字OCR处理,很不理想。

我们再切换为原图,看一下在原图的状态下识别正确率会不会高一些,很显然,不存在的。跟增强并锐化的识别效果基本一致。

对于这样的一个处理结果,意味着你在进行OCR之后,还需要自己再对照进行检查以免出现纰漏,看似省时其实也会将时间花费在其他地方。

2、纸质

这是我从一分纸质文件上拍照截取下来的文件。

我们将其进行增强并锐化。

进行OCR识别。

此次识别的准确率达到百分之一百,表现很优异。

但是对于这样一款发挥不稳定的OCR产品,我不是很放心把识别的活交给它。不过在没有电脑的情况下,全能扫描王还是挺不错的一款识别App。

二、PC端

这里我用的是捷速OCR,使用的还是刚才全能扫描王扫描出来的《出师表》。

点击右上角的OCR。

添加进刚才的《出师表》,点击“识别”-“识别全部页面”。

这样文字就可以被出来了。

有一个小小的不方便,就是识别出来的文字最大只能选取整行,不能选取段落或者全选。不过可以直接全部生成一个Word文档,算是弥补了这方面的不足。

纸质版拍照生成PDF文件的OCR识别就不上了,因为刚刚那一份的照片没有提前生成PDF文件。不过显示屏拍下来的文件都可以识别,纸质版就更不用说了。不过建议是尽可能不要从显示器拍照后识别。至少用截图的方式导入到全能扫描王再生成PDF,或者在PC端用迅捷PDF转换器在线版也可以将截图文件转换成PDF文件。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多