闲着没事来一发测试好了,看了答友们的答案,有一个很热门的选择就是手机端的全能扫描王。我平时有一些文字提取也会用到全能扫描王,但是全能扫描王的识别率受PDF文件的影响很大,有时候表现很好有时候很差。 一、手机端我们以显示器以及纸质版拍照生成的PDF文件来做一下测试。 1、显示器 我用全能扫描王从显示器上拍了《出师表》,之后截取一部分出来进行识别。 通过全能扫描王的OCR识别,对于一些增强锐化后的文字OCR处理,很不理想。 我们再切换为原图,看一下在原图的状态下识别正确率会不会高一些,很显然,不存在的。跟增强并锐化的识别效果基本一致。 对于这样的一个处理结果,意味着你在进行OCR之后,还需要自己再对照进行检查以免出现纰漏,看似省时其实也会将时间花费在其他地方。 2、纸质 这是我从一分纸质文件上拍照截取下来的文件。 我们将其进行增强并锐化。 进行OCR识别。 此次识别的准确率达到百分之一百,表现很优异。 但是对于这样一款发挥不稳定的OCR产品,我不是很放心把识别的活交给它。不过在没有电脑的情况下,全能扫描王还是挺不错的一款识别App。 二、PC端这里我用的是捷速OCR,使用的还是刚才全能扫描王扫描出来的《出师表》。 点击右上角的OCR。 添加进刚才的《出师表》,点击“识别”-“识别全部页面”。 这样文字就可以被出来了。 有一个小小的不方便,就是识别出来的文字最大只能选取整行,不能选取段落或者全选。不过可以直接全部生成一个Word文档,算是弥补了这方面的不足。 纸质版拍照生成PDF文件的OCR识别就不上了,因为刚刚那一份的照片没有提前生成PDF文件。不过显示屏拍下来的文件都可以识别,纸质版就更不用说了。不过建议是尽可能不要从显示器拍照后识别。至少用截图的方式导入到全能扫描王再生成PDF,或者在PC端用迅捷PDF转换器在线版也可以将截图文件转换成PDF文件。 |
|