分享

pdf文件怎么转换为txt格式呢

 繁星闪耀 2019-09-17
如何把pdf文件转换成txt文档

现在是电子书的时代,很多朋友的电子设备只支持txt格式的文件,可是找到的一些不错的书籍却是pdf的格式。怎么把pdf格式转成txt格式呢?近来,总有朋友问我这个问题。 这里把我的方法写下来,分享给朋友们,希望能帮到大家。更希望起到抛砖引玉的作用,有更好的方法被分享出来。
工欲善其事,必先利其器,所以,需要先安装pdf文档的专用软件,推荐使用Adobe Acrobat 7 Professional或者Adobe Acrobat 9 Professional版本。不要使用Adobe Acrobat reader,因为功能太少。软件网上一搜,可以随便找到。
如果是由word文件转成的pdf文件,这个比较简单。
打开pdf文档,选择文件——另存为,如下图:

在弹出的另存为对话框中,保存类型——纯文本。就可以了。如下图:

如果没法直接保存成纯文本,报ASCII码错误的话,可以先保存为microsoft word文档,再由word文档转换成txt格式。

如果pdf文档是由扫描后的图片制作而成的,用上述方法就无法直接转换成txt格式了。需要用以下方法。
打开pdf文档,选择文件——另存为——保存类型选择jpeg图片格式。如下图:

存为jpeg格式的图片之后,需要安装OCR识别软件。推荐使用清华紫光OCR或者汉王OCR软件。软件网上都可以免费下到。我使用的是汉王OCR 8.0 。
安装好软件之后,运行OCR软件。选择文件——打开图像,如下图:
找到图片保存目录,打开从pdf文件转换成的图片。

图片文件打开以后,选择识别——开始识别:

识别完成后界面如下图:


上半部分是识别出来的文字,下半部分是原稿。因为识别软件以及图片清晰度的原因,有些字会与原稿有误,需要校对。校对过程中,如果原稿字太小,看不清楚,可以选择放大原稿操作。如下图:


校对完成,选择输出——到指定格式文件,保存成txt格式就可以了。如下图:



至此,很轻松的,txt格式的文档就转换好了。
最后说一句,校对很重要,因为需要与原稿对比着认真的看一遍。仔细才能做到无误。所以这个过程很花时间的。希望大家从网上分享到别人上传的txt格式的电子书,在享受阅读的快乐与愉悦的同时,请怀着感恩的心,感谢发帖者。因为这也是别人的劳动结晶。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多