分享

3个Python PDF库,提取信息、转换格式、分割剪裁有它就够了!

 静幻堂 2018-08-17
中公优就业 2018-08-15 11:29:40

PDFMiner:

PDFMiner是一个从PDF文档中提取信息的工具。与其他PDF相关的工具不同,它只用于获取和分析文本数据。PDFMiner能获取页面中文本的准确位置,以及字体或行等其他信息。它还有一个PDF转换器,可以将PDF文件转换成其他文本格式(如HTML)。还有一个可扩展的解析器PDF,可以用于文本分析以外的其他用途。

3个Python PDF库,提取信息、转换格式、分割剪裁有它就够了!

(地址https://github.com/euske/pdfminer)

PyPDF2:

PyPDF 2是一个python PDF库,能够分割、合并、裁剪和转换PDF文件的页面。它还可以向PDF文件中添加自定义数据、查看选项和密码。它可以从PDF检索文本和元数据,还可以将整个文件合并在一起。

3个Python PDF库,提取信息、转换格式、分割剪裁有它就够了!

(地址https://github.com/mstamy2/PyPDF2)

ReportLab:

ReportLab能快速创建PDF 文档。经过时间证明的、超好用的开源项目,用于创建复杂的、数据驱动的PDF文档和自定义矢量图形。它是免费的,开源的,用Python编写的。该软件包每月下载5万多次,是标准Linux发行版的一部分,嵌入到许多产品中,并被选中为Wikipedia的打印/导出功能提供动力。

3个Python PDF库,提取信息、转换格式、分割剪裁有它就够了!

(地址https://www./opensource/)

以上3个Python PDF库。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多