分享

百度文库免费下载

 生信交流平台 2021-12-29

    百度文库是百度发布的供网友在线分享文档的平台。网友可以在线阅读和下载这些文档。百度文库的文档包括教学资料、考试题库、专业资料、公文写作、法律文件等多个领域的资料。百度用户上传文档可以得到一定的积分,下载有标价的文档则需要消耗积分。当前平台支持主流的doc(.docx)、 .ppt(.pptx)、 .xls(.xlsx)、 .pot、 .pps、 .vsd、 .rtf、 .wps、 .et、 .dps、 .pdf、.txt文件格式。

    俗话说no pain, no gain。要想下载一些有标价的文档你就需要付出积分。积分的获取可以通过上传文档,也可以直接付钱获取。对于手头不宽裕,又没有精力去上传文档的人来说,如何去获取需要的文档呢?今天小编为大家介绍一款小工具,可以免费获取百度文库中的文档。仅供大家从学习python编程的角度来探讨和交流。

    如果你去github上搜索,wenku,你会发现有很多这样的工具。小编自己测试过一款python写的工具,觉得还不错,叫做wenku_spider

1.下载wenku_spider

下载地址是https://github.com/jk50505k/wenku_spider

下载好之后解压会得到一个名叫wenku_spider-master的文件夹,我将其中的百度文库.py修改成了wenku.py。因为一般的程序不太喜欢中文。

2.下面来举个例子,在百度文库中搜索测序”,会发现下面这篇文章“”,需要2下载券才能下载。https://wenku.baidu.com/view/cad28aba4b35eefdc8d333a7

我们来试试wenku_spider

python wenku.py

运行完之后在wenku_spider-master文件夹中会生成一个测序名词解释.txt的文本文件。文档的内容就在里面了。

注意这里只能获取文档中的文字,图片和文档格式都会丢失。

3.这个工具还能下载ppt和pdf,注意下载下来的都是图片格式

我们再来测试一下ppt,找到一个名为“”的ppt文档,一共有71页,需要2下载券,链接是

https://wenku.baidu.com/view/2450cea1690203d8ce2f0066f5335a8102d2668e.html?fr=search

下载过程中,程序会自动生成一个文件夹img,ppt的每一页都会以样图片的形式保存到这个文件夹中

然后你只需要打开一个空白的ppt,插入相册,选中刚才得到的71张图片就能得到完整的ppt了。

希望这个工具对大家有所帮助,如果觉得有用请分享给更多需要的人。

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多