首先,你还是得需要一个基于Chromium的浏览器,比如谷歌浏览器或者360极速浏览器(不是360安全浏览器),鉴于国内用户普遍使用360的习惯,这里我以360为例。 相信大家在找资料时,对这种情况,深恶痛绝 百度流氓也不是一天两天了,所以这回,我们比他更流氓。 网上的一些下载方法,如在文库地址wenku前加wap改成手机格式,或者打开百度快照的方式,经我测试,都只能把文档转成最基本的TXT文字,但是我们需要的文档,里面经常会有公式,特殊符号,图片,PDF格式,这种情况下,网上的方法就不适用了。 今天我要教大家的,是如何完美保存百度文库上的文档。 1、打开控制台在你要下载的百度文库页面,按F12,再点击Console打开控制台 2、输入代码在蓝色>处,输入以下代码:
(代码来自Github用户分享,原址:https://github.com/HelloCodeMing/baidu-wenku) 之后回车,然后你会发现 原本的百度文库页面是这样的: 红色区域全是不需要的 使用代码后,变成这样: 大家也应该猜得出来个大概,这串代码的作用,就是除去网页上不需要的东西,只留下我们要的文档。 3、生成文件在生成文件之前,这一步非常重要,就是要先点击下方的继续阅读 这样整个文档才会加载出来,然后把页面移到文档的第一页,在网页的空白处点击右键,选择打印 接着你会看到 因为我们并不是要打印文件,而是下载文档,所以我们要点击左侧的更改按钮 选择另存为PDF。 保存之前,一定要勾选背景图形,这样文档中的图片才会显示,并且等右侧PDF文件预览完全显示,再点保存。 然后就会保存为一个PDF文件,在你电脑上: 这里需要注意的是,有些文档,保存过程中,可能出现部分文字重叠的情况,你需要在保存前,更改一下纸张尺寸,找到最适合自己文档的就行了。 4、成功打开我们刚才保存的PDF文件,你会发现,只要源文件是WORD格式再保存的,里面的文字都是可以选取并复制的,并且图片也能很好的显示。 图片完美保存 有一些人通过使用“冰点文库”之类的软件,把百度文库上的文件转成PDF下载,这类软件,转换出的PDF,非常模糊,文字也不支持复制,十分难用,所以我不推荐大家使用。 冰点文库转换的效果 最后 室友在用我的方法时,出现了一个问题,就是文档里面,有百度的广告。。。 作者:陈添宝 链接:https://www.jianshu.com/p/6c689cab7076 來源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 根据作者思路及Github分享的代码思路,编辑了一段处理【金锄头文库的思路】页面的代码: $("#headerplace").remove(); $("body > div:nth-child(3)").remove(); $("#ad_1").remove(); $("#ad_2").remove(); $("#ad_3").remove(); $("#ad_4").remove(); $("#ad_5").remove(); $("#ad_6").remove(); $("#ad_7").remove(); $("#ad_8").remove(); $("#ad_9").remove(); $("#readshop").remove(); $(".nav_uis").remove(); $("#boxright").remove(); $("#brandlist").remove(); $("#Div1").remove(); $(".mt10.works-comment").remove(); $(".bg_100.foot_nav_bg").remove(); $(".bg_100.siteInner_bg").remove(); $("#box1 > table > tbody > tr > td").remove(); $("#box1 > div.works-manage-box.shenshu").remove(); $("#box1 > dl").remove(); $("#box1 > div.works-intro.gray2.c666").remove(); $("#box1 > div.doctopic").remove(); $("#page_more").remove(); |
|