分享

请问怎么在GoogleBook网站上下载书籍?

 杏雨微醉 2015-04-07
http://hi.baidu.com/%B2%E9_%BA%EC%D3%F1/blog/item/7b386b1f69f6fcc1a78669d8.html
如何下载GOOGLE BOOKS上的书籍?
2009-06-30 01:03
注意:只能在Firefox上能用
第一步:安装Firefox
第二步:安装Greasemonkey add-on
第三步:安装 Google Book Downloader
第四步:找一本书,比如:http://books.google.com/books?id=NLngYyWFl_YC&printsec=frontcover& dq=subject:%22+Mathematics+%22&as_brr=3&ei=dSUESsuCLIuSkASoh7SiCA&rview=1#PPP1,M1
第五步:在右边的面板上, 按Download this book
第六步:在右边的面板上,按Download可以把页面下载过来。
第七步:在右边的面板上,会显示所下载的页面,然后把这些页面下载本地电脑,可以用
迅雷等工具。
这样就可以把Google Book上书籍下载过来了,然后把它们做成PDF格式的文件,就大功告成了。
有些书用搜索引擎、电骡等工具无法找到,但是在google books有,可惜只能看部分内容,而且只能一页一页翻。最近用google books downloader下载了很多书,只要google books能部分预览的书,用这个软件都能下载全(偶尔有缺页)并存成一个pdf文件。
1. 到http://www./GoogleBookDownloader下载新版本GBD-0.1.0.alpha8
2. 注意要运行这个软件机器上得安装:Microsoft .net Framework 3.5 SP1 http://www.microsoft.com/downloads/info.aspx?na=90&p=&SrcDisplayLang=en&SrcCategoryId=&SrcFamilyId=ab99342f-5d1a-413d-8319-81da479ab0d7&u=http%3a%2f%2fdownload.microsoft.com%2fdownload%2f0%2f6%2f1%2f061f001c-8752-4600-a198-53214c69b51f%2fdotnetfx35setup.exe
打开软件,到tools-options设置1. tools-options-Algorithms
这儿有两个重要选项
(1)下载书页图片的分辨率,分辨率越高越清晰但文件越大,缺省1000,我选的1600
(2)check discovered algorithms: 如果启用(enabled),本来的一些缺页可能会找到,但是不能保证全部找到。
2. Connections
按Import...- Rosinstrument.com
导入代理服务器列表。
      
可以开始下载了
1. 到 http://books.google.com/ncr 搜索自己要找的书,
http://xfge9g.blu./y1pqy3QBUmawc7nTAvsaylyKWabursfYur5BJqE3xksu0yyrDIcyyMqIKbcTI2slliDOZW30XgFQEUxhdYaiy2q6Q/112.jpg
注意选择"limited preview and full view",只有这些书才能下载
2. 比如我点击上面搜索到的 the art of speculation 进去
地址栏的地址是:http://books.google.com/books?id=OfWnbHN3aQ8C&printsec=frontcover&dq=art+of+speculation&ei=brWKSbT5BIPAlQS72cnIBQ]http://books.google.com/books?id=OfWnbHN3aQ8C&printsec=frontcover&dq=art+of+speculation&ei=brWKSbT5BIPAlQS72cnIBQ
那么id=后面就是书的代码: OfWnbHN3aQ8C
拷贝粘贴到google books downloader中,按"check"按钮,软件开始搜索书页
http://xfge9g.blu./y1pJV9Jjwd73jpZvLdEm63UD8o8gNfd3OrIdYkszohNFiC0hoiPVCAZT8KY-rs0NA7mN4ZRjiSpevcs9Q6qRjnQ6A/113.jpg
图中missing表示一开始找不到的书页,但软件孜孜不倦的搜索,搜到的从missing变成了discovered
搜索完毕的标志是上面"download all"按钮的字从灰色变成黑色的可以点击。
http://xfge9g.blu./y1pYgaz3H6Bd6EpgBrQ0b1gL3QM8kPRDJUu1-zjU3WbiudikCvO_txyL0UAbAXI19WtMLcVZqs50Y-hBsgl7Y25QQ/114.jpg
有些书页还是显示missing,这是实在找不到了。基本上95%以上的书页可以找到。
按download all 下载:
下载中:
http://xfge9g.blu./y1p0zl3jq62s8Xf07Sf0-8qJgRqQEEZStBGjHJtHIl2dJdl_z6vifKAp8wLCcyOmSTtSCCEcqke7rvO-GOtRbf4bg/115.jpg
下载完之后上面“save entire book as。。。”按钮会由灰色变成黑色,可以点击保存成一个pdf文件。
生成的pdf文件一般很清晰,但是文件较大,一般都要几十MB。有的书我用ABBYY Finerreader 9.0 OCR,这个软件对英文书的OCR效果一流。转成文字型pdf或者txt纯文本等格式,然后做成sony reader上用的电子书,一般只有几百KB。
google books 书籍下载方法 -
关于google books书籍的下载方法
什么是google books
google books是Google近来增加了新的搜索引擎,其中包含相当数量的图书,据说是和多家大型图书馆合作,目标是在10年内建成世界上最大的网络图书馆。但是google的目的并不是给人下载,而是供读者简单检索以向出版商和书店购买该书,因此也没有任何收费项目。其图书目前采取的是图片的方式,大部分图书均包含所有页面。
在打开 http://books.google.com的页面输入查找的关键字,搜索。得到包含该关键字的ebook,选择一本书进入
因为版权问题,google的书并不是每一页都能看,它只允许你浏览一部分(官方说法是20%多吧)。而且书中的每一页均是gif图片,在一般的浏览器中受到保护,只能看,不能下载。
所以对每个找书的人来说,现在的问题就是:先:能看到的页能下载下来吗?进而:不能看到的页能通过什么方法看到吗?
对于第一个问题,可以说是已经解决,方法用很多,试用后,感觉最方便的还是用firefox及几个java插件的方法了。
步骤:
1.安装firefox;
2.用firefox打开网址
http:// 选择信任站点,安装
3.重新打开浏览器firefox,打开地址 http:///projects/butler/
右击链接Download version 0.3 of April 14, 2005,选择install user script
4.重新打开浏览器firefox,检索http://books.google.com/ 打开电子书。右击图片,可以选择保存了。
接下来解决第二个问题:
如何看完整本书
因为goole books限制了上下只能看三页,达到三页后,到下一页的按钮会失效。
一个相当笨却行之有效的方法是在所能达到的最后一页搜寻某单词检索,在结果中找到该页,打开可以继续向下看。亦即:
一开始打开第一页,于是可以达到第三页,在第三页搜寻某单词,检索后返回若干结果,找到第三页,打开,于是可以到达第五页,以此类推。
但这样的方法都太费时费力。
通过偶的仔细揣摩,偶发现可以通过组合关键字利用左边的search in the book来解决这个问题。search in the book这个工具可以在在书内检索,把符合关键字的页面给出链接,所以,我们可以找几个这个书的常出现的词,组合起来,来达到覆盖所有页面的目的。
比如:market mircostructute theory这本书
常用的关键字有:market,stock,information,spread,volatility等,其实有个窍门,如果这本书定量的东西比较多,大可用数字来作关键字覆盖书,经实验,用1 2 3 4 5就可以覆盖大半本书(这里有个问题,不能采用太常见的英文单词,如:is the a 等, google会忽略它们的)
这样,我用market OR 1 OR 2 OR 3 OR 4 OR 5就把288页的整本书全覆盖了,这样就克服了google的上下三页的限制。(令人汗的是,在国外一个讨论google print的论坛上,看到别人发现一个非常好玩的bug:只要在search in the book工具栏里输入200,不管任何书,都可以把页面链接全显示出来。我已经检验过,绝对管用,不知道是不是google内部人故意留的)
找到每页的链接,但这时也很难把书看完,大概看个10页左右,会提醒你输入你的google账号(包括gmail等服务的账号均可),输入后,又可以 看个20 左右。然后会再跳出页面限制你继续看。这时就没有办法了。因为其中涉及到goole的cookie,如果不更改cookie,你将只能等待24小时,以使得其失效。
通过使用不同的 google的账号。为此,我注册了10个以上的gmail,当一个账号下载受限时,注销,换另外一个上,每个账号可下20左右,于是,这样基本可把google允许下的所有页面下载完,如那本market microstructure theory,共288页,偶下了能下的250多页(为什么说是google允许下的全下了呢,因为google的每本书都有一部分页面是怎么也不让浏览 的,页面链接提示为Sorry, this page's content is restricted.每本书大概10%-15%左右)但是现在,登陆gmail账户好像特别困难,好像一天只能登陆一次,一部计算机也只能登陆一次,加代理的方法不知道是否行的通?下次试试,不过好像 google的代理很难找。
第二步的地址已变为http://greasemonkey./

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多