分享

豆瓣数据导出工具(初步测试)

 东方不贰 2015-05-30
5/20 附加说明:
这个小工具其实是多年以前做的,后来一直懒得改。有朋友说需要这样一个东西,于是就放了出来,没想到一夜之间来了那么多推荐。里面 bug 是很多的,如果用过应该知道。希望专业的出手做一个啊!。。。



源码:https://github.com/zhuth/DoubanDiaryBackup
可执行程序待已知 bug 修复后放出。

使用 C# 编写,请在 Windows 下使用,需要.net Framework 3.5。(话说从源码编译的话应该不用说明了吧……)

使用方法:
1、程序运行后,在内嵌的浏览器中登录;
2、待标题栏出现“已登录 - xxxx”字样后,即可点击菜单栏上的某项,开始抓取对应内容。目前可以抓取的是:日记全文和评论全文(保存为 HTML 文档)、广播全文(保存为 HTML 文档并写入数据库)和书、影、音的列表(写入数据库);
3、选择某项操作进行之后,静候任务完成,直到出现“下载列表完成”提示时方告结束。然而可能由于网络等原因出现卡壳,这时请点击菜单栏中的“重试”按钮。

已知 bug 和待改进的内容:
1、写入数据库可能存在问题,遗漏某些项目,原因待查;
2、自动判断卡壳的情况重试;
3、数据库导出?

由于豆瓣对机器人的防范措施比较严格,不得不折衷采用这种丑陋的内嵌浏览器方式,还请见谅。
欢迎做改进,请发 Pull Request 。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多