分享

[转载]搬国家图书馆数字方志库回家

 昵称9847303 2016-05-30
网址:http://mylib./web/guest/shuzifangzhi
官网上是这样描述此特色库的“地方志文献为我国所特有,也是国家图书馆独具特色的馆藏之一,所存文献数量与品质极高。采用数字图书馆方式,整理、加工编纂清代(含清代)以前的方志资源,将有利于保存、传播、研究、开发中华特色文化,推动数字资源建设。”
方志库不管是在旧版或是新版系统中,都是可以免费在线预览全文的。目前做文库采用的流行技术是OpenOffice,pdf2swf用于将WORD一类文档转换为PDF,再转换为SWF,然后放置在一些FLASH的阅读器中。其中用得最多的阅读器是开源的FlexPaper,国家图书馆的阅览器也是在此组件上做的二次开发,除能支持文档外,还有视频,音频,包括实时流媒体的数据。有关新版国图阅览器的笔记,之前已有小记。在此是记录一些数字方志的想法,目的当然也是搬方志库回家,但搬回家的不只是一页一页的全文,还有方志库的元数据。对下载回来的资源进行加工后,再开发一个类似国图方志库的平台来使用这些资源,就算是比较完整的“搬”了。
1、采集目标主要有两个,一是全文资源,二是元数据。
2、全文资源通过后台的AMF接口获取链接格式,批量下载全文。元数据可通过页面采集,需要的字段有如:书名、责任者、出版地、出版时间、版本、分类号、文种、总册数、描述、索取号等,还有各卷信息,链接地址等。
3、下载的文件为单页文件,可使用ASV批量提取其资源,再通过合并工具将其合成单册。当然,为了建库的需要,可以留下单页文件,方便在线预览。这些过程当然也要设计为批量执行。
4、重新的数据库可采用WEB开发方式,这样便于部署。但也可以制作一个单机的版本,这样使用起来更为灵活一些。
5、 通过元数据及全文文档,搭建的新平台可仿照国图的界面设计,当然也可以完全不同。不论是WEB版或是单机版或是光盘版,尽量做到简洁易用即可。功能不必太强大,最基本的有如检索,在线预览,打印,单本下载等等即可。
6、数字方志目前资源有6511个,652页,每页十条记录。
7、与数字方志同为古籍大类下的宋人文集亦是此思路。
8、此计划绝不是用于商业目的,只是个人私藏之用。
9、目前数字方志库的新版还没有放出来,但从对博士库及中文图书库的分析,数据已准备好。不知新版/旧版混搭来分析会不会在将来影响使用,先不管这么多了,新版的接口调用比旧版的页面数据要高效一些,先混搭设计吧。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多