分享

古籍文献的检索与利用 | 建议收藏

 周原樵翁 2019-10-06
导读

本文介绍了多种古文字、古籍文献检索网站及数据库的使用方法,由北京中医药大学、南京中医药大学、福建中医药大学、(日本)京都大学等高校的医史文献硕博士们共同完成。希望能为大家掌握文献资源、利用文献解决研究中遇到的问题提供些许帮助。


01

出土文献、汉字篇


1
网站


简帛网——武汉大学简帛研究中心(推荐)

http://www./


网络首发 简帛研究文章



清华大学出土文献与保护中心 

http://www.ctwx./




复旦大学出土文献与古文字研究中心(网络维护中)

http://www.gwz.fudan.edu.cn/


国学大师(推荐)

影印字典等资源、汉语大字典、字源、古文字诂林、古文字通假字典、古文字类编、甲骨文字典、甲骨文合集、殷周金文集成等。



(1)汉语大字典



(2)字源



(3)古文字诂林

古文字字形,各家注解




(4)古文字通假字典



  (5)甲骨文合集





  (6)新金文编




  (7)殷周金文集成





 (8)字形演变



华东师范大学中国文字研究与应用中心 

https://wenzi./Index.aspx

2019年5月31日,华东师范大学中国文字研究与应用中心发布AI+表意文字大数据成果——“文镜万象”出土文献智能识别释读系统之“商周金文智能镜”。


安徽大学汉字发展与应用研究中心 http://hz./


吉林大学古籍研究所 http://gujisuo./jgsz/xrld.htm


山东大学简帛研究 http://www./


 

2
数据库


台湾中央研究院历史语言研究所—文物图像研究室—资料库检索系统

http://saturn.ihp./%7Ewenwu/search.htm




台湾中研院殷周金文暨青铜器资料数据库—殷周金文暨青銅器資料庫

www.ihp./~bronze/index.php


3台湾中央研究院历史语言研究所—考古資料數位典藏系統

http://ndweb.iis./archaeo2_public/System/Artifact/Frame_Advance_Search.htm



台湾中央研究院历史语言研究所—先秦甲骨金文简牍词汇资料库

http://inscription.asdc./

官方介紹:先秦甲骨金文簡牘詞彙庫分為詞彙檢索與全文檢索,收錄甲骨文、金文、簡牘三種文字材料,依詞類、材質做為搜尋條件,展示詞彙的詞性、時代、書目來源、釋文段落。特色在於打破材質作為前提的預設,以詞彙本身為焦點,橫跨不同時代觀察詞彙的流變。

本資料庫所收語料忠實記錄了殷周到春秋、戰國時期曆法、官制、地理、戰爭、法律、土地買賣、賞賜、漁獵、祭祀、嫁娶、親屬稱謂、氏族標誌、國際關係等諸多問題,這些豐富的語文材料正能補充傳統文獻之不足。

甲骨文主要採用《甲骨文摹釋總集》(甲骨文合集1-13、小屯南地甲骨、英國所藏甲骨、花園莊東地甲骨);金文則收錄《殷周金文集成》、《新收殷周青銅器銘文暨器影彙編》,以2005年以前出土的青銅銘文為主;簡牘包括《楚帛書甲乙丙本》、《曾侯乙墓竹簡》、《包山楚墓竹簡》、《望山楚墓竹簡》、《江陵九店東周墓竹簡》、《郭店楚墓竹簡》、《新蔡葛陵楚墓竹簡》七種文本的詞彙資料,以上材料提供詞彙檢索及全文檢索。另收錄《睡虎地秦墓竹簡》、《雲夢龍岡秦簡》、《上海博物館藏戰國楚竹書》1-7,提供全文檢索。現階段詞彙共收錄約13萬筆,每個詞彙包括出處、編號、上下文,便於使用者回查與檢閱,幫助理解詞彙意義。



台湾—小学堂(推荐)

http://xiaoxue.iis./shangguyin?kaiOrder=392






香港—汉语多功能字库(推荐)

http://humanum.arts./Lexis/lexi-mf/





《汉语多功能字库》是在其前期成果《粤语审音配词字库》的基础上发展而来,增加了“古文字系形”、“形义源流通解”、“英汉索引”三个主要功能,以此服务于汉字古今字形系联、音韵检索、粤语定音、形义阐释、英汉对转等使用需求。


古今文字集成

http://www./





—— 北京中医药大学  李丽



经验分享

古籍认字的一些简单攻略

看中医古籍原书,尤其是未经前人整理过的,可能常会遇到难以识别的字,特别是对于我等基础不好的小萌新来说,所以这个时候就需要用一些小窍门来认字。


(一)查台湾的教育部異體字字典网站


教育部異體字字典,网址是:【http://dict.variants.】。我一般直接用单字查询,因为这个功能简单粗暴,直接收藏单字查询的网址用的时候点一下就行了。注意在输入文字的时候最好用繁体。

举个栗子:

这个字是啥呢?左边是“氵”,右边是“大”和“又”,“又”在古文字里常表示重复,而“火”又常写作“大”,所以这个字可能是“氵火火”,也就是淡,是不是这样呢?打开上面的网址查一下。


搜索结果显示“淡”有两个异体字,一个下面的“火”写成了“又”一个写成了“大”,嗯,这样基本八九不离十了。


(二)查国学大师网站


国学大师是一个可以查字但是还有更多超级棒的功能的网站,虽然有缺陷,但是在很多时候都不可或缺,网址是【http://www.】。我们在国学大师里搜索“淡”,下面也给出了类似于上面的结果。


单就查异体字来说,有的时候国学大师字例多一些,有的时候教育部異體字字典多一些,总体而言是后者更好用一些,建议两个网站都收录,在查字的时候可以一起看。


(三)查汉典书法网站


我们在整理中医古籍的时候,有时不是被一个字的异体字难住,而是被它的书法给困住,尤其是抄本,有的抄得简直龙飞凤舞,这时候用国学大师就不管用了,推荐一个汉典网里面的汉典书法网站,网址为:【http://sf.zdic.net

继续举个例子:



图片里的字,第一个是“以”,第三个是“之”,这俩比较好认,但是第二个字是什么呢?联系上文说的是这是个什么病,医家特地说了一堆话,然后“以?之”。以发之?以醒之?字形不像。根据语境,觉得有可能是以明之,是不是明呢?我们在汉典书法网站搜索一下“明”字的草书写法。



这么一看,有几个是非常接近的,所以这个字应该就是“明”了。


(四)不找本家找邻居


有些字,猜也猜过了,查也查过了,愣是还查不出来,这个时候怎么办?南中医的沈澍农教授在课上推广过一个小窍门,叫做不找本家找邻居,即:不去管那个认不出的字,而是用这个字前面或后面的文字作为关键词进行网络检索(检索网站包括但不限于:国学大师、读秀、鼎秀、北大语料库、瀚堂等等)。

常言道人类的本质是复读机,中医古籍也经常有引用复述等等情况,所以这样检索可能会查到我们不认识的那个字是啥。当然,还有可能会直接查到这本古籍(也许是不同传本)的整理本。


附:中医处方里常见剂量写法图


中医处方经常会用到简写,接触不多的可能就认不出来,比如这样:



柴胡啥?枳壳啥?

还有这个……



不熟悉处方的很难猜出来,而这个时候就可以查下面的图:



—— 南京中医药大学 毗陵皇经会



02

国学大师


国学大师官网网址 http://www. 

另有新浪微博、手机APP等,大家可关注、下载,并尝试各种检索功能。

这里着重介绍它的离线版数据库、古籍移动硬盘和运营者整理的扫描版中医古籍。


(1)离线版数据库


数据库可直接下载到电脑,页面如下:



示例:点击 “高级检索”,输入中医幼科名词“变蒸”,范围选择“全部书籍”。(如有需求,也可在特定范围书籍内检索)



因数据较多,一般等待半分钟左右出现检索结果:



左侧为含有“变蒸”一词的古籍,点击第一条“宋史”,可以在中间的页面查看具体内容,关键词在此被标红,页面中的所有文字可以复制。


(2)4T移动硬盘


该硬盘是“国学大师”出品的付费检索器,售价1999元(购买方式见官网及APP),影印古籍包括四库全书系列、各地方志、日本内阁文库、古今图书集成、丛书集成、四部丛刊、万有文库、四部备要、百衲本二十四史、三国六朝文、中华再造善本等等。约32万个pdf或djvu电子书。


 实物图如下:



页面展示:




需要保存的古籍以“导出”方式复制到电脑D盘,硬盘拔出后仍可在电脑上查看。



(3)中医类电子书


截止到2019年,运营者陆续收集、整理了1.6万部影印中医古籍,包括很多流亡国外的医书,价格1200元,以百度网盘链接形式发送。同时配有《中医大辞典》软件,分为:中医著作、中药大全、中药方剂三部分,约1.2亿字。支持多种检索方式,可全文复制。





—— 北京中医药大学 黄天骄




03

爱如生中国基本古籍库



     (一)简介



爱如生中国基本古籍库是一种较常用的古籍数据库,精选自先秦至民国的一万余种文献进行数字化整理,是中国有史以来最大的历代典籍汇总。可用以检索古籍原文。其版本选择标准为:一、完本而非残本;二、母本或现存最早之版本。每种书均提供一或两种重要版本的书影,以及经校勘整理后的竖排繁体无标点通行本。


(二)检索方法


1.分类检索:分为哲科库、史地库、艺文库、综合库四类,每类下又分设子目,可以检索某一领域内的书籍,同时看到其作者与版本信息。



2.条目检索:可输入书名、作者、时代、版本、篇目等以检索某书或某篇。





3.全文检索及高级检索:可通过关键词直接检索含有该字词的条目,使用时建议关闭关联异体字功能。可在下方的“书名”、“作者”、“时代”进行限定,这样就只会显示限定范围内的条目,排除大量无用信息。高级检索功能可进行双关键词检索(“与”、“或”、“非”、“递进”),使检索更加精确。



检索后可选择想要查看的条目,单击进入原文浏览页面。



关键词会自动标蓝。如需拷贝文字则点击上方的下载按钮。



可拉动选取想要拷贝的范围,之后点击右上方的按钮。


就可以根据需要复制粘贴了。上方还会显示条目对应的书名、卷数与版本信息。

点击“版式设置”,可根据自己的喜好更改版式。



点击“版本对照”,可查看原据版本的书影,书影首页著明书名、作者及版本。




亦可对照两个底本。



这个数据库最大的不足就是没有办法直接把检索的位置对应到原书相应的那一页上,需要自行翻检原书,找寻相应的对照位置,非常不便。希望未来能够增加这一项功能,方便核对原书。



—— 北京中医药大学 刘雨茁



04

读秀



    读秀(http://www./)作为一个图书检索数据库,图书检索、图书阅读与下载、参考文献导出是其最为常用的基本功能,然而,其强大的功能远不止于此,如果能精当地学会并使用其检索功能的一些技巧,一方面可以提升检索效率,提高图书检索的检准率、检全率;另一方面可以利用读秀培养自主学习能力,获取知识学习线索,完成继续学习任务。笔者试从确切图书检索、线索性图书检索两个方面简述读秀数据库的知识、图书检索的使用技巧。



知识检索


知识检索功能是读秀数据库通过把图书资源制作为知识节点,用户可以通过检索知识节的检索就可以检索到某一知识点在哪一本书出现,可以称为学术数据库里的的百度。当我们只简单的知道某一个概念时,并不知道具体内容、有哪些学者研究、哪些书籍有论述时,用这个检索方法可以得到很多线索,实现从点到面的学习。

以“阳旦汤”为例,可以检索到关于“阳旦汤”的百科、图书、期刊、文档、学位论文、会议论文等中的相关论述。如图:




图书检索


在图书检索中,读秀提供了全部字段、书名、作者、主题词、丛书名、目次检索方式,相对于全部字段而言,使用后面几种进行检索,除了提高检索效率,还可以找到同类书、解决图书线索性检索问题。


2.1书名检索


在知道完整书名的情况下,使用完整书名检索最为快捷,这是我们最为常用的图书检索。但需要注意的是读秀数据库存在库中所录书名与出版书籍书名不对等的情况。如1956年人民卫生出版社的《黄帝内经素问》在库中书名为《黄帝内经素问 24卷》《黄帝内经素问影印本》,这种情况则需要书名加上卷数或影印版作为书名检索词才能找到,否则可能会检索不到。

若为线索性检索的话,取书名中的一部分字词即可,就是不需要知道确切的书名,只要用与书名相关词汇进行检索,这样可以增加检全率(检索出同类书籍)。如“简帛”“简帛医药”“药名”。


2.2 作者检索


作者是图书的一个重要信息,因为信息量也比较少,所以容易记住,除了用于检索单一特定的某一本书籍外,在检索作者所有著作、新出版的著作方面有着重要作用,用于跟进学术动态有着新线索性意义。如以“王庆其”为作者进行检索并通过筛选年份,就可看到王庆其老师2019年新出版的著作,如图:



2.3 丛书名检索


丛书名是提示一套丛书的重要信息,因为很多时候我们只知道其中一本,并不知道丛书的所有信息,此检索方式可以解决这个问题,如通过《中医药学高级丛书 中医内科学》知道了有“中医药学高级丛书”这套书,用“中医药学高级丛书”可以找到这套书还有其他哪些,另如“中医经典注评丛书”也可用此方法检索全。如图:




2.4 主题词检索


此检索方式,可参考《中国分类主题词表》,目前在网络数据库图书检索中并不是很常用,可作为辅助检索方式。


2.5 目次检索


目次,即图书的目录,目次检索即使通过检索在图书中出现的关键词进而链接到该章节的一种方式。此检索方式适合于检索者知道所需要的检索内容可以作为目录出现,如“桂枝汤”;或进行探索性检索:在哪一书中有可能有论述某一内容,如检索“五十二病方”:





2.6 各检索方式对比


在检索过程中,用同一检索词使用不同的检索方式会得到不同的结果,若为寻找线索性检索的话,建议都要检索,以增加检全率。如以“梅花版”一词检索,得到的结果(作者、主题词检索无结果)如下图:






因为读秀收录的图书时间跨度比较大,在不同时期录入的图书会有所差异,甚至错误,所以能否检索出所需的图书,会受到各种因素的影响,需要各种检索方式配合,根据专业实际情况进行选择,才能提高检索效率。


3 匹配与排序功能


在图书检索中提供了很多种匹配、排序方式,使用合适的方式可以更加迅速定位到所需的图书。


3.1 匹配方式


包括模糊匹配、精确匹配,通过匹配方式选择可以进行更加准确的匹配。


3.2 排序方式


检索后系统默认为“默认排序”,下拉选项有:时间降序,时间升序、访问量、个人收藏量、单位收藏量、引用量、电子馆藏、本管馆藏。可以根据实际需要进行筛选,提高检索效率。例如如果需要查找《中国医学史》(陈邦贤)的早期版本,使用“时间升序”则可以快速定位到。





4 筛选与高级检索功能


高级检索与筛选的功能类似,前者是在检索前进行限定条件,后者是在有了检索结果后进行筛选。所以以筛选为例,读秀的筛选包括类型(本馆馆藏纸书、本馆电子全文、在线试读)、学科、作者,通过相应的筛选可以高效地检索到自己所需要的图书。以检索杨伯峻老师的《论语译注》为例:





    5 文字提取


    读秀还提供了文字提取(文字提取、文字摘录)或OTC功能,并且提取完成后,还会自动提供资料来源,文字识别率也还相对较高,修改后可以直接复制使用。如图:





        6 参考文献


    在检索结果中选择需要导出的文献,点击“导出”(有时“导出”在右边并不会出现,则可以在该页底部看到),需要注意的是,只能每页导出一次,不能跨页选择,如在第2页时,第1页选择的会消失。在导出页面选择需要导入的写作软件,如EndNote、NoteExpress、NoteFirst(若无NoteFirst选择,可选NoteExpress也可以导入到NoteFirst),然后选择复制右侧文本按相应写作软件导入步骤导入即可。如图:






    5 总结


    读秀作为一个图书知识搜索数据库,以强大的知识库为基础,使用者的检索技能是能否从中获取到所需知识的关键,如果能把检索前的方式选择和检索后的筛选结合,在看似简单的一框式检索背后为我们提供了更加准确、高效的检索方式,无论是为了确切地找到所需图书,还是进行探索性学习,读秀都为我们提供了一个很好的途径,我们需要做的是在学习、实践中不断调整检索技巧,达到为我们学习服务的效用。


附:图片转文字方法


1、微信小程序【图片文字识别】,电脑版:https://lb1./h5/superocr/login。这个对繁体字识别准确率都比较高。

2、除了使用手机照片外,比如数据库【读秀】可以把每页书【存为图片】(单击鼠标右键)再上传即可;或者用截图先保存再上传。如图:



3、使用小技巧:可以用手机端识别后去除换行并保存,打开并登陆电脑端,就可以在电脑上操作(如复制),这样更方便于电脑整理文档。

4、对于纸张比较大的材料或者书籍,建议一页拍成或者截图为两张照片,作两次识别,识别率会高很多。


—— 福建中医药大学 刘文锋



05

国家图书馆(中国台北)文献检索介绍


国家图书馆(中国台北)



坐落于台北的国家图书馆(简称:台北国图),不论是现代还是历代的文献收藏都是十分丰富的,下面来简单介绍如何检索我们想要的资讯。


首先是台北国图的网址:www.ncl.edu.tw,要看清楚了,它与北京的中国国家图书馆网址:www.nlc.cn极为相似,请大家不要搞错了哦。


↑这是台北国图网站的首页



这次要给大家介绍3个常用的功能,在“资源查询”中,首先是“台湾博硕士论文知识加值系统”、“台湾期刊论文索引系统”和“古籍与特藏文献资源”。




台湾的硕博士论文并未完全对外公开,有标注对外公开的才能全文下载,而早年的硕博士论文由于未完全数位化,想查阅的同志们可亲自移步至台北国图当场阅读内容。另外,網上查閱硕博士论文需要注册一个账号,大家直接点击“注册”并按照说明步骤申请即可。下面我们直接上图。


↑论文的相关讯息


↑能够全文下载的页面,没有出现就代表未公开


↑著作权提示


↑下载页面,按提示操作即可



↑论文全文



台湾的期刊论文只提供了索引查询,若想阅读内容,是需要亲自到台北国图查阅的,而由于时间较旧的期刊文献是需要由馆员协助调阅,必须先自行查阅索引号,再填写查阅单申请。


↑索引页面


↑这些是笔者曾在台北国图调阅过的书籍



“古籍与特藏文献资源”中有许多已数位化且能公开在网上阅览的古籍影像资料,下面我们以查阅《诗经》为例。

小提示:查阅时所使用的皆是“繁体字”。






↑点击左上的“浏览影像”即可阅览数据资源


最后,建议使用:谷歌浏览器查阅。

 

—— 南京中医药大学 郭家兴



06

日本醫學古籍庫的使用方法及用例——以富士川文庫為例


(一)關於富士川文庫


京都大學富士川文庫,是醫學、文學博士富士川游氏(ふじかわ ゆう1865-1940)從1917年之後,分三次捐贈於京都大學的個人藏書共計4340餘部9000餘冊。藏書包含了明治以前的大量日本醫籍,一部分漢籍、朝鮮醫籍的日本刻本、抄本,江中期以後的西洋醫學書的翻譯書,以及江後期到明治期的教課書等大量珍貴資料

富士川游(1865-1940)氏,生於日本廣島,1887年畢業於廣島醫學校(現廣島大學醫學部)。畢業之後利用就職於中外醫事新報社之機,遍坊各地名醫遺跡和醫學文獻。與醫學家吳秀三(1865-1932)交好,曾担任第一屆日本醫史學會上記錄幹事。當時正東西文化碰撞,大肆禮讚西洋醫學的年代,富士川遊氏深感醫學史研究的重要性,開始了醫學古籍的收集。1890年德國留學歸國後,繼續從事醫學研究的他,與1904年完成了巨著《日本醫學史》,本書詳細整理了從太古時期到明治中期日本醫學發展的脈絡,第一次正式確立了日本醫學史的系統。

本文庫是富士川游氏為編寫《日本醫學史》所做的資料收集,因此藏書容呈現學術性和系統性的特點。

 

()使用方法


京都大學對本文庫的電子化計劃早已開始,從2015年開始,在文部科學省的科研計劃“京都大学附属図書館所蔵『富士川文庫』保存公開のための修復電子化事業-わが国の医学の歴史を俯瞰する研究基盤構築のために-(機能強化経費)”的支持下,正式進入大規模電子化工程,於2017年4月,正式實現了全部書籍的電子化和對外公開。通過以下網址

https://rmda.kulib./collection/fujikawa

可以進行全部書籍的免費閱覽詢相關資料,可在網上方的“檢索”一欄,按書名檢索。另外,本文庫的索引是以書名讀音的首個假名來排序,詢的時候,需要了解書籍的日文讀音。以《東垣十書》為例,此書名的日語發音為“トウエンジッショ”,首個假名為“ト”,從“富士川文庫ト”項目點擊進入便可找到(圖1)。


關於圖像使用的版權等問題,根據京都大學的規定,在滿足以下條件的情況下,所有的圖像可無償用於複印、加工、出版物、網頁及電視節目。具體條件為

1. 須依據著作權法明示原圖像的出處。

(例)『資料名』(京都大學附屬圖書館所藏)

(例)『資料名』(京都大學附屬圖書館所藏)部分

(例)『資料名』(京都大學附屬圖書館所藏)更改

2.在網絡刊登時,須在刊登網頁中添加本文庫主頁的鏈接。

3.對原圖像進行加工或變形時,需明確標示。

詳細版權規定,請參照https://rmda.kulib./reuse

另外,富士川游氏的個人藏書,除大部分贈予京都大學以外,另有17003600冊捐贈於慶應義塾大學,以及與教育相關的172部捐贈於東京大學。由三個大學聯合製作的“富士川文庫電子聯合系統試運行版”已於20194月開始運行(圖2),並計劃於2020年末完成全部書籍的電子化,使此聯合系統正式運行。



(三)使用舉例:《延壽類要》


《延壽類要》由竹田昭慶(又名定盛,1421-1508)編纂於1456年,全書以治未病的思想為開篇,分為養性調氣篇”“行壯修用篇”“行壯制禁篇”“服食用捨篇”“房中損益篇五個部分,多是中國養生書的拔萃和匯編。

富士川文庫中藏有此書的刊本(圖3),22冊本。富士川文庫請求記號:/51。此本由竹田昭慶的子孫竹田公豐加了補注,在寬政5年(1793年)刊刻,為整版刊刻,有讀點。容上除著者自序之外,添加了和氣家後人和氣朝臣成美君人,吉田宗恂的後人吉田宗愔、及刊者竹田公豐的序文,序文中提到“謙豫氏作之補注,並錄家藏之舊篇,為刻本欲公之四方”,“蓋其書成,而今既經三百有餘,以故後世藏其全書者鮮矣,予有慨於此,於斯乎,搜索予家所藏之蠹簡……宗俊君手澤之書稿也”。此注本多和出典文獻的原文做了一一對照,並和後代的醫書做了相應比較,且在“服食用捨篇”一章中補充了藥材、食材的和名叫法。



参考文献:

  • 《京都大學附屬圖書館六十年史》第3章第3節(京都大學附屬圖書館編 1961

  • 《富士川游先生―伝記富士川游》 (富士川先生刊行会 1988)

 

——(日本)京都大学 刘青


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多