分享

甲骨文数据库推介

 养悟斋 2023-02-02 发布于江苏

编者按

图片

“一片甲骨惊天下”,经过120多年的风雨沧桑与琢磨砥砺,甲骨学已经逐渐成长为举世瞩目的国际性显学。甲骨材料的数字化为甲骨学研究带来了极大助力,“汉字文明”公众号特推“甲骨文数据库选介”专栏,推介主要的甲骨数据库,以飨读者。甲骨文数据库众多,限于篇幅,本文未尽数收录,欢迎大家在公众号后台留言补充。

目录

1. 汉达文库“甲骨文资料库”

2. 殷契文渊

3. 殷墟甲骨文数据库

4. 瀚堂出土文献库

5. 甲骨文数位典藏数据库

6. 先秦甲骨金文简牍词汇数据库

7. 日本所藏中文古籍数据库

8. “甲骨世界”数据库

9. 小学堂甲骨文资料库

10. 殷商甲骨文数据库

11. 缀多多

12. 国学大师

汉达文库“甲骨文资料库”

图片
图片
图片
图片

汉达文库“甲骨文资料库”由香港中文大学中国文化研究所古文献数据库中心开发制作,是一个集著录、整理和检索于一体的大型甲骨文数据库。甲骨收录情况如下:

甲骨著录

著录号

甲骨文合集

H00001–H41956

甲骨文合集补编

B00001–B13450

苏、德、美、日所藏甲骨

S00001–S00582

东京大学东洋文化研究所

藏甲骨文字

D00001–D01340

小屯南地甲骨

T00001–T04612

英国所藏甲骨集

Y00001–Y02674

怀特氏收藏甲骨文集

W00001–W01915

天理大学附属参考馆甲骨文字

L00001–L00692

殷墟花园庄东地甲骨

HD00001–HD00561

数据库共收录如上九部甲骨著录书籍,收录卜辞数量总计67683片;数据库还设有收录所有甲骨文字的字形总表,每字下附有释文、隶定、《类纂》编号,并增补相当数量前人未收录的甲骨文字及其片号,在材料收集、文字处理、文句标点断句等方面采用了最近几年的最新成果。

数据库设置多个便捷的检索途径,除提供全文字句、著录号检索外,还支持布尔算符、截词符、位置算符共三种检索算符,并且提供选词检索方式。此外,该数据库还提供甲骨图文对照展示模式,使释文依照原文字体大小显示及所在位置排列。

网址:http://www./

图片
图片

殷契文渊

图片
图片
图片
图片

“殷契文渊”平台是在宋镇豪先生指导下,由安阳师范学院甲骨文信息处理教育部重点实验室和中国社会科学院甲骨学殷商史研究中心合作建设的非营利性网站,是专门性质的甲骨文资源大数据平台及数据检索分析技术支撑的一体化网站,包括“三库一平台”即甲骨字形库、甲骨著录库、甲骨文献库、甲骨文知识服务平台。

该平台从2016年开始建设,对甲骨文相关的基本数据进行了整理,包括自1899年甲骨文发现以来120多年间公开发表的论文、学术会议论文、硕博论文等3万多篇,甲骨著录152种,甲骨图像234662幅,甲骨论著33369种。

该平台针对著录文献图文混排的特征,利用图像分割技术切分并存储了著录中的拓片、照片以及摹本图像,又利用文档分析技术整理著录文献内容,存储了甲骨片的著录号、选定号、原骨拓藏、馆藏编号、分期情况、著录情况、重见情况、缀合信息、释文等信息,并可结合OCR技术加以识别。在此基础上,该平台利用知网的“知网节”技术构建了甲骨文知识网络,消除了信息孤岛,实现了甲骨文著录库、文献库、字形库三库的链接功能。

图片

甲骨文字形库由精通甲骨文的书法家乔雁群博士负责,在收集整理甲骨文研究文献基础上,逐字核校原片,去伪存真,改定和去除误摹、误收、重收及衍生字头与字形,合理调整部首与归部,正确处理异形字的分列与归并,形成一份综合各家之长又有所修订与补正的甲骨文三级字形表,制作成甲骨文大数据资源平台适用的甲骨文字库。

网址:http://jgw./

图片
图片

殷墟甲骨文数据库

图片
图片
图片
图片

“殷墟甲骨文数据库”是中华书局古联公司与浙江师范大学陈年福教授合作开发的甲骨文专题数据库。该库以陈年福教授的甲骨文文本整理成果为基础增补、修订而形成。

图片

全库收录甲骨59591片,卜辞143856条,参考国内外数十种甲骨文著录文献,每条卜辞均包含摹写与释文两部分,并标注卜辞主题分类、具体来源出处和所属字体组类。在此基础上整理多年来学界有关甲骨缀合的成果,使得该库展现的内容更为完整、全面。

图片

数据库专门研发的甲骨文字库,也让甲骨文摹写成果以数字化的形式呈现在广大读者面前。该数据库借助内置的甲骨文辅助输入法实现摹写字形输入,附有甲骨联机字典,全面展示甲骨文的字头、读音、字形、解形和释义,包含约3900个字头,6700个词头。既可实现单字的查阅,也可阅览含有该字的甲骨文词汇的释词内容。

网址:http://obid./

图片
图片

瀚堂出土文献库

图片
图片
图片
图片

瀚堂出土文献库由北京时代瀚堂科技有限公司制作,含甲骨文、金文、简帛、印章、钱币和石刻等分库,是集成性的中国出土实物文献数据库,其中的甲骨文分库包括《甲骨文合集》释文、《小屯南地甲骨》释文、《东京大学东洋文化研究所藏甲骨文字》释文、《英国所藏甲骨集》释文、《怀特氏等藏甲骨文集》释文、《苏德美日所见甲骨集》释文、《花园庄东地甲骨》释文、《甲骨文合集补编》释文等数据。

网址:https://www./

图片
图片

甲骨文数位典藏数据库

图片
图片
图片
图片

甲骨文数位典藏数据库由中国台湾中央研究院历史语言研究所研制。甲骨文拓片数据库于2004年开始建设,主要处理对象是藏于史语所的甲骨文拓片,约有四万余件,可分为考古发掘甲骨之拓片,及购藏所得甲骨之拓片两类。本数据库的拓片数据,囊括史语所傅斯年图书馆所藏甲骨文拓片18册,及考古学门库房所藏《善斋藏契》拓片九千多张,再加上史语所藏甲骨文拓片,总计超过四万五千张。数据库具有图文对照功能,读者除了能够检索甲骨文的基本数据和文字信息,还能将文字信息与拓片影像进行对照

网址:

https://rub.ihp./~oracle/

图片
图片

先秦甲骨金文简牍词汇数据库

图片
图片
图片
图片

先秦甲骨金文简牍词汇数据库由中国台湾中央研究院历史语言研究所研制。分为词汇检索与全文检索,收录甲骨文、金文、简牍三种文字材料,依词类、材质做为搜寻条件,展示词汇的词性、时代、书目来源、释文段落。特色在于打破材质作为前提的预设,以词汇本身为焦点,横跨不同时代观察词汇的流变。本数据库所收语料忠实记录了殷周到春秋、战国时期历法、官制、地理、战争、法律、土地买卖、赏赐、渔猎、祭祀、嫁娶、亲属称谓、氏族标志、国际关系等诸多问题,这些丰富的语文材料正能补充传统文献之不足。

  甲骨文主要采用《甲骨文摹释总集》(甲骨文合集1-13、小屯南地甲骨、英国所藏甲骨、花园庄东地甲骨);金文则收录《殷周金文集成》《新收殷周青铜器铭文暨器影汇编》,以2005年以前出土的青铜铭文为主;简牍包括《楚帛书甲乙丙本》《曾侯乙墓竹简》《包山楚墓竹简》《望山楚墓竹简》《江陵九店东周墓竹简》《郭店楚墓竹简》《新蔡葛陵楚墓竹简》等文本的词汇数据, 以上材料提供词汇检索及全文检索。另收录《睡虎地秦墓竹简》、《云梦龙冈秦简》、《上海博物馆藏战国楚竹书》1-7,提供全文检索。现阶段词汇共收录约13万笔,每个词汇包括出处、编号、上下文,便于使用者回查与检阅,帮助理解词汇意义。

网址:

https://inscription.asdc./

图片
图片

日本所藏中文古籍数据库

图片
图片
图片
图片

日本京都大学人文科学研究所研制并管理。日本所藏中文古籍数据库自2001年开始建设,计划分两个五年阶段实施,第一期项目旨在集合日本所有汉籍典藏机构的汉籍目录,并制作成古籍书目数据库。第二期项目则主要开发重要典籍的提要和重要版本的全文影像信息。目前数据库已基本建成,数据库可提供35个典藏机构约62万条记录的网络检索和阅读。其中甲骨文数据库以日本著名汉学家贝冢茂树1959至1968年所编著的《京都大学人文科学研究所藏甲骨文字》为目录进行数据录入,目前可提供文字检索和全文影像阅读。

网址:

http://kanji.zinbun./kanseki

图片
图片

“甲骨世界”数据库

图片
图片
图片
图片

“甲骨世界”数据库由中国国家图书馆研制。中国国家图书馆珍藏甲骨335651片,占全国甲骨藏量的1/4,是收藏甲骨最多的机构。“甲骨世界”数据库资料以照片和拓片为主,收录甲骨目录2964条,影像5932幅;甲骨拓片目录2975笔,影像3177幅。数据库的著录包括馆藏号(通用编号)、贞人、出土地点、时期、原骨属性、原骨尺寸、来源、释文情况、著录情况、旧藏编号、内容类别等信息,均可用于著录检索。“甲骨世界”数据库还具有工具库链接功能,如《甲骨文合集》来源表及释文、《甲骨文字典》、《金文字典》等,以便读者参考。

网址:

http://read./specialResourse/jiaguIndex

图片
图片

小学堂甲骨文资料库

图片
图片
图片
图片

小学堂甲骨文资料库由台湾大学中国文学系和台湾中研院共同开发,主要根据中国社会科学院考古研究所《甲骨文编》收字,并参照《新甲骨文编》、《甲骨文合集材料来源表》增补类组、合集号等资料,共收录甲骨文字头2548个、字形24701个,使用者可根据字号、字形、《甲骨文编》卷数、甲骨文部件、楷书字形等多种信息进行甲骨文查询。

网址:

https://xiaoxue.iis./jiaguwen

图片
图片

殷商甲骨文数据库

图片
图片
图片
图片

殷商甲骨文数据库由华东师范大学中国文字研究与应用中心建设,所收材料包括:《甲骨文合集》《甲骨文合集补编》《小屯南地甲骨》《花园庄东地甲骨》《殷墟小屯村中村南甲骨》等28种甲骨著录。刻辞总字数达1110000以上(《甲骨文合集》、《甲骨文合集补编》已收之甲骨而后出著录重收者不再重复收入数据库)。数据库具体设置了“著录检索”“单字引得”“考释检索”“缀合检索”等供以检索。

网址:

wjwx.ecnu.edu.cn/wenzidb/Home/Login.aspx

图片
图片

缀多多

图片
图片
图片
图片

“缀多多”由河南大学和首都师范大学联合研发。缀多多是全国首款AI甲骨缀合产品,采用断面匹配度和原边平滑度两个维度对算法过程进行逼近,并通过人机耦合,将专家知识融入到算法中,从而实现人工智能批量缀合甲骨。缀多多可广泛用于文物的数字化修复,如汉简缀合,彩陶缀合,具有较高的学术价值和应用前景。

图片
图片

国学大师

图片
图片
图片

国学大师网站提供“甲骨文合集在线检索”功能,支持《甲骨文合集》《甲骨文合集补编》《小屯南地甲骨》《殷墟花园庄东地甲骨》等工具书的甲骨拓片、文字版释文等检索。

网址:

http://www./jgwhj/

图片
图片
图片

编辑 | 仇俊豪

审核 | 张振楠

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多