关键词:数字学术 数字人文 古籍目录 目录学 数据集成 可视化 0 引言古籍目录是将一批书名和叙录依次编列的总聚,是目录学研究的主要对象之一[1],也是两千余年古籍整理工作留下的重要学术遗产。清代学者王鸣盛在《十七史商榷》中说“目录之学,学中第一要紧事,必从此问途,方能得其门而入”[2]。古籍目录在图书分类和学术史等方面都有宝贵的研究价值。一方面,古籍目录可以看作是我国最早的知识组织系统,是学者“即类求书,因书究学”(章学诚《校雠通义》)的入学门径,其广泛使用的四部分类法在当今的图书馆古籍分类工作中仍被应用。另一方面,古籍目录历来有“辨章学术,考镜源流”的学术史功用,其类目组织的分合转化体现了当时学术知识的流变,见证了中国历代知识生产、组织以及知识结构的发展变化。 目前,古典目录学研究仍以传统的人文范式为主,信息技术虽被广泛应用到古籍数字化等实践中,却尚未与古典目录学研究融合,而数字学术的发展为这种融合带来了新的契机和方向[3]。数字学术是指基于某一学科领域的使用数字工具产生并以数字形式呈现的学术[4],不仅包含使用数字证据和方法的学术研究,还包括文献等学术成果的数字化保存和利用[5]。对于古典目录学这一领域,数字学术意味着通过对古籍目录的数字化、数据化,使其以更适合数字环境的形式供今人阅读和使用,并通过数字工具的使用为目录学研究提供识别问题、解决问题甚至是发现问题的新方式。目前在古籍和古籍目录的数据化方面已经有了一定数量的标准规范[6]和方法框架[7],但由于历代目录所收典籍数量庞大,著录不规范统一,所以一直以来都缺乏针对大规模、跨时代的古籍目录数据化处理及集成的实践。此外,目录学研究,特别是对目录分类的研究多为定性研究,少量定量研究涉及到的书目统计数据也是局部的、分散的,近期虽有研究[8,9]引入计算手段对目录的提要、分类等进行分析,但研究基础都是单一的目录或类目数据。因此,学界亟需在现有研究基础上,对历代目录进行数据整合,并引入数字方法和工具对长时段、全领域的目录分类演化进行分析,以探索数字学术环境下的新的研究范式。 1 文献回顾在图情领域,古籍目录作为两千多年以来的古典目录学成果对现代目录学有着重要的参考价值[3],其数字化保护和开发在数字人文这一新兴研究范式下也倍受关注。从古籍整理和文献编目来看,古典目录学中的文献分类、叙录等方法可以视作最早的古籍整理范式[19]。而后随着计算机技术的发展,文献整理和编目也逐步从数字化转向数据化[20],特别是随着数据驱动的第四研究范式[21]的兴起,数字学术背景下的古籍整理逐渐以数据和知识为对象[19]。在这一背景下,古籍目录作为古典文献研究的重要数据,在人工智能、语义网等技术的加持下,可以为古典人文研究提供数字学术的数据基础[7]。2009年,北京大学中文系与国家图书馆合作,基于结构化古籍目录数据开发了“历代典籍总目分析系统”,具有古籍目录数据的浏览、检索和共现等分析功能。目前在古籍数据化方面已经有了一些标准规范,如《国家图书馆古籍元数据规范与著录规则》和《古籍元数据规范》[6]以及各高校图书馆的古籍元数据规范[22]等。在此基础上,夏翠娟等设计了古籍术语词表并将不同来源、格式的古籍目录数据进行融合,构建“中文古籍联合目录及循证平台”[7]。除构建数据基础的相关研究外,也有学者提出了利用数字化的方法技术来对古籍目录进行分析研究的方法框架,例如李惠等[9]以《四库全书总目》为例提出通过对目录中的古籍、人物和提要构建分析网络以实现古籍提要知识发现的方法框架。 在古籍目录的分类研究方面,数字学术的发展使面向大量书目的数据化以及基于数据的全局量化分析成为可能。自从Moretti提出“远读”的概念以来[23],统计和可视化就成为分析人文数据的常用技术手段[24]。描述性统计、可视化以及文本分析等技术方法也同样被应用到分类系统及知识组织系统的研究中[25–28],已有研究论证了其在分析类目体量变化、构成以及增长分布等方面的有效性[29]。李瑞龙等以易类典籍为例,探索桑基图这一可视化图表对从数量上分析古籍目录分类演变的可行性[8]。然而这些研究中的研究对象在数据规模和时间跨度上都很有限,且应用的可视化方法还局限于统计数据静态描述性的展示,而对于古籍目录分类演变这种涉及到历史、社会等人文方面的解释性分析,交互式可视化更能帮助学者从定量和定性两种视角进行探索[30]。 本研究在现有的古籍数据化,特别是古籍目录的数据化研究的基础上,对具有代表性的历代古籍目录进行数据化、规范化处理,一方面可以对古籍目录进行数字化保存,另一方面也可作为数据基础支撑数字古典目录学研究。此外,本研究还通过构建交互式可视化分析系统,为历时性的、全局性的、基于大规模数据的古籍目录分类演变的分析提供有效的研究工具。 2 研究框架数字学术环境的建立是一个持续的、迭代的设计过程,其建立基础是对用户及其交互需求的充分理解[31]。遵循以用户为中心的设计思想[32],本研究从最初的需求调研,到明确数据范围、确立设计目标、进行原型设计,再到最终的系统反馈,经历了多次迭代,并邀请三位古典文献学领域的学者作为专家用户提供领域知识并密切参与到数据处理及系统设计的各个环节。首先,通过与专家用户的多次交流确认了其对于古籍目录研究的两层需求,即数据层需求(R1)和分析层需求(R2、R3)。具体需求如下: R1: 形成一个跨时代的、统一规范的、结构化的、可供检索查询的代表性古籍目录数据集; R2: 考察历代典籍分布情况、不同时代新生产典籍的数量,以及前代典籍历经长时段留存亡佚情况,部分揭示知识生产、消亡、流变的趋势; R3: 全面考察和记录每部典籍在历代史志目录中归属的变化,以及每个典籍子类历代的分合流变,并进一步总结出各种知识分类演化的模式,然后分析其背后蕴含的规律和意义。 基于以上需求,本研究项目主要由数据集成(满足R1)及交互式可视化系统(满足R2、R3)两部分构成。在数据集成过程中,首先,笔者与专家用户共同确定项目初期需要覆盖的数据范围,即八种代表性史志目录,并由专家用户提供原始目录文本以确保数据的可靠性。其次,以尽可能保留最完整原始目录文本内容为原则设计数据结构,并通过半自动化的机器预处理与人工校对相结合的方式迭代进行数据的结构化与规范化集成。根据古籍目录的特性,这部分工作主要包括记录拆分与字段抽取、数据补全以及规范化与书目认同。最后,根据分析需求对数据进行转换并设计交互式可视化分析系统。与静态可视化图表相比,交互式可视化更适合人文领域的探索性研究,更能帮助用户进行对比分析、发现规律模式[30]。可视化分析系统的设计遵循Shneiderman提出的视觉信息搜索“概览—缩放、筛选—按需提供细节”的整体流程,以支持用户逐步深入地进行可视分析[33,34]。具体而言,为满足需求R2,本研究对各目录、各类目中的典籍数量以及留存情况进行统计,并对这些统计数据进行交互式的统计图表展示;为满足需求R3,本研究对规范化后的数据进行转换以得到每个典籍在历代目录中的类目归属,并进一步设计针对类目演化的可视化分析功能,支持筛选、检索、数据展示等交互。由此,本研究基于集成数据构建了一个完整的交互式可视化分析系统,如图1所示。 3 数据集成3.1 数据集范围古籍目录虽有官修与私撰之分、综合与专科之别,但从目录学史的进程来看,不论是何种类,历代修撰的目录共同构成了古籍目录体系。官修目录是古籍目录的主干,但宋以前的多已亡佚,不可得而观之。正史所附史志目录是一种特殊的官修目录,因其自成系统一般将其单列。史志目录在很大程度上承接了官修目录的成果,并且贯通主要的历史时期;相较于私家目录,史志目录收书种类无疑更广泛全面,更能反映特定时代典籍存佚的整体情况。时间上的贯通性和收书范围的全面性决定了史志目录是研究和利用古籍目录不可或缺的,也是可获得的最基础的资料。正史目录主体部分是正史的经籍志或艺文志,即《汉书·艺文志》《隋书·经籍志》《旧唐书·经籍志》《新唐书·艺文志》《宋史·艺文志》《明史·艺文志》以及《清史稿·艺文志》,其中《明史·艺文志》和《清史稿·艺文志》只收录本朝典籍。为了考察典籍的流传情况,本研究也将《四库全书总目》(包括补充禁毁书和未收书)和《清史稿·艺文志补编、拾遗》纳入研究对象。以上构成了本研究的数据来源(见表1)。从时间跨度上看,该数据集覆盖了从汉代到清代主要的历史时期。 从分类上看,《七略》将图书分为“六艺略”“诸子略”等六略。《七略》虽早已亡佚,但《汉书·艺文志》是《七略》“删其要”而成,继承了古籍目录体系的源头——六略分类。此后,古籍目录分类经魏晋“甲、乙、丙、丁”四部分类过渡,到《隋书·经籍志》(后文简称“隋志”,其他史志目录亦作此简化)形成“经史子集”四部分类法,此后一直沿用,成为古籍分类法的主流,乾隆时编纂的古代官修目录中的集大成之作《四库全书总目》使用的也是四部分类法。因而,由史志目录和《四库全书总目》所构成的数据集不仅具有时间上的贯通性、收录种类的广泛性,还具有分类方式的传承性和目录学史发展历程的代表性,足以支撑开展跨时段的研究。 3.2 数据处理与集成除了前文所述目录分类方式的相续相承,史志目录之间的内在联系还表现在对同种典籍或相关典籍的著录上。典籍是知识和文化的主要载体,中国古代知识的传承亦体现在古代典籍的历代相传上,正因为如此,今人才能通过大量的古代文献回溯贯穿几千年的文化。理想情况下,在典籍存续的时段里所编写的史志目录应将该种典籍收录其中,以求周全。实际情况是任何一种目录都不太可能囊括所有存世典籍,但史志目录还是很大程度上保留了当时存世典籍的面貌,这是其研究价值所在。另一个方面,同一种书在不同的目录中收录于何种类目,或者因某种原因在某个目录中缺收,同样值得关注。在过去的目录学研究中,鲜有能够将众多目录的所有类别集中综合分析的,遑论条分缕析式地考察每一条书目记录,也就无法准确回答类似以上的诸多宏观问题,主要的困难在于目录类别和典籍之间的这种内在联系却并没有完全体现于既有目录的形式之上。对于人工而言,书目形式和内容上的微小差异对理解影响不大,但人工的局限在于不能方便地处理大量的数据;对于计算机而言,其长处则在于可以进行大量数据的存储和运算,却对数据格式的规范要求很高。因此,为构建机器可操作的历代古籍目录数据集,首先要保证数据内容的准确性和数据格式的规范性。 由于这些目录陆续产生于过去两千多年的时间里,著录体例等方面的差异带来了数据规范处理的诸多困难,如需要大量的人工干预以解决异体字、同书异名、同名异书、字段缺失、称呼混用等问题。为解决目录数据的各种不规范问题,本研究以人机迭代的方式对书目数据进行规范集成。所谓人机迭代,是指由计算机自动处理与人工校对和修改交替进行的数据加工方式,可以在提升效率的同时保证数据的质量。对于普遍存在的、规模较大的不规范数据,先由计算机按照规则,使用正则表达式等技术处理,对于不便自动处理的,转由人工处理,即由具有古典文献专业背景的专家逐条手工修改,此外,专家还需对机器处理的结果做校正,进而归纳可以自动处理的新规则,手工处理完成后再转入计算机处理流程,如此反复迭代。具体的数据处理过程主要包括以下三个步骤:记录拆分与字段抽取、数据补全和规范化及书目认同(见图 2)。 (1)记录拆分与字段抽取。这一过程实际是数据的结构化。在原始数据中,每种典籍的责任者、朝代、题名、卷数等信息几乎混杂在一起,甚至一条记录包含多种书而没有做显式区分,如《清史稿·艺文志补编及拾遗》史部传记类日记之属有“樗寮日记不分卷(道光元年至四年)勤补录一卷客游笔记一卷笃竹录一卷(道光十年至十二年﹑十八年至二十三年)”。根据括号标识和数字与“卷”字相连的模式可批量提取时间和卷数信息,并以卷数为分界标志拆分出四种书,但由于全部数据中括号的用处不仅仅用于标示时间信息,因此需要人工修改错误的识别记录。若记录中杂有责任者和责任方式,责任方式的有穷性便成为提取责任者的入口,即首先尽量穷举所有可能的责任方式并生成责任方式字典,再根据责任方式前为责任者的规则提取这两个字段信息。事实证明,这种操作方式是可行的,但也有部分错误需要手工纠正,如将 “乾隆间纂”中表示修纂时间的“乾隆间”误提为责任者。在对所有书目记录进行拆分和字段抽取的同时,本文还为每一条结构化的数据赋予了ID,且该ID的前两位代表所属目录,三、四位代表一级类目,五、六位代表二级类目,后五位则为该类目下书目依次编号。以#01020300004为例,其中01代表《汉书·艺文志》,02代表一级类目“诸子略”,03代表二级类目“阴阳家”,00004则为该类目下的第四本书《邹子》。如此便可以方便计算机识别、操作,特别是在处理后续分类问题时可以直接通过ID识别书目的分类。 (2)数据补全。在将所有记录拆分并抽取出字段数据后便得到了结构化数据,但很多字段的信息仍存在缺失或不明确的问题,需要将之补全。以责任者缺失为例,宋志的体例历来为学者所费解,要么前一条责任者系于题名前,后一条虽无责任者但承上条,为同一责任者,要么确无责任者,如“邓名世春秋四谱六卷”条后接“辨论谱说一卷”条,“春秋四谱六卷”的责任者为邓名世,“辨论谱说一卷”无责任者,但经查考文献,此条责任者亦为邓名世。然而这种处理方式只可用在经部,子部文献庞杂,多无责任者,便不能草率认为其承接上条,因此在加工数据时,只能尽可能查考补充。又如《四库全书总目》中含“坿”的纪录(如“易数钩隐图三卷坿遗论九事一卷”),实为多个题名共用一个责任者,在第一轮计算机自动提取责任者时忽略了这种情况,仅为之对应一个题名,在人工校对阶段发现可利用此规则进行自动抽取,则在第二轮计算机处理阶段一并补充。除了责任者字段,其余字段皆做相同的处理。 (3)规范化与书目认同。最后也是最重要且繁杂的一项工作是题名和责任者认同问题的处理,其目的是通过保证同种书在各处的记录有完全相同的表达形式,以便让计算机识别不同目录中的同种书。在假定题名相同并且责任者相同的两种书是同一种书的前提下,本文对题名和责任者作了规范处理以满足机器认同的要求,这一工作主要依赖于手工完成。题名认同和人名认同实际上紧密相连,既需要依据责任者识别出同一种书的不同题名,又需要依据题名判断其责任者是否为同一个人。因此,在处理时为了便捷地互为参考,本文将八种目录的所有数据放在一起先后按照题名排序和人名排序,让同名书和同责任者书尽量靠近并逐条分析,以如上两次完整的数据清洗为一轮次,共进行四轮认同工作。为了保证同一种书和同一个人最后的规范表达相同,在每遇到一种特殊的表达形式时,需要事先规定对应表达的规范表达形式,如责任者为僧名的数据存在“法号”“释+法号”“僧+法号”三种表达形式,本文将其统一为“僧+法号”。其他如称字、号、俗名等不统一的情况也作类似处理,以保证数据的一致性。而对于“不知责任者”“不著撰人名氏”等责任者缺失的表达,则统一改为空值。题名的特例相对于人名要少,也仍根据专家判断选择一个最为通用规范名。以《荀子》为例,在汉志、隋志及旧唐志中,此书题名为《孙卿子》,而在新唐志和宋志中题名为《荀卿子》,在四库中题名为《荀子》,在进行数据处理时由专家统一规范化为《荀子》。同时,该书的责任者在汉志中记录为“荀卿”,而后皆为“荀况”,经规范化处理后统一为“荀况”。此外,原始数据存在大量异体字,为了更好地进行认同,本文在数据加工时通过制作规范字表对异体字进行替换,尽可能地将规范题名和责任者中的异体字统一为规范字,如“溪—谿”“略—畧”“衮—袞”“考—攷”“德—惪”等(规范字—异体字)。至此,数据的结构化和规范化便已完成,基础数据字段包括“ID”“原始题名”“规范题名”“卷数”“责任者”“责任方式”“所属类别”以及“提要”等,其中对于存在多个责任者的情况则分别以“责任者二”“责任方式二”等来表示(具体数据示例见表2,其中空值字段已省略)。在此数据的基础上,本文对所有书目记录作了一一匹配,不仅保证题名、责任者名相同,还要确保有多位责任者时责任者的顺序也是一致的,以尽可能减少错误匹配,由此完成书目认同的工作,保证了跨目录的书目数据具有一致性和贯通性,为后续的书目分类演化等分析奠定了基础。 4 可视化分析系统构建4.1 书目统计及典籍存佚4.2 目录分类演化5 总结参考文献:[1]来新夏. 古典目录学(修订本)[M]. 北京:中华书局, 2013. (LAI X X. Traditional bibliographic studies (revised) [M]. Beijing: Zhonghua Book Company, 2013.) [2]王鸣盛. 十七史商榷[M]. 上海:上海古籍出版社, 2013. (WANG M S. Discussions on seventeen histories [M]. Shanghai: Shanghai Classics Publishing House, 2013. [3]柯平, 刘旭青. 中国目录学七十年:发展回溯与评析[J]. 中国图书馆学报, 2019, 45(5): 101–111. (KE P, LIU X Q. 70 years of Chinese bibliography development: retrospect and analysis [J]. Journal of Library Science in China, 2019, 45(5):101-111.) [4]AYERS E L. Does digital scholarship have a future?[J]. EDUCAUSE Review, 2013, 48(4): 24–26. [5]RUMSEY A S. New-model scholarly communication: road map for change[C]//Ninth Annual Meeting of Scholarly Communication Institute.Charlottesville,USA,2011. [6]中华人民共和国文化部. WH/T 66-2014古籍元数据规范[S]. 2014.(Ministry of Culture of the PRC. WH/T 66-2014 The Chinese ancient books metadata specifications[S]. 2014.) [7]夏翠娟, 林海青, 刘炜. 面向循证实践的中文古籍数据模型研究与设计[J]. 中国图书馆学报, 2017, 43(6): 16–34. (XIA C J, LIN H Q, LIU W. Designing a data model of Chinese ancient books for evidence-based practice[J]. Journal of Library Science in China, 2017, 43(6):16-34.) [8]李瑞龙, 李明杰. 数字人文背景下古典目录学“辨考”思想的实现路径初探[J]. 山东图书馆学刊, 2019(1): 14-19,40. (LI R L, LI M J. Probe on the realization path of the Bian Kao thought of Chinese classical bibliography under the background of digital humanities [J]. The Library Journal of Shandong, 2019(1): 14-19,40.) [9]李惠, 陈涛, 侯君明, 等. 钩玄提要——古籍目录智能分析工具构建[J]. 中国图书馆学报, 2021, 47(4): 97–112. (LI H, CHEN T, HOU J M, et al. Noting the essentials: an explorative tool for catalog annotations in Chinese rare-book collections[J]. Journal of Library Science in China, 2021, 47(4):97-112.) [10]班固. 汉书[M]. 北京:中华书局, 1962. (BAN G. Book of Han[M]. Beijing: Zhonghua Book Company, 1962.) [11]姚名达. 中国目录学史[M]. 北京:商务印书馆, 2014. (YAO M D. History of Chinese bibliographies[M]. Beijing: The Commercial Press, 2014.) [12]汪辟疆. 目录学研究[M]. 上海:华东师范大学出版社, 2000. (WANG P J. Studies of bibliographies[M]. Shanghai: East China Normal University Press, 2000.) [13]马学良. 从《四部分类源流一览表》看目录学的考辨作用[J]. 图书馆理论与实践, 2012(07): 46–49. (MA X L. The Biankao function of bibiliographies:from “Four-division Classification Evolution Glance”[J]. Library Theory and Practice, 2012(07):46-49. [14]TSIEN T-H. A history of bibliographic classification in China[J]. The Library Quarterly: Information, Community, Policy, 1952, 22(4): 307–324. [15]耿素丽. 浅析古籍目录中子部农家类与谱录类之关系[J]. 文献, 2002(1): 158–169. (GENG S L. Brief analysis of the relation of Nongjia category and Pulu category in ancient book catalogs[J]. The Documentation, 2002(1):158-169.) [16]万彩红. 史志目录中易学文献分类研究[J]. 南方论刊, 2015(6): 58–60. (WAN C H. Study of the classification of Yi category in the bibliographic sections of Chinese history books[J]. Nan Fang Lun Kan, 2015(6):58-60.) [17]程有庆. “杂家”与“杂家类”浅说[J]. 文献, 2002(3): 233–241. (CHENG Y Q. Brief discussions of “Zajia” and "Zajialei”[J]. The Documentation, 2002(3):233-241.) [18]ZHAO X H. Xiaoshuo as a cataloguing term in traditional Chinese bibliography[J]. Sungkyun Journal of East Asian Studies, 2005, 5(2): 157–181. [19]李明杰. 数字环境下古籍整理范式的传承与拓新[J]. 中国图书馆学报, 2015, 41(5): 99–110. (LI M J. The inheritance and innovation of ancient book collation paradigm in the digital environment[J]. Journal of Library science in China, 2015, 41(5):99-110.) [20]胡小菁. 文献编目:从数字化到数据化[J]. 中国图书馆学报, 2019, 45(3): 49–61. (HU X J. Cataloging from digitization to datafication[J]. Journal of Library Science in China, 2019, 45(3): 49-61.) [21]HEY T, TANSLEY S, TOLLE K M. Jim Gray on eScience: a transformed scientific method[EB/OL].(2009)[2021-2-28]. http://itre.cis./myl/JimGrayOnE-Science.pdf. [22]姚伯岳, 张丽娟, 于义芳, 等. 古籍元数据标准的设计及其系统实现[J]. 大学图书馆学报, 2003(1): 17–21. (YAO B Y, ZHANG L J, YU Y F, et al. On the design of rare book metadata standard and its system implementation [J]. Journal of Academic Libraries, 2003(1): 17-21.) [23]MORETTI F. Graphs, maps, trees: abstract models for a literary history[M]. London:Verso, 2005. [24]王军. 从人文计算到可视化——数字人文的发展脉络梳理[J]. 文艺理论与批评, 2020(2): 18–23. (WANG J. From humanities computing to visualization: the evolution of digital humanities[J]. Theory and Criticism of Literature and Art, 2020(2):18-23.) [25]SALAH A A A. The evolution of classification systems: ontogeny of the UDC[J/OL]. CoRR, 2012, abs/1204.3769[2021-2-28]. http:///abs/1204.3769. [26]CHOI I. Visualizations of cross-cultural bibliographic classification: comparative studies of the korean decimal classification and the Dewey Decimal Classification[J]. NASKO, 2017, 6(1): 39–55. [27]SMIRAGLIA R P. Disciplinary, asynthetic, domain-dependent: NARCIS a national research classification in isolation[J]. Advances in Classification Research Online, 2017, 28(1): 7–10. [28]CHOI I, PARK M S. Specificity and exhaustivity of bibliographic classifications—a cross-cultural comparison with text analytic approach[C]//iConference 2020 Proceedings. Bross,Sweden, 2020. [29]SMIRAGLIA R P, SCHARNHORST A, SALAH A A A, et al. UDC in action[C]// Proceedings of the International UDC Seminar. Hague,Netherlands,2013. [30]SINCLAIR S, RUECKER S, RADZIKOWSKA M, et al. Information visualization for humanities scholars[M]//Literary studies in the digital age: an evolving anthology. New York:Modern Language Association of America, 2013. [31]BURDICK A, WILLIS H. Digital learning, digital scholarship and design thinking[J]. Design Studies, 2011, 32(6): 546–556. [32]VREDENBURG K, MAO J-Y, SMITH P W, et al. A survey of user-centered design practice[C]//Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. New York, NY, USA: Association for Computing Machinery, 2002: 471–478. [33]SHNEIDERMAN B. The eyes have it: a task by data type taxonomy for information visualizations[M]//BEDERSON B, SHNEIDERMAN B. The craft of information visualization. San Francisco: Morgan Kaufmann Publishers Inc., 2003: 364–371. [34]KEIM D A, MANSMANN F, SCHNEIDEWIND J, et al. Challenges in visual data analysis[C/OL]//Tenth International Conference on Information Visualisation (IV’06),2006[2021-2-28]. https://dl./doi/10.1109/IV.2006.31. [35]CARD S K, MACKINLAY J, SHNEIDERMAN B. Readings in information visualization: using vision to think[M]. San Francisco: Morgan Kaufmann Publishers Inc., 1999: 1–34. [36]FRIENDLY M. The golden age of statistical graphics[J]. Statistical Science, 2008, 23(4): 502–535. [37]MACKINLAY J. Automating the design of graphical presentations of relational information[J]. ACM Transactions on Graphics, 1986, 5(2): 110–141. [38]杜泽逊. 文献学概要[M]. 北京:中华书局, 2008. (DU Z X. Summary of documentation studies[M]. Beijing: Zhonghua Book Company, 2008.) [39]HEINRICH J, WEISKOPF D. State of the art of parallel coordinates[C/OL]//Eurographics 2013,2013[2021-2-28].http://diglib./bitstream/handle/10.2312/conf.EG2013.stars.095-116/095-116.pdf?sequence=1&isAllowed=y. [40]BLANKE T, HEDGES M, DUNN S. Arts and humanities e-Science:current practices and future challenges[J]. Future Generation Computer Systems, 2009, 25(4): 474–480. [41]THANOS C. The future of digital scholarship[J]. Procedia Computer Science, 2014, 38: 22–27. 王凤翔,北京大学信息管理系,北京大学数字人文研究中心博士研究生。 孙显斌,中国科学院自然科学史研究所研究员。 黄芷欣,北京大学中文系博士研究生。 李芃蓓,中华书局文学编辑室助理编辑。 |
|