分享

议档案著录标准化工作

 52赫兹鲸旅 2022-05-14
山西档案 2004,(02),26-27

山西省档案局 山西太原030045

收稿日期:2004-02-01

Standardization Work for Archival Description

Received: 2004-02-01

随着自动化技术和网络技术的发展, 实现档案文献工作的标准化已经成为当今档案文献工作的首要任务。为了促进档案文献工作的管理现代化和网络化, 我国最早制定了《文献著录总则》 (GB3792.1) , 于1985年5月又颁布了《档案著录规则》 (GB3792.4) , 随后又制定了《中国档案主题词表》、《中国档案分类法》等。目前全国已有多家综合性档案馆采用了计算机对档案进行数据处理及检索的现代化管理手段, 而档案要实现计算机管理, 著录工作的标准化是其前提条件, 也是实现计算机检索的基础工作。就工作实践中发现的问题, 笔者想从两个方面谈谈自己的看法。

一、档案著录标引工作面临的几个问题

档案著录工作目前仍以手工方式进行, 它是一项工作量大, 技术性强的工作, 需要很多专业人员和档案工作人员参加, 在档案的著录过程中, 常常因著录人员的观点、方法、经验和专业知识、技术水平等方面的因素, 对于同一份档案可能选取不同的检索标识, 甚至对于同一著录人员来说, 在不同时期, 对同一份档案的著录结果也可能不同。这种不一致性给以后的检索工作带来很多麻烦, 具体原因可归纳为:

1、 实际操作当中难度大

首先, 不同级别、不同类型的档案馆 (室) 、不同门类的档案在著录时运用和把握标准有很大不同。由于对《档案著录规则》的执行缺乏统一的要求, 有的单位在著录时不进行主题标引, 有的则不进行分类标引, 著录项目少则几个, 多则30多个, 在计算机的输入格式上五花八门, 各自为政, 各行其是。主题词的标引语言不统一, 有的用《中国档案主题词表》, 有的用《汉语主题词表》等等, 甚至还有的用关键词标引。由于词表缺乏统一要求和宏观控制, 编制的质量参差不齐, 加之标引方法、标引要求往往因人员的数量和业务水平不同, 往往导致标引一致性差, 造成误标、漏标、过度标引、过粗标引等, 最终将会影响计算机管理系统的检索效率。

其次是人员素质有待提高。档案著录标引是我国档案部门一项新型的基础业务工作, 著录的条目要充分揭示档案内容, 准确记录档案的各种特征。而要做好这项工作不是一蹴而就的, 要求著录标引人员熟练掌握著录规则理论, 有较丰富的实践经验。国外著录工作常常是由具备中级职称以上的人来承担, 笔者于1988年在中央档案馆学习著录时了解到, 中央档案馆专门成立了十几人组成的著录小组, 全部是由文科大学毕业生组成。这样的标准对各省、市、地、县档案馆来说显然是不现实, 难以做到的。假如著录人员学历不够或业务水平不高, 如果责任心再不强, 一味地追求著录数量, 追赶进度, 这样著录出来的内容可想而知。笔者就曾见过不少人在著录主题词时仅凭主观想象, 直接从标题中选取关键词, 这样的工作实际上计算机完全能够胜任, 它能从标题当中自动抽词, 抽字, 速度还远远超过手工著录, 何须人工费时、费力呢?

2、 实用效果差

我们知道, 著录工作是为计算机检索系统准备数据, 故称之为“数据工程”, 它的好坏是检索系统建设成败的关键。有人作过调查, 已开展著录标引工作的档案馆, 平均完成的著录标引数量仅占馆藏档案的6.7%, 输入计算机的数据仅占馆藏档案的4.8%[1]。笔者曾了解到, 截至1999年, 全国综合性档案馆机读数据库目录超过百万条的不过十余家, 其中做了著录标引的不足20%。我馆在1998年达标升级工作中, 输入计算机中的档案目录、资料数据库达到了154万余条, 其中著录标引过的档案共约五、六十万条, 但这些年利用当中很少有用主题词或分类号来查档的, 编制专题目录或检索工具也不用主题词或分类号, 只有标题、时间、责任者等常用的一些项目利用率较高, 而当时, 我馆组织了三、四十人的著录工作组, 著录标引主题词和分类号是耗费人力、财力、物力最多、最大, 时间最长的, 显然入与出的比例严重失衡。

档案计算机检索系统的建立, 数据准备工作是其主体工程, 计算机 (包括软件) 只是处理档案数据的工具, 数据是检索系统的核心, 是检索系统的生命, 计算机则是进行管理的手段。计算机和数据的结合, 才能构成一个高效的档案自动化检索系统。数据与计算机的这种关系, 决定了在规划建立自动化检索系统时, 必须同时考虑档案的著录标引工作, 著录标引工作应该超前或同步发展, 绝不能滞后。

3、 著录质量难以保证

著录质量决定整个档案检索系统的质量, 数据质量差, 检索系统的检索效率就不会高, 国外图书情报界是这样来形容数据重要性的:“GARBAGE IN, GARBAGE OUT” (进去的是垃圾, 出来的也是垃圾) [1]。著录数据质量难以保证是令人忧虑的, 有人做过调查, 有80%以上的人认为目前著录标引质量一般或较差, 其主要反映在三个方面:数据库建设无统一规划;著录内容、格式、标引方法五花八门;主题标引极为混乱。目前我国对档案计算机检索系统的建立缺乏统一的要求和宏观控制, 往往是由各单位根据各自检索系统的要求自行开发、设计、实施, 缺乏通用性, 也难以达到资源共享的目的。著录内容上的差异也是非常明显的, 著录格式有卡片式, 表格式, 书本式, 也有的将目录套印后增添几个项目, 或者仅将有关著录内容写在纸上直接将目录输入计算机。主题标引方法有手工标引, 有自动标引, 有的标主题词, 有的标关键词, 有的按文件内容选词, 有的从文件题名中抽词, 有的用概念组配, 有的用字面组配, 在主题标引方面, 人们花的功夫最多效果却最差。

二、几点感想

1、 要充分认识数据准备的重要性

我们一定要克服计算机是万能的机器, 数据质量差些不要紧的想法, 不能只是为了应付评比检查或获得升级的分数, 而要从思想上真正认识到数据工作的重要性, 充分利用原有档案的基础, 把不准确、不统一和缺少的必要项目补充完整, 提高档案数据准备工作速度, 加快档案工作现代化步伐, 真正把自动化检索提到议事日程, 这样对于档案标准化著录及实现计算机系统衔接, 都具有十分重要的意义。

2、 加强著录标引的组织工作

目前我国档案数据准备基本上采取集中式的组织模式, 即各档案馆 (室) 建立各自的检索系统, 档案数据也完全由各馆 (室) 承担, 各个单位要尽量克服馆藏基数不断增大和著录量难以赶上增长量的矛盾, 制定选择合理的数据准备方案, 确定可行的数据标引深度, 切忌掺杂个人的观点和褒贬, 提高著录数据的实用价值。

3、 建立质量控制监督措施

由于多数检索系统没有进入实际应用阶段, 数据质量的控制和监督往往被人们忽视。著录标引的检查, 一般采取自审、互审的方法, 也可设专人负责质量检查, 必要时还需将著录卡片与文件一一对应起来抽查, 这样有些问题便能得到及时发现。建立奖惩制度, 杜绝个别没有责任心的人, 为赶速度、抢任务而出现的错著、漏著等现象, 提高著录质量。

4、 建立一支稳定、业务水平高的著录标引队伍

尽量选取专业和业务素质高的同志参加著录工作。首先, 著录人员要熟练掌握检索语言, 对馆藏法、分类法、主题法等检索方法做到了解;其次必须学会使用检索分类表和主题词表, 熟悉其体例、结构和使用规则;再次必须具有一定的专业知识, 对馆藏档案形成的背景、档案内容、特征和档案之间的历史联系比较了解, 还应具备专业的科技知识。除此之外, 著录人员还应具有分析问题、概括问题的能力, 了解计算机有关知识, 了解档案检索过程以及用户需求、查询习惯等。

5、 对著录工作要有一个灵活的方针

要根据本单位的实际情况安排灵活的著录思路。如经费紧张, 人员缺少, 便可选择重要的全宗、目录或利用率较高的全宗来进行著录标引, 做到重点突出。也可根据实际情况, 舍弃一些难点、“卡脖子”项目, 例如, 笔者认为与其大家把大部分精力耗在主题词标引上, 不如先暂时搁置, 标引其他项目, 这样标引数量会成倍增加, 使计算机录入工作不会处于等米下锅状态, 而计算机中档案数据量只有达到本馆 (室) 70%到80%的程度, 才能体现出计算机的优越性, 才能发挥它的作用。对于标题质量较好、内容单一的民国档案, 完全可以采用青岛市档案馆与二史馆联合开发的“民国档案分类、主题快速著录标引”程序, 对机器中已录入的档案目录、资料进行批量标引主题词和分类, 从而减轻著录人员的压力, 提高工作效率。实在无精力、无条件著录, 也可直接先输入传统的档案目录及相应的一些简单项目, 等有条件再著录标引补上空缺也不迟, 保证数据先进入计算机, 能够提供利用为上。

总之, 由于我国档案著录工作基本上还是处于初级阶段, 数据的准备是档案自动化检索发展的瓶颈, 也是制约计算机管理档案的关键。可以设定, 只要著录标引的数量和质量两大难题解决了, 建立数字档案馆就不会是遥不可及的事情, 当我国计算机管理档案从试点实验进入实际应用阶段, 标准化、自动化、现代化的实现也就不远了。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多