分享

档案数字化建设思考系列之

 天涯军博 2016-04-30

档案馆的数字化建设作为传统档案馆数字之路的起点,如何走好这首要一步,就显得至关重要。为此我们就着重于这一点来谈一下我们的观点。

计算机技术的普及,为档案馆数字化建设奠定了良好的基础。档案馆数字化建设包含以下几个方面:

(一)档案管理的数字化。

档案管理自动化是对档案馆自身管理行为现代化的确定,而这种现代化是建立在计算机数字化管理基础上的。这个特征是基础性的,有普遍意义的,是开展其他数字化工作的前提条件。现在许多文章在探讨数字档案馆或虚拟档案馆时,较多是对档案馆美好前景的预测与憧憬,很少涉及传统档案馆的现代化管理问题,忽视档案管理具体业务环节的计算机数字化管理问题,如档案自动编目和自动检索、档案自动全文存储与检索、档案业务工作辅助管理、计算机辅助立卷、档案自动标引、文档一体化管理、档案馆办公自动化、档案库房保护技术现代化、档案数据库设计与建立等。而这些不仅是档案管理基本的业务环节,也是档案管理自动化的具体体现,更是档案管理数字化全面实现的基础。这些问题不解决,档案馆数字化建设就是“空中楼阁”,无从谈起。

20世纪90年代以来,我国各级各类档案馆开始进行档案管理数字化的实践与探索,大致可以归纳为三方面的发展方向。

1、建立著录档案信息检索系统。著录档案信息检索系统,应该说是计算机技术与档案工作的最早结合点。由于档案馆的馆藏量巨大,档案的信息资源又是如此丰富多样,为了方便利用者,提高查询效率,档案馆利用计算机技术进行档案目录或专题文件级目录著录,以达到快速检索的目的,检索工具的数字化带来的优势尽显无遗。

2、“文档一体化”管理。1992年国家档案局提出“文档一体化”管理思路,许多档案部门纷纷尝试利用计算机技术实现文件与档案的一体化管理,从文件形成之时到文件办结归档乃至档案管理成为一条流水线的操作过程。“文档一体化”操作管理软件与传统手工操作相比,避免应归档的文件材料人为遗漏,提高了文件归档的完整性和准确性,提高了文件立卷的效率,提高了档案的质量。但它也只是利用计算机技术来模拟传统手工操作流程,不是真正意义上的文档管理数字化。

3、档案馆数字化管理系统的建设。我国档案工作数字化管理起步时间较晚,目前还是以针对上述档案信息检索系统和文档一体化数据库系统的管理为主,停留在档案工作数字化管理的初级阶段,数字化管理的优势和潜能并未充分发掘出来。档案工作数字化管理系统实际上是一个可以涵盖档案馆行政管理和业务管理、档案信息开发利用工作等诸方面的大型的系统工程。档案馆数字化管理应该以此为契入点,朝着这个方向积极发展。

(二)馆藏信息的数字化。

根据《档案法》的规定,综合性档案馆作为党和国家的科学文化事业机构,是永久集中保存档案的基地,与国家历史同在。综合性档案馆通常都有数量庞大的馆藏,内容及形式也是丰富多样的。就传统的档案载体而言,其记录信息都是平面的,文字、图像、声音等不同载体的信息难以有机地结合起来。通过运用计算机技术与多媒体技术,所有的馆藏信息都能以数字化的形式存储,做到图、文、声并茂,档案信息的记录功能与显示功能得到了极大的强化;而且更有前景的是数字化后的档案信息能随心所欲地从一种媒介转换到另一种媒介,给长期以来沉闷、形式单一的档案信息贴上吸引人的“标签”。馆藏信息的数字化是档案馆数字化建设的核心,其数字化建设的工程量巨大,各级档案部门应根据自身特点采取不同的建设模式:

1、大型综合性档案馆,它们的馆藏基础一般都较好,馆藏信息的利用也较频繁,在建设经费充足的情况下,可以采取技术优先的原则,划出专项经费,成立馆藏信息数字化部门,专门负责档案信息数字化工作。这种模式见效快,但投入高,需要很强的经济支持和技术支持。

2、中小型综合档案馆,在建设经费不够充足的情况下,可以采取资源优先的原则,购置少量的设备,对重要的档案资源先期进行数字化处理,循序渐进逐步扩大数字化规模。这种模式见效慢,投入较少,对技术要求也不高。馆藏档案信息经数字化后转化为数字信息,以数据库的形式存在。
目前大部分档案馆馆藏档案载体仍然是以纸质为主,纸质档案数字化制作方式一般有二种:

第一种是通过计算机人工录入或通过扫描仪扫描由字符识别软件(OCR)识别,制成文本文件;

第二种是将档案文件的每一页看成是一张图片,不管上面具体是什么内容,由扫描仪按页扫入计算机制成图形文件。

第一种方式占据空间小,是一种真正意义上的全文数字化,但纸质档案信息的记录方式是多种多样的,有的是手写体、繁体字,有的字迹褪化及非文字形式等,此时采用第一种方式就会暴露出如下致命弱点:用OCR字符识别的准确率低;若采用人工录入,不但需要大量的录入人员,而且一时还不能马上胜任此项工作,差错率大且核对困难,投入大,收效慢。

而第二种方式实现容易,一般档案工作人员只要稍加培训,即可操作机器,且工作可以定量化,差错率相对较低,即便有一些错扫、漏扫等,也能很快被发现。至于图形文件占空间大的问题,在计算机技术日新月异的今天,相信适合的软件很快就会被开发出来,如果能采用先进的高速扫描机,那么对档案信息数字化无疑是如虎添翼。另外,还因为图像扫描保持了档案原件本来面目,可以使利用者在看到文字内容的同时,也能看到纸质档案的其它一些特征,如原件的纸色、墨迹、印章、圈点、批注等各种原貌,使利用者可以获得更多的线索,开展一些更深入的研究。

(三)档案信息传输平台数字化。

档案信息只有在传递过程中才能体现出它应有的价值,以往信息存在于一次文献即档案原件或经过处理的二次文献范畴内,人们需要档案信息,往往需要亲临档案馆,通过阅览摘录、静电复制或拍摄等形式来获取需要的信息。但档案信息在完成数字化后以数字形式存在时,数字网络系统就将成为其主要的传输平台,为档案信息的快速流动提供可能。数字化了的档案信息在传递过程中可以同时进行多向传递,形成传递网络,而且通过因特网可以方便地进行远程传递,不受时间与空间的限制,利用者不必亲临档案馆,就可以在任何时间任何地点通过计算机方便地利用档案信息。

如果把档案馆数字化建设比作一个人体的话,那么档案管理数字化和馆藏信息数字化的建设就是这个人体的骨架和血肉,数字网络系统就是它的神经网络。档案馆信息传输平台应首先构建的是档案馆局域网也可称为内网,一般的要求是在遵循统一的通信协议前提下,通过网络连线将各个部门的计算机资源整合在一起。可根据不同的应用设置服务器,部门的个体计算机通过网络共享网络信息资源,为档案馆核心数据库提供档案信息,也可以得到权限范围内的档案信息。其次是构建外网、公众网等,可使档案信息通过数字网络系统进入信息交流的大动脉----互联网,实现档案资源的共享。档案馆的数字化建设作为传统档案馆数字之路的起点,如何走好这首要一步,就显得至关重要。为此我们就着重于这一点来谈一下我们的观点。

计算机技术的普及,为档案馆数字化建设奠定了良好的基础。档案馆数字化建设包含以下几个方面:

(一)档案管理的数字化。

档案管理自动化是对档案馆自身管理行为现代化的确定,而这种现代化是建立在计算机数字化管理基础上的。这个特征是基础性的,有普遍意义的,是开展其他数字化工作的前提条件。现在许多文章在探讨数字档案馆或虚拟档案馆时,较多是对档案馆美好前景的预测与憧憬,很少涉及传统档案馆的现代化管理问题,忽视档案管理具体业务环节的计算机数字化管理问题,如档案自动编目和自动检索、档案自动全文存储与检索、档案业务工作辅助管理、计算机辅助立卷、档案自动标引、文档一体化管理、档案馆办公自动化、档案库房保护技术现代化、档案数据库设计与建立等。而这些不仅是档案管理基本的业务环节,也是档案管理自动化的具体体现,更是档案管理数字化全面实现的基础。这些问题不解决,档案馆数字化建设就是“空中楼阁”,无从谈起。

20世纪90年代以来,我国各级各类档案馆开始进行档案管理数字化的实践与探索,大致可以归纳为三方面的发展方向。

1、建立著录档案信息检索系统。著录档案信息检索系统,应该说是计算机技术与档案工作的最早结合点。由于档案馆的馆藏量巨大,档案的信息资源又是如此丰富多样,为了方便利用者,提高查询效率,档案馆利用计算机技术进行档案目录或专题文件级目录著录,以达到快速检索的目的,检索工具的数字化带来的优势尽显无遗。

2、“文档一体化”管理。1992年国家档案局提出“文档一体化”管理思路,许多档案部门纷纷尝试利用计算机技术实现文件与档案的一体化管理,从文件形成之时到文件办结归档乃至档案管理成为一条流水线的操作过程。“文档一体化”操作管理软件与传统手工操作相比,避免应归档的文件材料人为遗漏,提高了文件归档的完整性和准确性,提高了文件立卷的效率,提高了档案的质量。但它也只是利用计算机技术来模拟传统手工操作流程,不是真正意义上的文档管理数字化。

3、档案馆数字化管理系统的建设。我国档案工作数字化管理起步时间较晚,目前还是以针对上述档案信息检索系统和文档一体化数据库系统的管理为主,停留在档案工作数字化管理的初级阶段,数字化管理的优势和潜能并未充分发掘出来。档案工作数字化管理系统实际上是一个可以涵盖档案馆行政管理和业务管理、档案信息开发利用工作等诸方面的大型的系统工程。档案馆数字化管理应该以此为契入点,朝着这个方向积极发展。

(二)馆藏信息的数字化。

根据《档案法》的规定,综合性档案馆作为党和国家的科学文化事业机构,是永久集中保存档案的基地,与国家历史同在。综合性档案馆通常都有数量庞大的馆藏,内容及形式也是丰富多样的。就传统的档案载体而言,其记录信息都是平面的,文字、图像、声音等不同载体的信息难以有机地结合起来。通过运用计算机技术与多媒体技术,所有的馆藏信息都能以数字化的形式存储,做到图、文、声并茂,档案信息的记录功能与显示功能得到了极大的强化;而且更有前景的是数字化后的档案信息能随心所欲地从一种媒介转换到另一种媒介,给长期以来沉闷、形式单一的档案信息贴上吸引人的“标签”。馆藏信息的数字化是档案馆数字化建设的核心,其数字化建设的工程量巨大,各级档案部门应根据自身特点采取不同的建设模式:

1、大型综合性档案馆,它们的馆藏基础一般都较好,馆藏信息的利用也较频繁,在建设经费充足的情况下,可以采取技术优先的原则,划出专项经费,成立馆藏信息数字化部门,专门负责档案信息数字化工作。这种模式见效快,但投入高,需要很强的经济支持和技术支持。

2、中小型综合档案馆,在建设经费不够充足的情况下,可以采取资源优先的原则,购置少量的设备,对重要的档案资源先期进行数字化处理,循序渐进逐步扩大数字化规模。这种模式见效慢,投入较少,对技术要求也不高。馆藏档案信息经数字化后转化为数字信息,以数据库的形式存在。
目前大部分档案馆馆藏档案载体仍然是以纸质为主,纸质档案数字化制作方式一般有二种:

第一种是通过计算机人工录入或通过扫描仪扫描由字符识别软件(OCR)识别,制成文本文件;

第二种是将档案文件的每一页看成是一张图片,不管上面具体是什么内容,由扫描仪按页扫入计算机制成图形文件。

第一种方式占据空间小,是一种真正意义上的全文数字化,但纸质档案信息的记录方式是多种多样的,有的是手写体、繁体字,有的字迹褪化及非文字形式等,此时采用第一种方式就会暴露出如下致命弱点:用OCR字符识别的准确率低;若采用人工录入,不但需要大量的录入人员,而且一时还不能马上胜任此项工作,差错率大且核对困难,投入大,收效慢。

而第二种方式实现容易,一般档案工作人员只要稍加培训,即可操作机器,且工作可以定量化,差错率相对较低,即便有一些错扫、漏扫等,也能很快被发现。至于图形文件占空间大的问题,在计算机技术日新月异的今天,相信适合的软件很快就会被开发出来,如果能采用先进的高速扫描机,那么对档案信息数字化无疑是如虎添翼。另外,还因为图像扫描保持了档案原件本来面目,可以使利用者在看到文字内容的同时,也能看到纸质档案的其它一些特征,如原件的纸色、墨迹、印章、圈点、批注等各种原貌,使利用者可以获得更多的线索,开展一些更深入的研究。

(三)档案信息传输平台数字化。

档案信息只有在传递过程中才能体现出它应有的价值,以往信息存在于一次文献即档案原件或经过处理的二次文献范畴内,人们需要档案信息,往往需要亲临档案馆,通过阅览摘录、静电复制或拍摄等形式来获取需要的信息。但档案信息在完成数字化后以数字形式存在时,数字网络系统就将成为其主要的传输平台,为档案信息的快速流动提供可能。数字化了的档案信息在传递过程中可以同时进行多向传递,形成传递网络,而且通过因特网可以方便地进行远程传递,不受时间与空间的限制,利用者不必亲临档案馆,就可以在任何时间任何地点通过计算机方便地利用档案信息。

如果把档案馆数字化建设比作一个人体的话,那么档案管理数字化和馆藏信息数字化的建设就是这个人体的骨架和血肉,数字网络系统就是它的神经网络。档案馆信息传输平台应首先构建的是档案馆局域网也可称为内网,一般的要求是在遵循统一的通信协议前提下,通过网络连线将各个部门的计算机资源整合在一起。可根据不同的应用设置服务器,部门的个体计算机通过网络共享网络信息资源,为档案馆核心数据库提供档案信息,也可以得到权限范围内的档案信息。其次是构建外网、公众网等,可使档案信息通过数字网络系统进入信息交流的大动脉----互联网,实现档案资源的共享。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多