分享

【学术前言】敏感词全文比对在档案开放审核中的应用实践

 宋洋sy 2021-11-05

档案开放审核的重要性

档案开放审核是档案工作的一个难点,目前我国的档案开放审核工作仍停留在纯人工工作的初级阶段,存在工作方法单一滞后、档案开放程度低等问题。随着我国经济、文化等的全面发展和全社会档案意识的提高,档案开放审核工作的重要性愈发凸显。如何在确保依法依规的前提下提高档案开放审核工作的效率,从而提高档案开放程度,也就成为档案界面临的一个非常突出的问题。

1

研究意义

1.学术意义

近年来,学术界对档案开放审核工作做了大量的研究,并形成了很多成果,有的学者从制度、组织、法律等方面做了分析,有的学者从技术层面做了分析,但专门从技术的角度来研究档案开放审核工作的成果则相对缺乏,尤其缺少可供参考的现实案例。潍坊市档案馆研究将敏感词全文比对技术应用到档案开放审核工作中,具有较高的学术价值。

2.现实意义

目前,我国各地档案部门已经开始对数字档案进行开放审核,实现了鉴定媒介的转变,但并没有降低鉴定工作本身的难度和巨大的工作量。有鉴于此,部分档案馆设计软件通过敏感词实现了目录比对,但正文仍需要人工逐字逐句审查,因而审核人员的工作仍然非常繁重。

潍坊市档案馆探索将敏感词全文比对技术应用到档案开放审核工作中去,审核人员无需再阅读每一份文件的全文,只需审查敏感词所在的位置来提出鉴定意见即可,实现了档案开放审核工作在技术上质的提升,具有很高的现实意义和推广价值。

2

技术优势

1.敏感词全文比对技术

敏感词全文比对技术具备覆盖全、反应快、识别准等特点。在数字档案馆综合档案管理系统中,计算机通过档案开放审核程序,运用在线OCR(Optical Character Recognition)识别技术,同时结合数字化加工成果解析结果,从敏感词库中读取敏感词,通过DFA(Determinist ic Finite Automation)算法,用档案原文与敏感词一一比对,最终过滤筛选出档案中包含的敏感词,实现敏感词文中定位,同时让敏感词列表显示在指定窗口上。

2.档案开放审核程序

将敏感词全文比对技术嵌入到档案开放审核程序中后,可实时快速过滤出数字档案中的敏感词,准确定位敏感词所在位置,供审核人员进行下一步处理。此外,档案开放审核程序还可以批量导入敏感词库。档案馆可根据工作需要,对词库进行更新维护,增加或删除敏感词,为档案开放审核提供更为可靠的依据。在档案开放审核工作过程中,针对特殊条件的批次,审核人员可借助档案开放审核程序对特殊年代、特殊载体、特殊种类等特定档案进行批量处理。所有工作人员在档案开放审核程序中的每一个操作,程序都将自动保存相关数据。如果审核人员操作错误,管理员可查看数据,准确识别出错误,从而进行修正。

3

应用实践

为进一步做好档案开放审核工作,准确划分档案开放等级,保障档案在信息化条件下及时和安全开放利用,2019年,潍坊市档案馆开展了新一批的档案开放审核工作。潍坊市档案馆保管有185个全宗,各类档案共45.4万卷((册件),目前纸质档案已全部数字化。此次需要审核的档案是1983年至1989年的文书档案,共计15.7万余件、162万余页。为了完成此次审核工作,潍坊市档案馆制定了实施办法,主导开发了综合档案管理系统中的档案审核程序,将敏感词全文比对技术应用到审核工作中。

1.制定实施办法

依据《中华人民共和国档案法》《中华人民共和国档案法实施办法》《中华人民共和国保守国家秘密法》《各级国家档案馆开放档案办法》《各级国家档案馆馆藏档案解密和划分控制使用范围的暂行规定》等法律法规,参照《中华人民共和国政府信息公开条例》和山东省档案馆、青岛市档案馆开放审核工作经验,结合本馆实际情况,潍坊市档案馆制定了《潍坊市档案馆档案开放鉴定工作实施办法》,作为开放审核工作的依据。按照该实施办法,档案馆确定开放审核组织管理、适用范围、遵循原则、开放审核标准、工作流程、档案开放与公布等各项工作内容,使档案开放审核工作有法可依、有据可循。

2.建立敏感词库

要实现敏感词全文比对,首先就要有一个非常科学准确的敏感词库。档案开放审核是档案馆的重要基础性业务工作,在长期的工作中,档案工作者已经认识到,某些词语的出现,往往能够成为一份档案是否可以开放或者以何种方式开放的重要参考依据,这些词语被称为敏感词。此前,山东省档案馆、青岛市档案馆等已经建立了敏感词库。潍坊市档案馆建馆已经有61年,在历次档案开放审核工作中,已经积累了一定数量的敏感词。为确保敏感词更加全面准确,潍坊市档案馆在梳理自身形成的敏感词的基础上,又参考了其他档案馆的敏感词库,最终形成的敏感词库共收入敏感词1009个,基本覆盖了各个领域。

3.梳理工作流程

此次潍坊市档案馆开展新一轮档案开放审核工作,与尚德软件股份有限公司合作研究敏感词全文比对算法,敏感词的筛选过滤、敏感词的准确定位等技术,优化档案鉴定流程,最终将敏感词全文比对技术嵌入到了档案开放审核程序中。

潍坊市档案馆档案开放审核工作是以三审为核心,分为鉴定任务分配、初审、复审、审核、审批、档案开放与公布6个环节。

(1)鉴定任务分配

档案馆确定的档案开放审核管理员在开放审核平台上配置任务条件,建立档案开放审核任务,之后将任务分配至指定鉴定人。

(2)初审

档案馆档案开放审核工作小组负责馆藏档案的初审工作。鉴定人登录专属账号,进入档案初审列表,开展档案开放审核初审工作,提出鉴定意见。

(3)复审

档案开放审核委员会组织人员承担复审工作。初审完成后,鉴定人员将已完成的任务提交给档案开放审核管理员,后者将鉴定任务分配给指定的复审人员。复审人员登录专属账号后进入档案复审列表,开展档案开放审核复审工作。在复审环节,复审人员按需求对初审工作进行抽检。

(4)审核

复审工作结束后,鉴定委员会形成《开放审核审查报告》,采取会议形式对报告进行审核。

(5)审批

档案开放审核委员会将《开放鉴定审查报告》和档案开放审核结果报馆务会研究审批。开放档案由市档案馆报市档案局审批。

(6)档案开放与公布

档案开放审核工作完成后,档案馆将按规定办理开放手续,向社会公布档案开放结果,原则上每年开放一次。为方便提供利用,档案馆将编制开放档案目录,并对秘密变更、解密和经鉴定开放的档案对应的电子目录数据逐一进行标注。已解密档案公开利用时,其档案原件,各种非纸质载体的复制件等均需加盖档案解密标示。

4

应用成效

1.省时省力,事半功倍

传统的档案开放审核工作是由审核人员凭借多年经验来完成,具有一定的主观性。运用全文比对技术,可以防止在档案开放审核工作中因审核人员的主观性而造成的工作失误。全文比对技术通过自动化处理,对数字档案资源进行初步筛选,并展示敏感词比对结果,减少了档案工作人员逐字逐页查看档案的工作量。利用计算机对部分档案进行批量处理,有效节省了时间,使得潍坊市档案馆的档案开放审核工作效率大为提高。经测试,鉴定1页B5纸张、约500字的档案,如果采取传统的审核手段,每人至少需要80秒左右,若采用敏感词全文比对技术,只需30~40秒就审核完毕,本次审核的162万余页档案共计节省了1.8万小时。

2.缓解压力,突破困局

早期阶段,因为档案开放审核工作人员相对不足,导致档案开放程度、开放质量不高。档案馆馆藏量大,档案内容涉及面广。专业性强,档案开放审核工作需要专人负责,但目前大部分档案馆尚未设置开放审核科室,缺少专职人员,审核人员在承担鉴定工作的同时还承担档案利用、安全管理等日常工作,现有的人员机构编制难以应对繁重的鉴定工作。特别是这些年来,档案形成的数量成倍增加,相应地档案开放审核的工作量也将成倍增加。针对档案开放审核工作人员严重不足问题,潍坊市档案馆在此次档案开放审核程序设计、开发过程中,专门设立了档案开放审核任务机制,每个审核人员可对应多个鉴定任务,并结合程序中全文比对、批量处理等功能,使得档案开放审核工作更简捷、更有效,从而缓解了档案开放审核工作人员严重不足的情况。

3.提高意识,形成联动

档案开放审核不只是档案馆一个部门的工作,需要立档单位的充分参与。在此次档案开放审核工作过程中,潍坊市档案馆开展了对立档单位的宣传和培训工作,增强了其对开放审核工作的重视和理解,让此项工作逐步成为立档单位的常规工作。目前,潍坊市已经初步形成了档案馆和立档单位互相合作、联合审核的格局,切实推动了全市档案开放审核工作有效开展。立档单位的档案意识普遍提高。同时,在审核工作过程中,档案馆还对该项工作做了大量的宣传;人民群众的档案意识也得到了提升。

伴随着时代和科技的发展,档案工作也在不断发生变化。每一个时代的档案工作者都应努力探索最优技术选择,可以预期,未来将会有更加现代化的技术手段应用到档案开放审核和其他工作环节中。潍坊市档案馆将和各地同仁一起,积极推动档案工作迈向现代化、智能化。


作者单位∶山东省潍坊市档案馆

文:杨扬 孙广辉 韩先吉

来源:《中国档案》2020年11月(转载仅做分享交流,侵权请联系删除)

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多