档案数字化方案的制定与实施

梁伟   李学广

 

对馆藏传统载体档案进行数字化转换,许多地方档案馆进行了实践,积累了一定的经验。但是,总结以前我国档案数字化建设的不足和失误,往往不是信息技术支持不够,而是绝大多数都知道搞数字化,但档案数字化目的是利用的主题不突出,忽略档案开放鉴定与数字化档案利用的逻辑关系,对先剔除无用档案后开展数字化的思路不明确,没很好研究档案数字化的整体效果就大张旗鼓地做起来了。进而出现数字化目录数据和全文数据不对应、找不着或不好用等问题不少,档案数字化的量虽多,但能上网利用或者说能上互联网利用的很少,数字化返工的现象比较突出,使有限的资金投入并没有体现在数字化档案的利用效益上,这一点已引起档案系统管理和技术高层领导的重视,许多实践工作者已开始进行有益的探索

面对网络时代公众迫切需要远程、公开、快捷的档案信息,面对馆藏浩瀚如海的案卷,面对当前我国档案数字化需要解决的一系列问题,长春市档案馆与中国人民大学信息资源管理学院共同承担了国家档案局科技项目《档案数字化方案研究》。该项目经过课题研究人员的共同努力,已取得了初步研究成果。通过课题研究,对档案数字化方案的研究提出了一些观点和看法,供大家交流和讨论。

一、确定档案数字化指导思想与原则

档案数字化指导思想是:以需求为导向,以利用为目的,充分利用计算机软硬件功能,最大限度发挥人力资源和数字化加工设备能力,保护馆藏档案原件完好,保证数字化档案真实准确,更好地发挥档案信息资源的作用。

档案数字化原则是:遵循重要档案数字化的价值性原则、常用档案数字化的实用性原则、开放档案数字化的开放性原则、褪迹档案数字化的抢救性原则,解密档案数字化的及时性原则,目录数字化与全文数字化分步的时效性原则,档案数字化加工与利用同步的一致性原则

二、明确档案数字化策略

(一)需求导向,急用先上策略

1.需求导向策略

社会需求对档案利用的影响应该是档案工作者特别关注的问题。我们用统计数字加以分析。

1)随着编史修志工作纳入各地工作规划,1986年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的69%。随着编史修志阶段性高潮过去,2003年全国省(区、市)综合档案馆接待编史修志查档卷数占利用总卷数的28%。下降41个百分点。(此数据来自国家档案局法规司保存的档案统计年报)

2)随着社会保障制度的建立和国有企业改革的深入,长春市档案馆查阅工人调配档案卷数占利用总卷数的百分比,由2002年的1%增加到2004年的占利用总卷数的68%

由此看出,国家、地方新政策的出台和工作部署对档案利用的影响程度。从宏观上讲,档案利用已实现了两个转变,服务重点由政治领域转变为经济领域,服务对象由机关干部扩展到公众百姓,特别是为百姓提供凭证案例急剧上升。用动态观念研究当前与长远社会对档案的需求,并指导档案数字化与利用服务工程实践应该是档案部门的必然选择。

2.急用先上策略。地方档案馆馆藏档案数量众多。但并不是所有档案都在现实中利用,有相当大一部分多年不用。2004年全国省(区、市)综合档案馆档案平均利用率仅为1.6%。虽然档案馆众多全宗中当地党委、政府全宗利用率高是一般规律,但其他全宗利用情况往往和政策、时间的变化而变化,影响更大。所以,各级地方档案馆按照近期利用统计情况和发展趋势确定数字化的先后顺序是科学的选择,利用优化理论进行档案数字化筛选,快速反应,突击完成急用档案数字化任务,能够达到更好地发挥档案作用的目的,实现即时投入使用的预期。(此数据来自国家档案局法规司保存的档案统计年报)

()本级为主,分步实施策略

1)本级为主策略

根据档案馆职能分工和档案来源原则,各级地方档案馆永久档案绝大多数是本级机关形成的,一般都占50%以上,这部分档案自然是当地档案馆数字化的重点。同时,地方档案馆都保管着大量的上级档案文件,馆际之间上级档案文件重复是必要的,这些纸质文件来源一般都是上级机关统一印制的。进入信息时代,地方档案馆都面临着保管的上级档案文件全文数字化问题,特别是上级档案文件的开放鉴定审查问题,与其各地分头审查上级档案文件开放和进行数字化,不如国家档案局着手进行档案全文数字化和开放鉴定分工、协作,向馆际共建、共享已有鉴定和数字化成果的方向发展。地方档案馆坚持本级为主的原则,根据需要和可能适时、适量地进行利用频繁政策性上级档案文件的全文数字化,以满足当前工作的急需,尽量减少档案馆多层的重复劳动。

2)分步实施策略

馆藏档案数字化不可能一步到位,而且档案室进馆范围档案陆续进馆,进馆范围档案实施档案数字化馆室共建、共赢、共享的策略非常重要。在具体实施过程中,文件级目录数据库建设是最基础性的工作,是第一位需要建全的,但并一定是文件级目录数据库建成后再建其它数据库。专题数据库建设是根据现实需要而适时建立。全文数据库建设是满足信息检索需要而必须加快建设的数据库。

()剔除无用,避免浪费策略

1.剔除无用策略

地方档案馆馆藏现行档案主要来自于机关各个立档单位,其档案文件进馆的决定权掌握在立档单位文档人员手里,加之国家档案保管期限表几经修改和许多条款至今还比较笼统,所以,不该归档的、不该进馆的、文件重复的档案进馆颇多。特别是建国超过50年以后,半数左右长期保管的档案逐年超过保管期的最上限,这些档案实际上绝大多数已失去保存和利用的价值,但它们仍占据着档案管理的各种资源。

2.避免浪费策略

面对数字化方法的选择,剔除无用,避免浪费应该是一种长久策略,把大量失去保存价值的档案先剔除,避免把无用档案数字化,再造数字化垃圾。

三、优选档案数字化技术与业务路线

档案数字化建设周期长,信息技术又处在快速发展之中,各个档案馆数字化基础和条件不同。从本馆实际出发,优选档案数字化技术与业务路线特别重要。

(一)计算机新技术与档案数字化业务的有机结合

信息技术的发展给档案数字化效率和质量的提高带来深刻的影响,本着技术为需求服务的理念,无论是利用哪一种档案管理系统,都要适应档案数字化流程重组和再造需要,适时进行软件升级,通过软件升级固化技术与流程重组与创新,使档案数字化的效果更好。同时,设计符合国家标准与适应自身需要的数据库结构,使档案数字化的过程优化,数字化档案的利用快捷。

(二)档案鉴定与数字化同步

鉴定与数字化同步的目的是加快数字化档案信息的利用。在计算机网络环境下同步进行档案鉴定与数字化工作是发展趋势。这种档案鉴定是以剔除无用档案为前提,以鉴定档案开放为主,按需求筛选全文数字化档案,为适时提供数字化档案信息服务打基础的过程。

()档案数字化与上网利用同步

数字化档案分开放与不开放两种。在计算机网络环境中,在确定档案开放与不开放的同时,开放档案即上因特网。开放与不开放档案数据在局域网中即时使用。

四、细化档案数字化操作方法

()优化配置各种资源

档案数字化建设需要投入,特别是建设初期软硬件配置投入较大,建成后也要保持一定的运行成本。地方档案馆在具备一定档案数字化条件的基础上,要按照成本效益最大化理论,根据不同的情况,进行档案专业人员和数字化技工人员、计算机和扫描设备的合理搭配,优化档案数字化各种资源配置,提高档案数字化建设的投入产出比,构建档案数字化投入小产出大的新式。 

(二)首先建立文件级目录数据库满足一般检索和管理的需要,建好档案文件级目录数据库。目前,绝大多数综合档案馆,由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。另外,档案的统计单位主要是卷和延长米,而档案的最小单位是文件的件数,以件为单位的底数不清是普遍存在的问题。所以,把文件级目录数据库建设作为一项基础性工作,在提高档案的查全率、查准率的同时,利用计算机实现档案以件数为基本单位的管理是非常必要的。

1.高度重视文件级目录数据录入的前期处理。档案馆的案卷来自各个立档单位,案卷是由文档人员在档案局业务人员指导下形成的。但是,由于文档人员变动频繁、档案业务指导面多线长,案卷质量难以适应计算机精确管理的需要,加之个别文件形成时的先天不足,给文件级目录数据库建设带来许多麻烦。实践证明,进行文件级目录录入的前期处理,抛开原有的文件目录,按卷内实有文件一一录入,把题名不反映主题、目录与实体不符等一系列问题一并处理是非常必要的。

2.科学合理地设计数据库结构。文件级目录数据库结构包含三方面功能为最佳。一是符合国家有关标准及实际情况,文件题名、责任者等满足文件检索需要的字段。二是存毁、开放、扫描等数字化加工阶段利用的字段。三是数据录入、校对、鉴定、审查等标明责任的字段。

3.数据质量是数据库的生命。建立在计算机环境下,以上网公开利用为根本目的文件级目录数据库,与纸质文件目录有本质的区别。纸质文件目录有问题只有档案馆内部少数人知道,利用者并不清楚。但是,文件级目录数据库进入网络,特别是向社会公开的部分,对数据库的质量要求是相当高的,数据质量也是当前制约许多数据上网利用的瓶颈之一。

(三)适时建立专题数据库

满足特殊检索需要,适时建立档案专题数据库。馆藏档案仅靠文件级目录数据库是不可能解决全部检索问题的。随着客观需要的变化,对某一专题档案有集中利用的需求是经常发生的,突击建立专题数据库,满足社会需求,是档案馆与时俱进的突破口,也是充分发挥档案作用的最佳时机。主要把握三个方面:一是根据馆藏档案内容确定专题数据库的总体布局。二是按需求分期建立专题数据库。三是根据文件内容和检索需要分别设立不同的专题数据库结构。

(四)优选建立全文数据库

满足信息检索的需要,建立档案全文数据库。按照国家档案局提出的重点的、利用频繁的档案首先实现全文数字化的要求,按照“二八”定律,即以20%的努力达到80%的效果,通过多年档案利用统计数据分析,优先全文数字化档案的全宗、年代。在网络中、在文件级目录的基础上同步进行档案存毁、开放、数字化鉴定与筛选,进而形成与文件级目录一一对应的全文数据库,并确保数字化档案的真实、准确。

(五)档案数据库的管理

为了档案数字化与利用同步和数据安全管理的需要,档案数据库分在建数据库和成果数据库两大类。

1.在建数据库的设立。在建数据库是为了数字化加工所设立的动态库,是数据不断变化的数据库。例如,设立文件级目录数据录入库,它是每个录入人员都分配给操作权限的动态库,属于在建数据库。而完成的文件级目录数据库则是成果库。但是,在鉴定及全文数字化加工过程中它又成为全文数字化加工在建数据库。

2.成果数据库的使用。成果数据库只分配使用权限,只有特殊需要时经批准才分配数据改变的操作权限。

3.数据的管理与监督

建立技术负责人、超级管理员、数据管理员连锁责任制,实行审批者没有数据操作权,超级管理员只允许分配权限不允许使用数据操作权,数据管理员只有需要时经批准使用数据操作权,用后即刻收回。给予单位领导和相关中层干部全部数据的查看权,每天24小时可以时时对数据质量进行监督,形成数据管理监督新机制。

(六)数字化档案利用服务工程

数字化档案利用服务工程是以搞活数字化档案利用的目的,以局域网、政务网、互联网为平台,通过建立数据安全管理制度、网络安全运行制度和具有法律责任的网管、数据管理员、数字化加工人员、提供利用人员连锁责任制,环环相扣,从措施上保证数字化档案的准确。通过防火墙、CA认证、数字水印、电子签章、权限控制等计算机新技术,从技术上保证数据的安全,利用网络实现档案的法律效力,实现远程为利用者提供快捷、准确数字化档案的目标。

1.在局域网上应用

在局域网内,档案在建和成果数据库所有接待人员都有检索权限,对只进行目录数字化的档案实行现用现扫描全文的方法使之达到已全文数字化的档案一样效果,利用网络技术实现数字化档案利用替代档案原件利用、计算机打印件替代复印机复印件、电子签章替代手工盖章、接待人员和利用者不接触档案原件的目标。从而起到了运用数字档案高效利用、保护原件的作用。并积累了利用者凭加盖电子签章的数字档案打印件办理社会保险的成功案例,其数字化档案的法律效力得到认可,为档案馆参与电子政务开辟了新途径。

2.在互联网上应用

利用档案网站,通过CA证书等安全手段,不但实现了领导远程数据上传的审批,主要是开展开放档案远程查询、下载、打印。特别是把CA证书发给立档单位或使用单位档案室,CA用户远程提供档案证明和数字化档案法律效力的体现,减少异地现场查询的不便,使档案馆参与电子政务成为现实

五、加强档案数字化工作的行政管理

档案数字化涉及档案馆内部许多部门,加强组织管理工作显得十分重要,“三分技术七分管理同样适合档案数字化与利用服务工程。各个档案馆涉及档案数字化加工和利用的内部组织机构设置不尽相同,但应按照效率优先的原则,在计算机环境下,把数据录入、鉴定、数字化加工、整理、数字化档案利用形成一个流水线,打破内部行政分工界限是发展趋势。无论是采取那种组织形式,优化人员组合重新分工在所难免,各个档案馆在组织实施方面有所不同是必然的。

1.加强计划管理

档案数字化建设是一项复杂的系统工程, 针对实际的调研和论证,运用科学方法预测,制定科学配置各种资源进行档案数字化的总体规划和年度专项计划,通过计划谋求管理系统的外部环境、内部条件、决策目标三者在动态上的平衡,实现管理决策所制定的各项目标。

2.强化组织实施

实施是一个复杂的活动过程,档案数字化建设又是一项全新的工作,技术含量高,涉及到许多因素,在实施过程中会出现各种各样的矛盾和困难,会遇到来自各方面的干扰,实施特别强调解决问题的及时性。通过创新行政管理与技术管理相互作用的新机制,实施有效的组织、指挥、协调、激励工作,保证档案数字化的计划目标的顺利实现。

3.增强管理的技术含量

档案数字化的建设过程贵在控制,重在管理。利用计算机进行档案数字化,任何一个逻辑错误,都会给数据的管理和使用带来麻烦或隐患。在互联网上公开不真实、不准确的档案,将在世界范围内产生不良影响。特别是在网络环境下的流水作业,上一道工序一定要为下一道工序负责,各道工序工作量的对等与匹配同样重要,这必然要求行政、技术、质量管理的网络化。实践证明,建立数字化进度数据库、数字化质量反馈库、档案利用登记数据库,给局馆领导和相关人员分配使用权限,通过技术手段将全面质量管理思想引入档案数字化建设,实现全程管理、适时控制,达到强化数字化档案质量保证体系的目的。

档案数字化与利用服务工程是一项长期的任务,需要从理论上解决的问题很多,需要在实践中探索的问题也不少,我们将继续深化研究与实践。

 

(此文章刊登在国家档案局技术部、科学技术研究所主办的《档案科技与现代化》20056期上,获长春市档案学会2005年度优秀论文一等奖)