课题成果

                                                    [课题]

国家档案局科技项目《馆藏档案鉴定、筛选、数字化及利用网络技术实现法律效力的应用研究》

随着社会的进步和网络技术的发展,我国各级党政机关在互联网上登录了数以亿计的公开现行文件和政府信息,使公众享受了方便快捷、高效率、低成本的信息服务,得到百姓的普遍欢迎。与之相比,互联网上档案信息服务却很少,与公众对档案信息开放的需求形成强烈的反差

为此2002《全国档案信息化建设实施纲要》就提出加快档案资源数字化、信息管理标准化、信息服务网络化的进程,为改革开放和现代化建设服务的要求。特别是中办发[2004]34号文件和《国家档案局中央档案馆关于加强档案信息资源开发利用的意见》(国档发[2005]1)先后下发,使档案馆面对着社会需求和上级要求的双重压力,加快数字档案馆建设步伐已成为全国档案系统从管理层到技术层的共识与行动

从目前我国数字档案馆建设的实践来看,虽然已有资金雄厚的档案馆按数字化与上网利用分步进行的案例,但面对全国综合档案馆上亿卷档案,在传统载体档案利用与数字化档案利用长期并行的趋势下,迫切需要多样化、分层次的数字档案馆建设模式。为此,长春市档案馆与中国人民大学信息资源管理学院、北京市博阳信息工程研究所协作,2004年进行了国家档案局科技项目《馆藏档案鉴定、筛选、数字化及利用网络技术实现法律效力的应用研究》的理论与实践研究,运用现代管理理念和先进的科学技术,以利用为本,优选在先,探索出档案鉴定、数字化、上网利用同步这样一个新模式,系统解决了人力资源和资金设备使用效率,节约数字档案馆建设成本,最大限度发挥档案信息资源利用效益问题,形成了值得借鉴的数字档案馆发展战略。

今年初,该项目顺利通过国家档案局组织的科技成果鉴定


 

                 数字档案馆建设创新成果

          ----档案数字化与利用服务的综合研究

 

一、项目研究的基础

长春市档案馆在完成网络工程建设后,2004年初就把档案信息化建设确定为“一把手”工程、班子工程和全员工程。首先从认识上破除传统观念和思想束缚入手,消除干部对信息化的距离感、恐惧感和陌生感。其次抽调骨干力量组成工作班子,群策群力,科学决策,制定了《2004—2010年长春市档案信息化建设发展规划及实施方案》,在规划中明确了“利用为本、急用先上、快速反应、即时见效”的思路,在方案中确定了档案鉴定、数字化、上网利用同步,多种数据库建设同步的数字档案馆建设实施路线。三是抓住工人调配档案需求强烈,手工检索十分困难,局馆干部有目共睹的有利时机,项目前期研究从百万工人调配档案数据库建设入手,全员参与,齐心协力,仅利用45个工作日就建成了112万人的专题数据库,即时投入使用,使档案的查准率由万分之六提高到百分之百。实实在在的档案数据库建设成果,不但得到利用者的普遍赞誉,更重要的是信息化带动战略在全体档案干部的心中扎根,成为长春市档案馆无形的财富,也为此项以理论与实践结合的应用研究打下了良好的基础。四是以先进技术为支撑,以利用效果为检验标准,从档案数字化到上网利用、从实施过程到实现目标的思想明确。

二、项目研究的组织

此项研究的组织,一方面要考虑研究对象的适用性、典型性和学术性,还要认准主要切入点,才能卓有成效,早出成果。另一方面,我们对课题组成员的研究素质和研究能力以及特长进行了慎重考虑。可以说对各种研究因素进行了科学匹配,充分运用了策略和技巧,实践表明,这番心血没有白费。

(一)组成团队,开展大协作

在研究题目和对象确定之后,项目组从理论、技术、实践三个层面聚集了优秀的研究人员。在理论层面,重视理论对实践的指导性,实行档案馆与信息资源管理学院联合,集中优秀理论人才,加强理论指导。在实践层面,重视经验和动手操作能力,打破行政分工界限,抽调优秀实践人才。在技术层面,坚持科学发展观,实行档案馆与研究所协作,聚集优秀技术人才。本项目属应用性研究,不但理论上要有突破,实践上也需要创新。从工作最后成果看,各个层面的研究人员合力攻关,成为全国档案界馆、学、研、用四位一体的成功案例。

(二)契而不舍,苦干克难关

项目研究任务以上百万件档案作为研究对象,面对不同时期不同内容的档案,面对大量近乎于重复的工作,面对当年立项当年鉴定,并要在实践基础上提炼出有规律性成果的预期。一年的时间,全体研究人员,放弃了180天的机关例行休假,加班加点不计其数。有几位同志常年早来晚走,几乎每个周末周日都到机关加班,为项目研究的速度、深度而呕心沥血。

三、项目研究的主要内容

2004年底,全国档案馆保管三亿多卷档案,不必要也不可能一下子都全文数字化。长春市档案馆保管着不同时代、不同作用、不同质量的三十万卷档案,按照需求导向的原则,走档案鉴定、数字化筛选、上网利用同步是客观需要的必然规律,领导和专家作出了明智的战略抉择。为此,研究人员对长春市档案馆近三年档案利用统计数据进行了汇总分析,结合政府信息公开的要求,最后确定了当前利用率高、社会影响大的工人调配档案作为专题研究对象,确定改革开放以后代表性较强的1982年度各全宗档案作为横向研究对象,确定能够反映各个历史时期档案产生情况、现实利用和历史研究价值较高的市政府全宗各年度档案作为纵向研究对象,使项目研究的代表性更强、实用价值更高。

(一)档案鉴定与数字化范围的研究

1.该项目所指鉴定即档案的价值鉴定,对选择范围内的每一件档案进行留存(确定固定年限的保管期限)、缓销、销毁的研究。通过鉴定数据对选定范围内档案保管期限的重新划定,总结相对应档案今后保管期限改革的规律,也为鉴定后定期(固定年限的)档案的批量出库销毁打下基础, 使档案馆朝着有用就进没有就出的动态管理系统发展,尽快形成良性循环。

2.筛选是把《全国档案信息化建设纲要》提出的“重要的和利用频繁的档案全文数字化的”要求,对选择范围内的每一件档案进行的细化研究,确定、标明是否进行全文数字化档案的类别,在文件划密、解密规定的原则下,参考机关各部门现行文件上网范围选定档案开放的研究、实践,总结馆藏档案数字化后上网范围和规律。

3.档案鉴定、筛选、数字化、整理、利用流程及整理方法的系统研究。

(二)数字化档案利用网络技术实现法律效力的应用研究

1.把CA认证、数字水印、电子签章、权限控制、智能卡技术嵌入档案管理系统,并以下岗职工急需工人调配档案办理社会保险为契机,利用网络技术提供数字化工人调配档案起凭证作用为案例,研究、实践数字化档案法律效力的实现方式,为馆藏档案数字化后作用的发挥开辟新的途径。

2.积累工人调配档案利用网络技术实现法律效力的实例数据,进行档案数字化前查全率、查准率、查询时间等多方面数据对比分析,研究利用网络提供数字化档案社会效益与经济效益。

(三)研究档案数字化不同途径的成本问题

利用成本理论,依据实践数据对选定范围的档案鉴定与数字化同步和档案鉴定与数字化分步(即全部数字化后再鉴定)的经济成本、机会成本进行系统评估、比较研究,推算出长春市馆藏全部档案鉴定、数字化的成本,为今后档案信息化建设决策提供科学依据。

四、项目研究的主要成果

    为了综合使用人力、物力、技术、设备资源,增强人力和资金使用效率,节约成本,提高效益,整个项目研究采取的是一体化、流水线的方式进行。

(一)档案鉴定与数字化同步

目前,我国综合档案馆档案数字化工作,因受经济条件、人员结构、保密观念、总量偏大的影响,与许多行业信息化速度相比处于落后状态。现在,全国综合档案馆一般都采取档案数字化与鉴定分步的方法。为了加快数字档案馆建设,把档案价值鉴定与数字化同步进行,既符合节约、高效的原则,又可加快数字档案馆建设步伐,收到事半功倍的效果。

1.馆藏全部现行档案两种数字化方法成本分析

利用研究数据分析,长春市档案馆有90万件现行档案,利用两种数字化方法的成本(显明成本)分别是:

采取档案鉴定与数字化同步的方法,完成90万件任务,计算成本需投入40万元。不需要更多的扫描设备,也不影响有用档案数字化的速度,但需要投入档案鉴定专业人员。

采取鉴定与数字化分步的方法,完成90万件任务计算成本需120万元,需要大量的扫描设备来提高速度,是鉴定与数字化同步成本的3倍。

2.档案鉴定、筛选实践研究

档案鉴定、筛选是按照上级档案部门关于档案鉴定、筛选原则规定而进行的细化研究。档案鉴定内容包括档案的存毁鉴定、保管期限鉴定。档案筛选内容包括对鉴定留存档案确定是否全文数字化、开放两个方面。

1)保管期限与存毁鉴定细化研究

依据档案的具体内容、价值大小、重要程度、载体形式,经反复研究与实践,从建立动态档案馆和不再重复鉴定的角度出发,将鉴定后档案的保管期限划定为永久、80年、50年、30年、缓销和销毁六个档次。判定依据一是按照档案内容是否继续发挥效用来判断;二是按照档案内容是否具有法律凭证作用来判断;三是按照档案内容是否反映立档单位主要职能活动来判断;四是按照立档单位的级别来判断;五是按照档案是否产生于特殊年代来判断;六是按照立档单位的性质来判断;七是按照档案内容所反映的问题大小来判断;八是按照同一全宗同一年度档案齐全完整程度来判断;九是按照档案是否唯一来判断。在软件技术支持下,对档案查询是否唯一。若出现重复件,则在第一责任者单位留存,其它立档单位的重复件剔除;十是按照特殊需要来判断。

鉴定10万件档案后永久档案件数占鉴定总件数的21%80年档案件数占鉴定总件数的19%50年档案件数占鉴定总件数的19%30年档案件数占鉴定总件数的8%;缓销档案占28%,销毁档案占5%

2)档案全文数字化筛选的细化研究

按照档案的利用频率及发挥作用的程度来决定是否对档案进行全文数字化处理。实践中将档案全文数字化的范围确定为:利用频繁的档案;重要且难以查到的档案;有法律效力的档案;需要抢救的档案等等。

实践数据:鉴定后档案扫描件数占鉴定总件数的20%,占鉴定后留存档案总件数的50%,其中扫描率最高的全宗达到60%。

3)开放档案筛选的细化研究

根据档案内容及其开发利用价值,将其分为开放和不开放档案两种。被筛选为开放的档案直接进入互联网,即时提供利用。不开放档案在内网按规定的范围使用。开放档案的类别主要确定为:经济、社会管理方面档案;通用的公共服务方面档案;与个人关系密切的扶贫、优抚、教育、社会保障、劳动就业等方面档案;科学技术普及方面的档案;文化方面的档案;机关机构职能和人事调整、变动情况档案等等。

实践数据:鉴定后开放档案件数占留存档案件数59%,政府全宗各年开放的平均数81%,最大数为90%。基本规律是年代越久远开放越多。

3.档案鉴定与数字化同步的好处

一是档案价值鉴定、提前开放鉴定、数字化筛选、整理、上网利用一次完成,不但避免多次重复调卷,节省人力和时间,更重要的是加快了档案提前开放利用的步伐;二是避免无保存价值档案数字化,加快馆藏档案数字化速度;三是剔除无保存价值的档案,节省保管空间,降低保管成本。

(二)多种数据库建设同步

按照利用为本、急用先上的思路,同步建设档案目录和全文数据库。一是满足一般检索需要,建好档案文件级目录数据库。目前,绝大多数综合档案馆,由于没有实现全部档案的文件级目录机检,查找档案不快、不准、不全的问题普遍存在。从数字档案馆建设来说,把文件级目录数据库建设作为一项基础性工作,努力提高档案的查全率、查准率,长春市档案馆在完成案卷级目录数据库的基础上,已完成了70%的文件级目录数据库建设。二是满足特殊检索需要,适时建立档案专题数据库。馆藏档案仅靠文件级目录数据库是不可能解决全部检索问题的。随着客观需要的变化,对某一专题档案集中利用需求是经常发生的,组织力量突击建立专题数据库,满足社会需求,是档案馆与时俱进的突破口,也是充分发挥档案作用的最佳时机。长春市档案馆根据现实需要已建立多种专题数据库115万条。三是满足信息检索的需要,建立档案全文数据库。按照国家档案局提出的重点的、利用频繁的档案首先实现全文数字化的要求,已完成15万件和112万人常用档案鉴定、数字化任务。 

(三)数字化加工与利用同步

由于长春市档案馆档案数字化思路明确,运用“二.八”定律的优选实施路线,并采取全文数字化档案在网络中直接利用,目录数字化档案即时扫描全文利用的方法,使数字化档案在网络中发挥了接待利用的主导作用。目前,在互联网的《长春档案信息资源网》上已开放档案107万条,在局域网上运行档案数据200万条,并成功把身份认证、数字水印、电子签名等新技术运用于档案数字化实践,进行了数字化档案利用替代档案原文利用、电子签章替代手工盖章、计算机打印件替代复复印件的探索,积累了下岗工人凭加盖电子签章的数字档案打印件办理社会保险的成功案例,其数字化档案的法律效力得到认可,系全国范围内率先开展的创新性实证研究。从而实现了运用数字档案高效利用、保护原件的作用。据2004年初至20056月底的实际统计,全部工人调配档案数字化仅占馆藏档案数字化比例的10%,却在网络中提供的工人调配档案数占长春市档案馆接待利用总数的68%,充分证明了档案数字化优选路线的科学性。

数据分析

 

 

档案种类

 

检索方式

 

利用人次

 

查找件次

查到人(件)次

未查到(件)人次

 

查全率

 

查准率

 

平均查找时间

 

年度

 

调配档案

手工案卷级检索

 

323

 

538332

 

201

 

122

 

38%

 

6/10000

35小时

2003

计算机全文级检索

 

887

 

887

 

887

 

0

 

100%

 

100%

5分钟

 

2004

 

数据分析:

2004年利用人次是2003年的3倍。

2003年因为查不到而多查档案538131件,使2003年利用件次是2004年的700倍。

查全率是未查到人次与利用人次的百分比。2003年查全率只有38%2004年查全率则是100%,提高了62个百分点。

查准率是利用件次与利用人次的百分比。2003年查准率是万分之六,2004年查准率是100%

2003年未查到档案的122人中有的档案不在档案馆,也有的在档案馆没查出来。其中有14%2004年建成调配档案数据库后又补查到,最典型的是原在长春参加工作,现在外地办理社会保险的同志查到了调配证。

档案数字化前查找一件档案平均是3.5小时,档案数字化后查找一件档案是5分钟,一年多就使利用者和接待人员节省查档时间3000多小时,为外地查档人员节省大量的旅差费,同时也节省了接待人员的时间,提高了工作效率。

   (四)技术创新

长春市档案馆在数字档案馆建设中,除跟随计算机新技术进行硬件升级外,重点是不断地将新的管理思想、管理理念浓缩形成不断完善的软件系统。

1)利用新技术,固化创新

充分利用计算机新技术,科学设计、完善档案管理系统。一是基于大型数据库的安全机制和系统完备的授权控制,将身份认证、数字水印、电子签章、智能卡技术系统的嵌入档案管理系统,保证数据安全及有效利用,使数字化档案法律效力的实现成为可能。二是努力使档案管理系统覆盖档案实体管理和数字化档案管理所有业务。三是把重组和再造的业务流程利用计算机新技术固定下来,使改革创新适时到位。四是内外部数据顺畅导出导入,并保证其可以更大范围的共享。

2)利用自定义功能,提高效率

设计和利用档案管理系统数据库自定义功能,结合研究与实践的需要,科学合理地设计、设置数据库结构和字段,使数字化档案的关联度更大、系统性更强。长春市档案馆数据库建立和档案鉴定、筛选、数字化、整理、利用等具体内容研究都是在档案管理系统支持下,按照系统工程思想设计的,数据相互关联,系统即时记录。使用人员根据需要自动提取字段数据,任意编排,批量利用,使过去手工无法做到的事情迎刃而解。

(五)制度创新

建立数字化档案形成、管理、利用环环相扣、相互约束、保证安全的制度是数字档案馆建设的主要内容之一。在人员管理制度方面主要是按照系统工程思想在组织、机制、制度保障方面形成一整套实用的措施。在数据管理制度方面主要是把数据管理的要求,变为科学使用权限控制功能,形成相互约束的操作规程,达到既保证数据安全又方便利用的目的。

1保障措施

一是组织保障:根据工作需要,建立数字档案馆建设领导小组,形成一把手工程、班子工程、全员工程的齐抓共管行政管理体系。组建由技术总负责人、超级数据管理员、数据管理员、数据监督员组成的档案数据技术管理体系。二是机制保障:实施分级管理的责任机制。数字档案馆建设领导小组,负责数字档案馆建设重大问题的决策、指挥,强化对数字档案馆建设的领导。建立数据管理相关入员连锁责任制,实行审批者没有数据操作权,超级管理员不允许使用数据操作权,数据管理员只有需要时经批准给予数据操作权,数据监督员给予全部数据的查看权,这样就形成了人员管理的新机制。三是制度保障:建立馆藏档案数据录入责任制度、接收外部数据责任制度、档案数据安全管理制度、网络运行安全制度、计算机主机房管理制度等等,保障网络及数据安全运行、有效管理、科学使用。

      2.建立数字化档案形成、使用人员岗位责任制

为规范馆藏档案数字化工作,保证数字化档案真实性和有效利用,制定具有法律责任的连锁责任制是数字档案馆建设不可缺少的内容。一是档案数字化加工人员在扫描拍照档案原文时,认真检查档案原文排序是否正确、内容是否完整,根据档案原文的质量,确定扫描技术参数。在档案数字化过程中,必须由专人负责档案的保密与安全,工作人员不得擅自复制档案内容或将涉及档案内容的物品带出工作间,也不得向其它人泄漏档案信息。二是档案馆负责提供数字化档案利用的人员,要按照纸质档案利用的保密、安全、准确制度执行,承担相应的责任。三是无论是档案数字化加工人员还是提供利用人员,都要按照档案法律法规的要求,对数字化档案真实性、准确性、安全性负有法律责任,直接领导有连带责任。

五、成果鉴定意见

2005116,国家档案局组织专家对该项目进行了成果鉴定,其主要意见如下:

(一)该项目运用现代管理理念和系统科学方法论指导项目研究和实践,在管理为利用服务、技术为需求服务及常用先上等六个理念的基础上,对馆藏档案鉴定、筛选、数字化及电子签名技术的应用等方面进行了较全面的研究与实践,在档案鉴定原则、筛选原则、数字化原则及开放原则等方面有所创新。通过项目研究带动、促进管理机制的变革,进行全面制度创新以及注重成本效益的做法具有先进性。

(二)该项目在对档案业务流程进行系统再造与重组的基础上,深入探讨技术支持的方式、方法,成功地把身份认证、电子签名等新技术运用于档案数字化实践,实现了运用数字档案高效利用、保护原件的作用。并积累了下岗工人凭加盖电子签章的数字档案打印件办理社会保险的成功案例,其数字化档案的法律效力得到认可,系全国范围内率先开展的创新性实证研究。

(三)该成果对于在档案馆开展档案数字化工作中,因地制宜、因时制宜,增强人力和资金使用效率,节约成本,提高效益,具有较强的示范作用。建议在本领域继续深化研究,并加大实践力度,组织实施和推广。

数字档案馆建设是一个长期的任务,随着社会需求的增大和档案馆功能的扩展,提供全方位服务和多元数据库建设任务会更重,需要解决的问题会更多,档案工作者面临着新的挑战和机遇。

 

(此文刊登在《中国信息界》杂志200516期上,获中国信息化百篇优秀论文奖)