数字档案长期保存集中代管模式探索

    耿志杰 凌桂萍

    摘? 要:为解决目前档案部门存在的技术策略未能有效落实、配套管理体系不完善、难以面对未知风险挑战困境,参考北极世界档案馆“一站式”集中代管理念和成功经验,提出数字档案长期保存集中代管模式,并从内涵、价值、关键要素和推进策略四方面对其进行探索研究。

    关键词:数字档案长期保存;北极世界档案馆;集中代管模式

    Abstract: In order to solve the problems existing in archival departments,such as the ineffective implementation of technical strategies,the imperfect supporting management system,and the difficulty in facing unknown risks and challenges,learning from the idea and experience of 'one-stop' centralized escrow of the Arctic World Archive,this paper puts forward the centralized escrow mode for long-term preservation of digital Archives,and explores and studies it from four aspects of connotation,value,key elements and promotion strategy.

    Keywords: Long-term preservation of digital archives; Arctic world archive; Centralized escrow mode

    數字档案长期保存工作涉及技术、管理、标准规范等多方面因素。在前期调查过程中发现,很多策略难以得到有效落实,长期保存工作难度较大。数字档案长期保存的困境主要表现在技术策略未有效落实、配套管理体系不完善、未知风险挑战严峻等方面。

    受档案领域集中管理模式相关研究的启发,并参考北极世界档案馆的成功经验,本文认为对于需要长期保存的数字档案进行集中代管,特别是对基层档案部门,未尝不是一种可以探索的模式。

    1 北极世界档案馆数字档案长期保存实践

    北极世界档案馆(Arctic World Archive)也称世界数据档案馆,由挪威Piql公司与国家矿业公司合作管理,位于挪威斯瓦尔巴群岛3号矿区,于2017年3月正式投入运营,是一家营利性企业。受世界末日种子库项目的启发,Piql公司希望创建一个超安全的数据仓库来保存全世界的数字记忆。[1]

    1.1 充分利用独特地理环境优势。斯瓦尔巴群岛位于挪威大陆与北极之间,永久冻土带的北极气候以及洁净的空气环境,特别是矿井深处温度常年保持在零下5摄氏度且极其干燥,非常适合胶片的保存。1920年“斯瓦尔巴条约”宣布该地区为非军事区,目前包括中国、美国、英国在内的多个国家都加入了该条约,可以有效避免战争因素的影响。

    1.2 先进的数字胶片存储技术

    1.2.1 胶片直接存储数据。传统档案缩微技术可以用于存储数字档案,《数字档案信息输出到缩微胶片上的技术规范》(DA/T44—2009)对此有详细规定,即使用计算机输出缩微品技术(COM),将数字档案的实际影像记录在胶片上,是一种间接存储方式。

    这种方式存在一些不足:第一,COM技术在将数据转换成影像过程中,会造成数据丢失并破坏数字档案的原始性;第二,对一些特殊数字档案无法记录,如数据库、三维CAD等;第三,存储密度低,难以满足大规模数字档案存储的需要。

    Piql胶片技术的核心是将数字档案的数据转换成超高分辨率的QR(Quick Response,一种二维码),再记录在胶片上,以实现对数据的存储,可以避免对数字档案原始性的破坏,并能存储所有类型的数字档案。

    1.2.2 存储密度高、容错能力强。Piql胶片每一帧超过800万像素,可以实现高密度存储QR,单盒胶片的数据容量可达120G,并使用CIRC(交叉交错里德-所罗门码)和数据分条(在不同的物理帧上保存连续数据)等技术,可以有效减少灰尘、划痕等对胶片的影响,容错能力强。

    1.2.3 存储内容全面。相比于COM技术,Piql胶片存储的数据内容还包括管理和技术元数据、压缩算法、加密算法、文件格式、封装结构等,存储数据内容全面,可以有效保证数字档案完整性。另外,Piql胶片还可以实现数字档案数据与实际影像混合存储。

    1.2.4 保存寿命长、节能安全。Piql胶片由第三方研究机构基于ISO18901、18936、18924标准进行检测,保存寿命可长达500年甚至更久,其胶片容器PiqlBox测试寿命也可达500年。

    1.2.5 免迁移。基于软件环境不断发展的考虑,Piql胶片中还包含如何构建读取器、如何解码数据、解码软件源代码、文件格式描述等资料,以确保将来在高技术环境下,可以通过仿真等技术方法实现对存储数字档案的有效读取,保证数字档案的可用性,实现免迁移。

    1.3 市场发展与效果。北极世界档案馆自投入运营以来,在三年多的时间内已在全世界范围得到广泛认可。

    其中有代表性的合作案例包括:欧洲最大的照片博物馆FratelliAlinari将部分珍贵的历史照片保存于北极世界档案馆,梵蒂冈图书馆将最珍贵的手稿保存于北极世界档案馆,印度高等法院将部分法律文书保存于北极世界档案馆等。2018年3月,上海中信公司与Piql公司开展战略合作,开始拓展国内市场。

    2018年9月2日晚巴西国家博物馆发生火灾,超过2000万件文物历劫,仅有10%的馆藏得以幸存。[2]在此之前,巴西国家博物馆与Piql公司合作的第一期工程已经完成,部分珍贵画作和历史照片制作的数字胶片保存于北极世界档案馆,该部分历史记忆得以幸存。而计划中的第二期工程已无法进行,这是人类文明史上的一次重大损失。

    1.4 北极世界档案馆长期保存成功经验总结

    1.4.1 技术层面可行且可信。技术可行性主要体现为免迁移:胶片寿命可达500年以上,可以确保载体免迁移;通过对数字档案数据、软件环境及读取技术等联合存储,可以确保软件方面免迁移。同时,由第三方机构基于国际标准进行检测认证,确保了技术可信性。

    1.4.2 长期保存成本较低。地理环境优势可以减少管理成本,免迁移优势可以减少迁移成本。

    1.4.3 “一站式”服务理念。针对客户需求量身定制长期保存方案,提供“一站式”长期保存集中代管,为客户彻底解决数字档案长期保存难题。

    1.4.4 成功的市场推广营销。通过与重量级客户合作,极大提高了自身的口碑和影响力,为进一步拓展市场提供助力。

    2 数字档案长期保存集中代管模式的内涵与价值

    2.1 集中代管模式的内涵。本文所构想的数字档案长期保存集中代管模式,是指依托具备资质的档案部门或第三方机构,采用市场化运营模式,在确保长期保存技术、管理等方面可行且可信的基础上,根据托管档案部门数字档案资源特点和长期保存需求,有针对性制定长期保存“一揽子”解决方案,提供“一站式”长期保存服务,确保所存储数字档案的长期可用性。

    相较于分散管理模式,集中代管模式与其最大的区别在于集中,是一种集中存储、集中管理的模式。

    相较于集中管理模式,集中代管模式与其区别主要有三个方面:第一,责权清晰,集中代管机构只负责数字档案的长期保存工作,不涉及所有权和使用权;第二,市场化运营,集中代管模式是一种商业模式,通过收取保存费用实现代管机构自身的良性循环发展;第三,服务对象社会化,集中代管机构的服务对象不仅有国家综合档案馆,还可以进一步拓展到高校、企业、个人等,实现长期保存服务对象社会化。

    2.2 集中代管模式的價值

    2.2.1 有利于纾解目前档案部门的困境。数字档案长期保存管理模式的选择,需要综合考虑不同模式的保管能力和效果是否能够满足社会需求。截至2018年底全国馆藏电子档案127.7万GB,馆藏档案数字化副本1556.4万GB,[3]海量的数字档案资源对档案部门长期保存工作提出了更高要求。

    分散管理模式中技术策略落实、管理体系、未知风险挑战三方面的困境,目前档案部门难以在短期内彻底解决,难以满足日益增长的长期保存社会需求,同时现阶段长期保存工作中的遗留问题,也会对将来造成不可预测的隐患。

    通过集中代管模式,由代管机构充分发挥自身技术和管理优势,专门负责解决数字档案长期保存难题,可以纾解目前档案部门的困境。

    2.2.2 有利于节约社会资源。数字档案长期保存涉及各种资源,包括软硬件资源、库房资源和人力资源等。

    国内有学者提出建立国家层面的数字资源合作保存网络,从经济层面保障长期保存持续发展[4];国外学者基于假设200多家档案馆、图书馆和博物馆共享长期保存系统,对2010年芬兰国家数字图书馆项目(NDL)背景下的长期保存成本效益进行了分析,共享系统在开发、实施、后期阶段的成本效益方面具有显著优势。[5]

    由此可见,相比于分散管理模式,集中代管模式可以减少大量重复建设,有效节约社会资源。

    2.2.3 有利于提高我国档案工作整体水平。长期保存是档案信息化工作的重要内容,是保障档案历史凭证价值的基础。 集中代管模式符合“精减、高效、节约”的原则,不仅可以集中资源以提高我国在数字档案长期保存方面的水平,还可以有效解除档案部门的后顾之忧,将档案部门从艰巨的长期保存任务中解放出来,使其有更多精力投入到档案工作的其他方面,提高我国档案工作整体水平。

    3 数字档案长期保存集中代管模式的关键要素

    3.1 集中代管机构资质认可

    3.1.1 代管机构的综合实力。首先,数字档案长期保存涉及基础设施、技术、管理、人员等多方面内容,要求代管机构必须具备充分的基础条件,并具备完善的长期保存规划、技术策略体系、管理制度体系,确保其能承担数字档案长期保存的重任;其次,数字档案长期保存是一项长期性系统工程,要求代管机构必须能获得稳定的持续投入,综合实力能长期保持稳定并逐步提升。

    3.1.2 代管机构的可靠性。考虑到档案信息的特殊性,尤其是涉密内容,要求代管机构必须具备足够的可靠性。特别是由非档案部门的第三方机构承担,需要对其资质进行严格审查,例如国家档案局在《档案数字化外包安全管理规范》中对外包机构资质和工作人员政治要求方面有明确规定。

    3.2 长期保存技术策略可行且可信

    3.2.1 确保长期保存技术策略的完备性。代管机构根据数字档案长期保存中的载体老化、格式过时等问题,有针对性采用封装、备份、检测、迁移等技术策略,综合形成完备的长期保存技术策略体系,并建设涵盖数据接入层、系统应用层、平台工具支撑层、应用数据层的数字档案长期保存信息系统。

    同时,对既定技术策略的触发条件进行追踪,当技术环境变化符合既定触发条件时,及时启动应对技术策略对所存储数字档案进行相应处置,在技术层面确保数字档案的长期可用性。

    3.2.2 确保长期保存技术策略的先进性。信息技术高速发展使得技术环境不断变化,代管机构长期保存技术策略必须顺应技术环境的变化,以应对未来各种潜在风险。

    首先,对信息技术发展前沿进行追踪,不仅可以对目前技术策略是否会被淘汰进行预警,也可以对将新技术应用到长期保存领域进行可行性论证和风险评估。

    其次,对相关标准体系进行追踪,当标准体系发生调整时,需要对技术策略进行必要调整。

    3.2.3 确保长期保存技术策略的可信性。对于长期保存各项技术策略,应该符合相关技术标准,同时在管理层面制定相应的配套制度,以确保技术策略的可行性和有效性,可以得到档案行政管理部门和托管档案部门的认可。

    3.3 个性化长期保存方案制定。具体的长期保存方案需要综合考虑代管机构的技术策略体系以及托管档案部门实际需求,考虑到两者之间存在差异,这一过程较为繁琐和困难。例如在元数据方面,是由代管机构采用统一的元数据方案进行管理,还是按照托管档案部门的元数据方案进行单独管理,以及后续封装、迁移过程中形成的元数据如何管理,需要充分考虑和协调;再如在封装方面,对托管档案部门已经封装的数字档案,是否需要拆封并重新封装,后续封装标准如何确定,也需要进行协调。

    3.4 市场推广。代管机构应重视市场推广,通过重点样板工程提高口碑,建立良好的信誉,增强托管档案部门的信任,拓展用户形成规模效应以降低单位成本,提高自身竞争力并保持可持续良性发展。在收费标准方面,要兼顧托管档案部门的承受能力,也要考虑到其年度预算可能会调整,可以采用灵活的收费模式。

    4 数字档案长期保存集中代管模式的推进策略

    4.1 完善顶层设计。在政策法规方面,需要国家档案局制定明确的政策法规,从国家层面明确代管机构的资质要求,明晰可以集中代管的数字档案范围;集中代管模式涉及多方利益主体,需要通过相应的政策法规理清各方的权责关系,尤其是托管档案部门和代管机构的权利和义务;需要在组织层面明确档案行政机构与代管机构的关系,明确档案行政机构的管控权责。

    在标准建设方面,目前我国已经制定了一系列数字档案长期保存标准,初步形成了标准体系,但是在系统性、完整性和适用性等方面还有所欠缺,[6]因此需要进一步完善长期保存标准体系建设,为代管机构长期保存工作提供依据和参考模型。

    在认证和评估机制方面,需要建立科学的认证机制对代管机构的既定技术策略进行认证,以确保技术策略可行且可信,在认证模式上可以使用标准模式、管理模式和技术模式,形成认证链条[7];同时在管理体系、运行效果等方面,需要建立配套的评估体系,形成定期和长期的评估机制。

    4.2 建立妥善的保障体系。代管机构的核心工作是维护数字档案的长期可用性,虽然任务较为单一,但仍然需要妥善的保障体系予以支持。在安全性方面,数字档案安全是长期保存的基础,只有确保数字档案的真实性和完整性,才有长期保存的价值,因此代管机构需要使用完备的安全防护技术,确保数字档案的信息安全。在配套资源方面,代管机构需要配置足够的软硬件资源,特别是具备技术能力和知识视野的专业技术人才,才能在信息技术高速发展的环境下,有效应对将来各种未知风险的挑战。

    4.3 积极培育和拓展市场。数字档案长期保存集中代管模式作为一种市场化运营模式,其建设和发展需要积极培育和拓展市场空间,最终通过盈利来实现代管机构的良性循环发展。

    代管机构需要加大宣传和推广力度,可以重点通过打造样板工程来提升在档案业界内的口碑,形成品牌效应培育市场。同时,市场空间也不应局限于档案领域,可以进一步拓展到图书馆、非物质文化遗产保护、社会记忆工程等领域。

    参考文献:

    [1]资料与数据来源于Piql公司官方网站、媒体公开报道、上海中信公司,以及通过电子邮件与Piql公司工作人员进行咨询.

    [2]吴亚雄,蒋波.巴西国家博物馆大火2000多万件藏品仅10%幸存令人痛心[EB/OL]. (2018-09-04)[2020-05-01].http://culture.people.com.cn/n1/2018/0904/c1013-30271621.html..

    [3]国家档案局政策法规研究司.2018年度全国档案行政管理部门和档案馆基本情况摘要(二)[EB/OL]. (2019-09-26)[2020-05-03]. http://www.saac.gov.cn/daj/zhdt/201909/5482cc6929cd4b94b16a135517316d4f.shtml..

    [4]戴艳清.原生数字资源长期保存的经济策略研究[J].图书馆杂志,2010(11): 9-13,+17.

    [5]Keskitalo E-P.Costs and Benefits of a Shared Digital Long-Term Preservation System[J].Liber Quarterly:The Journal of European Research Libraries,2011(01): 69-85.

    [6]肖秋会,高婷.电子文件长期保存格式标准研究[J].信息资源管理学报,2017(02): 81-86.

    [7]钱毅.基于OAIS的数字档案资源长期保存认证策略研究[J].档案学研究,2018(04): 72-77.

    (作者单位:上海大学图书情报档案系? ? 来稿日期:2020-07-26)