美国电子文件档案馆的建设及其启示

    何芮+刘晓菲

    摘 要:2005年~2012年,美国国家档案与文件署(NARA)开展电子文件档案馆(ERA)建设。ERA参考OAIS模型,保障电子文件真实可靠、永久可读,提供人性化、分享与开放的利用;然而,ERA建设用时长、花费巨大。我国需要汲取美国ERA建设的经验教训,增强对电子文件的信任度,档案馆建设需要加强合作,对电子文件进行集成管理,充分开发利用电子文件。

    关键词:电子文件;档案馆;ERA;OAIS;API

    Abstract:From 2005 to 2012, National Archives and Records Administration(NARA) carried out the construction of Electronic Records Archives(ERA). ERA is the implementation of OAIS model, to make electronic records reliable and permanently readable, to provide humanized and shared use patterns; However, the building of ERA took too much time and money. China needs to learn from the lessons, enhance trust of electronic records, build archives by cooperation, integrated manage electronic records and develop and utilize electronic fully.

    Key words: Electronic Records; Archives; ERA; OAIS; API

    1 美国电子文件档案馆简述

    1970年,第一批电子文件移交至美国国家档案与文件署(National Archives and Records Administration,NARA),NARA开始了对电子文件的管理。随后,电子文件数量爆炸式增长、类型与种类繁多,使得NARA在电子文件管理方面面临着巨大挑战。为应对挑战,NARA启动了“美国电子文件档案馆(Electronic Records Archives,ERA)”项目。

    1.1 ERA建设目的。ERA是以实现联邦机构能够线上执行文件移交过程的数字档案馆项目。“ERA的职能不只是为管理NARA电子文件,还管理文件生命周期和其他事项,如支持文件处置和对联邦文件的接收。同时,ERA不只是保管数据,ERA是在法律和法规框架下提供了一个数字档案馆,支持发生在NARA与客户群体之间的任何业务流程,并通过联机公共检索平台(Online Public Access)为公众提供原本无结构化的电子文件。”[1]

    1.2 ERA建设过程。2005年9月,NARA与洛克希德·马丁(Lockheed Martin)公司签订了一份3亿美元的合同建设ERA,开始了长达数年的合作。

    2007年8月,洛克希德·马丁公司向NARA提交了初始操作能力(Initial Operating Capability,IOC)展望计划,预测2008年可以运营ERA三大功能区,即创建和提交文件保管期限表、请求移交电子文件、移交电子文件。

    2007年9月、2007年11月、2008年6月,NARA分别测试并通过了ERA的三大功能区。

    2008年6月,ERA基础系统(ERA Base)发布,该系统具备了ERA的基本操作功能。

    2011年9月,ERA系统全部上线。

    2012年,基本上达到了全部操作能力(Full Operating Capability,FOC)水平,NARA宣布ERA基本完成。

    1.3 ERA发展趋势。目前,ERA在以下五个方面进行改进,完善系统功能:

    第一,提高电子文件利用率。

    第二,使电子文件提交过程更加流程化、可靠和灵活。

    第三,提高NARA工作人员使用检查工具水平。

    第四,增强ERA系统元数据捕捉、存储和更新能力。

    第五,改进ERA系统架构,以实现更具扩展性、持续性和高性价比的电子文件存储和管理服务。[2]

    2 美国电子文件档案馆的特点

    2.1 ERA参考架构设计:参考开放档案信息系统模型。ERA的参考架构是对开放档案信息系统 (Open Archival Information System,OAIS) 模型的具体应用,为国际参考OAIS模型进行的数字档案馆项目提供了范例。

    ERA参考了OAIS模型,使整个系统不仅包括信息收集、存储等信息工作流程,还包括了外部环境、信息生产者及利用者与信息工作流程的互动,囊括了与信息保存、获取相关的所有主要实体和活动,从宏观上保证数字档案馆系统的合理性。同时,ERA对OAIS模型的应用,成功打破了数字档案馆对传统档案馆模仿的误区,工作内容不再局限于馆藏数字化或者改进利用方式,而是构建了一种“全新”的档案馆。再者,OAIS模型本身就是一个旨在为基于长期保存目的的信息系统建立一个参考模型和基本概念框架,ERA对OAIS模型的应用使其在战略上和实际操作中都体现了一种长期保存的理念。

    根据2016年最新报告,ERA项目组肯定了利用OAIS模型的正确性,认为基于OAIS模型的参考架构实现了可信任数字化保管。[3]

    2.2 电子文件管理方式:保障电子文件真实可靠、永久可读。

    在美国,任何一份文件自生成之日起,就会伴随着一张文件处置表,即SF258。ERA用TR代替了原来针对纸质文件的SF258。TR如SF258一样保证电子文件形成时其过程记录信息也同时形成。同时,典型的TR包括6个选项卡:基本信息、移交详细信息、联系信息、签名信息、相关资产以及附件信息,每个选项卡又包括十几项,通过这种对文件的细致描述保证电子文件真实性,实现对移交文件最大化的控制。

    如前文所述, ERA采用了ISO发布的OAIS模型,该系统强调档案信息系统独立于具体的应用技术,即档案信息可以依赖多种技术,但不是唯一一种技术,任何软硬件成分都是可以更换的,以维护信息系统中数字信息的长期保护和可存取。同时,ERA倡导了以组合为基础的持续目标保存方案。持续目标保存方案要求将文件的内容、背景信息、结构信息和外形特征等元数据提取出来,嵌入到一个正式的模型当中。“模型用XML定义说明,外形特征用XSSL语言加以界定。然后,使用模型中的元数据包裹文件,将其转化为独立于任何特定技术之外的中性格式。”[4]这种转化保障了电子文件永久可读。

    2.3 ERA的利用方式:人性化、分享与开放。这里提到的ERA利用方式,不仅指利用电子文件的群体,还指利用ERA进行电子文件移交的群体。针对两类利用群体,ERA适时调整提供利用方式,满足用户需求。

    2.3.1 指南、网上视频指导移交工作。NARA日益重视电子文件管理指南、工具的研制,如“NARA2014-04:永久保存文件移交的格式指南修订版(2014.01-2017.01)”,[5] “利用ERA对联邦文件常规移交指南”。[6]同时,ERA提供网上培训,文件生成者可以观看视频,了解ERA功能和基础导航,并在一个模拟界面进行试操作。这些措施从动态、发展观点出发,对文件管理权限、管理方式作出了调整,顺应了电子文件管理的特性和需求。

    2.3.2 分享、开放的public API。应用程序界面(Application Program Interface,API)是分享、标准、去中心化、开放、模块化的Web 2.0时代带来的一大创新应用,它不仅给使用者带来价值,还可让站点提供的服务拥有更大的用户群和服务访问量。ERA 除了提供联机公共检索平台之外,还率先创建了公众API(public API)。首先,该平台提供了数量可观的元数据,包括了档案描述性元数据、权威性文件的元数据、公众创建的元数据(标签、转录)、公众账号信息等,除去那些具有隐私性质的文件信息,NARA档案馆藏的元数据都可以在这个平台上获取。其次,用户可以轻松创建账户,参与到利用、再利用、创建数据的过程中,这种参与还包括为自己喜欢的文件信息添加标签。最后,“API使得一方面业务商能够利用及控制属于运营商的一个相对封闭的网络设备环境及其他资源,另一方面业务独立于这些设备而在多厂商设备环境中自由地移植”。[7]这种兼容性满足了不同设备的用户群体。

    3 ERA存在的问题

    根据美国政府问责署2010年报告,ERA项目严重拖延交付时间且花费巨大。2011年9月本为预期完成时间,然而,只有65%的系统工程结束,且ERA项目的花费已经从1.93亿美元飙升到4.33亿美元。[8]在参议员托马斯·卡珀(Thomas Carper)和众议员威廉·克莱拉齐(William Lacy Clay)起草的2010报告中,认为这些都是因为NARA较少使用“挣值管理”(earned value management,以下简称为EVM)。报告指出,NARA仅仅完全完成了一个有效EVM系统所拥有11个最佳实践项目的两项,部分完成了7项,有2项完全失败。NARA没有及时确认潜在成本并作出计划,因此没有及时纠正问题来避免项目延期和花费剧增。

    4 ERA对我国电子文件管理的启示

    ERA存在的两大问题也将成为我国电子文件数字档案馆建设的挑战,我们应制定详细战略规划,将财产管理、风险控制一系列问题考虑周全。同时,ERA给我国电子文件管理以下启示:

    4.1 增强对电子文件的信任度。虽然人们对电子文件与电子档案的发展趋势有着比较一致的认识,但在现实做法上存在着相当大的分歧,普遍存在疑虑和怀疑、犹豫与徘徊。首先,我国没有专门的证据法,而《中华人民共和国电子签名法》第三条又排除了涉及人身关系、不动产权益转让、公用事业服务和其他电子文件的法律效力,《电子文件管理暂行办法》也没有明确规定法律效力。其次,在实际工作中,我国相当多数的政府机关以“双轨制”或“双套制”为长期管理形式或目标管理形式,形成“双轨制”或“双套制”依赖。然而,电子文件时代的到来,使档案工作者面临的不仅是保管实体在载体材料上的变化,更重要的是文件从形成、运作到利用等过程中产生的根本性变化所带来的挑战。事物是不断发展的,档案管理活动也是,只有依据业务需求和事物发展规律,动态性、发展性调整工作方式,才能体现工作的价值。我国在电子文件管理过程中,应增强对电子文件的信任度,确认电子文件接收的法律效力,推动电子文件鉴定思路研究,大力推动电子文件利用工作,找到处理深度与平面、整体与碎片、中心与边缘、时间与空间的平衡点。

    4.2 数字档案馆建设需要加强合作。数字档案馆建设涉及通信、计算机网络、数据库、信息安全等诸多领域,是一项复杂的大型系统工程。ERA在构建蓝图之时已经认识到多方合作的重要性。为了电子文件保存的真实性问题,ERA与InterPARES项目合作,从真实性上定义了电子文件保存的需求,还检查了与电子文件保存相关的技术问题并建立了一个正式的电子文件保存模型。为提供电子文件保存强大的软硬件平台,“IBM 、Sun、Dell等服务商为其运营环境提供支持,EMC以及Net App公司提供存储支持,日立公司提供内容归档平台”。[9]社会非营利机构如在线计算机图书中心为如何解决因特网资源机制等问题提供了意见,其与美国国会图书馆合作,相互促进机构的研究进度和发展规划,建立起了更紧密的合作关系,推动了全国数字化保管系统的研究。

    与ERA建设工作相比,我国数字档案馆建设具有很强的独立性,除去软硬件公司的支持,数字档案馆建设多在档案系统内独立开发,很少与其他政府机构、大学合作,没有充分利用现有资源。我国档案部门应立足长远,关注IT界新产品,为我国数字档案馆建设打下技术基础;汲取图书馆、大学中新思想、新思路,聘请专家为数字档案馆谋布局;建立行政网络与行业协会的跨体系合作,通过定期联席会议,共同承担研究项目等形式,扩大与行业学会、协会、协作组的合作,实现优势互补。

    4.3 对电子文件进行集成管理。ERA系统建设的方方面面体现了集成管理思想。由前文可知,ERA的职能不只是为管理电子文件,还管理文件的整个生命周期和其他事项。同时,ERA系统强调资源的整合,首先是综合应用各种不同的方式、手段和工具,包括借鉴InterPARES、OAIS模型等设计系统标准、模式,引进美国高校最新的技术和理论,与美国国会图书馆协同设定规划;其次,将外部环境和文件生成者和利用者都置于ERA参考架构中,全方位考虑各方利益,最大限度地放大系统功能。这种集成管理的管理理念渗透在ERA建设的方方面面,也是我国电子文件管理的借鉴之处。

    “‘集成管理是一种将电子文件管理集成于电子文件生命连续体之中的全程管理。”[10]在 ISO档案文件管理分技术委员会(ISO/TC46/SC11)召开的第十六次年会中,40 多位代表修订草案时特别提及了文件管理要贯穿文件整个生命周期、嵌入机构职能及业务流程之中的集成管理思想。这种理念在国际电子文件研究项目中已不断得到肯定,如 InterPARES项目。“集成管理”要求我国文档工作者了解和熟悉机构的主要职能及业务工作流程,对流程中各个节点产生的电子文件的情况有预期把握,能从保证文件的真实性、完整性、可用性等角度干预电子文件管理系统设计。同时,我国在电子文件档案馆建设中需要强调资源的整合,将各方资源和优势结合起来,实现优势互补,效用共享。

    4.4 充分开发利用电子文件。如前文所述,ERA提供了人性化、分享与开放的利用方式,为我国树立了榜样。我国应充分开发利用电子文件,以开发利用方式和模式创新为动力,结合网络、Web2.0 工具、媒体平台和手机等工具,开发相应的电子文件“产品”,构建一种政府与其他机构合作、公益性和商业性目的兼具、多利用方式的全新模式;以用户需求为导向,充分考虑到用户检索水平、检索习惯等,为用户提供人性化的利用服务;以技术为保障,开展核心技术攻关,包括“文件格式转换技术、电子文件迁移技术、电子文件封装技术、数字权限保护技术、电子文件防改写技术、电子文件元数据捕获技术和电子文件分布式检索技术”。[11]

    参考文献:

    [1]About the ERA System[EB/OL]. [2016-01-10]. http://www.archives.gov/era/about/.

    [2]ERA Status and Accomplishments[EB/OL].(2013-09-30).[2016-01-10]. http://www.archives.gov/era/about/status-accomplishments.html

    [3]The electronic records archives system and trusted repositories

    [EB/OL]. (2016-01-11).[2016-01-11] http://www.archives.gov/records-mgmt/era/.

    [4]江涛. 美国电子文件档案馆(ERA)对我国电子文件保存的借鉴意义[J].浙江档案,2006(5):60~61.

    [5]NARA Bulletin2014-04[EB/OL].(2014.02.25).[2015-01-10]. http://www.archives.gov/records-mgmt/bulletins/2014/2014-04.html.

    [6]Electronic Records Archives Agency User Manual[EB/OL]. [2015-01-10]. http://www.archives.gov/records-mgmt/era/user-account-guide.pdf.

    [7]冠宙,洪钧.开放API:下一代网络的灵魂(上)[J].电子质量,2002(03):92~93.

    [8]More Problems for NARA's ERA[J]. Information Management 2011 May;45(3):17.

    [9]肖秋会,沈茜.美国电子文件档案馆项目(ERA)进展[J].信息资源管理学报,2012,2(2):91~96.

    [10]杨安莲.聚焦电子文件管理前沿——国际电子文件管理研究热点及启示[J].档案学通讯,2008(6):60~64.

    [11]冯惠玲,刘越男,等.电子文件管理国家战略[M].北京:中国人民大学出版社,2011:108~119.

    作者单位:何芮,中国人民大学信息资源管理学院;

    刘晓菲,中航技进出口有限责任公司

    来稿日期:2016-02-12