基于数字档案长期保存的元数据需求及建设策略研究

    吴申艳

    摘 要:元数据与数字档案资源长期保存具有密不可分的关系。通过分析元数据在数字档案资源长期保存过程中对其真实性、完整性、安全性、可获取性的维护及数字档案资源长期保存对元数据的关键要求等内容,提出基于数字档案资源长期保存的元数据建设策略。

    关键词:元数据; 数字档案资源; 长期保存; 策略

    Abstract:Meta-data and long-term preservation of digital archives resources has a close relationship. It is convenient to find the gap between meta-data research and digital resources long-term preservation of the construction project through introducing the function of meta-data in the long-term preservation of digital archives resources and how those program demand. Thus we put forward the value of meta-data description function, sensitive information and so on.

    Keywords: meta-data digital archives resources long-term preservation

    引言

    数字档案资源的长期保存既要求确保数字档案资源的长期存储,也要求保证数字档案资源的永久获取。元数据作为描述数据的数据,其本身以及与其相关的技术是数字档案资源长期保存的关键,因此基于数字档案资源长期保存的元数据研究就显得尤为必要。为了更好地利用元数据满足数字档案资源的长期保存需求,相关学者提出了保存元数据这一概念并开展了以保存元数据为核心的项目研究,比如PREMIS和METS等,这些项目的开展可以推动元数据更好地解决数字资源长期保存过程中涉及的管理、技术问题等,为本文探讨数字资源长期保存的元数据建设策略提供了借鉴。

    1元数据在数字档案资源长期保存中的作用

    1.1维护数字档案资源的真实性。档案是真实的历史记录,因此维护数字档案资源的真实可靠是数字档案资源长期保存过程中的重中之重。元数据可以通过建立与数字档案资源真实性相关的元数据结构来保证数字档案资源的真实性[1],即在数字资源形成和使用阶段描述与记录数字资源及与之相关的责任者、业务过程、法规、时间、人员使用行为等信息,并在描述与记录这些相关信息的同时通过数字签名将其与数字档案资源固化为一体,进行封装保存,从而起到说明与保证数字档案资源真实性的凭证作用。

    1.2维护数字档案资源的完整性。元数据对数字档案资源的监管贯穿了数字档案资源的整个生命周期。因此,为了保证数字档案资源的内容、结构和背景信息均没有缺损,它可以持续动态地记录和保存用户对数字档案资源的使用行为,包括对数字档案资源的编辑、复制、删除等[2]。形成的这些元数据记录不可更改和删除,与数字档案资源绑定在一起,因此数字资源保管单位可以通过这些元数据记录说明所收集、长期保存的数字对象完整性及其变化情况,特别是在接受保存、提供利用前后的完整性变化。

    1.3维护数字档案资源的安全性。元数据可以通过对权限、版权、使用过程等方面信息的保存和描述来限制和监管相关人员对数字档案资源的传输和使用行为,从而实现维护数字档案资源安全性的目的。比如,通过权限的控制可以避免数字档案资源内容的泄露和损坏、通过版权的控制可以促进数字档案资源规范化的运转、对与使用过程有关的信息的记录和保存便于有效追责,形成对相关人员的约束等。

    1.4维护数字档案资源的可获取性。为了维护数字档案资源的可获取性,一方面,元数据可以通过不断完善元数据元素尽可能达到对数字档案资源的全方位描述,保证数字档案资源的准确性。比如,随着社会维权意识的增强,与权利信息、技术信息有关的元数据元素被不断加入到元数据保存框架中[3]。另一方面,通过建立元数据框架抽取数字档案资源中有关于数字档案资源标示符、创建日期、结构类型、复杂对象技术结构、文件描述、已知系统要求、安装要求、存储信息、查找搜寻工具和提取方法、存取类型等方面的元数据单元并将其封装在一个数据包中,例如,OAIS就将数字资源对象和与它们相关的元数据纳入到AIP之中,这些元数据不是直接和数据束缚在一起,就是和系统有逻辑联系。通过类似于AIP这样的封装数据包,与数字资源有关的存放在存储介质中的物理数字信息,数字资源的保存数字格式与处理信息,数字资源的生成处理、利用环境,数字资源的内容校验、身份验证、版本演变、知识产权管理机制等都能得到完整的保存及再现,从而实现数字档案资源的长期存取。

    2 数字档案资源长期保存对元数据的要求

    2.1 标准化。统一规范和统一标准主要是指在数字档案资源长期保存过程中,元数据元素的选取、元数据保存框架的建立等必须标准化、规范化。元数据标准化是数字档案资源进行长期保存的必然要求,能够保证数字档案资源在环境频繁变化的情况下保持其真实性、完整性、可用和安全。例如,档案信息包唯一标识符的构成规则若是没有规范的标准,那么与唯一标识符相关联的档号、题名、编码、档案信息包等要素就很难去定位、识别和解析,从而增加了数字档案对象的长期保存的难度。因此,数字档案资源对元数据的标准化要求很有必要。

    2.2易于捕获。易于捕获是指元数据要便于获取,即数字档案资源长期保存所需要的元数据不依赖于人工添加,可以较大程度以自动捕获的方式从系统、数字资源本身、其他描述记录等目標对象获取。这种自动生成的元数据一方面可以有效保证数字档案资源的真实可靠,另一方面也可以提高数字档案资源长期保存项目的效率水平。