云环境中的文件档案管理研究进展及趋势分析

    何思源

    摘 要:数字时代,以云计算为代表的技术变革已成为文件档案管理转型的重要驱动力,越来越多的文件档案将在云环境中生成、存储、利用。本文采用文献调研法,系统梳理国内外相关文献,以期描绘云计算在档案学领域的研究进展及发展趋势。从研究现状来看,当前该领域研究主要围绕“机遇—应用”和“风险—应对”两条主线展开,取得了一定成果,但在理论深度、技术理解、研究视角与方法等方面存在不足。从研究趋势来看,应在实践经验总结与反思的基础上,聚焦风险管控与安全保障、档案机构云服务采纳行为、技术融合应用等领域。

    关键词:云计算;数字文件管理;风险管控

    Abstract: In the digital age, the technological change represented by cloud computing has become an important driving force for the transformation of records management, and more and more records will be generated, stored and utilized in the cloud environment. In this paper, literature research method is adopted to systematically comb the relevant domestic and foreign literatures, in order to describe the research progress and development trend of cloud computing in the field of archival science. As far as the present research situation is concerned, the research in this field is mainly focused on the two main lines of "opportunity-application" and "risk-response", and some achievements have been achieved. However, there are some deficiencies in theoretical depth, technical understanding, research perspective and methods and so on. In terms of research trend, we should focus on risk management and security, cloud service adoption behavior, technology integration and application on the basis of summary and reflection of practical experience.

    Keywords: Cloud Computing; Digital Records Management; Risk Management

    1 引言

    云計算作为可配置计算资源池(如网络、服务器、存储、应用程序和服务),具有按需自主服务、广泛的网络访问、资源共享、快捷的可拓展性、可度量的服务等特点。[1]美英澳等国相继出台“云优先”战略,以支持云计算在政府部门的推广应用。随着政府部门业务系统逐渐云化,海量业务活动数据(含文件)在云端生成、存储,存在失存、失控、失真、失用的风险;同时,文件档案管理部门出于降低建设成本、提高管理效率的考量,越来越多的电子文件管理系统和数字档案馆系统迁入云端。无论文件档案是在云端“被动”生成,还是档案机构主动将其推入云端,云平台已经成为文件档案管理的技术环境。截至目前,国内档案领域的相关综述共有3篇。其中,薛四新和黄萃[2]从数字档案馆和电子文件管理两个角度进行聚类分析;祝洁[3]、颜海和李有仙[4]则运用文献计量对该领域进行主题分析。但前者的聚类较为粗略,而后两者仅聚焦国内成果,未能涉及国外相关研究。因此,本文将采用文献调研法,以上述成果为基础,系统梳理国内外相关学术成果,呈现云计算在档案学领域的研究进展和发展趋势,旨在推动云环境中的文件档案管理研究走向深入。

    2 数据来源

    就中文文献而言,笔者以“云+文件”或“云+档案”为检索词,在中国国家图书馆联机公共目录查询系统、中国知网和中国人民大学学位论文库进行题名检索,检索时间为2019年1月15日,共输出结果141条。在检索过程中,为保证文献质量,首先根据学科领域、期刊层次等,再通过阅读摘要、关键词等方式根据主题契合度进行筛选,最终获得图书3本、期刊论文46篇、学位论文6篇、会议论文3篇。就英文文献而言,笔者以“cloud”或“SaaS”或“PaaS”或“IaaS”为检索词,在Archival Science、The American Archivist、Archivaria、Archives and Records、Archives and Manucripts、Records Management Journal的期刊网站进行篇名检索,检索时间为2019年1月15日,获得8篇期刊论文;以“cloud+record/archive”为检索词,在ProQuest进行主题检索,检索时间为2019年1月15日,获得1篇学位论文。之所以没有将Springer、Elsevier、Web of Science等作为来源数据库,而是选取6本文件档案管理领域的知名国际期刊,是考虑到档案学的“小众”特征,这样有利于获取高相关度的文献。

    3 云计算在档案学领域的研究进展

    任何技术变革都会给文件档案管理带来机遇与风险。两者相伴相随,对于云计算而言,亦是如此。“机遇”往往与新技术应用相关,而“风险”则常常与应对措施和消减策略相对,据此,结合上述文献,以“机遇—应用”和“风险—应对”为主线,可构建用以描述云计算在档案学领域研究进展的分析框架,如图1所示。

    3.1 “机遇—应用”。文件档案管理实践与信息技术的发展密不可分,云计算在社会各领域普及推广的同时,也在档案领域形成了新的应用场景,为档案领域现实困境的破解提供了新的可能。

    首先是基于云架构的“档案云”建设,即“国家或各省市档案局整合现有设施设备,构建全国性、区域性云计算平台”[5]。例如,黄新荣等提出“数字档案馆云建设模式”[6],Jan Askhoj等在识别云环境中文件管理特征的基础上,根据OAIS构建新的云档案系统的分层模型[7],探索“档案云”的系统建设模式及其实现路径。在档案信息化建设过程中,尤其是对中小型档案机构而言,存在“经费投入不均和技术力量分布不平衡”“档案工作者信息化专业性不强”[8]的问题。云计算通过共享基础设施、网络、服务器、系统等,使得档案部门不再需要耗费大量资金用于购买软硬件,系统的部署、运行、维护均由云服务提供商负责,档案部门按需使用、付费即可,有助于解决一定区域范围内档案馆的信息化基础设施和应用软件的持续建设、运行维护和滚动发展等问题[9]。这与多数机构采用云计算的动机吻合,即“降低ICT成本、获取更高的灵活性和可伸缩性以及优化IT基础设施”[10]等。

    其次是云存储和云备份。面向海量数据、实时存取、资源整合、跨平台应用等新需求,传统存储方式存在一定局限[11],而云计算恰好有助于解决存储空间不足的问题[12],保证业务连续性[13]。云计算技术有着海量分布式存储的优势,可通过“云存储”服务的方式和弹性的空间供给以保障用户的按需使用[14]。当发生意外时,也可借助冗余机制和备份能力及时进行灾难恢复。在数字档案云存储构想阶段,刘永[11]提出“云应用、云统筹、云适用、云共享”的建设原则;杨静等[15]基于MVC三层架构,构建了包含显示层、业务逻辑层、数据存储层的电子档案长期保存云存储系统。同时,“云备份作为云存储的特殊应用”[16]得到了档案界的关注和青睐。黄新荣[17]提出“建立全国档案系统私有云、采用分级存储的云备份方案、制定云备份标准、加强人才建设和培养”的备份策略;陶水龙[16]构建了多层次的云备份系统架构,提出“本地磁盘——云存储客户端——云备份服务器”阶段式云备份模式以及多套多地备份机制。

    最后是云共享服务。云计算有助于实现档案信息资源共享,实现易用的信息集成服务[14],提高工作效率,创造价值。通过云计算模式,可以避免“信息资源孤岛”现象的出现,在档案部门之间共同构筑档案信息共享池[5],为电子文件和数字档案“以统一的标准归档迁移和档案信息的资源共享创造了良好的基础条件”[18]。云共享服务包括两个基本层面,一是基于云计算的数字档案资源共建共享,二是基于云平台的开放利用服务。就前者而言,程结晶[19]从框架体系、存储架构、云服务平台、云终端生产流程以及政策与机制等角度提出基于云计算的数字档案资源共建共享新思路;刘洋[20]以黑龙江省档案馆为例探讨了基于“云计算”的档案信息资源共享平台的建设目标、总体设计、系统功能以及实施策略。就后者而言,牛力和韩小汀[21]设计了基于支撑云、业务云和公共云的档案“云服务”平台。此外,还有学者集成上述两个层面,提出“国家档案信息资源‘云共享服务模式”[22]。

    3.2 “风险—应对”。组织机构采用基于“云”的业务开展方式,不是一项技术决策,而是有关信息风险的决策[23]。“如何确保档案信息和数字档案资源的安全是合理运用‘云计算技术的核心问题”[8]“不得使用电子政务云之外的其他公有云存储管理电子文件、电子档案”[24]的规定即是出于安全因素的考量。采用云服务可能面临的风险及其消减策略已成为国内外档案领域关注的共同焦点。

    3.2.1 风险要素分析。政府部门和文件档案管理机构在采用云服务过程中,既会面临云计算在“特权用户访问、法规遵从、数据位置、数据隔离、数据恢复、调查支持、长期可用”[25]等方面的固有风险,也会面临文件档案管理领域独特的管理、技术和法律风险。在综合考量上述两种风险的基础上,可根据风险来源,将其归纳为法律风险、技术风险、服务商管理风险[13]和经济风险,如表1所示。此外,也可根据风险结果将其分为失存、失真、失密、失用等。

    对档案机构来说,上述风险要素是存在优先级的。例如Kirsten Ferguson-Boucher等通过问卷和访谈等方式得出“信息检索与销毁、失去信息控制权和数据保护是信息行业在云环境中最为关注的风险要素”[10]的结论;而Julie McLeod等亦采用调查法,认为“服务的可持续性、满足文件管理要求的能力以及服务的经济可行性”[35]是关注的焦点。

    3.2.2 风险消减策略。从宏观层面来说,主要涉及国家档案行政管理部门。首先,应建立健全文件和档案云管理方面的政策和標准体系,就采购管控、规范合同、服务质量评估、风险防范、退出战略等作出明确规定。[36]其次,国家档案行政管理部门应积极推动文件档案云平台市场的发展[36],强化对云服务商的外部审计和第三方认证[33]。

    从微观层面来说,涉及云服务用户(即采用云服务的文件档案管理机构,下文简称机构)和云服务商。其中,机构是风险消减策略中最重要的责任主体,相关措施主要包括以下几点:一是开展风险评估[29],在采用云服务前,对可能面临的各种技术、法律和管理等风险进行识别,形成风险评估报告。二是完善内部规范,明确需求标准,开展合规管理。机构应建立和完善云使用的内部规范,控制云的采购、规范使用和利用等[36];需求标准即明确云计算环境中,云服务商应具备哪些具体的文件档案管理功能[31],确定信息开放范围[26],这就要求机构根据相关法律、法规、政策、标准构建规范体系,即“文件地图”。三是合理选择云服务商。在选择云服务商时,应对其进行全面、细致的资质审核[30],选择发展成熟、实力雄厚、技术领先、知名度高,尤其是在档案保存和维护方面有突出表现的云服务商[29]。例如,英国和爱尔兰的档案与文件协会(ARA)从价格模型、安全措施、审计安排、信息存储位置等角度对一系列云服务商提供的服务进行了细致的对比分析[37]。四是完善云服务合同。在订立云服务合同时,机构应关注数据所有权和知识产权、数据利用、数据处置和跟踪、数据存储和保存、数据凭证价值和安全、数据存放地点和跨境迁移、云服务合同终止等[27,38-39],同时也要对云服务商的合同履行(包括文件档案管理目标的实现)情况进行监督[30]。此外,还要选择恰当的云部署模式[13],研究新型“云保险”策略[36],设计更为有效的云存储成本模型[35]和电子文件迁移模型[40]。同时,为更好地满足机构需求,云服务商既要形成符合电子文件管理需求的云服务意识[41],也要运用动态身份认证、存取访问控制、RS纠删码冗余容错策略、数据分割与聚合机制保障文件档案的安全[42]。

    3.3 小结。目前,该领域已取得一定成果,关于云计算技术应用于文件档案管理的必要性、重要性和可行性基本达成共识,对于采用云服务的风险及其消减策略研究也已较为成熟。但在肯定既有研究成果的同时,也要看到其局限与不足。

    一是理论深度有待提高。当今社会,新技术层出不穷,给文件档案管理活动造成巨大的冲击与挑战。作为档案工作者,需要透过现象看本质,发现其中的变与不变。具体到云計算,需要思考与本地部署的管理模式相比,云环境中的文件档案管理有何本质不同,这是无法回避的根本问题,但现有研究却鲜有涉及。此外,机遇、应用、风险与对策等均属于应用理论或应用操作层面的研究,几乎未涉及基础理论。在云环境中,来源原则、文件生命周期理论、文件连续体理论等是否面临挑战,是否需要做出修正以及如何修正,是否需要提出新的理论模式,等等,这些问题都有待解决。例如,Geoffrey Yeo曾针对云计算的出现,提出“来源元数据”[43]的概念,但也未能引起学界的广泛关注。

    二是技术理解有限。积极开展新技术研究值得肯定,但“盲目跟风”却不利于学术的成长和发展。自文件档案管理领域引入“云”的概念之后,针对“档案云”、存储备份、共享服务等应用场景进行了一系列研究,但这些研究多数处于“构想”阶段,对云计算的认识不够深入,未能真正理解云计算的概念、原理和方法。云计算是“良药”,但并不万能。例如,许多学者探讨了云共享服务的可能和构想,却不涉及具体的实现路径,若无法在接口、格式等方面满足档案信息资源交换共享的要求,那么真正的“云共享”只能是“空中楼阁”。

    三是研究视角狭隘,主题内容局限。就研究视角而言,当前研究多站在档案行政管理部门或组织机构的视角看待云与文件档案管理,缺乏从云服务商视角审视文件档案管理活动的研究成果;管理和法律视角的研究较多,技术角度的研究较少。就主题内容而言,覆盖范围较广,但深度不足,以“风险—应对”为例,当前研究并未明确指出云环境中的新增风险,缺乏对某种风险的深入分析,也未涉及不同风险相互之间的相关关系;风险消减策略往往泛泛而谈,仅有张宁和朱晓东基于Itrust的研究成果对云服务合同进行深入探索。此外,由于“云”所涉及的技术、服务类型、部署模式多种多样,包括IaaS、PaaS、SaaS以及私有云、公共云、社区云和混合云等,不同的服务类型和部署模式之间存在较大差异,但多数研究只是笼统地探讨“云”,未对其加以区分,进而影响结论的精确度和准确性。

    四是未能有效应用科学的研究方法。部分国外研究通过问卷、访谈等调查研究方法收集数据,进行风险要素分析。但多数国内研究并未采用科学的研究方法,往往基于研究者自身理解,结合国外政策文本或实践现状进行经验性的总结,缺乏对于国情的把握和考量,例如,国外非常重视文件档案的“销毁安全”,但该问题在国内并不突出。无论是使用科学研究方法的成果数量,还是方法运用的规范化程度,都存在较大欠缺。

    4 发展趋势分析

    首先是风险管控与安全保障研究。笔者在调研过程中发现,档案部门最关注的就是“档案是否可以放在‘云(尤其是政务云)中”,折射出档案工作者对云环境安全性问题的担忧。现阶段,各地政府都积极推进政务云建设,促进政务信息资源共享,实现资源的整合、服务的集成,档案部门采用(政务)云服务是大势所趋。但档案中往往含有涉密信息,对安全保密有着极高的要求,使得档案机构在有关“云”的决策过程中顾虑重重。因此,有必要精准识别云计算带来的新增风险,并与本地部署方式进行对比,回答实践部门面临的现实难题。同时,针对新增风险和危害程度较高的风险,强化风险管控措施和安全保障机制的研究。此外,对于“档案是否可以放在‘云中”,也不能一概而论,应在综合考虑档案资源结构、信息化基础、政务云建设现状等因素的基础上科学决策。

    其次是档案机构云服务采纳行为研究。在图书情报领域,已有学者利用各种理论模型对云计算采纳行为进行大量理论和实证研究[44],已取得较为丰硕的成果。具体而言,档案领域的云服务采纳行为研究应包括两个方面,一是影响因素研究,即明晰影响档案机构采纳云服务的激励因素和阻碍因素,可借鉴图情领域相关成果运用定量方法进行实证研究,辅以定性分析;二是推进策略研究,基于上述因素,从“供”和“需”两个维度探索推动档案机构采用云服务的路径、方式、方法。其中,影响因素识别与推进策略研究并非彼此割裂的关系,因素识别的最终目的仍是策略的制定,前者是后者的基础和依据,后者是前者的深化和拓展。

    最后是技术融合应用。云计算与大数据、物联网、人工智能、移动互联、区块链等现代技术之间存在着千丝万缕的联系,档案工作者在部署云服务或研究者在进行学术探索时,应综合考虑多种技术的应用、实施,而非孤立地看待云计算。例如,智慧档案馆建设会同时涉及物联网、大数据、人工智能、云计算等技术,物联网的应用催生了海量数据(大数据),云计算为海量数据的存储和处理提供存储空间和计算能力,人工智能则用于数据分析、实现智慧服务。再如,BaaS(Blockchain as a Service,区块链即服务)的提出意味着区块链将作为一种云服务提供给用户,预示着两种技术的融合。因此,在技术融合的趋势下,如何更好地应用这些技术、有效应对多种新技术带来的风险与挑战,是值得学界和业界共同思考和探索的问题。

    5 结语

    技术变革不仅是数字文件(档案)管理发展演变的“催化剂”,更是档案事业转型升级的重要驱动力。在技术驱动发展的时代背景下,探索云计算等新技术对文件档案管理活动的影响及其与档案领域的交叉融合路径具有重要的现实意义。既有研究围绕“机遇—应用”与“风险—应对”两条主线进行了初步探索,但在理论深度、技术理解、研究视角、主题内容和研究方法等方面仍存不足。后续研究将在充分吸取先前研究经验教训的基础上,聚焦风险管控与安全保障、档案机构云服务采纳行为、技术融合应用等领域,逐步弥补上述不足,推动云计算与档案领域的有机结合,实现档案事业的优化、转型、升级、发展。

    参考文献:

    [1]The NIST Definition of Cloud Computing.[EB/OL].[2019-01-22].https://nvlpubs.nist.gov/nistpubs/legacy/sp/nistspecialpublication800-145.pdf.

    [2]薛四新,黄萃.云计算环境下电子文件管理研究综述[J].北京档案,2011(9):25-27.

    [3]祝洁.我国云计算环境下档案管理研究综述[J].档案管理,2014(5):15-17.

    [4]颜海,李有仙.国内档案领域云计算研究现状剖析[J].信息资源管理学报,2017(1):106-112.

    [5]方昀,郭伟.云计算技术对档案信息化的影响和启示[J].档案学研究,2010(4):70-73.

    [6]黄新荣,王晓杰,段广利等.云环境下我国数字档案馆建设模式研究[J].档案与建设,2013(6):4-7+15.

    [7]Askhoj J, Sugimoto S, Nagamori M. Preserving records in the cloud[J]. Records Management Journal, 2011(3):175-187.

    [8]田雷.“云计算”在档案领域的应用[J].北京档案,2011(5):24-25.

    [9]薛四新,陶水龙,崔伟.数字档案馆云计算建设模式的思考——以北京市区域性数字档案馆为例[J].档案学研究,2012(3):62-64.

    [10] Ferguson-Boucher K, Convery N. Storing Information in the Cloud—A Research Project[J]. Journal of the Society of Archivists,2011,32(2):221-239.

    [11]刘永,刘坤锋.论数字档案云存储[J].档案管理,2013(5):14-18.

    [12]王玉龙.云计算环境下电子文件管理问题的思考[J].北京档案,2012(2):21-23.

    [13]刘越男,马林青.2010-2015年电子文件管理发展与前沿报告[M].北京:电子工业出版社,2016:94-104.

    [14]王志宇,赵淑梅.论云计算环境下电子文件管理工作的发展特点[J].辽宁大学学报(哲学社会科学版),2015(3):108-111.

    [15]杨静,殷建琳.Hadoop云存储技术在电子档案长期保存中的应用研究[J].档案与建设,2015(12):22-25.

    [16]陶水龙.档案数字资源云备份策略的分析与研究[J].档案学通讯,2012(4):12-16.

    [17]黄新荣,谢光锋.云存储环境下的档案异地备份[J].档案学通讯,2011(6):69-72.

    [18]朱悦华,何丽萍,丁建萍.“云档案”信息资源共享系统研究[J].浙江档案,2012(6):52-53.

    [19]程结晶.云技术中数字档案资源共享与管理体系的构建[J].档案学研究,2013(1):66-68.

    [20]刘洋.黑龙江省档案信息资源云共享平台建设研究[D].哈尔滨:哈尔滨工业大学,2016.

    [21]牛力,韩小汀.云计算环境下的档案信息资源整合与服务模式研究[J].档案学研究,2013(5):26-29.

    [22]吕元智.国家档案信息资源“云”共享服务模式研究[J].档案学研究,2011(4):61-64.

    [23]Stuart K, Bromage D. Current state of play: records management and the cloud[J]. Records Management Journal, 2010(2):217-225.

    [24]国家档案局发布第13号令《机关档案管理规定》[EB/OL].[2019-01-22].http://www.saac.gov.cn/daj/xxgk/201810/8515c1f79e904e08aef8bf63dcc9b1f7.shtml.

    [25]Jon Brodkin.Gartner: Seven cloud-computing security risks[EB/OL].[2019-01-22].https://www.infoworld.com/article/2652198/security/gartner--seven-cloud-computing-security-risks.html.

    [26]赵屹.机遇与风险:云计算环境下的电子文件管理[J].档案与建设,2013(10):4-6.

    [27]聂曼影.云环境下的文件档案可信性保障[M].北京:社会科学文献出版社,2018:70,94-106.

    [28]Goh E. Clear skies or cloudy forecast?: Legal challenges in the management and acquisition of audiovisual materials in the cloud[J]. Records Management Journal, 2014(1):56-73(18).

    [29]祝潔.基于云计算的档案信息安全风险及防范策略[J].浙江档案,2017(2):14-16.

    [30]程妍妍.云计算环境下国外政府电子文件管理面临的挑战与实践[J].浙江档案,2016(2):14-17.

    [31]程妍妍.基于云的文件和档案管理问题研究[J].档案学研究,2017(2):35-39.

    [32]崔海莉,张惠达.云计算环境下档案信息管理系统风险分析[J].档案学研究,2013(1):56-60.

    [33]杨巍,李刚.云计算环境下电子文件管理面临的问题浅析及对策[J].档案与建设,2012(11):9-13.

    [34]黄正鸿.云计算在档案信息化领域的应用启示[J].中国档案,2011(5):61-63.

    [35]Mcleod J, Gormly B. Using the cloud for records storage: issues of trust[J]. Archival Science, 2017(2):1-22.

    [36]程妍妍,張茜.国外文件和档案机构云实践调研及启示[J].档案学通讯,2018(3):104-107.

    [37]Cumming K. The Archives and Records Association (ARA) UK and Ireland 2010 Cloud Computing Report and Toolkit Reports[J]. Records Management Journal, 2011(2):165-167.

    [38]张宁.基于文件档案管理视角的云服务合同研究[J].档案学研究,2017(S1):21-27.

    [39]朱晓东.数字档案资源云存储服务中的法律合同问题研究[J].档案学通讯,2017(2):38-43.

    [40]朝乐门.云计算环境下的电子文件迁移模型研究[J].档案学通讯,2013(1):53-56.

    [41]杜梅,蔡盈芳,周文泓.基于云服务的电子文件安全与保密研究[J].档案学研究,2017(S1):28-34.

    [42]王根发,张浩.基于云存储的数字档案馆文件安全保护机制研究[J].档案学研究,2016(2):110-114.

    [43]Yeo, Geoffrey. Trust and context in cyberspace[J].Archives and Records, 2013(2):214-234.

    [44]卢小宾,王建亚.云计算采纳行为研究现状分析[J].中国图书馆学报,2015(1):92-111.

    (作者单位:中国人民大学信息资源管理学院 来稿日期:2019-02-12)