区块链技术在电子文件管理中的应用特点研究

    武瑛 王为久

    摘? 要:本文基于國内外典型文档区块链项目的系统梳理,从业务需求、应用平台、存储资源和区块链技术等方面进行比较研究,归纳出区块链在文档管理中的应用特点及背后原因,并从技术和管理双重视角对文档区块链项目的发展进行展望。

    关键词:电子文件;区块链;比较研究法;电子文件管理;区块链项目

    Abstract: Based on the systematic analysis of the record blockchain projects at home and abroad, this paper carries out a comparative study on the projects and summaries the characteristics and reasons from the views of business requirements, application platform, storage resources and blockchain technology. Finally this paper looks forward to the development of electronic records blockchain project.

    Keywords: Electronic documents; Blockchain; Comparative study method; Electronic document management; Blockchain Project

    区块链技术在解决多方信任问题中的具有独特优势和作用,受到政府、产业界和学术界的广泛重视。[1][2] [3][4]现有研究认为,区块链去中心化的信任机制和文件真实性任务维护的绑定机制方面具有突破意义,数据一旦上链,在多个节点的共同监督维护下,将实现数据资源的长期保存。[5][6]Victoria作为加拿大不列颠哥伦比亚大学区块链研究小组的组长,指出区块链本质上就是一种文件档案管理技术。[7]

    目前落地的文档管理领域的区块链项目包括三类建设主体,即档案馆、大型企业、公共服务机构。[8]

    本研究从档案馆、企事业单位和公共服务机构三类建设主体中选取7个文档区块链典型项目进行对比研究,归纳建设特点及原因,并对发展方向作出展望。

    1 文档区块链项目概况

    1.1 区块链在档案馆的应用

    1.1.1 Archangel项目。英国Archangel项目启动于2018年6月,是全球首个专门针对档案完整性管理问题所开展的区块链技术及应用研究项目。

    该项目由萨里大学联合英国国家档案馆机构、开放数据研究院等档案与记忆机构协同开展,其目标是通过分布式账本技术保障数字档案长期可用及内容完整。[9]

    该项目通过多个档案机构组建联盟链的方式来实现多方认证,运用非对称加密算法实现档案内容的加密,并将加密后的内容存储在区块链上以实现档案内容的存证和认证。

    除此之外,该项目还探索了工作量证明、权威证明等共识机制以及基于机器学习的哈希算法在档案区块链中的应用。[10]

    目前该项目成果已在由英国、美国、澳大利亚、挪威和爱沙尼亚等5个国家档案馆构建的国际联盟链中得到了应用并取得了不错的成效。[11]

    1.1.2 TrustChain项目。该项目由克罗地亚萨格勒布大学的研究团队完成。该团队采用联盟链的基本架构,对文档的数字签名和部分元数据进行上链保存,以实现数字签名的永久保存和认证。

    TrustChain以区块链上不可更改的方式保存了数字签名有效性信息,既克服了长期保存过程中签名失效、签名更新的弊端,也弥补了仅以元数据来记录数字签名而不对签名进行验证所带来的不足。

    1.1.3 Smart Records项目。Smart Records(智能文件)项目源自美国特拉华州政府启动的“区块链先导计划”。该项目由州公共档案馆牵头实施,其目的是为了更好地识别、收集和保存具有长久历史和证据价值的公共文件。[12]

    该项目分为两个阶段实施,第一阶段是“智能文件”项目,旨在实现文件的存档记录成。第二阶段是“智能UCC文件”项目(Smart Uniform Commercial Code Records),旨在利用区块链取代纸质文件,加快UCC文件的搜索速度,以减少错误和欺诈的发生,削减风险控制成本。此外,该项目还通过智能合约实现了对文件归档和销毁的自动触发,实现了电子文档的自动化管理。

    1.2 区块链在企事业单位文档管理领域的应用

    1.2.1 中国石化“电子文件归档与电子档案管理”试点项目。中国石化的文档区块链项目启动于2018年初,在2019年正式落地应用。该项目的目标是运用区块链技术来解决真实性保障问题和信任问题。[13]

    该项目较为详细地分析了文档管理过程中需要上链的环节以及上链的具体内容和字段,同时,实现了基于云平台实现电子档案的存证验证和通过BaaS的方式对外提供服务。

    1.2.2 深圳先进院基于区块链技术的数据安通宝系统。数据安通宝系统源自中国科学院深圳先进技术研究院的“基于区块链的可信安全数字档案系统构建研究”项目。该系统通过构造基于区块链的分布式、去中心化的数字档案系统,提供不可篡改且能在任何时间点恢复的数据库服务以有效应对突发应急事件。

    该系统的核心要点在于通过共识算法来保证数据存储安全。一方面,对数字档案数据库的操作以交易的方式达成共识,分别储存在区块链节点和本地数据库上,实现了数据的同步存储和数据库的多节点备份;另一方面,通过执行区块链共识数据操作,可以将数字档案数据库恢复到任何时间点。这一方案解决了数字档案易被篡改、确权验证复杂的难题,保障了档案数据的真实性和不可篡改性。

    1.3 区块链在公共服務领域的应用

    1.3.1 台中市小学毕业证书的区块链证书认证平台。我国台湾地区台中市政府与“国网中心”共同运用区块链技术,利用QR Code(内含用户个人识别号码)设计开发了用于验证小学毕业证书的区块链证书检验平台,以保障证书的真实性。

    该项目基于以太坊公有链开发,由市立中学、市立小学、国网中心多方参与构建。项目参照美国麻省理工学院推出的Blockcerts数字证书应用,让毕业生直接通过手机APP领取毕业证书,同时应用QR Code和加密传输机制建立具有隐私性的证书验证平台,共同保障证书的隐私性和真实性。

    1.3.2 北京互联网法院“天平链”。为了保障电子合同、电子发票、电子文章、电子邮件等以文档形式出现的电子证据的真实性,解决由于电子记录易篡改,易变性等导致的存证难、取证难问题,北京互联网法院联合北京市高院、司法鉴定中心、公证处等司法机构,以及行业组织、大型央企、大型金融机构、大型互联网平台等20家单位作为节点共同组建了“天平链”。[14]

    天平链通过区块链的分布式存储以及不可增加、删除、修改的特性,为电子文件的凭证性价值提供了保障。

    同时,天平链选择将电子文档的哈希值而非全部内容上链存证,保障了数据的真实性、完整性和电子证据的隐私性,也能为法律行业的证据文档管理提供参考。

    2 文档区块链项目的比较分析

    本文选择业务需求、应用平台、存储资源以及区块链技术四个视角对上述文档区块链项目进行比较。

    第一,业务需求视角关注区块链在文档管理领域所应对的需求问题,主要考察点聚焦是否满足在电子文件管理的真实性、完整性、安全性和可用性四个方面。

    第二,应用平台视角关注区块链系统所交互的系统平台类型,按照电子文件全生命周期管理的观点,可以将与电子文件相关的系统划分为业务系统(BS)、电子文件管理系统(ERMS)和数字资源长期保存系统(TDR)三类,以此明确区块链的应用场景。

    第三,存储资源视角关注于上链存储的数据对象,Victoria将区块链存储的数据对象分为三种类型——哈希(签名)上链、内容上链和资产上链,[15]通过分析数据对象来明确上链内容。

    第四,区块链技术视角关注区块链系统的技术设计细节,本文依据区块链参考架构,主要分析区块结构、区块链链型、共识机制、智能合约以及底层架构的设计和选择问题。

    2.1 业务需求:区块链应用着重实现真实性认证和完整性保障。前端业务领域主要通过区块链解决真实性问题,中后端电子文件管理和长期保存领域则主要通过区块链技术为电子文件提供真实性、安全性和完整性保障。

    另外,目前区块链主要应用在前端业务系统和后端长期保存系统,在归档环节及在电子文件管理领域的应用相对较少,未来有待进一步探索和应用。

    2.2 存储资源:链上“哈希值+关键元数据”,链下完整数据。目前,文档区块链项目多采用了链上存储哈希值和关键元数据,链下存储完整数据的存储方式。一是因为区块链技术在文档管理中的定位是增强真实性和完整性保障,而并非“数据备份”,哈希上链足够满足功能要求;二是这种方式既能够节省区块链的计算资源,又能确保数据在多节点间同步共识的效率;三是哈希运算的方式能够保障数据的安全性,保护数据隐私。因此“链上哈希,链下内容”仍将是现阶段文档区块链存储架构的主流设计方案。

    2.3 技术选型:依需求而定,以联盟链为主。联盟链是由多个中心控制,由多个权威机构共同分布式记账,共识过程和验证交易过程需要受联盟权威节点控制的区块链平台类型。

    相较于公有链的完全去中心化和完全开放的许可机制,联盟链需要对加入节点进行审核和许可以确保系统的稳定性。因为文档管理工作涉及多权威认证主体,且对安全性和保密性要求较高,因此多采用联盟链的方式进行组织。大型企业,如中国石化因其子公司众多且文档主要在内部流转,为了实现更快的交易速度、更好的隐私保护和更低的交易成本,采用了私有链的方式进行组织。

    2.4 底层架构:以太坊和HyperLedger居多。以太坊和IBM的HyperLedger均是出现较早、较为成熟的企业级区块链应用架构。开发者可以依托其开源平台,快捷方便地开发出适用于自身业务的高性能区块链系统,因此受到很多区块链项目的青睐。

    目前,阿里、腾讯、华为、百度等公司也在开发区块链服务平台,这为国内文档区块链项目建设提供了更多的选择。

    2.5 底层编码:共识机制与智能合约定制化程度高。在共识机制方面。目前在区块链系统中应用的共识机制包括POW(工作量证明法)、POS(权益证明法)、DPOS(股权代理人共识)、PEFT(实用拜占庭容错协议)等多种,在选用时仅需要依据业务需求确定即可。

    在智能合约方面。因为不同系统的业务需求和功能逻辑不一致,因此作为底层自动执行业务逻辑的智能合约也存在较大差异,定制化程度较高。

    目前智能合约还不具备图灵完备性,后续智能合约代码还需要进一步贴合业务需求加以设计。

    3 文档区块链项目的应用展望

    3.1 构建覆盖文档全生命周期的区块链系统。在“BS+ERMS+TDR”三段式的文档生命周期系统链条中,区块链在ERMS领域的应用探索还相对较少,尤其是在归档环节,应采用什么样的数据结构、应如何实现跨系统的对接、应如何发挥智能合约自动化的作用等问题还有待进一步探索和回答。

    3.2 形成规范统一的文档区块结构设计。在由数字化向数据化转型的过程中,文档将更多地以“数据态”的形式呈现。[16]数据化背景下未来的文档区块链将作为基础服务,以BaaS(Blockchain as a Service,区块链即服务)的方式服务于各业务系统。在对组织外提供服务时,文档区块链也会产生与多个区块链系统进行跨链对接的需求,这就需要在底层规定统一的文档区块结构。

    目前各类区块链系统以分散建设为主,区块结构缺乏统一标准,区块链系统也会时常面临成员变更、系统升级、数据更新等风险,系统对接成为难点。因此,需要加强文档区块结构的标准研究。

    3.3 探索灵活高效的跨链融合技术。目前文档区块链系统多面向单一业务、服务于单一主体,未能充分体现区块链的分布式与多方参与的优势。随着区块链技术的深入应用,未来的文档区块链系统必然会与更多系统发生交互以及区块链之间的数据交换,比如国家电网公司就会向其所参与“天平链”中提供交易证据的验证服务。

    鉴于当前跨链技术还不成熟,各区块链之间还是价值孤岛,不同类型的区块链系统由于编程语言、数据字典、智能合约等不一致,实现数据价值互通仍然较为困难。因此,未来需要进一步探索跨链融合的技术,实现跨链业务和数据交互的灵活与高效。

    3.4 打造完备高效的文档区块链治理体系。区块链仅为信任提供了技术保障,而完整的信任体系有赖于技术与管理的双重支持。为了形成健全完善的电子文件信任保障机制,需要打造包含技术与管理的文档区块链治理体系。在技术方面应依据实际文档管理需求来提升区块链与文档管理的匹配程度。管理方面需要从电子文件的“四性”,即真实性、完整性、安全性和可用性出发,提取关键的监管要素,构建科学合理的管理体系。

    参考文献:

    [1]张珊.区块链技术在电子档案管理中的适用性和应用展望[J].档案管理,2017(03):18-19.

    [2]邢变变,杨晗.现阶段区块链技术在档案管理中可行性应用的哲学透视——兼与李高峰、马国胜、胡国强商榷[J].档案管理,2019(02):13-15.

    [3]张晓培.基于区块链的电子档案信息安全防护研究[J].档案管理,2020(04):34-35.

    [4]马仁杰,李梦云.关于区块链技术应用于我国档案利用工作的若干问题[J].档案管理,2020(04):29-33.

    [5]刘越男.区块链技术在文件档案管理中的应用初探[J].浙江档案,2018(05): 7-11.

    [6]刘越男,吴云鹏.基于区块链的数字档案长期保存:既有探索及未来发展[J].档案学通讯,2018(06): 44-53.

    [7]Victoria Louise Lemieux.Blockchain for Recordkeeping;Help or Hype?[R/OL].(2016-10-01) [2020-11-08].https://www.researchgate.net/publication/309414276_Blockchain_for_Recordkeeping_Help_or_Hype.

    [8][9]杨茜茜.基于区块链技术的电子档案信任管理模式探析:英国ARCHANGEL项目的启示[J].档案学研究,2019(03): 135-140.

    [10]赵屹.区块链存证:可信的数字档案馆——英国ARCHANGEL项目及启示[J].兰台世界,2020(02): 16-20+24.

    [11]刘越男,张一锋,吴云鹏,郑翀.区块链技术与文件档案管理:技术和管理的双向思考[J].档案学通讯,2020(01): 4-12.

    [12]Delaware Office of the Governor.Governor Markell Launches Delaware Blockchain Initiative[EB/OL]. (2016-05-02)[2020-11-08].https://www.prnewswire.com/news-releases/governor-markell-launches-delaware-blockchain-initiative-300260672.html.

    [13]李春艷,乔超.区块链技术在大型企业集团电子文件管理中的应用——以中国石化为例[J].档案学通讯,2020(01): 13-20.

    [14]北京互联网法院.天平链介绍[EB/OL]. (2018-09-09)[2020-11-08].https://tpl.bjinternetcourt.gov.cn/tpl/.

    [15]Victoria Louise Lemieux.A typology of blockchain recordkeeping solutions and some ref lections on their implications for the future of archival preservation[C/OL].(2017-11-11)[2020-11-08].https://www.researchgate.net/publication322511343_A_typology_of_blockchain_recordkeeping_solutions_and_some_ref lections_on_their_implications_for_the_future_of_archival_preservation.

    [16]钱毅.从“数字化”到“数据化”——新技术环境下文件管理若干问题再认识[J].档案学通讯,2018(05): 42-45.

    (作者单位:武瑛,国网江苏省电力有限公司无锡供电分公司;王为久,北京大学光华管理学院,中国人民大学电子文件管理研究中心? 来稿日期:2020-11-10)