关于新技术热潮下在档案领域应用区块链技术的冷思考

    刘洪 罗茜

    摘要:新技术热潮下,区块链作为一项新兴“科技”,它对档案工作产生了深远的影响。文章基于现有区块链技术条件,介绍了区块链技术在去中心化、安全加密、资源共享等方面应用于档案管理领域的优势;论述了区块链在技术层、共识层、制度层三个方面给现代档案工作带来的挑战;阐明了在机遇、挑战并存的情况下应当以乐观、冷静、审慎的态度应对区块链的技术优势及其在档案工作中可能造成的各种风险,以期发挥区块链技术的最大效用。

    关键词:新技术 区块链 档案信息 冷思考

    Abstract: Under the upsurge of new technology, block chain, as an emerging technology, has had a profound impact on archive work. Based on the exist? ing conditions of block chain technology, this paper in? troduces the advantages of block chain technology in the field of archives management, such as decentral? ization, secure encryption and resource sharing. This paper discusses the challenges brought by block chain to modern archive work in three aspects: tech? nology layer, consensus layer and system layer. This paper expounds that in the case of both opportuni? ties and challenges, we should be optimistic, calm and prudent in dealing with the technical advantages of block chain and the risks it may cause in the ar? chive work, so as to give full play to the maximum ef? fect of block chain technology.

    Keywords: New technology; Block chain; Archive information; Cold thinking

一、引言

    近年来,区块链技术在档案归档、存储、电子文件管理及档案信息资源开发、开放、共享等档案工作中的影响越来越大。2017年国家档案局科技项目立项选题指南将“区块链技术在电子档案管理中的应用”列入其中,这标志着区块链技术正式进入档案界的视野[1]。2018年国家档案局科技项目立项选题指南在“电子文件归档与电子档案管理”方面再次将区块链技术列入其中。2020年第十九届国际档案大会将区块链技术作为其面向全球征文和提案的三大主题之一——“信任与证据”的核心技术。由此可见,在档案领域,积极应用新技术既是历史大势也是发展之要[2]。

    区块链技术发端于比特币,本质上是一种去中心化的分布式数据库,分为公有链、私有链、联盟链。区块链技术是支撑比特币的底层技术,它运用密码学将所有涉及比特币交易的信息存储在各区块上以保证总链的正常运作。经过快速地迭代与演进,区块链技术已形成“分布式、免信任、时间戳、非对称加密、智能合约”五大技术特征[3]。美国学者梅兰尼·斯万(Melanie Swan)将区块链技术划分为区块链1.0、区块链2.0、区块链3.0三大阶段。其中,区块链3.0的应用场景最为广泛,它突破了金融应用界限,为各行各业提供去中心化的解决方案,在数据存储、数据鉴证、信息共享等方面具有重要作用。档案领域所运用的区块链技术主要得益于区块链3.0的发展。

二、区块链技术在档案领域的应用优势

    区块链技术具有去中心化、分布存储、安全加密、信息共享等应用优势,是驱动现代档案工作前进的重要力量。如今,诸多档案领域的学者开始研究区块链与现代档案管理的关系,寻求二者之间的契合点,探索档案工作中相关难题的最优解。

    由于国内学者对档案领域区块链的应用研究主要集中在电子文件(档案)上,故笔者将下文提及的所有档案信息默认为电子文件(档案)信息。

    (一)档案信息的去中心化与分布式存储

    “分布式”是区块链技术的五大技术特征之一。传统的区块链服务于比特币,称为比特币区块链。它将比特币交易的所有信息(账单)用特殊的算法(如SHA256等哈希算法)存储在各个区块中,再对区块内部的信息进行整合(利用Merkle trees等)形成完整的數据结构,最后使各区块前后相连形成长链。由于长链上的所有区块都是相对独立的,因此赋予了总链去中心化与分布式存储的特点。参照比特币区块链,我们可以进行“档案信息区块链”的映射研究,如图1所示。

    

    当今社会各行各业每天都会形成大量的信息、数据,区块链可以很好地解决信息存储的问题。档案信息区块链则可以减少电子文件(档案)的存储空间、优化其存储结构,特殊情况下还可以提高档案信息容灾备份的能力。此外,区块链的分布式存储还能实现去中心化的档案信息真实性维护机制[4],为确保档案信息的安全、分布存储提供良好保障。

    (二)档案信息的安全加密

    区块链的安全性体现在其存储的信息和数据不可篡改、可验证、可追溯上。另外,非对称加密、数字签名、时间戳、数字摘要等技术也为其安全性提供了坚实保障。区块链具体结构如图1所示:在各区块中,档案信息通过非对称加密机制签名、打上时间戳、计算哈希值、设置随机数,然后串联成链,环环相扣。这种链式结构决定了总链中任何一个节点上的数据丢失或被破坏都不会影响整体数据的完整性。由于存储在“分布式链状数据库”上的档案信息既互相独立又紧密相关,使恶意篡改、肆意删除难以实现。即使信息、数据丢失还可以通过链上的其他区块来恢复,从而更好地保证了档案信息归档、存储、传输流程的不可逆以及信息内容的真实、可靠,很大程度上解决了档案信息从存储到利用中的安全问题。

    (三)档案信息资源的共享

    目前,区块链主要分为公有链(共三个层级,分别为公有链1.0、公有链2.0、公有链3.0)、私有链、联盟链三种,它们的使用权限、去中心化程度、应用场景等各有不同,见表1。其中,公有链应用场景最为广泛,它面向全部公众,处于完全去中心化状态;私有链应用场景最小,仅面向特定机构或个体,处于内部去中心化、外部中心化状态;联盟链基于共识机制可根据实际需要调整应用场景范圍,面向授权机构或个体,处于半去中心化、多中心化状态。比之公有链、私有链,联盟链对档案信息资源的开放与共享意义更大。

    

    对于区块链技术在档案领域的应用须联系实际,由于我国档案机构总体上分布分散、数量繁多且不存在一个专门负责存储、管理所有档案信息资源的中心机构,因此档案信息资源的分散性问题也十分突出。为了更好地管理、开放、共享这些资源,学界开始探讨各种基于区块链技术的档案信息开放共享模式,其中较为典型的就是将联盟区块链引入档案信息资源共享建设之中。这种联盟链以若干机构或地区为授权单位,在互信共识机制下将各自产生的电子档案(文件)存入总链。联盟链网络中的所有授权节点(单位)都可以随时访问、共享、利用链上的数据。

    由于联盟区块链将原先分散在各单位的档案信息进行了分布存储、集中整合,大大提高了授权单位内部数据的传输、存储、利用效率,从而为进一步探索档案领域信息资源的开放、共享模式提供了重要指导。

三、在档案领域应用区块链技术的冷思考

    新兴起的区块链技术在档案领域的创新特点和应用优势十分明显,但它并不是万能的颠覆性技术,人们在享受其带来优越体验的同时也产生了一些问题,面对这些挑战,我们需要冷静思考。

    从技术层面来说,档案信息区块链去中心化的可实现性、安全加密的可靠性、联盟链的可行性尚未有明确定论。从共识与制度层面来说,档案信息区块链还受到共识信任机制与制度标准等方面的考验。

    (一)技术层

    1.档案信息区块链是否一定“去中心”?经过实践检验,比特币区块链完全可以实现去中心化,但档案信息区块链去中心化建设却受到了一些制约。

    从技术本身来说,区块链还不够成熟。过去十年,区块链的发展从未脱离金融领域,具有起步早、发展晚、金融属性强等特点。与大数据、人工智能等其他新技术不同,区块链技术自带金融属性。金融与区块链的关系好比伯乐与千里马,千里马常有而伯乐不常有。就目前看来,区块链的最佳应用场景当属金融领域。因此,“去中心”归根到底是金融场景下比特币区块链的特点,不能代表所有场景下的区块链都是去中心的。理论上,若在其他行业中使用这种技术,须将其与自带的金融属性剥离开来,但被剥离出来的技术未必能发挥其最大效用。而且,完全拘泥于“比特币区块链”范式,并无多大价值和发展空间,区块链的发展需跳出“比特币区块链”的思维和范式[6]。

    从实际应用来看,目前档案领域的去中心化建设尚难完全实现。近年来,区块链在国内数字档案馆建设中的地位渐渐凸显,“去中心化”的档案管理模式开始进入大众视线。笔者在知网、万方等数据库平台以“区块链+数字档案馆”为检索词进行高级主题检索(截至2020年8月),共得到相关文献(包括硕博论文)9篇,且发表时间全部集中在近3年。通过对相关文献的研究,不难发现我国部分数字档案馆建设虽然已经借助区块链技术,却仍难跳出“中心+分布”的模式,即“中心式数据库+分布式终端管理”。值得一提的是,这种管理模式已在以往“中心+中心”的基础上对档案数据的抓取、清洗、存储、分析进行了相应的优化,但任何事物的发展都难以一蹴而就,需要循序渐进,档案管理模式想要达到“去中心+全分布”,不仅需要技术支持,还需要相关领域的经验支撑。目前档案领域真正实现去中心化的案例并不多,英国的ARCHANGEL项目以DLT(分布式账本技术)为技术支持,通过多方长期努力基本实现了相关数据的共享共治。ARCHANGEL项目的成功给学界提供了相关经验,中国的档案管理领域可以借鉴却不能照搬照抄,这不仅受到技术水平的制约,也与国家宏观制度密不可分。

    因此,笔者认为,或许档案信息区块链能实现“去中心”,但它未必一定是去中心的。至少在未来较长的一段时间里我国档案领域将依旧采用“半中心化”模式。若要打破这种现状,必须积极探索分布式文件系统(IPFS)的建设,提高当前数字档案管理的“去中心化”程度,提升数字资源抓取、清洗、存储、分析的质量。

    2.档案信息区块链是否绝对安全?任何一项新技术的产生都会受到社会各界的质疑,非对称加密、时间戳、数字摘要等技术,随机数生成算法、哈希算法、数字签名等算法,确实是使区块链总体性能安全、链上数据真实的重要保证,但这些技术也并非无懈可击。早在2004年,国内密码学家王小云就以破解MD5密码散列函数等揭示哈希函数(如SHA256)在当今技术大发展条件下的碰撞破解只是时间问题;2016年,NIST在标准随机数发生器算法中内置有后门[7]。此外,即使是在区块链最优场景——金融领域中,比特币矿池依然遭受了外界巨大的攻击量,这说明区块链引入的密码算法及密码协议存在安全隐患。档案信息区块链虽然能借助云存储、混合加密等技术,对结构与非结构数据进行加密管理,可一旦遭遇安全危机(如信息泄露、信息损毁、信息遗失),其造成的损失将是巨大、不可逆转的。

    区块链除本身技术特征、网络攻击等带来的安全问题外,其应用效果因未得到有效验证也造成了一定的安全风险。众所周知,公有链由于其开放、透明度过高,一般机构不予采用。为此,大部分机构选择通过联盟链或私有链来搭建信息资源共享平台。目前尚未有较好的方法来检测这些平台的运行效率与安全性能。例如,曾经炙手可热的R3区块链联盟,由于投入资金庞大但效果不尽人意,如今已辉煌不再。

    由此可知,目前档案信息区块链并非绝对安全,区块链技术的“跨界”运用不仅离不开健康安全的网络技术环境,还需要相关监管平台的介入。

    3.档案信息区块链是否能实现信息共享?区块链强调公开、透明,对数据隐私要求较高的场景并不适用。与比特币交易信息不同,档案信息绝大部分都有相应的密级及保管、公开期限。因此,我们必须弄清楚,档案信息区块链的建设究竟是为了信息的安全保密,还是信息的开放共享。笔者认为,就目前的技术水平来看,档案信息区块链若要兼顾以上两点,道阻且长。

    此外,目前国内研究档案信息区块链的文章并不多,研究基于区块链技术的档案信息资源共享的更是寥若晨星。在理论与技术都略显不足的情况下,檔案信息区块链在协同共享方面或将面临更大的挑战。

    (二)共识层

    区块链3.0强调社会化互信机制与社会治理应用,它表面上解决的是技术性问题,本质上解决的是共识、信任问题。这种共识与信任的“文化”不仅是人与人之间的,更是人与技术、技术与技术之间的。在现有的区块链技术中,有工作量证明、权益证明、拜占庭协议等多种共识机制,每种共识机制的特点和优劣各有不同[8]。区块链共识与信任机制发挥作用的关键是“一致性”确认,它要求总链上的所有节点互相“协作”并进行相应的数据备份,以防数据篡改、网络攻击等问题。

    虽然理论上在档案领域应用区块链是可行的,但在实际应用中“不信任”问题依然突出,即便是ARCHAN? GEL项目也未能完全解决区块链中相关数据的信任问题,这是因为我们很难确保基于DLT电子数据的真实性,而且也无法控制参与者的积极性。此外,当前档案信息区块链的信任还局限于联盟机构内部,各种共识机制仍然属于“中心化”范畴。小范围的“信任”不足以体现区块链的特殊优势,长此以往业界一直追求的档案信息区块链建设只能是流于形式,很难有所突破。

    一般来说,区块链内部是低门槛信任,共识机制又是一切分布式系统正常运行的基础,因此区块链技术内含的“共识”与“信任”处于绝对自信状态。但是,档案领域的职业本能与法规要求,不可能做到绝对的“信任”[9],档案信息资源很难完全透明开放。也就是说,目前档案信息区块链在共识层上面临的是“技术自信”与“行业不自信”之间的矛盾,是在缺乏信任的环境下建立信任、传递信任的矛盾。在这种情况下,业界更需要冷静应对,积极探索社会互信机制的建设路径,形成良好的技术-行业“信任生态”。

    (三)制度层

    近年来,新兴技术如雨后春笋般迅速发展,它们影响着社会生活的方方面面,甚至使档案工作产生了一些深刻的变革。本质上来说,一切技术无论新旧,归根到底都是服务于社会发展的“工具”。要发挥工具效用、解决难题,既需要良好的硬件配置,也需要一定的软件环境。

    就档案信息区块链来说,它的良好运转不仅受到其技术本身的影响,也受到国家体制、法律规范、社会环境的制约。理论上看,档案信息区块链应当是去中心的,不存在核心管理机构或组织,但实际上它仍然跳不出中心化的范畴。根据《中华人民共和国档案法》的规定,我国档案工作必须遵循“统一领导、分层管理”的原则。从这点上来说,档案信息区块链应当是非去中心的,这与该技术的特性相悖。因此,档案信息区块链的推行一定程度上会使我国“统一领导、分层管理”的格局受到挑战。不仅如此,由于我国目前关于区块链技术在档案领域的应用标准及相应的法律规范尚不明确,在相关制度不健全、法律监管有所缺失的情况下,“工具”作用的发挥也必然受到层层制约。因此,我们在追求技术发展的同时更要注重软件环境的配套,只有技术与制度双管齐下,档案信息区块链才能进一步发展,信息共享共治才能成为可能。

四、结语

    档案,承载了人类文明与社会记忆,是当今世界的宝贵资源,建设档案信息区块链既是新技术条件下档案工作创新发展的要求,也是社会前进的需要。但区块链在档案领域的应用并非一帆风顺,目前来看,它更多的是处于理论颠覆而非技术颠覆阶段。虽然区块链具有去中心、安全加密、开放共享等一系列技术优势,但其在档案领域的发展依然受到多方制约。如由于技术不成熟带来的安全风险以及场景匹配不当带来的效益低下等问题。

    由此可知,虽然新技术是社会进步的驱动力,是国家与民族发展的坚实力量,但它绝对不是万能的。在高唱技术赞歌的同时,我们必须辩证地看待各种新技术,必须用乐观、冷静、审慎的态度来剖析新兴技术在档案工作中的实际应用情况,采取更具针对性的应对之策,发挥新技术的最大效用。

    注释及参考文献:

    [1]张珊.区块链技术在电子档案管理中的适用性和应用展望[J].档案管理,2017(3):18-19.

    [2]卢林涛.关于在档案工作中应用信息技术的冷思考[N].中国档案报,2019-03-25(3).

    [3]龚鸣.区块链社会[M].北京:中信出版社,2016:VII.

    [4]刘越男.区块链技术在文件档案管理中的应用初探[J].浙江档案,2018(5):7-11.

    [5][6][7]任仲文.区块链:领导干部读本[M].北京:人民日报出版社,2018:8-9,34,141.

    [8]杨茜茜.基于区块链技术的电子档案信任管理模式探析:英国ARCHANGEL项目的启示[J].档案学研究,2019(3):135-140.

    [9]李高峰,马国胜,胡国强.现阶段区块链技术在档案管理中不可行分析[J].档案管理,2018(5):30-32.

    作者单位:安徽大学管理学院