档案管理中电子文件防篡改技术的应用及启示

    师立华

    [摘 要] 科学技术的发展给档案管理工作带来巨大的冲击,尤其面临网络安全风险。随着各项新技术应用的持续优化,产生了多种不同的电子文件防篡改技术,如文件固化、哈希值校验、数字签名、可信时间戳及区块链技术等。这些不同技术类型的出现极大地增强了档案管理中电子文件的安全、完整及可处理性,给当代档案管理工作带来变革式发展。文章首先简单介绍了大数据时代档案管理工作现状,由此深入分析多种新技术的产生、变化及用于档案管理的影响,最后在此基础上总结了多种电子文件防篡改技术用于档案管理的经验,以供相关研究者参考。

    [关键词] 档案管理;档案数据;安全风险;电子文件防篡改技术

    中图分类号:G271 文献标识码:A 文章编号:1674-1722(2021)07-0081-03

    近年来,大数据技术广泛运用于档案管理,促使档案管理工作正式实现电子化。然而,各种档案管理平台的应用及发展效果并不理想,但其中存在的数据信息增长迅速、复杂且面临网络安全风险的情况不容忽视。而随着时代的发展,多种不同的技术随之完善并趋于成熟,用于档案管理当中取得了良好的效果。此类技术被统称为电子文件防篡改技术,对整个档案管理事业发展造成了巨大的影响,切实增强了档案管理的安全性、完整性及可处理性,促使档案管理与时代发展并轨通行,正式迈入全新的发展领域中[1]。

    一、新时代下档案管理中电子文件管理现状

    (一)档案数据增长迅猛,复杂化转变

    大数据驱动下的档案管理平台建设,促使档案信息资源迅猛增长,相应的数据信息量持续攀升。大量的数据信息资源通过数字扫描转变为不同的档案类型,如图片、图纸、照片、影像以及大量数码相机拍摄的各种实物图片,存储大小也在不断增大,再加上多媒体技术的涌入及档案单轨趋势发展,促使档案数据内容、格式及类型等数量越加繁多,档案管理正式达成数据化转变。随着档案数字化的进一步发展,由此呈现出大量的结构化、半结构化及非结构化的档案数据类型,且整体占比持续攀升。可见,档案管理的档案数据格式及类型越来越复杂多样,因此直接对档案管理工作提出了越来越高的要求[2]。

    (二)档案数据传输呈现孤岛效应

    随着各大档案数据管理平台的数据类型和数量不断增大,但随着它们相互间的数据内容传输和共享面临泄密的風险,由此形成档案数据孤岛效应。这种无法实现相互共享的档案数据管理,无法切实满足广大用户对档案信息数据的多样化需求。这种档案信息数据孤岛效应具体是指相关档案管理部门和其他部门间难以达成信息数据的沟通和交流,最终形成信息数据孤岛。再就是各个档案部门间的档案数据平台缺乏必要的关联性,相互间缺乏有效的档案数据交流与整合,无法达成互为信息共享。

    (三)档案数据管理面临安全风险

    档案信息数据安全的重要性不言而喻,在档案全面信息化、电子化环境下,在对档案数据信息资源进行开发和利用的过程当中,所产生的数据内容将有很大概率出现被泄露、丢失及遭受篡改的风险。这类面临安全风险问题的数据,在内容上具体涵盖了数字档案内容、知识产权、个人隐私数据等。而档案数据所面临的安全风险主要源于档案信息数据失真、传输共享泄露、关键信息缺失等。出现信息失真是指在档案信息数据实际传输与迁移过程当中,遭受旁人篡改及出现信息数据无法识别的情况;信息泄密则是指档案数字信息遭受计算机网络病毒(如木马病毒)攻击,直接致使档案信息数据泄露或遭到破坏;而档案关键信息数据缺失大部分是由于存储载体故障所致。

    二、档案管理中电子文件防篡改技术类型及应用

    (一)文件固化管理防篡改技术

    文件固化管理技术是指为了防止文件的内容、结构及相关信息遭受损失,而采取技术手段将该文件转换为只读格式,也是将文件信息内容及格式进行固定的过程。具体在档案管理中电子文件的形成及处理阶段当中,采用文件固化技术来将文件转换为版式文件,能够促使文件内的文字、图形及图像等内容依照相应的规则来进行版面固化,并展现出统一标准的字体、字号及行间距等格式,且不会由于软硬件环境变化而改变。以往档案管理中电子文件固化主要依照国际标准转换为PDF的格式文件[3];后来我国颁发《电子文件存储与交换格式板式文档》,明确了电子文件固化的标准格式为OFD。该格式主要是通过XML及压缩技术所构成的电子文件格式标准。

    文件固化管理技术用于档案管理能够达成对电子文件的全流程管理,通过OFD格式的运用,能够促使多个文件最终聚合至一个文件当中,并且在版本功能上还可保存为多文件形式,从而极大地提升了档案文件归档质量,增强了管理效果。再就是实现了对电子档案的长期保存管理,主要表现为电子文件本身包含相应的格式及自描述内容,具体是借助XML技术将不同数据格式统一打包成电子信息包。再就是电子文件在格式上较为开放、稳定,受到多家厂商支持,并由此开发出了一系列包含OFD格式的编辑器、转换器、阅读器、软件包及生成器等。最后是利用便捷,OFD格式本身支持高速扫描和软件功能识别,能够一件生成专属版式文件,迅速检索和提取其中的文字、图形等信息内容,并且支持页面随机访问,可通过目录导航迅速浏览内容。

    (二)哈希值校验防篡改技术

    哈希值校验技术是一种针对特征值实施校验的算法,其中特征值是指档案管理中电子文件结合某种特定的算法最终核算所得的数值。通俗理解类似于人的指纹验证,因为电子文件特征值具有各不相同、各自独有的特点。因此,采用该技术可通过比较同一电子文件前后特征值的差异来判断去是否遭受缺损、篡改等情况。具体而言,哈希值校验技术也被业内人士称之为信息摘要和散列值,其主要是借助随机字母和数字的形式来组合为特定的长度,且具备独特的比特串。再就是,电子文件进行储存管理操作中,主要是将其与哈希值同步保存。最后在鉴别电子文件是否遭受缺损和篡改时,可采取哈希值实施校验。

    哈希值校验技术用于档案管理能够充分保障电子文件的真实性、完整性,从而极大地缓解档案管理机构在实施档案管理时的工作压力和负担。并且结合哈希值的特性,还可充分证明电子文件一旦遭受篡改,即可直接逆向追查,逐个缓解进行哈希值对比,从而准确判定篡改的位置、手法及具体内容,因此更加方便审查追责。这就给电子文件的真实性、完整性打造出一条完善的、可持续追溯的证据链条,最终极大地加强了电子文件的智能、安全化管理。最主要的是,哈希值技术是整体防篡改技术的核心,它属于后续多项防篡改技术的实现基础。

    (三)数字签名防篡改技术

    数字签名本身是一种电子化数据类型,它和档案管理中的电子文件密切相关。使用数字签名技术主要用于辨别档案管理中文件签署人的身份情况,同时以此来表明签署人真正认可电子文件的内容信息。数字签名技术在应用过程上,主要体现为以下几个方面:1.用于身份认证。数字签名技术是一种签名使用者面向认证方注册登记,申请获得数字证书的全过程。2.签署发送方电子文件。数字签名技术在获取电子文件哈希值后,针对哈希值进行数字签名,因哈希值本身的不可逆特点,因此签名哈希值等同于电子文件签名。3.网络传输。数字签名技术具体是指签署发送方电子文件数字签名后进行封装处理,并最终将签名结果发送至接收方。4.接收方验证。数字签名技术主要是对签名后的电子文件进行哈希值验证。

    数字签名技术用于档案管理,能够辅助档案数据传输时,明确发送方和接收方的身份,且文件内容也将第一时间生效。再就是数字签名技术极大地增强了档案管理中电子文件的真实性、完整性,一旦文件内容被篡改,则必然无法通过文件接收方对签名的验证。最后数字签名技术直接淘汰了传统印章的方式,促使档案文件传输更加规范化[4]。甚至有些数字签名产品本身还具备相应的公章功能,在进行文件打印时,可同步打印出公章内容。

    (四)时间戳防篡改技术

    时间戳技术重点在于保障数据文件的日期及时间信息,其经过加密处理后形成专属的凭证文件。在具体操作上,时间戳的嵌入也是与哈希值相结合,将所收取电子文件的日期结合哈希值特性,生成固定的数字签名。因此,时间戳的形成和数字签名的生成过程较为类似,先是将需要嵌入时间戳的文件以哈希值算法来生成哈希值,然后发送至时间戳服务系统,由此对文件的哈希值添加时间信息,并进行数字签名。

    时间戳技术用于档案管理将发挥出极大作用,主要表现为以下几点:1.可对电子文件时间内容加以明确。保障档案管理中电子文件时间签名真实有效性的同时,还将明确签名的准确时间,促使文件更为有效、权威。2.切實保障电子文件法律效力。档案管理中电子文件的法律效力重点在于如何突显文件本身的原始凭证性。从法律角度分析,一般是要求文件属于原件,则表明文件有法律效力。基于这一点,嵌入时间戳的文件,从内容生成起,就维持完整且未被更改的状态。3.保证了电子文件内容的安全性。时间戳的嵌入,用户上传至对方的文件哈希值并非原件,但文件哈希值得出后无法更改,也不能由此还原文件内容,因此极大地保障了文件安全性、完整性。

    (五) 区块链防篡改技术

    区块链技术在原理是由多种区块严格依照时间顺序来形成有序链接的数据结构,区块本身具备存储和共享数据的功能,在存储上细分为区块头与区块体。其中区块头专门记录区块特征信息,涵盖区块高度、区块哈希值、版本号、前一个区块的哈希值、时间戳等。而区块体则用于对某段时间发生的交互信息进行记录的功能,当区块头和区块体信息进行打包并数字签名后,即可面向全体区块实施网络广播,由此数据交互的所有节点信息都将被记录。考虑到其中存在多数节点同时参与的情况,区块链本身在整个形成过程当中,通常会基于某种共识机制在诸多节点当中选取出最早完成数据打包的节点,并促使其具备区块权限,进而发展成为区块链的下个区块。通常区块链形成后无法更改,一旦进行数据交互,则节点必将对所储存信息实施核实验证,如此发现存在篡改行为,则节点所记录任何数据都将作废,需拷贝正确记录来进行节点交互。

    区块链技术用于档案管理,首先能够实现对其中电子文件的全流程管理,可直接覆盖电子文件生成、保存、传输、整理、归档及利用等全流程环节,在提升档案管理效率的同时,切实保障电子文件管理全程可信。其次,区块链技术能够保证电子文件不可篡改,采用区块链技术保存电子文件,如果有人要篡改文件,则必须修改所在区块所有区块内容,并修改整个区块链网络所有节点备份的内容,这样才能保障内容的一致性,而这一操作基本无法实现。再次,区块链技术可保障电子文件的原始可靠性,使用者只需借助私钥即可查看区块链中电子文件生成的时间、信息等,其不可篡改性极大保障了电子文件内容完整可靠性。最后区块链技术能够有效避免一些电子文件的安全类风险问题产生。

    三、档案管理应用电子文件防篡改技术的启示

    通过对以上档案管理中电子文件管理现状及不同电子文件防篡改技术的应用,给现代档案管理工作发展带来启示,总结为以下几点:

    (一)档案管理工作需始终秉持创新开发及应用先进技术的理念。在档案管理过程中,坚持研发和采用先进技术,不断打破当下问题及面临的工作局限性。(二)档案管理需始终保持纳入新元素的状态。随着科学技术的不断发展进步,往后必然会不断产生各种全新的技术,将这些技术元素逐渐融入档案管理工作中,使之成为档案事业发展的重要驱动力。(三)档案管理工作开展应当全面应用新技术。档案管理工作发展至今,是多种不同的、全新的技术共同作用的结果。因此,需秉持全面应用新技术的理念,通过新技术不断完善档案管理中信息资源的收集、整理、归档及储存等诸多流程,促使档案管理工作向着统一化方向迈进。(四)需持续强化档案管理的全流程监督管理。档案管理工作不仅仅应当切实做好防篡改技术的应用,同时也需对整个技术运用全过程实施监督管理,可以通过研发上线同类系统的方式来达成对档案管理中电子文件管理的全流程管理。

    参考文献:

    [1]李宁.人脸识别技术在个人电子档案管理中的应用[J].北京档案,2020(10):29-31.

    [2]杨桂明,许凤姣.大数据时代电子档案管理现状与发展对策分析[J].档案管理,2020(02):84-85.

    [3]刘倩.浅析数字时代下档案管理数据迁移模式的规范化[J].绥化学院学报,2020,40(03):135-138.

    [4]王玲.信息时代档案管理的优化策略[J].陕西档案,2020(01):49+48.