档案数据化之原生数据源全链式管理分析

    刘永 庞宇飞

    摘 要:本文针对数据时代档案管理面临的数字化和数据化认知问题和服务问题,基于链式管理理论和方法,提出了档案原生数据源全链式管理的数据化管理思路。在深入分析数字与数据、数字化与数据化、超链接与区块链、链式管理与生态链管理等相关概念的基础上,对链式管理理论引入的必要性进行了论证,给出原生数据源全链式网络化管理模式,并对档案原生数据源链式管理的本质、管理要素、管理网络、管理机制和管理流程进行了具体分析。最后,作为原生数据源全链式网络化管理的重要组成部分,提出档案数据化链式服务体系构建的基本构思。

    关键词:档案数字化;档案数据化;原生数据;链式管理;档案服务

    分类号:G206

    Abstract: As to the recognition and service problems of digitalization and datamation in Archives management during data age, based on the chain management theory and method, the paper proposed the data management idea of the native data sources full-chain management. On the basis of in-depth analysis of related concepts such as digital and data, digitalization and datamation, hyperlinks and block chain, chain management and ecological chain management, the necessity of the introduction of chain management theory was demonstrated, and the native data source full-chain network management mode was given, and then specific analysis of the management essence, management elements, management network, management mechanism and management process of the native data sources chain management. At last, as an important part of it, the basic idea of constructing the Archives data chain service framework was proposed.

    Keywords: Digitalization of Archives; Archives Datamation; Native Data; Chain Management; Archives Services

    1 引言

    自上個世纪90年代社会开始进入信息时代以来,信息高速公路、移动互联网和物联网等网络技术迅猛发展,逐渐开启了今天的数据时代,由此也不断催生了可能颠覆许多经典管理理论的现代技术,这些技术包括云计算(Cloud Computing)、大数据(Big Data)、区块链(Block Chain, BC; Distributed Ledger Technology, DLT)、人工智能(Artificial Intelligence)等。新技术的不断涌现和不断渗透社会各领域的同时,日益突显了“数据”的核心地位、核心价值和核心作用。

    目前,各种类型的社会组织的工作活动和各种角色的社会成员的日常生活无一例外地被纷繁多样的各类数据所影响。数据化生存已经逐渐成为人们工作和生活的主流方式。数据时代的适应能力和数据资源的掌控处理能力逐渐成为提升变革与转型发展能力和增强新一轮竞争力的主导因素之一。

    但是,面对这一时代浪潮,档案学研究专注于数字化、大数据等相关研究较多,对数据化现象所带来的数据植根性、记录离散性、实体虚无性、集中困难性、引证认同性、管理跨界性等问题的研究偏少。也就是说,在数据时代来临之际,现有的实体档案管理和档案数字化管理理论与方法,难以解决上述问题,显露出了理论研究指导档案工作实践的局限性。

    可喜的是,档案学界部分学者已经意识到了档案信息管理的基础性问题,需要用数据化思维方式创新档案管理和服务模式。例如,提出从档案数字化向档案数据化转变的思路[1]和提出用数据化技术提升档案管理与服务工作水平[2]等。

    运用数据思维,研究档案管理向数据层迁移的可行模式并开展数据化管理活动,具有适应数据时代的变革需求,提升档案管理工作质量和水平的理论和实践意义。因此,引入数据化思维方式,重新审视档案数据化管理的概念并对其进行深入研究非常必要。本文拟以档案原生数据源全链式管理角度,探讨档案数据化管理问题。

    2 相关概念分析

    为了比较清晰地说明档案原生数据源全链式管理问题,有必要从数据化视角对相关概念进行分析和说明。这些概念包括数字与数据、数字化与数据化、超链接与区块链、链式管理与生态链管理等。

    2.1 数字与数据

    2.1.1 数学领域。数字(number)在数学上主要指自然数,也就是一个自然数的数值字符。在数学上,如果数字带上相应的属性,则可以变成数据(data),而且是数值型数据,例如一个区域的人口数量、一个企业的产品产量等。这个意义上讲,数字、数目、数值等均是对数值型数据的表示方法。

    2.1.2 电子技术和计算机技术领域。电子技术和计算机技术领域,数字(digital)的概念比数学领域的数值概念外延要广。数字在计算机领域主要与模拟相对应,数字相对应的是二进制表示的离散的逻辑量,模拟相对应的是电信号表示的连续的物理量,有数字信号(Digital Signal)和模拟信号(Analog Signal)之分。

    在计算机领域,数字通过位(bits)、字节(bytes)和字(words)描述的不仅是自然数的数值,还包括描述图形符号和字母等一切可表达的事物,即除表示一个区域的人口数量、一个企业的产品产量等,还可表示人口类别和产品质量等等。

    数值型数字带上相应的属性仍然可以变成数值型或逻辑型数据,可以按照数学的方法进行运算。其他类型的数字,如字符型、指针型、备注型和大二进制对象等,赋予相应的属性也能构成各种类型的数据,如一段文字、一幅图片、一段音频和视频等,同样可以用数学或其他方法进行运算和处理。

    在计算机领域,数据是由对现实世界中各种事物,如人物、事件、事实、对象和概念等进行表示、表达或描述的二进制数字构成的。计算机用二进制数字所表达的所有数据符号均包含矢量和点阵两种类型。这个意义上讲,电子技术和计算机技术领域,数据的概念比数学领域的数值型数据概念要广,可以说数据包罗万象。

    2.1.3 图书情报与档案学科领域。在图书情报与档案领域,相关数字和数据的讨论均基于电子技术和计算机技术领域的概念进行的,也就是数字是数据的二进制表示方式。如根据专业特点,将数据分为书目型数据、实事型数据、文献型数据、数值型数据、全文型数据、智能型数据、多媒体型数据等等类型,这些数据均由数字化形式进行表述。但是,许多理论和应用研究中也存在数字与数据、数据与大数据概念的使用不十分严格的情况。

    2.2 数字化与数据化

    2.2.1 档案数字化概念分析

    (1)档案数字化一般认识

    一些学者对档案数字化概念的解读基本上属于实体档案的二进制化加工理念,认为档案数字化是运用计算机数字化技术,将实体档案与数字档案相互转换,并运用信息技术实现系统化、平台化和网络化的输入、存储、保护、检索、输出、利用等管理过程。计算机数字化技术包括数据库技术、数据压缩技术、图像扫描技术等;实体档案包括所有传统介质和非数字化形式的档案材料,如纸质档案、声像档案等[3][4][5][6][7]。

    专家们对档案数字化概念的表述,虽然表达方式上存在细微差异,其共性是强调运用信息技术手段将传统载体档案信息转化为数字档案信息和逆向转化的过程。

    (2)档案数字化涵义分析

    从电子技术和计算技术领域的数字概念角度来看,数字化的概念应囊括数据化的范畴。根据现有档案学研究领域和实际档案工作中的档案数字化解读观点,存在概念偏颇的认识问题。

    现有的档案数字化认知一般基于实体档案材料输入存储和输出显示范畴,对实体档案材料输入转换的解读也是基于档案用户的视听觉需求和直观显示作为出发点进行的。

    数字的显示形态可分为实体显示和虚拟显示两种类型。文档图表等打印成纸质材料,工程设计打印的三维实体模型等都是属于实体输出显示的范畴;显示器和投影儀输出的光学影像,依赖设备输出的音视频等都属于虚拟输出范畴,也可理解为终端输出范畴。

    传统的数字化认知在一定条件下有其合理性。过去很长一段时间,档案的内容、形式与载体统一度较高,内容与凭据关联性和一致性也高。实体档案材料如书面材料、影照录材料等,可以比较容易地按有机联系进行实体化管理。

    实际上,一份材料包含的信息远非书面信息,其载体本身也包含各类特定的和更多的相关有效信息,其载体内容的数字化加工可能会造成部分信息的丢失或者增加无关的信息。传统意义上讲,各种载体的档案材料经过数字加工处理后,能很大程度保留其原始面貌,不会对原始性、凭证性等属性和功能的造成实质性影响。

    值得注意的是,各类职能活动的信息化与智能化的快速演进,许多档案数据难以实体化,也无法进一步进行数字化加工和管理,还有许多信息存在虚拟显示不能全部或无法传递的情况,如场景、气氛、各类支撑数据和程序等,存在诸如CAD、BIM、网页、游戏等生成的有归档价值的关联数据和链接数据难以使用传统方法按有机联系进行实体化管理的现象。另外,因数据广泛链接而产生的数据离散化和无形化问题也导致了档案的内容、形式与载体统一度愈来愈小,内容与凭据关联性和一致性愈来愈低的现象。上述现象导致许多载体类型的档案经过数字处理后,难以保留其原始面貌,对档案原始性和凭证性属性的实质性影响较大。

    可以预见,未来大规模的难实体化档案数据在档案管理体系中将占据越来越大的比重。这种现象的出现所带来的问题是多方面的,如档案收集方面,是否能按实体化收藏档案材料的全部,是否能确定原始记录的位置,是否能确定记录包含信息的位置,是否能保障档案的完整形态等等;档案保管方面,过去长期保存的替代方法,如翻录、迁移等,现在是否还适用;类似的还有集中统一管理原则指导下的物理集中和逻辑集中问题、档案信息安全管理问题、完整准确系统和精炼性保障问题、管理内容与管理凭证的矛盾问题、描述性保存和本体性保存的选择问题等等。这些均是现代档案管理工作所面临的严重挑战。

    面对上述情况,传统思维方式下对档案数字化内涵进行表述,难免出现数字化概念内涵偏窄和外延失泛的问题。面对三维建模、虚拟现实、远程协作、人工智能等应用所产生的数据管理问题,出现数字化和实体化档案管理的困境在所难免。

    重新认识档案数字化概念,应跳出原有思维局限,深入原生数据层,将实体形态或虚拟形态的内容要素和具有归档价值的数据及其应用环境要素加入档案数字化涵盖范围,保证内涵和外延表述的准确性。

    据此,本文认为,档案数字化是运用数字技术,对档案原生数据进行数字处理和描述,以实现数据化和网络化全生命周期档案管理的过程。

    以数据化链式思维和手段管理档案资源,建立档案全链式管理与服务系统,可以深化档案管理服务主体、档案形成主体和档案利用主体的深度交互与协同[8]、增强档案原始性、凭证性保障,以提升档案管理质量与绩效。

    2.2.2 档案数据化概念分析

    (1)档案数据化一般认识

    一些学者对档案数据化概念的解读基本上属于数字档案的矢量化加工理念,认为档案数据化是在档案数字化的基础上,用光学识别(OCR)、语音识别(ASR)等技术对图像、音视频中的数字内容进行全文识别、分类、著录、标引等工作,形成结构化数据,并建立目录数据库、全文数据库和媒体资源库,使档案资源内容为计算机所挂接、存取、调用、更新、分析和处理,使其能用检索词进行检索的过程[9][10][11]。

    也有学者认为档案数据化属于档案的数据格式化的过程,如认为档案数据化是以统一规范的数据格式进行录入转化、节点控制和全程跟踪管理等[12]。

    (2)档案数据化涵义分析

    本文认为,档案数据化管理不仅仅是数字档案的矢量化加工范畴,还包括数据的结构化解析、应用级封装、媒体化组织和全链式管理过程。

    档案数据化既可以认为是档案数字化的延伸,也可以认为是档案数字化的重要构成。按“延伸”理解,在档案数字化解决了包括二进制转换和矢量化转换在内的档案原生数据的处理和描述问题后,档案数据化就是档案数据的结构化解析、应用级封装、媒体化组织和全链式管理过程。按“构成”理解,档案数据化就是档案数字化的全生命周期贯穿始终的档案原生数据管理过程。

    档案数据化管理理念对解决传统意义上档案难以数字化管理和实体化管理的问题提供新的思路,也可以解决档案本体的技术植根性所带来的档案内容、形式和载体的离散化和虚拟化问题。档案数据化使档案原生数据管理由“实体化”管理向“媒体化”管理延伸,由“用户级”数据管理向“应用级”数据管理延伸成为可能。

    按上述认知对档案进行数据化管理,可以突破档案载体形态和载体类型、档案数据输出形式乃至“份”和“件”等存取理念和管理方式的制约,疏通各类活动主体档案管理协作的渠道,减少甚至终结低层次的增量档案数字化加工转换工作,摆脱传统档案数字化和档案实体化管理滞后于各类职能活动的信息化快速推进所带来的不适应性困扰。

    (3)媒体化概念分析

    国际电信联盟(ITU:international Telecommunication Union)下属的国际电报电话咨询委员会(CCITT-Consultative Committee International Telegraph and Telephone)和电信标准部(TSS: Telecommunication Standardization Sector)的ITU-T I.374对媒体给出了类别划分的建议,包括感觉媒体(Perception Medium)、表示媒体(Representation Medium)、显示媒体(Presentation Medium)、存储媒体(Storage Medium)、传输媒体(Transmission Medium)、交换媒体(Exchange Medium)等六类。其中,感觉媒体是对感觉器官产生直接感觉的媒体,如语音、音乐、各种图像、动画、文本等,一般将文本、图形、图像、动画、音频、视频六种感觉媒体称为六种媒体元素。

    档案数据化管理不仅需要关注感觉媒体的管理,还需关注其他五类媒体并将其纳入结构化解析、应用级封装、媒体化组织和全链式管理过程之中。

    (4)应用级概念分析

    信息技术的系统结构一般包括系统硬件层、系统软件层和应用软件层三个层次。系统硬件层是各类设备的物理与逻辑关系和链接,系统软件层是各类系统服务模块操作关系和链接,应用软件层是面向用户的各类应用模块操作关系和链接。

    档案数据化管理角度看,可以把信息技术的系统结构分为硬件系统层、驱动软件层、操作系统层、应用软件层、显示输出层、实体输出层等六个层次。其中应用软件层也就是应用级,是档案数据化管理与服务应着重关注的方向。上文提到传统的档案数字化管理理念,主要是面向显示输出层、實体输出层的操作理念,按照本文对数字化和数据化释义和前端控制理念,档案数据化管理需要在应用层面进行数据处理和管理。

    2.3 超链接与区块链

    2.3.1 超链接概念分析。超链接是包括网页在内的不同媒体和不同站点之间进行链接和跳转的一种程序化的内容组织方式。超链接作为媒体内容的一部分,可以从一个媒体内容指向其他目标媒体或目标媒体内的某些内容。通过超链接将各个网络媒体、站点以及图片和视频等数据链接起来,才能真正构成一个完整的媒体内容并通过媒体浏览工具进行浏览[13]。新媒体与自媒体大量涌现,超链接也在其中大量应用并逐渐成为网络信息传输、获取和服务的主要方式。

    2.3.2 区块链概念分析。区块链技术是一种联网数据库技术,具有去中心化的特征。该项技术利用网络中每个成员都可以成为其中的参与者和记录者所产生的“相互证明、互相印证”功能,从而达到印证某数据块的可靠性的目的。从这个角度上讲,区块链的本质是数据或信息模块化并通过链接关系实现网络上的相互印证,以此产生信用和凭证作用。如果一个“信用”信息块,同时被多个“链接”锁定,则可以构成无法反悔的网络“凭据”。

    区块链起初是以比特币为代表的数字加密货币体系的核心支撑技术[14]。2015年,区块链技术独立出来[15],以其特有的网络凭证特性逐渐被用于需要数据和信息的真实性、可靠性保障的许多场合,如2018年5月29日,百度百科上线区块链功能应用,利用区块链技术的时间戳与共识机制优势,确保百科词条的准确性。

    在档案信息真实性和可靠性保障技术层面上讲,继数字签名技术和数字水印技术等技术之后,区块链技术的引入,为数字档案的原始性和凭证性保障提供了新的技术手段。如果“认同”是“凭证价值实现”的根本的理念得到学术界的认可的话,那么,“网络信用”将可能成为档案原始性和凭证性保障又一重要利器。其基本原理是“网络信用”基于这样一种信赖,这种信赖是取得某数据块在网络上的“广泛认同”,“广泛认同”本身源自网络上的“广泛印证”,而“广泛印证”则源于网络的“广泛链接”。

    2.4 链式管理与生态链管理

    2.4.1链式管理的源起和应用。美国管理学家杰伊·弗莱斯特(Jay Forrester,1918.7.14~2016.11.16)于1961年在美国通用电气公司一个项目中提出了“供应链”概念。美国管理学家迈克尔·波特(Michael E. Porter,1947~)分别于1980年和1985年出版《竞争战略》和《竞争优势》专著,书中均提出了“价值链”概念。荷兰籍管理学家彼得·德鲁克(Peter F. Drucker,1909.11.19~2005.11.11)于1999年出版《21世纪的管理挑战》一书,书中提出了“经济链”概念。管理学界学者们也先后提出了商品链、技术链、空间链、信息链、知识链、创新链和服务链等相关概念,分别从不同的视角研究企业生产经营活动、科技创新活动等社会活动中各活动主体相互之间的链性关系,通过链性关系的挖掘和业务流程再造,即“链式管理”,可以进一步增强组织内部和组织之间的协同性,以达到管理上提质增效的目的[16]。

    链式管理模式首先在企业的管理模式改进和业务流程重组上得以应用。链式管理主要是指在理顺企业各部门相互之间的工作关系的基础上,建立生产链、经营链、考评链等环环相扣的链接关系,并将这些关系按对等、主从、无关、考评等关系进行梳理和组织,形成新的管理体系,使企业生产经营各个环节的职能活动通过链接关系进行协同,共同完成企业的生产经营任务,以达到最大限度提高企业的管理经营效益的目标[17]。

    实际上,任何社会组织内部围绕其主要职能活动都存在各种要素相互之间相互依存和相互制约的链性关系,不管这些关系是隐性的还是显性的,在客观上都是存在的,而且自然界也是如此。如果能将这些链接關系深度挖掘,形成完整的理论和应用体系,并应用于职能活动的优化管理,对提高管理水平和管理质量,促进组织系统目标的达成,增强组织的活力、实力和竞争力,会起到重要的推动作用。

    2.4.2档案原生数据源与全链式管理

    (1)档案原生数据源

    档案原生数据源包括档案原生数据和原生数据源两个概念。就档案的本质属性讲,档案是职能活动直接形成并有存取价值的原始记录。档案原生数据就是这个原始记录的组成部分,只不过记录的粒度是数据,与作为电子文件的记录粒度不同,称为职能活动中直接形成的具有归档保存价值的原始数据[18];原生数据源是指生成原生数据的职能活动关键实体岗位主体或关键虚拟岗位主体。

    这里需要说明的是,传统的档案学理论认为档案作为职能活动的原始记录,通常表现为原件。作为公文来讲,原件就是包括定稿在内的以及定稿前后所形成的与定稿相关的一组有机联系的系列材料所构成的记录。这是看得见和摸得着的实体类型的原始记录所表现的应有形态,具有相对的独立性、直读性和有形性。

    但是,信息技术元素既深深植根于档案的载体和内容之内,又牢牢关联于档案的载体和内容的呈现和管理之外。整体上讲,档案作为原始记录已经无法完全脱离对信息技术的依赖,或无法完全独立于信息技术工具而自成一体。

    很多情况下,离开了信息技术支撑,档案材料根本无法使用,其独立性大打折扣。这样,传统意义上的原件这一形态就因技术元素的植根而变得虚拟化了,原始记录性因档案本体无法独立呈现而逐渐失去自身的可信性与外部的认同性。

    档案本体既然无法脱离技术依附性,就需要拥有和融合技术。档案本体要以原生数据和原生数据源管理为基础,规划和构建更细粒度的档案管理模式,与信息技术无缝衔接和融为一体,共同搭建原始记录的信任体系、凭证体系、认同体系和参考依据体系。本文认为,用全链式管理方法重构档案管理模式和管理体系是解决上述问题的一种理想选择。

    (2)档案原生数据源全链式管理

    由于链式管理主要是对活动主体及其相互之间依存和制约关系的管理,较少考虑对活动客体和活动载体对象的管理,因此不具备全链式管理的属性。

    档案原生数据源既涉及职能活动的各类主体,也涉及档案信息用户主体、系统平台、活动客体和包括档案原生数据在内的活动载体。档案原生数据是档案管理的主要对象,因此,需要对链式管理的理论和方法用全链式管理思维进行改进和应用。

    档案原生数据源全链式管理是指在挖掘档案原生数据形成的平台、主体、客体、载体和用户之间关联关系、依存关系和制约关系等各种关系的基础上,构建档案本体数据层面的链接管理、档案形成单位协同化管理以及档案形成的各类业务与信息平台的接口化管理体系和运转流程,促进原生数据源各职能活动主体和平台的协同、档案数据集合和模块的链接以及管理渠道和流程的畅通的管理模式。

    2.4.3链式管理与生态链管理区别与联系。原生数据源全链式管理与数字档案生态链管理既有区别也存在一定联系。总体上讲,原生数据源全链式管理与数字档案生态链管理存在理论、原理、内容、对象、主体等方面的区别与联系。

    (1)基本理论上的借鉴性

    自1998年以来,20年间关于档案生态问题的研究超过100篇文章,其中档案馆生态问题研究有43篇。另外,研究内容还包括档案业务环节生态学问题、档案生态系统构成要素和构建模型以及运行机制等问题、档案生态环境保护建设问题、档案生态链信息管理机制问题、档案服务生态问题、档案生态链管理效率评价问题以及档案生态综合管理问题等方面。

    部分文章在研究数字档案生态链、信息生态理论在数字档案系统中的应用以及数字档案资源安全、档案服务生态系统问题的过程中,借鉴和引用了链式管理的理论和方法。因此,档案生态链管理不仅仅运用了生态学理论与方法,还借用了管理学中的链式管理理论与方法。

    (2)研究原理上的异同性

    数字档案生态链管理往往依据生态学原理,将数字档案生态特征与生物界的食物网络特征进行匹配,试图在探索数字档案信息主体相互之间的交互作用关系的基础上,建立数字档案网络生态模型,以此改进档案管理的模式和方法。

    原生数据源全链式管理不讨论数字档案生态特征与生物界的食物网络特征以及相互之间的关系,直接从档案信息载体、档案信息内容、原生数据源产生主体与客体以及档案管理主体与客体角度,分析相互之间的在技术和管理、工作流程等层面的关联关系、依存关系、印证关系、业务关系、价值关系、供需关系和制约关系等各类关系。原生数据源全链式管理运用链式管理理论与方法,对档案管理技术、机制、模式进行优化和调整,打通档案信息载体和信息内容、档案管理与原生数据源形成者、档案信息链上下游相关组织机构和档案信息服务对象之间的技术和管理的壁壘,增强技术和管理上的协同性,以实现数据环境下对档案信息资源的有效管理与服务目的。

    (3)研究内容上的关联性

    数字档案生态链管理较少涉及档案信息载体和内容的链式管理问题,原生数据源全链式管理则将该部分内容纳入重要组成部分加以研究。

    档案原生数据源全链式管理以“价值链”为导向,研究档案的形成、管理和服务环境,包括自然环境、社会环境、经济环境、政策环境、技术环境、基础设施环境、资源状态环境、制度保障环境等。数字档案生态链管理则以“生态链”为导向,研究这些环境问题以及环境中的影响因素、文化现象、法律法规现象、信息交流现象、社会网络现象和档案信息消费现象等。两者在研究内容上有一定关联,也存在一定差异。

    (4)研究对象上的统一性

    档案原生数据源全链式管理以原生数据为对象,数字档案生成环节既包括常规的数字化加工生成过程和电子文件生成过程,也包括数字档案管理环境的生成过程。数字档案生态链管理也以原生数据为对象,但数字档案生成环节仅包括数字化加工生成过程和常规电子文件生成过程。

    数字档案生态链管理把现实系统的档案链式管理作为研究的内容偏少且宏观性较强,档案原生数据源全链式管理则将虚拟和现实相互融合的系统全部纳入研究内容体系之中并注重微观层面的设计。

    (5)研究主体上的一致性

    档案原生数据源全链式管理与数字档案生态链管理也有一定的相似之处,两种管理都是基于档案原始信息形成主体、档案信息管理主体和档案利用主体三者之间相互作用的链式依存关系,研究档案管理的共生模式、共享模式、合作模式、协同模式、联盟模式和混合模式等问题。

    3 链式管理理论引入的必要性

    现有的档案管理方式如档案数字化管理方式和档案实体化管理方式,在数据时代存在着一些与技术应用实际情况相脱节或相掣肘的客观问题。这些问题很大程度上阻碍了档案工作的进一步开展,也影响了档案资源的深入挖掘与服务质量,要求档案管理和服务进一步创新发展。本文认为,链式管理理论引入的必要性有以下几个方面。

    3.1 信息技术的植根性促使链式管理。信息技术的植根性体现在数字档案的形成、积累全过程,其制约性不断增强,产生档案本体和档案管理对技术的依赖性不断强化现象。

    首先,档案信息的形成过程大都依托现代的各种信息技术所提供的工具而产生。离开了信息技术工具,许多类型的档案信息就失去了形成的技术手段[19]。从目前的情形看,即使使用其他手段和工具产生的原生信息,其绝大部分也需通过信息技术和数字化手段进行加工和处理,成为数字档案信息源。

    其次,档案信息的管理过程和信息服务过程也离不开各种信息技术应用平台的有效支撑。传统的档案管理方法和手段如果不能适应信息技术环境所提出的各种新的需求和要求,就必须加以改进和优化,否则,档案管理与服务就很有可能被边缘化,从而进一步加剧档案管理与服务的被动局面。

    其三,档案信息的安全与保密工作也与各种信息技术所提供的信息安全与保密策略紧密相连。档案的安全性和保密性在很大程度上依赖信息技术所提供的安全与保密策略的成熟度。

    其四,档案的信息载体和内容多数情况下由信息技术的各类要素在时间和空间上按一定的规则组合、装配、匹配、链接、关联配置而成。物联网、人工智能、大数据和区块链等新一代信息技术的不断涌现、不断成熟和深入应用,档案信息载体和内容的这种信息技术依赖性将会进一步增强。

    总之,信息技术元素已经深深植根于档案本体之中,但通过观察可以发现,“链接”关系是信息技术在档案资源中的重要体现形态。从数字链接形态、数据链接形态、存储链接形态、超文本和超媒体链接形态到区块链形态等均表明信息技术的链接性质。从管理方式上讲,信息存储链接管理、网络地址链接管理、信息节点链接管理以及价值链管理、知识链管理、创新链管理等,均体现了链式管理的广泛应用。将链式管理引入档案管理理论与方法体系,建立全链式档案管理新模式,在数据时代既具有可行性也具有必要性。

    3.2 数据业务的一体性需要链式思维。目前,无纸化和数据化速度不断加快。在建筑设计领域内,BIM技术(建筑信息模型)[20]的广泛应用是一个典型的例子。在生产制造领域内,也逐渐实现了数据化的工作模式,例如复杂装备的三维建模设计,各类实时试验记录等重要内容,几乎全部以数据化的形式呈现和利用,并参与到整体的业务流程运转中。

    数据化的工作方式必然产生只能以数据和数据链接的形态进行管理的记录,由此带来难以进行“实体化”管理问题。因此,档案管理思维方式的转变,建立数据的链式管理思维,实现“实体化”管理向“媒体化”管理的延伸,完成数据及其支撑环境管理的转型就成为必然趋势。

    3.3 档案信息的系统性要求底层链接。传统的档案管理方式,存在深入应用级进行管理的不充分性问题。传统的档案管理模式更注重档案实体和档案信息资源的目标控制、终端控制、静态管理和事后管理开展档案的收集、整理、鉴定、编研与开发利用工作,更多强调存量档案的扫描加工或在线获取有归档价值的目标信息,本质上还属于档案形成的末端控制、顶层设计或输出层设计,没有完全实现前端控制,具有用户层级管理的特点。

    这种方式获取的档案信息资源只是全部档案数据中极小的一部分,对档案内容信息、关联信息和背景信息等缺乏深入的挖掘和管理,从而导致档案数据获取不全的问题,是档案数据资源的完整性、系统性管理的隐患。

    现行的档案管理工作,对新技术应用不断深化,但因数据时代的链式管理思维方式还没有建立起来,相关应用结合度尚显松散,技术应用缺乏实质性效果。因此,档案管理由用户级向信息化低层推进一个层面,进行应用级链接管理,可以在系统较低层获取档案数据,接近数据源并实现交互式收集和管理数据。

    综上所述,在数据时代,档案的信息化管理和专业化管理已经离不开原生数据各个形成单位信息化和平台化的管理活动。档案原生数据源形成部门与档案管理部门的信息化协同已经变得的不可缺少。

    为了提高档案信息资源收集和征集以及档案管理与服务的效率和质量,需要采取全链式管理的方法,优化档案管理流程和档案管理模式,进行一体化设计,以适应信息技术在各行业的平台化应用对档案工作带来的新要求。

    4 原生数据源全链式网络化管理模式构建

    4.1 全链式管理本质。档案原生数据源全链式管理本质是在档案原生数据形成的平台、主体、客体、载体和用户之间建立关联关系,全面构建包括档案本体数据层面的链式管理、档案形成单位协同化管理以及档案形成的各类业务与信息平台的接口化管理等在内的体系化档案管理模式。

    档案原生数据源全链式管理的核心是活动主体和平台的协同、档案数据集合和模块的链接、管理渠道和流程的畅通。

    通过档案原生数据源全链式管理模式的建立,在纵向和横向两个维度,将档案价值链、信息链上下游各纵向节点、各横向节点涉及的相关主体的工作职能活动和各业务环节按照协同化要求,实现工作机构、工作岗位和信息平台的有效关联和原生数据源形成的相互印证,共同构成档案数据原生性内容体系和原始性凭证体系。

    档案原生数据源全链式管理需要建立一套统一的规则,对档案原生数据形成的质量进行流程再造。流程再造包括建立数据集合、数据链接、安全预警、价值评估、反馈优化等内容。

    4.2 全链式管理要素。原生数据源全链式管理所包含的要素包括活动主体、活动对象、活动载体、价值取向、活动目标、人力资源、纵向链接关系、横向链接关系、纵横向约束关系、技术手段和活动内容等。

    4.3 全链式管理网络。在链式管理理论中,管理者将各类管理要素分为节点、链接和关系三个基本要素。节点是管理要素当中的最基本的职能活动计量单元,这一活动计量单元既是一个相对独立的行为主体,又具有一定的职责范围和工作目标;链接主要是节点与节点之间在职能活动中存在的关联关系;关系主要是指存在工作联系的节点之间的链接属性,主要包括对等关系、主从关系、无关关系、考评关系或价值关系等。一个组织的内部各类节点、链接和关系可以组成一个链式网络,这个网络可以称为链式活动关系网络。

    在链式管理的运行模式中,主从关系往往采取领导和指挥管理模式;对等关系往往采取竞争和合作管理模式;无关关系往往采取指导和协调管理模式;考评关系或价值关系往往采取自评和互评相结合的管理模式。

    档案原生数据参与主体和平台相互之间的链式循环是客观存在的。原生数据的形成主体、档案管理部门和档案利用主体相互之间的节点、链接、关系也可以通过依存和制约关系的深度分析,形成档案链式管理网络,建立链式管理工作模式和管理体系。

    4.4 全链式管理机制。档案原生数据源全链式管理的工作机制包括档案形成主体协同机制、档案管理主体协同机制和档案形成平台协同机制三个方面。

    在档案原生数据形成主体内部按岗位职责协同方面,设置兼职档案员负责档案原生数据源全链式管理工作,包括数据集合、数据链接、安全预警、价值评估、反馈优化等工作内容。在档案管理主体协同方面,档案管理部门负责对各形成主体进行档案数据的形成、归档和管理进行协调、指导、监督、检查和评估。在档案形成平台协同方面,建立档案原生数据形成平台内各层次和平台之间的数据生成协同与管理协同。

    4.5 全链式管理流程。建立档案原生数据源全链式管理的工作流程,需要在对档案原生数据形成主体、档案原生数据源形成平台、档案管理部门和档案利用主体进行分析,明确各自的功能定位的基础上,进行程序化设计和运行,包括清单组织、指导检查、质量分析、整改落实、评价备案、归档存储等六个环节。

    (1)清单组织环节

    档案原生数据源涉及的形成主体需要对各自产生的档案原生数据的价值和可信性等质量負责,根据档案的归档范围和保管期限的要求,确定档案原生数据收集和管理的范围并确定其相应的价值,以此建立档案原生数据管理清单,为后续流程的顺利执行提供依据。

    (2)指导检查环节

    档案部门负责档案原生数据形成质量控制的业务指导、监督和检查。档案原生数据源相关责任主体负责对需要归档存储的档案原生数据进行真实性、可靠性、系统性、完整性、安全性和系统性的印证并建立质量印证台账。

    (3)质量分析环节

    相关责任主体针对档案原生数据可能出现的质量问题,根据数据质量要求和可能出现的偏差进行正确性校验和印证,并给出校验分析结果和形成印证分析台账。档案业务指导部门对印证台账和印证分析台账进行处理,提出确保原生档案数据质量的整改工作建议。

    (4)整改落实环节

    档案原生数据形成主体根据档案业务指导部门的整改工作建议,对职能活动和业务平台中所形成的原生数据所存在的质量问题提出具体整改方案并进行实施,改进工作方法和优化业务系统平台,确保档案原生数据形成质量。

    (5)评价备案环节

    档案业务指导部门根据整改工作的进程和结果,对档案原生数据的质量进行评估,分析整改工作可能存在的相关问题,提出进一步整改意见和建议,并将评估结果形成书面材料备案。

    (6)归档存储环节

    档案原生数据形成主体按归档时间和归档范围要求,将高质量的档案数据进行处理并按链式管理要求归档存储。

    5 档案数据化链式服务的基本构思

    5.1 档案数据服务链的概念。档案数据服务链是档案原生数据源全链式管理的组成部分,是以档案管理部门为核心,依托档案链式管理服务平台形成的档案形成者与档案用户之间以档案数据资源为载体的链式供需关系[21]。

    5.2 档案数据服务链的构成要素。档案的数据服务链按链式管理的思维方式,可分为服务节点、服务链接、服务关系、服务机制、服务环境五种要素。

    服务节点主要包括档案原生数据形成者、档案利用者、档案信息平台、档案信息载体等;服务链接是服务节点之间存在的依存关系;服务关系分为主从关系、对等关系、无关关系和价值关系。服务机制是档案数据服务链要素体系的运行方式和运行流程;服务环境主要是指对档案数据服务链起影响作用的自然与社会因素所构成的环境,包括内部因素和外部因素。内部因素包括与制度、机制和体制设计相关的因素;外部因素包括政策因素、人文因素、技术因素、资源因素和时空因素等。这些因素的集合共同构成了服务链运行和管理的动力或约束。

    5.3 档案数据服务链的节点功能与联系

    (1)数据服务链节点功能

    档案数据服务链的节点体系中,节点是关键因素。档案原生数据形成者、档案利用者、档案信息平台、档案信息载体等在服务链节点体系中分别承担不同的角色和功能。

    档案的形成者和档案的形成平台既是档案数据形成和收集管理的对象也是档案数据服务的对象和档案数据处理和发布的对象,是档案数据服务链节点最重要组成部分,其主要功能是数据供应。

    档案管理部门和档案管理平台是档案数据服务链核心节点,在档案数据服务链式管理体系当中起主导作用,主要功能是数据管理与数据服务。档案管理部门在档案数据服务体系建设中,重点依托档案数据服务链管理平台根据数据服务链体系内所链接的服务对象,开展相应的档案数据管理与数据服务。

    档案利用者节点是档案数据服务链的重要服务对象。按照链式管理的基本模式,通过档案数据服务链管理平台,由各类档案数据服务对象在平台之中按照相应的链接关系,进行自组织完善各自节点信息、需求信息并针对档案信息服务绩效进行评价,具有自身数据组织和服务评价功能。

    档案原生数据源链式管理平台,按照信息服务过程中的数据供需变化、服务质量评价等信息服务过程中生成的相关数据,进行档案数据的自组织管理,以满足动态服务需求,具有数据优化和数据支撑功能。

    各类档案数据载体节点,在未来可能包含自组织程序模块,相对独立于信息平台,形成智能档案数据生命体或档案智能体,具有数据自主优化、信息自输入输出和知识问答等微管理和微服务功能。

    (2)数据服务链节点联系

    档案数据服务链各节点的连接方式,根据各自的节点功能分别采取移交接收方式、问答咨询方式、线上下线方式等,各节点按一定方式交叉协同和优势互补,以提升档案数据服务绩效。

    档案数据服务链体系节点数量、种类、质量、技术含量和节点之间链接关系、衔接关系、供需关系和人机交互关系等因素直接影响档案数据服务的复杂程度。这种复杂程度的大小,有利一面是可以增加数据服务的活跃程度,不利的一面是如果链性关系组织不当或协同不力,档案数据服务的效率和质量会因此受到消极影响。

    5.4 档案数据链式服务体系构建。传统的档案信息服务涉及的档案查阅服务、档案展览服务、档案编研服务、档案检索服务、信息导航服务、档案咨询服务、档案社区服务和档案网络服务等服务类型,均可以作为档案数据服务链中的各种服务类型,按全链式管理模式和方法进行节点设计、链接设计和关系设计,以此形成档案数据链式服务体系。

    档案数据链式服务体系功能的发挥程度,取决于档案数据在形成主体和利用主体相互之间数据、信息和知识转移的效率和质量。其中,档案数据资源的质量和数量是基本条件,各类主体相互之间的链接与关系的有效组织和信息技术的有效利用是重要保障,服务绩效的反馈和评估是优化链式服务体系和进行模式改进的重要补充。

    因此,档案数据链式服务体系的建立和运行,需要按照链式管理理论和方法深度挖掘档案数据资源、档案关联主体、档案信息平台和数据知识化转移的机理及其相互之间的作用关系和作用路径,并按照链内链外依存、制约、共享、交互、协作和竞合等理念进行自上而下的详细设计、构建和实施,以提升数据环境下档案信息资源管理與服务的水平、质量与效率。

    6 总结与展望

    档案原生数据源全链式管理既包档案原生信息载体和内容的链式管理问题,也包括档案原生信息形成者和数据利用者以及相关平台的链式管理问题,本文对此仅提出了初步设想和初步探讨。

    还有一些问题值得进一步的研究,如全链式管理模式与现有管理模式对接问题、档案数据资源链接描述问题、档案管理与服务涉及的各种类型主体节点的具体设计和链接关系的具体描述问题、档案原生数据源全链式管理模块设计问题和管理平台构建问题以及链式管理中人机交互问题和管理体系运行保障问题等等。

    对于上述问题的深入研究,会不断丰富档案数据化管理和档案数据化服务研究的内容体系,为数据时代档案管理思维方式的转变和档案管理模式的创新提供更加系统的理论和方法参考。

    本文系国家社会科学基金项目“智慧城市背景下的档案信息化研究(项目编号:14BTQ070)”成果之一。本成果受航空经济发展河南省协同创新中心、郑州航空产业技术研究院、河南航空经济研究中心、郑航研究生教育创新计划的资助。

    参考文献:

    [1]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(02):4-8.

    [2]郑丹妮.基于信息空间理论的历史档案数据化及其生存模式研究[J].档案管理,2018(03):9-12.

    [3]梁惠卿.档案数字化、数字化档案和数字档案概念辨析[J].档案管理,2013(01):38-40.

    [4]李筱春.手段 途径 结果——档案数字化、网络化、信息化三者关系浅析[J].兰台世界,2002(03):4-5.

    [5]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(02):4-8.

    [6]王学平.浅议我国档案数字化建设实践与发展策略[J].档案学通讯,2011(06):54-57.

    [7]屠跃明,翟瑶.档案数字化的元数据研究[J].兰台世界,2012(14):60-61.

    [8]王协舟,王露露.“互联网+”时代档案工作改革的几点思考[J].档案学通讯,2016(05):94-100.

    [9]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(02):4-8.

    [10]田伟,韩海涛.“互联网+”视域下档案信息化建设的四重境界[J].中国档案,2017(10):70-73.

    [11]齐力上,詹锐.树立“数据為王”的档案数字化建设理念[J].浙江档案,2014(02):56.

    [12]程璇,高志宏,胡翔.医院科技档案数据化管理模式探讨[J].医院管理论坛,2008,25(12):62-64.

    [13]吴国柱,李东洋,曾利玲.网络超链接分析初探[J].图书情报工作,2002(11):70-72+42

    [14]袁勇,王飞跃.区块链技术发展现状与展望[J].自动化学报,2016,42(04):481-494.

    [15]潘虹,王子鹏.区块链技术对社交媒体信息归档的应用探究[J].中国档案,2018(06):74-77.

    [16]陈勇.企业链式管理模式的理论研究[J].华东船舶工业学院学报(社会科学版),2004(02):67-70.

    [17]王新华,佟强.工业企业链式管理模式简介[J].煤炭企业管理,2002(01):44-45.

    [18]梁惠卿.原生电子档案概念辨析[J].档案管理,2018(02):27-29.

    [19]江彦. 数字档案生态链信息流转机制研究[D].华中师范大学,2015.

    [20]梅园.BIM应用对档案工作的影响与挑战[J].城建档案,2017(12):19-20.

    [21]娄策群,徐黎思.信息服务生态链功效的影响因素及提升策略[J].图书情报工作,2011,55(04):19-23.

    (作者单位:刘永,郑州航空工业管理学院;庞宇飞,航空经济发展河南省协同创新中心 来稿日期:2018-06-15)