后疫情时代抗疫数字档案资源整合

    周耀林 刘梦颖 杨文睿 费丁俊

    摘? 要:进入后疫情时代反思发现,抗疫数字档案资源还处于一个分散管理的状态,有待于系统地进行整合。本文从多个方面简要论述了抗疫数字档案资源整合的动因、内容及方法,旨在通过科学、系统地整合抗疫数字档案资源,为政府公共卫生决策提供参考。

    关键词:抗疫数字档案;资源整合;后疫情时代

    Abstract: After entering the post-epidemic time, it has been noted that the anti-epidemic digital archives resources are still in a state of decentralization and need to be systematically integrated. This article briefly discussed the motivation, content and method of the integration of anti-epidemic digital archives resources from multiple aspects, aiming to provide a reference for governments public health decision-making by integrating the anti-epidemic digital archives resources scientifically and systematically.

    Keywords: Anti-epidemic digital archives; Resources integration; Post-epidemic time

    进入后疫情时代,[1]档案部门如何建设抗疫数字档案资源,如何整合这类档案资源,为公共部门服务,为政府公共卫生决策提供参考是迫切需要考虑的问题。

    1 抗疫数字档案资源整合动因

    整合抗疫档案资源,就基于抗疫档案资源自身的特点和后疫情时代外部环境的变化两个方面的考虑。

    1.1 内因:抗疫数字档案资源的特点

    1.1.1 抗疫数字档案资源具有分散性。由于疫情防控工作的复杂性和动态性,抗疫数字档案资源在来源、内容和载体形态上具有明显的分散性。

    在来源方面,数字档案资源牵涉主体和来源途径多,碎片化特点显著,保存在不同机构,例如政府部门、医疗卫生部门、企业、档案馆及图书馆等;在内容方面,抗疫数字档案不仅包括疫情本身的信息,还涉及到不同视角下不同主体在抗疫过程中形成的信息[2];在载体形态方面,不仅包括医疗数据库和统计系统等结构化数据,还包括网页、图片和多媒体等非结构化数据,[3]且分属于不同平台或系统,呈现分散管理的特征。

    1.1.2 抗疫数字档案资源具有动态性。动态性主要体现在抗疫数字档案资源的形成过程及其内容上。抗击疫情是一个动态发展的过程,其应对和处置有不同的阶段,因此抗疫数字档案资源的形成过程也具有阶段性、动态性特征。

    同时,不同于常规档案形成时的规律性和周期性,疫情的动态发展使得新的数据不断产生,部分数据被更新替代,所以档案内容也具有动态性。目前借助5G、大数据、人工智能和区块链等技术可以对抗疫数字档案资源进行实时补充、更新和修正,从而反映事件发展变化的全貌,有利于拓展认知、靠近真实。

    1.1.3 抗疫数字档案资源具有公共性。疫情防控工作的总体性和全民性决定了抗疫数字档案资源具有公共性特征。一方面,抗疫数字档案资源是党、国家、社会组织以及人民在抗击疫情过程中形成的真实记录,是中国智慧、中国力量的体现,具有极大的公共价值。另一方面,数字时代构建了参与式信息领域,开放互动的网络平台使得人人都能记录抗疫过程中社会和个人的活动,抗疫数字档案资源不再是档案部门控制主导的单一主体资源,而是广大群众共同参与构建的记忆。抗疫数字档案资源的这些特征增加了其分类整合的困难度和复杂度,也凸显了整合共享的必要性和紧迫性。

    1.2 外因:后疫情时代社会环境的变化

    1.2.1 公共文化机构服务方式向线上转变。移动互联网的普及和抗击疫情的需要使得无接触的在线化服务浪潮兴起,公共文化機构的服务方式迅速从线下转为线上。档案馆、图书馆、博物馆等文化事业机构纷纷将服务拓展至网络并创新服务内容。

    例如,沈阳市档案馆将档案应用数据库与移动客户端相连,推出了线上超媒体档案文化产品《印象沈阳》,拓展了公众在线了解档案文史的方式。疫情导致的公共文化服务方式的变化影响了人们的文化生活方式,档案馆应整合好抗疫数字档案资源,丰富并创新在线服务的内容和方式,积极应对线上服务的趋势。

    1.2.2 公众数字文化需求持续增长。保持社交距离的防疫方式使公民生活方式和文化习惯发生改变,导致其数字文化需求急剧增长。疫情期间很多知名博物馆例如中国国家博物馆、三星堆博物馆等通过直播的形式实现了在线开馆,累计吸引近千万人次在线参观。

    同时,人们对与疫情相关的信息抱有很高的关注度,各地纷纷推出抗疫专题展,吸引了众多市民捐赠抗疫实物、参观展览。档案馆将抗疫数字档案资源收集整合后反馈给公众,可以满足公众的数字文化需求,重视人文关怀,建构有温度的集体记忆。

    1.2.3 数字记忆建构需要逐渐凸显。中国人民抗击疫情的伟大历程是一项值得建设的记忆工程,而收集整合抗疫数字档案资源是建设前提。

    档案馆作为记忆机构的主体之一,承担着守护社会记忆的责任,在信息时代更是顺势成为数字记忆项目的主要承担方,[4]在此环境下,档案馆利用信息加工组织能力将抗疫数字档案资源整合,是在为构建抗疫数字记忆打下坚实基础。

    正是因为上述原因,抗疫数字档案资源整合成为后疫情时代档案工作中不可缺少的基础性环节。对抗疫数字档案资源进行整合有利于这些档案资源长期保存,从而挖掘其中的深层价值和效益,不仅能为疫情时代的抗疫工作消除信息孤岛,而且有助于为今后类似的公共卫生事件提供服务和参考。

    2 抗疫数字档案资源整合内容

    2.1 整合主体。抗疫数字档案资源的主体是一切直接或间接参与抗击疫情活动的承担者和执行者,[5]包括政府部门、科研机构、医疗机构、企事业单位、社区、新闻媒体乃至个人。

    抗疫数字档案资源整合需要对这些参与的多元主体进行整合,各主体之间不应各自为政,要厘清主次关系,确立多元合作模式,通过“一核多元”的社会协作模式发挥社会群体力量共同促使异构资源整合目标实现,[6]充分发挥各个主体的优势,明确各个主体的责任地位。

    第一,确立档案部门作为后疫情时代抗疫数字档案资源整合的核心力量。在疫情暴发初期国家档案局就发文要求将档案工作纳入防控工作的总体部署,将疫情防控档案应收尽收、应归尽归,[7]各地档案馆、企事业单位档案部门、高校档案馆等应充分发挥自身优势,主动承担抗疫数字档案资源整合的重要责任。

    第二,联合博物馆、图书馆等文化事业机构进行资源共享。除档案馆之外,博物馆、图书馆等单位也在向社会各界收集征集抗疫资料。[8]按照《中华人民共和国档案法》第十八条规定,[9]档案馆应主动与其他文化机构保持交流和合作,形成资源互补,共同做好抗疫记忆建设工作。

    第三,倡导公共部门、行业协会和公众积极配合参与,协同做好抗疫数字档案资源整合的顶层设计工作、资金支持、技术支持和人才支持等工作,搭建专门的整合平台。

    最后,公众是抗击新冠肺炎疫情过程中最直接的参与者、目击者,他们在社交媒体上的记录为抗疫数字档案资源建设提供了新的视角,如多名视频博主通过实地探访用镜头记录下武汉封城后的状况。将公众纳入整合体系有利于丰富数字档案资源内容,拓展数字档案资源价值。

    2.2 整合客体。整合客体是整合主体施动的对象,是整合活动的核心内容,整合客体的完整程度、内容的丰富程度直接影响着整合工作的安排。[10]数字档案资源整合客体的内容是指将分散的抗疫档案及相关技术、人员等资源进行重组,达到资源有效配置的目的。[11]

    整合客体所包含对象包括散落在各处的抗疫档案资源、标准规范和信息技术等。[12][13]

    3 抗疫数字档案资源整合实现

    抗疫数字档案资源整合是一个从资源获取到内容整合、信息重构、知识发现和价值应用的连续过程,涉及到使用多种信息整合技术对多源异构的数字档案资源进行一体化处理。[14]

    在明晰了抗疫数字档案资源整合内容的基础上,本文将从项目借鉴、整合流程及实现策略三方面讨论如何实现抗疫数字档案资源的整合。

    3.1 项目借鉴。GitHub开源项目2019nCovMemory是专门记录新冠肺炎疫情的记忆项目,它收录了两类记忆并持续更新。

    一是可信赖的媒体或公众号上与疫情有关的新闻报道、纪实作品。

    二是微信公众号上发表的亲历者的个人叙述,旨在提供一个供网络用户和研究人士取用资料的资料库。[15]GitHub上还有一些类似的开源项目,如记录疫情进展的2019-nCoV时间线、新冠病毒防疫信息平台,但目前均处于网页无法打开的状态。

    3.2 整合流程

    3.2.1 数据整合。数据整合就是基于数据的抗疫数字档案资源整合,即对多源异构的抗疫数字档案资源,即纸質档案数字复制品、数字资源两个层面的资源进行采集和预处理,实现逻辑或者物理上资源实体的聚集,解决多源异构数据互联和共享困难问题。[16]

    对于资源采集工作,可以采用使用率很高的Heritrix以及HTTrack工具进行。[17]对于数据资源预处理,可以借助一些ETL工具,ETL是指从数据源抽取数据出来,进行清洗加工转换,最后加载到数据仓库中,以供分析处理和数据挖掘使用。[18]

    3.2.2 信息整合。数据整合只是实现了抗疫数字档案资源的简单叠加,将资源汇集到了一起,而信息整合是在数据整合的基础上揭示数据资源之间的关联,对抗疫数字档案资源进行组织和重构。

    抗疫数字档案资源进行信息整合的重要工具是借助“语义网”技术,语义网技术中的关联数据能够解决非结构化、半结构化数字档案资源语义异构问题,实现数字档案的关联和整合。

    在规范并统一信息描述标准的基础上,利用关联数据技术建立抗疫数字档案多维语义关联框架,实现异构数字档案资源的关联聚合和语义化组织。[19]

    最后,采用RDF链接聚合机制自动在不同的信息单元之间建立各种关系,以静态RDF/XML文件形式发布关联数据[20], 实现异构资源无缝性整合。

    3.2.3 知识整合。知识整合是在信息整合的基础上通过数据挖掘、知识抽取等技术,不断发现抗疫数字档案资源中的隐性知识和深层价值的过程,这一过程旨在实现知识发现和价值应用。

    档案部门可以借助可视化技术呈现抗疫数字档案资源内容,挖掘、分析、构建、绘制和显示其中各个要素的关联关系,通过构建知识图谱模型实现抗疫数字档案资源的深层次整合与共享。

    可以借鉴的有Allhistory.com网站的AI知识图谱核心引擎技术。该网站实现了时空化、关联化的方式构造及展现历史知识间的关联,具有以时间节点为索引的知识信息组织、自然语言处理和时空地图绘制功能。[21]

    数据整合、信息整合及知识整合反映了抗疫数字档案资源一体化程度的高低。[22] 数据整合关注的是异构资源的共享互通、数字档案资源实体之间的逻辑关联和语义组织和数字档案资源的内容进行了深度分析等三个层次。

    这三阶段层次鲜明,密不可分,通过这种层级递进式的数据处理方式,能够实现抗疫数字档案资源的有序化、组织和体系的优化,在资源整合和服务协同的基础上最终实现抗疫数字档案资源的共建共享。

    3.3 实现策略

    3.3.1 基于资源外部环境做好顶层设计。2019nCovMemory项目经验告诉我们抗疫数字档案资源的整合过程具有长期性和复杂性特点,应做好顶层设计工作,自上而下统筹规划。即给予整合工作政策支持、打造主体协作的局面、搭建公共平台等。

    3.3.2 基于资源内部特点做好资源建设。资源整合工作的重点策略在于保证资源采集的全面性、整合标准的规范性以及整合技术的可行性。包括推动资源全面采集、保证整合标准的规范性、确保整合技术实用可行三个方面。

    4 结语

    “人类能在这场病毒和生活的赌博中,赢得的全部东西,就是知识和记忆。”[23]抗疫过程中产生的数字档案资源记录了政府工作人员、科研工作者、医护人员、社区工作者以及普通民众等不同角色的使命与担当,是不可或缺的记忆载体,能够为记忆建构提供资源基础。将抗疫数字档案资源整合的理念和方法落到实处,是当前国家政策层面上需要优先考虑的问题之一。

    *本文是教育部人文社会科学重点研究基地重大项目“大数据资源规划理论与统筹发展研究(16JJD870001)”研究成果之一。

    参考文献:

    [1]新华网.习近平的2020·六月:“后疫情时代”彰显“中国策”[EB/OL]. (2020-07-14)[2020-08-02]. http://www.xinhuanet.com/politics/xxjxs/2020-07/14/c_1126236129.htm.

    [2]周耀林,杨文睿,姬荣伟,丁玲.基于群体智慧的抗疫档案资源库建设研究[J].档案学研究,2020(02): 4-11.

    [3]张卫东,左娜,陆璐.数字时代的档案资源整合:路径与方法[J].档案学通讯,2018(05):46-50.

    [4]冯惠玲.数字记忆:文化记忆的数字宫殿[J].中国图书馆学报,2020,46(03): 4-16.

    [5]胡莹.论东巴古籍文献保护主体及其整合[J].广西师范大学学报(哲学社会科学版),2018,54(05): 1-7.

    [6]牛力,赵迪,韩小汀.“数字记忆”背景下异构数据资源整合研究探析[J].档案学研究,2018(06): 52-58.

    [7]中华人民共和国国家档案局.国家档案局关于做好新型冠状病毒感染肺炎疫情防控期间档案工作的通知[EB/OL]. (2020-02-07)[2020-08-08]. http://www.saac.gov.cn/daj/tzgg/202002/fd8abfed55c54443a8a71214fbe42e5d.shtml.

    [8]搜狐网.诉说抗疫记忆,征集电子版抗击新冠肺炎疫情资料启事[EB/OL]. (2020-04-22)[2020-08-09].https://www.sohu.com/a/390076539_805974.

    [9]中国人大网.中华人民共和国档案法[EB/OL]. (2020-06-20)[2020-08-09]. http://www.npc.gov.cn/npc/c30834/202006/14a5f4f6452a420a97ccf2d3217f6292.shtml.

    [10]唐义,肖希明,周力虹.我国公共数字文化资源整合模式构建研究[J].图书馆杂志,2016,35(07): 12-25.

    [11]陈慧,王晓晓,南梦洁,安小米.数字档案资源整合与服务过程中的隐性知识分类——以赋能思维为视角[J].图书与情报,2019(06): 118-124.

    [12]赵红颖.图书档案资源数字化融合服务实现研究[D].吉林大学,2015.

    [13][17]黄新平,王萍.国内外近年Web Archive技术研究与应用进展[J].图书馆学研究,2016(18): 30-35+19.

    [14]周耀林,常大伟.国家重点档案信息资源融合及其实现策略研究[J].档案学研究,2018(02): 14-20.

    [15]码云.2020新冠肺炎记忆:报道、非虚构与个人叙述[EB/OL].[2020-08-08].https://gitee.com/dark.H/nCovMemory#%E5%B7%A5%E5%85%B7.

    [16]肖希明,唐义.国外多领域数字资源整合研究进展[J].中国图书馆学报,2013,39(04): 26-35.

    [18]中国专业IT社区.几款开源的ETL工具及ELT初探[EB/OL]. (2018-08-06)[2020-08-10].https://blog.csdn.net/juceli/article/details/81448224.

    [19]王志宇,熊华兰.语义网环境下数字档案资源关联与共享模式研究[J].档案学研究,2019.

    [20]刘爱琴,刘洁,尚珊.基于知识集成的LAM数字资源整合模型设计[J].图书馆学研究,2018(04): 73-79.

    [21]全历史[EB/OL].[2020-08-10].https://www.allhistory.com/.

    [22]趙生辉,朱学芳.图书、档案、博物数字化服务融合策略探析[J].情报资料工作,2014(04): 68-74.

    [23]阿尔贝·加缪.局外人·鼠疫[M].译林出版社,2013.

    (作者单位:1.武汉大学政务管理研究中心;2.武汉大学信息管理学院;3.武汉市自然资源和规划信息中心? ? 来稿日期:2020-08-19)