数字人文视域下的数字档案馆建设:合理性诠释与策略探讨

    魏歌 吴志杰

    

    摘要:基于数字人文的产生、演变及基本特征分析,从时机、需求和价值三个角度诠释数字人文视域下数字档案馆建设的合理性,认为数字人文视域下数字档案馆建设在目标层应构建以知识生产和知识利用为导向的数字资源共享平台;在资源层应同时兼顾资源收集的广度拓展以及资源开发的深度提升;在模式层应选择符合实际的建设模式;在实施层应完善多元主体协同建设机制。

    关键词:数字档案馆 数字人文 合理性 建设策略

    Abstract: Based on the emergence, evolution and basic characteristics of digital humanities, this paper analyses the rationality of the construction of digital archives for digital humanities from aspects of opportunity, requirement and value. This paper builds a strategy system including target level, re? source level, pattern level and implementation lev? el. At target level, digital resource sharing platform oriented by knowledge production and knowledge utilization should be built. At resource level, the breadth of resource construction should be expand? ed and the depth of resource utilization should be improved. At pattern level, the actual construction model should be selected. At implementation level, the coordination construction mechanism of multi? ple subjects should be improved.

    Keywords:Digital archives; Digital humanities; Rationality; Construction Strategies

    5G、工業互联网、人工智能、区块链、云计算和大数据等广泛应用的数据时代,社会数字化转型持续深入、技术迭代不断加快和用户需求多元复杂导致数字档案馆建设中数字资源建设不足[1]、技术应用能力落后[2]、服务方式单一[3]等问题日益凸显。作为近20年内逐渐显露并臻于火热的研究领域,数字人文(Digital humanities)已经成为当今人文学科学术研究和实践的新潮流[4]。数字人文研究与实践对数据资源的依赖、对技术工具的重视、对跨界合作的鼓励和对知识生产与构建的追求能够为破解数字档案馆建设面临的瓶颈性问题提供新思路和新方法,进而更好地发挥数字档案馆的价值。本文拟从数字人文项目特征分析入手,阐明数字人文视域下数字档案馆建设的合理性并提出数字人文视域下数字档案馆建设的基本策略。

一、数字人文的产生、演变与基本特征

    数字人文起源于人文计算(Humanities Comput? ing)。起初,人文计算仅指人文学者利用语汇索引、超文本卡片、文本分析和计算机语言学等技术和方法辅助人文学科问题的研究,它被认为是使用计算机进行量化分析的一种人文研究方法,体现出的是方法论上的一种革新[5]。之后,互联网的大众化和个人计算机的普及化使得人文计算的处理对象“从数字文本逐步扩展到超文本、图像、视频、音频、数字地图、网页、虚拟现实、3D等多媒体,计算的领域也不再单单在文学与语言领域,而是扩展到历史、音乐、艺术等多领域”[6]。此时,人文计算的内涵已远远超出了其所蕴含的字面意义。实践中,数字人文开始取代人文计算并逐渐发展成一个独立的跨学科研究领域。这一新领域不仅仅局限于字面意义上“数字技术”与“人文学科”的简单融合,更意味着本体论、认识论和方法论上的变革与创新。

    数字人文(Digital Humanities)是一个不断发展的概念,难以清晰界定[7]。通过对现有数字人文项目与实践的梳理,可以归纳出数字人文项目的主要特征有:第一,以开放性的数字人文数据库或数据集作为资源基础。例如,中国历代人物传记资料库(CBDB)项目已经系统地收录中国历史接近40万人的重要传记资料。CBDB将这些数据组织成关系型结构化数据库,使之不仅能够作为历史人物研究的参考资料,还可用于统计分析、地理空间分析与社会网络分析等[8]。第二,以辅助性的数字技术工具和程序作为技术工具。例如,利用网络可视化应用Gephi能够进行探索性数据分析、链接分析、生物网络分析等,进而实现不同层面的数据关联与可视化。第三,以协同合作为导向的建设模式。例如,中南民族大学王兆鹏教授主持的数字人文项目“唐宋文学编年地图”是由文学和计算机科学专业研究人员、地理学专业辅助测绘人员、软件开发人员、网站建设成员以及项目管理员等一百多人的团队合作开发而成[9]。第四,通过定性和定量相结合的方法对资源进行知识化处理,以探索新知识、发现新观点。总而言之,数字基础设施、工具支持、跨界合作和知识生产与构建是数字人文实践与研究的主要特征。

二、数字人文视域下数字档案馆建设的合理性诠释

    (一)时机合理性:数字人文引导数字档案资源建设由数量增长转向质量提升

    “截至2019年底,全国各级国家综合档案馆馆藏电子档案119.3万GB。其中,数码照片39.6万GB,数字录音、数字录像35.9万GB。馆藏档案数字化副本1 407.8万GB。”[10]可见,仅就全国各级国家综合档案馆馆藏数量而言,我国数字档案资源就表现出海量化的特征。数字化档案和原生电子档案虽然改变了档案的存在方式、方便了档案信息的获取与利用,但“数字档案资源的利用尚停留在基于目录的简单查询共享,缺乏综合的数据挖掘和深度整合”[11]。数字人文视域下的数字档案馆注重利用语义网、关联数据、知识图谱等技术实现数字档案资源的深度揭示与关联,能够使数字档案资源结构化、语义化和知识化,进而有效提高数字档案资源的建设质量。

    (二)需求合理性:数字人文能够满足档案服务的多元化、知识化和互动化需求

    随着互联网技术的深入发展,用户档案利用需求由“单纯地利用档案信息”变为“渴望获取有价值的档案知识”。在此过程中,数字档案馆不能仅仅基于目录数据库和全文数据库提供简单的档案浏览、检索、借阅和复制等服务,更需要以用户为中心,主动提供个性化、多元化、知识化和互动化的档案服务,来强化用户的获得感和满足感。数字人文视域下的数字档案馆强调利用各种先进的数字技术与应用工具来丰富档案用户体验并优化服务效果。例如,利用数据分析技术对海量档案数据进行文本分析、内容分析、社会关系分析等来进行完整历史叙事,增强档案服务的知识性;利用可视化技术将以文字为主的档案文本转化为具有交互性的图形或图像,以增强档案服务的互动性;基于大量的实景照片、历史地图、手稿资料、考古文物等,利用全息投影技术、混合现实技术等重建历史现场,使体验者身临其境,增加档案展览的沉浸性和可感知性。

    (三)价值合理性:数字档案馆建设与数字人文项目具有互相促进的价值基础

    数字人文视域下数字档案馆建设既能够提升数字档案馆的建设质量,也能够促进数字人文项目与实践的发展,具有“双赢”的价值。对于数字档案馆建设而言,数字人文不仅能够以数据思维和关联思维促进数字档案资源建设由“文件级”深入到“数据级”[12],而且还倡导数字档案馆应利用各类数字人文技术工具,辅助用户对档案资源进行关系挖掘、多维分析和可视化处理,将数字档案馆服务由提供资料向提供知识转变。对数字人文项目而言,数字档案馆保存的海量可信档案资源是孕育数字人文项目的肥沃土壤。大量对数据质量要求较高的数字人文项目均依托档案馆馆藏并冠以“档案”之名而实施。例如,美国弗吉尼亚大学数字历史研究中心基于弗吉尼亚大学、美国陆军军事历史研究所、宾夕法尼亚国家档案馆、弗吉尼亚军事学院档案馆等机构的馆藏而建立的“影谷项目”(The Val? ley of Shadow)[13],法国国家档案馆与斯坦福大学图书馆利用法国大革命期间的手稿资料、实物档案等建立的能够满足作者、主题、时间、地点等多维度检索需求的“法国大革命数字档案馆”项目[14]。

三、数字人文视域下数字档案馆建设的策略选择

    (一)目标层:构建以知识生产和知识利用为导向的数字资源共享平台

    数字档案馆建设目标是调配建设资源、明确推进方向、解决建设矛盾的重要遵循,能够决定数字档案馆建设的基本思路、主要原则和重点任务。因此,数字人文视域下数字档案馆建设首先要回答“应建设成为什么样的数字档案馆”的问题。对数字人文而言,一方面,大规模规范性较高的、注释丰富的语料库是数字人文的基础;另一方面,数字人文强调促进知识生产与扩散,“关注研究成果的保存与分享,并将关联数据应用于人文学科资源描述,更深层次挖掘人文数据之间的关系,从而实现人文知识的重新构建与认知”[15]。因此,数字人文视域下的数字档案馆不仅应该强调将数字人文的理念、方法与技术融入数字档案馆建设中,以便实现资源管理精细化、技术应用深入化和利用服务知识化,而且也应注重通过知识生产和知识重构来实现对人文学科研究的全面支持。这就是说,数字人文视域下的数字档案馆是在数字人文理念引导下,以馆藏数字档案资源精细化管理为核心,以相关数字资源集成化建设为辅助,以数字人文技术体系为工具,来将数字档案馆建设成为以知识生产和知识利用为导向的数字资源共享平台。

    (二)资源层:同时兼顾资源收集的广度拓展以及资源开发的深度提升

    在数字人文视域下数字档案馆建设目标的指引下,数字档案馆建设一方面应注重资源收集的多样性和全面性,通过扩大归档范围和创新资源收集思路实现资源建设的广度拓展;另一方面应在保证档案资源安全的前提下,利用数字人文技术工具对已开放的档案资源进行精确揭示、多维分析和深度挖掘以实现档案资源开发的深度提升。

    数字人文视域下的数字档案馆资源收集应以数字档案资源收集为核心,积极融合多来源、多类型的数字资源,以便形成数字资源集成平台。其一,数字档案资源建设是数字人文视域下数字档案馆建设的使命与根本。数字档案资源收集应在形式上做到“新旧结合”,即在保证传统归档范围中的文件资料应收尽收、应归尽归的同时,兼顾对数据时代新产生的、具有长期保存价值的数据的收集,尽可能保证档案资源体系的完整性和全面性。數字档案资源收集应在内容上坚持宏大叙事与微观叙事相结合,正如T·库克所言,“绝不能认为上层精英们产生的文件自然更有‘价值,坚持多元化的叙述,而不是主流叙述,要关照整个社会和人类全体的历史经验而不只限于充当国家和公共文件的保管者”[16]。其二,图书、报纸、期刊论文、年鉴、学科数据库等多来源的数字资源是数字人文视域下数字档案馆资源收集的重点内容。数字人文视域下的数字档案馆需要通过多来源、多类型的数字资源来补充和丰富资源体系结构,从而为档案资源的全景式揭示与描述奠定基础。

    

    档案资源不同于一般的文献资源,一些档案资源具有涉密性特征,在保密期内不允许随意开发利用。因此,数字人文视域下数字档案馆资源开发利用过程中,应在保证绝对安全的前提下,积极利用数字人文技术工具对已开放的档案资源和多来源、多类型的数字资源进行关系揭示和多维分析。通常可以按照资源组织与管理、资源分析与可视化、资源拟实化的步骤来实现资源的深度开发利用[17]。首先,借助关联数据、知识图谱的知识组织等技术挖掘档案之间的有机联系,使档案资源体系呈现出完整的逻辑结构。其次,通过开发有效的数据分析模块和可视化模块,对档案资源进行文本分析、聚类分析、主题分析等,并结合图形图像实现分析结果的形象化展示,从视觉、听觉等感官上强化对资源内容的感知。最后,结合虚拟现实技术、增强现实技术以及相关数据可视化技术,实现档案所描述的历史场景再现。

    (三)模式层:选择符合实际的数字人文视域下的数字档案馆建设模式

    通常而言,数字人文视域下的数字档案馆建设可以采取馆内主导建设模式、联合数字人文专业团队的合作建设模式以及以众包项目为导向的公众辅助建设模式[18]。馆内主导建设模式指现有数字档案馆建设团队主动利用数字人文技术工具体系来优化数字档案馆的资源建设、功能设定及服务方式等。联合数字人文专业团队的合作建设模式指数字档案馆建设方以项目外包形式将数字档案馆建设中的资源管理与利用、系统功能优化与提升等部分或者全部的任务交给数字人文专业团队进行开发。以众包项目为导向的公众辅助建设模式是比较灵活的建设模式,其鼓励将数字人文视域下数字档案馆建设中的一些工作量繁重、專业技能和知识要求不高的部分交由社会公众完成,以激发公众的参与兴趣,同时,减轻数字档案馆建设方的工作负担。例如,通过大众标引完善数字档案资源的元数据库建设、借助公众力量对数字资源进行转录与标引等。数字人文视域下的数字档案馆建设可以根据实际需求采用上述一种或多种建设模式予以实施。三种不同建设模式的优劣对比如表1所示。

    (四)实施层:完善数字人文视域下数字档案馆多元主体协同建设机制

    无论采用何种建设模式,数字人文视域下数字档案馆建设均涉及档案管理人员、技术开发人员、人文研究学者、档案用户等多元主体。在此情况下,为了确保各个参与主体充分发挥主观能动性,形成多元主体的协同建设优势,应建立和健全数字人文视域下数字档案馆多元主体协同建设机制。

    第一,明确不同参与主体在协同建设机制中的责任分工。不同建设模式的责任分工不尽相同,对于馆内主导建设模式而言,数字档案馆建设团队是发起者与主导者,承担数字人文视域下数字档案馆建设的主要责任和第一责任,他们应该明确团队内部不同小组或成员的具体责任。例如,档案管理员负责划定开放档案资源范围、提供数字资源的相关内容等,技术人员负责数字人文技术应用、数字人文相关需求实现以及界面展示效果优化等,人文研究学者则负责提供一些可行的建设思路与需求等。对于合作建设模式而言,应该在项目招标时明确数字人文专业团队的具体责任和项目成果的具体要求。以众包形式进行的建设模式则无须公众承担过多责任,主要由数字档案馆建设方明确众包项目的内容、任务与具体要求。

    第二,保证数字人文视域下数字档案馆建设多元主体间的有效沟通与交流。数字人文视域下的数字档案馆建设是一项长期、系统、复杂的工程,缺乏有效的沟通与交流将无法保证建设质量并影响建设目标实现。通常应该通过定期的线上和线下、正式和非正式等交流方式促进多元主体间的有效沟通,使其相互理解、达成共识。

四、结语

    数字人文的理念、方法与技术工具能够为解决当前数字档案馆建设中的瓶颈问题提供新思路,这对优化数字档案馆资源建设质量、提升数字档案馆功能建设水平和增强数字档案馆知识服务能力等具有重要意义。本文仅从宏观角度探析数字人文视域下数字档案馆建设的价值与实现的基本路径,未来需要更多、更为全面细致的研究,才能保证数字人文视域下数字档案馆建设的落地与实现。

    *本文系河北大学在读研究生创新能力培养资助项目“数字人文环境下雄安新区档案资源开发利用研究”(项目编号:HBU2020SS010)的阶段性研究成果。

    注释及参考文献:

    [1]陶水龙.大数据时代下数字档案馆面临的机遇与挑战[J].中国档案,2013(10):66-68.

    [2]李宝玲.数字档案馆建设的机遇、挑战与思考[J].档案管理,2020(2):27-28.

    [3]王顺,徐华.大数据时代我国数字档案馆信息服务的问题与对策[J].北京档案,2018(10):17-20.

    [4]王兆鹏,邵大为.数字人文在古代文学研究中的初步实践及学术意义[J].中国社会科学,2020(8):108-129;206-207.

    [5]陈静.历史与争论:英美“数字人文”发展综述[J].文化研究,2013(4):206-221.

    [6]朱本军,聂华.数字人文:图书馆实践的新方向[J].大学图书馆学报,2017,35(4):23-29.

    [7]贝里M.,费格约德.数字人文:数字时代的知识与批判[M].王晓光,译.大连:东北财经大学出版社,2019:7.

    [8]徐力恒.唐代人物资料的数据化:中国历代人物传记资料库(CBDB)近年工作管窥[J].唐宋历史评论,2017(0):20-32;381.

    [9]搜韵网.唐宋文学编年地图[EB/OL].[2020-09-29].https://sou-yun.cn/PoetLifeMap.aspx.

    [10]国家档案局政策法规研究司.2019年度全国档案行政管理部门和档案馆基本情况摘要(二)[EB/OL].(2020-09-04)[2020-10-06].https://www.saac.gov.cn/daj/zhdt/ 202009/23bee44fdf594f048619334774968c7d.shtml.

    [11]杨冬权.在全国数字档案馆(室)建设推进会上的讲话[J].中国档案,2013(11):16-21.

    [12]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2):10-14.

    [13]Valley of the Shadow.What is the valley project?[EB/OL].[2020-10-16].https://valley.lib.virginia.edu/VoS/us? ingvalley/valleyguide.html.

    [14]龙家庆,王玉珏,李子林,等.数字人文对我国档案领域的影响:挑战、机遇与对策[J].档案学研究,2020(1):104-110.

    [15]柯平,宫平.数字人文研究演化路径与热点领域分析[J].中国图书馆学报,2016,42(6):13-30.

    [16]库克,李音.铭记未来:档案在建构社会记忆中的作用[J].档案学通讯,2002(2):74-78.

    [17]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017,43(5):32-41.

    [18]杨千.数字人文视域下我国档案资源合作开发模式研究[J].档案与建设,2019(10):8-12.

    作者单位:1.河北大学管理学院2.中国人民大学信息资源管理学院3.中国人民大学电子文件管理研究中心