人工智能技术赋能下图书馆史料数据库建设刍议

    【摘要】? 史料资源具有重要的历史、学术以及社会价值,是图书馆业务开展和功能发挥的重要组成部分之一。文章以人工智能技术赋能为出发点,研究当前我国图书馆史料数据库的建设。通过研究发现,目前,我国图书馆史料数据库的建设存在类型单一、技术平台缺失、价值挖掘力不足、读者服务力式微四大问题。在此基础上,文章提出加强跨界联盟协作、创新技术平台建设、完善内容独立标引、提升智慧服务效能等建议,以期促进图书馆史料数据库建设以多元、立体、特色品牌、沉浸体验引领行业的创新发展。

    【关? 键? 词】图书馆;史料数据库;人工智能;技术赋能

    【作者单位】吴昊,四川工商学院图书馆。

    【中图分类号】 G250.7【文献标识码】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2020.14.027

    图书馆史料主要是指各历史时期有关图书馆发展进程的各类档案、图书、报刊、日记、电影、海报等文献资料,既包含了各历史时期图书馆发展变化的社会环境、物理、媒介等要素及成果,又反映了不同历史时期图书馆的制度、管理模式、运营机制等,因此具有高度的历史、学术、社会价值[1]。21世纪以来,图书馆历史文献的数字化建设呈现蓬勃之势,在人工智能技术赋能下,图书馆史料库的建设势必更加全面、立体、智能化,其史料资源的搜集、整理、汇整乃至呈现方式、建构路径都将实现颠覆性变革,这也是图书馆进行资源有效开发和管库体系建设的必经之路。人工智能技术赋能下,图书馆史料数据库的建设除了面临资源搜集烦琐、文献数量巨大、精细标引困难等问题,还须谨慎应对技术风险,最大限度地实现图书馆史料库智慧建设的目标。文章以图书馆史料数据库建设现状为研究点,深入分析其所存在的问题,并有效结合人工智能技术优势提出建设构想,以期为现阶段及未来图书馆史料资源的开发与管理提供可行性的指导建议。

    一、图书馆史料资源的三重价值

    图书馆史料资源是历史上各时期、各地区政治、经济、文化、社会等层面的记录,具有深刻的价值意义,主要表现在历史价值、学术价值及社会意义三大方面。

    1.图书馆史料资源具有重要的历史价值

    沈昌直曾言:“今观周子之所搜,无非史料也。”所谓史料,是人类社会历史在发展过程中遗留下的,对人们认识、解释、重构历史演化进程具有重要参考意义的经验总结,此外,图书馆史料资源的历史价值还表现在时代引领上。中国学者徐国利表示,史料价值的本质在于其本身的阐释性,即引文入史,以文史合一的书写传统呈现各历史时期的社会发展进程和实践活动样貌,进而为当下的时代发展提供理论参考。史料资源是历史经验的传承,因此具有深刻的历史价值。

    图书馆作为社会公共信息资源的集散地,其史料资源既是对区域发展进程的概括和映射,又是不同历史时期人类实践活动的演化记录,更是人类认识历史的唯一渠道,对当代社会的发展具有深远影响。

    2.图书馆史料资源具有浓厚的学术价值

    作为社会知识传播的公共服务机构,图书馆在知识传承方面起到重要作用。史料资源的价值主要是指历史材料(文字材料、实物材料)对历史研究的价值作用,其反映的历史事件越详细,则越为稀缺,其学术价值就越高。图书馆搜集的史料资源真实度高、稀缺性高、专业性强,其中不乏对各类现代学科具有重大指导意义的史料资源。如云南省图书馆收录的彝族史专著《武定凤氏本末笺证》,该书针对云贵川彝族历史文化资源予以归纳总结,具有极高的学术价值,有益于学术界对少数民族文化的研究。此外,作为中华传统文化的历史实践精粹,图书馆史料资源具有内容丰富、形式多样、体系庞大等特征,对当今我国学术研究事业具有重大的现实意义。如安徽大学图书馆现存的明代实录体文献《明实录》,不仅对地理区域史的研究具有极高的价值意义,对我国社会学、经济学科的创新发展亦具有重要的推动作用。

    3.图书馆史料资源具有深远的社会意义

    史料资源之所以在漫长的历史实践活动中经久不衰,传承至今,与其本身固有的价值分不开。首先,史料资源作为历史实践活动的真实记录,其反映的是历史时期的社会现实,是人类生活实践的具体表现。通过史料资源的研究分析,我们可以掌握各历史时期的社会发展现状,对现代社会发展具有较大的启示作用。其次,大量图书馆的史料资源既是历史的映射,又彰显了当时社会的整体风貌,对现代社会的历史溯源和未来发展提供了有益参考,有利于促进现代社会的进步。史料资源具备重要的区域社会功能,主要是指对区域发展建设提供历史参考,如西部大开发中的地方志资源对西部地区的发展建设具有强大的指导作用。正如朱光潜先生所言,“真正的史料只有两种:证据和批判,即生活和思想”,史料资源对社会发展和人的思想建设有着深远的影响,只有真正认识历史、了解历史,才能进一步掌握社会发展需求,实现长足进步。

    二、当前图书馆史料数据库建设存在的问题

    21世纪以来,图书馆史料库的数字化建设不断推进。但由于受到技术、成本及多种问题的制约,图书馆史料资源的數字化进程较为缓慢,大部分的数字化工作仅停留在纸质文献的数字替代阶段,并未实现内容移植,史料资源的数据利用率较低,这对史料库的建设造成了不少阻碍。

    1.史料类型单一

    图书馆史料数据库理应包含各类档案、图书、报刊、电影、图片等多种资源类型,但据调查得知,当前图书馆的史料数据库主要以报刊文献为主,类型较为单一。从我国多数图书馆史料资源类型来看,主要以老旧报刊、拓片、孤珍文本等纸质文献为主要类型,且大部分史料分布区域零散不一,与其他史料文献杂糅,集中整理难度大。以晚清、民国时期的史料资源来看,尽管诸如国家图书馆、上海图书馆等自建了史料数据库(民国图书数字化资源库、晚清期刊全文数据库等),但由于音视频资源稀缺,老旧报刊等文献较多,该数据库给人造成一种报刊库即史料库的刻板印象,这也说明了目前我国图书馆关于史料数据库建设还有很长的路要走[2]。此外,就目前图书馆史料数据库内容的建设角度来看,大部分史料数据资源的录入缺乏对历史背景、历程等内容的延伸,电子数据库的内容建设也并非集聚所有史料资源的综合体。

    2.技术平台缺失

    图书馆现有的史料数据库在平台建设与技术运用方面主要存在以下问题。第一,各区域、平台的技术研发与运用水平参差不齐。以社会服务为主导的公共图书馆,史料数据产品更为齐全,对前沿技术的应用速度也更快,如首都图书馆、广州图书馆等。但公共图书馆自建数据库的功能化取向却有待提升,其史料数据库的检索方式、文献标引技术较为落后,用户针对检索结果进行二次检索的服务功能依旧不健全,这往往给读者带来不良体验[3]。第二,史料数据资源的复用性较低,不少图书馆尽管开发了相关专著和期刊数据资源系统支持读者用户浏览,但由于平台系统间缺乏科学规划,导致不同类型的史料数据资源难以实现知识维度的整合统一,这不仅造成了史料资源的闲置或浪费,还加剧了读者的使用障碍。此外,图书馆的史料数据库建设往往由于技术与成本高昂而难以做到即时维护与更新,甚至由于访问量的骤增或功能故障导致数据库瘫痪,这对于移动互联时代的PC端和移动端数字阅读而言,其平台和技术的兼容与灵活性仍需要不断提升。

    3.价值挖掘力不足

    目前,我国图书馆史料数据库建设正在如火如荼地进行,其核心目的是发掘史料的多元价值,实现知识的传承与创新。但就现有的图书馆史料数据库的建设来看,其性质大多为语料库,并未达到知识库的标准。当前,大部分图书馆的史料数据库在内容检索方面多基于标题、作者、日期等外围特征,这种表面性的文献聚类导致用户的检索效率低下,史料价值多呈现为语料特色,知识的组织性聚类尚告阙如,说明了在当前图书馆史料数据库的数字化工作中,知识价值的挖掘能力有待提高[4]。现存的史料资源多以纸质文献为主,其在数据转化过程中较为注重事物性主题,对知识价值的挖掘程度不深,往往造成资源浪费与价值流失。从原因上看,目前图书馆史料数据库的知识挖掘没有真正实现史料资源类目的标准化,尽管《中国分类主题词表》已经颁布实施,但想要实现史料数据库向知识库的转化还须在此类标准上选取应用更强的词汇类目,并结合大数据精准定位等技术促使数据库由浅层的文献标引转向深层的知识服务,以实现质的飞跃。

    4.读者服务力式微

    技术、平台、史料数据库服务的不足,都会直接影响 图书馆的读者服务能力,难以真正满足用户的多元信息需求。图书馆史料数据库的读者服务力式微主要表现在两个方面:知识服务力弱和知识有效率低。从知识服务层面来看,多数图书馆的史料数据库主要以纸质文献形式为阅读载体,以多媒体阅读为渠道,以“文字+图片”为阅读形式,且对读者的知识认知水平要求较高。这意味着给用户获取史料或信息造成了一定的困扰,在用户需求与图书馆服务之间形成知识鸿沟。此外,多数图书馆的史料数据库建设对传统出版的史料汇编成果缺乏重视,且各区域的图书馆在史料数据库建设存在重复性问题,这不仅造成了严重的资源浪费,还影响了用户阅读体验。就知识有效率的角度来看,多数图书馆的史料数据库建设以全文或标题检索为主,用户仅能在线浏览,不能实现全文及其知识关联的内容浏览、复制和下载,导致用户体验感差,并难以彰显图书馆史料数据库的知识有效利用率。

    三、人工智能技术赋能下图书馆史料数据库建设路径

    人工智能技术赋能下,图书馆史料数据库建设中的技术平台和成本控制问题将得以解决,并在各类技术运行环境的优化特色下实现人工智能、大数据、云计算、虚拟现实、物联网等多种技术的融合,为史料数据库建设提供充足动力,使其以多元化类型、立体化体系、特色化品牌以及沉浸化体验促进图书馆实现跨越式的创新发展。

    1.加强跨界联盟协作,确保类型多元化

    与以往的图书馆史料数据库建设不同的是,人工智能技术赋能将促使各区域图书馆加速联盟协作,在远程史料资源定位、史料资源联合采购、自助馆际互借、用户驱动出版、联合保存等方面形成强大优势,对处理史料资源的搜集、整理与价值开发等问题具有重要的促进作用。如5G的独立网络切片技术可以促进图书馆史料数据库实现多用户、多业务、多服务的隔离与保护,最大限度地避免由资源重复带来的知识价值低微问题;在大连接、高速率的技术特性下满足多家图书馆跨区域、跨行业的史料资源采集和大规模设备间的通信需求;利用人工智能技术将以往以纸质报刊文献转化为以多场景构建为核心的多媒体呈现形式,确保史料数据库资源类型的多元化特色[5]。届时,图书馆的史料数据库不仅具备文本内容的知识传播形式,还有效联合了史料资源的背景文化和时代特色,并根据用户的阅读兴趣提供相关知识,为用户提供多类型、多样态的史料知识,充分满足用户的阅读需求。

    2.创新技术平台建设,实现体系立体化

    人工智能技术赋能下,图书馆史料数据库建设将有效融合大数据、云计算、物联网等多重前沿科技,在现有的数据库基础上强化平台建设,实现史料数据库的创新发展。

    首先,图书馆的史料数据库在5G技术的高速传输能力下将实现更精准的大数据分析服务,可以快速将散落在各区域、各平台的史料资源进行整理,实现储存机制和呈现机制的无缝衔接;在云端服务器的控制下将有效信息通过智能设备传递给用户,降低用户的阅读门槛和图书馆的服务成本。其次,5G技术的低延时、万物互联等技术特征能将图书馆的系统与用户设备自动连接,减少各类烦琐的检索和查阅流程,使用户便捷地获得智慧知识服务。最后,5G技术将改善以往图书馆技术维稳性的问题,即通过高速率、低时延、泛在化技术让图书馆史料数据库平台更为稳定,用户不再受到数据库瘫痪等问题的干扰。此外,在区块链技术下实现数据库成果的即时更新和版权保护,全面实现史料资源的增值。

    3.完善内容独立标引,加速品牌特色化

    在充分利用人工智能技术赋能优势建立的图书馆史料数据库,不仅要完善史料内容标引工作,还要以组织性的数据挖掘、知识关联加速图书馆特色品牌的形成。

    首先,图书馆要充分利用人工智能技术优势,在完全实现全文检索的数据库的基础上延伸内容标准,使其精确到史料的性质、标题、作者、图片等各个资源构成要素,再利用大数据、云计算等实现各类史料资源终生在线和有效互联功能,实现图书馆知识服务的精准化、全面化。其次,5G技术能赋予各种史料资源智能服务能力,如纸质文献、拓片、实物等可同时在线,形成独立标引,并以强大的知识关联为用户提供信息服务,在纵深融合的大数据剖析下即时反馈用户需求,为其提供低时延的相关知识服务。人工智能技术将改变史料资源的呈现形式,从传统的平面二维阅读向多媒体三维阅读转化,为用户营造知识服务氛围,通过虚拟互动达到理想效果,实现图书馆史料数据库特色品牌构建的目标。

    4.提升智慧服务效能,促进体验沉浸化

    人工智能技术赋能将促进图书馆史料数据库的智慧服务实现跨越式发展,以全新的沉浸体验为用户带来前所未有的多感官震撼。首先,5G的增强型移动宽带(eMBB)、海量低功耗连接(mMTC)以及低时延高可靠连接(uRLLC)技术将颠覆图书馆史料数据库的应用场景,在人工智能技术的配合下让用户享受超清直播服务、智能调度服务以及虚拟空间服务[6],让传统的史料数据库服务场景无限趋于真实,甚至达到真实与虚拟自由切换的状态。其次,用户不再需要主动检索史料信息,而是在图书馆的智慧书屋、智能设备等协作下享受史料数据库的各种智慧服务,并在iBeacon精准定位技术的维持下享受个性化的定制服务。最后,人工智能技术将促进虚拟智慧馆员的诞生,将解决各类用户阅读史料资源过程中的问题,有效提升知识效率,优化史料数据库的移动性和差异化业务处理功能,提高图书馆的整体服务质量。

    |参考文献|

    [1] 王天根. 大数据时代的珍稀史料考释及史学价值所在——大英图书馆藏“发信件簿”数据化处理及其反映清帝国通讯之侧影[J]. 广西师范大学学报(哲学社会科学版),2018(1):1-11.

    [2] 张莉,贾丝婷. “档案、问题与方法”工作坊综述[J]. 中国历史地理论丛,2019(3):2.

    [3] 陈媛媛,侯君明. 近现代新闻史料库数字化建设刍议[J]. 编辑之友,2018(8):84-89.

    [4] 张宁, Miguel Baptista Nunes,李俊炀. “VR+文化”背景下的中华古籍阅读与传统文化传播新路径研究[J]. 图书馆建设,2019(6):128-134.

    [5] 刘炜,陈晨,张磊. 5G与智慧图书馆建设[J]. 中国图书馆学报,2019(5):42-50.

    [6] 董同强,唐晓旺. 5G+AI:構建“智能+”时代的新一代图书馆服务平台[J]. 图书馆学研究,2020(5):81-86.