东北抗联资源专题数据库建设探讨

    张磊 贾书梅

    【摘 要】在党史学科的发展中,数据密集型知识方法受到普遍关注,充分利用数据记载史料和论证观点,并对数据进行科学处理是其研究的特点之一。在大数据时代,对东北抗联资源进行深入研究有必要从数据库建设入手,理性应对和推进新时期研究范式转变,有利于避免重复性研究,有利于整合抗联文献研究资源和推进抗联史深入研究。文章在深入分析了当前东北抗联资源数据库建设的必要性,同时对抗联资源专题数据库的现状作了梳理,提出建设东北抗联专题资源数据库的相关对策,以利于学界对此问题进行深入探讨交流。

    【关键词】大数据;东北抗联;红色文化资源;数据库

    【中图分类号】G26 【文献标识码】A 【文章编号】1001-0475(2017)02-0058-02

    当前,世界进入到了信息和互联网时代,应用信息技术革命提供的大数据、云计算、互联网等新技术、新手段,对传统党史学研究产生了重要影响。党的十八届五中全会决定“实施国家大数据战略,推进数据资源开放共享”。习近平同志曾指出:“我们既要坚持和发展马克思主义史学研究的优良传统,坚持和发展党史工作积累的成功经验和方法,还要积极运用现代科学技术,创新党史研究的手段、方法、载体。”[1](P.33)习近平同志论述为提高党史科学化研究水平指明了方向。

    一、 东北抗联红色文化资源数据库建设的必要性

    中共党史史料即中国共产党历史过去的信息。党史研究的信息化,是通过数据、网络和数据库等现代信息技术应用于党史学科的研究中,进而扩大文献史料和研究成果的共享化,提升党史研究人员的学术创新能力,提高党史研究“资政育人”功能的持续动态性,是党史研究科学化、现代化的重要内容。网络对史料最直接的影响,就是传播载体变化和速度的增加,由纸质版向电子版、数字化的转化。电子化史料,又名数字化史料、数位化史料,或者数据库史料,是通过计算机以及其它相关电子产品技术,将史料从纸质载体转化为电子载体的文献资料,并以电子化方式储存的一种新式载体史料,具有储量大、查询快捷、高效率等突出优点,电子化和数据库的基本史料包括报纸、期刊、档案、日记、实录数据库等。

    “历史是最好的教科书,也是最好的清醒剂。”加强东北抗联资源专题数据库的建设,是加强抗联史研究的重要内容和数字化载体平台。一是整合东北抗联红色文化资源研究力量的需要。当前,研究东北抗联的主要科研人员分布在高校、党校、社科院和各级党史研究室,研究机构互不统属,条块分割明显,研究人员分散,致使在科研任务的规划、课题的立项、人力资源配置等方面,出现了重复劳动、劳动效率低下和档案文献难以共享的问题,使得抗联史的信息化建设容易遇到发展瓶颈。通过数据库建设,能够建立起丰富的数据集,使其抗联史资源的可用性、共享性、协作性增强,提供了抗联研究学者大规模协作的可能。二是通过数据库的建设便捷提高了传统的史料检索方式,增加了文献史料的利用,使历史研究从传统史学的隐形联系阶段,进入到深层的显性联系阶段,开拓了研究新视角。在电子化和数字化时代,数据库让史料的收藏、传播、查找、获取和阅读都与以往不同,是传统研究方式无可比拟的。其制作成本低,存储量大,表现在数据库的建设,可降低实物史料存放成文,制作费用较低,存放空间较大;传播快速,检索便利,提高了研究的效率,数据库代替了传统的手工检索,节约了人力,在任何地域都可以调看文献史料,突破了以往的馆际、地域典藏的局限,提高了研究问题的速度,也满足了学者对电子化史料的需求,推动了抗联史研究进入到新的范式;数据库的建立,使原来文献史料经过量化处理,史实也重新建立在更加细致、全面、扎实的基础之上,原本秘籍、稀有等珍贵史料,借助数据库的传播,由罕见、陌生变得常见化,打破了文献史料的垄断现象,有助于学术研究的公平与平等,促进东北抗联研究的国内外学术交流,提升整体研究水平。三是通过数据库的建设,为国家存史,为人民存忆,更好抵制历史虚无主义蔓延的思潮,对国家文化建设具有重要的战略价值。战争的苦难惨绝人寰,珍爱和平成为人类文明最大的公約数。然而,70余年过去了,仍有少数人无视历史事实,一再否认甚至美化侵略历史。忘记历史就意味着背叛,否认罪责就可能重蹈覆辙,这些倒行逆施是对历史的藐视、对国际秩序的公然破坏和对和平潮流的公然挑衅成为逆流,通过数据库的建设为普及、传承和弘扬抗联史及抗联精神建立了有效的载体平台。

    二、当前抗联红色文化资源数据库建设现状

    东北抗联研究是中共党史抗日战争史研究领域的热点问题,随着文献史料的整理和深入挖掘,有关东北抗联研究也取得了丰富的研究成果。但是,在文献史料的整合利用中,不可避免出现效率低下、重复劳动和资料难以共享等问题。在大数据时代,对东北抗联的研究在作好传统历史学研究方法的同时,还要采用新技术,利用便捷、操作性强的数据库为科研工作服务,这也是将虚拟的电子文献与传统的纸质文献并存利用的捷径。大数据的关联分析方法、预测分析方法、非线性分析方法和量化比较等方法,都可以运用到东北抗联史的研究中,加以利用,以便对抗联史研究的深入,发挥出“资政育人”的政治功效,也是对新技术、新方法应用于党史学科研究的实效回应。

    目前,学界关于抗联红色文化资源综合性数据库建设还处于发展初期阶段,建设较为综合性的是国家数字图书馆中国记忆项目东北抗日联军专题资源库(http://www.nlc.cn/dsb_zt/xzzt/dbkrlj/),该项目自2012年4月启动实施东北抗联专题文献资源的收集和整理工作。该数据库涵盖抗联简史、抗联军事组织序列、主要将领简介、抗联歌曲、历史照片、抗联口述史等内容。其中资源库采集到陆宝平、于桂珍、李在德、李敏等25位抗联老战士、60位抗联后代、相关历史研究者和亲历者长达240小时的口述史音频资料,拉近了历史与现实的距离,不但提高了抗联史研究成果的感染力、吸引力,还为深入抗联研究提供了一手史料。还收集到抗联歌曲62首,包括《从军歌》《悼念赵尚志将军》《第一路军军歌》《松花江千万不能忘》和《抗联教导队歌》等红色革命歌曲。在资源建设中整理了抗联文献目录,其中包括舆图、新善本、普通古籍、方志馆地方文献、中文基藏及保存本库和馆藏冯仲云手稿。吉林省图书馆建设了《东北抗联》影音数据库,其它数据库建设内容少,影响力低。

    三、建设东北抗联红色文化资源数据库的相关对策

    一是加强对东北抗联红色文化资源纸质资料和信息电子化处理工作,通过数据采集、分类、编码、存储和挖掘分析等环节,建立起研究的量化数据库。按照数据库的内容主题,建设东北抗联资源专题数据库和综合性数据库史料平台。从史料的利用看,专题数据库要胜于综合数据库,但就查找的相关史料而言,存储多种载体史料的综合数据库,在时间段、内容覆盖面上要显然优于专题性数据库。两种数据库互存优缺点,加以综合性利用,才能有助于抗联文献史料的合理利用。专题性数据库要以东北抗联的史实资料为主,涵盖东北抗联精神研究专题,具有文献检索的针对性;综合性数据库要涵盖如东北抗联密营研究、抗联后勤保障研究、抗联思想政治工作研究、抗联根据地建设研究、抗联重要人物(群体)研究、抗联与苏联红军关系研究等重要专题内容,将有关东北抗联及抗联红色文化资源的实物史料图片和说明、抗联史文字史料(包括抗联时期的文件、档案;抗联将领文集、文稿;抗联时期编辑出版报纸、杂志;文献资料汇编;东三省地方史志、年鉴等)、抗联口述史料等资料收入其中,以此来加速东北抗联史资料的共享进度,推进研究的科学化、信息化进一步深入。

    二是在抗联资源专题数据库的建设中,要将图书馆OPAC系统、中英文期刊数据系统、报纸、论文等各类文献,整合于同一平台上,进行抗联内容的统一检索,再根据抗联研究领域不同专题、年代等属性标引、做上记号,力求实现书、刊、报纸、纸质文献资源与电子文献资源的有效聚合;要针对元数据和内容的检索,检索内容要深入到章节和正文版权页,使研究者能快速、准确查找到文献知识点。

    三是在新的范式研究方法下,用数据开展定量分析。数据库所收集的资料应在版本使用上争取祖本、足本、精校本等最佳选项,史料上坚持优先引用原始、内层史料和核心的史料。通过史料的电子化应用,可以弥补现有史学研究范式的运用缺陷和处理数据的不足,通过新范式的应用,拓展了抗联史料的收集渠道,变革研究的思维方式有助于研究成果更加接近于历史的本真,也可以为大数据时代的抗联史及抗联红色文化资源研究增添活力。

    四是加强数据库的建设,采取引入数量分析新方法,强化抗联史个案研究的关联度,有利于去伪史存真史,有利于整合内容相同研究成果。例如引入大数据研究中的关联分析法,可以挖掘抗联史料数据之间的事物相关性,找出事物发展的主要矛盾和规律,来注重事物相关联系在方法论上的一致性。運用此方法,可以在数据库建库和实行库关联时,将许多关联度强的选项适合开展量化研究。要注重数据库的版本规范,统一名称使用;要避免在数据库宣传和建设中对史料的推介存在言过其实的现象。同时,在数据库建设的过程中对样本的选择,要避免主观倾向,不可将量化研究的意义扩大,要注意定量研究与定性研究结合起来,才能更真实还原抗联史于“本真”。

    参考文献:

    [1]欧阳淞.党史学基本问题研究[M].北京:中共党史出 版社,2014.

    [责任编辑:秦 超]