电子文件研究二十年

    徐晓莎

    摘 要:借助CiteSpace,运用词频分析法,对1996年~2015年核心期刊中有关电子文件的文献进行可视化分析。以作者、机构、关键词为分析对象,在通过高产作者、高产机构、高频次关键词分析我国电子文件研究现状的基础上,以五年为单位进行阶段性分析,理清电子文件研究的发展脉络,同时对相关热点进行梳理,以期对今后的研究方向提供借鉴。

    关键词:电子文件;CiteSpace;可视化

    自1996年第十三届国际档案大会召开以来,我国档案学界对电子文件展开了广泛而深入的研究。至2015年,我国电子文件研究已有二十年的历史,对二十年来的研究成果进行回顾和梳理,有助于明确今后的研究方向。

    CiteSpace是用于计量和分析文献数据的可视化软件,可较为直观地反应某一科学领域的研究现状和热点,识别该领域的主要研究人员和机构。该软件在各个领域得到了广泛应用。在档案领域,利用CiteSpa -ce做研究的相关文献中,包括档案学研究可视化分析[1]、档案数字化可视化分析[2]、档案价值问题可视化分析[3]、国际档案服务领域的发展脉络及研究热点分析[4],都侧重于通过图谱来解读研究现状、热点及发展路径,极少利用词频进行分析。

    本文以CNKI为检索平台,篇名为检索项,“电子文件”为检索词,时间区间为1996.1. 1- 2015.12.31,根据北大最新核心期刊目录,将数据来源设定为《档案学研究》《档案学通讯》《中国档案》《北京档案》《档案管理》《浙江档案》《档案与建设》《山西档案》八本期刊,检索到文献1012篇,经数据清洗后得到有效文献944篇。借CiteSpace,运用词频分析法对作者、机构、关键词进行可视化研究,并以五年为单位进行阶段研究。文中所提“高产”标准为年平均发文量为一次以上(含一次),“高频”标准为年平均出现两次以上(含两次)。

    1 电子文件研究作者分析

    1.1 高产作者分析。在CiteSpace软件界面,设置“Time Scaling”为 l,网络节点为Author,数据抽取对象设置为30。运行CiteSpace,得到研究作者图谱(图1)、节点信息表(表1、表2),图谱中节点大小表示出现频次,节点间连线表示作者合作情况,凸显数值(Brust)表示该节点在短时间内受到较多关注。

    可见,二十年间刘越男、张正强等十位学者发文较多;刘家真、徐义全等十一人在短时间内取得较大成果。在535作者之间,共形成了123条连线,其中与其他作者合作较多的有冯惠玲、刘越男、张照余等学者。

    1.2 作者发展脉络分析。以五年为一个时间区间运行CiteSpace,得到各阶段的高产作者汇总表(表3)。

    可见,在1999年~2000年,有刘家真、冯惠玲等四位高产作者,最高达3.6篇/年;在2001年~2005年有徐全义、刘越男等七位高产作者,最高达2.4篇/年;2006年~ 2010年有陈勇、张正强等十一位高产作者,最高达2篇/年;2011年~ 2015年,有刘立、赵屹等七位高产作者,最高达1.6篇/年。可见冯惠玲、刘家真、张宁、于丽娟四位学者开启了我国电子文件研究热潮,随后越来越多的学者投入到该研究中,而随着研究的不断深入,高产作者年平均发文量有所下降。

    2 电子文件研究机构分析

    2.1 高产机构及机构合作分析。将网络节点调整为Institution,可得研究机构图谱(图2)。

    笔者通过节点信息表将不同名称同一机构进行合并,可得中国人民大学信息资源管理学院(简称人大信管院)、南京政治学院上海分院、武大信息管理学院等九个高产机构(表4)。除郑州航空工业管理学院、浙江省档案局外,其他机构七个机构和中山大学信息管理系均在较短时间内取得较大的研究成果(表5)。798个机构之间的形成了42条连线,机构间的合作并不明显。

    2.2 机构发展脉络分析。以作者分析相同的方法对电子文件机构进行阶段分析,可得每五年的高产机构汇总表(表6)。

    可见,在研究初期(1999年~2000年),人大信管院以及武大图书情报档案学院形成了研究的基础性成果;2001年~2005年,人大信管院、苏大档案系等八家机构都投入到电子文件的研究中;2006年~2010年,人大信管院、南京政治学院上海分院等八家单位为研究的高产机构;2011年~2015年,人大信管院、南京政治学院上海分院等八家机构为研究的高产机构。可以看到人大信管院是研究主要阵地,引领这一主题的研究;电子文件的研究机构相对比较稳定,并逐渐得到档案行政机构的关注。

    3 基于关键词的电子文件研究热点分析

    3.1 电子文件研究热点。将网络节点调整为Keyword,可得关键词图谱(图3)及节点信息表(表7)。从知识理论的角度来看,频次和中心性高的关键词代表着一段时间内众多研究者共同关注的问题,是研究热点。由于关键词是自然词,且早期的文献中作者没有提供关键词,由CNKI根据文章正文提取,故对关键词进行了数据处理:忽略“比尔曼”等无实意词;去除“电子文件”、“电子文件信息”等与主题高度重合词。可得1996年~2015年电子文件研究的热点为电子文件产生对来源原则以及传统档案工作的影响、电子文件归档、管理、存储、凭证价值、国家战略、电子文件中心、数字档案馆、国外电子文件研究。

    3.2 电子文件研究热点发展脉络。从五年为单位的研究热点汇总表(表8),可见1990年~2000我国电子文件研究集中在归档、管理、文件保存、凭证价值、国外电子文件研究、来源原则、档案工作八个方面;2001年~2005年集中在管理、归档、文件保存、凭证价值、前端控制、档案工作、数字案馆、电子政务、元数据、档案利用十个方面;2006-2010年集中在管理、归档、文件保存、电子文件中心、 电子政务、国外电子文件研究、前端控制、档案工作、凭证价值、电子文件格式、数字档案馆、国家战略十二个方面;2011-2015年集中在管理、归档、电子文件中心、前端控制、数字档案馆、国外电子文件研究、文件保存、

    元数据八个方面。可见我国学者对电子文件研究的关注点由基础理论逐渐向实践领域发展,从电子文件对基础理论的冲击,到探寻电子文件管理新模式再到对数字档案馆、电子文件中心等管理机构及元数据技术在电子文件管理中的应用研究。

    3.3 电子文件研究热点内容分析。

    (1)电子文件管理。我国电子文件管理研究历经了第十三届国家档案大会、电子政务的发展、国家战略的提出三次转折[5]。形成电子文件管理理论体系、管理流程及管理模式、国外电子文件管理模式研究、管理系统、管理机制、体系、标准、国家及区域发展战略、相关技术、管理现状八方面研究成果。

    (2)电子文件归档。自1997年起,我国学者就开始对电子文件归档进行研究,主要着眼微观研究,内容涉及国外归档办法、归档格式、范围、流程、时间、载体、保管期限、办法、规范、移交、技术及高校电子文件归档。

    (3)电子文件长期保存。该研究自1999年开始,在保存格式、载体、背景信息保存微观研究的基础上,侧重于宏观的策略研究,如政策框架、规范标准、合作机制、实现策略、国际合作、国外借鉴、异地备份。

    (4)电子文件凭证价值。我国学者围绕电子文件的凭证价值主要进行了电子文件是否具有法律证据性、电子文件法律依据的定位、可采性以及如何保障电子文件的法律证据性三方面的探讨。

    (5)数字档案馆。作为电子文件的管理机构,我国学者对数字档案馆建设的需求、条件、技术、实施方法、风险对策、功能模块、标准体系以及数字档案馆与电子文件中心的辨析进行了全面深入的研究。

    (6)电子文件中心。我国学者从电子文件中心的定位、作用、功能、建设模式、技术方案、安全保障等方面进行了有力探讨。并通过定量方法对电子中心研究进行综述,对建成的电子中心进行实证研究。

    (7)电子文件管理国家战略。2006年5月,冯惠玲教授将电子文件管理国家战略提上日程。

    从战略的角度探讨电子文件的宏观管理,我国学者在借鉴国外国家战略的基础上,对我国电子文件管理进行调查和分析,探讨了我国电子文件国家战略的特点、基础理论、实施框架及保障体系,并探索出电子文件区域合作模式。

    本文对我国电子文件研究现状、发展脉络、研究热点进行了全面的梳理。得出我国电子文件研究具有研究主体多样化、研究团队系统化、研究视角多元化、研究热点继承性等特点。同时,也存在如缺乏合作、对电子文件开发利用的研究不够等问题。