基于网络的政府信息公开与档案相关研究文献关键词词频分析

    张晓培

    

    

    

    摘 要:文章以CNKI为样本来源,运用SATI文献题录信息统计分析软件对政府信息公开与档案相关研究文献分别进行高频关键词提取和词频分析,建立高频关键词共词矩阵;再运用UCINET社会网络分析工具绘制高频关键词的共词网络图。而后依据采集的词频分析和建立的高频词可视化共词网络图得到的分析数据,得出档案信息、档案开放、现行文件、国家档案馆、信息查询、档案工作、档案利用是当前政府信息公开与档案相关研究领域研究的重点与热点,而档案馆、档案、开放、知情权、公开、档案法则可能成为日后研究的方向与趋势。

    关键词:档案;政府信息公开;网络;关键词;词频分析

    为了解与掌握政府信息公开与档案相关研究的主要内容及趋势,以中国知网为样本来源,采用高频关键词频分析,建立共词矩阵,绘制共词知识图谱的方法,对2003年以来政府信息公开与档案相关研究文献进行分析。

    1 样本来源与分析流程

    研究以中国知网为样本来源,以主题为检索项,以条件:主题=政府信息公开 and 主題=档案 (精确匹配) 检索到的657篇文献为样本。检索时间为2017年3月12日。

    样本的数据分析流程,首先从知网数据库中获取题录数据,使用Excel进行整理,而后使用SATI文献题录信息统计分析软件进行词频分析和构建共词矩阵[ ],最后使用Ucinet网络分析集成软件和Netdraw可视化软件构建与研究主题相关的共词知识图谱。

    2 词频分析

    分别将从知网数据库中获取的题录数据,经Excel整理后导入SATI文献题录信息统计分析软件,去重后,共得到1643个关键词。以5次作为高频词阈值,得到125个高频关键词(见表-1)。

    根据使用频次越高说明相关研究越多,表-1所列125个词显示了2003年以来政府信息公开与档案相关研究热点。其中使用频次在10次以上的45个词,是政府信息公开与档案相关研究的主要热点方向。

    3 建立共词矩阵

    在提取高频关键词之后,将使用频次10次以上的45个关键词形成45×45的共词矩阵。如果某两个关键词同时出现在一篇文章中时,就表明这两者之间存在相关关系。关键词右侧或下方对应位置的数值表示篇数,共词矩阵中对角线上的数值为该关键词的词频。政府信息公开与档案相关研究文献高频词共词矩阵见表-2(前20×20)。

    表-2数据表明,20×20矩阵共现次数在10次以上的关键词组合分别为:政府信息公开与档案开放(33),政府信息公开与档案利用(14),政府信息公开与档案馆(14),档案开放与现行文件(25),档案开放与国家档案馆(15),档案开放与档案信息(10),档案开放与国家档案局(10),现行文件与档案利用(17),现行文件与国家档案馆(17),现行文件与档案工作(12),现行文件与信息查阅(22),现行文件与公开信息(17),档案利用与国家档案馆(10),档案利用与馆藏档案(11),国家档案馆与档案信息(10),国家档案馆与信息查阅(22),信息公开与政府信息(12),政府信息与档案(11),公开信息与信息查阅(13)共19组。

    4 共词网络图

    将构建的2003年以来政府信息公开与档案相关研究高频词共词矩阵导入Ucinet社会网络分析软件,再利用Netdraw可视化软件生成政府信息公开与档案相关研究文献的高频关键词的共词知识图谱,分别如图-1所示。

    从2003年以来政府信息公开与档案相关研究高频关键词的知识图谱(图-1)可以直观地看出:档案信息、档案开放、现行文件、国家档案馆、信息查询、档案工作、档案利用等关键词不仅图标最大,处于知识图谱的中心,相互之间联系密切,且与其他关键词也关系紧密。表明2003年以来政府信息公开与档案相关研究者进行研究时更关注上述位于中心的词,是政府信息公开与档案相关研究的重点与热点。因此,这些位于中心位置的词,就是2003年以来政府信息公开与档案相关研究领域的研究重点与热点。而档案馆、档案、开放、知情权、公开、档案法等关键词则处于知识图谱的边缘,这些关键词之间的联系也相对稀疏,表明这些内容在研究中处于相对边缘的位置,关注度相对较低,不是研究的重点与热点。

    参考文献:

    [1]刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012(01):50~58.

    [2]张豪锋,李海龙.我国教育技术学研究前沿探讨——基于核心期刊关键词的共词网络与聚类分析[J]. 电化教育研究,2011(10):26~29+39.

    (作者单位:郑州大学档案馆 来稿日期:2017-06-16)