基于词频的档案与图书物联网研究内容及重点比较

    高丽萍

    摘 要:文章以CNKI为样本,采用高频词频分析,建立共词矩阵,绘制共词知识图谱的方法,对档案界与图书界物联网研究进行对比分析,得出两学科物联网研究具有开始较同步、立足点相同、热点相近、趋势相似等共性,在规模、整体性、重点、方向上存在差异的结论。建议档案界将研究重心移到应用上,注重整体性研究,多做实证研究,提高研究的有效性。

    關键词:物联网;档案;图书;档案馆;图书馆;词频;共词

    1 研究样本来源与分析工具

    研究以CNKI(中国知网)为样本来源。分别以题名=档案 and 题名 = 物联网 or 题名 = 档案馆 and 题名 = 物联网 and (精确匹配)和题名=图书 and 题名 = 物联网 or 题名 = 图书馆 and 题名 = 物联网 and (精确匹配)为检索条件。检索时间为2016年11月27日。检索到2009年~2016年档案文献60篇,2007年~2016年图书文献224篇。

    2 数据分析

    2.1 词频分析。分别将“档案文献数据”和“图书文献数据”导入SATI文献题录信息统计分析软件[1],去重后,以2次作为高频词阈值,得到“档案文献数据”31个高频关键词和73个“图书文献数据”高频关键词。一般来讲,频次越高说明相关研究越多。

    2.2 建立共词矩阵。在提取高频关键词之后,将前15个关键词形成15×15的共词矩阵。如果某两个关键词同时出现在一篇文章中时,就表明这两者之间存在相关关系。关键词右侧或下方对应位置的数值表示篇数,共词矩阵中对角线上的数值为该关键词的词频。数据表明,档案文献共现次数最高的关键词组合分别为:物联网与档案管理、物联网与RFID、物联网与射频识别、物联网与电子标签、物联网与智能化、物联网与智能管理、物联网与档案库房、物联网与智能化管理、物联网与高校档案9组。其频数分别为20、9、5、3、3、3、3、3、3。说明档案与物联网研究相关文献的主要研究方向体现在上述9个方面,其中又以物联网与档案管理、物联网与RFID、物联网与射频识别为重点。

    数据表明,图书文献共现次数最高的关键词组合分别为:物联网与图书馆、物联网与RFID、物联网与智慧图书馆、物联网与智能图书馆、物联网与高校图书馆、物联网与RFID技术、物联网与射频识别、物联网与服务模式、物联网与图书管理9个方面。其频数分别为64、52、26、21、13、10、10、8、8。说明图书与物联网研究相关文献的主要研究方向体现在上述9个方面,其中又以物联网与图书馆、物联网与RFID、物联网与智慧图书馆、物联网与智能图书馆为重点。

    两个学科高频词共词矩阵相比较,档案界的高频关键词分布相对较为稀疏,图书界的高频关键词分布较为密实,这虽然与档案界相关文献数量少于图书界有关,但仍能反映出档案界在物联网研究上,集中度明显低于图书界,与图书界相比依然显得狭窄、单薄。

    2.3 共词网络图。将构建的两个学科高频词共词矩阵导入Ucinet社会网络分析软件,再利用Netdraw可视化软件生成档案界和图书界与物联网研究文献的高频关键词的共词知识图谱,分别如图1、图2 所示。

    从档案界物联网研究文献高频关键词共词知识图谱(图1)可以直观地看出:物联网、档案管理、实物档案、RFID、智能管理、射频识别等关键词处于知识图谱的中心,表明这些词与其他词关系相对紧密。表明大多数档案研究者更关注物联网、档案管理、实物档案、RFID、智能管理、射频识别,其他研究也大都与这些位于中心的词相关。因此,这些位于中心位置的词,就是档案界物联网研究领域的研究重点与热点。而档案馆、服务体系、档案服务、智能化管理、信息技术、GIS则处于知识图谱的边缘,这些关键词之间的联系非常稀疏,甚至没有联系。

    从图书界物联网研究文献高频关键词共词知识图谱(图2)则可以直观地看出:物联网、RFID、图书管理、物联网技术、服务模式、图书管理、公共图书馆、智慧图书馆、射频识别、传感网等关键词处于知识图谱的中心,表明这些词与其他词关系相对紧密。表明大多数图书研究者更关注物联网、RFID、图书管理、物联网技术、服务模式、图书管理、公共图书馆、智慧图书馆、射频识别、传感网,其他研究也大都与这些位于中心的词相关。因此,位于中心位置的这些词就是图书界物联网研究领域的研究重点与热点。

    无论是档案界还是图书界,那些处于知识图谱的边缘的关键词并不一定代表该词不重要,只是目前对这些词的关注研究比较少,如果这些词较多出现在近期文章中,或许表明这些词可能是这个领域未来的研究方向或趋势[2]。

    3 对比分析

    3.1 共性。两个学科物联网研究的共性归纳起来有四点:一是开始较同步。图书界开始于2007年,档案界开始于2009年。二是立足点相同。均立足于档案或图书的实体管理。三是热点相近。从词频中的高频词与知识图谱的中心词中的相同词看,具有相近的重点与热点。四是趋势相似。从居于中心词与边缘词中间的过渡词和边缘词较多相同看,研究从宏观层面向微观层面延伸,内容更加丰富与细化。

    3.2 差异。两个学科物联网研究的差异归纳起来也有四点:一是规模不同。从文献数量上看,图书界的规模是档案界的4倍,远大于档案界。二是整体性不同。图书界的研究整体性更强,表现为更多关注图书馆、公共图书馆、智能图书馆、智慧图书馆的研究;而档案界的整体性研究则比较弱,表现为较少关注档案馆、公共档案馆、智能档案馆、智慧档案馆的研究。三是重点不同。虽然两个学科都有偏重理论研究的倾向,图书界在关注技术的同时,更加关注服务与服务模式、方法和服务反馈,因此有较多的实证研究成果出现;而档案界由于相关技术的普遍应用晚于图书界,研究更多关注的是相关技术的应用,所以较少有实证研究成果。四是方向不同。图书界关注的是由物联网图书管理系统向物联网馆,智能化、智慧型图书馆过渡,借助物联网技术推进文献资源建设和学科馆员培养;档案界虽然也在关注智能化、智慧型档案馆,但更多是开始从整体上关注档案馆的物联网应用、档案服务、档案服务体系和诸如GIS等专业档案、专业档案馆的物联网应用问题。

    4 建议

    4.1 将物联网研究的重心移至应用上。物联网研究,需要理论研究,但仅仅有理论研究是远远不够的,任何新技术、新方法,只有应用才有意义。因此,档案界物联网研究的重心需要从“理论探讨”转移至“应用实践”上来,让更多的档案人员具备物联网理念,在更多的档案管理环节上采用物联网技术,让物联网技术更好地为档案管理服务。

    4.2 注重从档案馆的整体层面上开展物联网应用研究。对档案馆应用物联网技术的研究,要特别注意整体性。这并不是反对或抑制在某个档案管理环节上开展物联网应用研究或采用物联网技术,而是从整体上,系统地开展物联网应用研究,更能够发挥物联网技术的优势,实现最优化的应用效果,提升投入效益。

    4.3 开展实证研究,提高物联网研究的有效性。档案界研究者应多开展实证研究,以实际应用来跟进与推动物联网研究,并以实际应用效果来评判物联网研究的成果。

    4.4 拓展物联网在服务领域的应用研究。物联网在整个档案管理各环节中产生的数据,作为一种反馈信息,对整个档案管理工作,特别是档案服务环节有着特别意义。这一点目前虽然有所涉及,但落后于图书界。应当吸取图书界在这方面的经验,注重对来自物联网传感器数据信息的挖掘,探索和拓展物联网在档案服务领域的应用,更好地为档案利用者服务。

    参考文献:

    [1]刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例[J].信息资源管理学报,2012(01):50~58.

    [2]张豪锋,李海龙.我国教育技术学研究前沿探讨——基于核心期刊关键词的共词网络与聚类分析[J]. 电化教育研究,2011(10):26~29+39.