图书馆管理信息系统中数据挖掘技术的应用分析

2022.09.27

摘要：科学技术的日新月异为各个领域的发展都带来了不可预估的可能性，特别是计算机技术的普及和进步让信息化成为时代的一张崭新的名片，大数据时代下，自动化形式和互联网+模式开始渗透到各行各业，其中不乏一些管理性质的领域，图书馆管理所需要的信息量极大，可以完美结合信息技术快，便捷等特点，提高工作本身效率的同时，为图书馆适用人群带来更优质，更人性化的服务，本文基于理论，结合实例分析图书馆管理信息系统中数据挖掘技术的应用。

关键词：图书馆管理;数据挖掘;信息系统

DOI：10.12249/j.issn.1005-4669.2020.26.168

图书馆的功能丰富，是满足读者文化需求的重要资源库，所以图书馆管理也应该与时俱进，尽可能准确地提供给读者需要的信息，这就对系统提出了更高的要求，在传统的图书馆管理中，读者的个性化选择通常是容易被忽略的部分，而数据挖掘是一种知识发现的过程，综合了统计学，信息技术等多个学科的知识，针对一些潜在信息能进行预测，还可以对风险进行评估，这就决定着数据挖掘在图书馆管理应用是必然趋势。

1 数据挖掘技术的定义和优势

数据挖掘属于信息挖掘的一种，信息挖掘是指用信息技术分析信息资源，从各类信息源中抽取先前未知的、完整的信息进行关键业务决策的过程，在很多行业领域都能发现它的应用痕迹，特别是一些涉及管理的职业，对工作人员的信息挖掘技能经常做出更细致的考察。而数据挖掘则是一种信息收集和数据集成数据规约的技术流程，它主要经过信息收集，数据集成，数据规约，数据清理，数据变换，数据挖掘过程，模式评估，知识表示八个环节，每一步骤都至关重要，承上启下，都属于总体不能分割的一部分。数据挖掘过程具有很强的重复性和连贯性，对每一步的要求都极为严苛，倘若有一个步骤没有达到预期目标，都需要对之前的一步或几步进行修改，重新调整并执行。数据挖掘也有一定的兼并性，有些工作可能可以忽略其中的一些步骤，这要通过项目的实际情况来确定。其中最重要的一项，是根据数据仓库中的数据信息，选择合适的分析工具，应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息，得出有用的分析信息[1]。

数据挖掘可以通过对海量数据的整合和分析，寻找规律和问题的解决方案，提供给使用者无限的灵感和有价值的参考数据，并利用可以理解的方式呈现出结果，最大限度表示规律并证明规律的科学性，避免用户产生理解上的歧义。

根据调查情况，数据挖掘不仅给信息产业界带来巨大发展潜力，也引起了业界人的关注，和传统处理模式相比它的优势是可以涵盖海量数据信息，提供给广泛的人群使用，并且效率高，运算速度快，信息转化率高，对短时间内亟需大量信息的工作帮助很大，例如公司管理、生产控制造、科学研究、调研决策和工程安排等。数据挖掘不仅融合了统计学，抽样学的估计和假设检验等方面知识，也参考了人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。随着科学技术的日新月异，数据挖掘不再局限于计算机，在最佳方案推算、演算推理、信息可视化和信息检索方面也取得了突出成就。所以其对于图书馆信息管理的影响更不容小觑，这也证明了图书馆管理信息系统和数据挖掘技术结合的合理性[2]。

2 数据挖掘技术在图书馆管理信息系统中的具体应用

2.1 满足借阅者信息的动态变化

图书馆对于使用者图书借阅上限是有规定的，超过了借阅上限读者无法进行借阅，这个规定本身是为了保证图书馆的书籍在合理的范围内变动，也易于管理，但是通过实际情况来看，很多读者对于书籍的需求量较大，已经远远超过了规定的数量，特别是正在进行学术研究的读者，通常要阅览大量资料，而有些读者并没有这么多的借阅需要，导致资源不能合理分配形成一种倾斜浪费，而利用信息挖掘技术可以很快地调查出每个读者对于书籍量的需求，从而较好的分配图书资源，对于有特殊需求的读者教师可以放宽上限，也可以通过数据分析出每一个读者的借书规律，让图书馆资源科学流动[3]。

2.2 利用数据挖掘技术完善智能搜索

一般来说，读者借阅时一般要登录图书馆的电子信息平台，但是在搜索引擎上输入需要目标书名才会在下方出现提示，给读者查询提供相关信息，这细节决定着借阅效率，如果读者能迅速找到自己需要的书籍可以节约大量时间，但是很多书籍名很长，特别是一些专业类用书，可能不是简单的两三个字，读者在进行搜索时很有可能出现打错字等情况。这时就需要系统在数据挖掘的基础上快速推算出使用者需要的书籍，因为数据的类型可以是结构化的、半结构化的，甚至是异构型的。发现知识的方法可以是数学的、非数学的，也可以是归纳的。最终被发现了的知识可以用于信息管理、查询优化、决策支持及数据自身的维护等，所以对查询这一环节的帮助也非常明显。需要注意的问题是必须提高准确性，以及在浏览器中的适配性，保证整个环节在完全安全的环境下进行。

2.3 图书分类管理

聚类体现了一种信息组织的方法，是相对较特殊的知识组织方法，也可以变相地看做信息资源的整合和组织。通过对聚类对象进行主题分析和提取，将聚类对象转换为基于主题的表示形式通过对每一本图书的借阅频率数据分析，可以更好的评价图书的价值，也可以以此为依据进行分类摆放，通常从两个层次进行分析，一是总体的借阅量，二是近期的借阅量，还可以通过这种方法推算出借阅较频繁和借阅频率增幅较快的书籍及种类，再进行排列，比如将借阅频率高的书籍放在一楼或较明显的地方，方便使用者进行查找[4]。

3 结束语

总而言之，数据挖掘是一种资料探勘，也是一种数据采矿，揭示出隐含的价值信息，这种技术赋予图书馆信息管理系统更多活力，也大幅提高了总体操作的效率和准确性，我们必须在传统使用方式中发现问题并及时解决，创新方法，注重核心技术，提供给借阅者最优质，最便捷的服务，让图书馆管理迸发出更多能量。

参考文献

[1]卿瑞.数据挖掘技术在图书馆管理信息系统中的应用分析[J].数码世界，2017，000（007）：240.

[2]吕美霞.数据挖掘技术在圖书馆管理信息系统中的应用研究[J].中国管理信息化，2019，022（015）：148-149.

[3]徐德俊.数据挖掘技术在图书馆管理信息系统中的应用[J].黑龙江史志，2015，000（005）：266.

[4]张昕.数据挖掘技术在图书馆管理信息系统中的应用[J].湖南城市学院学报（自然科学版），2016，25（005）：63-64.

作者简介

曾俊（1980-），男，汉族，贵州贵阳人，本科，馆员，研究方向：图书馆计算机技术研究。