大数据分析在大学图书馆的应用探索

    王娟

    【摘? 要】近年来,大数据的应用对高校图书馆工作产生了巨大的影响。论文运用调查法、文献法等就大数据分析对图书馆的影响以及其在大学图书馆中的应用进行分析探究,以供参考。

    【Abstract】In recent years, the application of big data has a huge impact on the work of university library. The paper uses survey method, literature method and other methods to analyze and explore the impact of big data analysis on library and its application in university library, for reference.

    【关键词】大数据分析;图书馆;应用路径

    【Keywords】big data analysis; library; application path

    【中图分类号】G250.7;G258.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻标志码】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章编号】1673-1069(2021)03-0188-02

    1 引言

    互联网、计算机等现代化技术在一定程度上改变了高校图书馆读者的阅读方式与图书馆的用户服务模式,高校图书馆数据开始逐渐呈现出多类型、高价值、快速处理以及海量激增等特征。在此情况下,传统的数据处理方式已经不再适应当前工作,高校图书馆必须引进与应用更为先进的数据处理技术来提高数据利用率,提升图书馆服务水平。下文结合实际情况,就大数据分析在大学图书馆中的应用问题作具体分析。

    2 大数据分析的特点与作用

    对于什么是大数据,《社会消费网络营销》中提出:(大数据)包括企业信息化的用户交易数据,社会化媒体中用户的行为数据和关系数据,以及无线互联网中的地理位置数据[1]。大数据的概念来自欧美国家,而对于大数据分析,我们可以将其理解为是一种数据工具。大数据分析包括数据收集与数据分析,通过收集与分析大量数据,获得信息不对称的优势,并据此对事物发展趋势作出预测。

    通过简单调查与研究可知,高校图书馆数据总量正在快速增长,且在相关技术等的影响下数据的结构也更加复杂。数据结构的变化与数量的增长使得图书馆处理数据的难度加大,若不借助先进的技术手段,许多数据将可能被埋没、遗失,无法发挥出作用,这无疑不利于图书馆服务水平的提高。鉴于此,高校应当将大数据分析应用于图书馆建设,借助有效的数据分析技术从海量数据以及复杂的数据环境中有效挖掘、获取、理解大数据的价值,让各项价值数据得到充分利用,让图书馆的建设能力以及服务能力得到提升。

    3 大数据分析在大学图书馆中的具体应用

    3.1 利用大数据分析构建个性化集成服务系统

    高校在开展图书馆建设以及推送个性化服务等工作时,可以将大数据分析作为基础构建一个个性化的集成服务原型系统,利用该系统来为读者制定阅读方案或者制定读书推送计划,让图书馆的各项工作更具针对性与有效性。在构建该系统时,高校图书馆利用大数据分析技术对图书馆读者的行为数据进行挖掘与分析,通过对海量数据的分析掌握读者的阅读需求、喜好以及习惯等,在此基础上为读者提供个性化的推送、检索以及讲解服务。

    3.2 基于大数据分析制定个性化服务策略

    在大数据时代,高校图书馆可将大数据分析技术作为基础为读者制定个性化服务策略,该个性化服务策略包含交互性、能动性、个性化、人性化、实时性这五大特征。图书馆可通过制定与使用以上策略来提升服务水平,让图书馆读者的多样化阅读需求与学习需求得到满足。在数据挖掘与分析技术的支持下,高校图书馆可实现对读者行为数据的实时收集与动态分析,能实现对用户行为数据的深入挖掘与安全储存,能够基于数据了解不同读者的不同特性,从而让图书馆的各项服务更具个性化、人性化。

    高校图书馆在制定以及使用个性化服务策略时,需利用大数据分析技术完成以下步骤:首先,获取关联数据。高校图书馆可借助大数据分析将各种异构化的学科知识库联合起来,构建起海量的语义网络库检索平台,使用户能便捷、高效地完成各项检索,让用户部分需求得到满足。其次,进行信息挖掘分析。结合以往经验可知,当我们对某用户的行为数据进行频繁且大量的采集时,这些数据就会在数据库中产生过拟合的状态,从而导致我们无法准确分析出用户的行为特征。因此,在使用大数据分析技术对高校图书馆用户行为数据进行收集时,应当利用个性化的推荐模型对海量数据进行筛选,利用这一模型筛选出有效数据,从而使数据分析结果具备实际的参考价值。最后,推出用户兴趣。要想为图书馆用户提供更加个性化与人性化的服务,高校图书馆还需借助大数据分析技术来获得用户情感指标。具体可通过分析用户个人日志来明确用户的隐性与显性表达,最终得到用户兴趣结果,使图书馆的各项服务更加科学合理。

    3.3 结合大数据分析编制个性化服务方案

    在大数据时代,高校图书馆可充分利用大数据分析技术来为读者编制个性化的服务方案。例如,为读者构建用户行为数据库、用户兴趣与需求挖掘中心以及个性化服务平台等。具体分析如下:

    首先,高校图书馆可基于大数据分析技术为用户构建用户基本信息数据库以及服务日志数据库,利用这两大数据库对用户日常行为数据进行管理与利用,并在平时借助用户行为模型完成对数据库的更新,让图书馆的各项建设与服务工作拥有更多的参考信息。其次,高校图书馆可利用大数据分析技术对个人用户的行为数据进行统计,对全体用户的日志数据进行挖掘与分析,利用大数据分析技术将有关联的数据进行提取整理获得各种聚类结果。基于各种聚类结果就能对用户群体的某项显性或隐性特征有所把握。最后,在基于大数据分析初步掌握了用户性质与需求后,图书馆就能为用户制定以及提供更加个性化与人性化的服务。为了进一步优化读者阅读体验,提高读者对图书馆服务的满意度,高校图书馆还可在利用大数据分析结果的基础上再参考图书馆原有的专利库、书目库、知识库、论文库等,将这些数据库与用户行为特征进行匹配与结合,在此基础上形成更具个性化与针对性的阅读服务方案。

    4 大数据分析在大学图书馆中应用的策略

    4.1 建设良好的物理环境

    要想让大数据分析技术在高校图书馆建设以及服务工作中充分发挥作用,高校就需要建设好相应的物理环境,如构建起高性能计算平台等。目前,部分高校为大数据分析技术的运作建设了Hadoop平台,该平台功能相对丰富,能为数据挖掘、计算等提供支持。Hadoop平台主要由两个功能模块组成:一是数据挖掘模块;二是数据存储模块。在执行数据挖掘任务时主要是通过Spark架构以及Map/Reduce数据对目标数据进行挖掘。而在对数据进行存储时主要是通过分布式文件系统进行操作。

    4.2 选择与构建数据挖掘框架

    要想提高大数据分析的质量以及效率,高校需要根据大数据分析的特征以及需求建设数据采集与挖掘框架。随着科学技术的发展,当前能够支持大数据挖掘与分析的框架也相对较多,但Map/Reduce和Spark框架可以说是最为适合高校图书馆工作的框架。该框架功能丰富,不仅包含线上的数据采集与应用模块,而且还能为线下建模以及数据存储工作的开展提供支持。具体来说,Map/Reduce和Spark框架线上部分的数据采集采用了HDFS和HBase等功能完成用户行为数据的存储和读写过程,使得数据采集过程非常灵活方便。而在线下进行建模时,Hadoop平臺的数据处理机制又能为建模活动提供很大帮助,并且在建模结束后,可基于该平台采用回归算法、聚类算法以及分类算法等数据挖掘方法对数据的内在含义以及隐藏价值进行分析,结束初步挖掘后再使用更高精度的基础算法获得价值更高的信息,从而让图书馆各项工作更容易开展。

    4.3 科学选择基础算法

    在高校基于大数据分析为用户提供个性化服务时,必须结合实际情况合理选择基础算法,以此保证最终的服务效果。当前,可供选择的基础算法较多,为确保基础算法选择的科学性与合理性,高校图书馆应综合考虑以下因素:首先,基础算法必须正确、准确。在选择基础算法时,相关人员需对用户行为特征与用户内容特征之间的比例进行分析,如果用户行为特征的区分度较高,那么就可借助用户行为特征的区分度完成推荐算法的计算;而当用户内容特征的区分度较高时,就可借助用户内容特征的区分度完成推荐算法计算。其次,算法要保证高效。当前有许多个性化的推荐系统采用的是离线计算模式,这种模式下的计算流程是:先完成对大量用户行为数据与内容数据的采集,再将所有数据进行一次性挖掘,最后在离线状态下计算出结果。这种计算方法虽有一定的可行性,但也存有许多不足,如计算效率低。因此,建议高校图书馆可适当改变算法,如采用增量挖掘的建模方法来提高计算效率与质量。

    5 结语

    综上所述,大数据分析能为高校图书馆的建设及服务等工作的开展带来很大帮助。因此,在当前背景下应进一步加强对大数据分析的研究以及推广应用,让大数据分析的作用价值得到充分发挥。

    【参考文献】

    【1】杨伟超,邹瑜,徐萍,等.基于大数据的图书馆资源分析系统研究[J].信息与电脑(理论版),2020,32(23):219-221.