云计算下的图书馆条码分类与查询技术研究

宋惠兰



摘 要: 图书馆中图书排列变动大,不利于进行图书档案信息管理,为了克服上述情况,设计云计算下的图书馆条码分类与查询系统,进行条码计算与管理、通信与图像采集。系统使用的条码分类技术通过对条码图像进行腐蚀、膨胀、重建实现粗分类,再通过开运算和开重建进行精分类,最后输出分类结果。条码查询技术以解码技术为基础,通过对条码图像上的扫描图形进行扫描和定位,获取条码扫描宽度,依照图书档案计算公式实现条码查询。测试结果表明,系统的分类与查询误差小,查询效率高,在复杂条件下也能实现条码的高效、准确查询。
关键词: 云计算; 图书馆; 条码; 分类查询
中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2017)13?0130?04
Abstract: The big variation of books arrangement in the library is bad for the management of book archive information. In order to overcome the above situation, the library barcode classification and query system under cloud computing was designed to perform the barcode calculation and management, communication, and image acquisition. The barcode classification technology is used in the system to realize the rough classification for the barcode image after corrosion, expansion and reconstruction, and perform the fine classification for the barcode image after open operation and reconstruction to output the classification results. The barcode query technology is based on the decoding technology to scan and locate the scanning pattern on the scanning image to acquire the scanning width of the barcode. The barcode is queried according to the computing formula of book archives. The test results show that the system classification and query errors are small, the query efficiency is high, and can query the barcode efficiently and accurately under complex conditions.
Keywords: cloud computing; library; barcode; classification query
0 引 言
條码技术[1]是在信息技术上兴盛起来的,它集合解编码、数据识别、数据采集与控制等技术,使用时不受时间与地点的约束,信息录入效率高、成本低、可靠性好,越来越多的领域受益于条码技术。条码技术发展至今,出现了一维条码和二维条码两种类别。一维条码的存储量小、显示效果不佳,已逐渐被淘汰。二维条码的功能具有多样性,使用更加广泛,但采集过程中容易出现噪声干扰,因此,对二维条码的深度研究具有十分重要的意义。
信息化时代的来临,使得图书馆图书档案的管理难度大幅度降低,将条码技术与图书档案结合起来,更是使档案索引效率得到明显提升。图书馆的客户流动性大,图书排列顺序每天都会发生大变动,利用条码技术管理图书档案的难点在于如何对条码进行准确分类和高效查询[2],为客户提供更好的服务。2006年,云计算[3]被首次提出,近年来,云计算以其安全性能高、资源消耗少、数据处理能力强等优势受到了广泛重视。在图书馆图书档案管理中,采用云计算对条码分类与查询技术进行研究是一项新兴课题,且极具发展前景。
为了克服当前存在的不足,设计了基于云计算的图书馆条码分类与查询系统,结果表明,该系统的分类与查询效率高。
1 云计算下的图书馆条码分类与查询
1.1 云计算下的图书馆条码分类与查询系统架构
采用云计算作为图书馆条码分类与查询系统的底层架构,管理进行分类与查询的计算硬件,对硬件资源进行虚拟仿真和计算,为图书馆图书管理员提供条码分类功能,为客户提供条码查询功能,增强图书条码的管理灵活性。云计算下的图书馆条码分类与查询系统架构如图1所示。
由图1可知,云计算下系统架构分为三层,分别是服务器层、数据通信层和应用层。系统分为私有云和公有云[4],基础架构相同,但私有云的使用对象是图书管理员,公有云面向全体客户,既保证了图书的统一管理与服务,又维护了图书条码分类秩序。
服务器层进行条码计算与管理任务。管理中心通过云计算虚拟化功能管理计算硬件,并向数据通信层和应用层传达虚拟资源。计算硬件中包含多种虚拟仪器,如开放源代码虚拟机监视器和VMware虚拟机等,共同进行条码分类处理。
数据通信层通过网络实现通信,为防止通信干扰,组建了网络防火墙。网络接口有两种:一种是GUI接口[5],中文释义为图形用户接口;另一种是B/S(Browser/Server,浏览器/服务器模式)结构接口[6]。GUI接口与传统的命令接口相比,更适合进行条码管理,在云计算的支持下,GUI接口的管理能力也得到了提升。B/S结构提供给客户通过浏览器对图书档案进行接收的功能,可对基础计算资源进行远程访问。
应用层的移动终端对条码图像进行采集,以手持为主,便于图书管理员巡视图书馆。条码图像上传至云端,采用云计算进行分类和解码,根据解码结果进行条码查询。云计算解码软件安装在移动终端上,其以面向服务的体系结构进行开发,解码准确率高、抗干扰性能强,为条码查询提供了便利。
1.2 云计算下的条码分类
图书馆中图书条码分类的实时性强,要求高效且准确[7]。特定时间内的条码分类数量取决于条码分类技术的时间开销,将分类流程分为粗分类和精分类两段进行条码处理,可减少时间开销。图2是条码分类技术处理流程。
如图2所示,设条码图像结构元素集合的尺度序列为未分类前的图像表示为经腐蚀处理去掉图像色彩变为灰色图像,表示为与的关系式为:
条码图像中存在大片空白相接区域,条空比例[8]表示空白区域与噪声区域的连续比值。以条空比例11513为例,其中的1表示噪声像素点,5和3表示空白区域。条空比例表示的像素点1中有可能存在多个像素点,与1相接的相同数值越多,噪声越大。在过滤中的噪声像素点时,以与1相接的相同数值数据长度为直径进行滤波,排除噪声,增大条码图像空白区域的相接面积。设空白区域相接面积为其最大值为为膨胀倍数,则:
式(2)的计算过程即为尺寸结构元素的膨胀过程,将条码图像中所有都进行一次膨胀,得到条码图像重建结果。当膨胀倍数趋于无穷大时,条码图像会发生收缩而非膨胀[9],由此可以看出,的取值并非越大越好,但过小的值对噪声的排除具有不利影响,至少应保证膨胀倍数大于腐蚀强度,故令如此便可在条码图像正常膨胀的基础上最大限度地排除噪声干扰,并保留高精度的实时分类性能。
为保证分类精度,条码图像重建过程至少进行2次,将相邻的两幅重建图像进行对比,直到获取到两幅相同的相邻图像,函数关系为。之后进入精分类,精分类分为开运算和开重建两步进行[10],开运算的处理过程如下:
图书馆中每本图书都有不同的开重建的作用就是提供一个条码分类规则,将同类型的进行汇总和排列,最后输出条码分类结果。由于只需进行条码分类,因此没必要对粗分类的膨胀过程进行收缩,以节省分类时间。
1.3 云计算下的条码查询
图书馆条码查询技术的基础是解码技术,对解码结果进行显示可获取条码中图书档案信息的查询结果,解码流程为:
(1) 提取条码图像中像素色度的两端极限值,设极限值的平均值为分界值,将图像像素全部替换为深浅两种色度。
(2) 条码图像四个边角上存在三个扫描图形,经第(1)步处理后,扫描图形的色度应为深浅相间,清楚地观察到扫描线,如图3所示,点是扫描线与扫描图形边界的交点,同时,同比例上下移动和90°翻转移动两点,直到扫描图形被完全扫描,获取三个扫描图形的中心点。
(3) 定位扫描图形,获取条码上方两个扫描图形的宽度和以及两个扫描图形中心点之间的距离如图4所示。
当时,将所得结果与图书档案标准进行对比,实现条码查询;当时,设为条码的云计算虚拟尺寸,如果落在条码像素的深色区域内,若落在浅色区域,
2 仿真实验
2.1 数据集
在条码分类测试实验中,使用多功能条码在线生成器生成500个图书条码,条码中记录的图书类型包括理学类、文学类、工学类、体育类和外文类,每种类型均生成100个条码。对比DNA条码分类技术、标准化条码分类技术和本文系统的条码分类技术,在相同时间限制下获取500个图书条码的正确分类数量,得出本文系统的条码分类性能。为同时测试系统分类性,将时间限制设置在最小时间采集点上,超出采集点的分类数据均视作无效。
2.2 结果与分析
表1中记录了三种条码分类技术的分类结果准确率,由表1可知:理学类和工学类的图书条码分类准确率最低,造成这种现象的原因主要是理学和工学之间存在一部分的信息共通点。外文类图书条码的分类效果最佳,这点毋庸置疑,但标准化条码分类技术仍存在2%的外文类分类误差,纵观其所有类型的分类准确率,都未能进行有效分类。DNA条码分类技术在对理学和工学的条码分类上性能不高,其原因有可能是条码图像噪声过滤不彻底或者分类效率低。本文系统的条码分类技术仅存在微小的分类误差,分类性能非常好,也间接体现了其高效性。
使用条码生成器生成如图5所示的4个二维条码,分别录入阿拉伯数字、英文字母、数字+字母、数字+字母+中文四种形式的图书档案信息,不同组合形式下的信息量均相同。利用本文系统的条码查询技术、快速响应矩阵查询技术以及轮廓拟合查询技术测试图5中的图书条码,测试结果见表2和表3。由表2和表3可知,本文系统的查询性能最好,查询准确率和查询效率都很高。
对图5(a),图5(b)进行条码污染,对图5(c),图5(d)中的某一处进行擦除形成残缺,再次进行测试,测试结果如表4和表5所示。本文系统的测试结果无较大变化,快速响应矩阵查询技术和轮廓拟合查询技术的查询性能则明显下降,表明本文系统能够在复杂条件下进行正常条码查询。
3 结 语
本文将条码技术与图书档案结合起来,设计了云计算下的图书馆条码分类与查询系统,对系统应用的条码分类技术和条码查询技术进行研究和测试。测试结果表明,本文系统的分类结果和查询结果误差小,查询效率高,在条码残缺的情况下也能正常查询到图书档案信息。
参考文献
[1] 董曦京.圖书馆行业条码数据模型标准化方案研究[J].国家图书馆学刊,2015,24(4):51?59.
[2] 李超,王正亮,杨倩倩,等.DNA条形码技术的应用研究[J].中国计量学院学报,2014,25(3):231?237.
[3] 耿向博.云计算环境下高校图书馆学科服务模式的创新[J].科技情报开发与经济,2014,24(1):55?57.
[4] 吕瑾瑜.指纹识别技术在图书馆的应用与研究[J].河南图书馆学刊,2015,35(11):129?130.
[5] 贾应炜.云计算环境下的GIS软件工程设计分析[J].现代电子技术,2015,38(17):133?134.
[6] 梁静.云计算环境下高校图书馆信息资源的共享与融合[J].科技情报开发与经济,2014,24(15):49?51.
[7] 倪斌.云计算系统中能量有效的数据摆放算法和节点调度策略[J].现代电子技术,2015,38(9):80?82.
[8] 江颖,张仪,郭云海.DNA条形码技术在软体动物分类学中的研究进展[J].中国寄生虫学与寄生虫病杂志,2016,34(1):80?83.
[9] 王华武,苏克芳.加强服务提升质量促进商品条码信息服务平台的发展[J].中国管理信息化,2015,18(1):208?209.
[10] 王博.凸增量极限学习机的逼近阶[J].西安工程大学学报,2015,29(6):756?760.