大型Web网络数据中心资源高效挖掘技术研究

2022.07.06

陈贵平
摘要：在大型Web网络数据中心构架中包含海量的多媒体信息资源，为了高效挖掘资源，提高资源的调度能力，提出一种基于模糊语义本体映射的大型Web网络数据中心资源高效挖掘技术。对大型Web网络数据中心的资源信息流进行信息流重建，采用泛化学习方法进行资源信息流的模糊聚类处理，结合语义本体映射方法实现互信息特征提取，以提取的特征为训练集，进行数据迭代，实现资源优化挖掘。仿真结果表明，采用该方法进行大型Web网络数据中心资源挖掘的准确性较好，资源调度的效率得到提高。
关键词： Web网络；数据中心；资源挖掘；多媒体信息；模糊语义
中图分类号： TN711?34； TP391 文献标识码： A 文章编号： 1004?373X（2017）24?0018?03
Abstract： Large amount of multimedia information resources exist in the architecture of large Web network data center. To improve resource scheduling capability by means of efficient resource mining， an efficient resource mining technology based on fuzzy semantic ontology mapping is proposed for large Web network data center. Resource information flow in large Web network data center is reconstructed. The generalized learning method is adopted to perform fuzzy clustering of resource information flow. Combined with the semantic ontology mapping method， the mutual information features are extracted and taken as the training set for data iteration and realize resource mining optimization. The simulation results show that the resource mining method for large Web network data center has good accuracy and can improve resource scheduling efficiency.
Keywords： Web network； data center； resource mining； multimedia information； fuzzy semantic
0 引言
随着网络多媒体信息技术的发展，大量的多媒体资源信息以视频、声音和文本等形式存储在大型Web网络数据中心，用户通过数据库访问和检索方法，进行多媒体资源调度使用。对大型Web网络数据库的访问建立在对数据中心资源的高效挖掘基础上，通过挖掘网络数据中心资源的关联特征信息，结合数据信息融合和聚类方法，实现资源调度和优化分类，提高资源的使用效率。研究大型Web网络数据中心资源高效挖掘技术，同样在Web网络数据库的优化设计中具有重要意义，相关的数据挖掘方法研究受到人们的极大重视[1]。在大型Web网络数据中心构架体系中，由于存储构架体系的差异性以及数据之间的扰动，导致对资源的挖掘和调度的准确性不好，容易出现数据冗余。对此，本文提出基于模糊语义本体映射的大型Web网络数据中心资源高效挖掘技术，并进行了仿真测试，得出有效性结论。
1 大型Web网络数据中心资源分布结构模型
1.1 大型Web网络数据中心资源的分布式结构构架
为了实现对大型Web网络数据中心资源高效挖掘，首先分析数据中心资源的分布式结构模型，并进行资源信息流的时间序列擬合和多维信息特征重组。通过资源优化挖掘，提高大型Web网络数据中心的访问和调度能力[2]。在大型Web网络数据中心中，数据库的存储节点通过分布式结构构建方式将资源存储在大型Web数据库中，数据库采用云存储构架模型进行数据读取，将大型Web网络数据中心资源数据进行二值图模型构建，表示为。在数据挖掘中，对采集的资源数据进行信息分类，分类集合A，B，融合聚类中心满足，。假设大型Web网络数据中心的数据存储模型为一个分布节点为，网络数据中心访问接口的信息融合中心函数满足，令：
为资源信息分布的模糊概念集，在数据分块中选择k个实例集，建立资源数据挖掘的聚类目标函数为：
对聚类目标函数进行极值优化求解，得大型Web网络数据中心资源挖掘模糊概念集为：
给定资源分布的4层量化信息结构模型[3]，通过分布式结构构架，得大型Web网络数据中心资源分布式的信息结构模型用二元拟合为：
在Web网络数据中心资源的分布式结构构架模型中，进行信息融合和数据聚类处理，实现资源高效挖掘。
1.2 大型Web网络数据中心资源信息流模型
在大型Web网络数据中心的查询向量集中通过查询接口进行信息特征提取，构建大型Web网络数据中心资源信息流模型，采用资源信息的文本块学习器和实例学习器构建资源信息分布的本体模型为：
采用本体映射方法构建一个包含n个特征分类属性的进行大型Web网络数据中心数据库语义映射关系，计算本体内元素之间语义相似度[4]。在资源存储空间中采用决策信息融合方法，资源信息流分布贝叶斯粗糙集可写为：
式中：是大型Web网络数据中心资源的有限论域；为资源挖掘的客观推理准则。构建资源信息流分布的信息函数，采用傅里叶变换进行时频特征分解[5]，过程为：
式中：为大型Web网络数据中心的非平稳态特征值；为边界域的时频联合分布；为分类特征参数；为置信增益函系数，在语义本体负域和边界域内，得到大型Web网络数据中心资源信息流的二值决策模型为：
在语义本体论域框架中，进行资源信息流模型拟合，为进行信息融合和资源挖掘提供识别框架内的幂集特征信息。
2 资源高效挖掘实现
在对大型Web网络数据中心资源信息流进行信息流重建后，进行资源高效挖掘算法优化设计，提出基于模糊语义本体映射大型Web网络数据中心资源高效挖掘技术，构建大型Web网络数据中心大数据信息流时间序列分析模型[6]，得网络数据中心边缘性状态函数表示为：
式中：代表大型Web网络数据中心锥形核分布状态矢量；为一个核函数。采用特征量化分解方法进行资源信息重组，表达式为：
求得大型Web网络数据中心多媒体资源流挖掘的最大梯度差[7]为：
式中：是资源信息语义指向性函数；m，n分别是大型Web网络数据中心多媒体资源的维数和频数。采用泛化学习方法进行资源信息流的模糊聚类处理[8]，得到聚类中心矢量分布集合描述为：
式中：，表示大型Web网络数据中心关联规则分布概率密度函数；X，Y为原始资源信息的负载量；是关联规则互信息函数。采用表示大型Web网络数据中心资源特征分布互信息量，结合语义本体映射方法实现互信息特征提取，得到资源分布的区域密度函数为：
式中：和分别是两组资源信息列分布的模糊聚类中心；表示资源信息流采样的长度；表示归一化区域分布密度。待挖掘的资源信息的关联属性为，结合语义本体映射方法实现互信息特征提取，得到特征提取结果为：
以提取的特征为训练集，进行数据迭代，实现资源挖掘，迭代式为：
式中：为初始聚类参量；为大型Web网络数据中心数据流样本的特征维数。
3 仿真实验与结果分析
为了测试本文算法在实现大型Web网络数据中心资源挖掘中的性能，进行仿真实验。实验中，软件工具采用Matlab 2010b，网络数据中心数据库采用Deep Web 200 GB，首先进行资源信息的原始数据采样，资源信息流采集的长度为1 024，数据采样的周期长T为0.04 s，实验信噪比为-10 dB，信息聚类自适应初始步长选为μ0=0.001。根据仿真环境和参数设定，进行资源仿真分析，进行大型Web网络数据中心资源信息流重建，重建时域波形如图1所示。
对图1采集的资源信息进行泛化学习和模糊聚类，结合语义本体映射方法实现互信息特征提取，实现资源挖掘，得到挖掘的精度对比结果如图2所示。分析图2得知，采用本文方法进行大型Web网络数据中心的资源挖掘的精度较高，性能更优。
4 结语
本文研究了大型Web网络数据中心资源高效挖掘问题，提出基于模糊语义本体映射的大型Web网络数据中心资源高效挖掘技术。通过实验分析可知，采用本文方法进行资源挖掘准确定位性能较好，资源调度能力较强。
参考文献
[1] 何力，丁兆云，贾焰，等.大规模层次分类中的候选类别搜索[J].计算机学报，2014，37（1）：41?49.
[2] 李永刚，张治中，李龙江.一种WLAN与eHRPD系统间负载均衡算法[J].微电子学与计算机，2017，34（1）：44?47.
[3] 王亞强，汤铭，曾沁，等.级联式低消耗大规模网页分类在线获取方法[J].计算机应用，2017，37（4）：924?927.
[4] 潘颖，元昌安，李文敬，等.一种支持更新操作的数据空间访问控制方法[J].电子与信息学报，2016，38（8）：1935?1941.
[5] 郭明强，黄颖，谢忠.一种多核环境下的WebGIS模型优化策略[J].计算机工程，2013，39（8）：15?19.
[6] 韩国辉，陈黎，梁时木，等.Na?ve Bayes分类器制导的专业网页爬取算法[J].中文信息学报，2010，24（4）：32?38.
[7] TEA T， BOGDAN F. Visualization of Pareto front approximations in evolutionary multiobjective optimization： a critical review and the prosection method [J]. IEEE transactions on evolutionary computation， 2015， 19（2）： 225?245.
[8] 王亚玲，李春阳，崔蔚，等.基于Docker的PaaS平台建设[J].计算机系统应用，2016，25（3）：72?77.