大数据分析在高校智慧教育中的应用研究

沈贵庆
关键词: 大数据分析; 高校智慧教育; 数据挖掘算法; Hadoop技术; 云计算; 学生认知模型
中图分类号: TN919?34; TP393 ? ? ? ? ? ? ? ? ?文献标识码: A ? ? ? ? ? ? ? ? ? ?文章编号: 1004?373X(2019)04?0097?04
Application research of big data analysis in college wisdom education
SHEN Guiqing
(Northwest A & F University, Yangling 712100, China)
Abstract: It is difficult to accurately analyze the students′ learning behavior from massive intelligence resources in the traditional data analysis platform for college wisdom education, resulting in the low accuracy problem in the difficulty prediction of test?oriented questions. Therefore, the big data analysis research is carried out for college wisdom education. The composition of the intelligent education system architecture and the data analysis platform are given. The Hadoop technology is used to analyze and process the wisdom education resources. The data mining algorithm in combination with the cloud computing technology is used to deeply analyze and explain the collection and convergence of student learning behavior data. The implicit and explicit behaviors of students′ learning are obtained to evaluate the education quality, predict students′ future learning performance, and establish the student cognitive model and visualization chart. The acquired data is intelligently integrated into the wisdom education system architecture. The system architecture is applied to the question?answering data provided by the online education system, so as to predict the difficulty of English reading test. The test results show that the prediction performance of the test difficulty evaluation is good.
Keywords: big data analysis; college wisdom education; data mining algorithm; Hadoop technology; cloud computing; student cognitive model0 ?引 ?言?
大數据、人工智能技术的发展和广泛应用,使得“互联网?教育”成为高等院校教育改革与发展的重要研究方向[1]。“智慧教育”的提出更是将高校教育信息化提升到前所未有的新高度[2]。面向高校智慧教育的大数据分析逐渐成为研究广泛关注的重要研究方向之一[3]。目前,相关学者已研究出多项针对智能辅助系统的数据分析平台。例如:李爽等人通过学生学习行为投入测量指标构建数据分析平台[4]。这些测量指标更有利于分析和测量教学智能辅助系统的学习行为。周效章以云计算、大数据分析技术为依托,按照“线上?线下?线上”为教育实施路径,构建了“在线教育平台+学习中心”融合教学模式的数据分析平台[5]。上述数据分析平台缺乏对学生学习行为数据合理的整合管理模式,易造成信息孤岛,无法准确分析学生学习行为数据,导致在面向试题时的难度预测精度较低。在分析国内智能辅助系统的数据分析平台现存问题的基础上,构建“面向高校智慧教育的大数据分析平台”,以推动我国高校智慧教育发展。1 ?高校智慧教育大数据分析
1.1 ?高校智慧教育体系架构
高校智慧教育体系架构属于多层次体系结构,共6层:感知层、通信层、云计算层、业务层、数据层和智能服务层。由这6层结构构成体系架构如图1所示。模型中感知层负责将系统环境与外部高校环境进行信息交互,通过传感器、移动终端等设备实时感知高校环境和教师、学生信息,并将感知数据经由通信层上传[6]。网络通信层负责将感知层获取的相关数据传输到业务层,为高校学生提供网络访问服务。云计算层采用虚拟化技术实现高校校园可视化、可靠的云服务。业务层主要负责为高校师生的教学、管理提供全方位、多角度的服务支撑。数据层采用大数据分析技术,综合学生的学习行为数据,在网络空间内构建教育体系架构的虚拟框架,并对框架做出全方位的描述,为高校智慧校园的不同应用方向提供数据支持。智能服务层主要负责对不同应用系统进行深度整合,给学生和教师提供个性化服务。整合处理后,最终展现在师生面前的不是一个生硬的应用系统,而是一个以个性化服务为宗旨、以师生需求为导向的智能信息化服务平台[7]。
1.2 ?面向学生学习行为的大数据分析技术
通过收集学生学习阶段相关数据,对收集的数据进行预处理,预处理过程包含数据清洗、数据规整化处理等,预处理后针对学生的学习行为数据构建相应的数据分析模型,分析高校学生该学期针对学习任务制定的学习模式以及对知识的掌握程度。将数据分析结果反馈给学生和教学管理者,学生和教学管理者针对此结果调整学习计划和教学进度。
1.2.1 ?收集高校学生学习行为数据对高校学生学习行为数据统一化标准处理过程如图2所示。
智慧教育与当前高校教育方式的不同之处在于,高校智慧教育是以高校学生为中心,以综合多媒体课堂互动的方式,鼓励高校学生根据自身学习情况开展新型学习模式。如何从含量的学生学习行为数据中发现学习行为的潜在规律,是当前阶段亟待研究的重要问题。根据xAPI数据规整化基准采集学习行为记录。不规整的学习行为数据以xAPI数据规整化基准调整后,可实现检索、读取和写入功能。
预测分析报告框架中的学习应用平台通过设置不同的数据采集器,对学生与教育体系架构应用平台的交互数据备份,存入本地数据库中,并间隔给定周期将这些数据传送到教育体系架构的数据分析平台的学习行为存储模块中。
高校学生在不同学期、不同场景下学生的学习行为是不同的,通过学生对不同学习工具在各个阶段的实际应用,分场景、周期采集有效的学习行为数据,以xAPI数据规整化基准进行传输,形成大数据分析的基本条件[8]。
1.2.2 ?学习认知情况度量
通过分析结果评价学生对教学内容掌握程度,达到对学习成绩的预测。对预测结果进行详细解释并建立学生认知模型[9],采用可视化技术全方位展示分析结果。具体步骤如下:
评价体系中就学生对教学内容的掌握程度,给出不同评价指标的评价基准,不同的评价指标相应的权重不同,构造一个模糊一致判断矩阵[R],采用该矩阵衡量评价等级与相关因素之间重要性的对比结果,矩阵形式描述如下:
[R=r11 ? … r1n ? ? ? ?? ? ? ??rn1 ? … rnn] (1)
式中,[rnn]表示隶属度函数。对式(1)给出的各行因素进行求和,获得[h1,h2,…,hn],此时因素[ai]的权重为:
[τ=hih1+h2+…+hn] ? (2)
以上为评价指标的权重确定方法,通过专家对比,获得不同评价指标的权重。
依据评价标准,邀请多个专家评价学生对教学内容的掌握程度。各项评价指标通过[X={x1,x2,…,xn}]描述,[Y={y1,y2,…,ym}]表示评价结果集合,将评价结果划分为5个等级,描述为[y1],[y2],[y3],[y4],[y5],表示“完全掌握”“90%的部分可以掌握”“80%的部分可以掌握”“70%的部分可以掌握”“60%的部分可以掌握”。對于不同的评价指标,可通过构造一个模糊评价矩阵来全面描述:
[T=t11 ? … t1m ?? ? ? ? ? ? ? ? ?tn1 ? … tnm] ?(3)
式中,[tnm]表示矩阵[T]相应的隶属度函数。
以下给出二级指标的模糊评价因素集的权重:
[A=[a1, ?a2, ?…, ?an]] (4)
结合最大隶属度基准判定,评估教育质量,预测学生日后学习表现,构建认知模型。
采用可视化技术全方位展示学生学习行为数据的分析结果:采用饼状图来描述行为数据类型的分布情况;通过饼状图的面积大小分析不同行为数据类型的分布情况,所占面积越大说明该学生对此类学习活动更感兴趣;通过折线图来描述学生对课堂测试题目的准确性,通过折线中走势的变化观测学生对已学内容的掌握情况;通过柱状图来表现学生在此学期中某一天的学习活动数;通过散点图来描述学生参与教学活动的活跃程度[10]。2 ?实验结果与分析
为了验证面向高校智慧教育的大数据分析平台的综合有效性,需要进行一次实验验证。仿真实验在配置为WIN 7操作系统、Intel酷睿Ⅱ处理器、1.86 GHz主频、2.95 GB RAM的笔记本计算机进行。
将数据分析平台应用于某高等院校提供的学生高数答题数据,采用近200万的答题记录,预测高数科目测试题的难度,选取均方根误差(RMSE)衡量准确性能;利用排序准确度(DOA)评测高数科目试题对之间的难度排序正确率;利用皮尔逊相关系数(PCC)测试高数科目测试题难度与学生成绩之间的关系。
利用t检验通过率评测高数科目测试题难度评估结果的置信水平。上述评价指标中,均方根误差(RMSE)值越小,说明预测结果精度越好;剩余指标值越大说明预测模型性能越好。图3给出试题难度预测结果,对比方法包括文献[4]给出的数据分析平台和文献[5]给出的数据分析平台。为了简化描述,将文献[4]给出的数据分析平台和文献[5]给出的数据分析平台下的预测模型以及所提平臺下的预测模型分别表示为A1,A2,A3。 从图3中可以看出,与文献[4]、文献[5]给出的数据分析平台下的预测模型相比,所提平台下的预测模型能够更准确地对英语测试题进行难度预测。
分别采用文献[4]、文献[5]给出的数据分析平台下的预测模型以及所提的预测模型,预测高校学生多次答题得分结果,不同方法对高校学生成绩预测表现在A数据集和B数据集的对比结果如图4所示。从图4中可以看出,所提平台下的预测模型能够对得分结果进行高精度预测。3 ?结 ?论
将大数据分析技术应用于高校教育领域,降低了高校智慧教育数据采集、转换、集成和挖掘的门槛,使定量研究高校智慧教育行为、优化教学方案成为可能。大数据分析技术对高校教学环境以及师生课业发展产生了深刻的影响,使广大师生和学校受益。
参考文献
[1] 蒋东兴,吴海燕,袁芳,等.高校智慧校园成熟度模型与评价指标体系研究[J].郑州大学学报(工学版),2017,38(2):1?4.
JIANG Dongxing, WU Haiyan, YUAN Fang, et al. Research on the wisdom campus maturity model and the evaluation indexes [J]. Journal of Zhengzhou University (Engineering science), 2017, 38(2): 1?4.
[2] 李朝晖,陈迪新.基于众创的高校图书馆智慧服务模式研究[J].图书馆工作与研究,2017,1(7):57?62.
LI Chaohui, CHEN Dixin. Research on the smart service mode of university library based on group innovation [J]. Library work and study, 2017, 1(7): 57?62.
[3] 李馨.高等教育大数据分析:机遇与挑战[J].开放教育研究, 2016,22(4):50?56.
LI Xin. Big data analytics in higher education: opportunities and challenges [J]. Open education research, 2016, 22(4): 50?56.
[4] 李爽,王增贤,喻忱,等.在线学习行为投入分析框架与测量指标研究:基于LMS数据的学习分析[J].开放教育研究,2016,22(2):77?88.
LI Shuang, WANG Zengxian, YU Chen, et al. Mining LMS data for behavioral engagement indicators in online learning environments [J]. Open education research, 2016, 22(2): 77?88.
[5] 周效章.“在线教育平台+学习中心”融合教学模式构建研究:基于沪江教学模式的分析与思考[J].现代教育技术,2017,27(10):33?40.
ZHOU Xiaozhang. The research on the construction of integrated teaching model of "online education platform + learning center": based on analysis and reflection about the teaching mode of Hujiang [J]. Modern educational technology, 2017, 27(10): 33?40.
[6] 曾忠禄.大数据分析:方向、方法与工具[J].情报理论与实践, 2017,40(1):1?5.
ZENG Zhonglu. Big data analysis: directions, methods and tools [J]. Information studies: theory & application, 2017, 40(1): 1?5.
[7] 肖源,郝杰,刘莹,等.信息分析视角下的大数据分析平台构架研究[J].情报科学,2016,34(9):83?89.
XIAO Yuan, HAO Jie, LIU Ying, et al. Research on the framework of big data analysis platform in the perspective of information analysis [J]. Information science, 2016, 34(9): 83?89.
[8] 严萍.高等职业院校人才培养工作评估的反思与改进:基于安徽省两轮高职评估大数据分析[J].职业技术教育,2016,37(18):30?34.
YAN Ping. Reflection and improvement on the evaluation of personnel training in higher vocational colleges: based on analysis on the massive data of evaluation of two rounds of higher vocational colleges in Anhui province [J]. Vocational and technical education, 2016, 37(18): 30?34.
[9] 张兵.一种用于云计算数据库的数据挖掘方法研究[J].控制工程,2016,23(6):956?960.
ZHANG Bing. Study of data mining method for cloud computing database [J]. Control engineering of China, 2016, 23(6): 956?960.
[10] 杨可晗,马琼.大数据下提高远程教育质量提取有效资源仿真[J].计算机仿真,2017,34(4):212?215.
YANG Kehan, MA Qiong. To improve the quality of distance education and the simulation of effective resources under the big data [J]. Computer simulation, 2017, 34(4): 212?215.