MOOC学习者在线学习行为和学习绩效评估模型研究

    沈欣忆 刘美辰 吴健伟 董现垒

    

    

    

    【摘要】? MOOC的自主性和灵活性特征,使得学习者具有多样化的学习行为模式,很多研究指出学习者在线学习行为模式与学习成果具有高度相关性。线上授课的教学方式因为其便捷等各种优点,广泛被学生群体所接受,虽然线上授课弥补了传统教学的不可重复性等缺陷,但是由于每个学生的在线学习行为不同,其教学效果也因人而异,本研究尝试从国内最早的MOOC平台“学堂在线”上获取学生的学习行为数据,建立学生在线学习行为与在线学习绩效评估模型,并进行抽样逐步回归,以了解学生在线学习行为对其学习成绩的影响。结果表明,学生某些在线学习行为,如作业完成比例、视频完成率等对其学习效果产生重要的正面影响,反之部分在线学习行为对学习效果会产生不良影响。因此,根据本研究结果对教师设计在线学习、对学生开展线上学习提供意见和建议,将有效提高在线学习的效率和效果。

    【关键词】? 在线学习行为;学习绩效评估模型;在线学习者;教育大数据;数据挖掘;学堂在线;Python

    【中图分类号】? ?G434? ? ? ? 【文献标识码】? A? ? ? ?【文章编号】? 1009-458x(2020)10-0001-08

    一、引言

    “互联网+”时代,在线学习已经被应用于各个教育阶段,是学习者不可或缺的学习方式。在线学习因其不受时空分离的影响,学习方式变得更加灵活,信息化时代所具有的精细化、碎片化和去权威化的特征更加凸显(夏青, 2018)。MOOC(Massive Open Online Course,MOOC)的自主性和灵活性特征,使得学习者具有多样化的学习行为模式,很多研究指出学习者在线学习行为模式与学习成果具有高度相关性(Johnson & Sinatra, 2013; 高洁, 2016; 李爽, 2016)。在“互联网+”背景下,大数据迅速充斥着各行各业,教育领域也不例外,随着学习分析和人工智能技术等的发展,利用学生在线学习行为数据来评估学生的学习表现以为学生提供更好的服务已经成为不可阻挡的趋势(Francisco, García, ?ngel, & María, 2018; Tsai, Lin, Hong, & Tai, 2018),数据挖掘成为深入探究在线学习行为以及行为数据背后隐藏的行为模式和学习绩效的关联性的重要方法 (Jesús, Alejandro, & Manuel, 2017; Elena, Zhang, Cristina, & Francisco,2018; Manuela, Tiago, Fernando, & Marco, 2018)。

    本研究选取“学堂在线”的一门课程,运用Python技术对学生在线学习行为数据进行整理加工,建立学生在线学习绩效评估模型,最后利用Stata进行抽样逐步回归,形成学生学习行为对学习绩效的贡献模型,分析和发掘有利于提高学生学习绩效的在线学习行为,助力在线学习过程性评估的研究,同时也为MOOC学习绩效提升提供实质性建议。

    二、MOOC在线学习行为和学习绩效研究现状

    (一)在线学习行为和学习绩效的关系研究

    随着现代信息技术的迅速发展,网络技术在教育中的应用日益广泛和深入,研究学生在线学习行为和学习绩效的关系成为新的研究热点。郎波等 (2019)利用学习向量化方法将在线学习行为数据分类,并通过遗传算法预测在线学习成绩。孙发勤等(2019)利用数据和模型,通过机器学习相关知识研究了影响在线学业成就的主要因素、次要因素以及无关因素。赵西粉等(2019)以北方民族大学为例研究了在线学习效果的主要影响因素。吴林静等(2018)提出了一种基于数据挖掘的网络学习行为分析模型,并根据分析结果为网络学习中的各类利益相关者提供了教学参考。郭芳侠等(2018)研究了学习者的在线学习行为与学习效果之间的相关性,以及男女生的在线学习行为与学习效果的差异。胡艺龄等(2014)建立了学习者在线学习行为模型并对学习数据进行了模式分类与解析。魏顺平等(2012)以江苏电大新生为研究对象,分析了某一课程的在线学习行为数据,研究了学生在线学习行为特点及其影响因素。陈圆圆等(2019)基于数据挖掘进一步分析了成人学习者的在线学习行为与学习效果之间的关系。

    在线学习行为已被证实与学习绩效有着紧密的联系,学习行为可以作为预测学生学习绩效的重要表征,通过对学习行为的监控引导学生进行有益的学习行为,从而提升学生的有效学习比率。

    (二)学习行为指标研究

    MOOC学习的自主性导致学生的学习行为多种多样,研究者从不同的视角对学习行为进行选取和分类。

    有的研究從学生努力程度出发考察学生的时间管理情况,主要以时间投入长度、投入频率和投入规律为重要指标。Joo等人(2007)在研究中发现学生在在线学习中的表现受其对学习时间的分配和管理情况的影响。Kwon(2009)认为时间管理是在线学习成功的一个显著因素,并发现了学习者的行动水平、时间管理和学习结果之间的关系。Lin等人(2005)对影响在线学习的关键因素进行分析,最终得到八个影响因子,学习时间管理是其中的关键因素之一。Jo、Yoont和Ha(2013)指出学生的自我调节能力,特别是他们的时间管理策略,是驱动正常参与在线学习活动的隐性心理特征,会导致高绩效。Carver等人(2017)对167名研究生在9门在线课程中的学习数据进行分析,以了解学生的学习成绩与其在课程各个模块中所花时间之间是否存在关系,包括课程学习总时长、课件/教学视频学习时长、学习资源学习时长、同步在线会话时长四个方面。分析发现,学生在同步在线会话中所花时间越长,考试成绩获得A的可能性越大,但是学习总时长、课件/教学视频学习时长、学习资源学习时长与考试成绩之间不存在这样的关系。

    有的研究从学生的学习积极性出发,以参与意识和互动程度为主要指标。Bolliger等人(2018)在研究中发现,在在线学习中学生的参与意识与其学习结果之间存在必然联系,参与意识越强,在参与学习活动中投入的时间越长,其获取较高学习成绩的可能性越大。Libby 等人(2005)提取345名学生的在线课程访问日志,将学生分成完全参与在线学习活动、不完全参与在线学习活动、成功学习者、不成功学习者四种类型,采用多元回归分析方法分析参与频率、参与持续时间等8个变量与学习成就之间的关系,发现完全参与在线学习活动的学习者和成功学习者在学习活动中的参与频率和参与持续时间明显多于其他两类学生。

    有的研究从在线学习的某个要素出发,专门研究某个要素或者学生的某个学习行为与学习绩效的关系。在Watanabe(2011)的一项关于在线英语学习时间管理研究中,发现那些有在作业提交前临时突击学习倾向的学生往往比那些每周平均分配在线学习时间的学生在学习上投入的时间少得多,当然最终的考试成绩也是比每周平均分配学习时间的学生差得多。

    有的研究从学习偏好出发了解不同学习习惯的学生行为模式。沈欣忆等(2019)对MOOC學习绩效评价指标进行梳理,构建了MOOCAP学习绩效评价指标模型,指出学习偏好可以分为时间偏好、投入偏好、节奏偏好、序列偏好和交流偏好几个类型。

    也有一些研究关注学习过程的动态,研究不同的学习阶段学生的学习行为特征。Huei-Tse Hou等人(2011)对基于项目的学习环境中学生交互的时间管理模式进行了研究,研究发现在不同的学习阶段学生在不同的交互行为上投入的时间不同:学习初期,学生之间的交互更多的是收集和分享信息,学习中后期则以问题分析和讨论为主。这说明,学习初期学生会在信息的收集与分享上投入较多的时间,而随着时间的推移,学生在问题分析和讨论上投入的时间会逐渐增多。Laurie等人(2010)对学生在线开放式话题(没有教师规定的特定截止日期的话题)中的时间投入变化趋势进行了研究,研究发现学生在一个开放式话题中的时间投入集中爆发在21~28天之间,31天之后基本趋于稳定;一周中,学生在话题中的时间投入倾向于前半周;一天中学生在话题中的投入变化趋势不明显。

    很多关于在线学习参与的研究都将时间维度作为对学习者参与程度的详细描述,并报告说时间管理和分配对于描述学习者和预测学习效果具有重要意义(Macfadyen & Dawson, 2010; Wong, 2013; Hamane, 2014)。另外,在线学习的一些习惯和偏好也可以作为预测学习绩效的重要指标。本研究将结合学习形式(视频、作业、论坛)、时间偏好等重要指标,系统梳理在线学习的学习行为,以全面分析和挖掘哪些学习行为对绩效有正面影响,希望有助于探索学生学习投入的特点和规律,为MOOC课程的设计和支持提供依据,进一步降低MOOC课程的辍学率。

    三、研究设计

    (一)数据来源

    获取16,000多名学生在2018年于“学堂在线”网站学习课程“财务管理”的学习行为数据和本学期个人期末考试成绩,利用学生在线学习绩效评估模型分析学生在线行为对学习成绩的影响,并根据学生在线学习行为预测其学习成绩。

    (二)构建学生在线学习绩效评估模型

    梳理MOOC平台“学堂在线”网站上“财务管理”课程中的学生行为,将学生在线学习行为变量分成以下五类(如图1所示):①视频(Video)学习行为:学生看视频总数、视频完成率、视频观看总时长、视频观看间隔、视频观看跳数、学生是否按顺序观看视频、视频复看率等;②作业(Classwork)学习行为:学生的作业得分率和作业完成比例等;③论坛(Forum)学习行为:学生在讨论区的活跃程度,如学生在讨论区的发帖数、回帖数、发帖字数以及发帖回复数;④学习时间偏好(Time preference):学生习惯在凌晨、上午、下午、晚上四个时间段中的哪一个时间段进行在线视频学习,学习多长时间、多少次;⑤页面访问情况(Page visits):学生在线访问与课程相关页面的次数,如课程公告访问次数、课件访问次数、其他页面访问次数。

    构建学生在线学习绩效评估模型,如下所示:

    表1列出了用于衡量学生在线学习绩效的每个子因素的25个具体数据项,每个数据项都表示学生在线学习绩效评估模型中的独立变量。

    (三)抽样逐步回归

    逐步回归的基本思想是将自变量逐个引入模型,每引入一个解释变量后都进行F检验,同时对已经选入的解释变量逐个进行t检验,当原有的解释变量由于后面的解释变量被引入后变得不显著时,将其删除。这样每次引入新的变量之前回归方程中只包含统计显著的变量。反复进行该过程,直到既没有显著的解释变量被选入回归方程,也没有不显著的解释变量从回归方程中被剔除为止。逐步回归常常被用来解决自变量间的多重共线性问题。

    求解该模型需要估计26个参数:表1中25个自变量的参数([β25×1])和截距项([α])。除了完全对学习绩效不产生影响的变量以及完全共线性的变量,我们希望所有其余变量均被包含在模型中。本研究尝试通过结合逐步回归和基于大数定律的抽样来进行建模。

    一般地,可以主观先验设置[πk]。例如,对于模型中每次逐步回归的迭代,如果希望包含大约[M]个在线学习行为变量,可以初始化[πk=Mk]。其中,[k=25]表示在线学习行为变量的总数,[M]表示在每次逐步回归中期望的抽样个数。

    四、结果分析与讨论

    使用 Stata/MP 14.0,运行程序10,000次获得收敛的运算结果。模型估计的拟合优度R2为0.398,说明模型拟合效果较好。将每位学生拟合得到的期末成绩与其真实期末成绩进行比较,如图2所示,可以发现,通过模型得到的期末成绩曲线与真实期末成绩曲线趋势走向一致,该模型精确度相对较高。也就是说,学生的在线学习行为能够在一定程度上预测学生的学习绩效。