大数据环境下在线学习的发展和应用

    李瑞

    摘要:包括在线学习和大数据在内的新兴技术给教育领域带来了巨大的变化。在线学习允许学生远程学习,打破了时间和空间限制。网络教育的灵活性、创新性和可扩展性吸引了大量的学生。许多顶尖的在线教育平台提供了大量的在线开放课程,提供了数千门高质量的课程,吸引了数以百万计的注册学习者。在线学习产生了大量数字数据,这些数据继续呈指数级增长。每天产生的大量数据给数据的存储和分析带来了巨大的压力和挑战,传统的应用程序和软件无法处理这些数据。为了解决这个问题,学者们选择利用数据挖掘和学习者画像技术。借助数据挖掘技术,可以从大量生成的数据中提取有价值的信息。在教育领域,学习分析技术被用于数据挖掘,它是指对用户在学习环境中产生的数据进行收集和分析。它帮助教育者监控学生的学习行为和过程,并提供实时反馈。这些反馈随后被收集、分析和总结为标签,随后用于标记学生以构建学习者画像。学习者画像按标签显示学生信息,这些标签表示由同一组共享的特征。通过学习分析和学习者画像,教师可以更好地了解学生的学习模式,并提供有针对性的教学建议。

    关键词:在线学习者画像;学习分析技术;在线学习;教育大数据;智慧教育

    中图分类号:G434 文献标识码:A? ?文章编号:1003-2177(2021)05-0114-04

    1在线教育的蓬勃发展

    1.1 互联网的快速增长

    近年来,互联网用户持续快速增长。截止到2018年,互联网网民数量已经达到390亿,这意味着世界上有一半以上的人口都在使用互联网[1]。根据维基百科的数据,2017年中国有超过53.2%的人使用互联网,网民数量居世界第一[2]。互联网的迅速发展促使电子数据的飞速增长。新技术、新设备以及社交网站等通信手段的出现和应用,产生了大量的电子数据,在不久的将来,这些数据将随着互联网的规模不断增长。

    根据统计结果显示,网络数据的数量从2005年的150EB增长到2010年的1200EB,预计未来几年将以每年40%的速度持续增长[3]。这些信息的数量规模超过了当时任何软件和硬件的存储和计算能力,这意味着这些大型数据集无法使用传统的计算技术进行处理。在此背景下,2011年,麦肯锡提出了大数据的概念。大数据是指以巨大的数据量、高度多样性或极高的速度收集的信息[4]。今天,大量的数据正在从各种渠道产生和流动,而且这种情况持续不断地发生在我们的日常生活中。

    随着社交网络的蓬勃发展,世界各地的创业公司开始研究由海量数据所创造的信息网络。雅虎在2005年创建了Hadoop。Hadoop是一种用于存储和处理海量数据的开源结构。同时全世界的一些政府部门也开始着手大数据项目。2009年,印度政府对一个民间信息收集项目进行了大型投资,该项目收集了当地居民的虹膜扫描数据、指纹和照片。从2012年开始,全球越来越多的政府发布了一系列纲要文件,旨在推动大数据的发展和推广应用。2012年,联合国宣布大数据时代已经到来,并指出这是各国政府的历史机遇[5]。联合国认为,大数据的价值在于数据的数量和多样性,使决策者能够跟踪事物的生命周期,从而对现有的政策和项目做出合理的调整。

    这场数据驱动的革命给我们现代社会的各个领域和行业带来了全面的变革。在过去几年中,将新兴技术应用于其他行业和领域已经带来了革新性的进步。

    例如,物联网(Internet of Things)这一新兴技术在智慧城市建设中发挥了主导作用。物联网用实时数据改造落后的基础设施和建筑物,提供智能化服务,使我们所居住的城市更加现代化。交通堵塞、公共安全和犯罪预防等城市问题利用了大数据技术的帮助,24小时實时的视频监控数据记录了城市中的每个日夜。对于制造业来说,大数据的出现帮助传统设备向智能机器转型,智能机器能够生成和收集实时数据,从而做出准确及时的决策。智能交通来自于与大数据相关的新兴技术,如物联网(IoT)和云计算。它要求根据多通道实时交通状况数据进行精确决策,涉及到交通数据系统与其他系统之间的数据共享和知识图谱。在智慧教育的建设中,采用新的数据相关技术,将大学变成更智能的学术机构。海量的数据采集使学生更加信息畅通。这些用于管理大数据的智能基础设施加快了教育信息化的进程。

    1.2 智慧教育的发展

    智慧教育的特点还包括对智能技术的应用。虚拟现实(Virtual Realization)是指由计算机创造的模拟环境,它可以与真实环境相似,也可以不同[6]。虚拟现实有助于传统教学向沉浸式体验教学转变[7]。学生们被带到微观和宏观的虚拟世界中,在那里他们可以沉浸体验刚刚学到的新的化学反应。学生们可以直观地看到书中的抽象概念和结构,更好地理解它们。毫无疑问,这种多元教学促进了学生的好奇心和对知识的掌握。云计算(Cloud Computing)是指一种新的计算服务交付方式,即可以访问云上的服务器、数据库和软件,而无需在自己的设备上安装它们[8]。云计算的发展为智能教室的出现指明了发展方向,它源于IBM于2008年首次提出的“智慧地球”概念,并扩展到其他领域,形成了智慧城市、智慧交通、智慧教育的概念。智能教室是智能技术在课堂上的应用。在这种情况下,学生从被动的参与者转变为智慧教育系统的主动建构者,为智慧课堂的构建提供学习经验数据和主观反馈。直播课堂和虚拟人工智能教师也来自云计算。此外,学习者在网络学习过程中所关心的问题,可以很容易地被人工智能教师所处理,让教师有更多的自由去关注更重要的问题。在这个学习过程中,研究者收集和分析了大量的数据,包括课程任务、学习行为、课堂互动和课后投入等,以便了解教师和学生的表现,有利于个性化的课程推荐和准确的多维教学评价。大数据应用的未来效益包括提高制造效率、企业创新、智慧城市建设、环保能力增强和精准的个性化服务。

    大数据在教育中的应用越来越广泛[4]。根据数据来源和应用领域的不同,教育大数据可以定义为:教育大数据是作用于教育、服务于教育的技术和应用系统的大数据。信息技术在校园里的应用已有好几年历史。近年来互联网的迅速发展使学校拥有可用的、高质量的海量数据的美好愿景成为现实。

    世界各国政府为了顺应科技模拟教育的流行趋势,积极采取行动。他们将免费入学、高质量课程和低成本相结合,广泛普及高等教育,提高了学习效率,减少了欠发达国家接受高等教育的局限性。英国政府宣布投资3000万英镑来促进创新教育技术,其中包括人工智能[9]。中国政府在教育部于2001年出台的《普通教育课程改革纲要(试行)》文件中发布了促进个性化学习的教育改革举措[10]。在美国教育部教育技术办公室(U.S.Office of Educational Technology)2012年发布的一份咨询报告中,将利用学生数据系统改善教育作为了国家的优先事项。

    2009年以来,大数据在教育领域占据了重要地位,在发展的路上机遇与挑战并存。这种大数据参与的技术强化教育的特点是:学习普及率更高,学生学习成绩更高,评分系统更好,课程更个性化,辍学人数更少。

    高等教育应用新技术带来的新发展,都表明了传统高等教育界以及开放大学等更灵活的提供者为应对这些挑战所作的努力是有效的。大规模的在线开放课程MOOC(Massive Open Online Courses)的发展就是一个很有力的证明。

    2在线开放教育

    2.1 在线学习平台的兴起

    MOOC是免费的、开放的在线课程,由全世界的大学提供,所有人都可以报名学习。MOOC是一种重要的教育资源,它能促进全世界学习者得到更多优质教育的学习机会。在便利政策的扶持下,MOOC发展迅猛。近几年来,互联网用户的数量呈指数级增长,更多的在线学习者进入在线学习领域。因此,MOOC在这些移动设备用户中变得越来越流行。2013年,大规模在线开放课程的爆发式出现,引发了一场名为MOOC革命的现象。从那一刻起,各种各样的在线学习平台纷纷进入MOOC领域,为MOOC的长久发展做出了贡献。数以百计的MOOC提供者为学生提供数千门课程,这些课程的入学要求各不相同。

    在所有的在线课程提供商中,Coursera、edX和Udacity三足鼎立。Coursera由斯坦福大学教授于2012年创立,目前与世界顶级大学和教育机构建立了合作关系。Coursera的一些在线课程结业证书得到了大学的认可,这些课程主要集中在商科和计算机科学领域。Coursera拥有2400多万注册学习者,149所大学提供商,提供2000多门课程。Udacity也是由斯坦福大学的两位教授创建的,他们发布了免费的在线课程“人工智能入门”,吸引了190个国家的16万多名学生。这些大学和行业专家共同努力开发和提供了Udacity的课程。EdX是由麻省理工学院和哈佛大学联合创办的。它与160多所大学建立合作关系,提供1300多门课程。广泛传播的MOOC革命也引起了中国教育部的关注。2015年4月,随着网络公开课的蓬勃发展。中国强调了发展MOOC平台的重要性,2016年中國高校建设了20多个在线平台,2017年提供了受到大学认可的在线课程[11]。

    在线学习不仅方便了在校学生的课程学习,也方便了在职人员的学习。据估计,目前约有六分之五的在线学习者是在职人员,他们没有时间和精力去学校上课[8]。网络教育的灵活性、创新性和可扩展性吸引了大量的校外学习者[9]。许多在线学习平台,如Udemy、Coursera和Udacity,通过线上课堂为数百万人提供服务,其中一些课程直接来自大学课堂。在每个学术领域,互联网提供了唾手可得的学习资料和课程,消除了时间和空间的限制,因此,那些非在校生但渴望学习的人可以通过在线学习很容易地获得高质量的讲座和课程。

    仅在2019年,MOOC就招收了1000多万名学员,预计全球总入学人数将达到1.1亿,并以每年10%的速度持续增长[12]。而在中国,2019年有超过12500家中国MOOC服务商。网络课程的普及率说明人们对在线学习的需求是巨大的。2020年爆发的新冠疫情使在线学习的渗透率进一步提升。学校、大学和公司都关闭,人们都被迫在家工作数月,这大大促进了在线课程的招生,并培养了人们在线学习的习惯。

    2.2 在线教育带来的挑战

    教育大数据在展现现代教学惊人潜力和美好未来的同时,也面临着各种各样的挑战。

    对在线教育的财政投入可能给全球各国政府造成沉重负担,特别是那些对在线学习有更大需求的欠发达地区的政府。例如在偏远地区,互联网的带宽通常不够,无法支撑流媒体的使用,因为这需要大量的资金投入。教育中的大数据也引发了许多隐私问题和数据使用的知情同意的问题。大量的学习经验数据被收集并用于进一步的分析和剖析,学生会感到自己被监视。所以在隐私问题和数据知情权上,需要采取审慎的预防措施,以确保所收集数据的扩展和利用是合规合理的,避免数据滥用对学习者造成伤害。

    除了大数据应用带来巨大效益,数据生产的指数增长对数据存储和数据处理的需求也值得关注。现代生活中的每一瞬间都会产生和传输大量的数据。在这些领域中,互联网产业、公安、科研、制造业、农业、教育、医疗卫生等所占份额最大。在智慧城市建设中,视频监控记录、交通量和空气质量数据等每时每刻都在生成,这些不断生成的数据量呈指数级增长,每天产生的全球视频监控数据超过560PB[13]。在智能交通建设中,交通系统与其他信息数据库的实时互联,从不同的信息渠道产生大量的数据,从而实现智能决策。交通状况的信息以图像和视频的形式从广域视频监控系统中呈现出来,实时传输信息。智慧课堂在智慧教育中占最大比重,因而随着智慧教育的发展,学习相关的数据呈指数级增长,其中课堂的实时监控数据,学习时长和在线测验成绩等数据都占据了系统存储区域的大部分容量。对于互联网行业来说,移动智能终端的出现和广泛应用每分钟都会产生大量的用户数据,数据库、云计算、物联网等新的智能技术也促进了数字数据的指数级增长[4]。

    大数据的数据量给各方都带来了巨大的压力和挑战。这些数据的收集、存储、传输和分析不仅需要大规模的资金投入,而且需要先进的数据挖掘技术。稳定的存储需要复杂可靠的软件和硬件设施,同时也需要高带宽的互联网传输基础设施。此外,大数据来源的多样性也要求对数据进行深入的理论和实践分析。将大数据转化为有价值的信息需要智能技术的开发和应用,以便揭示数据中隐含的有价值的趋势信息。因此,组织、机构和公司必须能够利用大数据挖掘和分析技术来满足这些需求。这样做的目的是可以提供个性化的课程推荐和准确的多维教学评价。这些数据的收集、存储、传输和分析需要先进的数据挖掘和分析技术,在教育领域被称为学习分析技术。

    2.3学习分析技术

    学习分析是指运用智能技术对学习数据进行分析,以提高教学质量。基于大数据的学习分析有助于收集、测量和分析学习者的多模态数据。它可以为教师和平台设计者提供准确的个性化教学服务,从而优化学生的在线学习表现,提升学生的学习体验。

    通过对国外相关文献的整理,我们可以看到,学习分析领域虽然是新兴领域,但相关的研究已经涉及到很多其他领域,主要包括学习分析的分析方法、分析工具、分析模型和分析系统的研究与开发。同时,学习分析在教学中的应用也越来越受到教育相关者重视。

    学习者画像是指分析学习者的特征并根据这些标签进行标记。学习者画像是一种普遍应用在教学中的服务,其中个性化教学服务是最受欢迎的应用之一。在信息教育化时期,面对多媒体教学环境、多样化的教学模式、数字化学习资源和特征迥异的学习者,要实现个性化教育教学,必须准确地刻画和塑造学习者的学习特征。基于学习者画像,教师可以为学生提供更有针对性的教学。

    这些技术增强和数据丰富的教育系统能帮助教师在更好地理解学生行为。实时传输的数据提供了准确的学习进度监控,使教师能够更准确地评估学习者是否提前或延迟学习进度。课后,该技术也可以帮教育者为学习者制定学习计划,以提高学生的学习参与度。

    个性化教学服务作为一种先进的教学理念,充分尊重学生的个性,其独特的优势已得到国内外学者的认可。教育不是工厂,学生也不是产品。学生不能按统一标准被加工成“标准件”。因此,教育者需要正确认识学习者的个体差异,继承因材施教的教育理念,才能实现特定的培养目标。

    3 结语

    随着互联网的发展,大数据在各行各业里得到了广泛的应用,其中大数据在教育领域的发展尤为亮眼。在线学习和学习分析技术成为了智慧教育的重要组成部分。在中国,以MOOCs为首的在线教育平台提供了数万在线课程,吸引了的学习者。2020年新冠疫情的爆发,让在线学习得到了井喷式增长。这些变化都使得学习者产生了大量学习行为数据,这为数据的提取分析带来了巨大的挑战。学习分析技术利用大数据里的数据挖掘技术,从海量的原始数据里,挖掘有价值的行为信息,以便更好地帮助学习者了解自己的学习状态,帮助老师完善课程设计,帮助教育者改进教学系统。

    参考文献

    [1]Annika Wolff,Zdenek Zdrahal,Andriy Nikolov,Michal Pantucek.Improving retention:predicting at-risk students by analyzing clicking behavior in a virtual learning environment[EB/OL].http://oro.open.ac.uk/36936, December 31,2015.

    [2]U.S.Department of Education(2015).Ed Tech Developer's Guide[R].Washington,D.C.:64-65.

    [3]Wolfram Alpha計算知识引擎[EB/OL].https://www.smartsparrow.com/,September 12,2015.

    [4]金义富,吴涛,张子石.大数据环境下学业预警系统设计与分析[J].中国电化教育,2016(2):69-73.

    [5]Kimberly E.Arnold and Matthew D.Course Signals at Purdue:Using learning Analytics to Increase Student Success[EB/OL].http://www.itap.purdue.edu/learning/docs/research/Arnold_Pistilli-Purdue_University_Course_Signals-2012.pdf,December 31,2015.

    [6]Hilbert M.Big data for development:A review of promises and challenges[J].Development Policy Review,2016, 34(1):135-174.

    [7]Xenos M.Prediction and Assessment of Student Behaviour in Open and Distance Education in Computers Using Bayesian Networks[J].Computers & Education,2004, 43(4):345-359.

    [8]Thomas K Q.Local colleges providing online learning programs[J].Rochester Business Journal,2001,16(43):28.

    [9]李雪娇.基于学习者画像的在线学习支持服务策略设计研究[D].上海:华东师范大学,2019.

    [10]Hew,K.F.,Cheung.Students' and Instructors' Use of Massive Open Online Courses(MOOCs):Motivations and Challenges[J].Educational Research Review,12(6): 45-58.

    [11]张冬冬,李玉龙,王玉鑫.数据挖掘技术在高校贫困生认定中的应用[J].西安文理学院学报(自然科学版), 2013,16(4):90-94.

    [12]冯春燕.基于学习者画像的个性化教学研究[D].金华:浙江师范大学,2019.

    [13]SIEMENS G.What are learning analytics[EB/OL]. http://www.elearnspace.org/blog/2010/08/25/what-are-learning-analytics,August 25,2010.

    (责编:陈静姝)