查看原文
其他

【MOOC透视】用聚类分析方法勾勒MOOC学习者众生相

慕客人译 MOOC 2022-08-02

【总第18期】


用聚类分析方法勾勒MOOC学习者众生相

 

说明:此前我们主要关注来自美国的MOOC研究文献,毕竟那里是MOOC发展重镇。今天,我们稍把目光放开一点,译介一篇奥地利学者的文章(译文有删节),看看MOOC发展是否“环球同此凉热”。

 

作者:Mohammad KHALIL, Christian KASTL & Martin EBNER

 Graz University of Technology, Educational Technology

{mohammad.khalil, martin.ebner}@tugraz.at,

 

本文是一项非常有趣的研究。它运用聚类分析方法,对MOOC平台上学习者的行为数据进行分析,揭示了不同类型的学习者在课程学习中的投入程度。

 

引言


MOOC的优势,从提高教育产出,扩大入学途径,减少教育费用,到促进全球开放教育资源运动和终身学习等,都已有人给予了充分阐释。虽然有如此多的优势,MOOC仍因注册学生多而最终完成学业者少——即辍学率高——而备受诟病。目前已有很多研究挖掘完成率低这一问题背后的原因,学习者和教师缺乏互动、MOOC教学方法自相矛盾等,也被认为是影响MOOC发展的负面因素。除此之外,近期一些研究出版物也在探讨学习者的参与模式,以及对学习者进行分类的问题。

 

由于MOOC已积累了在其上学习的学习者产生的大量数据,所以使得学习分析成为迫切需要。已经有学者 (KHALIL & EBNER, 2016; KNOX, 2014)提出对MOOC数据集进行学习分析,从而发现克服MOOC局限性的方法;也提出过运用学习分析优化学习,以更好地保证远程教育中学生得学习效果 (KHALIL & EBNER, 2015b) 。

 

本研究主要运用学习分析中的聚类分析方法,对来自奥地利的MOOC领军平台iMooX提供的数据进行分析,描绘出MOOC平台上的学习者的投入程度和行为特点,从而为制定提升学习者完成课程比例的策略,并对特定群体的学习行为给予特别干预,提供支持。

 

研究方法


本研究主要对数据进行分析,这些数据是用一个正规的学习分析程序从奥地利的MOOC领军平台iMooX上收集的。通过跟踪学习者的活动轨迹,该分析程序记录下了学习者在MOOC平台提供的各类资源中的学习活动和表现,如观看视频、文件下载、在论坛中发贴/读贴、完成问答测验等。本研究选择了一门名为 “信息技术的社会影响” 的MOOC课程,作为分析和研究的对象。

 

收集到的信息主要以日志形式组织,通过解析过滤掉重复和非结构化的数据。数据分析采用的是R软件,并利用一个附加的软件包NbClust进行聚类分析。之后,进行内容分析,分析单位的测量基于量化决策。 这些决策建立在以周为基础的持续观测之上,并在课程结束时,由一位研究人员对结果进行检验。

 

说明与概览


iMooX是奥地利的MOOC领军平台,由奥地利格拉茨技术大学(Graz University of Technology )和格拉茨大学(University of Graz)合作建立。该平台提供包括社会科学、工程与技术等在内的多种课程,也提供对终身学习和开放教育资源(OER)运动的支持。其服务对象,大致可分为学龄儿童、高校学生以及拥有大学学位的人,此外还免费向社会开放,并为完成课程的学员颁发证书和徽章。

 

本研究选择的学员,学习的是格拉茨技术大学2015年开设的一门夏季课程,名为“信息技术的社会影响”(德语缩写为GADI)。之所以选该课程,是因为它是以下几个专业学生不同学期的必修课:信息与计算机工程专业本科第6学期,计算机科学专业本科第2学期,软件开发专业和商务管理专业本科第6学期,以及进修教师的计算机科学专业本科第2学期。此外,该课程还向其他外部学员开放,不限于该校大学生。课程主要讨论信息技术对社会的影响。

 

该课程持续10周。每周教学内容包括2~3次视频演讲,1次论坛讨论,以及进一步的阅读和多选题测验。每次测验最多可以做5次,系统会记录最高分作为成绩。课程作业大约为每周3小时,每次测验的及格成绩为75分。格拉茨技术大学的学生要通过这门课程,需得到2.5个ECTS(欧洲学分制), 还要完成一些额外的实际工作。

 

共有838人选修了该课程,其中459为在校大学生,379为其他外部自愿学习者。由于该课程是大学必修课,所以相对于其他MOOC课程,完成率较高,达到49%,其中在校生为80%,外部学生为11 .35%。

 

那些成功通过所有测验的学生,被要求回答并提交一份预先设计好的评价表格。从收集到的数据看,大部分外部学习者来自奥地利和德国;大学生的平均年龄是23.1岁,外部学生则为46.9岁。

 

表1显示的是根据评价表格数据得到的选课学员人口学统计结果。




划分聚类和分析


划分聚类的主要目的是将MOOC的每个参与者,归到一个有类似行为的群组中。每个群组都应尽可能地独特,以避免重复。这些群组中的要素,应适合与之相联结的群组参数。因此我们选用k-mean算法,采用欧几里德距离指标。为了划分聚类,我们给算法中将要引用的变量分配标签。预期的结果是应按MOOC参与者的活跃程度和性格分类。

 

由于特定变量之间的关系,我们排除了那些高度相关的指标,因为它们不影响群组排序。这样一来,聚类分析可用的变量就是:


1、 阅读频率:表示一个用户点击一个论坛中特定文章的次数


2、 写作频率:表示用户在论坛中发贴的数量


3、 观看的视频:表示一个用户点击所有视频的总次数


4、 测验企图:计算学员尝试完成10次测验(每次测验最多可尝试5次)的总次数

 

由于被考察的MOOC课程对于在校学生来说是必修的,而对于外部学习者来说是开放的,所以聚类划分就针对两种情况分别进行。

每种情况下学习者的目的都可能很不同。例如,在校学生参加MOOC课程是为了学习目的,或只是单纯为了拿学分。

 

情况一:大学学生


在这种情况下,k值被赋予一个3〜6之间的数字,因为我们并不想将所有学员划分为超过6个群组。根据变量的值和NbClust 包,建议分为4个类。图1显示的是MOOC上大学学生分成的4个聚类。

 


图1:选修MOOC课程的大学学生聚类

 

其中以蓝色和绿色表示的两个群组有重叠。在X轴和Y轴上的这些组件之间的相关值达67.76%, 这个百分比意味着,基于这个聚类值,我们得到了约70%的信息。这些聚类的特征如下:

 

以粉色椭圆表示的聚类1包含有95个学生。这个群组具有较低的活动性。只有10个学生获得了完成证书,而且辍学率很高。

 

以蓝色椭圆表示的聚类2包括154个学生。这个群组中的绝大多数学生完成了课程。本聚类的最显著特征是观看视频课程较多。

 

以绿色椭圆表示的聚类3包括206个参与者,证书获得率为94%。聚类2和聚类3的证书获得率都较高,区别在于观看视频的数量不同。

 

聚类4最小,只有4个学生。通过观察变量,我们注意到这个聚类中的学生只有一个在论坛中发过贴。获得证书的学生比例为50%。

 

情况二:外部学习者


图2显示的是不属于该大学的外部学习者的聚类情况。K仍然被赋值为3〜6之间的数值。这种情况下,各聚类特征如下:




以蓝色椭圆表示的聚类1中,包含42个参与者。本聚类的证书获得比例为76.20%。与其他聚类相比,本类中的参与者社交活动和在论坛中的阅读发贴行为都处于中等水平,但参加测验的次数较高。

 

以红色椭圆表示的聚类2中仅包括8名参与者。证书获得比例为100%。该聚类中的参与者在论坛中贡献的发贴最多,阅读频率也最高。

 

以粉色椭圆表示的聚类3包括其他所有参与者。这个群组中的参与者辍学率极高,课程完成率仅为1%。

 

讨论


在上述两种情况下的聚类划分结果中,我们研究了每一聚类的每个变量的值。下一步则要按低、中、高的分类来描述每个群组的活跃水平。表2显示了大学学生和外部参与者两种情况下的描述结果。




通过分析这些聚类,我们可以勾画出MOOC上的学习者的行为图。不过, ELTON1996年进行的一项考察在班级中激励学习者的通用策略的研究,其结论与我们的聚类划分研究近类。图3显示了他对学生在一门课程中的表现行为的划分体系(又称Cryer体系)。



图3:基于学生投入程度的Cryer划分体系

 

X轴代表内部因素,主要是成绩和科目;Y轴包括考试准备,被称为外部因素。需要指出的是,该体系不仅包括图中所显示的类型,还包括介于这四种类型之间的其他学习者。

 

在该体系中左下角的那些学生,主要指那些既对课程不感兴趣,也未取得好成绩的学生。

这类学生对应我们研究中的大学学生情况中的聚类1,以及外部参与者情况中的聚类3。

 

在图左上角的那一类,是指只做教师要求做的事,只为得到一个分数而学习的那些学生。运用学习分析,就可以发现一些学生被要求观看视频时,不断跳跃,甚至根本不看每周要求看的视频,直接开始进行测验。这类学生也被称为“赌博者”。尽管测验中有些问题若不看视频就难以回答,但这类学生中仍有一些能够通过考试。所以或许可以这样推断:MOOC平台提供的每周测验,最多可以试做5次,这也是导致大学学生“赌博者”的比例偏高的一个原因。

 

反叛者是指那些对课程有兴趣,但却因准备不足未通过考试的学生。在聚类分析中,这一群组在大学学生中也有,就是聚类4。但在外部学习者中就难以检测到这类学生。聚类4的典型特征是在论坛的社交活动中表现积极。我们把这类学生称为“社交型学生”。

 

最后一类是自我期望和投入度很高的学生,可以说是“完美的学生”。每一种MOOC平台上都有这类学生。在两种情况中的聚类2反映的就是这个群体的形象。

 

结论


本研究考察了在iMooX提供的必修xMOOC课程中的学习者行为。由于课程也向公众开放,所以我们研究了学生的参与模式,并将学生分为两种情况研究:内部参与者和外部参与者。在研究中,我们对这些MOOC课程的参与者进行了聚类分析。此外,我们发现,这些聚类可与ELTON 1996年作出的研究结论相参证。我们的研究也表明,在线学习行为与传统面对面的课堂学习其实有很多相似之处。因此,建议进一步研究如何使MOOC更具吸引力,并创新教学概念,从而增加学习动机因素。

 

文献来源:

http://www.academia.edu/21842282/Portraying_MOOCs_Learners_a_Clustering_Experience_Using_Learning_Analytics


产权及免责声明本文为微信公众号【MOOC(微信号:openonline)】原发、原创、编辑或评论的文章,版权为慕客人所有。欢迎个人转发分享,任何单位、公众号转载需要取得授权,违者将追究法律责任。


了解在线教育,
把握MOOC国际发展前沿,请关注:
微信公号:openonline
公号昵称:MOOC



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存