查看原文
其他

【MOOC透视】想象不等于真相!牛津大学学者用数据告诉你参加MOOC课程的全球学习者之间如何交流……

慕客人译 MOOC 2022-08-02

【总第13期】MOOC的脆弱性和信息扩散障碍的深入研究


想象不等于真相!牛津大学学者用数据告诉你参加MOOC课程的全球学习者之间如何交流……

 

关于伟大的MOOC运动的想象中,大概有两点最令人兴奋:一是连上网就能选学全球顶尖学府的名师讲授的招牌课程;二是可与众多选学同一门课程的全球学习者自由互动,以学会友…..

 

第一条应该没有什么异议。但第二条呢?互不相识的学习者是否在上课的过程中展开了火热互动?

 

想象不等于真相!针对这个问题,牛津大学的几位学者做了较深入的研究,研究结果发表在nature.com上:《群体学习的结构性限制:MOOC中的交流脆弱性和信息扩散》(Structural limitations of learning in a crowd: Communicationvulnerability and information diffusion in MOOCs)。我们来分享一下他们的研究成果。


原文作者:Nabeel Gillani、Taha Yasseri、Rebecca Eynon、Isis Hjorth.

文章来源:Scientific Reports


简介

 

从前几年开始,人们可以选择在大规模在线教育平台上选学课程,这使得成千上万的人可共同选学同一门课程,并在学习过程中进行交流互动。在计算机支持下的协作学习领域,对在线群体学习的结构属性,已做过非常详尽的研究。然而,这些研究考察的学习实际上是发生在以相对传统的方式组织、人数规模较小的在线教室。

 

大规模在线学习因其新颖性,也已经激发了一些关于学习者如何与课程内容互动等方面的研究。有的研究通过追踪MOOC学习者在整个课程学习过程中的点击数据,来分析学习者的学习行为;还有研究根据学习者的学习投入程度,来划分学习群体,进而预测辍学率。

 

尽管相关研究越来越多,但与群体在课程学习中互动和对话特征相关的问题,仍未受重视和研究。由于当代社会文化学习理论非常强调群体互动对于认知的重要作用,所以基于MOOC实践,了解在寻求获得知识和生成新知的过程中,参与者之间有价值的互动和信息扩散方式,对于促进富有深度和意义的学习,就是十分必要的。

 

本论文的目的在于通过观察MOOC论坛中学习者群体互动的水平,来拓展上述研究领域。


无论在哪一类MOOC平台上,学习者通常都有机会参与,或与其他学习者合作,进行在线讨论,以强化他们的学习体验。在线讨论区的参与者通常具有非常不一样的背景和选课动机;讨论区里也极少有规则,可以视为非正式的学习空间,学习者在此可以十分自由地选择他们是否以及怎样参与讨论互动。讨论区的总体监管架构相对薄弱,主要由教育者为讨论区设置的问题、作业,讨论区的技术设计(例如,根据不同话题建立子讨论区),以及参与者在上课过程(通常8周)中自己选择的角色等因素决定。

 

在线学习研究的理论视角和着重点都有很大差异。通常认为,从在线讨论区入手来了解学习过程,需要考虑学习者个人以及群体两个层面上的互动。在这些讨论区中,群体层面的互动可以看作是某种使学习得以发生的支架,因此,在未来的课程设计和开发中需要予以注意。

 

研究MOOC中学习者群体层面的互动问题,面临的一个关键挑战是方法论:我们需要界定,在这前所未有的学习环境中,何谓“有意义的”互动?这可不是一个简单问题!因为在MOOC讨论区中,大规模的、具有不同社会文化背景的学习者之间发生的成千上万次互动,可能与学习本身基本无关。因此,要解决的第一个问题是:如何界定描述有意义互动的底层社交网络?

 

一旦有意义的互动建立,我们就可以提出二个涉及理解MOOC学习中群体互动核心的问题:什么是讨论区中交流网络的脆弱性?信息流如何在讨论区中扩散?讨论区的大规模和开放意味着,学习者群体因为具有不同的经验和专长而拥有大量可用资源。然而,群体成员的种类,以及这些课程的非正式和短期等特征,决定了他们个人之间的关系会相对薄弱。

 

结果

 

该研究分析了从Coursera平台2013年春季和秋季开设的两门商业课程(FOBS-1和FOBS-2)获得的数据。将近9万名学生注册了FOBS-1,超过7.7万名学生注册了FOBS-2。每门课程都分别持续了6周;期间,有4500名FOBS-1学员在讨论区发贴或评论了超过1.5万次,3300名FOBS-2学员发贴或评论了超过1.4万次。超过1.5万和1.15万名学员至少浏览了1次每门课程的讨论,这两门课程各子讨论区的总浏览次数分别为181911次和139858次。

 

课程的讨论区是由教员在开课之前分成了多个子讨论区。例如,包括一个案例子讨论区讨,每周进行商业案例讨论;一个结业项目设计子讨论区,让学生可以在此就学习结束时的战略分析作业提问或合作。为了深入细致地了解学习者的行为,该研究分别分析了每个子讨论区的运行机制,发现各个子讨论区的学习者之间的重叠度很低:总体而言,低于10%;极端情况下,低于3%。这些数字透露出这样一个事实:大多数学生只是偶尔参与一些子讨论区的活动。

 

学习者在每个子讨论区的发言和浏览行为,似乎呈爆发式,绝大多数发生在课程开始时,某些情况下,发生在课程快结束时。每次讨论的发贴和浏览数字,呈肥尾式分布,而不同子讨论区的讨论具有不同的“浏览生命期”,90%的浏览发生在这个时间区间。考虑到本论文的兴趣在于考察明确的讨论区参与行为,故将聚焦发贴行为。表1提供的是课程中不同子讨论区的基本统计数据。 



有意义的互动网络(Significantinteraction networks)

 

本文将学习者之间的交流视为社交网络,在这个网络里,节点代表在讨论区发帖的学习者,而联结两个学习者的边代表他们在讨论中至少围绕某个讨论有一次合作。然而,并非以此方式生成的所有连接都同等重要,而两个学习者在一次讨论中的共同参与也并非总指向有意义的交流。借鉴经济学和工程学方面的研究成果,以及近来在移动通信网络研究方面的进展,本文假设,在每个子讨论区中被观测到的交流网络,实际上都是真实网络——即,描述学生之间有意义交流的那个网络——被“噪音污染”了的一个版本。那么,就需要通过过滤掉那些代表学习者偶然相遇产生的连接,而得到真实的那个网络。凭直觉,可以用算法过滤这些偶然出现的连接---即,两个学习者在某次讨论中的偶然短暂相遇,即时他们在其他子讨论区中是积极主动的参与者。相反,那些在反复参与讨论、持续对话的学习者之间建立的连线,将被探测出来,作为有意义的交流对待。图1已过滤了受各种网络属性(例如模块化)影响而形成的无意义连线。

 



表2显示的是为形成有意义的网络(来自FOBS-1 和FOBS-2课程的每个顶级子讨论区)而修剪掉的连线的比例。在这两个例子中,反馈讨论区的连线被最大程度地减少,与预期的一致:在这些子讨论区中的绝大部分参与者的行为都是一次性的,仅发表一个技术性的提问/评论,或在课程结束时向教师道一声“谢谢”。另一方面,案例子讨论区的连线损失率最低,两门课程分别为44%和39%。这大概是由于在这个讨论区中,讨论受到鼓励:每周的案例讨论要求学习者针对一系列开放式问题,提供他们自己的思想和意见;子讨论区包容各类问题,以激发和引导群体讨论;在很多情况下,学习者被要求阅读他们的同学发布的分析,并通过补充观点,进行评价或批评,从而促使更多的参与和知识构建。


 


有意思的是,在两门课程的子讨论区中,都有超过三分之二的学生之间的连接被认为是“无意义的”。对这些子讨论区的非正式内容分析表明,大多数学习者只是在课程早期发帖进行一些自我介绍,当发现有来自同一地区/时区的同学后,他们倾向于转到另一些社交平台(如Facebook)进一步交流。而“学习小组”子讨论区更多地变成了学习者开会的地方,并不是预期的进行持续性交流的场所。

 

交流的脆弱性(Communicationvulnerability)

 

网络的脆弱性已经在各学科中都得到研究。例如,电力系统工程师经常问,在一个正常运转的回路中,网络组件的哪一个“关键集合”被损坏后,能导致整个回路失去功能,以此确定如何为其它节点断电。我们也从教育学的视角问一个类似的问题:哪些学习者组成的“关键集合”,在一个交流网络中对信息流动负责?如果组成这个集合的学习者被剔除,在线讨论会出现什么情况?我们将教育语境下的脆弱性定义为这样一类节点的比例:这些节点若从网络中断开,就会迅速减少最大可连接组件数相对于全部节点数的大小。

 

就我们所知,交流网络的脆弱性,在教育领域的研究中此前尚未被涉及。

 

MOOC讨论区交流网络的脆弱性是指交流的完整性和包容性。那些学习者参与行为少而短暂的讨论区,其畅所欲言的参与者只构成一个很小的关键集合,从在线讨论中移走这些学习者,就会快速地消除该讨论区中潜在的讨论和信息在其他参与者之间的扩散。相反,那些鼓励参与者重复参与和深度讨论的论坛,通常有一个较大的关键集合,讨论也在较大范围的学习者之中展开。通过分析不同子讨论区中的交流脆弱性,我们会理解群体交流机制怎样随着讨论话题的不同而不同。

 

为了画出每个子讨论区的交流脆弱性,我们执行如下算法:对每个子讨论区导出的有意义网络,通过迭代,寻找具有最高介数中心度(betweenness centrality)的节点,将之从网络中断开,计算网络中最大连接组件相对于节点总数的比例。我们引用介数中心度作为我们的移除矩阵,正如它的定义,特别是对于无向图,表明每个节点作为信息或理念传播导管的潜在可能性。我们将从这个移除策略获得的结果,与另一个节点随机移除的结果比较----该方法作为一种基本的可评估机制,已经在其他领域获得应用。

 

图2显示了课程FOBS-1的所有子讨论区的结果。图3显示的是对FOBS-1 的案例子讨论区,迭代移除具有最高介数中心度的节点得出的降低度,与采用随机移除策略相比得出的结果。

 



从图2可以看出,不同子讨论区具有不同的脆弱性阈值。例如,在两门课程中,案例子讨论区和结业项目设计子讨论区都有最低的脆弱性,这是由于在将最大连接组件的相对数字逼近零时,需要移除较大比例的节点。这可能是因为,这两个子讨论区中反复进行对话和知识构建的特点比较明显。

 

相反,学习者倾向于在这些讨论区,进行每周案例提问、学习结束时的战略分析或询问学习结果、同学评议,分享观点和看法。这一倾向表明,这种能促进学习者参与多种讨论、与其他学习者进行交流的引导机制,在很多其他子讨论区中是缺乏的。例如,学习小组子讨论区,是一个最脆弱的讨论区,大多数人仅发贴一次向其他小组介绍自己,然后就与人转到其他社交平台继续交流,或终止交流。事实上,观察FOBS-1 和 FOBS2在子讨论区方面的差异,非常有趣。快速降低FOBS-2的案例子讨论区和结业项目设计子讨论区信息流通所需的节点比例,要高于FOBS-1,表明其交流脆弱性较低。这可能是因为在FOBS-2中有附加的评价标准,就是学生在讨论区中发帖和评论所得的“赞成”数量,占其课程最终得分的8%。

 

不同子讨论区和课程的不同脆弱性阈值,反映了不同的讨论话题,或许,还有不同的激励机制对于学习者参与程度和包容性的影响。

 

信息扩散(Informationdiffusion)

 

从对网络脆弱性的分析,已经很清楚,不同的子讨论区有不同的能反映交流脆弱性的参与者“关键集合”。下面,重要的是,需继续探索在这些网络中,信息是怎样扩散的,这将有助于了解讨论区的参与者是如何促进知识构建的。因此,我们问:讨论区中的信息是如何流动的?

 

为了研究这个问题,我们借用在之前已经广泛应用于社会传染模型研究的SI(易感)模型,来建立信息传播模型。SI模型虽然很简单,在分析网络交流系统的拓扑和时间效果时却非常有用。SI模型并不考虑随着时间流逝的兴趣减弱、同伴的影响和其他社会传染的复杂机制,但却足够确定基于拓扑和互动网络连接性的接触率的上限。它也能使我们定量地比较不同的拓扑和它们对于信息传播的有效性。

 

作为一个基准,我们对一个随机网络执行一个类似的扩散模拟,在这个随机网络中,每个节点保持它的度,但却与被观测到的有意义的网络有不同的一组集合。在随机网络中交换邻居的目的,是呈现那些没有内在模块化的子讨论区中信息扩散的潜在可能性。

 

图4描述了原有网络和随机网络中接触到的节点随时间进化的情况。从该图可以看出,在随机网络中的传播总是比较快,而且,贯穿从一个单个受感染节点开始到整个系统的全部传播过程。为了定量描述随机网络和原有网络中的传播差别,我们计算一个模拟的“信息包”感染到网络中一半节点(即,参与者)所花费的时间,Thalf。也可以考虑使用不同的阈值(例如,某些研究选用20%),但是,图4表明,阈值的不同选择并不影响整体模式。

 



我们定义了一个信息在某子讨论区传播的有效性参数e,e=Thail(随机)/Thalf(原有)。e的值大于/小于1表示与增强/弱化的信息传播相关的交流网络的结构与随机基准的比较结果。图4(b)显示了课程FOBS-1不同子讨论区的e值。在课程FOBS-2的讨论区中也可以观察到相似的趋势。

 

从所有子讨论区的情况看,信息在原有网络中的传播,慢于随机基准。这可以解释为是因所导出的有意义网络中存在的局部交流结构所致。最近的研究表明,拥有大量连接的节点的密度可以妨碍传播过程。向教授求教子讨论区在信息传播方面是最有效的,相反,学习小组子讨论区的高模块化降低了传播的效率。

 

为了进一步验证这一发现,我们用Louvain算法计算每个子讨论区的原有网络和随机网络的模块度得分,然后计算每个子讨论区的标准化的模块度。表3显示了每个子讨论区的模块度矩阵。比较图4(b)中的有效性值,可以看得很清楚,最模块化的子讨论区通常有最低的传播效率(如,阅读和学习小组讨论区),反之亦然(如,向教授求教、课程学习材料反馈等讨论区)。值得注意的是,技术反馈讨论区的标准化模块度和传播效率都很低,可能是因为这个讨论区旨在获取技术平台的差错,而不是促进有关课程内容的讨论,所以学习者参与度也最低。

 

鉴于上述两门MOOC课程的子讨论区的有限数量,我们不必再用皮尔森相关数r值去定量描述标准化的模块和传播效率之间的相关性。此外,还需要用其他项目中的相关数据去确认本研究中观察到的模块度和传播有效性之间的逆向关系是否亦然正确。这是值得进一步研究的问题。

 



总而言之,这些结果显示出MOOC中讨论的重要特征:学习者之间的有意义交流,产生于多种讨论话题和参与者的明显异质性—这也是实现真正意义上的全球规模讨论的关键所在。相反,讨论区中的绝大多数信息交换,乃至于任何知识构建,都是发生在较小的、短期存活的小组中。

 

讨论(Discussion)


我们的研究表明,讨论区参与行为在时间上和讨论话题上呈不同类地分布。用户参与行为受课程关键点的驱动,如课程发布、有截至日期的最终项目等。另外,群体机制—即,交流的意义和脆弱性——根据所讨论的题目和教员设置的鼓励机制而有所变化。最后,MOOC交流网络中的模块度似乎在“捕获”小型学习小组中的信息,妨碍其传播。这些发现很重要,因为它表明,结构性限制可能影响MOOC促进大规模学习者之间进行交流的能力。如果对于在线讨论不采取一些技术性的及教学监管方面的干预,当前MOOC上社交性学习的结构限制就可能会妨碍真正意义上的全球教室的实现。

 

论文最后还介绍了所采用的研究方法。对此有兴趣的读者可以找来进一步研究。


原文网址:

本文是由中关村互联网教育创新中心运营总监李国丽博士推荐,由慕客人编译。

 

产权及免责声明本文为微信公众号【MOOC(微信号:openonline)】原发、原创、编辑或评论的文章,版权为慕客人所有。欢迎个人转发分享,任何单位、公众号转载需要取得授权,违者将追究法律责任。


了解在线教育,
把握MOOC国际发展前沿,请关注:
微信公号:openonline
公号昵称:MOOC


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存