查看原文
其他

当期荐读 2020年第4期 | 基于认知分类的大学生网络健康信息搜索的学习效果研究(内含视频摘要)

图书情报知识 图书情报知识 2021-03-13

ISSN 1003-2797

CN 42-1085/G2

双月刊

同行评审期刊



韩正彪1 ,2   郭靖怡1   潘培培1   徐铭泽1

(1.南京农业大学信息科学技术学院,南京,210095; 2.南京农业大学领域知识关联研究中心,南京,210095)


[目的/意义]


旨在探索大学生在完成不同认知层次的健康信息搜索任务时是否具有独特的搜索特征和学习效果。

[研究设计/方法]


采用实验法和问卷调查法收集了65 名被试完成六类不同认知层次的健康信息搜索任务的搜索行为和学习效果数据, 并综合利用配对样本t 检验、 单因素方差分析和多元线性回归法对数据进行分析。

[结论/发现]


用户在完成搜索任务时,其搜索时间、搜索策略、目标网页操作和搜索引擎结果页面点击次数等搜索特征在六类任务间体现出一定的显著差异;在用户搜索的学习效果测量方面,用户主题熟悉度变化指标可以有效地揭示用户在搜索过程中发生的学习行为,而用户感知学习效果指标无法有效地区分不同认知水平搜索任务间的学习效果。

[创新/价值]


首次尝试从搜索即学习(SAL)理念出发,引入了认知分类理论探索大学生健康信息搜索行为的特征及其学习效果的测量。该研究可为交互式信息检索领域设计不同复杂度的检索任务以及测量学习效果指标的选取提供理论支持。

[关键词]


学习效果  搜索行为  认知学习理论 

网络健康信息  大学生  搜索即学习(SAL)



1 引言


在健康中国战略的引领下,我国的医疗健康领域已经取得了长足的进步,但当今大学生仍然会面临着各种健康问题。通过搜索引擎获取或规避健康信息已成为当今大学生日常生活中的一种常见行为。截止目前,学术界已有不少研究关注用户健康信息搜索与规避等相关的研究问题。以往的研究主要集中在大学生健康信息搜索的动机[1]、影响因素与行为模式[2-4],大学生健康信息素养[5],大学生健康信息规避行为[6]等主题。鲜有研究从搜索即学习(searching as learning,SAL)视角出发,将大学生用户健康信息搜索视为一种学习过程来进行探索。


SAL从建构主义视角出发,将信息视为知识或信念,将各类搜索系统或网站视为用户进行学习的空间[7]。用户通过与信息互动,可以学习相关知识从而解决自身面临的问题甚至是创造新知识。该主题已受到国内外学者的广泛关注[8-11]。大学生健康信息搜索是一种以获取预防或治疗自身面临的健康问题的相关信息为目的的搜索行为,自然在搜索过程中也会伴随着健康知识的吸收和利用行为,即学习行为。从该视角出发,不仅可为探索大学生健康信息搜索行为提供新的理论视角,也可为健康信息检索系统(搜索引擎或网站)的优化提供新的启示。


教育心理学中的Bloom认知分类理论表明人类的学习可以按照认知水平的高低划分为不同的层次[12]。该认知分类法可以用来指导如何设计面向不同认知层次的搜索任务[13]。大学生为了完成不同认知层次的学习任务需要进行不同的心智活动,基于此,我们假设既然大学生的健康信息搜索行为是一种学习过程,那么他们在完成不同认知层次的搜索任务时,自然也会进行不同认知层次的心智活动,并体现出不同的搜索行为。此外,应该如何科学地测量他们完成不同认知层次搜索任务的学习效果呢?基于上述思路,本研究形成了以下研究问题:


(1)用户完成不同认知复杂程度的健康信息搜索任务时,其相应的搜索行为有何显著差异?


(2)用户在完成不同认知复杂程度的健康信息搜索任务时,应该如何测量其学习效果?各类任务下的学习效果之间是否有显著差异?


2 文献综述


2.1 SAL相关研究


2.1.1 用户信息搜索与学习的关系研究


LIS学科一直有学者探索信息搜索和学习的关系。例如,Brooks描述了信息作用于知识结构的方程,而用户知识结构的变更正是一种典型的学习[14]。Kuhlthau提出的信息搜索过程模型主要是针对学习型任务,该模型的理论基础源自于心理学的成果[15]。这些理论都是将人类的思考和学习视为意义建构的过程。之后,Kuhlthau提出用户信息搜寻早期阶段持有的“不确定性”并非是一个消极的构念,而是作为用户创新和创造的开始,是学习过程的一部分[16]。此外,Dervin提出将信息需求视为用户内在的构建以解决“缺口”或不连续的东西[17],以及Belkin提出的知识非常态,都在一定程度上体现了信息搜索和学习的关系[18]


虽然各类检索系统能够较好地帮助用户完成事实型搜索任务,但在帮助用户完成探索型搜索任务和综合型搜索任务方面却收效甚微[19]。因此,越来越多的学者开始积极探索SAL研究问题。这类研究可以分为三类。第一类研究将信息搜索视为学习工具,重点探索与学习任务有关的信息搜索行为及其与学习效果之间的关系[20-22]。例如:Heinström等分析了人格特征和学习方式对于学习任务全过程的影响[23];刘涵蕊与刘畅分析了用户的认知风格和话题熟悉度对其完成学习型任务的交互行为的影响[24]。第二类是将信息搜索过程视为学习过程,重点关注用户在信息搜索过程中的知识构建问题。知识的构建和变化主要体现在领域知识和系统知识(或称其为系统的用户心智模型)两个维度。其中,绝大部分研究重点关注领域知识的构建,既有关注个体完成搜索任务过程中的知识构建问题[25-29],也有关注协作信息搜索过程中的知识构建问题[30]。值得关注的是,在研究的理论层面,已有学者采用认知心理学理论理解此学习现象,为今后探索该类问题提供了理论基础。Jansen等提出相对于以往的决策范式和问题解决范式而言,从学习理论出发可以更好的描述和理解信息搜索过程[31]。之后,Zhang和Soergel采用建构主义的思想分析该现象,并引入皮亚杰的认知发展理论揭示用户知识的构建和展示等问题[32]。此外,有少部分研究尝试探索用户在信息检索过程中其系统知识和检索技能的变化[33-37]。第三类是关注如何基于SAL的理念优化当前的搜索系统。按照优化的思路来看,主要分为以下两个主题:其一,探索支持特定类型搜索任务的搜索系统,例如Fulantelli等分析了一种可以支持SAL的搜索系统[38],该系统可以支持用户完成高层次的学习活动;其二,通过优化搜索结果的可视化展示支持用户搜索中的学习,例如Arora提出从检索到的文献中抽取出有意义的信息文本单元进而展示给用户以提升用户在完成信息搜索任务中主题知识增加的有效方法[39],Lu与Hsiao为编程语言学习论坛中的用户提供了可视化的导航和浏览历史以显著地提升其学习效率[40]


2.1.2 用户信息搜索的学习效果测量


将用户信息搜索视为学习过程面临的一个重要研究问题便是如何测量学习效果。相关研究中关于学习效果的测量主要从用户自我汇报和外部专家评估两个角度展开。在用户自我汇报角度,已有研究探索了用户在完成搜索任务的前后对于检索任务主题熟悉度的变化[41]、自我感知学习效果[42]等。这类研究主要采用调查问卷的形式。也有研究尝试采用绘制概念图的方法来探索搜索前后其知识结构的变化[43]。外部专家评估主要包括让用户搜索后完成特定的测试问题[44]、专家对被试撰写的文本质量(主要针对特定的搜索任务,如需要用户在搜索完成之后撰写报告等)进行评估[45]。也有研究提出评估用户网络搜索的学习效果可以同时从用户主题知识变化、用户感知学习和面向特定认知层次的学习评估三个维度同时展开测量和对比分析[46]


2.2 Bloom认知分类理论及其在搜索任务设计中的应用


1956年,美国教育心理学家Bloom提出了教育者的教育目标分类,就认知范畴而言,包括知识、领会、应用、分析、综合和评价六种思维级别[47]。之后,2001年,Anderson等提出了Bloom认知分类法的修订版本,按照认知复杂度的高低将认知过程分为6个层级和19种认知过程[48],如表1所示。



Jansen等基于Anderson等提出的修正后的Bloom认知分类层次设计了具有不同认知复杂度的信息搜索任务,探索用户完成不同任务之间的搜索行为差异[49]。但是由于探索性较强,该研究并未证实随着搜索任务认知复杂度的提升,其搜索行为复杂度(具体由花费的搜索时间,搜索策略调整次数、搜索结果页面点击次数等行为指标反映)会越复杂。之后,Kelly等进一步探索了应该如何应用认知复杂度分类框架来开发交互式信息检索任务[50]


通过上述回顾可知,虽然SAL和基于Bloom认知分类理论的搜索任务设计已经取得了一定的研究进展,但很明显这些研究的探索性都较强,尚需后续研究进行进一步的证实和完善。尤其是将这些成果应用到大学生网络健康信息搜索领域的研究更是少见。此外,上述研究回顾表明,Bloom的认知分类理论可以有效的指导如何设计面向不同认知复杂度的搜索任务,从而为探索SAL主题的实证研究提供方法论层面的支撑。因此,本研究基于Bloom认知分类理论中六个层次的内涵,设计了六个健康信息搜索任务,从SAL视角出发探索用户完成各类搜索任务的搜索行为差异,并对其相应的学习效果进行测量和对比分析。


3 实验设计


3.1 实验被试


本次实验一共招募72名南京农业大学的大一学生参与。除去中途主动放弃实验和实验任务书填写不完整的被试,最终有效被试65人。其中,女生37人,男生28人,年龄分布在17—20岁之间(M=18.12;SD=0.600)。这些被试来自于南京农业大学信息科技学院、公共管理学院和经济管理学院等9个不同的学院。被试使用搜索引擎的年限分布在0.5—15年之间(M=8.48;SD=2.668)。为了在一定程度上避免被试的信息检索技能差异太大而影响实验结果,招募的被试均是大一的学生,且均没有选修过信息检索课程和参加过图书馆信息素养专题培训的经历。


3.2 实验任务设计


“模拟仿真工作任务”描述了一个真实的信息需求情境,可以有效替代真实工作任务,用于信息检索系统评估及用户信息搜寻行为研究[51]。设计该类任务需要向用户阐明信息需求的来源、目前所处的环境、搜索的目的以及待解决的问题[52]。本研究设计的六个任务满足Borlund提出的模拟仿真工作任务的特点[53]:第一,这些任务都是大学生在日常生活中经常会遇到的搜索问题(例如,应用型任务(TAp)是典型的于南京就读的大学生经常面临的问题。南京梧桐树非常多,在每年的春天都会有大学生因梧桐絮而过敏),以保证被试能够准确的理解这些任务;第二,设计的搜索任务被试都有兴趣,且自愿参与实验;第三,每个任务的初始都提供了足够的环境信息,以便于被试发挥他们的想象。结合Bloom认知分类层次的内涵,最终设计了六个不同认知层次的搜索任务,如表2所示。



此外,为了减少任务次序对被试的影响,实验采用拉丁方设计对六项任务的顺序进行轮换。实验要求每个被试对6个不同的任务进行搜索,则拉丁方中至少有6个被试参与实验,组成6*6的矩阵(令1=记忆,2=理解,3=应用,4=分析,5=评价,6=创造)。对标准拉丁方矩阵进行轮换和纵列的随机排列过程如下。首先,利用rand函数生成随机数表,从表中选取第84行第3个数字开始向右抄录3个6位数(142365、246135、261354),抄录时舍去“0”、“7以上的数”和重复出现的数字。其次,将第一组六位数与列数对应,进行纵向轮换;然后将第二组六位数与行数对应,进行行列轮换。最后,第三组六位数与六个实验任务对应,得到最终拉丁方序列,如表3所示。



3.3 实验流程


为了消除检索时间限制对于用户搜索行为的影响[54],本次实验不限制用户完成每类任务的时间。为了让被试更加自在地开展健康信息搜索,实验场所选择了与他们平时查找网络健康信息相一致的教室或宿舍。实验时间为2018年9月17日至12月16日。在开始实验前,被试的电脑上提前安装了屏幕录像软件,以记录被试在网上搜索健康信息的整个过程。实验的具体程序如下:第一,实验负责人介绍实验的基本情况和注意事项;第二,被试仔细阅读实验同意书并签字;第三,被试填写人口统计学信息等调查问卷;第四,被试按照抽签得到的拉丁方顺序依次完成实验书上的六项搜索任务,其中在搜索任务前后被试需要填写相关的学习效果测量问卷。其中,实验程序一、二、三的时间为20分钟左右;被试完成六个实验搜索任务的总时间分布在14—127min之间(M=59.98;SD=25.91)。


3.4 变量的可操作性测量


3.4.1 用户健康信息搜索行为的可操作性测量


在参考相关研究基础上[55-57],本研究主要从搜索行为整体情况、搜索过程和搜索结果出发,设计了完成时间、搜索平台记录等8个对应指标测量被试的搜索行为,如表4所示。



3.4.2 学习效果的可操作性测量


考虑到本研究的探索性较强,实验从多个维度出发设计学习效果测量指标。由于用户关于搜索系统的心智模型常常具有稳定性,且被试均已使用搜索引擎多年,已有较为稳定的搜索模式。所以,本次学习效果的测量只考虑用户领域知识水平的变化程度,具体从主题熟悉度、感知学习效果、信息探索效果和面向不同认知层次的学习效果四个不同维度测量,如表5所示。其中,问项的测量通过李克特7点量表的形式进行。



4 实验结果分析


4.1 用户搜索行为在任务间的差异


通过独立样本t检验和方差分析结果显示,用户的搜索行为在人口统计学特征(性别、使用搜索引擎年限)上没有显著差异。被试在完成六类不同认知复杂程度的健康信息搜索任务时,其搜索行为在任务间存在一定的差异,方差分析结果如表6所示。



4.1.1搜索行为整体情况在任务间的差异


在搜索任务完成时间方面:用户完成搜索任务的时间会因任务的分类不同而有所差异(F(5,384)=17.705,p=0.000<0.05)。经事后多重比较发现,记忆型任务(TRe)的搜索时间显著低于其他五种类型的搜索时间;分析型任务(TAn)和创造型任务(TCr)的搜索时间显著高于应用型任务(TAp)的搜索时间。此外,在用户完成不同类型的搜索任务时,搜索平台变更次数的数量无显著差异(F(5,384)=0.717,p=0.611>0.05)。但观察均值可知,用户在完成分析型任务(TAn)时搜索平台改变次数最多(M=0.49,SD=1.427),用户在完成评价型任务(TEv)时搜索平台改变次数最少(M=0.17,SD=0.601)。被试在完成实验过程中,共使用12类信息平台508次。其中,百度搜索引擎被使用了344次,占总数的67.72%,是使用最频繁的信息平台,360搜索位居第二,占总频数的14.57%。除了搜索引擎外,少数被试选择使用一些健康网站和文献数据库(如:CNKI)获取健康信息。


4.1.2 搜索行为过程指标在任务间的差异


在查询重构次数方面:由表6可知,用户完成搜索任务的查询重构次数在任务类型间有显著差异(F(5,384)=4.478,p=0.001<0.05);经事后检验发现,分析型任务(TAn)的查询重构次数显著高于记忆型任务(TRe)的查询重构次数。在目标网页操作维度:用户浏览页面总数在任务类型间有显著差异(F(5,384)=6.615,p=0.000<0.05);事后检验发现,完成记忆型任务(TRe)时的浏览页面总数显著低于其他五类任务。重新浏览先前页面总数在任务类型间也有显著差异(F(5,384)=4.213,p=0.001<0.05),事后检验发现完成分析型任务(TAn)和创造型任务(TEv)时重新浏览先前页面的总数显著高于完成记忆型任务(TRe)的重新浏览先前页面的总数。


4.1.3 搜索结果浏览在任务间的差异


由表6可知,用户SERPs点击次数会因任务的分类不同而有显著差异(F(5,384)=7.506,p=0.000<0.05)。经事后检验发现,完成记忆型任务(TRe)的SERPs点击次数显著低于完成其他类型任务的SERPs点击次数。


4.1.4 任务类型与搜索行为复杂度关系分析


为了进一步揭示用户完成搜索任务时其整体搜索行为的复杂度,按照用户完成六类任务在五个指标(完成时间、查询重构次数、浏览页面总数、重新浏览先前页面总数和SERPs点击次数)上的得分进行从低到高排序,并对排序值进行加总求均值后,最终得到任务类型和搜索行为复杂度之间的关系如图1所示。以分析型任务(TAn)的搜索行为复杂度计算为例:用户完成此任务时在五个指标上的得分均最高,即在每个指标上的排序值均为6。因此,分析型任务(TAn)的搜索行为复杂度最终得分为6。


由图1可知,各类任务对应的搜索行为复杂程度排序结果为:分析型任务(TAn)>理解型任务(TUn)>创造型任务(TCr)>评价型任务(TEv)>应用型任务(TAp)>记忆型任务(TRe)。除了应用型任务(TAp),用户在完成理解型任务(TUn)、评价型任务(TEv)和创造型任务(TCr)时其搜索行为复杂程度排序略有变化,且有趋同的趋势。虽然评价型任务(TEv)、创造型任务(TCr)最终的任务目标需要被试进行高认知层次的活动(如:评判和制定计划),但是这些都是用户在搜索信息后进一步的信息利用行为。因此,用户完成这三类任务时在搜索行为测量指标上没有体现出显著的差异。



4.2 大学生网络健康信息搜索的学习效果分析


4.2.1 不同搜索任务类型的用户学习效果


(1)用户主题熟悉度变化

对六类任务搜索前后主题知识熟悉度分别进行配对样本T检验,结果如表7所示。六类任务搜索前后的用户主题知识熟悉度均存在显著差异(p<0.05),用户在完成各类不同认知复杂度的搜索任务后,主题熟悉程度均有了提高。



(2)感知学习效果

用户在完成六类搜索任务后,其感知学习效果的得分均值如图2所示。由图2可知,用户在六类主题任务的自我感知学习效果均分均高于4。表明用户完成搜索后,存在一定的学习效果。进一步进行方差分析,发现用户在完成六类任务后的自我感知学习效果得分均值之间没有显著差异(F(5,354)=0.452,p=0.811>0.05)。从均值来看,用户在完成分析型任务(TAn)后的自我感知学习效果最好;而在完成理解型任务(TUn)后自我感知效果最差。



 (3)信息探索效果信息探索效果

主要包括概念关系、扩大主题范围、信息合成三个子维度,这三项指标在六类搜索任务间的方差分析结果如表8所示。



由表8可知,概念关系指标的得分在六类任务间无显著差异(F(5,384)=1.246,p=0.287>0.05)。但从均值来看,用户完成评价型任务(TEv)之后,该指标的得分最高;而用户完成记忆型任务(TRe)之后,该指标的得分最低。扩大主题范围指标的得分在六类任务之间存在显著性差异(F(5,384)=4.219,p=0.001<0.01)。经过LSD事后检验发现,扩大主题范围指标的得分在完成记忆型任务(TRe)后显著低于其他五种类型的任务的相应得分。信息合成指标的得分在六类任务之间存在显著性差异(F(5,384)=2.662,p=0.022<0.05)。用户在完成分析型任务(TAn)后,其相应的信息合成效果最好(M=4.58)。经LSD事后检验可知,用户在完成分析型任务(TAn)后其相应的信息合成指标的得分显著高于完成记忆型任务(TRe)、理解型任务(TUn)、创造型任务(TCr)后该指标的得分。


 (4)面向不同认知层次的学习效果

由于该指标及其问项的设计都是单独针对不同认知层次的任务,所以未进行统计学意义上的检验。用户在完成六类任务之后,其相应的学习效果的得分均值如图3所示。由图3可知,用户在完成应用型任务(TAp)和评价型任务(TEv)后学习效果得分最高,而在完成创造型任务(TCr)后的学习效果得分最低。



4.2.2 用户搜索行为对学习效果的影响研究


分别以主题熟悉度变化、用户感知学习效果、信息探索效果为因变量,以搜索平台变更次数、查询重构次数、浏览页面总数、重新浏览先前页面总数、SERP点击次数为自变量进行多次多元线性逐步回归。研究结果显示:自变量仅对扩大主题范围有显著影响。相应的回归方程为:扩大主题范围=4.215+0.052*查询重构次数。该回归模型的判定系数R2为0.012,F检验结果表明回归显著(F(1,388)=6.260,p=0.033<0.05)。判定系数非常小,表明查询重构次数只能够解释扩大主题范围变化很小的一部分。此外,由于面向不同认知层次的学习效果,针对不同的任务采用不同的测量题项,所以未分析搜索行为对该变量的影响。


5 研究讨论与结论


5.1 不同认知复杂度任务下的用户健康信息搜索行为差异


本次研究表明,用户在完成不同认知复杂程度的健康信息搜索任务时,其搜索行为体现出一定程度的显著差异。这与Ghosh等人的研究结果一致[63],在一定程度证实了将用户健康信息搜索行为视为学习过程的合理性。其中,用户完成分析型任务(TAn)时的搜索行为最为复杂,体现在花费的时间最多、采用的搜索策略步骤最多、点击SERP次数最多等。该发现与Jansen等人的研究结果一致[64],即该类搜索任务对于搜索者而言更具有挑战性,呈现出复杂的搜索特征。而完成记忆型任务(TRe)时的搜索行为则最为简单,时间也最短。这是由于该类任务属于最为简单的事实型搜索任务,用户所花费的认知负荷较小。而且,目前的搜索引擎能够很好的支持用户完成这类任务。该研究结果可为今后设计不同认知复杂度的搜索任务提供依据。例如,在交互式信息检索研究中,如果想探索用户在完成不同认知复杂度的搜索任务过程中情感的变化,可以通过设计分析型任务(TAn)和记忆型任务(TRe)来反映任务的认知复杂度变化。


通过分析发现,用户完成应用型任务(TAp)的搜索行为复杂度低于理解型任务(TUn)、评价型任务(TEv)和创造型任务(TCr)相应的搜索行为复杂度。我们初步推测这是因为学习分类理论中的应用层主要是让学生掌握在给定情境下应用某一项具体的执行规则。本研究虽然试图开发与之相对应的搜索任务,但仍很难真正体现“执行”的过程,更多的还是反映在“规则”本身的描述和搜索上。这一点在Kelly等的研究中也有所体现,该研究认为无法在应用层次设计出与其他层次有明显区分的搜索任务[65]。此外,由于被试在搜索平台更换的次数方面都非常低,用户在完成任务时搜索平台的平均变更次数不超过0.5,且在六类任务上都没有显著差异,搜索行为复杂度的计算未纳入该指标。该研究结果进一步验证了陆溯的研究结果[66],即只有少数对几种搜索引擎都熟悉的大学生才考虑有针对性地选择自己需要的搜索引擎。这意味着在一定程度上大多数大一学生在完成健康信息搜索任务时,并不会主动的综合采用多种信息检索工具与平台进行搜索以解决其面临的健康问题。作为刚进入大学的学生,他们面临着新的学习和生活环境的变化,在这种情况下常常会引发学生的心理等健康问题。如何提升这类用户的健康信息搜索技能应该纳入到大学生信息素养课程教学和培训之中。


此外,在任务设计方面,本研究主要是依据Bloom认知分类理论中六个层次的内涵来进行设计。其中,记忆型任务(TRe)需要被试查找一个具体的事实型信息;理解型任务(TUn)需要被试在理解任务的基础上搜索并列出多个相关的信息;应用型任务(TAp)需要被试在搜索信息的基础上,并通过利用这些信息形成一个具体的方案。虽然这三类任务体现出了一定程度的认知差异,但是在本质上均属于事实型搜索任务,这一点可能导致这三类任务之间的显著性差异不明显。依据Anderson等提出的观点,学习可从认知处理维度(认知复杂度)和知识类型(事实型知识、概念型知识、程序型知识和元认知知识)维度来理解其学习过程[67]。正如Urgo等人提出的,之所以出现不同认知层次的搜索任务间差异不明显,可能是由于在实验任务设计时没有很好的控制知识维度导致的[68]。因此,今后在设计实验任务时,需要进一步同时控制认知层次和知识类型两个维度来创建搜索任务。


5.2 不同认知复杂度任务下的用户健康信息搜索学习效果差异


本次研究表明,用户主题熟悉度的变化可以有效的揭示用户在搜索过程中发生了学习行为。用户完成六种任务后,其主题熟悉度的得分都有显著提升。该研究发现进一步实证了Liu等发现的主题熟悉度指标可以用来评估用户信息搜索前后知识的变化,以揭示用户在信息搜索过程是否发生了学习[69]。但是Liu等人研究中识别到的:“当用户对于某一搜索任务主题有高的认知水平时,该指标在评估搜索前后知识的变化效果会出现不显著的情况,即天花板效应”的结论在本研究中并未发现[70]。我们初步推测这是由于本研究选择的是健康领域的搜索任务,而招募的被试均没有专业的健康领域知识,他们对于这些搜索任务的搜索前的主题熟悉度并不高。此外,本研究进一步发现该指标在记忆型任务(TRe)和分析型任务(TAn)方面,提升幅度排在前两位。这可能是由于记忆型任务(TRe)较为简单,对于用户的认知需求较低,用户可以在很短的时间内完成任务,且达到相应的认知要求,所以他们会觉得对该任务主题有比较高的认知。而对于分析型任务(TAn)而言,用户在该任务上花费的时间最长,探索的深度和广度都高于其他类型任务。因此,分析型任务(TAn)对应的主题熟悉度变化也较高。


此外,本研究表明用户在感知学习效果、信息探索效果、面向不同认知层次的学习效果三个维度对应变量上的得分处于3.40—4.72之间,但是各个变量在六类任务上的得分排序并不一致。这也在一定程度上表明对于用户健康信息搜索行为学习效果的测量需要从多个维度展开,才能全面和科学的揭示其学习效果。在探究信息探索能力的差异上,用户扩大主题范围与信息合成能力在六类主题任务间存在显著性差异,而探索概念关系能力在六类主题任务上不存在显著性差异。这可能是受到样本特征和搜索系统特征的双重影响。通过观察搜索录像发现,一些被试缺乏按一定逻辑探索概念关系的意识。具体体现在当被试面临搜索结果不理想时,他们会选择从非关键词上拓展检索式。例如:将“篮球运动员面临的风险”调整为“篮球运动员面临哪些风险”。因此,今后在大学生信息素养培训方面,需要加强培养学生对于搜索任务主题概念关系的分析和探索能力。此外,当前的搜索平台未使用较好的概念匹配与概念合并规则,其提供的检索帮助大多从修辞上改变提问方式,而非从概念关系上改变检索式,这不利于满足用户探索概念关系的潜在学习需求[71]。具体而言,用户在记忆型任务(TRe)三个指标上的得分均最低,这是由于该搜索任务的认知层次较低,从搜索引擎中检索信息有效的替代了他们的“记忆”。对于其他类型任务而言,分析型任务(TAn)和评价型任务(TEv)的学习效果得分排在前两位。在感知学习效果方面,六类任务上的得分都相对集中,得分均处在4.37—4.72之间。这表明,该测量指标并不能够很好的区分各类任务学习效果的差异。Fisher等人曾研究发现用户在使用互联网搜索之后,常常会产生“掌握知识”的错觉,从而对自己的能力产生过高的估计[72]。本研究设计的感知学习效果指标主要是让用户自我评估知识的增长程度,既没有知识增长的具体的基准,也没有提出知识增长应该考虑哪些维度。由于该指标的特性和用户使用互联网搜索的认知偏差,从而导致了本指标在任务间学习效果的测量得分方面较为趋同。


由于面向不同认知层次的学习效果是单独针对各个层次而设计的,所以无法进行任务间的比较。但通过计算该指标与其他指标的相关性可以发现,均具有显著相关性。这在一定程度上表明了该指标也可以用于测量学习效果的合理性。


6 小结


本研究基于SAL的理念,以Bloom认知分类理论为基础,设计了六类认知复杂度不同的健康信息搜索任务,对大学生在完成不同认知学习层次的健康任务时的行为差异和学习效果测量进行了探索性的研究。虽然本研究达到了预期研究目标,但仍然存在一些局限性。第一,研究设计的搜索行为测量指标粒度较低(例如:对于SERP仅仅计算了点击次数,而没有统计SERP停留时间等),而这些细化后的指标有可能会是用户学习效果的核心影响因素。第二,招募的被试为南京农业大学大一新生。通过观察其搜索录像发现,被试在搜索方法方面,均只利用初级检索进行;在搜索策略的制定方面,存在缺乏按一定逻辑探索概念关系的意识。这可能会导致即使是面临着高认知复杂度的任务,由于其检索行为偏好,也会仅仅采取简单的搜索行为。另外,本研究只调查了被试使用搜索引擎的年限,而没有对被试的信息素养进行精确测量,从而造成无法分析信息素养偏高组和信息素养偏低组在完成六类搜索任务上的差异。因此,今后需要扩大实验对象的范围和在实验中加入被试信息素养评估环节。第三,本研究主要从用户自身视角出发测量其信息搜索的学习效果,但该测量方法是否可靠取决于所设计的问卷的效度和用户填写问卷的认真程度。用户对于自身知识的评估常常会存在或高或低的偏差[73]。因此,今后可进一步引入专家评估等方法,并对比分析这些测量方法在学习效果测量方面的异同。


参考文献



*本文原载于《图书情报知识》2020年第4期19-31

版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。




专家评审意见

文章需要进行的修改包括:补充近年的文献;实验设计方面需描述更加清晰、明确,对于设计方面的局限性要有更清楚的描述和认识;讨论部分的一些观点需要有证据支持,且讨论应该更深入,尤其要结合SAL的已有研究发现。具体如下:


1.SAL是近年来比较受关注的研究领域,但从作者的文献回顾中,反映近年的研究成果不多,有些欠缺。


2.实验设计部分总的来说,比较规范严谨,但也存在一些影响整个研究结果的问题:
(1)实验选择大一新生,给出的理由是:“由于用户的检索行为常常受到检索技能的影响,为了尽可能消除用户检索技能对其检索行为的影响,本次实验招募的被试均是大一的学生”,这样的理由需要有根据,而不是作者自我主观的认为大一新生的检索技能趋于较低水平并且水平一致。
(2)“模拟仿真工作任务”的设计方法需要补充说明本研究中的设计是否符合这种任务情境的设计要求。
(3)记忆型、理解型和分析型的任务设计没有充分体现这几类任务的特征,设计的任务基本属于事实型任务。如何体现差异?这样的任务设计直接导致了研究结果不太理想。因而,讨论部分需加强对“任务设计”如何影响了研究结果的分析,不是“任务类型”。
(4)实验的时长,参与者是有差异的,如果不限制时间,实际上会导致完成时间具有一定的差异,应该给出时间上的差异数据。
(5)拉丁方设计是如何做的?任务如何安排要体现在文章中。
(6)被试的基本特征过于简单,检索实验还是应该有他们对计算机使用的熟练程度、使用网络的年限、通常使用哪些搜索引擎等的数据,并评估这些特征可能带来的影响。
(7)“被试点击搜索引擎显示的第一页结果页面的次数”,此处需要说明为何只点击第一页。
(8)文中称“借鉴研究背景中对于用户信息搜索学习效果测量研究中的已有指标”,哪些是借鉴的指标?从哪项研究借鉴的?哪些是本研究新开发的?这些问题都需要作者注明。


3.研究讨论与结论部分:
(1)“本研究选取的被试为大一新生,大部分用户缺乏按一定逻辑探索概念关系的意识”,作者是如何得出这一结论
的?有研究表明这一点吗?
(2)“大一新生由于还没有参加信息素养相关课程的学习,其信息素养水平不高。”问题同上,此结论有证据吗?
(3)讨论部分应该结合SAL的相关研究进行深入的分析,目前的分析深度不够。尤其是针对健康信息搜寻和其他类型的信息搜寻过程中用户的学习效果有何不同?

制版编辑 | 姚志臻

END





当期荐读 2020年第4期 | 时空限制与任务复杂度对搜索结果的影响: 跨设备实验研究(内含视频摘要)

当期荐读 2020年第4期 | 信息行为研究如何进阶——IP&M 主编Bernard Jim Jansen教授专访

当期荐读 2020年第4期 | 卷首语 交互信息世界中的信息行为研究

当期荐读 2020年第3期 | 协同搜索过程中用户交流内容与模式研究(内含视频摘要)

当期荐读 2020年第3期 | 用户动机视角下的Altmetrics指标研究(内含视频摘要)

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存