查看原文
其他

当期荐读 2020年第4期 | 学术社交网络用户特征对知识交流效果的影响——以南京大学ResearchGate用户为例

图书情报知识 图书情报知识 2022-06-09

ISSN 1003-2797

CN 42-1085/G2

双月刊

同行评审期刊



王 瑞  李思豫  袁勤俭

(南京大学信息管理学院,南京,210023)


目的/意义

分析不同用户特征对知识交流效果的影响,探索平台改进策略,提高学术社交网络知识交流效果。

研究设计/方法

采用主成分分析法将用户特征分为身份特征、影响力特征、互动特征、追踪特征和项目特征五大类,利用描述统计、相关性分析和回归分析探究不同用户特征对知识交流效果的影响。

结论/发现

不同学科背景用户具有不同的RG指数分布,影响力特征对知识交流效果具有重要影响作用,其中h指数影响最为强烈。

创新/价值

为提升学术社交网络知识交流效果提供参考。

关键词

学术社交网络 用户特征 信息行为 知识交流效果 ResearchGate


1  引言

随着Web2.0的发展,学术活动逐渐拓展边界,在线社区的科研人员互动和科研成果共享已成为学者知识交流的重要方式。学术社交网络是用以交流专业领域内知识的开放性互联网平台[1],其共享性、交互性等特点使知识交流更加高效和便捷。近年来,学术社交网络越来越活跃,ResearchGate、Academia、科学网等平台已成为学者进行科研创造的重要工具。用户是学术交流的主体,其科研身份、平台使用行为、学术影响力等可能会对学术社交网络知识交流效果和用户持续参与交流的态度及意愿产生一定影响,因此研究学术社交网络中的用户特征,把握各项特征与知识交流效果的关系,对于完善平台服务,提高知识交流效果同时提升平台用户粘性具有重要意义。为此,本文以ResearchGate平台上的南京大学用户为例,通过对用户特征数据的采集分析,从用户身份、学术影响力、互动行为等不同维度阐释了用户特征对知识交流效果的影响,以期为提升学术社交网络知识交流效果提供参考。


2  研究回顾

2.1 学术社交网络用户相关研究

在用户参与动机的相关研究中,提升自身学术影响力[2]、与同行保持联系[3]、分享并获取学术成果[4]、跟踪领域内研究前沿、建立个人学术档案[5]、增强社会参与、提升自我效能、互惠、信任[6]等均是用户参与学术社交网络知识交流的重要原因;关于用户的学术交流行为研究,张宁等用扎根理论方法构建了学术社交网络用户感知信息质量影响因素CPUC模型,提出用户感知信息质量受社区、平台、用户和内容四方面影响[7];胥伟岚则从社会网络理论出发,分析了用户知识交流模式的内涵与特征,构建出基于人际网络的知识交流模式[8];类似地,邱均平等考虑了学者的好友链接关系网络,利用社会网络分析法挖掘学科间及学科内部研究人员的学术交流行为[9];为进一步明晰学术交流过程中的群组特征,刘晓娟等利用用户属性和行为数据剖析了学术群组的形成和发展因素[10];Yan等将ResearchGate平台上的用户进行了分类,指出该平台用户由信息源类、好友类和信息搜寻类三类群体组成,且不同群体中的用户在平台上的活跃度及平台利用情况均有所差异[11]


2.2 学术社交网络科研机构相关研究

为检验科研机构在学术社交网络上的学术影响力是否能准确反应其真实学术水平,Lepori等通过对ResearchGate社区的网络调研,得出平台上科研机构的RGScore得分与机构已发表的科研文献数量正相关[12];Yan等则聚焦到具体的高校机构,分析了ResearchGate平台上美国61所研究型大学的用户数据,结果表明学术社交网络中的指标能很好的衡量现实中科研机构的研究活动[13];为探究我国与西方国家的差异,严炜炜选取中美具有代表性的iSchool院校学术社交网络总体利用水平进行比较分析,得出中国iSchool成员的学术社区参与水平、学术影响力和受关注程度均距美国iSchool成员有明显差距[14];仝晶晶则对78个iSchool联盟成员进行了更为广泛的调研分析,基于国家差异的视角从影响力、信息共享和社交行为三方面比较了不同科研机构用户对学术社交网络的利用行为,指出中国的用户注册数量居全球第三位,但用户活跃度低,影响力较小[15];聚焦于图书情报与档案管理学科,庞玲玲分析了南京大学、武汉大学、中国人民大学三所机构信息管理学院的科研人员在ResearchGate平台上的行为数据,从总体采用情况、使用行为与用户影响力、学科背景与关注主题三方面探讨了图情学科用户的学术社交网络使用行为[16]


2.3 学术社交网络平台功能相关研究

有学者对平台功能进行了划分,黄丽佳将其分为导航功能、知识获取功能、知识分享功能、交互功能和个人知识管理功能,并构建了系统功能设计对知识交流效果的影响模型,研究表明知识交流效果受五项功能的直接促进作用[17];类似地,皇甫军采用主成分分析法将平台功能分为信息、凝聚、合作、管理四项功能,其中信息功能有效增强学术分享行为,合作功能对各行为影响较小,凝聚功能对学术分享与合作行为作用较大,管理功能也会有效增强学术分享[18];Bhardwaj通过比较ResearchGate、Academia.edu、Mendeley和Zotero四大主流网站的功能,发现服务性能、输出功能、隐私设置、文本显示、书目特征的可用性等均会影响用户的使用体验[19];另有学者聚焦于具体的推荐系统,刘先红等对四个学术社交网络的推荐系统进行了对比分析,提出我国学术社交网络存在推荐项目较少、推荐策略单一、冷启动效果差、用户偏好学习能力弱等问题[20]


综合以上研究可以得出,目前关于用户的研究大多围绕知识交流动机和行为展开,部分关于用户特征的研究也只集中在学科、机构等单一方面,对于用户的多项属性未进行细致的特征分类,缺乏对用户特征的整体把握;关于知识交流效果的研究大多集中在平台功能的影响方面,少有研究分析不同特征用户间知识交流效果的差异,然而用户作为学术社交网络中最重要的元素,其各项特征可能会对知识交流效果产生一定影响,但是用户的身份、行为等特征与知识交流效果到底有怎样的关系?它们又是如何影响知识交流效果的?应该如何从用户特征出发提升知识交流效果?如果能寻找到这些问题的答案,无疑有助于学术社交网络引导用户行为、提升用户参与度。为此,本文以ResearchGate平台上的南京大学用户为例,将用户特征划分为身份特征、影响力特征、互动特征等不同维度,探讨了各类用户特征与知识交流效果的潜在关系,明确了其对知识交流效果的影响强弱,并为提升学术社交网络知识交流效果提供了建议。


3  数据获取与处理

3.1 数据获取

ResearchGate平台是全球最成功的学术社交网络之一[21],目前使用该平台进行知识交流的科研人员已超过1,500万,平台用户通过完善个人信息、发布研究成果、与其他用户互动等进行知识获取和传播,用户的高注册量和持续使用率使得该平台上获取的用户数据更具代表性和可用性。另外,南京大学作为一所综合性科研院校,在该平台上具有大量注册用户,且其研究成果、影响力等均处于前列。因此本文选用ResearchGate平台上的南京大学用户为研究对象(https://www.researchgate.net/institution/Nanjing_University/members),分析用户特征对知识交流效果的影响。RG指数是ResearchGate平台依据用户的研究影响力及互动行为综合得出的用户评价指标,主要构成为:Publications表示用户发布的出版物情况,Questions和Answers表示用户的提问和回答情况,Followers表示用户获得的关注者情况,RG得分算法不仅依赖于用户创建内容的数量,还与内容质量即同行对内容的评价密切相关[22],可较全面地衡量用户在平台的知识学习和知识贡献,因此本文使用RG指数来表示用户整体知识交流效果。


本文编写Python爬虫获取ResearchGate平台南京大学用户数据,截至2019年9月14日,共得到8,943条原始数据,剔除无法评估其知识交流效果(RG指数为0)的僵尸用户,共得到3,147条可分析数据,数据项及描述如表1右两列所示。


3.2 数据处理

为将用户属性进行准确的特征归类,减少人为划分的主观随意性,方便后续相关性分析,本文对表1中定量数据项进行主成分分析,首先进行KMO和Bartlett检验,得到KMO值为0.663,大于0.6的可接受水平,且显著性小于0.001,表明数据项适用于主成分分析,提取特征值大于1的因素作为主因子,共得到4个主成份,累积贡献率达80.117%,表明主成份保留了原始数据的大部分信息,具有较强的解释性。为使每一主成份含义更加明确清晰,采用最大方差法对因子载荷矩阵实施正交旋转,使每个主成份上具有最高载荷的变量数最小,旋转因子载荷矩阵如表2所示,可以发现主成份1中旋转因子载荷较大的为总体研究兴趣指数、被引量、被推荐量、被阅读量、发布成果数和h指数,主要反映用户在学术社交网络中的影响力,可解释为影响力特征;主成份2中旋转因子载荷较大的为提问数和回答数,反映用户在学术社交网络中的互动行为,可解释为互动特征;主成份3中旋转因子载荷较大的为关注数和被关注数,反映用户在学术社交网络中的动态持续追踪状况,可解释为追踪特征;主成份4中发布项目数具有较大载荷,反映了用户在平台上发布项目的状况,可解释为项目特征。综合用户身份特征可得表1左侧列所示的用户特征分类,本研究基于此分析不同用户特征对知识交流效果的影响。


4  数据分析与结果讨论

4.1 用户基本情况分析

本文以ResearchGate平台上南京大学为例分析用户特征对知识交流效果的影响,在8,943个注册用户中,仅3,147人RG指数不为空,超过60%的用户处于低活跃状态,表3为获得RG指数评分的用户各数据项统计结果,由表可知,用户人均发布成果29.367项,人均发布项目不足1,可见平台上项目合作与共享并不活跃;在影响力特征方面,尽管人均被阅读量、被引量、被推荐量、研究兴趣指数整体呈现较高水平,但部分数据项显示出较大的标准差和偏度、峰度,表明数据分布严重不均衡,存在明显的长尾现象;在互动特征方面,人均回答和提问数均不足0.5,二者偏度和峰度值较大,表明学者间互动不频繁,只有少数人参与互动;在追踪特征方面,用户人均关注35人,被40人关注,表明用户持续追踪意愿强烈,平台具有良好的社交氛围。从知识交流效果来看,南京大学人均RG指数16.427,最大值为52.39,分布较为对称,为评估整体知识交流效果,绘制图1所示的RG指数分布图,由图可知,超过半数的用户RG指数在0-20,并且随着RG指数的增大,相应区间的人数呈递减趋势,知识交流效果佳的用户占比较少,知识交流效果具有较大提升空间。


4.2 相关性分析

4.2.1 身份特征分析

本次研究共采集了3,147条用户数据,从用户学历构成上来说,在具有学历信息的用户中,博士及博士后(含在读)占82.92%,硕士(含在读)占7.23%,由于学历信息存在大量缺失且现有数据未及时更新,本研究不考虑其对知识交流效果的影响。为研究用户学科背景对知识交流效果的影响,综合用户填写的学科及院系信息和南京大学学科设置,将学科背景划分为人文社科、经济管理、数理科学、电子信息、环化地农、生物医药、综合交叉共七大类,其中人文社科类包括文学、历史学、语言学、社会科学、心理学等,经济管理类包括经济学、管理学等,数理科学类包括数学、物理学、天文与空间科学等计算学科,电子信息类包括电子工程、计算机科学、信息科学等,环化地农类包括环境科学、化学、地理科学、农业学与生态学等,生物医药类包括生命科学、医学、药学等,综合交叉类包括材料科学、建筑工程、大气科学等跨类学科,各大类人数分布情况及平均RG指数如表4所示。


由表4可知,环化地农类研究人员占比最多,但综合交叉类具有更高平均RG指数,人文社科和经济管理类占比较少且平均RG指数较低。为进一步探究用户学科背景对知识交流效果的影响,对二者进行了独立样本的非参数检验,假设检验显著性水平小于0.01,表明各学科的RG指数分布具有显著差异,由图2箱线图可知,综合交叉类学科RG指数具有较高的中位数,生物医药类次之,人文社科和经济管理类处于较低水平,从最大值来看,数理科学和环化地农类RG指数最大值达50以上。


4.2.2 主因子分析

为明确不同特征对知识交流效果的影响,采用Pearson相关系数探究各主因子与RG指数的相关性,结果如表5所示。P<0.1表明两指标不相关,P<0.3为弱相关,0.3<P<0.5为中度相关,0.5<P<0.8为强相关[23],由表可知,影响力特征与RG指数高度正相关,互动特征与RG指数无关,追踪特征和项目特征与RG指数均呈弱正相关性。另外,考虑到被关注数在主因子1和3上均具有较高载荷,因此单独探究关注数和被关注数与RG指数的相关性,结果如表6所示,关注数与RG指数呈弱正相关,被关注数与RG指数强正相关。


4.3 回归分析

为进一步探究与RG指数相关的用户特征对知识交流效果的综合影响,利用回归分析探讨各数据项对RG指数的影响,在进行共线性诊断后,发现总体研究兴趣指数和被引量之间存在共线性问题,由于总体研究兴趣指数是依据用户项目或资料被其他用户阅读、引用、推荐等计算得出的综合指标[24],故将该变量剔除,回归分析结果如表7所示。调整后的R方为0.823,模型具有较高拟合度,Durbin-Watson值为1.973,表明通过残差独立性检验,且显著性小于0.01,表明变量间存在显著线性关系;由表7可知,除去被阅读量(Reads)和项目数(Projects)显著性大于0.05,其他数据项均对RG指数产生影响,其中h指数(h-index)影响最强。


4.4 结果讨论

4.4.1 用户身份特征对知识交流效果的影响

由身份特征分析可知,不同学科背景的南京大学用户知识交流效果具有显著差异,环化地农类人数占比最多,具有强烈知识交流需求,综合交叉类平均RG指数最高,具有较好的知识交流效果,人文社科和经济管理类人数占比较少且平均RG指数较低,具有更大的提升空间。


前人在学科背景的研究中,大多对不同院系用户数、项目数、被阅读数等指标进行了描述性统计[25,26],或分析了理学、工学、医学和其他四类不同学科间注册人数的差异[27],严炜炜聚焦于图情领域比较了中美ischool成员学术社区利用行为的差异[28]。本文不仅对学术社交网络上用户的学科背景进行了更细致的划分,而且将学科背景与用户的知识交流效果联系起来,分析了不同学科间知识交流效果的差异,结合前人研究发现其他学术机构不同学科背景的学者在注册量、话题选择、内容发布等方面也呈现出学科间差异,屈宝强指出评价知识交流效果可以从知识的获取与互动、问题的解决、心理需求的满足、学术交流的聚类等方面入手[29],因此我们有理由相信不同学科背景的ResearchGate用户知识交流效果存在显著差异。


4.4.2 用户影响力特征对知识交流效果的影响

由主因子分析可知,南京大学用户影响力特征与RG指数高度正相关(Person相关性为0.626,sig.=0.000),由进一步回归分析可知,h指数作为学术影响力的重要衡量指标与知识交流效果强正相关(t=75.648,sig.=0.000),被阅读量具有较大随机性且通过单纯的阅读行为难以全面考察用户知识交流效果,因此被阅读量与知识交流效果无关(t=1.144,sig.=0.253),被引量与知识交流效果负相关(t=-38.559,sig.=0.000),由于RG指数评分不仅关注引用数量更看重引用者的学术影响力[30],因此被引量负相关可能是由于引用者RG指数较低造成的。


前人研究表明高学术影响力的学者在网络结点中占据更重要位置[31];刘雨农等以知乎网为例分析了社会化问答平台意见领袖特征及其在话题网络中的关键角色[32];在学术社交网络研究背景下,严炜炜指出在学术社交网络中学术影响力和层级领先的机构表现出更大的学术影响[33],张耀坤得出高影响力学者的信息共享行为与影响力之间具有较强相关性[34];以上研究均支持了高影响力用户在学术传播过程中扮演的关键角色,本文用h指数、被引量等指标进一步深入细化了影响力特征,探究了各指标与RG指数的相关关系,知识交流的本质即学术传播,因此前人提出的高影响力学者对于学术传播的促进作用结合本文所得的正相关关系,即可在一定程度上验证用户影响力特征对知识交流效果具有正向影响作用。


4.4.3 用户互动特征对知识交流效果的影响

由主因子分析可知,互动特征与RG指数无关,然而在RG指数构成中,提问数和回答数均占有一定比重,为探明原因,汇总提问数和回答数均为0的用户,总计达2,960人,占比约94%,由此可知南京大学用户的互动特征与RG指数无关可能是由于提问与回答的不积极不活跃造成的。


前人研究分析了社会化问答社区中用户提问和回答对知识贡献行为的影响[35],张鹏翼等以知乎网为例分析了社会资本视角下的用户社交问答行为[36],在学术社交网络的使用行为研究中,学者大多将用户行为作为因变量,关注社会资本[37]、感知信任[38]等对行为的影响,而本文将知识交流效果作为因变量,关注了学术社交网络背景下用户问答行为对知识交流效果的影响,结果表明用户互动特征对知识交流效果无影响,这似乎与社会化问答社区背景下得出的结论不一致,一方面可能是由于ResearchGate平台不单单可通过问答获得信息也可经项目、论文浏览、私信等方式进行知识摄取,另一方面也可能是由于平台上用户提问与回答不活跃,平台可通过增强用户互动的活跃度提升知识交流效果。


4.4.4 用户追踪特征对知识交流效果的影响

由主因子分析可知,用户追踪特征与RG指数呈弱正相关性,其中关注数与RG指数弱正相关(Person相关性为0.183,sig.=0.000),被关注数与RG指数强正相关(Person相关性为0.546,sig.=0.000)。


前人关于用户间关注与被关注的研究多集中于社交媒体的粉丝现象和粉丝文化,重点探讨了意见领袖的内容推广作用及粉丝的传播作用[39-42],在学术社交网络背景下,有学者利用用户间追踪关系构建了研究人员合作网络[43,44],本文通过相关性分析探究了用户关注数、被关注数与知识交流效果的相关关系,由于学术社交网络与大众社交媒体同样具有社交属性和传播作用,因此结合上述社交媒体平台意见领袖和粉丝文化的研究,我们可以认为学术社交网络上高被关注的学者对于其粉丝的学术成果共享和交流互动等行为也可能具有一定的影响作用,即南京大学用户关注数、被关注数一定程度上影响其知识交流效果。


4.4.5 用户项目特征对知识交流效果的影响

由主因子分析可知,用户项目特征与RG指数呈弱正相关关系(Person相关性为0.158,sig.=0.000)。前人研究表明,部分学者有较强的意愿希望通过在学术社交网络上共享个人主持或参与的项目来扩展自己的学术影响力[45],但不同学科背景用户分享项目的意愿、项目受其他用户的关注程度和所发布项目的合作情况均存在差异[46],结合本研究中项目特征与RG指数的相关关系,可以在一定程度上表明用户项目特征与学术影响力、学科背景等共同影响用户在平台上的知识交流效果。


5  结论与启示

本文以ResearchGate平台上南京大学用户数据为例,利用描述统计、相关性分析和回归分析探究了不同用户特征对知识交流效果的影响,研究得到以下结论:(1)ResearchGate平台上南京大学用户的活跃度、学术影响力和知识交流效果等存在严重的不均衡现象;(2)南京大学不同学科背景的用户知识交流效果具有显著差异;(3)南京大学用户的影响力特征对其知识交流效果具有最显著的影响作用;(4)南京大学用户缺乏在平台上的问答互动,提问和回答的积极性不足;(5)关注对学术社交网络贡献的质量而非数量更有助于增强知识交流效果。


基于上述结论,本文提出以下几条学术社交网络知识交流效果提升策略:


(1)充分挖掘高影响力学者的带动作用,刺激低活跃用户参与。有研究表明社会资本、感知有用性显著影响知识共享满意度,从而影响持续知识共享意愿[47],学术社交网络中的科研互动是社会资本积累的重要过程,平台上的资源学习和交流是增强感知有用性的重要途径,高影响力学者对其他用户的资本积累和感知有用性增强具有明显的带动作用,因此可定期邀请高影响力学者进行学术讲座或专题研讨会等提升社区活跃度;另外,考虑到我国研究人员在学术社交网络中活跃度偏低的原因是由于未形成利用在线平台进行科研互动的习惯[48],因此平台可采用签到打卡及金币、积分、升级等奖励措施增加用户粘性。


(2)推动跨学科交流与合作。不同学科背景用户的知识交流效果显著不同,综合交叉类知识交流更有效,这与他们跨类的学科性质有关,故平台可采用跨学科的知识推荐策略提高不同学科学者的接触概率;另外,前人研究表明将游戏化应用于公众科学项目能够给参与者带来乐趣和归属感,是吸引个体参与的有效方法[49],因此可设计游戏化的科学任务促进不同学科背景学者的组队合作。


(3)注重学术社交网络功能改进,营造良好的社区互动氛围。学者间的有效互动对提升知识交流效果有重要影响,然而ResearchGate平台上南京大学用户提问和回答频率较低,阻碍了知识学习和知识贡献。为解决这一问题,平台可通过改进功能和营造问答环境促进用户参与互动,如突出显示问答标志,简化操作步骤,提升界面美观度等进行问答功能改进,同时可通过构建专题问答版块、塑造社区文化特色、规范不文明言论等营造积极健康的互动氛围。


(4)学者自身应注重发布内容的质量,提高个人学术影响力水平。“科研主体学术影响的深度与广度主要取决于其研究成果被他人重视、认可和引用的情况[50]”,因此在个人层面,用户可上传被引频次较高的学术成果,发布高质量的项目和回答,积极提升自身学术影响力水平,从而获得更高的RG指数。


6  研究展望

本文以ResearchGate平台上的南京大学用户为例,分析了不同用户特征对知识交流效果的影响并提出了相应的知识交流效果提升策略,然而本文还存在一些局限:①研究截取某一时刻的用户特征数据项进行分析,从五个维度13个数据项讨论了不同用户特征对知识交流效果的影响,保证了研究广度和全面性,但是从深度来看,用户特征对知识交流效果的影响随着时间变化可能也呈现出一定规律性,未来可获取随时间变化的用户数据,纵向深入研究;②用户身份特征还包含学历、职业等信息,由于ResearchGate平台大量用户未填写学历和职业信息,且无从得知填写后是否更新,因此本文未对其进行探讨,考虑到越来越多的学者已经意识到利用虚拟社区进行学术社交的价值,且平台也在不断更新完善,因此缺失信息会逐渐得到补充,未来研究可获取更丰富的用户身份特征数据进行分析;③本文以ResearchGate平台上的南京大学用户为例展开研究,所得结论难免受南京大学用户独有特性的影响,未来研究可采集不同类型、不同特点的学术机构用户数据,进一步扩大结论的适用范围。


参考文献


专家评审意见

1.建议扩充引言部分。除了研究背景外,还应说明已有研究的大致情况和不足,以及本文的研究问题和意义。


2.有关学术社交网站的研究很多,但本文的研究回顾部分对已有的研究发现所做的综述还不够充分。建议扩充一下,同时按逻辑分小节。


3.本文对用户的身份特征、影响力特征等属性和知识交流的行为记录之间的关系进行了分析,但是并不能判断二者之间是“影响”关系。影响也有可能是反向的,比如可能是知识交流增加了作者影响力。作者的分析只能说明相关,并不能说明因果。因此建议作者对主要的结果和结论加以修改。


4.作者在结果和结论的讨论中,有点过度概括化,南京大学的学者是否有其自身独有的特点,导致本文的结论未必能够具有普适性,文章对此没有任何的阐述和说明。建议说明其局限,同时结论不要过度概括化。


*本文原载于《图书情报知识》2020年第4期97-105

版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。

制版编辑 | 姚志臻

END





当期荐读 2020年第4期 | 社会资本视角下社会化策展行为实证研究——以花瓣网为例(内含视频摘要)

当期荐读 2020年第4期 | 自助旅行者旅行中的信息行为研究(内含视频摘要和评审意见)

当期荐读 2020年第4期 | 基于残联网站的残障人士信息需求(内含视频摘要和评审意见)

当期荐读 2020年第4期 | 面向任务终止的认知停止规则应用及影响因素(内含视频摘要)

当期荐读 2020年第4期 | 基于认知分类的大学生网络健康信息搜索的学习效果研究(内含视频摘要)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存