查看原文
其他

当期荐读 2021年第1期 | 学术代表作时间周期、首发载体及题材类型特征研究 ——以图灵奖为例(内含视频摘要)

图书情报知识 图书情报知识 2022-04-25

     ISSN 1003-2797

     CN 42-1085/G2

     双月刊

     同行评审期刊



苏鹏

(北京大学信息管理系,北京,100871)

张琳

(武汉大学信息资源研究中心,武汉,430072;

武汉大学信息管理学院,武汉,430072)


目的/意义

代表作在学术评价中的全面推行是科研管理工作的关注热点。其规律性研究有助于推进代表作评价的理论构建,为国家科研评价改革提供决策参考。

研究设计/方法

选取图灵奖得主代表作为研究对象,基于文献计量和非参数检验方法,分析图灵奖代表作时间周期、首发载体及题材类型等的特征规律。

结论/发现

①随时间推移,代表作从发布到被图灵奖认可所需时间存在逐渐上升的整体趋势。②不同首发载体的代表作完成年龄和被认可所需时间可能会存在一定差异,在会议类和发明类代表作中尤为显著。③部分代表作的题材类型对代表作的完成年龄和被认可所需时间具有相对显著影响。

创新/价值

以图灵奖为切入点,分析获奖者学术代表作特征,为相关学术评价制度的设立提供参考和借鉴。


0

引言

2020年初,科技部印发《关于破除科技评价中“唯论文”不良导向的若干措施(试行)》[1],教育部印发《关于规范高等学校SCI论文相关指标使用树立正确评价导向的若干意见》[2],旨在破除“唯论文”“SCI至上”等评价导向,引导学术评价从“重视数量”走向“重视质量”,在国内外引起广泛关注[1]。代表作评价近年来已成为国家科研评价改革关注的热点问题之一。然而,相对于代表作制度建设的热度,代表作产生、发展和受到认可的规律性研究较少。姜春林基于科学计量学视角,提出代表作评价的量化指标[3,4]。张积玉基于某高校经验,尝试将代表作和量化考核相结合[5]。宋敏探究代表作“三高”规律,认为代表作具有期刊影响力高、被引频次高、同行专家评价高的特点[6]。在国外,鲜有以“Representative Work”或“Masterpiece”作为主题的研究,现有研究通常将之作为数据来源,分析社会关系或者学者成长规律,比如Kanigel分析美国医学界重大成果产出过程,研究科学家成长对高水平学术指导的依赖[7]。Alexiou探究生命科学领域研究人员产出代表作的最佳年龄[8]。科睿唯安自2002年起,每年筛选高被引论文,发布高被引科学家名单,进而通过其成果评选引文桂冠奖[9]


制度预设,规律先行,针对代表作的实证研究能够揭示代表作相关的客观规律,是代表作制度确立的基础。图灵奖在计算机学界最负盛名,其获奖得主在计算机领域举足轻重,其代表作在计算机学界具有相当的代表性。本文以图灵奖为例,探究代表作时间周期、首发载体和题材类型等客观规律,具体如下:(1)分析图灵奖代表作完成年和获奖年的特征,判断图灵奖的时间周期的整体趋势。(2)分析图灵奖代表作的首发载体,探究不同载体的完成年龄和获奖所需时间,并具体分析期刊类代表作的期刊所属机构和期刊级别。(3)分析图灵奖代表作的题材类型,探究不同题材的完成年龄和获奖所需时间。在发现特征规律的基础上,以期为代表作评审制度提供参考借鉴。



1

相关概念

1.1 代表作

当前,代表作的定义并不清晰。《关于深化项目评审、人才评价、机构评估改革的意见》在“推行代表作评价制度”中强调“标志性成果的质量、贡献、影响”,但未明确何为“标志性成果”[1]。《现代汉语词典》解释为“最能体现作者思想水平和艺术风格的作品”。科研工作者中,叶继元认为代表作是“少数几项能够代表作者最高水平的成果”[10],杜学亮认为代表作是“对前人成果的实质性推进”[11],刘益东认为代表作是一种“突破性成果”,提倡用简短的语言概括代表作的核心贡献[12]。总体来看,代表作的定义与其应用场景存在密切关联,本文的“代表作”属于奖项类评审,主要依据官方获奖理由,在其提及的多种形式的作品中遴选代表作。


1.2 首发载体

在本文章节3.2部分,针对代表作首次发布的方式或途径展开研究(以下简称“首发载体”)。在奖项或职称评选时,评选人员的定义相对宽泛,如图灵奖未明确规定代表作包括哪些类型,图灵奖得主的代表作发表载体多样,包括但不限于期刊论文、个人著作、会议论文及报告、软件或其它发明等[13]。科技部建议发表的三类高质量著作中,也包括了期刊论文和会议报告等形式[14]。代表作的载体类型多样,基于此,本文不仅涉及期刊载体,更将个人著作、会议论文等纳入研究范围内。其中“首发”指的是该代表作首次公开发布的时间,载体主要包括期刊、发明、专著和会议等多种形式,其中期刊主要指首发于学术期刊的论文;发明包括以多种形式首次公开的发明创造或工程项目,包括产品上架、公开发布会、互联网宣传等形式的可以作为公共或商业产品的成果或方案,以首次面向大众或首次面向学术界公开的时间为准;专著指正式出版的书籍,出版时间以第一版为准;会议包括在学术会议及非学术会议首次公开的报告和论文。


1.3 题材类型

在本文章节3.3部分,针对代表作研究内容的类型展开研究(以下简称“题材类型”)。题材类型主要经过两次划分:第一次针对研究主题的主观判断分类。基于直观的研究内容特征、范围和应用对象等,共分为5类:将编程语言设计归入语言类,系统研发归入系统类,各类算法设计的代表作归入算法类,人工智能研究归入智能类,网络建设和推广归入网络类。第二次是基于数据实际情况的进一步划分。在第一次分类的基础上,在研究过程中对实际数据观测,发现算法类代表作的数据分布中,存在着两个相对独立分布的区间,通过探究,发现其中一个独立区间内的代表作,都是复杂度计算而提出的特殊算法,另一个独立区间内是除复杂度计算外的其他算法,因此将这两部分数据区分开来,单独分析。系统类代表作也基于同样的理由,因为数据加工、存储和分析的系统和其他普通系统的数据差异很大,因此拆分开来分析①。如图1所示。

① 智能类和算法类(除复杂度外)在神经网络算法等个别上存在交叉,但重叠数量不多,本文曾以不同分类方式分别计算,两种分类方式不影响结果,演示时将这部分算法归类为智能类。



2

引言

2.1 数据来源

图灵奖由美国计算机协会(Association for Computing Machinery,简称ACM)设立,每年一届,每届1—3人,1966年首次颁奖,截至到2018年,共70位科学家获得这一殊荣。图灵奖评奖程序严格,评选要求极高,象征计算机科学领域的最高水平,其代表作具有典型意义[15]。本文数据采集的截止时间为2020年2月20日,主要来源分为两部分:第一部分为ACM在图灵奖官网公示的图灵奖得主履历和学术成就等相关信息,包括获奖理由、生卒年和主要作品等。大多数信息可直接在ACM公开的Digital Library数据库获取,依据官方发布的获奖理由,明确其依托哪项成就获奖,结合相关科学报道及采访,从公示作品中直接筛选代表作。第二部分为未被DigitalLibrary数据库收录的其他形式作品,则通过广泛采集获奖者所在单位官网、媒体报道、新闻转载以及其他可用信息,结合获奖理由作为筛选依据,通过Web of Science、Engineering Village、国家工程技术图书馆等平台人工查找和核实信息,并补充期刊类代表作的出版商等信息。结合两部分数据源最终确定代表作的首发载体和具体题材类型[16]。本文的研究重点为“首发代表作”,在遴选代表作时,主要关注获奖理由涉及的重要观点、思想或发现的首次公开,对其补充完善的后续作品不计入其中。以图灵奖1968年得主HammingRW为例,从获奖理由可以看出,获奖依据为发明了“汉明码”。结合其生平履历和相关媒体报道,并逐篇阅读其成果,发现他在《Error detecting and error correcting codes》一文中首次提出了汉明码,故而将这篇文章作为他“汉明码”成果的代表作。


此外,代表作确定过程中,存在一人多件和多人一件的特殊情况的代表作情形。首先,一人多件代表作是因为存在一个图灵奖有多个获奖理由的情况下,将尝试追溯不同获奖理由所对应的不同成果。因为获奖理由存在多个贡献的表述,凭借多件代表作获奖的图灵奖得主,其代表作合作者存在少量非图灵奖得主的情况,主要为得主的学生、下属等身份,不影响代表作本身的遴选。其次,多人一件代表作往往是因为同一件代表作,对应了多位图灵奖得主,几位合作者在同一年因为相同或者相近的理由分享图灵奖,这件代表作被本文同时计算为几位合作者的代表作。在量化统计过程中,同一代表作对于不同合作者来说,其代表作对应的发表年龄和获奖年龄是不一样的,在发表年龄和获奖年龄等方面的统计中,会出现分歧,因此对于合作同一代表作的图灵奖获得者,需要重复计数。本文除章节3.2.4外,对多位获奖者合著代表作重复计数,即同一年的图灵奖得主的合著代表作,分别对应不同的获奖者计算其代表作的发表年龄和获奖年龄,共得到70位图灵奖得主的115份代表作样本。在3.2.4中,具体分析期刊类代表作与期刊所属机构的关系,二者之间是一一对应的关系,在3.2.4中没有对合著代表作进行重复计数,共得到43位图灵奖得主的37篇期刊类型的代表作。


2.2 非参数检验

本文采用非参数检验法探讨图灵奖代表作首发载体和具体题材对代表作完成年龄和被认可时间的影响。首先以不同方式对图灵奖得主及其代表作分组,在分组基础上进行非参数检验,分别判断每组相对于其余组的差异是否显著。当非参数检验结果认为该要素存在显著性影响时,其中位数等描述才具有统计学意义。Kruskal-Wallis非参数检验在检验时不涉及总体分布的具体参数,对总体方差需求不高,可对有序数据总体中位数是否相等的假设做出检验,进而评价两组及两组以上数据是否来源于同一样本总体,适用于本文。当P-value小于0.05时,则判断两组代表作数据来源于不同样本总体,认为二者具有显著性差异,意味着该组别的变量要素明显影响了代表作完成年龄或被认可时间。



3

研究结果

3.1 完成年和获奖年

基于2.1数据获取、匹配和校对,共得到70位图灵奖得主的115份代表作样本。将历年代表作的产出数量绘制柱状图,图灵奖代表作的产出主要集中在1955—1990年(图2)。进一步比较获奖时间和相应代表作完成时间,代表作从完成到获奖,平均需要17.99年,所需时间中位数为17年,平均数略大于中位数。在图灵奖早期,获奖所需时间相对向较低的区间集中(图3)。获奖所需时间与年份存在一定的正相关性,随时间推移,代表作与获奖时间的相隔周期趋于增长,取95%的置信区间,Coefficients为0.42,具有中等强度的正相关关系;R-Square值为0.42,P-value值为1.33E-14<0.01,拟合结果具有较高显著性,标准误差为0.05,数据波动较小,具有较好的拟合度。得到线性关系为:

Y1=0.42Y2+ε0

其中Y1为代表作发表后获奖所需时间,Y2为该代表作获得图灵奖的年份。即每当时间推移1年,获奖所需平均时间就增加0.42年。这意味着,获奖所需要时间存在逐渐上升的趋势。拟合结果如表1所示。

进一步细分时间区间,可清晰观察到随着时间推移,代表作获奖所需年限的“长尾”不断向右延伸,使得代表作从发布到获奖的年限平均值不断上升(如图4)。


3.2 首发载体分析

3.2.1 首发载体的描述性统计

70位图灵奖得主的代表作首发载体中,以期刊为载体的代表作最多,共43个,占比37.39%;其次为发明,共40个,占比34.78%;专著和会议基本相当,都为16个,分别占比13.91%。具体分布如图5所示。

从首发时间来看,不同类型代表作发布年份集中于20世纪60—80年代之间,2000年后发布的代表作数量极少(图6)。从获奖时间来看,以“期刊”为载体的代表作在2000年前后存在一个较大的空档期,以“发明”为载体的代表作数量少于期刊类代表作,总体平稳,无较大空档期(图7)。


3.2.2 完成年龄分析

假设不同类型的首发载体对获奖人代表作的完成年龄没有影响。取α=0.05,具体结果如表2所示,其中“组间”是对4类首发载体整体的假设检验,从组间来看,首发载体与代表作完成年龄有较大相关。具体来看,发明类代表作对完成年龄具有显著性影响。在研究样本中,发明类的获奖人平均完成年龄为39.25岁,大于各类型代表作的平均年龄(37.39岁),一般而言,发明类代表作需要研究人员具有更资深的经验。会议类代表作对完成年龄具有显著性影响。会议类的平均完成年龄为33.75岁(中位数仅31.5岁),小于平均年龄。其余2类代表作(期刊和专著)对获奖人完成年龄不具有显著性影响。


3.2.3 获奖所需时间分析

假设不同类型的首发载体对代表作被认可所需时间没有影响。取α=0.05,具体结果如表3所示,其中“组间”是对4类首发载体整体的假设检验,从组间来看,首发载体与代表作被认可时间的相关性不大,载体对获得认可时间不具有显著性影响,从统计结果来看,不同类别代表作被认可所需时间存在一定差异,期刊和专著类被认可时间相对较短,会议类相对较长。


3.2.4 期刊类代表作分析

首发载体中,期刊论文数量最多,共有37篇(其中包括1篇为三位同年度获奖者合著论文,4篇为两位同年度获奖者合著论文,重复计数后共43件)。在期刊论文的评价中,科睿唯安公司的期刊统计报告(Journal Citation Reports,简称JCR)和索引数据库(Science Citation Index,简称SCI)被广为使用。按照2019年JCR分区进行统计,不重复计数的37篇期刊论文中,20篇发表在Q1区,Q2和Q4区各5篇,还有5篇首发的期刊从未被SCI所收录(图8)。如表4所示,以期刊论文发表年和当前年分别为依据,其中有24篇论文所属期刊在发表年和当前年均被SCI核心合集收录,1篇论文发表的期刊先被收录而后被剔除,8篇论文发表的期刊在论文发表多年后才被收录。4篇论文发表的期刊从未被收录。在图灵奖所代表的科学领域中,期刊论文发表当年被SCI所收录的代表作(25篇,65.71%)占据较高比例,但未被SCI收录的数量(12篇,34.29%)同样不可小觑。高影响期刊的论文具有高价值的可能性较高,但图灵奖的期刊论文代表作分析表明,只重视高影响期刊可能会埋没大量的潜在高质量论文。

从期刊所属机构来看,美国机构以28篇的数量独占鳌头,英、荷、德分别依靠自然、爱思唯尔、施普林格等知名出版商获得部分图灵奖代表作首发权。美国机构中,ACM发行的期刊共刊登19篇图灵奖得主的代表作,以Communication of the ACM最为突出(16篇),其次为工业和应用数学学会(Society for Industrialand Applied Mathematics)下属期刊,共刊登3篇(图9)。

将37篇期刊论文中的共同获奖作者重复计数,共43件代表作,全部源于英文期刊。获奖作者国籍和期刊出版商所属国家分布如表5所示,其中有9件代表作的获奖作者母语不是英语,但首次发表的语种为英语,这可能是因为英文文献更易推广或者图灵奖的评选更倾向英文论文。作者国籍以英美为主,发表期刊也多为英美出版,这可能是计算机科学领域英美的科研工作在历史上长期领先的结果,也可能是图灵奖评审对英美科研人员具有一定倾向性。总体来说,在图灵奖为代表的计算机科学领域,欧美科研人员和期刊出版商占据绝对主导地位,中国需要积极参与和推动科研国际化,同时提升本土的学术期刊水平,在本土化和国际化之间寻求合适的动态平衡。


3.3 题材类型分析

3.3.1 题材类型的描述性统计

对70位图灵奖得主代表作的题材类型进行分析。题材类型中,算法类(除复杂度外)数量最多,为34件,占总量的29.57%;语言类和智能类其次,分别有23件,占据20.00%;系统类(除数据方面外)再次,有17件,占据14.78%。算法类(复杂度方面)、网络类和系统类(数据方面)较少,分别有7件、6件和5件,占据6.09%、5.22%和4.35%。具体情况如表6所示。

根据题材类型绘制时序图。从完成年份来看,语言类代表作主要完成于1975年前,1975年后除少数改良外,几乎没有语言类代表作被完成。系统类(除数据方面外)和算法类(除复杂度外)分布比较均匀,是代表作的主要类型。智能类主要有1960年前后和1985年前后两次代表作爆发期,1960年前后主要是人工智能概念及相关设想的提出,1985年是相关算法和证明的完善(图10)。从获奖年份来看,语言类和算法类(除复杂度外)在1990年之前分布较为集中,系统类(除数据方面外)、算法类(复杂度方面)和网络类在1990年之后分布较为集中(图11)。


3.3.2 完成年龄分析

取置信度α=0.05,假设每一种首发载体对代表作的完成年龄没有影响。从组间来看,题材类型与代表作完成年龄的相关性不大。具体来看,系统类(数据方面)对完成年龄具有显著性影响,平均完成年龄为44岁以上,远大于平均年龄,说明系统类(数据方面)需要研究人员具有更资深的经验。复杂度算法类对完成年龄具有显著性影响,平均完成年龄为31—32岁,远小于完成代表作的平均年龄,说明复杂度计算类的算法对经验要求不高。其余5类代表作的完成年龄不具有显著性影响。具体如表7所示。


3.3.3 被认可时间分析

取α=0.05,假设每一种首发载体对代表作被图灵奖认可所需时间没有影响,从组间来看,首发载体与代表作被认可时间的相关性不大。具体来看,算法类(除复杂度外)、智能类、系统类(数据方面)、算法类(复杂度方面)和网络类对被认可时间具有显著性影响。算法类(除复杂度外)的被认可时间为11年左右,远小于代表作被认可的平均时间。智能类代表作的被认可时间为19年左右,略大于被认可的平均时间。系统类(数据方面)的被认可时间为7年左右,远小于代表作被认可的平均时间。算法类(复杂度方面)的被认可时间为28—29年,远大于代表作被认可的平均时间。网络类的被认可时间为25—27年左右,远大于代表作被认可的平均时间。可以认为,算法类(除复杂度外)和系统类(数据方面)的研究能够更快地得到图灵奖认可,复杂度计算和网络类需要更长时间才能得到图灵奖认可。此外,智能类想要得到图灵奖认可也需要较长时间。其余2类代表作的被认可时间不具有显著性影响。具体情况如表8所示。


3.3.4 四象限图

不同方式对代表作进行分组后,其中不具有显著性影响的分组视为整体的一部分,即这类分组的中位数视为与整体一致。具有显著性影响的分组需要进一步分析。四象限图通过横纵两条坐标轴将平面分为4个区域,从完成年龄和被认可时间两个维度将数据分割。横轴为代表作完成者的年龄,并选取完成年龄的中位数36岁作为横轴中心原点,右半边表示代表作往往在较高年龄段完成,代表作评价时放宽年龄要求。纵轴为代表作从完成到得奖所需时间,并选取被认可所需时间的中位数18年作为中心原点,上半部分表示代表作完成后需较久才能获得认可,奖项评选所需时间更长,可放宽完成年限要求。综上,四象限图的中心原点为(18,36)。


与首发载体相比,题材类型对完成年龄和完成后被认可时间的相关性较强。网络类位于在第二象限,属于容易在较年轻的时候创作,但是被认可所需时间较长的类型。算法类(除复杂度外)位于纵轴负半轴,对完成年龄无显著性影响,但容易被认可。系统类(数据方面)位于在第四象限,需要更长时间知识和阅历积累才能完成,但比较容易被认可的类型,算法类(复杂度方面)位于纵轴正半轴,对完成年龄无显著性影响,但难被认可。其余语言、系统和智能类与完成年龄和被认可所需时间的相关性不强。具体如图12所示。



4

总结与建议

4.1 总结

本文以图灵奖为例,基于代表作评价视角,分析其首发载体、题材类型和时间周期等规律特征,结论如下:


(1)随时间推移,代表作从发布到被图灵奖认可所需时间存在逐渐上升的整体趋势。在奖项类代表作评价制度中,建议遵循客观规律,不宜对发布时间设置教条式的严格限制。当的确需要设置相关年限时,既要保证在较短年限内发掘大多数高价值代表作,也要基于上升的均值给少数位于“长尾末端”的、需要长时间检验才能得到认可的代表作以机会。


(2)从首发载体来看,会议和期刊类的代表作对应获奖人的完成年龄略小,发明类的代表作完成年龄更大,首发载体类型与完成年龄有一定的相关性。在代表作评价制度中,在考虑评审的客观需求之余,建议适当放宽代表作完成人的年龄要求。发表在更高影响期刊的论文更可能获得图灵奖,但较低影响的期刊也可能诞生重要的论文,并且后一类论文的比例不可忽视,只关注期刊级别会使很多高水平论文沧海遗珠。代表作评价时,可以一定程度上关注高影响期刊的论文以提升评审效率,同时也应当对其他期刊的论文保持关注,避免“以刊评文”。


(3)从题材类型来看,系统类(数据方面)代表作的获奖人完成年龄更大,网络类代表作完成年龄更小;复杂度方面的算法类和网络类的代表作完成后受到认可所需时间较长,算法类(除复杂度外)和系统类(数据方面)代表作完成后受到认可所需时间较短。代表作完成年龄和获奖周期受其题材类型影响较大,在奖项类的评价实践中,应综合考虑不同类型代表作的完成年龄和认可时间周期等特点,灵活设置符合客观规律的代表作评价制度。


4.2 建议

基于图灵奖代表作的相关结论,本文面向奖项类的代表作评审,提出以下建议:


(1)应定期调研科研人员代表作的实际情况和分布特征,摒弃教条主义,为具体评价制度的动态调整留有空间。根据不同学科领域、不同载体和不同类型代表作的实际特征及规律,兼顾评审的客观需求,依据具体的评价场景,对代表作完成年龄、时间周期、发布载体和不同题材类型等客观标准进行动态调整。


(2)允许多种形式作品载体参与代表作评价,在遴选代表作时,应以科研人员为主体,保障科研人员能够选出自己当前最出色的代表作参加评审,可以要求科研人员提交围绕某一主题的深入研究情况,突出对该主题下的学术观点或发明发现的评价,而非对发表载体级别的评价。在评审阶段,适当的量化评价可以提高评审效率和保障评审公正性,但应保证内容和载体之间清晰的主次关系,以同行评议为主,将定量评价与定性评价有效结合[17]


(3)在奖项类代表作评价中,具体研究内容的类型对代表作完成年龄和被认可时间周期的影响较大。如果推行代表作制度,每一个学科,甚至每一个子学科都应该根据自身学科和不同研究主题方向的实际特性对代表作的完成年龄和已完成时间设定更合理的限制,使得本学科的优秀科研人员能够尽量得到发掘,优秀代表作能够尽量得到机会参评。


需要说明的是,本文基于奖项评审领域展开实证研究,部分结论是否适用于其他评价场景还有待进一步探究。此外,本文仅聚焦于时间周期、首发载体和题材类型三个角度分析代表作,而影响代表作评价制度的因素还有很多,例如学者所属机构类型、教育履历、合作模式、学术生涯、学术头衔及国别语种等诸多因素,因数据和篇幅限制,留予后续研究。




作者贡献说明

张琳:提出研究问题和思路,指导和参与论文撰写; 

苏鹏:采集、清洗和分析数据,论文起草和最终版本修订。




支撑数据

支撑数据由作者自存储,

Email:linzhang1117@whu.edu.cn。 

1 张琳,苏鹏.支撑数据.xlsx.图灵奖代表作支撑数据.




参考文献


*本文原载于《图书情报知识》2021年第1期66-75

版权归《图书情报知识》所有,欢迎转发到朋友圈,转载请联系后台。


制版编辑 | 卢慧质


--END--


当期荐读 2021年第1期 | 任务驱动下的学术数据库新手心智模型演进及学习模式研究(内含视频摘要)

当期荐读 2020年第5期 | 智慧服务群俦:期刊主编笔谈(三)

当期荐读 2020年第5期 | 智慧服务群俦:期刊主编笔谈(四)

当期荐读 2020年第5期 | 智慧服务群俦:期刊主编笔谈(五)


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存