查看原文
其他

经济学革命|赫克曼等:经济学的出版与传播:五大顶级期刊的专制

James J. Heckman CPEER 2022-12-31

 Heckman

    Sidharth Moktan

作者:James J. Heckman,美国芝加哥大学经济学家,芝加哥经济学派成员。由于他在计量经济学和微观经济学的贡献与丹尼尔·迈克尔法登一起获得2000年诺贝尔经济学奖。

         Sidharth Moktan,芝加哥大学人类发展经济学中心(CEHD)博士前研究员。

译者:唐昱茵、何庆麒、刘静怡

译审:杨虎涛

本文出处:史正富、孟捷主编,《现代经济学的危机和政治经济学的复兴》,社会科学文献出版社2019年。

摘要:本文主要研究在五大顶级期刊(Top Five ,以下简称T5)上发表文章与经济院系终身教职获取的关系。通过对被美国排名前 35 的经济院系所聘用的常任轨经济学者们的分析,我们发现 T5 发文对终身教职授予的决定和终身教职转换率有巨大影响。一项对初级教员看 法的调查结果佐证了正式的统计分析。追求在T5上发表文章,已经成了下一代经济学家所痴迷的事情。然而,T5 的筛选眼光远不可靠。相当一部分具有影响力的文章都发表在T5之外的期刊上。依靠T5来筛选人才,激励的只是他们的名利心,而非创造力。

1 引言

 本文考察了经济学学术界是如何激励青年学者,并由此塑造未来的职业经济学者的价值观和追求的。任何与步入学术界年轻经济学者讨论起职业前景的人以及他们的同僚,都必会发现这些年轻经济学者对在五大顶级期刊上(TOP FIVE,后文简称为 T5)发文的痴迷。因为教授委员会在讨论教员引进、职称晋升、终身教职评定和各类评奖时,是通过在 T5 上已发表或将发表的文章数量以及发文速度来评估候选人的。评价候选人的标准是以候选人“生产”T5 文章的潜力而定的。

T5 期刊分别是:《美国经济评论》,《经济计量学》,《政治经济学杂志》,《经济学季刊》和《经济研究评论》。这些受到普遍关注的期刊,论文所涉主题非常广泛。他们被列为前五是基于对其期刊影响力指标的综合评估。基于各种指标体系评估研究人员的做法现在在各个领域中都很常见,影响因子[2]的使用就是一个典型例证。影响因子原本是为图书馆的采购咨询系统而设计的,现在却被许多领域的评估系统所广泛运用[3]。而期刊绩效的综合评价指标,比如影响因子,并不能评估出其中任何一篇论文的创造性或价值,而只是评估该论文所在的刊物及其同类期刊订阅规模的大小。

在T5 期刊上发文已成为一种专业标准。而对发文的追求则决定了做怎样的研究。对很多年轻的经济学者来说,如果一篇论文不能在 T5 上发表,那么这篇论文的主题就是不值得研究的。而在非 T5 期刊上发表的论文,通常被认为是在经历了T5 发文的失败后,降到了一个“平庸”的区域,其价值也因此大打折扣。这样的心理并不仅限于年轻学者,因为早期形成的习惯是很难改变的,所以追求在 T5 上发表文章,也已成为资深经济学者的一种生活方式,而文章在 T5 的审稿中淘汰也成了一种专业水平下降的标志。升职、认可度甚至薪水[4]都与T5 发文数挂钩。依靠 T5 来评估研究,只会激励学者追求在“适当”的地方发表论文,而不是激励他们进行连贯性的系统研究。

在某种程度上,对 T5 发文这一指标的依赖很严重。经济学的专业规模日趋扩大,且越来越专业化,客观存在着通过在 T5 上发表文章去证明其研究质量的需求。虽说论文读者和期刊的订阅者不完全相同,但普遍认为,文章发表在高等级的、广谱性(general interest journal)[5]期刊上,就等于说文章的引用率高且具有普遍理论价值。但我们本文的研究认为,论文的被引用程度和在T5 期刊上发表文章几乎是两码事。

而T5 发文的标准也已越来越难以达到。卡德(Card)和德拉·维格纳(Della Vigna)(2013)的研究表明,1990 年至 2012 年6期间,T5 中的可用版面大致保持不变。但在此期间,向 T5 投稿的数量及稿件篇幅都大幅增加[7],与此同时也伴随着拒稿率的增长和审稿过程的延迟。[8]编辑现在也倾向于采用比过去更多的评审。T5 期刊的接受率(acceptance rates) 已从 1980 的 15%下降到 2012 年的 6%。[9]

在排名靠前的院系中任职且素有声誉的经济学者们,现在正逐渐不再往 T5 或专业期刊投稿[10],而是在线发表一些有影响力的工作论文,而这些非 T5 的工作论文往往被引程度很高,这种态势有可能会弱化T5 指标。 

接收率的下降以及对多人评审结果的依赖(以及伴随审查和延迟),也可能意味着 T5筛选论文质量的上升。但这也可能产生一些潜在的令人忧虑的问题,而这正是这篇论文要表达的。

我们考察了发表 T5 文章对经济学界晋升以及终身教职授予决定的影响。首先我们分析了在 1996 到 2010 年间[11]被美国排名前 35 的经济院系所聘用的人员数据。该选定时间段有充分长的时间跨度来评估T5 论文的早期影响,同时又有足以用来描述现在的专业环境。

接着我们评估了终身教职的获得在多大程度上受 T5 论文发表的影响。我们考察了首次入职时获得试用长聘资格的概率和在该教职上的第七年获得终身教职的概率,[12]并用持续期分析的估计值对此分析进行了补充。分析显示,在同样时期内,与在非 T5 上发表同等水平文章的候选人相比, 在T5 上发表三篇论文的人获取终身教职的可能性要高 370%。如果只T5 上发表一篇,则高出 90%,发表两篇,则高出 260%。相比之下,在非 T5 发文的 “绩效”就相形见绌了。

然后我们探讨了在不同排名的院系中,发表 T5 文章对获取终身教职的影响的差异性。随着院系排名的下降,对获取终身教职的T5 发文数量要求也随之降低,但T5 发文在终身教职获取的影响力却在增加。任职于排名较低的院系,但拥有相同数量的 T5 发文的教师, 获得终身教职的比例更高。尽管存在这种差异性,但无论哪个层次的院系,在 T5 上发表论文都是提高获取终身教职可能性的最有效的途径。在美国排名前 35 的经济院系中,T5 文章对职位晋升和任用的影响力是毋庸置疑的。

虽然由于我们收集的女性样本规模较小因而不能精确认定,但仍能判断长聘职的获取比例存在着性别差异。对男性来说,在第一个任职期间,两篇 T5 论文已足以达到 50%或更高的获得终身教职的概率。对于女性却需要三篇论文——不过这仅仅是一个点估计,并且标准误差很大。

在证明了T5 发文的影响力之后,我们继而考察了用影响因子作为评价机制的有效性。T5 论文被高度引用,但在非 T5 期刊的上发表的论文也同样如此,甚至很多非 T5 的论文比T5 论文的引用还要多,[13] 大量有影响力的论文并没有发表在 T5 上。事实上,在过去 50 年里,许多最重要的论文都因太过于创新而未能通过 T5 的保守用稿制度。[14] 20 篇被引最多的 RePEc 论文中,很大一部分都不是在 T5 发表的。15 但在将终身教职获取后的十年或十年以上时期内论文被引数作为控制变量的情况下,发表 T5 论文仍然是获取长聘教职和晋升终身教职强有力的决定因素。

从根本上说,坚持让学者在 T5 这类具有广谱性期刊上发表论文,与经济学日益凸显的专业化和碎片化发展趋势相违背。不过,现实往往就是这么吊诡:多数领域的泰斗都在非T5 的专业期刊有大量的发文。并且,相比 T5 期刊,非 T5 期刊在大多数经济学分支领域的顶级期刊的被引用次数上通常有着明显优势,虽然 T5 期刊明显依赖各领域的专家来对提交上来的各领域论文进行评审。而本来主要在非T5 期刊上发文、阅读非T5 文献、引用非T5 论文的学者们,却要用 T5 发文数对参与晋升和应聘的潜在候选人的水平进行评估。而这些评审专家自己却并不会依据这套标准来行事。

编辑的任期都很长,特别是“内刊”[16]——亦即编辑大多是——与某一院系机构密切相关的期刊。对这类期刊而言,较为稳定的编委会导致对编辑和期刊的“追随者效应”成为可能,经济学期刊倾向于发表那些与期刊编辑联系紧密的作者的作品,这一点已经被充分证明。见布罗加德等(Broggard et al.,2014)、拉邦和皮特(Laband and Piette,1994)以及克鲁西(Colussi,2018)等。我们通过对 T5 发文“近亲繁殖”(inbreeding)情况的“近亲度”(incest coefficient)进行的量化分析也证实了这一观点。编辑们更可能选择那些他们所熟知的作者的作品。网络确实很重要。[17]

这种行为究竟是一种利用文章质量作为衡量标准——如引文数——的内部信息行为,[18]还是一种低效的、任人唯亲的行为?对这一问题的讨论很多。[19]关于这个问题的证据还不是确凿的,但似乎支持了掌握内部消息的人获得净收益的判断。不过本文没有深入探论用引文数衡量工作效率的价值,也没有深入探讨经济学圈内相互审定和相互引用并排斥圈外人的这类“自我指涉性”问题。[20]

本文余下的内容安排如下。第二部分证明了 T5 在决定终身教职授予和获取终身教职所需时长上的影响力。第三部分公布了一个面向初级教员的关于当前终身教职和晋升机制看法的调查结果,他们证实了我们进行实证分析的证据。第四部分考察了以已发表文章的引用情况来评价科研的 T5 筛选机制。第五部分则给出了期刊编辑长期聘任的时长及其近亲繁殖的证据。

总结部分进行了观点概括,并讨论了针对当前对 T5 发文的依赖可以采取什么措施(如果有的话)。文章用一个在线附录[21]给出了背景资料并对敏感度分析作报告。我们附上了正文附录,以提供重要的方法论细节。

————————————————

2 影响因子由Web of Knowledge 评估,Web of Knowledge 是由科学研究院信息研究所制作的科学引文索引服务,为图书馆收购提供建议。

3 见伯图兹和德鲁宾(Bertuzzi and Drubin ,2013)

4 见吉布森等人(Gibson et al.,2014)的表 7。加州大学的经济学教师因未在 T5 发文而遭受工资处罚。

5  意即涵盖专业领域全面、广泛的刊物,结合上下文含义看,此类刊物与专业性很强、选题较为集中的刊物对应,故译为广谱性刊物。译者注。

6 卡德和德拉·维格纳(2013)的数据摘要,见在线附录图O-A30。

7卡德和德拉·维格纳(2013) 

8 埃利森(Ellison,2002)

9卡德和德拉·维格纳(2013) 10埃利森(Ellison,2011)

11 前 35 名是根据 2008 年、2010 年和 2015 年《美国新闻和世界报导》对经济院系排名的平均值来评估的。

12 需要注意的是,在美国的Tenure-Track 制度中,首先是一个博士或专业人士能否取得进入Tenure-Track 体系也即是接受长期聘任试用的资格。7 年结束之后如果达到要求即可申请终身制教职。遵循阅读习惯,译文未明确区分常任轨和预聘制。这一制度的起源是:1900 年美国斯坦福大学经济学家因公开发表移民劳工问题言论触怒校董而遭到解聘,此事引起了部分高校争取学术自由权利的行动,并于 1915 年成立了美国大学教授协会(AAUP)。该协会成立之初发表了

《关于学术自由和终身教职的原则声明》,以期获得学术自由和职业安全的双重保障。而与之相对的美国高校组织在认可 AAUP 声明的前提下对获得终身教职前的试用期做出了规定。这即是Tenure-Track 制度的来源,1940 年 AAUP 和美国学院联合会(AAC)达成协议,设定试用期期限,如期满后如未能晋升副教授则必须离开,这便产生了“非升即走”  的概念。这也是这篇文章将时点定为第七年的原因。译者注。

13 见提出这一观点的哈默梅什(Hamermesh,2018)。 我们建立并扩展了他的分析。

14 阿克洛夫(2018)认为,T5 期刊经常支持“安全的研究”,这种研究可以略微扩展一个领域的边界,但不会有大幅的推进。这可能是同行评议过程的产物,而这种过程产生了固有的保守主义。另见AEA 研讨会中的讨论于此链接:https://www.aeaweb.org/webcasts/2017/curse.

15 RePEc(www.RePEc.org)为经济学研究论文网(Research Papers in Economics)的缩写,是业内引文数排名的主要来源。 根据RePEc 网站的说法:“ 来自 99 个国家的 2000 多个档案馆已经从 3,000 种期刊和 4,600 份工作文件系列中贡献了约 260 万份研究论文。每周有超过 50,000 名作者注册以及 75,000 个电子邮件订阅申请。”

16 house journals 并非不能公开发布的内部刊物,而是往往指具有某些院系或学派背景的刊物,译者注。

17 见克鲁西(Colussi ,2018)最近的一项研究。

18 意指编辑更容易通过网络掌握作者的能力和研究质量,作者更容易通过网络知晓编辑偏好。译者注。

19 拉邦和皮特(Laband and Piette ,1994)发现文章的作者与编辑有关系时确实更有可能被发表,然而,平均来看,这些文章也倾向于有更高的引用数。布罗加德等人(Brogaard et al. 2014)估计,相比于这些院系与编辑无直接关系时, 若期刊编辑是同事,则作者在期刊上发表的论文数量将增加 100%。他们还发现,有关系的文章比没有关系的文章的引用数平均多 5%到 25%。

20 详见卡佩勒等人(Kapeller et al.,2017)

21 详见http://heckman.uchicago.edu/publishing-and-promotion/appendix.pdf

2. 五大顶级期刊支配力的经验证据

就青年经济学者的普遍忧虑和期望,我们进行了广泛的分析。结果表明,青年经济学者的这类期望和忧虑是有理由的——在 T5 期刊上发表论文的确是通往成功的道路。我们从一开始就注意到,金融已经成为一个与经济学关系密切的主要领域,并且有许多具有影响力的学者。在我们的主要分析中,我们将金融学和经济学其他领域的论文一同进行分析。在线附录第四部分是一个除去了金融领域论文的同样的研究,因此我们的点估计几乎没有受到影响。我们的分析表明,在现行的任何一套规则体系下,T5 发文数都是判断事业成功的一个重要指标。 

2.1 数据   

运用美国前 35 个经济院系在 1996 到 2010 年间所聘用的终身教职人员的和发文历史 的面板数据,我们研究了终身教职职位与 T5 发文数之间的关系。面板数据分四个步骤建立,[22]在线附录第一部分给出了关于数据建立的细节。在院系分组中,第一个任期结束前,获取终身教职的比例在 26%到 31%之间,且没有在 院系排名间表现出系统性差异。[23]不出所料,相当一部分的初级教员(意为刚获得试聘期) 出现了向下流动。[24]横向流动的比例在排名前 5 的院系中最高,为 21%,在 26 至 35 的院 系中最低,只有 6%。相反,向上流动或转到企业中任职的情况,在排名更低的院系中更 为普遍,而在更高排名的院系中则较为少见。[25]所有院系分组中,临近第二个任期结束时获 取终身教职的比例明显提高,达到 34%到 54%之间。[26],[27]

图 1 不同终身教职获取结果人数比例在首次常任轨教职年限上的分布

图 1 描绘了在不同院系排名组中,在第一个预聘任期就被授予终身教职或做出了其他选择的教职员比例在时间上的分布。获取终身教职的教员的平均任职时间是 5.4 到 7 年,标准差是 2.0 到 3.0 年。[28],[29]院系间的向上流动和横向流动分布,相比获取终身教职的分布是向左偏移的。相反,向下流动或放弃教职到企业工作的分布则更与获取终身教职的分布相近。这些差异说明,相较于很可能发生在获取终身教职之前的向上流动和横向流动,向下流动和转移到企业就职的学者,更可能是因为在原就职院系没能获得终身教职的结果。我们会在 2.4 节讨论性别上的差异。 

2.1.1 期刊分类 

为了比较终身教职获取与 T5 以及非 T5 期刊发文的关系,我们将非 T5 期刊进行了基于期刊质量的分类。这样的分类使我们能估计在具有相近地位的非 T5 期刊上发文对获取终身教职的影响。运用库姆斯和林内默(Combes and Linnemer,2010)的专业排名,我们把期刊分为以下几类:A 级专业期刊、B 级专业期刊和非T5 普通期刊。[30]在线附录 OA-A9 表格给出了期刊分类情况。

对发文数数据的归纳如下。图 2 根据是否拥有终身教职对在前 15 名院系的教员进行了区分,并且四个子图分别表示在学术生涯的第一个八年中,教员在四种期刊类别上的平均发文数量。该图揭示了一种异乎寻常的模式。以具有同行评议性质的期刊来看研究效率的话,院系排名前五的终身教员与他们没能获得终身教职的同事之间的主要区别是 T5 发文数。随着时间的推移,获得与未获得终身教职的教员的 T5 发文数之间表现出更明显的差距,具体表现在两者第八年时的平均 T5 发文数相差近 3 篇。[31]T5 和非 T5 期刊之间明显的差别深刻反映了顶级院系过分强调T5 发文的重要性。

图 2 不同终身教职获取结果和院系排名下的四类期刊平均发文数的变化 

注:该图根据不同终身教职取得结果绘制了教员在四类不同期刊平均发文数的变化。绘制的平均值是根据院系所属排名组聘用的常任轨教师发文数计算的。∆8 截至第 8 年最终取得和未取得终身教职的教员的累计发文数差值。

在排名 6 到 15 的院系中,T5 发文数差距有所下降,但同时 A 级期刊中发文数的差距在上升。截至第 8 年,A 级期刊平均发文数在前 5 名中是 0.4 篇,而在第 6 到 15 名中则是0.7 篇。尽管存在这些变化,但T5 期刊在排名 6 到 15 的院系中仍是区分获得终身教职和未获终身教职的主要指标。当我们考虑级别更低的院系时,A 级期刊的相对重要性持续上升,其发文数差异在排名 16 到 25 的院系中甚至超过了T5 期刊。 

观察到的发文模式表明,对 T5 发文数的要求随着院系排名降低而下降。排名较低的院系更看重非 T5 发文。排名较低院系的教师可以发表更多非 T5 文章来弥补他们 T5 发文数量的下降。这种差异性的证据表明,对终身教职获取和发文数之间的关系中的院系间差异进行更深入的研究是有必要的。在我们的正式分析中,我们使用允许这种异质性存在的经济计量学模型来进行分析。

————————————————

22 这四个步骤是:(i)使用由 WayBackMachine 存档的排名前 35 的院系网站上公开的历史照片,建立 1996 年至 2010年期间各院系雇用的常任轨教员名册; (ii)使用简历和其他公开的工作历史资料来建立终身教员的工作经历;  (iii)根据多种公开信息来源构建终身教职授予决定,包括授予终身教职的公告; (iv)使用Scopus.com 的数据构建发文数和引用数。

23 见在线附录表O-A4

24 排名前五的院系在向下流动者的比例和终身教职获取者的百分比差距最大。这种特殊的相对差异是由于前 5 个院系的教师无法定义向上流动,从而将其最终归属限制为 4 个选项而不是 5 个选项。

25 所有排名组的向上和横向流动率之和是相近的。

26 有关第二个任期的终身教职获取率,见在线附录表O-A6。

27 在线附录表O-A7 给出了前 35 个院系的终身教授授予率。

28 有关每组的平均值和标准差,请见在线附录表O-A5。

29 终身教职分布的右尾延伸超过 10 年。这种异常值的存在与人们所期望的一致,因为终身制时间钟延长政策允许教师在怀孕、收养以及其他允许的情况下延长时间钟。

30A 级专业期刊由发展经济学、经济计量学、金融学、微观经济学/博弈论、卫生经济学、产业经济学、劳动经济学、宏观经济学以及公共经济学等各领域中排名最高的两本期刊组成。B 级专业期刊由在同一领域排名三至五的期刊组成。非T5 普通期刊包括排名最高的关注普遍问题的非 T5 期刊。

31 参见在线附录O-A1。我们还估算了将持续时间固定为 7 年的终身经验的模型。汇总估算值见在线附录图O-A5。该分析的结果在定性上与正文中的分析类似。在线附录图O-A6-O-A8 中列出了第 7 年的细分排名院系的估算。

2.2 获取终身教职的可能性 

    我们讨论了不同期刊分类中终身教职授予和发文数的关系。图 3 绘制了由 logit 模型测算的,与在四类期刊中的发文数相关的获取终身教职的平均概率。[32],[33]通过控制所有设定中的发文总数,我们从规模影响中分离出了结构影响。我们还进一步控制了性别、合著者的数量、毕业母校的质量以及由每个作者在所有相关期刊中发文的被引总数所代表的作者发文组合的质量。[34]

图 3:在第一个常任轨教职任职期间获得终身教职的预测概率(logit)

注:该图显示了与不同期刊类别中不同出发文水平对应的预测概率。预测概率由等式 TA-2 定义(等式 TA-2 使用了来自等式 TA-1 的参数估计值)。条形图上的白色菱形表示预测在 5%的显著性水平下显著。 

从图 3 可以看出,在 T5 期刊上发表文章与获得终身教职概率高度相关。一位仅有一篇 T5 发文的教师有 29%的概率获得终身教职。而有两篇和三篇 T5 发文则分别会使概率提高到 43%和 63%。虽然在 5%的显著水平下非T5 发文使得获取终身教职的概率非 0,但是靠非 T5 发文获取终身教职的概率远远低于靠 T5 发文。非 T5 发文获得终身教职的最大概率只有 24%,而且这还是在 A 级期刊上发表了两篇文章的情形下。这一概率比仅有一篇 T5 发文时所对应的概率(29%)还要低。发表三篇甚至更多的 T5 文章所对应的概率是 63%,这几乎是非 T5 发文所对应的最高概率的 1.6 倍。而考察发文数与在常任轨内任职七年时能否取得终身教职之间的关系时,这种由T5 和非 T5 发文引致的巨大差异仍然存在。[35]

2.2.1 不同排名院系中 T5 的影响力 

    图 4 描绘了在不同排名的院系中的教职员在第一个常任轨任期中,不同水平的 T5 发文对应的获得终身教职的预测概率。36第一个任期的长度因人而异。37对每个院系排名组的预测值,是对在我们所讨论的院系中有过初任常任轨教职的教员子样本进行有条件的logit 模型估计得到的。对于本文中所有使用的实证分析模型,我们都将针对院系间的固定效应和因院系水平集中进行的标准误修正纳入其中。

 图 4:不同名次的院系中在初任常任轨教职期间获得终身教职的预测概率 

注:该图绘制了与不同期刊类别中的不同发文水平对应的预测概率。预测概率由方程 TA-2 定义(等式 TA-2 使用了来自等式 TA-1 的参数估计值)。不同院系排名组对应的估计值采用属于我们所讨论的院系中的教员所构成的子样本,由方程 TA-1 进行有条件地估计。条形图上的白色菱形表示预测在 5%的显著性水平下显著。 

该图显示了每篇 T5 发文对获得终身教职概率方面形成的影响的异质性。较之排名较前的院系,排名较低的院系的教员发表相同数量的 T5 论文,有更高的终身教职获取概率。在前 10 名的院系中,有一篇 T5 发文的教员有 22%的概率获得终身教职。但在相同情况下, 排名在 11 到 20 以及排名在 21 到 35 的院系中的教员获得终身教职的概率分别是 28%和39%。同样地,在排名 11 到 20 的院系中,有两篇和三篇 T5 发文的教员预计会比排名前 10的院系中发表相同数量 T5 文章的教员拥有更高的概率获得终身教职。[38]

2.2.2 不同 T5 文章质量对应的 T5 影响力[39]

这一部分探究 T5 的持续影响力。前几部分的研究结果已经揭示,即便在对以被引用水平表示的论文集质量进行了差异控制的情况下,T5 发文仍在终身教职的授予决定上有着巨大的影响。这些研究结果表明,T5 的影响力是独立于文章质量而发挥作用的。图 5 为这一假说提供了强有力的证据。根据在 2018 年中个人在初次任常任轨教职期间所有期刊发文的平均被引用情况,该图将教员分进四等分位点划分的四个组中。在各组中,我们分别给出了获取终身教职的概率与不同水平的T5 发文之间的关系。[40]为以论文质量为条件来研究T5 的持续影响力,我们要求所有发表的文章首次被引用的时点距今至少十年。[41]因样本容量问题,本次分析不根据院系的固定效应和由院系排名差异对应的终身教职获取过程差异进行修正。但由于对样本中的个体引入了在 2008 年之前结束初次任期这一约束条件, 我们失去了大量的观测值。

图 5:在由 2008 年及 2008 年之前结束初次常任轨教职任期的教员发表论文的不同质量水平下(文章质量以在初次任常任轨教职期间所发表论文至 2018 年的平均被引用情况),对应的在初次任职期间获得终身教职的粗略概率;样本限制于在结束初次任职期前发表过3 篇或 3 篇以上期刊论文的教员。

注:该图表绘制了在以初次任职期中发表文章在 2018 年被引用情况的度量为代理变量的文章质量的不同水平下,对不同 T5 发文数目的个体获得终身教职的概率(在初次任职期间)进行的估计。根据在初次任职期间发表的所有论文在 2018 年的平均被引用情况,教员被分进以四等分点划分的四个组中。图表还绘制了不同四分位组中每个 T5 发文水平所对应的终身教职获取概率的差别。在每一个四分位组中,都以给定 T5 发文水平下在初次任期中获得终身教职的人数比例为概率的估计量。估计样本被限制为仅含在初次任期中发表过 3 篇或 3 篇以上期刊论文的个体上。概率的估计值等于 1 时并没有给出置信区间,因为这意味着这些组内所有个体都获得了终身教职。

在所有以作者发文质量为划分依据的四等分组中,获得终身教职的概率总体上随 T5 发文数增加而增加。各四分组内的比较揭示了 T5 的影响程度。拥有平庸的作品但有 T5 发文的作者,胜过了拥有杰出的作品却没有 T5 发文的作者。在上四分位组中拥有较少 T5 发文数的作品集合——有三篇或三篇以上非T5 的论文的人,与在下四分位组中拥有一篇T5 论文而有两篇或两片以上非 T5 论文的人相比,预计获得终身教职的概率相同或是比后者更低。拥有下四分位水平作品集合,但集合中含有两篇或三篇 T5 发文的教员,获得终身教职的概率则远大于拥有上四分位组水平的作品集合,但集合中缺少 T5 发文的教员。当我们把样本限制于仅包含在初次任期中发表过 4 篇或 5 篇以上期刊论文的教员时,与质量水平无关的T5 发文影响力依然存在(见在线附图 O-A14 到O-A15)。

这一部分得出的结论支持了之前的假说,即 T5 的影响力是以与文章质量无关的方式发挥作用的。通过调查美国排名前 50 的经济院系现任常任轨教员,我们证实了这一发现。初级教员认为,终身教职审核委员会至少有 89%的可能性,将终身教职授予一位拥有 T5 发文的候选人,而不是一位情况完全一样但没有 T5 发文的候选人(两人有着完全相同的论文发表数量和质量)。

————————————————

32 明确的Logit 估计所用设定见正文附录 1.1 部分。

33   对应的边际影响于在线附录表O-A10 中的“综合”(Pooled)一栏中给出。我们还在在线附录表 0-A10 中给出了线性回归模型(LPM)估计引致的偏效应的近似估计值。结果定性地一致,即目前为止 T5 是最有影响力的期刊类别。

34 分析中每个文献的相关性都不同。我们用在初次常任轨任期全部发文的被引数,来对终身教职的获取进行估计。

35 有关结果和所用设定的详细信息,见在线附录第 2.3 部分。

36 相应的边际影响于在线附录表O-A13 中的院系排名栏中给出。

37我们还估计了将持常任轨任职经历固定为 7 年的模型。综合估计值于在线附录图O-A5 给出。该分析的结果与正文中的分析结果定性地一致。在线附录表 O-A6 到O-A8 中列出了不同排名下的各院系中第 7 年获取终身教职的估计值。

38 虽然差异是明显的,但是无法拒绝院系排名组间概率均等的原假设。参见在线附录表O-A14。

39 这一部分的分析受丹·布莱克和哈拉尔德·乌利希(Dan Black and Harold Uhlig.)的评论所启发。

40 这一概率通过以如下步骤构建:(i)样本被限制于仅包含在首次常任轨教职期间发表过至少 3 篇期刊论文的教员上(3 是首次任职期间的期刊发文平均数);(ii)基于每个人发表的所有期刊论文在 2018 年的平均被引用情况,每个人都被分到以四分位点划分的四个组中的一个组;接着(iii)用各组中在首任常任轨教职期间,从 0 到 3 的 T5 发文数所对应的个体中获得终身教职的人数比例来估计获取终身教职的条件概率(给定条件是 T5 发文数)

41 通过将估计样本限制于仅包含在 2008 年之前结束常任轨教职任期的个体,这个要求可以得到满足。因此,估计样本中所有在获得终身教职之前的期刊发文都发表于 2008 年或 2008 年之前。

2.3 获取终身教职所需时间的持续期分析

表 1:尚未获得终身教职的常任轨教职人员的可能状态

这一部分将通过探究获取终身教职所需时间与在四类期刊中刊物发表的时变度量之间的关联,进一步阐述我们对终身教职与期刊发文数之间关系的分析。为继续我们的讨论, 请设想这样一个单期模型:每个人都以在 T35(排名前 35 的院系)中未获终身教职的助理教授身份进入博士毕业之后的学术就业市场。任意一个人在第一期中,首次获得常任轨教职但未获终身教职的概率是 1。在随后的时期中,个人可以保有在 T35 的未获终身教职的常任轨教职,或是接受在 T35 中的终身教职,抑或不再以常任轨教员的身份在 T35 中任职。[42]未获终身教职的常任轨教员可以转变为两种互斥的职业状态,但这两种职业状态相对于他们最近的状态——未获终身教职的常任轨教职而言,又是对立的。我们根据表 1 给出的状态,[43]使用了一个标准化竞争风险时期框架,并以发文数为约束条件。

2.3.1 风险率和获取终身教职所需时间的综合估计

图 6:不同类型期刊中的发文与获得终身教职的相对风险率(Hazard Rate)的关系

注:该图表绘制了在不同类型刊物中,发文数与风险比率(Hazard Ratio)的关系。风险比率可由对附录中的 TA-13 方程之估计得到。柱状图上的白色菱形表示在 5%的水平下,推算值显著不为 1。

图 6 表现了在四种期刊类型中,获取终身教职的风险率(终身教职转换率)的提高与不同的发文数量有关。[44]各个参数的估计值见在线附表O-A17。这些估计值表明,对于T5 发表过两到三篇文章的人和从未在 T5 发文的人,前者对应的终身教职转换率是后者对应的转换率的 3.6 或 4.7 倍。与之形成对比的是,对于在 A 级或 B 级期刊发表过三篇文章的人和从未在这些刊物中发表过文章的人,前者转换率仅为后者风险比率的不到 1.3 倍。在5%的水平下,非 T5 中所有风险比率的估计值都是不显著的。

人们预期通过在这些刊物中发表文章来提高自己取得终身教职的可能性,但就实际结果来看,T5 和非T5 期刊有着天壤之别。对于在T5 发表过 1、2 和 3 篇文章的人,他们的终身教职转换率分别是在 A 级发表过三篇文章的人的 73%、227%和 327%强。而风险比率的差异可以转换为获得终身教职所需时间的差异。图 7 则刻画了在四类期刊中不同发文数所对应的获取终身教职所需时间的分布情况[45]。在 T5 中发文对应的分布——预计终身教职获取所需时间的密度分布,有明显的向左的移位,这意味着在 T5 发文与预期终身教职获取所需时间大量减少相关。相比之下,在非 T5 期刊中发文所对应的分布对基准分布的偏离程度是微乎其微的。

图 7:获取终身教职所需时间的密度分布(韦伯分布)

注:该图表绘制了在四种不同类型期刊中的不同发文数所对应的获取终身教职所需时间的分布情况。获取终身教职所需时间的密度可由对方程TA-13 的估计推得。每幅图的蓝色阴影区表示是这样一种情况下的终身教职获取所需时间的分布——没有在任何一类期刊中发表过任何文章[46]。

2.4 获得终身教职的概率与比例的性别异质性

2.4.1 获得终身教职所需时间的异质性

这一部分考察获取终身教职所需时间与终身教职获取率的性别异质性。对基准风险的估计源自对性别指标(以男性为表示主体)的风险比率估计。基于对未观测到的异质性的假设(见在线附表O-A17),这一指标在 1.46 到 1.47 之间。1.47 的男性指标表明,当考虑到时变和时不变向量对X 的约束时,男性教员获取终身教职所需时间的风险比率要比女性高 47%。风险率的差异可以转换为获取终身教职所需时间的差异。图 8 描绘了不同性别下, 终身教职获取时间的密度分布与在T5 发表一到三篇文章之间的关系(见在线附图 O-A23:不同性别和 T5 发文数条件下,用非参数化卡普兰-梅尔曲线刻画的存活概率)。与男性相比,女性的分布密度分布呈现出向右偏移态势。通过柯尔莫哥洛夫-斯米诺夫检验,我们以5%的水平拒绝了每种 T5 发文水平下跨性别密度分布属同分布的原假设。

图 8:不同性别条件下(发文水平的正面影响在不同性别中保持不变),获取终身教职所需时间的密度分布(韦伯分布)

注:该图表绘制了在给定不同 T5 发文水平和性别下获取终身教职所需时间的条件密度。由正文附录后的 TA-13 方程可得剔除了发文水平参数与性别的相互影响的参数估计值,并可由此推算获取终身教职所需时间的密度。给定性别为 g,T5 发文数为 x,非 T5 发文数为 0 的获取终身教职所需时间的条件密度可表示为 f(t|#T5=x,#非 T5=0,性别=g,X) = h(t|#T5=x,#非 T5=0,性别=g,X)×S(t|#T5=x,#非 T5=0,性别=g,X),其中 h(t|·)和S(t|·)分别为条件 t 下的条件风险率和存活率。图 8 中 3 个子图的标题列出了以发文数变量为条件的条件约束。“2 篇发文于 T5,0 篇于其他刊物”给定了条件:#T5=2,#非 T5=0。通过表明每条曲线对应何种性别的图例,我们给出了对性别的条件约束。对 X 的条件约束则无需多言。综上,在以“2 篇发文于 T5,0 篇于其他”为名的图中,黑色的密度分布是对下面这个密度函数的刻画:f(t|#T5=2,非#T5=0,性别=男,X)。对其他不同 T5 发文数的曲线以及女性所对应的曲线都以类似方式定义。每幅图中的蓝色阴影部分表示在没有任何期刊发文的情况下,女性获取终身教职所需时间的条件密度。每幅图还给出了对男性和女性分布进行柯尔莫哥洛夫-斯米诺夫检验所得的 p 值。

接下来我们将在给定性别指标的统计显著水平下,研究 T5 发文的正面影响在不同性别中可能存在的差异。我们通过考察附录里 TA-13 方程中的发文变量与性别指标进行相互影响,来探究不同发文数的正面影响异质性。在线附录图 O-A20 到 O-A22 给出了在不同期刊分类中不同发文水平下,不同性别获取终身教职的风险率。图 O-A20 绘制了不同性别作者的前三篇T5 发文所对应的风险率。结果显示,在第一篇T5 发文中,女性获取终身教职的风险率更高,但对男性教员首篇T5 发文所对应风险率的估计值只有 5%的水平。继续观察估计结果可得,男性第二篇和第三篇 T5 发文所对应的风险率则远高于女性。与女性相比,男性的两篇 T5 发文所对应的风险率要高 56%,三篇则要高 92%。第二篇和第三篇T5 发文的风险率仅对男性教员而言是统计意义上显著的。风险率的性别差异表明,同女性相比,同样的 T5 发文数对男性有更多的正面影响,与女性相比,男性获取终身教职所需时间会有更大程度的减少。但 T5 正面影响程度上的性别差异不能归因于不同性别的T5 发文质量差异。因为一个对性别间独立创作的 T5 论文被引用分布情况的比较揭示了这样一个事实:T5 文章被引用数的性别间差异是不显著的(详见在线附录 6.6 节)。我们注意到, 由于女性教员样本相对较小,所以同男性相比,对女性教员的点估计精度较低。[47]

获终身教职的风险率、获取终身教职所需时长在性别间的差异,表明即便在同一的发文水平下,女性教员相比男性教员所获得的回报是较低的——甚至可能是更不确定的。较低的女性终身聘用率在多大程度上是由育儿假期间的离职造成的,我们还不得而知。我们缺乏必要的数据以我们用以洞见女性情况的视线。

2.4.2 终身教职获得概率的异质性

图 9 给出了在给定性别和T5 发文数下取得终身教职的粗略概率。[48]在所有 T5 发文水平下, 女性的概率都是偏低的。这意味着在相同发文水平下,女性的回报可能低于男性(就取得终身教职的概率而言)。尽管图 9 表明在给定发文水平下,取得终身教职的概率存在性别异质性,但当我们建立一个 logit 模型,并引入性别指标和对非 T5 发文数的控制以及一个特征向量 X 时,[49]这些性别差异消失了。对于拥有七年常任轨任职经验的人,性别(男性指标)对终身教职获取的边际影响为 0.019(SE=0.038;p=0.607),而对初任常任轨的人,边际影响为-0.045(SE=0.033;p=0.175)。这两个估计值在 5%的水平下都是不显著的。该模型的推算值在男女间是大致相同的(见在线附录图 O-A10-O-A13),同时初年的估计值呈现出的性别无差异性要强于到第七年时的估计值[50]。

我们注意到,用于构建推算方程的关于非 T5 发文数和X 的参数不能随性别变化而变化。因此,对任何基于性别间终身聘用率差异之上的推算概率而言,它们的差异都与由发文数量造成的回报差异无关。与在 2.4 节中由持续期分析估计出的不同性别的发文回报不同,由 logit 得到的估计值没有展示出任何发文回报的性别差异。因为样本容量问题,我们无法更详细地对不同性别发文数进行说明。[51]

图 9:给定 T5 发文数和性别情况下初任常任轨教职者取得终身教职的条件概率

注:该图表绘制了在给定 T5 发文数和性别下在初任常任轨教职期间取得终身教职的条件概率。该概率由在初任常任轨教职期间,各性别-T5 发文数的分组中取得终身教职的人数比例来估计。

2.5 包含和剔除金融和经济计量学期刊时的灵敏度估计

金融学是一个独立于主流经济学又与其共存,有时还会与主流经济学有重叠的新兴领域。我们通过以下分析确认了这一事实:(a)将经济学和金融学期刊一同置于前文所述的混合领域期刊分组中,接着(b)将它们排除出去。我们的结果稳健地包含或剔除了金融期刊。在线附录第 4 部分中,我们给出了针对金融期刊的替代变量和剔除了金融期刊的样本的logit 模型估计值、线性概率模型(LPM)估计值以及风险率估计值进行了灵敏度检验结果。[52]

T5 期刊和非 T5 非金融期刊对获取终身教职(logit)和取得终身教职所需时间(持续期)的影响所对应的参数估计值,对这些处理金融期刊[53]不同方式是不敏感的。对 A 级期刊(由使用金融期刊分级的各组灵敏度检测得到)的分类估计值在统计上都是显著的。这些估计值的量级都比较大,表明专攻金融的教员或许可以利用其他非 T5 杂志,将他们的科研产出像发信号一样发出去,并作用于终身教职的获取或晋升。更多关于在模型设定中包含或剔除掉金融期刊的估计值灵敏度分析的讨论细节,见在线附录第 4 部分。

同样地,我们对原有期刊分类中包含的经济计量期刊进行了不同处理,并对不同处理方式下的估计值进行了灵敏度检测。于在线附录第 5 部分呈现的灵敏度结果显示了我们的处理方式,T5 的估计值有力地剔除了经济计量学期刊,同时 A 级期刊分类也被重新定义——包含了《统计年鉴》和《美国统计协会杂志》(替换掉包含在初始的 A 级分类中的经济计量学期刊)。对经济计量期刊的其他处理方式会造成从 LPM 估计值中得到的 B 级学术期刊的估计值丧失统计显著性。这也意味着在基准估计值中,经观察得到的终身教职获取结果与B 级发文水平的正相关关系,在很大程度上是由原本包含在 B 级期刊中的经济计量期刊(尤其是《美国统计协会杂志》)促成的。B 级期刊统计显著性的丧失提高了 T5 发文水平的相对重要性。

————————————————

42 个人不再以常任轨教员身份任职包含以下情况:前往排名低于T35 的院系中任职,进入商界,或在T35 中转为非常任轨教职。

43 详见正文附录第 2 部分。

44 院系排名差异对应的估计值差异见正文附录 2.3 部分

45  每一个图中都绘制了一个基准密度分布,这个基准密度分布是基于在四类期刊中没有任何发文的情况绘制的。不同期刊类别的密度分布被这条基准密度分布线所覆盖,用以凸显在不同类型期刊中发文的差异。这一图组中的第一个绘制了在我们所的期刊类型中的一类发表过一篇文章,同时在其他三类中未发表过任何文章的情况下,获取终身教职所需时间的密度分布。类似地,余下的两幅图分别描绘了在某种我们所关注的期刊类型中发表过两篇和三篇文章,但在其他三类期刊中未曾发文的情况下的密度分布。

46 在线附表O-A18 对比了韦伯模型和一个指数模型的估计值。T5 在韦伯模型中(T5 的显著性在韦伯模型和指数模型中是相近的,但非 T5 在指数模型中比在韦伯模型中更具显著)相对地更具影响力(与非 T5 相比)。但韦伯模型与指数模型相比具备更高的拟合程度,并且韦伯模型的对数似然函数值大于指数模型。为满足韦伯模型条件,我们使赤池信  息准则(AIC)和贝叶斯信息准则(BIC)都最小化。

47 样本较小有以下两点原因:(i)大学中从事经济学研究的女性数量小于男性。斯科特和西格弗里德(Scott 和Siegfried,2018)在 2017-2018 大学学年中对拥有博士点的 103 家美国机构进行调查后宣称,在助理教授和副教授的岗位上,女性只占到 21.7%-26.6%);以及(ii)在 T5 上发表过 3 篇以上论文的女性数量就更少了。

48 这些概率由各个 T5 发文水平下取得终身教职的性别比例估计得到。

49 详细设定见方程 TA-1

50 通过向推算方程 TA-2 中引入性别指标变量以得到Pr(终身教职=1|# Jˆ = Nˆ ,# J = 0, 性别=g, X)。在推算中用到的参数来自于估计方程 TA-1

51 因为样本容量问题,很多女性发文数参数没有进行估计。女性仅占样本的约 20%。

52特别地,通过在模型设定中以三种不同方式对金融期刊进行处理,我们给出了每种估计(logit,LPM,和风险率)的三组结果。第一组结果将金融期刊从A 级和B 级期刊分类中剔除。第二组结果也将金融期刊从A 级和B 级分类中剔除,同时引入一组发文指标阈值来度量这些金融期刊的发文水平。我们以对五本金融期刊的这一分类方式为总体的分  类方式。最后一组估计仍将金融期刊从A 级和B 级分类中剔除,但同时引入两套发文指标阈值来度量两个级别中的金融期刊发文水平—A 级金融期刊(排名前二的金融期刊),和 B 级金融期刊(排名 3-5 的金融期刊)。我们将对这五本期刊的分类方式视作对所有金融期刊的分级方式。

53 当金融期刊以分离的分类方式(从学术期刊单独分出来)引入时,B 级期刊在灵敏度测试中相对更突出。这种突出程度的提升只有在LPM 估计中才能观察到。

3 初级教员对当前终身教职授予和晋升机制的看法

我们在分析中还补充了一些工作经验和发文水平的数据,这些数据是对最近被全美排名前 50 的经济系聘为助理教授和副教授们进行调查所得。[54]受访者被问到他们关于由系内决定的终身教职授予以及晋升的看法,特别是对 T5 发文水平在这些决定中起到的作用的看法。[55]调查结果不仅支持了我们在第 2 部分的统计结果,还赋予了这些结果以现实意义。初级教员都对T5 的影响力都有理性的预期。附录 7.3 部分给出了我们的调查方法。

在 50 个院系中,调查整体的应答率为 40%(N=308),其中助理教授的应答率是 44%(N=210),副教授的应答率为 34%(N=97)。整体来看,排名在 41 到 50 的系应答率最高(43%),而排名前 10 的系最低(37%)。除了在排名前 10 的系中助理教授和副教授的应答率同为 37%,在其他所有排名分组中前者的应答率都要高于后者。职位和排名差异造成的应答率差异见在线附录图 O-A28。

这一水平的应答率使我们担心因缺少回答而导致的偏差。尤为担心的是受访者可能根据自己有无在T5 发表文章的能力选择参与调查与否,从而可能造成的潜在误差。但通过比较受访者的 T5 发文分布和总体中受聘于排名前 50 的系中的助理教授和副教授们的 T5 发文分布,我们有理由拒绝这种选择的存在。在对调查中的应答者和全部调查对象置于按系排名划分的组中并进行曼-惠特尼检验后,我们发现无法拒绝各分组分布相同的原假设。以上对比见在线附录表O-A53。在线附录 7.2 部分给出了对调查样本的新增数据描述。[56]

3.1 调查结果

调查中的一个问题是让受访者将八个科研和教学领域的绩效进行排序,排序标准是受访者认为的这些领域对于终身教职授予和/或晋升的影响程度。图 10 根据回答中的各领域的平均秩次对受访者回答进行了归纳。该图给出了三组归纳,分别对应影响三种不同职位晋升的绩效领域排序。三种不同职位的晋升分别是:获得终身教职、升为副教授、升为正教授。[57]T5 发文数在所有涉及的职位晋升中均获得了最高的平均秩次。对八个绩效领域及其所属的各排序的分布进行成对的威尔科克森符号秩(Wilcoxon signed-rank)检验后,我们发现在 10%的显著水平下,T5 发文数的重要性显著不同于其余七个绩效领域。[58]除了证实了我们之前关于 T5 发文相对于非T5 发文有更大影响力的发现之外,这些调查结果还表明, 相比例如外部推荐信、教学绩效等未被观察到的绩效指标,T5 依旧更具影响力。这些发现支持了顶级院系中的初级教员认为 T5 发文数是影响终身教职授予和晋升的最重要原因的结论。

图 10:基于对各绩效领域对终身教职授予和晋升之影响力大小的主观认识进行的绩效领域排序

注:该图归纳了受访者对八种绩效领域的排序。所有回答由以下三种职位晋升进行归纳:获得终身教职、升为副教授、升为正教授。条形图反映了每个绩效领域在累次回答中的平均秩次。我们给予了受访者不对任何领域进行排序或只对部分领域进行排序的选择。故受此影响,不同绩效领域中的受访者数量各不相同。在线附录表 O-A56–O-A58 中对不同排序分类下,相同绩效领域秩次是否相同进行了成对检验。每组成对检验只使用在回答中完成了对应两组绩效领域排序的受访者的数据。在 10%的显著水平下,T5 发文数在统计上显著不同于其他七个领域中的任何一个。

外部推荐信的质量在所有类型的职位晋升因素中均获得第二高的平均秩次。外部推荐能起到向终身教职与晋升委员会提供候选人所从事研究的质量和影响力的第三方意见的作用。在一些在相近领域中做研究并有着相近经验的研究人员中进行挑选时,这一作用尤其重要。现有数据尚不足以让我们检验 T5 发文数是否影响外部推荐信质量。然而,考虑到外部和内部评审专家的关注点都在对候选人研究成果的评定上,且外部评审专家可能任职于与候选人所在院系排名相近的院系中(在研究评估中的 T5 发文一项上有相近的重视程度),所以内部和外部的评审专家可能对候选人的 T5 发文数的重视程度相同。的确,写推荐信的人常关注潜在候选人的 T5 发文数或将要发表的 T5 论文。外部推荐信与 T5 发文数的这种相关关系将增加初级教员在T5 发文上所面临的压力。

图 11:获取终身教职所需最低 T5 发文数

注:该图归纳了受访者对获取自己所在院系中的终身教职所需 T5 发文数的估计。条形图反映了每个绩效领域对应回答所涉及发文数的平均值。白色菱形表明回答所涉的发文数在 10%的显著水平下显著不为零。

非T5 发文数在不同级别的职位晋升中都获得第三高的平均秩次。但是,当我们仅考虑取得终身教职和晋升副教授时,外部推荐信和非 T5 发文数的排名才与被引数的秩次显著不同。在线附录表O-A58 中,在晋升正教授这一项下的威尔科克森检验没能拒绝外部推荐信和非 T5 发文的秩次分布与被引数的秩次分布相同的原假设。其余的绩效领域在所有职位晋升类型中获得最低的四个平均秩次。在所有职位晋升类型中,教学绩效和成功获得拨款的平均秩次差异都是不显著的。著书数和在书中贡献的章节数在所有职业晋升类型中都排在最后。在以取得终身教职为目的这一背景下,进行长期且完整的研究与将资源集中在T5 发文上相比,前者的价值被认为低得多。

这些调查为 T5 发文对终身教职授予和晋升机制有着重大影响这一命题提供了重要的证据。但这些证据无法阐明T5 和非 T5 发文的影响力差别是否仅仅是文章本身影响力和质量的反映,也无法阐明 T5 是否是以独立于文章影响力和质量的形式发挥着影响力。但图12 给出了这个问题的答案。该图是一项调查结果的归纳,该项调查要求受访者在文章质量等同的情况下,比较拥有T5 发文和拥有非T5 发文时取得终身教职和成功晋升的概率。具体而言,这个提问对受访者呈现了一个思想实验,在这个实验中受访者必须想象出这样一个情景:受访者所属院系必须从两个候选人中挑选出一个授予终身教职或进行提拔。实验还要求受访者假设两个候选人在各方面都相同,除了其中的一个所有的发文都是 T5 发文, 另一个则有相同数量和质量的非 T5 发文。接着让受访者回答 T5 发文的候选人取代非T5 发文的候选人获得终身教职和/或得到晋升的概率是多少。如果 T5 的影响力是通过文章间影响力和质量差异实现时,那么 T5 和非 T5 候选人获得终身教职和/或得到晋升的概率应该都为 0.5。如果 T5 候选人的概率有任何对 0.5 的正偏离,那么就表明 T5 以某种独立于文章质量的形式发挥着影响力。

图 12:只有 T5 发文的候选人取代只有非 T5 发文的候选人获取终身教职或晋升的概率(在其他条件相同的情况下)

注:该图归纳了在其他相同的情况下,受访者对在自身所属院系中拥有 T5 发文的候选人取代拥有非 T5 发文的候选人而取得终身教职或晋升的概率的主观评估。受访者对回答根据不同职位晋升类型分类:获得终身教职,升为副教授,升为正教授。条状图代表的是在每种绩效领域中,受访者回答的概率的平均值。白色的菱形表明在 10%的显著水平下,平均概率显著不同于 50%。

图 12 绘制的结果显示了 T5 候选人的概率对 0.5 存在着明显且统计上显著的正偏离。这种偏离存在于所有院系排名组中,并且也存在于全部的三种级别的职位晋升中:获得终身教职,升为副教授,升为正教授。该图绘制了不同学习排名组和不同级别的职位晋升对应的受访者所回答的概率平均值。在获取终身教职上,受访者回答的概率平均值在所有学习排名组中都大于或等于 0.89。因此,平均地来说,排名前 50 的院系中的初级教员认为他们所在的院系将在 100 次此类终身教职授予决定中,至少会将终身教职授予 T5 候选人89次。院系排名越靠后平均回答概率越高,且其峰值 0.93 出现在排名 31-40 的院系中。在升为副教授一组中,回答概率同样很高。升为正教授的平均回答概率较低且变异较高。

这些结果表明,在排名前 50 的院系中,初级教员普遍存在着这样一种认识——同样数量和质量的文章,是否发表T5 期刊和非T5 期刊上所获得的收益有着天壤之别。教员的认识来源于过去的终身教职授予和晋升决定,而过去的决定显然是偏好 T5 发文的。可以说, 如今的学术事业,就是对T5 发文的追逐。

————————————————

54 见莱讷尔和西维尔(Liner and Sewell,2009)对系主任们由于晋升和获取终身教职而产生的研究需求的调查。

55 该调查在设想中设置了三个目标:(i)确证我们对 T5 发文水平在终身教职授予对象选择上的影响力的实证结果;(ii)收集一些我们认为是重要因素的数据,例如教学绩效、外部推荐信等无法在工作经历数据中观察到的数据;然后(iii) 为初级教员提供一个表达的机会,用以表达他们对当前终身教职授予和晋升机制对他们自身和对整个学科所造成的影  响(积极或消极)的看法。

56 我们注意到这项调查提前地中止了,这是因为有一些我们试图纳入样本中的个人向伦理审查委员会进行了投 诉。这些投诉主要是出于担心自己的身份会被我们的调查协议暴露——尽管我们保证了每个人都是匿名。这类无回答的根源直接导致了低应答率。而除非之前的受访者都别有用心,并且在同一大致方向上产生偏误,否则低应答率并不必然地产生偏误。

57 终身教职一组的样本容量为 306 个受访者。升职组的样本容量要小一些,因为这些排序被分到了不同的受访者类别之中:升为副教授这一排序组的数据只能来源于现任助理教授,升为正教授排序组数据只能来源于现任副教授。采用这种形式的样本约束的原因有两个。首先,它确保了回答是及时有效的,因为只就教员当前正努力获取的职位晋升种类进行调查。其次,通过将受访者负担从列出 3 种排序方式下调到 2 种,完成调查的概率得到了提高。

58 各类职位晋升的排名成对检测见在线附录表O-A56–O-A58。

4 作为质量筛选机制的T5 

对第 2 节的分析建立了排名前 35 的院系中终身教职的授予与T5 发文数之间的密切关系。对第三节的分析表明,初级教员们敏锐地意识到了T5 的力量。本节的分析对 T5 在研究影响力和质量的筛选作用方面进行了评价。在 4.1 节,我们用被引数代表影响力,将单个期刊的被引数分布与 T5 期刊整体的被引数分布进行了比较。第 4.2 节则比较了最具影响力的论文在 T5 和非 T5 期刊上发表的比例。4.3 节是基于影响因子对 T5 和非 T5 期刊进行的比较。4.4 节在经济学的 14 个主要领域中对具有影响力的经济学者的发文选择进行了考察。

4.1 T5 和非 T5 杂志的被引数对比 

    本节将比较T5 期刊与其他 25 本期刊在 2000 年到 2010 年这十年间发表文章的累积被引用数(截止到 2018 年)。这一节的对比以哈默梅什(Hamermesh ,2018)的分析为基础,他比较了T5 期刊和《经济学与统计学评论》(RESTAT)以及《经济学杂志》(EJ)的被引数。通过将非 T5 期刊的范围扩大到 25 种期刊,以及分析更广泛和更近的时间段(我们所分析的是 2000-2010 年的数据,而哈默梅什(2018 年)的数据来自于1974-75 以及 2007-08)发表的文章,我们扩充了他的分析。[59]我们的结论证实了他的发现。除了T5 内部存在着很大的被引数差异之外,在 T5 中发表的论文与在RESTAT 和EJ 上发表的论文在被引数上甚至还有部分相同。我们扩展的期刊类别有助于识别另外六种非 T5 经济学期刊,它们至少有与EJ 和与T5 部分相同的被引数。通过对被引数相同的非T5 期刊和T5 期刊进行比较分析,我们得出了结论。我们发现,当人们关注于较少引用的T5 期刊时,T5 和非T5 期刊的可比性大大提高了。例如,在T5 文章当中, RESTAT 杂志中位被引数对应的文章被引数排名经过年度调整后,与所有T5 文章相比,其引用数为38;但当它与本刊发表的文章相比时,它仅获第 58 名的排名。这些对比表明了组成 T5 的期刊在影响力上存在着较大异质性。

    由于缺乏一个更好的衡量标准,我们对期刊和文章质量的比较依赖于被引数。然  而,相较T5 文章,被引数这一指标更可能低估了非T5 文章的质量,因为对于T5 上的文章而言,“层次就是高’这一长期且根深蒂固的看法无疑会增加T5 文章的知名度,从而提升了其被引数。只要这种(声誉)差异存在,即使在文章质量相同的前提下,T5 文章也会比非T5 文章吸引更多引用这一说法是说得通的。如果这种偏好确实倾向于 T5 文章,那么以被引数为指标将低估非T5 文章的质量,从而低估T5 与非T5 刊物之间的可比性。[60]另外,除去质量因素,T5 这类主题无所不包的广谱性期刊能够比那些专注于某一领域或专题的专业期刊吸引更多的引用,这仅仅是因为广谱性期刊的受众比后者更为广泛。

4.1.1 和 T5 总分布的比较 

图 13 中的点状图表示,我们分析的 30 本期刊中的每一本在 2000-2010 年刊登文章的(被引数+1)的残差分布。[61]每类期刊的分布都与一个阴影表示的分布重叠,后者代表2000-2010 年在T5 发表的所有文章的被引数残差分布。残差是通过估计(被引数+1)对年数三次多项式进行 OLS 回归获得的,该年数是自发表到 2018 年(统计被引数的年份)之间的年数。[62]为了使结果看起来更明显,残差对被引数的 log 值进行了调整,并产生了一种可用于比较任意刊物分组中文章的表现同时结果明显的度量。[63]

标签为 T5 的子图显示,与非 T5 文章相比,QJE 文章的被引数分布有一个十分显著的向右移动。QJE 残差的中位数与所有T5 文章的残差分布对比显示,在引文残差方面,中等引用数量的 QJE 在所有 T5 文章中排在 71%。[64]在被引数的中位数排名方面,紧随 QJE 之后的是AER,JPE,ECMA 和 ReStud,其中 ReStud 的引文中位数在T5 文章中位列 31%。 

图 13:2000—2010 年发表论文的 Log 被引数的残差分布图(2018 年 7 月统计) 

资料来源:Scopus.com(全世界最大的摘要和引文数据库——译者注); 访问时间:2018 年 7 月

期刊缩写含义:QJE–经济学季刊,JPE–政治经济学杂志,ECMA–计量经济学,AER–美国经济评论,ReStud–经济研究评论,JEL–    经济文献杂志,JEP–经济展望杂志,ReStat–经济学与统计学评论,JEG–经济增长杂志,JOLE–劳动经济学杂志,JHR–人力资源杂志,EJ–经济学杂志,JHE–卫生保健经济学杂志,ICC– 产业和公司变革,WBER– 世界银行经济评论, RAND–兰德经济学杂志, JDE–发展经济学杂志, JPub–公共经济学杂志,JOE–计量经济学杂志,HE–卫生经济学, ILR–劳资关系评论, JEEA–欧洲经济学会杂志,JME–货币经济学杂志,JRU–风险与不确定性杂志,JInE–产业经济学杂志, JOF–金融杂志,JFE–金融经济学杂志, ReFin–金融研究评论,JFQA–财务定量分析杂志,以及 MathFin–数理财政学。 

图 13 中标记为期刊 6-10 的子图则描绘了具有最高被引中位数的五个非 T5 经济学期刊的被引数残差分布。在非 T5 期刊中,最高的被引数出现在调查类期刊(survey journals)。与T5 分布相比,JEL 的分布呈现出明显的向右偏移。在线附录表 O-A31 表明,就被引数残差而言,JEL 中其中位引用数对应的文章排在 T5 文章中的 70%,这比 QJE 文章的排名低了1 个百分位。排在JEL 之后的是JEP,它的中位引用文章在 T5 分布中居于中间位置。凭借在所有 T5 引文中排在 38%的中位被引数,ReStat 在非调查类经济学期刊中排名第一。同时,它的排名比 ReStud 高出 7 个百分位,并且仅比 ECMA 低 3 个百分位。JEG 在五个被引用程度最高的非T5 期刊中处于中间位置,它自己的中位引用文章排在 30%,类似地,JOLE 排在 25%,而JHR、JHE 和 ICC 则并列 24%。[65] 

正如前文所指出的那样,金融已经成为经济学的一个重要分支。正如我们预判的那样, 金融类期刊有自己独特的活力。它们比非 T5、非调查类经济学期刊有着更高的被引数。JOF 是金融期刊中被引用得最多的期刊,其中位引用文章在 T5 文章中排在 61%。紧随其后的是JFE 和 ReFin,二者的中位被引数都在 ECMA 和 ReStud 之上。

4.1.2 和不同 T5 子集的比较 

    前面给出的对比表明,T5 期刊里各刊物的被引数不尽相同。QJE 有最多的中位被引数,排在其后的是 AER,JPE,ECMA 和 ReStud。鉴于 T5 内部存在的这种异质性,本节将研究:随着我们逐渐增加对对照组的限定,直至对照组中仅包含较少被引用的 T5 文章时,非 T5 文章的相对表现是如何变化的。在线附录表O-A32 提供了包含这些对比的一张表格。[66]结果表明,当比较不包括被引数较高的 T5 期刊时,非 T5 期刊的相对表现会大大提高。因此,虽然 ReStat 的文章在整个T5 分布中仅排在 38%,但是当对照组仅限于 JPE,ECMA 与 ReStud 时,其排名提高到了 40%。随着对照组的进一步限定,ReStat 的表现继续提升,其中位被引数对应的文章排名超过了ECMA 和 Restud 分布中的中位被引数对应的文章组合。

我们所记录的其他非T5 期刊的相对表现也出现了类似的提高。在对T5 整体分布的比较中,ReStat 和JEG 是在T5 分布中唯一达到或超过 30%的非 T5 且非调查类期刊。当对照组被限定为JPE,ECMA 与 ReStud 时,排名达到或超过 30%的期刊增加到了 8 个;当仅与ReStud 比较时,期刊数为 16 个。 

4.2 有影响力的研究论文发表在哪些期刊上? 

本节将对T5 和非T5 中各个期刊在 2000 至 2010 年期间发表的有影响力的文章数量进行比较。为了继续进行研究,我们用前面几节中计算得到的被引数残差值将 30 种经济学期刊的文章基于文章表现分为四个组:具有前 25%,前 10%,前 5%和前 1%的被引数残差值的文章。然后,我们计算了 30 家经济学期刊中每种期刊所发表的文章在各个表现组中的比例。表 2 显示了根据未调整比例的 30 家期刊排名。

AER 在这些排名中占据突出地位,除了前 1%组之外,它在每个表现组中文章的占比都最高。QJE 在前 25%,10%和 5%的组别中排名第二,在前 1%组中排名第一。除了前 25% 组,AER 与 QJE 的文章在每个引用组中的占比加起来为 30%强(他们的文章在前 25%组占23.5%)。其他 T5 期刊在有影响力的文章贡献方面略逊一筹。[67 ]

非T5 非调查类期刊也发表了许多具有影响力的文章。JOE,ReStat 以及 JEG 共占被引数残差值的前 1%组中全部文章的 13.6%。这三种期刊的贡献不仅在绝对数量上是显著的,并且在和T5 比较的相对层面也是显著的。这三种期刊都比ReStud 贡献了更多的前 1%文章,其中的两种期刊比 JPE 贡献了更多前 1%文章,而剩下的一种期刊贡献的前 1%文章与JPE 一样多。ReStud 被另外六种非 T5 非调查类期刊所超越。这些期刊对前 1%组贡献了 16%。而在其余的三个组中,非T5 非调查类期刊的贡献依然显著。在前 5%组中,最具影响力的五种非调查类期刊共计贡献了本组中 20%的文章。前 10%组和前 25%组中五种最具影响力的非T5 期刊分别贡献了各自组中 19%和 24%的文章。

表 2:2000 至 2010 年间各个期刊发表的具有影响力文章数量的未经调整的比例 

资料来源: Scopus.com; 访问时间:2018 年 7 月

注:此表列出了没有依据刊载文章总量对不同期刊发表的被高度引用文章的进行调整的比例。

期刊缩写含义:QJE–《经济学季刊》,JPE–《政治经济学杂志》,ECMA–《计量经济学》,AER–《美国经济评论》,ReStud–《经济研究评论》,JEL–《经济文献杂志》,JEP–《经济展望杂志》,ReStat–《经济学与统计学评论》,JEG–《经济增长杂志》,JOLE–《劳动经济学杂志》,JHR–《人力资源杂志》,EJ–《经济学杂志》,JHE–《卫生保健经济学杂志》,ICC–《产业和公司变革》, WBER–《世界银行经济评论》, RAND–《兰德经济学杂志》, JDE–《发展经济学杂志》, JPub–《公共经济学杂志》,JOE–《计量经济学杂志》,HE–《卫生经济学》, ILR–《劳资关系评论》, JEEA–《欧洲经济学会杂志》,JME–《货币经济学杂志》,JRU–《风险与不确定性杂志》,JInE–《产业经济学杂志》, JOF–《金融杂志》,JFE–《金融经济学杂志》, ReFin–《金融研究评论》,JFQA–《财务定量分析杂志》,以及 MathFin–《数理财政学》。 

到目前为止,我们的讨论集中于每种期刊在最具影响力文章上的绝对产出上。AER 发表的论文数量至少是排名第二的T5 期刊的两倍。因此,通过比较每种期刊发文的绝对量来比较贡献大小的确是能够提供一些信息的。表 3 给出了根据刊载文章总量进行修正的表2 的调整版本。[68]为了说明(对引用组)贡献概率的增加与更多的发表文章数量有关,该调整削减了AER 等高发文量期刊的贡献。

数量调整导致所有引用组内的期刊重新排序。AER 的排名(不同引用组中不同)从未经调整时的第一或第三,掉到了调整后的第三或更低名次。调整增加了 QJE 和JPE 的贡献比率,反映出这些期刊的发文量低于AER。虽然贡献比例的增加提高了这两种期刊的总体地位,但由于其他期刊(例如JEL)的贡献比例增幅更大,所以它们在所有分组中的排名未能得到提升。对于ECMA 而言,这种调整是负面的,它在前 25%、前 10%和前 5%组中的排名均跌至第六位。ReStud 在前 25%和前 10%组的排名则有所提升,不过尽管进行了数量调整,它在前 5%和前 1%组的排名仍未受到影响。 

表 3:2000 至 2010 年间各别期刊发表的具有影响力文章数量的调整比例  

资料来源: Scopus.com; 访问时间:2018 年 7 月

注: 该表显示了依据刊载文章总量对不同期刊发表的被高度引用的文章数量进行调整后的比例。调整后的比例按照公式 1 计算。

期刊缩写含义:QJE–《经济学季刊》,JPE–《政治经济学杂志》,ECMA–计量经济学,AER–《美国经济评论》,ReStud–《经济研究评论》, JEL–《经济文献杂志》,JEP–《经济展望杂志》,ReStat–《经济学与统计学评论》,JEG–《经济增长杂志》,JOLE–《劳动经济学杂志》, JHR–《人力资源杂志》,EJ–《经济学杂志》,JHE–《卫生保健经济学杂志》,ICC–《产业和公司变革》, WBER–《世界银行经济评论》, RAND–《兰德经济学杂志》, JDE–《发展经济学杂志》, JPub–《公共经济学杂志》,JOE–《计量经济学杂志》,HE–《卫生经济学》, ILR–《劳资关系评论》, JEEA–《欧洲经济学会杂志》,JME–《货币经济学杂志》,JRU–《风险与不确定性杂志》,JInE–《产业经济学杂志》, JOF–《金融杂志》,JFE–《金融经济学杂志》, ReFin–《金融研究评论》,JFQA–《财务定量分析杂志》,以及 MathFin–《数理财政学》。 

在非T5 非调查类期刊中,JEG 的增幅最大,其在所有引用组中的排名均位列前七。ReStat 的排名有所下降。然而,它在各引用组中仍保持着影响力。EJ 和JOE 的排名在经历调整后都有所下降。

从表 1 和表 2 中的排名得到的主要结论是,因为非T5 非调查类期刊发表了大量具有影响力的经济学研究成果,所以其表现常常优于一些影响力较小的 T5 期刊。无论是考虑其贡献的绝对数量或单位文章的贡献,它们对学科的影响力都是显而易见的。

4.3 T5 并非经济学领域中影响因子排名前五的期刊 

表 4 列出了滞后(2 年;5 年;…,20 年)影响因子,最长的滞后表示期刊的持续贡献(20 年间的被引数)。在T5 中,只有QJE 在任何列出的年份都具有名副其实的T5 影响,并且在除 10 年滞后外的所有滞后影响因子组中都位列第一。金融类期刊有着更高的影响因子,这反映出该领域专业人员的规模。短期(2 年)影响较大的期刊通常不会长期保持其排名。这也就是说,T5 排名的基础——用被引数最高的文章给期刊贴上 T5 的标签——是有缺陷的。只有 QJE 的地位才名副其实。 

与自然科学类期刊相比,经济学期刊影响的范围显得微不足道(见在线附录表 O- A34)。该表中列出的六种主要期刊中,任何一种期刊的两年影响因子均超过了任何经济学期刊。例如就排名第四的《科学》而言,其两年和五年影响因子均在 41 左右。同样值得注意的是,《美国科学院院刊》——该杂志也是许多经济学者发表重要论文的一个渠道,但却不在T5 评估的范围之内,而其影响因子与排名最高的经济学期刊相当。

表 4:使用 2017 年被引用数据所构建的并根据第 5 年的影响因子排名进行排序的 25 种经济学期刊的 2、5、10,、15 和 20 年的影响因子 经济学季刊      

资料来源: Scopus; 访问时间:2018 年 7 月.

注:该表列出了 15 种不同期刊的 2,5,10,15 和 20 年影响因子 。影响因子是利用 2017 年增加的被引数计算得出的。该表还给出了分别对应五个影响因子的五种不同的期刊排名。 

影响因子的定义:对于任何特定期刊,截至 2017 年的 x 年影响因子被定义为,2016-x 年至 2016 年期间期刊发表的所有文章于 2017 年累计获得的被引总量除以同一时间段内期刊的文章总量: 

4.4 那些有影响力的经济学家在哪发文? 

本节探讨了有影响力的经济学者在专业领域发表文章的期刊。我们使用 RePEc 的各个领域作者排名编制了一份在 14 个专业领域[69]中最具影响力的 50 位作者[70]的名单。我们分析了 50 位各领域顶尖作者的发文历史记录,以确定占据其发文总数最大份额的期刊。

我们使用 EconLit[71]获取每位作者在 1996 至 2017 年间发表的文章名单。我们进一步使用了卡德和德拉·维格纳(2013)的分类办法,根据 EconLit 数据中包含的JEL 代码将文章分配至不同的领域。[72]这种分配产生了与 14 个特定领域中的作者们一一对应的 14 个发文名单,其中每个发文名单仅包含被识别为与作者的专业领域相关的期刊文章。

在线附录表O-A40 列出了未调整的各领域期刊的发文量排名,排名标准是 f 领域的50 位顶尖作者撰写、发表的f 领域文章在各个期刊中所占的比例。该表列出了在发文中所占份额最大的十本期刊的排名。排名显示,各个领域的顶尖作者在 AER 或非T5 专业领域期刊上发表的各自领域的文章数量最多。除了在计量经济学和微观经济学中排名第三的 ECMA 外,其余四个T5 期刊在任何领域都没有进入前三名。这些例子表明,在经济学的主要专业领域工作的一流经济学者将他们大部分的专业论文都发表在了非 T5 期刊上。当我们按发文数份额对期刊进行排名时,非 T5 领域期刊的重要性变得更加突出。

表 5 中调整后的发文量排名显示,一旦调整了发文数量的差异,T5 期刊占各领域的50 位顶尖作者发表的专业领域文章数量的比例就会下降很多。[73]排名方式的不同很大程度上源于分配给AER 排名的不同。AER 由于其庞大的刊载文章总量而受到了相当大的削减。除AER 之外的T5 期刊的排名在不同的排名方式中都相当稳定。

表 5:1996-2017 年 50 位各领域的顶尖作者分列在特定领域文章中所占比例最大的期刊(按刊载量调整) 

注:调整后的比例是根据方程式 2 计算的。

期刊缩写含义:AEJae—《美国经济杂志:引用经济学》,AEJep—《美国经济杂志:经济政策》,AEJma—《美国经济杂志:宏观经济学》, AEJmi—《美股经济杂志:微观经济学》,AER—《美国经济评论》,AmJHealEc—《美国卫生经济学杂志》,BPEA—《布鲁金斯经济活动论文集》,CES—《德国经济信息研究会经济研究》,ClmCHGeC—《气候变化经济学》,EcHumBio—《经济学与人类生物学》;ECMA—《计量经济学》,ECMA—《计量经济学》(原文如此——译者注),EcPol–《经济政策》, EctJ–《经济计量学杂志》, EctRev–《计量经济评论》, EctT–《计量经济学理论》, EDCC–《经济发展与文化变革》, EducEc–《教育经济学》, EJ–《经济学杂志》, Empirica–《经验》, EnvDevEc–《环境与发展经济学》, EnvEcPol–《环境经济学与政策研究》, EnvResEc–《环境与资源经济学》, ExpEc–《经验经济学》, FedSTLRev–《圣路易斯联邦储备银行评论》, FinanzArchiv–《金融文献》, FiscSt–《财政研究》, FormHeaEcPol–《卫生经济学与政策论坛》, FrntEcChn–《中国经济前沿》, GAMES–《博弈论与经济行为》, HE–《卫生经济学》, IEJ–《国际经济学杂志》, IJIO–《国际产业经济学杂志》, ILR–《劳资关系评论》, IMFEcRev–《国际货币基金组织经济评论》, IndRel–《劳资关系》, InfEcPol–《信息经济学与政策》, IntFin–《国际财政》, IntJCentrBank–《国际中央银行杂志》, IntJFinEc–《国际财经杂志》, IntRevEnvResEc–《国际资源与环境经济学评论》 , ITPF–《国际税务与公共财政》, JAE–《应用计量经济学杂志》, JAfrEc–《非洲经济杂志》, JBES–《商业与经济统计杂志》, JDE–《发展经济学杂志》, JDemEc–《人口统计经济学杂志》, JEBO–《经济行为与组织杂志》, JEcMeth–《经济方法论杂志》, JEEA–《欧洲经济学会杂志》, JEG–《经济增长杂志》, JEL–《经济文献杂志》, JEMS–《经济与战略管理杂志》, JEnvEcMgmt–《环境经济学与环境管理杂志》, JET–《经济理论杂志》, JFinEcmt–《金融计量经济学杂志》, JFinServRes–《金融服务研究杂志》, JHE–《卫生保健经济学杂志》, JHR–《人力资源杂志》, JHumCap–《人力资本杂志》, JIE–《国际经济学杂志》, JIMF–《国际货币与金融杂志》, JIndCmpTr–《产业、竞争与贸易杂志》, JInE–《产业经济学杂志》, JIntComEcPol–《国际商务、经济与政策杂志》, JJapIntEc–《日本与国际经济杂志》, JLawEcOrg–《法学、经济学与组织学杂志》, JMCB–《货币、信贷与银行杂志》, JME–《货币经济学杂志》, JOE–《计量经济学杂志》, JOLE–《劳动经济学杂志》, JPE–《政治经济学杂志》, JPop–《人口经济学杂志》, JPub–《公共经济学杂志》, JRU–《风险与不确定性杂志》, LabEc–《劳动经济学》, NTJ–《国家税收杂志》, NZEcPap–《新西兰经济论文》, OpEcRev–《开放经济评论》, OxES–《牛津经济学与统计学通报》, OxRevEcPol–《牛津经济政策评论》, PubFinRev–《公共金融评论》, QJE–《经济学季刊》, RAND–《兰德经济学杂志》, REnvEcPol–《环境经济学与政策评论》, ResEnerEc–《资源与能源经济学评论》, ReStat–《经济学与统计学评论》, ReStud–《经济研究评论》, RevEcDsgn–《经济学建构评论》, RevIntEc–《国际经济评论》, RevIO–《产业经济评论》, RevWrldEc–《世界经济评论》, RschInEc–《经济研究》, SthEcJ–《南部经济杂志》, WBER–《世界银行经济评论》,WBRschObs–《世界银行研究观察者》, WrldEc–《世界经济》, WrldTrdRev–《世界贸易评论》  

资料来源: RePEc, EconLit. 

表 6:在不同专业领域内排名前二的期刊中,被 2010-2017 年间发表的文章引用最多的期刊(排名使用了 1996-2017 年期间发文的引文数据;并根据被引期刊的发文量进行了调整)

注:该表列出了经调整的期刊刊载量(被引用期刊的数量)排名,这些期刊获得了九个不同专业领域内排名前二的专业期刊的最多引用。该表的九个专业领域与我们在表 O-A9 中历史数据分析的分类和使用是一样的。此表中使用的九个领域与我们分析工作历史数据时使用的相一致, 并在表 O-A9 中进行了分类。排名的构建分三个步骤进行。首先,按照定义,领域内的前 2 期刊由库姆斯和林内默(2010)的特定领域排名中获得最高排名的两个期刊组成(表 O-A9 的列名“A 级领域”表示了按照领域列出的前 2 期刊)。其次,我们对获得 2017 年前 2 专业期刊引用的文章中,引用了前 2 期刊的文章比例进行加权计算,并根据前者所属期刊的年度发文量进行数量调整。由于 1996 年以前的数据不可用,这一比例仅使用了 1996 至 2017 年期间发表的文章被引量。最后,根据在步骤 2 中构建的每个特定领域所占的比例,将期刊在领域内进行排名。本表使用步骤 1-3 中构建的特定领域所占比例来表示各领域内被前 2 期刊引用最多的 10 个期刊。

期刊缩写含义:AEJae—《美国经济杂志:应用经济学》;AEJep—《美国经济杂志:经济政策》;AEJma—《美国经济杂志:宏观经济学》;AER—《美国经济评论》;Annstat—《统计年鉴》;BPEA—《布鲁金斯经济活动论文集》;ECMA—《计量经济学》;EcT—《经济理论》;Ectj—《计量经     济学杂志》;EctRev—《计量经济学评论》;EctT—《计量经济学理论》;ExpEc—《实验经济学》;FoundTrFin—《金融基础与趋势》;GAMES—《博     弈与经济行为》;HE—《卫生经济学》;HtlhServRes—《卫生服务研究》;IJGT—《国际博弈论杂志》;IJIO—《国际工业组织杂志》;JAE—《应     用计量经济学杂志》;JASA—《美国统计协会杂志》;JAccEc—《会计与经济杂志》;JBES—《商业与经济统计杂志》;JDE—《发展经济学杂志》;JEG—《经济增长杂志》;JEL—《经济文献杂志》;JEMS—《经济与管理战略杂志》;JEP—《经济展望杂志》;JET—《经济理论杂志》;JFE—《金     融经济学杂志》;JFQA—《金融与量化分析杂志》;JFinInterm—《金融中介杂志》;JFinMkt—《金融市场杂志》;JHE—《卫生保健经济学杂志》;JHR—《人力资源杂志》;JInE—《产业经济学杂志》;JLawEcon—《法学与经济学杂志》;JMCB—《货币、信贷与银行杂志》;JME—《货币经济学杂志》;JOE—《计量经济学杂志》(瑞士);JOF—《金融杂志》;JOLE—《劳动经济学杂志》;JPE—《政治经济学杂志》;JPub—《公共经济学杂志》;QJE—《经济学季刊》;RAND—《兰德经济学期刊》;RED—《经济动态评论》;ReFin—《金融研究评论》;ReStat—《经济学与统计学评论》;ReStud—《经济研究评论》;SocChWelf—《社会选择与福利》;WBER—《世界银行经济评论》 

4.5 被(五大顶级期刊)遗忘的经典 

表 14:过去 10 年和过去 20 年,在不同期刊中被引量最高的 RePEc 文章的比例。(已根据刊载量调整) 

资料来源:RePEc

该图使用了随时间推移所有经济学文章中位于前 1%的 RePEc 排名,以显示在不同期刊上被引量最高的文章所占的比例。每张子图都分为期刊的个别和合计两部分。合计部分显示的是经刊载量调整后,由(i)T5 期刊(ii)卡拉齐达基斯等人(Kalaitzidakis et al. (2003))归纳的 T10 期刊(A 类)(iii)科德尔齐基和 Yu(Kodrzycki and Yu (2006))归纳的从 T10 期刊(B 类)到 T10(iv)以及非 T5 期刊所占份额。T10 期刊 A 类包括原有的 T5 期刊还有《经济学理论杂志》,《计量经济学杂志》,《计量经济学理论》,《商业与经济统计杂志》和《货币经济学杂志》。T10 期刊 B 类包括 T5 期刊和《经济学理论杂志》,《计量经济学杂志》,《财经杂志》,《金融经济学杂志》和《金融研究评论》。横轴上的标签对应的是:JEL—《经济文献杂志》,QJE—《经济学季刊》,ECMA—《计量经济学》,ReStat—《经济学与统计学评论》,JAE—《应用计量经济学杂志》。EEA—《欧洲经济协会杂志》,JEP—《经济展望杂志》,AER—《美国经济评论》,JOE—《计量经济学杂志》(瑞士),JFE—《金融经济学杂志》, JME—《货币经济学杂志》。 

T5 排除了大量有影响力的论文。图 14a 和图 14b 分别记录了在过去十年和过去二十年,RePec 中被引量最高的中有超过 70%的文章是在非 T5 期刊上发表的。在前 20 篇引用最多的论文中,有 35%的论文是没有在五大期刊上发表的。(详见表 O-A49)。被引量最高的非 T5 论文列表读起来宛如一份经济分析的荣誉册。(详见表 7,表 O-A47 和 O-A48)。不仅很多经典文章没有出现在T5 上,并且T5 标准也忽视了书籍的出版。贝克尔(Becker)的《人力资本》(Human Capital,1964)被引次数要比 RePEC 上任何一篇论文的多四倍不止。[74]将书籍的被引量排除在外,这将会更多激励人们写一些简短的观点片段,而不是做一些广泛和综合的研究。

表 7:RePEc 排名中被引量最高的前 10 非T5 论文 

2017 年的诺贝尔经济学奖得主理查德·塞勒(Richard Thaler)就是体现 T5 保守主义的一个典型例子。他的研究与主流经济学背道而驰,因此多年来都没有在 T5 期刊上发表论文(详见在线附表 O-A51)。在一个又一个的经济学分支中,这种保守主义模式被不断地重复着。真正的创新性论文常常无法经受住那些以常规科学而不是新颖科学为标准的主流评稿人和编辑们冷漠而狭隘的筛选。

————————————————

59 我们选择的时间段必要地排除了任何对新美国经济学会应用期刊影响力的分析,它从 2009 年开始出版刊物。

60 T5 期刊在专业领域中是口碑最好且最流行的期刊。在分析了对 92 位经济学者的一项调查的结果后,霍金斯等人(Haekins et al.,1973)证明 AER,ECMA,JPE 和QJE 是 60 年代末 70 年代初四大最受欢迎的期刊。(ReStat 排在第五位,Restud 排在第六位)。这四大期刊的流行优势持续了很长时间。阿克萨拉格鲁和西奥哈拉基斯(Axarloglou and Theoharakis(2003))得出了与霍金斯等人(1973)同样的结论,即 AER,ECMA,JPE 和QJE 依然被认为是 21 世纪初期最具影响力的期刊。学者们是如此偏好从他们认为质量和影响力最高的期刊中引用文章,以至于我们可以预料他们对于非 T5 期刊有着负面偏见。换言之,由于 T5 文章更牛这一观念已经在人们心中长期存在并且根深蒂固,T5 在持续保持着文章质量及其与引文作者作品的相关度的同时,获得了更多的引用。

61 与哈默梅什(2018)所做的研究类似,我们排除了编辑们的笔记、评论、报道,以及在AER 论文和议事录的年度事件栏目发表的论文。我们也将篇幅不足 10 页的论文排除在外。

62 在线附录表O-A33 表示,被引数残差的中位数对比(T5 平均水平与个别杂志之间)使用了从四种不同设定中获得的残差值。前三栏表示使用从ln(被引数)+ 1 的OLS 获得的残差,分别对曝光年份的一、二、三次多项式进行比较。最后一栏使用从估计 ln(被引数)+1 获得的残差作为明显指标的函数。得到的结果符合我们的设定。

63 目前的分析侧重于对年度调整度量的比较。感兴趣的读者可以参考在线附录图O-A24 到O-A26 中类似的图,这些图分别是 2000,2005 和 2010 年发表的文章。

64 各个期刊的被引中位数与T5 的引文分布的比较,见在线附录表O-A31。

65 图 13 中接下来的三幅子图按照中位被引数的降序给出了其余 15 个经济学期刊的分布。这些期刊中的前六个在全部

T5 文章中中位被引文章排名都至少高于 20%。

66 第一列给出了 30 种期刊各自在T5 总分布中的中位引用残差的百分比排名。每从左至右依次增加一列,就按照中位引用降序排列从对照组中剔除一种T5 期刊。

67 除去前 1%组,JPE 与ECMA 的排名差距都在一个百分点以内。另一方面,ReStud 不仅排名远低于其他四种T5 期刊,而且在全部的四个分组中还被许多非T5 期刊所超越。ReStud 作为T5 中的一个异常值,它的出现与之前几个部分得到的结果相一致,这些结果表明ReStud 中的文章的被引数残差的中位数排在全部 T5 文章的 31%。

68 排名基于每个引用组的数量调整后的比例,其中引用组b 中期刊j 的调整比例计算如下:

其中,Nb 是引用组 b 中的文章总数, Cj,y,b 是在 y 年期间期刊j 发表的所有的满足可被纳入b 组的文章的被引数条件的文章数量,vj,y  是在 y  年期间期刊j 发表的文章数量,而Vy  是本研究所涵盖的 30 种经济学期刊于 y 年度发表的文章总量, (vj,y/Vy) 项是一个特定年份的数量调整,它利用给定年份的刊载量的倒数对每种期刊的贡献进行加权。

69  这些领域包括人口经济学、发展经济学、经济计量学、环境经济学、实验经济学、金融学、卫生经济学、国际金融、国际贸易、产业经济学、劳动经济学、宏观经济学、微观经济学和公共经济学。

70.在线附录表O-A43 到O-A46 给出了各个邻域内排名前 50 的作者。因为 RePEc 的排名中金融学和产业经济学领域的作者人数不足 50,所以名单中这两个领域的作者人数都不足 50。

71 美国经济学会经济学全文数据库,译者注。

72 我们对卡德和德拉·维格纳(2013)的分类方案作了以下修改:(i)将劳动经济学类别划分为劳动(JEL 代码 I2 和J(J1 除外))和人口经济学(JEL 代码J1);(ii)新增环境经济学为一个领域(JEL 代码Q5);(iii)将国际经济学分为国际金融(JEL 代码 F3、F4 和F65)和国际贸易(JEL 代码 F1 和F4);(iv)将城市经济学从卫生和城市经济学类别中移除,以生成一个新的类别:卫生经济学(JEL 代码I0 和I1)。其余领域的划分方法与卡德和德拉·维格纳(2013)一致。

73 表 5 列出了加权排名,其排名依据是某特定领域f 发文总量经调整后的比例:

其中 是Nf 领域的 50 位顶尖作者在 1996-2010 年期间发表的特定于f 领域文章的总数,是f 领域的 50 位顶尖作者在期刊上发表的特定于f 领域的文章总数。

74 有关这些被忽略的经典的详细内容,见表格O-A50。

5 开放度与近亲繁殖 

 图 15:1996-2016 年编辑的任期年数密度图 

资料来源:Brogaard, Engelberg & Parsons (2014) 论文中截至 2011 年的数据。随后几年的数据来自于期刊的头版。

注:该图显示了 1996 年至 2016 年间各期刊编辑任期年数的密度。 

垄断限制福利,寡头垄断也半斤八两。而开放和进入则能促进生产力的提高,创造力的增加和新思想的碰撞。据卡德和德拉·维格纳(2013)记载,T5 论文刊载量的减少是因为其版面供应是固定的,而单篇论文的篇幅更长了。对期刊容量的需求大大增长,然而期刊的供给是固定不变的。[75]这就创造出了一个更具竞争力的环境——在固定的常规考核期约束下——这意味着作者在 T5 发文的成本和精力随着发文成功率的下降而越来越高。对于这种现象有两种理解,一种是论文的平均质量提升了,另一种是更有价值的时间和精力被投入到为迎合某些编辑们的口味而专门“特制“文章了。据埃利森(2011)记载,顶尖学者们在 T5 期刊上发表的论文越来越少。这种现象削弱了T5 的品质认知度和声誉价值。 

除了因出于个体理性激励作者去讨好编辑之外,编辑任期之长也是另一个普遍的现象,特别是在内部期刊(house journals.。专业协会通常会限制编辑的任期,但内部期刊对此较为宽松。内部期刊会持续多年任用符合它们特殊偏好的编辑(见图 15),而编辑的长任期会不可避免地产生一种体现编辑们的研究风格和专业兴趣的本刊文化。基本的经济学激励理论告诉我们,准作者们会结交这些编辑并迎合他们的突发奇想。这种追随者效应是任何期刊都不可避免的特性。非内刊中编辑人员的更替减少了这种弊端,但内部期刊则不太可能提高人员流动性。

这种做法不可避免地导致了近亲繁殖。表 8 测度了 T5 期刊的“近亲度”[76]。该表记录了 2000 至 2016 年间《美国新闻与世界报道》评出的排名前十的经济院系[77],以及纽约大学(排名 13)和伦敦大学学院(未被《美国新闻与世界报道》排名)的发文量占比。所显示的百分比是那些从属特定大学的学者在每一T5 期刊上发表文章的比例。JPE 与芝加哥大学的从属学者之间有着高达 14.3%的近亲系数,属于非内刊的 AER 和哈佛大学间的近亲系数较高,占其发文量的 11.9%[78]。最显著的是 QJE,与哈佛和麻省理工分别有 24.7%和 13.9%的近亲系数(其联合近亲系数超过 33%)。[79],[80]

如果大学的终身教职评定委员会太依赖于 T5 期刊,他们会放弃自己的责任。他们有效地将评估候选人的任务交给了T5 编辑,这将导致权利集中于少数编辑手中的潜在危险,使得原有的 T5 编辑系统内的规范准则易受潜在的偏袒和腐败的影响。

表 8:近亲度:按照作者所属机构分列的 2000 至 2016 年间T5 期刊的发文量 

资料来源:Elsevier, Scopus.com.

注:该表中,每一本  T5  期刊都有三列数据。最左边的一列呈现的是归属于各个大学的文章数量。中间的一列是发表在所列的顶尖学校附属期刊上的文章占该学校发表的所有文章的比例。最右边的一列则是期刊中归属于各顶尖大学的文章占该期刊里所有文章的比例。如果在某一特定年    份内一位作者在其论文中列出了所属机构,他/她就会被界定为和某一大学有近亲关系。如果一篇文章在某一年份内,该作者是属于某一学校机构的,这篇文章就被定义为与该学校机构有近亲关系。 

5.1 腐败还是内幕信息?

许多研究尝试通过考察文章的发表机会在多大程度上受作者与编辑之间关系的影响, 来判定经济期刊的编辑过程中是否有腐败产生。在分析了 28 本主要经济期刊于 1984 年(包括T5)发表的 1051 篇论文的数据后,拉邦和皮特(Laband and Piette ,1994)发现和编辑有关系的作者的文章确实更容易被发表。但平均来看,这些文章通常也有着更高的被引量。布罗加德等人(Brogaard et al.,2014)在分析了更广泛的样本——自 1955 年以来排名前 30 的经济和金融期刊发表的五万篇文章后,也得到了数量上相似的结果。他们认为,当期刊是由院系同侪担任编辑时,一个作者在该期刊上发文的数量是没有这种院系-编辑关系网时候的两倍。他们还发现,这些文章的平均被引量要比那些无关系的文章多出5%到 25%。这两项研究的作者得出结论,他们的研究结果使人们联想到一种潜在的现象,即那些希望文章影响最大化的编辑们辨别高潜力论文的方式,是利用其与作者间的关系网而不是腐败。他们推测由于获取有关系论文和无关系论文信息方式的异质性,编辑们在衡量认识的作者所写的论文质量时需要的成本更小,反过来,这也促进了关系网内作者论文的数量与质量同步提升。

虽然这些分析表明了顶尖经济期刊在编辑过程中的整体“健康”状况,但因为这只是对这些期刊分析的一小部分样本,但是这些分析的整体性——即基于仅一小部分的期刊样本的分析——使其无法研究T5 内是否存在编辑腐败盛行这一问题。评价这种依赖 T5 进行质量判断的制度后果时,我们只能说对 T5 内部的腐败一无所知,但我们不能否认腐败存在的可能性。

尽管我们对 T5 期刊中腐败的普遍性和严重性尚不明确,但上述结果仍具有重要意义。如果这些文献中的解释适用于T5 期刊,那么与T5 编辑委员会有联系的常任轨教员会比缺乏这种关系的同事更有优势。虽然从编辑的角度来看,根据他的关系网信息来寻求文章影响最大化是一个公平的做法,但从与编辑无关系的作者的角度来讲,这是不公平的,因为这些作者能否得到终身教职与 T5 编辑的决定休戚相关。正如我们所猜想的,T5 的编辑对无关系的作者是有偏见的。因此,基于现有的证据,无论这种偏见是否来自于公然的编辑腐败,还是如上述猜想,来自于编辑寻求高质量论文以求文章影响最大化的行为,[81]我们都必须考虑到那些与T5 编辑间缺乏关系的常任轨教员可能受到严重的关系偏见。

源于信息有效性的偏见已成为一种现实,而这种信息有效性与作者-编辑间的关系密切相关。并且,编辑在思想和方法论上的偏好对选稿的影响也与其相关。这种偏见既可以由编辑对审稿人的评估和撤销的方式有所影响来直接体现,又可以通过影响编辑所选的审稿人来间接体现。在有着思想和方法上的强烈偏好的情况下,期刊往往过多地发表了体现编辑喜好的文章。鉴于终身教职的授予高度依赖于 T5 发文量,这种偏见会对经济学的健康和未来产生深远的影响。

首先,通过减少不符合编辑偏好的常任轨教员在 T5 上的发文机会,这种偏见直接影响了终身教职学者队伍的构成。这将导致(编辑)关系网之外的学者在 T5 发文的数量不断减少,从而进一步降低了他们通过终身制教职考核的机率。

其次,强烈的编辑偏好也可能通过引导未来的常任轨教员只去做那些已知的会被该编辑所在期刊发表的研究,从而产生一种附加的间接影响。因此,对 T5 的依赖可能会促进未来研究方向的重大调整,特别是在编辑长任期的前提下。

————————————————

75 见在线附录表O-A30

76 克鲁西(2018)使用 2000 至 2006 年的引用数据对“四大”期刊(不包括 ReStud)进行了类似的分析。他对近亲繁殖的估算值要比我们的低:克鲁西(2018)发现在 2000 年到 2006 年,哈佛大学的教员占 QJE 发文的 15%,芝加哥大学教员占 JPE 发文的 10%。估计数量的差异有以下几个原因(1)所用出版期的差异(克鲁西采用的是 2000-2006 年的数据,而我们用的是 2000-2016 年的数据)(2)配分作者归属的策略差异。(我们根据作者在论文中所提供的所属院校来确定关联,而 Colussi 根据作者的简历中记录的就职数据来确定关联)这两种策略可能产生不同的结果,因为研究人员在研究最终发布时被聘用的机构(我们的策略所提到的从属关系)可能与其做研究时所属的机构研究人员不同(通过将出版日期与简历中的年度就职数据进行匹配来获取的从属关系)。

尽管估计数量存在着差异,由Colussi 的结果能够得出相同的结论:“ECA 和AER 似乎比QJE 和JPE 更开放,这表明了期刊对在其主办机构就职的作者的偏好。” 因此,这两组结果通过使用不同的策略、数据集和时间段进行相互补充, 得出了相同的相互证实的结论。

77排名前 10 的院系是根据US News2008,2010 和 2015 年的院系排行榜的平均值来确定。

78 芝加哥大学的职员仅占 7.7%。

79 某些论文有多位哈佛与麻省理工学院的作者,因此并没有把这些百分比加总起来。除了 AER 的哈佛大学教员之外,非内刊的百分比几乎没有显示出偏袒的证据。

80 我们不能把哈佛大学教员的 AER 出版比例相对较高归咎于近亲繁殖。因为在分析的时间段内,哈佛大学的教员并未在 AER 编辑委员会任职(详见在线附录表 O-A59)。事实上,数字 11.9%可以作为质量基准,以降低 QJE 的近亲度。

81 伯特西马斯、布林霍夫森、赖克曼和西尔伯霍兹(Bertsimas, Brynjolfsson, Reichman, and Silberholz,2015) 研究了(短期)关系网对于预测运筹学与管理科学方面未来的被引数的作用。他们的分析隐含地说明了成为关系网内成员的  重要性。关系网内的成员不仅促进了文章引用,而且传播了知识。Ellison(2011)提供了顶尖学者更依赖于互联网论坛的证据,这意味着在职权力并显示出公共科学图书馆(PLOS)系统的价值。详情请参阅 Eisen(2013)。

6、总结与讨论 

毫无疑问,能否在 T5 发表论文是能否获得经济学终身教职的一个决定性因素,这影响了年轻经济学家对论文主题的选择。他们更倾向于把论文压缩成一块符合期刊需要的压缩饼干,而不是烹制一份完整的学术佳肴。我们作者中的一位(赫尔曼)多年来曾经和很多人就一些有趣的科研项目进行过交流,其中不乏一流的研究生,博士后和助理教授,但他却总是被告知:“这是个好主意,但不会发表到 T5 期刊上”。 

一些颇有创意的“另类假说”往往都是一些选题宏大,数据密集的经验研究,但由于对发表T5 期刊论文的看重,学者研究这些项目的积极性往往受到挫伤,因为这些项目的成果相对于T5 期刊所提倡的 40 页论文格式来说实在是太长了。

对 T5 期刊的依赖导致权力被集中在到一个选定的编辑团队手中。同时,依赖 T5 期刊来筛选下一代经济学家,会鼓励行业的近亲繁殖并引发追随者效应。因此,以职业为导向的作者会刻意迎合编辑的口味和期刊的偏好,这提高了期刊及其编辑关系圈以外的新想法和人员的进入成本。[82] 

如果根据其产出能够持续获得被引数的文章的能力进行评判,目前的做法缺乏实证支持。据称,在假设(暂无证据支持)订阅者从头到尾阅读了每期刊物的前提下,T5 刊物对广泛的专业经济学家显示出论文的吸引力。该论点同时忽略了 T5 的审稿人本来就是领域内专家的这一事实。此外,即使是 T5 期刊,在众多经济学期刊中,其影响因子也并非最高,更不要说普通期刊了。很多非T5 期刊的被引数足以与T5 期刊分庭抗礼,特别是某些被引数较低的T5 期刊,比如《经济研究评论》和《计量经济学》。与此同时,那些采用 T5 标准体系评价他人的学者们自己并不遵循这一评价体系。他们阅读、发文和引用的主要阵地是非T5 期刊,还有那些通过了T5 筛选并成为了终身教员的学者们其实也同样如此。

依赖 T5 作为筛选机制引发了严重忧虑。首先,过分看重 T5 发文反而会激励学者以放弃创造性开拓性研究为代价而进行改进性和重复性的研究,因为后续改进的工作很容易评判,也更有可能得出简洁并可发表的结果,因此更有可能被发表。83这种行为与基本常识一致:激励即所得。

鉴于很多负面的、潜在的严重后果都与(人们)对 T5 刊物的依赖相关,我们认为,继续使用 T5 刊物作为衡量研究成果和预测未来学术潜力的标准是不明智的。T5 不足以预测个别文章的质量,更不用说预测个人的研究能力,需要改变是不言而喻的,更遑论 T5 还有明显的性别倾向。

我们的研究结果应引发一场认真的专业内讨论,即如何形成可行的替代方案用来评估研究质量。这样的解决方案既需要降低 T5 在常任轨授予和升任上的重要性,又需要把衡量和预测的功能分配给更多高质量的期刊。84例如,有限的证据表明 AEJ(Applied Economics) 就在和 Restat 及EJ 的竞争中处于优势。 

但是,对 T5 专制的一个合适的解决方案可能不仅仅只是对 T5 阵营重新定义,如包容一些其他有影响力的期刊。依赖少数选定期刊的发表记录来判断学者在创新研究潜力这一操作有其根深蒂固的缺陷,更好的解决方案要能够弥补这一缺陷。

在这个问题上,阿克洛夫(Akerlof ,2018))对依靠外部排名而不是论文的个人阅读量的这一做法敲响了警钟。这个问题适当的解决方案还需要人们从当前以出版为基础的常任轨授予制度,转变为强调系内同行来评审候选人工作成果的制度。这样一个制度会考虑到一个学者未发表的工作论文以及该学者研究的系统性和质量。通过审慎对待一个学者已发表和未发表的论文,而不是只看文章发在哪儿,院系就会传递这样的一个信号,即,他们充分认识并考虑到了一个在学科前沿工作的严肃学者所面临的更大风险:与那些更保守和更安全的的研究比起来,这些学者的努力的结果往往是更富创意的未发表工作论文,而不是T5 的文章。 

一个更激进的方案是将出版从当前的固定期刊转移到开源的 arXiv85或 PLOSCE86。这种格式可以便利新思想的传播并为其提供即时的在线同行评论。讨论会议将审查批评意见, 为作者和读者提供不同的观点。更简短和更有针对性的论文会促进对话交流,从而打破编辑和期刊的垄断。并且,开源系统会使得作者有机会在严肃的专业讨论中测试他们的新观点,并使关系网络之外的创新型学者进入专业领域中成为可能。现有的关系网和关系网内的参考引用圈是进入学术领域的严重阻碍,他们往往用“异想天开“或与 T5 价值取向不一”屏蔽新进入者。埃利森(2011)注意到,资深学者已经开始尝试在线出版了。我们为什么不推广这种做法,激发富有活力的对话与独特观点的迅速传播呢?

无论如何,经济学界都应淡化极端的仕途主义,转而促进创造性活动。短暂的终身教职时钟(tenure clocks)和对依赖T5 证明论文质量二者是相互抵触的。 

曼索(Manso,2011)主要研究的是鼓励创新的最优激励策略,他的研究说明容忍早期失败和考虑最终结果及其获取方式对于创新的的重要性。在区分了探索未经测试的新活动和应用已知活动后,曼索(2011)提出,对于旨在促进探索性活动的方案,应设计合理的报酬体系来适应这类收益高度不稳定的活动。阿祖莱(Azoulay et al.,2011)曾通过比较两组高素质的生物医学研究人员的出版成果来测验该假说。前一组(人员)来自于 HHMI(霍华德休斯医院),他们享有更加灵活和宽容的审查流程。后一组则来自 NIH(国民卫生研究所),他们受制于“常规科学”规定的成果形式,即更短的审核周期和不允许失败的延伸政策。通过控制选择误差,他们发现 HHMI 的研究人员比 NIH 发表高影响因子文章的比例更大。更重要的是,HHMI 的研究员似乎更有可能从事探索性研究,他们的 MeSH (Medical Subject Headers)87关键词与其前后发表的研究成果之间的重叠程度较低体现了这一点。

在整篇文章中,我们采用被引数作为产出能力的有效标准来研究文献。但众所周知, 把被引数本身当作产出能力的衡量标准是有缺陷的。因为按照惯例可能出现这种情况,即使有更好或更优质的非T5 论文,作者也更倾向于引用T5 论文。

从长期来看,经济学界会因采用更注重创造性的论文筛选方式而受益。否则,经济学学术界将很可能会继续戴着T5 的镣铐,迈着沉重的步伐前行。倚重T5 来选拔人才造就了一种文化,在这种文化中,最有价值的是经济学者的简历长度,而不是一个人是如何发展出一系列连贯和原创的思想。这种文化只会鼓励仕途主义,而并非创造性的学术。

————————————————

82  这篇论文的很多读者向我们反映本文的实证结果并没有很好地支持和证明了所有的这些主张。我们承认这一点。但同时我们请求读者们把激励的标准分析应用到我们所说的这个“市场”上。要知道,否认这些激励就是认为期刊编辑 和寻求在期刊上发表文章的学者都是无欲无求的圣人。

参考文献

Akerlof, G. A., “ Sins of omission and the practice of economics,” Submitted, Journal of Economic Literature, 2018.


Axarloglou, K. and V. Theoharakis, “Diversity in economics: An analysis of journal quality perceptions,” Journal of the European Economic Association, 2003,1(6):1402–1423.


Azoulay, P., J. S. Graff Zivin, and G. Manso, “Incentives and creativity: evidence from the academic life sciences,” The RAND Journal of Economics 2011,42(3):527–554.


Becker, G. S., Human Capital: A Theoretical and Empirical Analysis, with Special Reference to Education, (University of Chicago Press, 1964).


Bertsimas, D., E. Brynjolfsson, S. Reichman, and J. Silberholz, “Or forum — tenure analytics: Models for predicting research impact,” Operations Research, 2015, 63(6):1246–1261.


Bertuzzi, S. and D. Drubin, “No shortcuts for research assessment,” Molecular Biology of the Cell, 2013,24(10):1505–1506.


Brogaard, J., J. Engelberg, and C. A. Parsons, “Networks and productivity: Causal evidence from editor rotations”, Journal of Financial Economics,2014,111(1):251 – 270.


Card, D. and S. DellaVigna, “Nine facts about top journals in economics”, Journal of Economic Literature, 2013,51(1):144–61.


Colussi, T., “Social ties in academia: A friend is a treasure,” The Review of Economics and Statistics, 2018,100(1):45–50.


Combes, P.-P. and L. Linnemer, “Inferring Missing Citations: A Quantitative Multi-Criteria Ranking of all Journals in Economics,” Working Papers halshs00520325, HAL, 2010-09.


Eisen, M., “The past, present and future of scholarly publishing,” Remarks by Michael Eisen, co-Founder of Public Library of Science (PLOS), at the Commonwealth Club in San Francisco, 2013-03.


Ellison, G., “The slowdown of the economics publishing process,” Journal of Political Economy, 2002,110(5), 947–993.


Ellison, G., “Is peer review in decline?” Economic Inquiry, 2011,49(3):635–657.

Gibson, J., D. L. Anderson, and J. Tressler., “Which journal rankings best explain academic salaries? evidence from the university of California,” Economic Inquiry, 2014,52(4):1322– 1340.


Hamermesh, D. S., “Citations in economics: Measurement, uses, and impacts,” Journal of Economic Literature, 2018,56(1):115–56.


Hawkins, R. G., L. S. Ritter, and I. Walter., “What economists think of their journals,” Journal of Political Economy, 1973,81(4):1017–1032.


Kalaitzidakis, P., T. P. Mamuneas, and T. Stengos., “Rankings of academic journals and institutions in economics,” Journal of the European Economic Association, 2003,1(6):1346– 1366.


Kapeller, J., M. Aistleitner, and S. Steinerberger., “Citation patterns in economics and beyond: Assessing the peculiarities of economics from two scientometric perspectives,” Technical Report 60, ICAE Working Paper Series, 2017.


Kodrzycki, Y. K. and P. Yu., “New approaches to ranking economics journals,” The BE Journal of Economic Analysis and Policy, 2006,5(1).


Laband, D. N. and M. J. Piette., “Favoritism versus search for good papers: Empirical evidence regarding the behavior of journal editors,” Journal of Political Economy, 1994,102(1):194– 203.


Liner, G. H. and E. Sewell., “Research requirements for promotion and tenure at phd granting departments of economics,” Applied Economics Letters, 2009,16(8):765–768.


Manso, G., “Motivating innovation,” The Journal of Finance, 2011,66(5):1823–1860.


Scott, C. E. and J. J. Siegfried., “American economic association universal academic questionnaire summary statistics,” AEA Papers and Proceedings, 2018,108:616–18.


Vale, R. D., “Accelerating scientific publication in biology,” Proceedings of the National Academy of Science, 2015,112(44):13439–13446.

往期回顾

1、书目推介 | 史正富、孟捷主编:现代经济学的危机与政治经济学的复兴

2、史正富 | 现代经济学的危机与政治经济学的复兴

3、贾根良|中国经济学教育改革建议书

4、陈 平|经济数学为何如此落伍却自封社会科学之王——经济学的七大困惑

5、经济学革命|杨虎涛:经济学多元主义:历史、主旨和中国意义

6、罗 默|宏观经济学的困境

7、斯蒂格利茨|现代宏观经济学的走向错在哪里

http://www.cpeer.cn/

http://www.peforum.cn/


责任编辑:朱德志   审核:余超

点击阅读原文前往

中国政治经济学40人论坛官网


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存