查看原文
其他

集智科学家PNAS发文:女性科研工作者的退出风险与学术成就

Leo 集智俱乐部 2021-10-06


导语术界中性别不平等的现象始终存在,也有不少研究对此表示关注,但由于各种原因没能够得出很令人满意的结论。这块空白如今有所填补:黄俊铭博士及其合作者,整合并运用前所未有的大规模数据库,进行了一项题为《不同国家和学科的科学职业中性别不平等的历史比较》的研究。本文是研究报告的详细解析,将从职业生涯、学术能力等不同角度透析学术界性别不平等之因。第一作者黄俊铭是集智科学家社群成员。


论文题目:
Historical comparison of gender inequality in scientific careers across countries and disciplines
论文地址:
https://www.pnas.org/content/early/2020/02/14/1914221117

学术界中性别不平等现象的一个主要表现是“productivity puzzle”,即男性科学家在职业生涯中发表的论文多于女性科学家。就这一问题,先前已有不少科学研究给予了关注,给出的解释也多种多样,但大多研究使用的样本都比较小,很难将其成果推广到整个学术界中。

 

来自普林斯顿大学当代中国研究中心的黄俊铭博士和他的合作者们,在整合Web of Science数据集和Microsoft Academic Graph数据集的论文发表、引用、单位等多项信息后,筛选整理出150万名科研人员的完整职业生涯,覆盖13个主流学科、83个国家和1300万篇论文的大规模数据,对学术界中女性科研人员的学术能力表现及其背后的原因做出了分析。这项题为 Historical comparison of gender inequality in scientific careers across countries and disciplines(《不同国家和学科的科学职业中性别不平等的历史比较》) 的研究近日发表在了《美国科学院院刊》(PNAS)上。


在Web of Science、Google Scholar和Microsoft Academic Graph等结构化大规模数据库出现之前,要完整地获取并分析大量科学家的职业生涯数据是很困难的。而学术界的重尾分布使得这一问题更加复杂:少数顶尖科学家发表了大量文章并获得了大部分的学术引用。因此,要系统地回答学术界的性别不平等问题,需要分析跨时间、空间、学科的大规模学术数据,以得出普适的规律。——论文作者 黄俊铭



不平等的学术圈


一个显然的事实是,在学术界女性始终不是主流。在黄俊铭等人调查的数据集中,通过查找姓名字典的方式推断论文作者的性别并加以区分后,总体的女性占比勉强超过四分之一。虽然每年发表论文的作者中女性占比在持续增长,从1945年的12%上升到2005年的35%,但仍然远远少于男性。

       

图1:自1945年起至2005年,每年发表论文的作者中女性占比从12.3%增长到了35.4%。图中饼图表示总体的女性作者比例为27.1 %


并且,研究者也证实了这一现象在所有主流学科中都不同程度地成立,既包括数学、物理等传统印象中认为男性占优的学科,也包括心理学等通常认为性别差异不明显的学科。


       

图2:各学科的性别比例图示


除了总人数之外,从平均每名科研人员的学术表现来看,女性依然处于弱势地位。在本研究中,黄俊铭等人选择了两项主流指标来评估单个科研人员的学术产出:职业生涯总发文量和总引用数。其中引用数对于发表时长、引用膨胀、自引等因素做了修正。      

图3:以论文发表的时间跨度来定义科研人员职业生涯(虚拟人物,非具体实例)


如上图所示,一个科研工作者的职业生涯表示为其发表的所有论文(实心深色黄点)的总和。发表第一篇论文标志着一个研究者进入了学术界。发表最后一篇论文被视为研究者离开科研领域(Dropout)的标志。每一篇论文的“尾巴”——黄色细实线,表示一篇论文发表后十年内的被引数据;浅黄色柱状图表示每年发表的论文数量;横贯全图的黄色虚横线则表示平均每年发表的论文数量。而右侧柱状图则表示总体的论文发表数量(上部)和被引次数(下部)。需要指出的是,根据这样的职业生涯定义来度量总发文量和总引用数,平均每名女性科研工作者的总体表现确实是低于男性的。


       

图4:分性别比对男女科研工作者在论文发表数量(左图)和被引数据的表现(右图)


如上图所示,平均每名女性科研工作者在其整个职业生涯中发表9.6篇论文,被引用175次,而男性在这两个数据上则分别高出27%和30%。这一现象在顶尖的科学家中尤其显著:在排名前20%的科学家中,女性论文发表数量和被引量均比男性少37%左右。这样的现象在不同的国家、不同的学科、不同档次的大学甚至是不同的年代中均普遍存在。

      
图5:论文发表数量(上排)和被引数据(下排)在国别、学科、大学和年代间的具体差异。


面对这样一个不平等的现实,备受争议的一个论断就是“女生不适合搞科研”。这常常也被诉为学术界中性别歧视的主要偏见。可是,到底什么叫“适合搞科研”?为了分析在科研领域性别间的不平等现象,我们需要用明确的方法来定义出什么算“适合搞科研”——或者说,怎么才叫作“把科研搞好了”。


在此之前,我们分析的都是一个研究者职业生涯的总体研究表现,这里面就涉及到了一个影响因素——时间。当黄俊铭等人去掉时间因素,分析一名科研工作者平均每年发表的论文数量时,发现女性科研人员每年发表论文数与男性相当。进一步地,女性科研人员每篇论文的引用数也与男性相差无几。并且,这一结论在不同学科中普遍成立。

      图6:女性科研人员平均每年发表论文数与男性的差异,以及分国家、专业、大学排名、年代的具体差异图示。

我们发现,男性与女性之间的生产力差异几乎是微不足道的:女性科研工作者平均每年发表1.33篇论文,而男性是1.32篇……并且,这一现象在我们所研究的所有数据集上都得以体现。—— 论文作者 黄俊铭



职业生涯对学术能力表现的影响


在观测到学术职业生涯的累积时长对学术成就的影响后,黄俊铭认为:“年均发文数和单篇论文引用数这两个不变量,引导我们探索学术界性别不平等的根源。”由此他们把研究的重点聚焦于:由性别导致的职业生涯累计时长差异,究竟在多大的程度上影响着科研工作者的成就。他们发现,男性科研工作者的平均职业生涯为11.0年,而女性的平均职业生涯只有9.3年,男性在时长上的优势达到16%。

       

图7:左右两图分别表示,分国家、学科职业生涯的性别差异(横坐标)与学术产出性别差异(纵坐标)


如上图所示,在男性女性的职业生涯相差较大的国家和学科中,学术产出的性别差异也往往较大,二者呈现良好的线性关系。


为了进一步分析这一问题,研究者设计了控制职业生涯长度的配对取样(matched sampling)实验,把男性与女性科研工作者的信息按照专业领域以及职业生涯长度加以匹配,共得到了412,778对数据。

       

图8:匹配后的样本数据


在控制了专业和职业生涯长度后,学术表现上的性别差异大幅减少,职业生涯总发文量和总引用数的性别差异减小为8%和12%。


图9:控制控制了专业(discipline)和职业生涯长度(career length)后学术产出和学术影响力的性别差异



过早离场的女性科研工作者


女性的科研生涯短于男性,也就意味着,女性科研人员面临比男性更高的退出风险。


       

图10:职业生涯时长与退出风险,图中橙黄色实线表示女性在不同年龄段的退出风险,而虚线表示平均的退出风险。对应的男性数据用蓝色表示。


从上图中,我们可以看到,女性的总体退出风险为10.8%,而男性的退出风险为9.0%,这也就意味着每年因各种原因退出学术界的女性科研人员比男性多2%。参考前文的分析,女性科研人员的平均职业生涯年限比男性短16%。


类似前文的配对取样实验,黄俊铭等人为了验证退出风险对个体学术成就的影响,进行了人工改变退出率的(伪)反事实实验。通过随机选择部分男性科学家并强制“缩短”其职业生涯,使得男性和女性科学家在职业生涯的同一时段面临同样的退出率,以此来模拟女性科研工作者的处境。

     

图11:控制退出率后学术产出与学术影响的性别差异变化


这一实验结果确认了这一额外的退出风险,可以单独解释总发文量和总引用数上约2/3的性别差异,因此认为:女性科研人员过高的退出率是造成学术界性别不平等现象的主要原因。女性科研人员的学术成就低于男性的主要原因就是——她不在学术界了。


既然在学术界,女性的表现实质上并不弱于男性,那留给我们的问题也就更加清晰。



“女科学家去哪儿了?”


“女科学家去哪儿了?”是结构生物学家颜宁教授在央视一档名为《开讲了》的节目中提出的问题。在浙江大学生命科学研究院教授王立铭的一项调查研究中,也提出了类似的问题——《消失的女生:国内学术机构性别问题调查分析报告》。


题目:消失的女生:国内学术机构性别问题调查分析报告

网址:https://zhuanlan.zhihu.com/p/20466784


黄俊铭认为:“本文受数据所限,对于退出率与学术表现性别差异之间的因果关系持谨慎态度,也因此无法对科研政策保护女性科研人员提出建议。唯一的建议是,现在很多科研政策着重保护年轻女性科研人员,但根据本文发现女性科研人员在不同年龄段都面临几乎一致的额外退出风险。或许应该同等地扶持全年龄段的女性科研人员,以消除学术界的性别不平等现象。”


此外,在此研究中,对一名科研工作者的评价是“论文导向”的——以发表论文数量和被引次数来衡量学术能力表现,并未包含职务、职称、个人家庭信息等数据,也并未区分退出学术界(不再发表论文)以后的去向(如进入工业界等)。我们并不能武断的认为,女性离开学术界一定是一个糟糕的结果。但面对学术界中——尤其是顶尖学者中——不均衡的性别比例,我们确实应该思考一下:她去哪了?



作者:Leo

编辑:张希妍



直播预告:

集智科学家亲述论文故事


我们邀请到论文第一作者黄俊铭,在北京时间本周六中午 12:00-12:30,做客集智俱乐部 B 站直播间,从研究者的视角,为你解读这篇论文。

直播时间:周六(2月29日) 12:00-12:40

直播通道1:集智俱乐部 B 站直播间


扫码直达教室

PC端:https://live.bilibili.com/8091531


直播通道2:zoom线上会议室:


黄俊铭博士还将同时在 zoom 线上会议室和听众互动交流。如果你读完论文或者本篇解读,有疑问希望与作者探讨,请点击文末“阅读原文”报名,即可获得 zoom 线上会议室房间号。(B 站只有直播,不提供答疑。)



推荐阅读


Nature:应对21世纪的大规模流行病,各个学科必须联合起来

网络上的流行病传播与预测 |《巴拉巴西网络科学》新书推荐

怎样入门复杂性科学?从 NetLogo 多主体建模开始

非常时期,集智开放超过100小时的系统科学课程

加入集智,一起复杂!






集智俱乐部QQ群|877391004

商务合作及投稿转载|swarma@swarma.org

◆ ◆ ◆

搜索公众号:集智俱乐部


加入“没有围墙的研究所”

让苹果砸得更猛烈些吧!


👇点击“阅读原文”,报名周六线上论文解读
: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存