查看原文
其他

JF论文复现:金融学术圈的女性们

连享会 连享会 2023-10-24

👇 连享会 · 推文导航 | www.lianxh.cn

连享会课程 · 文本分析专题

作者:陈卓然 (中山大学)
邮箱:chenzhr25@mail2.sysu.edu.cn

编者按:本文主要摘译自下文,特此致谢!
Source:Sherman M G, Tookes H E. Female representation in the academic finance profession. Journal of Finance, 2022, 77(1): 317-365. -Link- -PDF- -Replication-

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 摘要

  • 2. 数据

    • 2.1 学校排名

    • 2.2 商学院员工花名册

    • 2.3 金融系教职工

    • 2.4 终身制与全职教授

    • 2.5 研究产出

    • 2.6 性别

  • 3. 比较性描述分析

    • 3.1 金融系中性别组成

    • 3.2 金融系员工的发表情况

  • 4. 回归分析

    • 4.1 学校的排名

    • 4.2 任期状态

    • 4.3 教授职位

    • 4.4 退出

    • 4.5 研究产出:发表

    • 4.6 合作者

    • 4.7 工资

  • 5. 结论

  • 6. 参考文献

  • 7. 相关推文



1. 摘要

作者通过对 2009-2017 年美国前 100 商学院的全部金融系教职工样本展开分析,发现性别不平等体现在如下的若干方面:

  • 首先,在控制研究产出之后,女性普遍处于排名较为靠后的大学,并且不太可能成为教授,同时她们的工资往往很低;
  • 其次,女性往往发表更少的论文,这种性别差异体现在发表的数量而非质量上面;
  • 最后,女性有更多的女性合作者,这意味着女性的学术圈网络要更小。但是时间序列分析表明这种性别鸿沟在逐渐缩小。

2. 数据

2.1 学校排名

作者的学校排名数据来自 2009 年到 2017 年 U.S. News & World Report 对美国最好的商学院的排名,作者选择了前 100 所商学院。

2.2 商学院员工花名册

教职工花名册数据来源于 Academic Analytics (ACA)。作者将这份数据与 U.S. News & World Report 的前 100 的大学进行合并,得到最终的面板数据。

ACA 的数据中包含全部教职工的姓名、头衔、工作单位、博士毕业的学校以及博士毕业的年份。作者集中于助理教授、副教授以及教授的数据。

由于我们的样本要求一个学校必须在 2009 年到 2017 年间在 U.S. News & World Report 的名单中至少出现一次,同时在样本期内这所学校必须被 ACA 数据库所覆盖到至少一次,最终作者一共获得了 97 个 "top-100" 个商学院。

2.3 金融系教职工

ACA 的商学院员工数据包含七类:金融系,会计系,工商管理系,其他商科类,管理系,管理信息系统,市场营销。但是原始数据中存在两个问题:一是对于每一个人的分类可能会随时间而变化;二是一些金融系的教职工被归到其他的子领域,而其他非金融系的员工可能被错误地归为金融系。

作者对于这个问题是这样处理的:首先在我们的样本中如果一个员工被归为金融系员工至少一次,而这个人又没有被归入会计系,那么我们就先将这个人作为金融系员工。然后作者根据这些人的简历或者他们的 LinkedIn 进行二次筛选。作者将筛选之后的结果分为四组:

Group 1:包含那些初始没有被分入金融系,但是他们发表的论文中 25% 都是在金融学期刊的 Tier A 和 Tier B。

Group 2:所有最近的毕业生 (毕业年份在 2009 年之后的) 并且他们没有在第一次被分入金融系员工中,而且没有任何发表。

Group 3:包含全部初始被分入金融系的员工,但是在金融学的 Tier A 和 Tier B 期刊中发表少于 5 篇文章的人或者没有在金融学 Top 3 期刊 (The Journal of Finance, Review of Financial Studies, Journal of Financial Economics) 中至少发表 3 篇文章的人。

Group 4:包含全部没有任何发表但是初始时被包含进金融系员工当中的人。

注意 Group 1 和 Group 2 事实上帮助我们在没有被归为金融系的员工中寻找实际上是金融系的员工;Group 3 和 Group 4 事实上是在帮助我们将实际上并不是金融系的员工,但是被错误归为金融系的员工挑出来。

背后的逻辑在于如果一个员工并不是金融系的,那么他在金融学顶刊上的发表量一定会很少,相反如果一个员工在金融学顶刊中发表的文章很多,那他就是一个金融系员工。但是对于那些没有任何发表的员工而言,我们不能确定他们一定是金融系员工还是一定不是金融系员工,因此需要对此进行二次检验。

作者之所以要分这四组是因为可以不用将全部人都进行二次筛选,那些不在这四组人内的员工,作者认为他们并没有被错误分类,因此作者只需要对这四组人进行二次筛查即可 (大大节约工作量)。

作者最终识别出 2011 个金融系员工,在 2009 年到 2017 年期间受雇于美国 top-100 的学校。

2.4 终身制与全职教授

作者用 "Professor" 指代全职教授。由于终身制 (tenure) 的标准在不同的大学里面不一样,特别是副教授在某些大学中并不是终身制。

作者首先对于全部学校的教职工手册进行了检查,找出其中副教授不全是 tenure 的大学。然后作者对于这些大学中的全部教职工的简历进行手动筛查,一般这些教职工的简历上都会写明自己何时获得了 tenure。对于那些没有写清楚的教职工,作者参考了 Brogaard 等 (2018) 中的数据,最终确定了 tenure 的数据。

2.5 研究产出

作者将期刊发表作为主要的产出测度。对于教职工的发表和引用的数据,作者采用 Scopus.com 中的 Scopus 数据库。Scopus 数据中包含一个独特的作者识别码、文章的题目、期刊名、合作者名字、发表日期以及引用的数据。作者将 ACA 的花名册和 Scopus 中的数据按照教职工的名字和机构名合并起来。

2.6 性别

ACA 数据库使用一个人姓和名来计算一个人是男性或者女性的概率,如果这一概率大于 90%,那么这个人就被归为男性或者女性。然后作者进一步对缺失值进行了手动的筛查和补充,但是最终仍然有两位员工的性别难以确认,因而最终观测值的个数为 2009 个。

3. 比较性描述分析

3.1 金融系中性别组成

下表展示了金融系中的性别构成。在 2009 年到 2017 年美国前 100 的商学院 2009 个观测值中有 16% 是女性,在 top30 的学校中女性占比为 14.3%,在 top10 的学校中女性占比为 13.1%。而且公立学校倾向于有更多的女性。

作者进一步采用图的形式进行更为直观的展现。

上图展示了在全体教职工中性别构成的变化。可以看出性别比例非常稳定,在 2009 年 14.9%,到 2017 年 16.8%。

上图表示在终身制的员工当中,女性比例要增长地相对更快一些。

这张图展示了在 2009 年以后取得博士学位的女性毕业生进入我们的样本中的比例。

3.2 金融系员工的发表情况

从发表的角度看,相较于男性,女性有着更少的发表量。从总发表量的角度看,女性的发表量大约占到男性发表量的 51% (7.24/14.33)。而当我们只考虑 Top 期刊的发表量时,这一数值上升到 61% (2.83/4.64)。其余的结果可以采用相似的方式进行解读。

4. 回归分析

作者试图解决的问题有:给定在样本期内的某一时间点上,一个个体在 top100 的大学中有教职,

  • 那么这个个体所在学校的排名如何?
  • 这个个体在获得博士学位之后的 X 年后获得 tenure 的可能性 ();
  • 这个个体在获得博士学位之后的 X 年后成为教授的可能性 ()。

4.1 学校的排名

上表呈现了每一年截面回归的结果,其中:

  • 被解释变量为 Institution Rank (亦即 U.S. News & World Report ranking 在每一年内的均值);
  • 核心解释变量为 Female
  • 控制变量为是否为 tenure (是==1),职业经验 professional experience 也就是一个个体自博士毕业以来参加工作的年限,学术圈的关注度 (通过引用率来衡量) **ln(number of citations+1)**,研究产出,亦即第 年在 Top 期刊上发表的论文数量 ln(number of top publications +1) 和非 Top 期刊上发表的论文数 **ln(number of other publications +1)**。

上表的回归结果显示,在控制了研究产出等一系列协变量之后,女性在大多数年份倾向于在排名更低的大学任职 (注意 institution rank 越大,表明这个学校越靠后)。在 2009 年,Female 的系数为 6.443,其含义在于在 2009 年,在其他条件不变的前提之下,平均而言,女性所在的机构会比男性所在的机构低 6 个级别。

作者将系数采用如下的图清晰地展示出来了:

从上图中可以看出,性别差距随着时间在稳定地下降,在 2017 年这一系数为 0.778,并且在 5% 的水平上显著异于 0。

从上述回归结果中,我们还能够看出那些有着更高引用率和更多顶刊发表的教职工倾向在排名更高的学校,而那些在较差期刊发表更多的教职工大多倾向于在更低的大学。

作者接下来将被解释变量替换为个体博士毕业 年之后所任职的大学的排名()。下面呈现了其回归结果:

可以看到在除 之外,博士毕业 4 年,6 年,8 年,12 年,16 年之后,性别差距都要显著异于 0,也就是说女性相较于男性,其任职的大学排名都要显著落后。

4.2 任期状态

作者在这一节中重点解决第二个问题:给定在样本期内的某一时间点上一个个体在 Top100 的大学中有教职,这个个体在获得博士学位之后的 年后获得 tenure 的可能性 ()。

在回答这个问题之前,作者使用 LPM 模型对于全样本教职工进行分析,其被解释变量为一个虚拟变量:如果这个个体在 年获得 tenure 教职,则被解释变量就为 1,否则为0。解释变量和前文一致:是否为女性,引用率,在 Top 期刊发表的论文数以及在其他期刊发表的论文数。

回归结果如下表所示:

上表的回归结果显示至少从 2009 年到 2013 年间在是否得到 tenure 的教职在男性和女性之间存在显著的差异,但是这种性别差异在逐渐减小。为进一步看出这种系数的差异性是如何随着时间而变化的,作者绘制了如下的图:

上图绘制了 Female 系数随时间变化的图,以及系数差异随时间变化的图。其解释与前文类似,此处就不再赘述了。

Sarsons 等 (2021) 指出女性在合作文章中往往获益更少,为检验这一猜想,作者进行了如下回归。与 Sarsons 等 (2021) 不同,作者并没有发现女性在合作文章中受到惩罚的不利影响的证据。

作者在接下来的回归当中呈现了在一个人博士毕业 6 年,8 年,10 年和 12 年之后是否男性会比女性更容易得到 tenure。

作者发现在 8 年,10 年,12 年的回归结果当中并不存在显著的性别差距,但是在 6 年之后的回归结果当中我们可以看到显著的性别差距:女性获得 tenure 的概率要比男性小 8.6%。

此外,在上述回归结果中还值得一提的是在 6 年的回归结果中存在显著的性别差距,而这种性别差距的来源是女性在非 Top 期刊上的发表 (包括合作和独作) 导致的。也就是说在控制了一系列的控制变量以后,Female 的系数不再显著了,而在这一系列的控制变量当中只有 Fem*Other Coauth PubsFem*Other Solo Pubs

4.3 教授职位

作者沿袭上篇对于 tenure 的思路展开对 Full Professor 的研究。作者依然采用线性概率模型,其被解释变量为1,当且仅当这个职工在第 年成为一个全职教授,其回归结果如下表所示:

很明显,在每一年当中都存在着显著的性别差距。同样作者也将上述的回归结果用如下的图直观地呈现出来:

作者接下来探究在博士毕业的 10 年,12 年,14 年,16 年,18 年以及 20 年之后女性是否要比男性更可能成为全职教授,估计结果如下表所示:

上表显示博士毕业之后的 16 年,18 年和 20 年的 Female 的系数显著为负,而在 10 年,12 年和 14 年的回归结果中这一系数并不显著,这反映了在全职教授中男女性别比例的失衡在逐渐减弱。

4.4 退出

作者为检验是否女性会比男性有更大的概率退出职场,作者进行了两组回归:首先作者在全样本下检验了在获得博士学位的 6 年之后退出职场的性别差异。因此我们在前面 tenure 的回归当中发现博士毕业 6 年之后是否获得 tenure 存在显著的性别差异。

其次,作者在新毕业的大学生的子样本 (也就是在 2009 年到 2017 年间获得博士学位的人) 中检验获得博士学位后的 3 年,4 年,5 年和 6 年之后退出职场的性别差异。回归结果如下表所示:

我们发现并没有足够的证据表明女性会更早地退出,不过在 Top 期刊的较低发表量却是一个很重要的预测提前退出的重要指标,这一结论在子样本的回归中依旧非常稳健。

4.5 研究产出:发表

作者在这一节中检验男性和女性在发表量上的差异。作者的解释变量为总发表量:ln(number of total publications + 1)。其余的被解释变量和前文的回归中含义一致,此处不再赘述。回归结果如下表所示:

从第 1 列到第 3 列,作者逐渐加入了 PhD 年份固定效应和机构固定效应,我们发现结果都非常稳健。在控制了 tenure 的状态,以及获得博士学位之后的年份以及现在的机构 (PhD Year FE 和 Institution FE) 之后,相比于男性而言,女性都倾向于发表更少的文章。

具体而言,在其他条件不变的前提下,第 3 列的结果显示女性相比于男性发表的文章量大约低 17.3%。下图展示了逐年进行截面回归的结果:

由上图可知,当控制了 tenure 的状态、PhD 的毕业年份以及现在所处的机构后,相对于男性而言,女性仍然倾向于发表更少的文章。并且这种性别差距并没有随着时间而逐渐减小。而在上表的最后一列中,Female 的系数 -0.123 表示在那些最近刚刚毕业的大学生当中女性相比于男性发表量要低大约 11.5% ()。

作者进一步将全部发表量划分为 Top 期刊的发表量和其他期刊的发表量两个部分。然后进一步分成四个组:top 期刊的独作发表,top 期刊的合作发表,其余期刊的独作发表以及其余期刊的合作发表。回归结果如下表所示:

上表的回归结果表明发表量的性别差异主要来源于在其余期刊上合作发表的性别差异,但对于顶刊中无论是独作还是合作,都不存在显著的性别差异。作者指出这在一定程度上反映了女性尽管发表数量上可能低于男性,但是其发表的质量并不比男性差.

4.6 合作者

在 tenure 的分析中,我们发现合作论文对于是否得到 tenure 的解释力度要明显高于独作论文,因此作者下面在合作者网络中探究潜在的性别差异。

作者考察成功的合作 (发表) 可能会发生的三条渠道:

  • 相同的性别;
  • 共同的 cohort;
  • 共同的机构。

AFFECT (2018) 发现在金融期刊中发表的论文作者存在明显的性别集聚现象。与之不同的是,作者集中于个体层面,试图发现是否一个个体更可能寻找女性合作者,这样的作法可以控制住如是否有 tenure、机构、引用率等等可能会影响合作团队中的性别组成的个体层面因素。

此外,作者在共同 cohort 当中主要关注是否在同一时间同一所大学内完成博士学业;

最后一个考虑的合作网络的因素就是在同一时间在同一所大学里工作。

下表报告了面板回归结果。被解释变量是一个个体在第 年合作者数量的对数。作者考虑了六种合作者的指标:全部合作者、来自 Top-100 商学院的合作者、来自 Top-100 商学院的女性合作者、和个体获得PhD的年份相差在 4 年以内并且同样来自 Top-100 商学院的合作者、和个体获得相同大学的 PhD 的年份相差在4年以内并且同样来自Top-100商学院的合作者、在过去三年内在同一所大学里工作的合作者。

回归结果如下表所示:

Panel A 的前两列表明女性倾向于有着更少的合作者,但是 Panel A 的第三列表明相比于男性,女性更可能寻找女性合作者。Panel A 的第四列表明在同一个博士毕业年份区间 (cohort),相比于男性,女性有着更少的合作者。

为进一步探究这是否由于在博士期间很少有合作造成的,作者做了Panel A 的第五列,但是结果并不显著。Panel A 的第六列意味着在和自己工作的学校内的其他同事合作论文中,男性和女性并不存在显著差异。

为了排除 Panel A 的结果是否由于女性本身发表的数量就更少导致其合作者也很少的疑虑,在Panel B 当中作者将发表数量作为控制变量进一步纳入考虑之中。在 Panel B 中作者发现第一列和第二列中 Female 的系数均不显著,表明当控制发表的数量之后女性和男性之间有着相似的合作者团队。

但是我们仍然发现即便在控制发表数量之后,女性依旧更容易选择女性作为合作者,并且女性倾向于选择来自不同 PhD cohort 的成员。

总而言之,Panel A 和 Panel B 的回归结果显示相对于男性,女性仍然更倾向于选择一位女性合作者。作者在附录中也将样本分为 tenure 和 untenure 两组进行回归,此处不再赘述。

4.7 工资

作者在最后一部分试图考察在金融学术圈中是否存在收入上的性别差异。

在上表的回归中被解释变量为员工九个月的工资的对数,我们发现在控制了博士毕业年份固定效应和工作单位固定效应之后,男性和女性之间不存在显著的工资差别。

作者指出由于大学工资信息是公开对外发布的,因此不太可能出现显著的性别差异。作者分析在 2012 左右出现的显著的工资差异是由于在金融危机之后各个大学对于男性工资的调整速度要快于女性员工的调整速度,因此造成短暂的差异,但是随后二者的差异便不再显著了。

5. 结论

这是一篇较为浅显易懂的实证文章,作者的绝大多数分析都只是描述性的,并不涉及任何的因果解释,其用到的主要计量方法就是固定效应面板回归模型,核心命令是 reghdfe。作者的主要工作是探究了在金融学术圈中性别失衡问题,但是对于如何解决性别失衡的问题,作者尚未给出相应的建议。

但是这篇文章最值得学习和借鉴的地方在于其结果的可视化的部分,作者在上述分年份的截面回归中绘制的每一幅系数变化图都用到了将近100行的代码,值得我们好好揣摩。

6. 参考文献

  • Currie R R, Pandher G S. Finance journal rankings and tiers: An active scholar assessment methodology[J]. Journal of Banking & Finance, 2011, 35(1): 7-20. -PDF-
  • Brogaard J, Engelberg J, Van Wesep E. Do economists swing for the fences after tenure?[J]. Journal of Economic Perspectives, 2018, 32(1): 179-194. -PDF-
  • Sarsons H, Gërxhani K, Reuben E, et al. Gender differences in recognition for group work[J]. Journal of Political economy, 2021, 129(1): 101-147. -PDF-
  • AFFECT. Publication patterns of women in the finance profession, Presentation, AFA, Philadelphia. 2018. -PDF-

7. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 可视化, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:数据处理
    • Stata:边际处理效应及其可视化-mtefe-T309
    • Stata: 约翰霍普金斯大学 COVID-19 疫情数据处理及可视化
  • 专题:Stata绘图
    • Stata绘图:balanceplot-系数可视化之平衡性点图
    • 值得收藏!三个Stata可视化绘图网站
    • Stata绘图:相关系数可视化
    • Stata绘图:COVID-19数据可视化
    • Stata可视化:能用图形就不用表格
    • Stata绘图:回归系数可视化-multicoefplot
    • Stata绘图-可视化:组间差异比较散点图
    • Stata可视化:biplot一图看尽方差、相关性和主成分
    • Stata绘图-组间差异可视化:不良事件火山图、点阵图
    • forest-森林图:分组回归系数可视化
    • Stata绘图:回归系数可视化-论文更出彩
    • Stata绘图:世行可视化案例-条形图-密度函数图-地图-断点回归图-散点图
    • Stata绘图:随机推断中的系数可视化
  • 专题:结果输出
    • Stata可视化:让他看懂我的结果!
  • 专题:回归分析
    • Stata:在线可视化模拟-OLS-的性质
  • 专题:面板数据
    • Stata绘图:面板数据可视化-panelview
  • 专题:Python-R-Matlab
    • Python 调用 API 爬取百度 POI 数据小贴士——坐标转换、数据清洗与 ArcGIS 可视化
  • 专题:工具软件
    • 知乎热议:有哪些一用就爱上的可视化工具?
  • 专题:其它
    • 数据可视化:带孩子们边玩边学吧

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存