学术活动|讲座纪要 史冬波 因果推断的反事实框架: 如何选择合适的方法?
供稿|司湘云
因果推断方法适用于何种研究情境?不同因果推断工具的方法思想有何不同,又分别具有哪些优缺点?在何种研究情境下应选择何种因果推断工具?“面向图情档研究问题的研究方法系列讲座(第二期)”第四讲特邀上海交通大学史冬波特别副研究员进行题为“因果推断的反事实框架:如何选择合适的方法?”的讲座。史冬波老师详细阐述了因果关系的定义,结合具体研究案例对比分析并总结了不同因果推断工具适用的研究情境。
1.定义因果关系
变量X与变量Y显著相关(相关性)且X发生在Y之前(时序性),是否可以充分说明X是Y的原因?以人才计划对于科学家流动的因果关系为例(如下图),示例中使用结果变量Y在实验组和对照组样本中均值的差异表示X对Y的影响,然而示例中两个方案分别忽视了时间趋势和科学家自身特质因素对于科学家流动的影响,因此并不能推论人才计划对科学家流动的影响是二者间的因果效应。人才计划对于科学家流动的因果效应应是入选人才计划的科学家群体的平均流动性与假设该部分科学家未入选人才计划时的平均流动性之差,但显然无法观测到后者的数值,即反事实,那么是否可以选择某些观测值来替代反事实呢?因果推断的主要工具即是在反事实框架下寻找合适的观测值以替代反事实,进而进行因果推断。
在上述的例子中,在何种条件下才能得到变量X对变量Y的因果效应?在何种情况下观测到的变量X与变量Y的相关性,或者变量Y在实验组和对照组样本中的均值之差可以归结为因果效应?
当且仅当变量X完全随机或者局部随机发生时,可使用对照组群体的平均效应替代上述中的反事实,进而计算变量间的因果效应,此时变量X与变量Y的相关关系可以归结为二者的因果效应,数学公式如下图。其中完全随机实验指使用”抽签”的方法决定对象是否接受干预;局部随机实验指在某些条件一定的情况下进行随机实验,从而在条件一定的范围内实现随机性,最终根据条件的概率分布加权计算全局的因果效应。完全随机实验或局部随机实验的条件也等价于,在线性回归模型中不存在遗漏变量,即控制了其他条件一致。
值得注意的是,虽然部分学者提出“因果图”等方法以探讨多变量间的因果关系,但是目前主流的统计学工具只能定义和处理两个变量间线性的因果关系,即变量X(自变量/解释变量/实验变量)与变量Y(因变量/被解释变量/结果变量)的因果关系,例如人才计划对于人才.流动的因果效应、人才流动对于科研生产率的因果效应等。因此因果推断方法适用于探讨两个变量的因果关系,而无法应用于更复杂的研究情境。例如由于网络呈现了多变量之间的关系,因此因果推断方法很难直接应用于科学计量学领域引文网络等网络结构情境中。
在社会系统或科学系统中,变量间因果关系均可简化为两个变量之间的因果关系,且相关关系很可能并不足以支持相关政策的改革,而因果关系才能够提供充分的证据支持政策的制定与实施或者干预人类的行为。因此尽管目前大多数情况下只能探讨两个变量间的因果关系,但是其仍具有很大的研究价值与应用前景。
2 因果推断常用方法
随机实验方法是进行因果推断最直接和最重要的方法,但是成本高昂、实施难度大,因此适用场景非常有限。那么如何在更宽广的研究场景中使用观测数据替代反事实,进而进行因果推断呢?常用的方法/工具包括匹配方法、双重差分法、工具变量法和断点回归法。
匹配方法:该方法的思想是为每一个实验组对象寻找一个尽可能相似的观测对象,进而构成对照组,即在可观测维度上使得实验组对象与对照组对象尽可能相近,并在此基础上假定该实验为随机实验,此时两组平均值的差异或者回归模型结果等即为两个变量间的因果效应。匹配方法的核心是选择决定或者影响实验配置的观测变量。具体的匹配方法如下图。
工具变量法:工具变量与解释变量X显著相关,但与结果变量Y不直接相关,而是通过变量X才能对变量Y产生影响,该方法的核心是工具变量的有效性。例如,Kahn等人(2016)采用匹配法和工具变量法相结合的方法,探究获得美国博士学位的学者获得学位后离开美国从事科学研究,其科研产出是否会受到影响。其中,该研究关注被富布莱特计划资助到美国读博士学位的非美国学生群体,学生是否受富布莱特计划资助显著影响其是否离开美国任教,但是该因素与其毕业后的科研产出无关,因此该因素即为工具变量。
双重差分法:为了分离/消除时间趋势的影响,例如事物发展具有其自身的发展趋势,为实验组对象寻找时间趋势上可参考的对象(即对照组),对两组对象进行平行趋势检验,进而使用对照组对象的时间趋势变化来替代实验组接受干预前的时间趋势(反事实),实验组接受干预前后的效应之差与对照组时间线前后的效应之差的差值即为干预措施的因果效应(如下图示例)。对照组和实验组对象能否通过平行性假设则是该方法的关键。例如Azoulay等人(2019)的一项研究探究某一学科领域内超级科学家的离世对于学科发展的影响,采用了双重差分法尽可能地消除学科内在发展趋势对于研究目的的影响。
断点回归法:该方法的研究情境是在断点处实验组对象接受干预的概率发生跃迁,而断点邻域内样本并未显著差异,因此可选取合适的邻域范围来探究某一干预措施的因果效应。断点回归包括清晰断点和模糊断点两类情境,清晰断点情境下,断点唯一决定了研究对象是否接受干预,此时可将断点及其高阶项作为回归模型中的控制变量,进而计算干预措施的因果效应;模糊断点情境下,断点影响了研究对象接受干预的概率,此时可将断点及其高阶项作为工具变量使用,进而进行因果推断。断点回归法的核心是选择恰当的断点邻域和断点高阶项,并进行一系列的稳健性检验。例如Wang等人(2017)研究中小企业创新基金对于企业创新能力与业绩表现的影响,下图横轴表示标准化后中小企业创新项目得分,纵轴表示项目被资助的概率,在分值0处(断点)项目被资助的概率发生跃迁,而显然本示例中的断点属于模糊断点。
综上,因果推断方法中随机实验/受控随机实验适用场景有限、成本高昂,却是进行因果推断最直接和最有效的方法;工具变量法的数理逻辑性高于随机试验之外的其他因果推断方法,然而工具变量有效性的论证却是难点;断点回归法中的断点情境“可遇不可求”;双重差分法适宜探究具有时间趋势因素的研究,常与其他因果推断工具结合使用,但通常用于处理面板数据;而匹配方法对于模型的依赖性很强,且模型中可能存在遗漏变量,但是该方法的可操作性高于其它方法,且应用范围也更广。因此,一言以蔽之,因果推断的常用方法具有不同的优缺点和适用情境,而能够回答研究问题的研究方法才是最好的方法。
参与学术直播活动的近3600名观众踊跃提问,问题主要包括因果推断中组合方法的选择与使用,匹配方法中关键变量的选择及变量类型,面板数据的倾向值匹配,断点回归中的高阶项,交互项(interaction terms)、控制变量(control variables)和中介效应(moderating effects)的区别等。史冬波老师一一详尽解答,并分享了一些学习方法和建议。
参考文献:
[1] Kahn Shulamit, MacGarvie Megan J. How Important Is US Location for Research in Science? [J]. The Review of Economics and Statistics,2016,98(2):397-414.
[2] Azoulay Pierre, Fons-Rosen C Z, Joshua S. Graff. Does Science Advance One Funeral at a Time? [J].The American Economic Review,2019,109(8):2889-2920.
[3] Wang Yanbo, Li Jizhen, Furman Jeffrey L. Firm Performance And State Innovation Funding: Evidence From China's Innofund Program [J]. Research Policy,2017,46(6):1142-1161.
[4] 史冬波, 张子江. 人才计划与科学家职业流动[J]. 图书情报知识, 2020(2):42-50.
推荐书籍:
Angrist J D, Jörn-Steffen Pischke. Mostly Harmless Econometrics :An Empiricist’s Companion[M]. Princeton: Princeton University Press, 2009.
讲座回放入口:
讲座版权归主办方所有,仅供个人学习,严禁任何形式的录制、传播。一经发现将依法保留追究权。
制版编辑 姚志臻
END
学术活动 | 2020图书情报青年学者国际论坛(五)(10.28,线上参会)
学术活动|讲座纪要 李月琳 案例研究:战略规划人员如何搜寻信息?
学术活动|讲座纪要 步一 描述性推断之相关与回归:科学合作有哪些影响因素?