学术活动|讲座纪要 党建伟 因果推断之工具变量:标准必要专利许可条款有哪些决定因素?
供稿|司湘云
工具变量法是经济学领域常用的因果推断工具,如何将该方法更好地应用到管理学研究中,以提高研究的深度和严谨性?“面向图情档研究问题的研究方法系列讲座第二期”第三讲特邀同济大学党建伟副教授开展题为“因果推断之工具变量:标准必要专利许可条款有哪些决定因素?”的讲座。党建伟副教授详细讲述了工具变量方法的基本知识及其在管理学领域中的应用,并以许可条款的决定因素研究为例阐述了该方法的具体应用过程。
1 工具变量方法简介
以计量经济学领域的典型例子开始,即工资水平与受教育年限二者间的关系,回归方程如下图,显然二者呈正相关关系。然而存在某些变量,例如个人能力,既影响受教育年限(自变量x),也影响工资水平(因变量y),会使估计系数(β)产生偏差。这类变量被称为遗漏变量(omitted variables),是造成内生性问题(endogeneity)的主要原因之一。
内生性问题的通用表达式如下图,即自变量x与误差项(u)的协方差不为0。除了遗漏变量外,造成内生性问题的其他原因包括测量误差、解释变量与被解释变量互为因果关系。遗漏变量的问题普遍存在,而通常解决该问题的方法是将遗漏变量作为控制变量加入回归模型中,但是依然存在部分遗漏变量无法观测或者无法度量,本例中个人能力因素的定义和测度就不易实施。工具变量法便是解决这类问题的主要方法。
工具变量(z)需要满足:①变量z必须是外生性变量,即变量z与误差项(u)的协方差为0;②变量z必须与自变量x相关,即二者的协方差不为0。如此,方能通过变量z与因变量y之间关系的观测得到自变量x与因变量y之间的关系。
工具变量的直观理解图如下,工具变量z与因变量y无直接因果效应,变量z只能通过自变量x才能对因变量y产生影响,因此可以通过探索因变量y与工具变量z之间的关系来揭示因变量y与自变量x之间的真实关系。
例如,学者Card(1995)以个人居住地与四年制大学间的距离为工具变量,探索受教育年限与工资水平间的关系。该研究的两个假设条件如下图。若个人居住地距离大学具有较远的距离,那么他/她选择大学教育的可能性就会较小,即距离会影响个人的受教育年限,而控制地域间工资水平差异后,居住在大学附近与个人工资水平并无直接因果关系。
工具变量法的计算原理如下图,可使用Stata软件的ivregress 2sls命令对数据进行处理和分析。
2 工具变量应用的主要问题
2.1 无效的工具变量
无效的工具变量(bad/invalid instrument)指该变量不是外生变量,而是与因变量y具有某些因果关系,即工具变量z与误差项的协方差不为0,进而导致估计结果存在偏差。J假设依照在工资水平与受教育年限之间关系的示例研究,考虑中国情境,以居住地与四年制大学的距离为工具变量,那么该变量可能反映了研究对象的家庭受教育程度或家庭经济状况等家庭背景条件,这些要素会对个人的受教育年限产生影响,同时这些因素隐含的社会资本因素也会对个人的工资水平产生一定的影响,因此该工具变量就可能是无效的工具变量。
面对无效的工具变量,将其作为解释变量加入回归方程中进行处理并不可行,此时需要进行更加缜密的逻辑论述以阐述该工具变量的合理性,或者对多个工具变量的处理结果进行比较分析等。
2.2 弱工具变量
弱工具变量(weak instrument)指工具变量与自变量x的相关性较弱,这可能会导致估计系数产生偏差,也会影响显著性检验结果的正确性。在回归方程中只存在一个工具变量的情况下,通常要求F值大于10。
总体而言,工具变量使用过程中的推荐做法包括:①针对无效的工具变量问题,建议从直观上、理论上和已有实证研究及其研究结果等角度多方面地评估所选工具变量与被解释变量间的因果关系,以降低使用无效工具变量的风险。值得注意的是,并无确切的方法可以证明所选工具变量的有效性,因此研究人员只能尽可能地减少无效工具变量问题的出现。②针对弱工具变量问题,可以使用相关的方法与工具对候选的工具变量进行检验,如F检验等。
3 管理学研究中工具变量的应用
在管理学领域,学者们也逐渐认识到内生性问题的普遍性与严重性。例如,管理学中典型的研究问题是决策的差异如何导致绩效(研发、财务等方面)的差异,然而管理决策并不是随机发生的,决策者通常将绩效预期考虑在内,因此决策与绩效二者互为因果关系,这便导致了内生性问题。同时,组织中的多个决策并非完全独立,而是相互关联,那么决策就不能被视为完全的外生变量,但管理学研究中通常假设决策是外生变量,再进一步探索决策与绩效之间的关系。
管理学领域对于工具变量法的使用尚不充分,部分研究并未使用工具变量法来解决内生性问题,也有部分研究在方法使用上存在不严谨的地方。可能的原因包括:计量经济学教材中鲜少涉及管理学场景下的潜在工具变量的讨论;企业层面的工具变量难以获取;管理学研究中使用大量的控制变量而忽视遗漏变量造成的偏差等。
下文将详细介绍四个工具变量在管理学研究中的应用,期望这些研究能够为我们未来使用工具变量来解决管理学问题带来启发。
案例一:学者Chai和 Freeman(2019)探究临时性的迁移(例如,参加学术会议)是否能够增加合作机会以及提高合作成果的影响力。已有研究通常假设学者参加学术会议是一个随机性的决定,但是实际上是否参会属于战略性选择问题,例如时间宽裕程度、已有合作网络的成熟度、对会议的预期等因素可能会影响学者们的选择。该作者借鉴经济学研究中的工具变量,以参会人员居住地与会议地点的距离作为是否参会的工具变量,来探讨参会与合作机会之间的因果关系。值得注意的是,会议地点并不是一个随机变量,距离会场的远近实际上确定了参会学者的区域地理位置,而从区域创新系统的角度思考,地理位置对于合作及合作绩效会有一定的影响,因此该研究选择的工具变量也并不是一个非常有效的工具变量。
案例二:在跨国公司中,总公司会向子公司外派人员,而外派人员也可能会引起总公司对子公司的关注与重视,学者Plourde等人(2014)的研究就探究了二者之间的关系。该研究使用了两个企业无法控制的变量作为工具变量——分公司所在地的政治稳定性和教育水平,即在政治不太稳定的区域,总公司倾向于雇佣当地的职员以维持分公司的运转;在教育水平较高的区域,总公司倾向于雇佣当地人员而减少外派人员。
案例三:企业在技术吸收能力强的地区开展大规模的投资项目时,研发过程会尽可能地减少外部知识的使用,以降低被他人模仿的风险。学者Giarratana和Mariani(2014)使用专利数据对内外部知识的使用与研发投入之间的关系进行研究。回归方程如下图,因变量是内外部知识使用的比例,解释变量包括研发投入等。企业的研发投入并不是外生变量,因而,该研究使用问卷调查的方式询问专利研发人员的研发动机(个人兴趣或者公司驱动),由于企业并不重视个人出于兴趣的无计划的发明创新,因此可以使用该变量(研发动机)为工具变量来区分企业是否对该项目进行研发投入。此外,当政府向企业提供资助时,企业更倾向于进行研发投入,因此该研究还将政府资助作为企业研发投入的工具变量。需要注意的是,专利人员的研发动机并不能区分公司研发投资规模的大小;政府对企业的资助也取决于企业的其他因素,进而影响企业对内外部知识的使用。
案例四:首次公开募股前,企业投资方经常会更换企业CEO,而CEO的更换与企业IPO的估值和运营绩效之间也具有正相关关系。管理学研究中,主要风险投资人距离公司较近时,则可能对公司进行更多的监管,以便及时纠正CEO的决策失误,而距离较远时,由于直接监管的不便利性,其更倾向于更换CEO。因此,学者Chahine和Zhang(2020)以企业与主要风险投资人之间的距离为工具变量,探索了前述两个变量之间的关系。
上述四个研究案例带来的启发如下:①建议从经济学文献中学习工具变量的选择、使用和论证过程;②建议重新考虑控制变量与工具变量的使用,以使研究结论更具启示性;③在设计问卷时,通过精巧的设计,可以考虑增加部分可以视为工具变量的测量项,这可能有助于未来研究的深入;④基于管理学的理论,建议深入探讨管理决策与外部因素之间隐藏的关联,在此基础上探究决策与绩效之间的关系。
4 研究示例:许可条款的决定因素
在标准制定过程中,无可避免地需要将部分专利技术方案纳入标准,该类专利即为标准必要专利(Standard Essential Patent, SEP),而专利权持有者需要声明其持有的标准必要专利的许可条款,否则标准便无法执行。许可条款的设定既取决于企业在产业链中的定位和获利战略,也受到专利的技术价值、权利范围及其在减少知识产权风险的期权价值等因素的综合影响。那么,哪些关键因素会影响专利权持有者的专利许可策略?
本研究主要考虑专利权持有者的两类许可条款策略:是否愿意无偿许可和有无回报性的许可条款。值得思考的是,这两类决策是否互相影响?例如,免费许可的条件下,专利权持有人可能更倾向于提出回报性许可条款。另一方面,影响两类决策的因素有哪些?进一步地,两类决策下存在共同的影响因素,那么如何评估每个因素的影响?
经上述分析可知,是否愿意无偿许可和有无回报性的许可条款两个决策相互影响、互为因果关系,显然中间存在内生性问题,因此无法针对一个决策单独进行回归分析,必须构建联立方程组进行处理。本文构建的研究模型如下图,其中因变量分别为是否无偿许可(free)和有无回报性许可条款(reciprocal),两个因变量又同时是彼此的解释变量,变量X3是二者共同的解释变量,变量X1和X2分别是二者的工具变量。解决此类问题的关键是寻找只影响其中一个因变量的工具变量。之后,可使用三阶最小二乘法进行计算,在Stata软件中可使用reg3命令。
本研究选择专利的权力范围作为是否无偿许可的工具变量,即专利的权力范围越广泛,使用者选择可替代性专利的可能性就越低,专利权所有者选择无偿许可的可能性也越低。经检验,二者的相关性确实存在。而专利的权力范围与回报性条款之间并无直接的因果关系。
回报性条款的价值与不确定性有关,即不确定性越大,回报性条款的可能收益就越大。不确定性可使用专利权剩余期限来度量,因此,本研究选择专利权剩余期限为有无回报性条款的工具变量。同样地,该工具变量与是否无偿许可之间并无直接的关联。
本研究的数据来源与分布如下图:
参与直播活动的1700余名观众积极提问,问题包括:内生性问题与选择性偏差、工具变量的选择与解释、如何处理互为因果的变量、不同因果推断方法的适用问题与场景、数据获取与工具学习、期刊论文投稿经验等。党建伟副教授一一详细解答,并推荐了相关书籍与文章。
参考文献:
●Huo D , Dang J W, Motohashi K . Empirical Analysis of License Policy for Declared Standard Essential Patents in Standard Setting[C]//80th Annual Meeting of the Academy of Management, Vancouver, Canada, 2020.
●Chai S, Freeman R B. (2019). Temporary Colocation and Collaborative Discovery: Who Confers at Conferences. Strategic Management Journal, 40(13), 2138–2164.
https://doi.org/10.1002/smj.3062
●Giarratana M S, Mariani M. (2014). The Relationship between Knowledge Sourcing and Fear of Imitation. Strategic Management Journal,35(8),1144–1163.
https://doi.org /10. 1002/smj. 2150
●Plourde Y, Parker S C & Schaan J L. (2014). Expatriation and Its Effect on Headquarters’ Attention in the Multinational Enterprise. Strategic Management Journal, 35(6),938–947. https://doi.org/10.1002/smj.2125
●Chahine S, Zhang Y (Anthea). (2020). Change Gears before Speeding Up: The Roles of Chief Executive Officer Human Capital and Venture Capitalist Monitoring in Chief Executive Officer Change before Initial Public Offering. Strategic Management Journal, 41(9), 1653–1681.
https://doi.org/ 10.1002/ smj.3197
●Card D. (1995). Using Geographic Variation in College Proximity to Estimate the Return to Schooling. In: Christofides L, Grant E K, Swindinsky R. (Eds.), Aspects of Labour Economics: Essays in Honour of John Vanderkamp. University of Toronto Press.
推荐书籍与文献:
●Arellano M, Bover O. (1995). Another Look at the Instrumental Variable Estimation of Error-components Models. Journal of Econometrics, 68(1), 29–51. https://doi. org/10.1016/0304-4076(94)01642-D
制版编辑 | 卢慧质
学术活动|讲座纪要 闫慧 田野调查:手机素养会失灵吗?
学术活动|讲座纪要 孙永强 问卷调查与结构方程模型:信息差异会影响人的信息采纳决策吗?
学术活动|讲座纪要 史冬波 因果推断的反事实框架: 如何选择合适的方法?
学术活动|讲座纪要 李月琳 案例研究:战略规划人员如何搜寻信息?
学术活动|讲座纪要 步一 描述性推断之相关与回归:科学合作有哪些影响因素?