实证研究中常常忽视的一个点:该如何将“控制变量”的选择进行到底
最近,有朋友粉丝讨论,他们在投稿时遇到了“控制变量”如何选择的问题,这类问题包括:什么控制变量需要纳入、什么控制变量可以剔除,或者如何去寻找适合主题的控制变量。
显然,做好控制变量的选择,是咱们在实证研究中非常重要的一件事情!如果在选择过程中,控制变量的选定没有做到有理有据,可能会被学术同仁或者审稿人群质疑,甚至拒稿。
从实证研究角度来看,在回归分析中控制变量的作用是毋庸置疑的。日常的实证回归分析,我们主要目的在于讨论因变量和自变量之间的因果关系,但是一个回归分析模型又并不是只能有自变量和因变量,毕竟因变量的产生还可能受到其他因素的影响或干扰。
在一定程度上来说,如果对控制变量予以控制,可能会存在一下两个方面的问题:一是忽视其他因素影响,从而带来放大自变量影响的潜在问题;二是实证研究中常见的遗漏变量问题,模型忽视了其他重要因素的影响,由此可能导致因变量和自变量之间的内生性问题。当然,上述两个问题之间也可能存在紧密的联系。
虽然在实证研究中我们十分重视控制变量的选定问题,但是我们需要注意的是,并不是所有的因变量影响因素都要纳入,这显然会给我们研究带来极大的困难。所以,在选择控制变量时,我们需要注意几个问题:
一是控制变量的选定应围绕因变量来产生确定,而不能天马行空,随意搭配;二是控制变量的选定避免随意摘取的心态,毕竟因变量的影响因素较多,需要有条件或者有据可依地选择确定;三是控制变量的选定不是越多越好,你要知道任何一个经济现象产生(因变量)都可能是由千万个因素影响产生的,我们所能做的工作就是从其中选定某些重要因素开予以控制,控制变量就对因变量产生重要影响的因素来确定;四是控制变量的选定需要有理有据,可以有理论依据,也可以经验优先,不能无中生有地确定控制变量。
为此,在实证研究中,我们该如何才能更好地去选择控制变量呢?它们的确定选取有什么途径或者解决方案呢?
一是参考已有权威文章或者学者专家的研究,通过阅读已有权威文章来借鉴他们的模型设计,从已有文献资料中确定你需要控制哪些因素。当然,这种方法对你来说可能比较简便易行,很容易做到有据可循,仅仅寻找同类因变量的文献即可。
二是根据因变量产生或者可能受到影响的因素,这就需要对相关理论知识予以掌握和吃透,从现有的理论依据中寻找我们模型中需要予以控制哪些因素,且选定哪些因素是我们重点关注的对象,并将这些重点因素作为控制变量选定目标的最优选择集。
三是通过常识经验来分析判断,并以此来确定控制变量,这也是一种不错的方案,但是往往存在受到挑战质疑的风险,这是为什么呢?有的学术问题研究避免个人的主观臆断,经验虽然重要,但是个人主观意识太强,难以再学术交流上令人信服,所以在运用该方法时需要你强化理论阐述,多引用文献资料予以支持。