陆铭教授以审稿人的身份谈论文写作和审稿
凡是搞计量经济的,都关注这个号了
邮箱:econometrics666@sina.cn
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
来源: 经济学家茶座;作者: 陆铭, 上海交通大学特聘教授,博士生导师.
近日,因为审稿,以及收到的审稿报告,想起一些话,说给大家听听。
前两天,我将自己写的一份审稿报告和收到的一份审稿报告放在一起,在学生面前晒了晒。我对学生说,你们或早或迟,会成为审稿人,也会在各种报告会上批评别人的文章,那么,我希望你们记住两个C和两个P:constructive、professional、careful、polite。
审稿总是要批评的,批评是容易的,难的是建设性的批评。特别是对于实证研究,世人皆知,模型误设(mis-specification)、度量误差(measurement error)、内生性(endogeneity)是三个绕不过去的问题,从这三个角度去批评文章,基本不会错。但是,一份审稿报告如果只谈这三个方面的问题,怕是恰恰说明审稿人除了教科书之外,对所审的文章没有更深的理解。更重要的是,一篇文章的模型形式应基于理论与文献,变量的度量应该是在研究之前已经充分考虑的问题,内生性的解决并不容易,有经验的作者不会在这方面一点也不考虑。作为审稿人,我更愿意告诉作者这样一些信息:
他有一个研究中闪亮的地方,他没有意识到;他遗漏了重要的文献;他可能能够找到某个数据,从而可以看看从X到Y的某个机制,甚至可以检验几种机制哪个更重要;或者,从X到Y的机制不是作者所说的那样,在历史和现实中,故事是另一种可能性,更接近真实的制度背景;我可能还会建议作者,在一篇学术论文中,不要将政策建议讲得那么多;我还会建议作者对于文章的引言部分换个写法,会使得他的工作更加重要和有趣。……我会尽量要求自己所提的建议是可以做到的,从而使审稿意见具有“建设性”。我不会对一篇研究收入差距对某个事物的影响的文章说,收入差距是内生的,你应该用实验数据去做,因为用实验方法来改变收入差距,不说是不可能的,也至少是不道德的。我也不会建议作者运用自然实验的数据来研究户籍的影响,因为我知道,随机地给农民工发放城镇户籍,这件事从来没有过。
对于耗费了经济学家大量精力的内生性问题,我想多说两句。我绝对认为克服内生性偏误是重要的,也是研究者应该努力去做的。不过,我的想法是,计量经济学方法和因果关系识别在理论上并无直接对应关系。计量的研究策略(包括实验方法、IV、regression discontinuity、propensity score matching、DID等等)都只是用来避免(或缓解)由遗漏变量或双向因果关系所产生的估计偏误的。在使用了这些方法之后,研究者所看到的相关性更接近因果关系,而其是否真是因果关系,仍然需要看理论逻辑。因此,我不认为运用OLS方法分析截面数据的研究就一定不好,事实上,只要研究策略得当(比如运用了实验或自然实验的方法),从而保证了核心解释变量的外生性,OLS恰恰是最好且有效的估计。一些顶级杂志的文章也常常在OLS的基础上,运用一些研究逻辑来排除某些作用机制,从而更好地接近因果推论。另外,一些开创性的研究往往是从看相关性起步的,此类研究的重要意义往往在于提出了具有创见的问题,当然,如果能够用更接近于因果分析的研究策略,则是锦上添花。
是不是可以简单地从研究方法来判断研究的价值?方法是重要的判断标准,但恐怕不能作为唯一标准。举个例子吧:党员到底代表什么?是能力还是权力?要回答这个问题,可以用同卵双胞胎数据,做一下双胞胎之间的数据差分,那么,同卵双胞胎的能力作为遗漏变量就被差分掉了。如果同卵双胞胎之间一个是党员,一个不是,两者之间的收入有差别,那说明党员的确不只代表能力。如果同卵双胞胎之间的党员身份差别没带来收入差别,那就只能说,通常在截面上看到的党员身份回报只是因为党员的平均能力更高而已。
最近,我审的一篇文章运用截面数据的OLS分析发现了党员身份和教育水平之间有替代性,做法是将两者相乘做个交互项,并发现,在收入方程里这个交互项的系数是负的。对此,我当然可以批评作者,说教育和党员都是内生的,然后,建议他应该用双胞胎数据做一下。可是我没有,因为我相信,在理论上,党员身份和教育水平是否是相互替代的,这是个有价值的理论问题,恰恰因此,即使党员和能力相关,那么,当收入决定方程遗漏了能力的时候,也遗漏了能力与教育的交互项,如果真是这样,即使是用双胞胎数据进行差分,在残差项里的能力与教育的交互项也是差分不掉的。而从理论上来说,如果党员身份和教育水平是相互替代的,即使其系数存在遗漏变量偏误,只要符号方向不错,那么,就可以质疑“党员仅是能力的代表”这一说,因为如果真是这样,并且文献已经告诉我们能力与教育是互补的,那么,党员和教育就不会是互替的。由于看到了这一点,我建议作者将这一发现及其对于理解党员身份的性质的文献的贡献作为自己的亮点来说。
顺便再说说理论和实证的关系。有人认为,必须要在实证前面加个数学模型才能将机制讲清楚。甚至认为,在统计相关性之前,加上个数学模型才可以确认因果关系。读者不妨自己统计一下,在经验研究性质的经济学论文中有多少比例的文章并没有一个数学模型。比较一下有数学模型的和没数学模型的论文就知道,不能简单地批评说,没有数学就是没有理论。即使没有数学,实证研究对于模型设定、变量选取等等,仍然需要依赖于“理论”。
但是,至少有两种情况,使得实证文章中并不需要写一个用数学表示的理论模型。第一,既有的理论已经很成熟,实证要做的,只是看从X到Y的净效应有多大,到底哪种机制是成立的;第二,实证所要看的机制实在是太直接,不需要用一个数学模型表述的理论,而这个有待检验的关系本身是否成立才是研究者关心的,比如说,如果我们想检验一下教育里的“同群效应”(peer effect),即一个人的学习成绩是否受到其同学成绩的影响,这个看似简单的关系在实证检验中却非常难做,而且这个“同群效应”是教育经济学的基石。更广泛地来说,基于社会互动的人类行为的相互依赖性是社会经济学(social economics)的基石。那么,对于一个X到Y的统计关系,是否必须以一个数学表述的理论来作为其因果推论的前提呢?如果你的答案是肯定的,那么,我就要追问两个问题,对于一个统计上的X与Y的正相关关系,我们可以写一个X影响Y的理论,也可以写一个Y影响X的理论,我们是否仅以此就能确认在统计上的关系到底是X到Y的因果链,还是反过来?与利用某种实证研究策略(包括实验方法、IV、regression discontinuity、propensity score matching、DID等等)看到了X对Y的影响相比,一个数学表述的理论加上“从X到Y”的相关关系,是否更能用来确认X与Y之间谁因谁果?
说完constructive,再说professional就容易了。正如陈凯歌在电影《和你在一起》中批评他学生说的那句,“都对,但是不好。”专业的审稿报告就应该是富有建设性的,这说明,在审稿人的研究内,他知道他审的这项研究可以做得更好,而且这不是外行话。为此,好的审稿人不应轻易地接受非自己熟悉的领域的审稿要求,否则,说外行话就在所难免。我对“professional”的理解就是,审稿人与作者同样知道,甚至比作者更知道研究的前沿在什么地方,什么地方是可以做得更好的。技术永远是手段,而不是目的本身。好的审稿人不应该只是告诉作者存在某项技术,而是清楚地知道一种技术(或者研究策略)是否适用并且可行,从而值得推荐给作者。
对了,我不应该忘记说一句,好的审稿人还应该有一项非常重要的职业精神,那就是审稿的时间不要超过杂志所要求的时间,至少我自己一直这样要求自己,因为我将接受审稿的邀请作为对杂志和作者的承诺。不过,非常遗憾的是,我自己曾经有过两次经历,文章的两轮审稿经过了近2年时间。没有任何一家中文杂志说这是允许的,只能说,这是审稿人不够有职业精神。尤其是当我看到审稿人花了近两年的时间完成的审稿报告里,提醒我被解释变量(Y)的度量误差会引起系数估计的“衰减偏误”,我只好提醒自己“笑比哭好”,因为,事实上,“衰减偏误”只会在解释变量(X)存在度量误差时出现。
其实,所谓“careful”的第一个要求,就是审稿时不要自己出错。在我看过的中文杂志的审稿报告中,另一个常常出现的错误是,审稿人提出作者的解释变量之间存在共线性。其实,如果解释变量完全没有共线性,那么,就不需要多元回归技术来分析问题了,遗漏变量问题也就不是问题了。当然,高度相关的解释变量同时放在模型里,会使各变量的系数出现不显著的情况,这时,请不要轻易丢掉其中的一个(或几个),否则,当你这样做时,虽然剩下的变量系数显著了,但它的系数却可能存在估计偏误,因为,你把与它相关的变量放到模型的残差项里去了。通过减少解释变量的个数来增强模型中解释变量的显著性,这只能在问题足够重要、样本又非常小,而且作者只关心系数的方向时才可以,不过,现在这很难成为让人接受的理由。此外,好的审稿报告,不妨仔细帮作者找他文章中的错误,包括文字、格式与标点,更不用说表述上的欠妥之处了。
最后,Please be polite。你可以拒绝审一篇稿,如果你实在觉得文章没有改好的可能,写审稿意见也是浪费时间。我对于自己接受审稿邀请的文章,绝不会说其中存在的错误够得上“愚蠢”、“幼稚”之类的形容词。特别是对于那些刚刚在职业生涯上起步的年轻学者来说,告诉他哪些地方可以做得更好,就够了,审稿报告不需要任何形容词。我自己也犯过错,在发表了的文章里,还存在着因为不够仔细而导致的不可原谅的错误。不过,我总是觉得,有错是可以改的。只要不是明知故犯,更不能知错不改。
我写这篇随想是要对国内的审稿提点建设性的批评,就象我认为写审稿报告也尽量建设性一样。学者的基本职责是知识的生产和传播,而其方式无非三种:第一种是自己创作;第二种是培养学生,让学生延续自己的创作;而审稿则属于第三种,即通过帮助他人来生产和传播知识。在这个意义上,审稿是值得学者投入精力的事,尽管这只是在创造某种正的外部性。正的外部性之所以成为“外部性”是因为这项工作不能直接给自己带来回报,所以,太认真也难免显得有点傻。不过,学术就是这样的职业,傻事做不做,做得如何,完全看你自己。不管怎样,作为审稿人,不需要向任何人证明你比别人聪明,如果真要证明点什么,你就去证明,你的意见可以切实地帮助作者做得更好。我就是这样想的。
可以到计量社群交流各种论文写作问题。
推荐阅读:
2.1998-2016年中国地级市年均PM2.5数据release
4.2005-2015中国分省分行业CO2数据circulation
5.实证研究中用到的135篇文章, 社科学者常用toolkit
可以到计量经济圈社群进一步访问交流各种学术问题,这年头,我们不能强调一个人的英雄主义,需要多多汲取他人的经验教训来让自己少走弯路。
计量经济圈是中国计量第一大社区,我们致力于推动中国计量理论和实证技能的提升,圈子以海内外高校研究生和教师为主。计量经济圈绝对六多精神:社科资料最多、社科数据最多、科研牛人最多、海外名校最多、热情互助最多、前沿趋势最多。如果你热爱计量并希望长见识,那欢迎你加入到咱们这个大家庭(戳这里),要不然你只能去其他那些Open access圈子了。注意:进去之后一定要看小鹅社群“群公告”,不然接收不了群息,也不知道怎么进入咱们独一无二的微信群和QQ群。在规则框架下社群交流讨论无时间限制。