查看原文
其他

博士如何高产?一位博二学长的现身说法

2016-08-08 徐定德 学术中国

博士如何高产?一位博二学长的现身说法


来源:经管之家论坛(ID:bbspingguorg-weixin) 作者:徐定德   编辑:学妹


如何写出高质量有创新性的论文、成为高产多产的科研工作者,是很多博士与“青椒”共同面临的问题。基于此,经管之家特别策划了本次访谈,活动请到了90后的高产博士徐定德,他将现身说法,讲述自己的学术科研历程,分享自己的经验心得。做一项研究不容易,既然选择了做,就要好好做,方不辜负这美好的青春。越努力,越幸运,与君共勉。 



 (提示:此部分内容稍长,干货不少。预计完整阅读约需要15分钟)


访谈1:博士阶段的论文写作、期刊投稿、学术心得

经管之家:


欢迎徐定德博士参加经管答疑特邀访谈,作为一位90后博三学生,您已经发表(接收)19篇ssci/sci/中文EI/CSCD/CSSCI,可谓一名高产博士。能否结合您的论文写作与科研项目经历,为大家介绍下博士生如何更好的写作和发表论文?分享下你的科研技巧与心得


徐定德博士:


谢谢经管之家的邀请。非常荣幸能有这次宝贵的机会来和大家交流一点自己的科研与学习心得。其实,我也只是学术道路上的一个小兵,可能学术才刚刚入门。只能就一些共性的东西提点比较泛的个人看法,细节的东西可能还得等有时间单独开贴和大家讨论。不当之处请大家批评指正。


我个人现在这阶段写文章的“套路”大概是按照以下这个大的步骤进行的。


先是找到一个感兴趣的点(这个点可能与我们自身的成长环境有关,自己想去探索;也可能是跟手里的数据有关,自己想通过数据来写一点文章;也可能是导师对我们的安排,多种多样),然后通过这个点衍生出几个关键词,利用CNKI,web of science,google scholar,百度学术等多种渠道找一些文献(经典的+最新的,最好是一些比较好的期刊上的文献)。通过读题目、摘要和泛读文献,剔除一些和研究主题不相关的文献,锁定15篇左右与研究主题密切相关的文献,然后进行细读,并做好归纳笔记(归纳的点后面会详说)。


我自己的经验是:一般读15篇左右的外文文献,很多共性的东西都会明白(如研究内容主要包括哪几块,研究方法主要用的哪些,研究区域主要集中在哪些国家/区域等),接下来,可进一步看能否找到自己想做研究的切入点,即文献批评点。如果能找到,可罗列2-3点切入;如果找不到,可能需要再仔细的阅读一下文献,或反思下自己找的文献是否经典,或再扩大一点阅读的范围,直到找到好的切入口为止。


就我个人的经验,文献批评点可以从已有研究中的很多地方找到,可着重关注一下。主要集中在以下几个地方:


1题目和摘要

有的研究直接题目就点明了要做什么,而要做的基本就是比较新的。比如探究A因素对xx的影响。A因素可能就是已有文献中研究的比较少的(相比于此篇文献前的其它文献)。除了题目外,有些文献摘要第一句就会写关于xx问题的研究主要集中在A,B,C等方面,但(外文文献中经常使用however, but等词转折)关于D对xx问题的研究比较少,这也是切入点(文献批评点)。


2引言主题句或末尾句或段落中总结归纳的句子

外文文献经常将文献批评点作为段落的主题句提出,然后用几句话引用一些文献来佐证自己的观点。当然,也有先通过一些文献来说明一个现象/问题,然后在段落结束时用一句话总结。这是两种比较常见的方式。我们可以从引言的主题句中去找我们研究可能的切入点,在具体写作过程中也可以参考这种写作方式。


3结论与讨论

在这部分中,可能需要注意两个方面。一是作者通常会交代自己的研究与其它同类研究的异同,可以将“异常”的地方摘录出来,因为这可能作为自己研究的文献批评点。比如,我们经常看到有研究第一句话这样说:许多研究发现,A对xx问题影响极其显著,但其作用方向却并不一致。然后作者举例说,B的研究结果是正向,C的研究结果是负向。这个可以用到自己的研究假设中(如承接上面的例子,我们在研究中用到A这个指标,就可以假设:A对我们研究的问题有显著影响,但作用机制并不明确),以及文献批评点中去(即已有研究中,A对问题的作用机制并不明确,需要进一步验证,所以有了此项研究);二是在英文文献中,作者一般会在这部分提自己研究的创新点在哪里,研究不足在哪里(将来的研究空间)。可把这部分摘录出来,作为自己的研究笔记。


当我们仔细整理10-15篇与研究主题相关的文献后,对比一下就会发现,有些文献的切入点和提出的不足都是相似的,这时就可以把这种点提出来作为自己研究的切入点,并引用这些文献来说明自己的观点。不过,也有可能仔细看了这10-15篇文献后,也没能看出这些研究在哪些地方有共性的批评点,这时可能就需要自己归纳了。比如我自己在近期的一篇研究中就发现,关于xx问题的研究,基本上都是集中在发达国家的城市,集中在A,B,C三种类型,少有研究关注发展中国家,关注农村,关注D对xx问题的影响。我就以此作为我文章的切入口之一进行论述(还做了一个表格来佐证我的观点)。

 

这一大的部分看似简单,其实是最耗时,也最难的。在我个人近期的研究中,这部分所占的时间基本占到我整个研究过程时间的75-80%。这部分相当重要,可能很多人都写不好。我早期的文章就是不大明确这部分想表达什么(老是在说做我这项研究的政策意义,背景之类的东西),切入口也没找好(模仿其他人的研究,切入口的点在这个圈子里都被写“烂”了),主题句不明确(这里写一点,那里写一点,有时根本没有主题句),所以早期的英文期刊投出去基本一投就被拒(因为主编会收到很多的投稿,直接看一下摘要和引言没看到啥他(她)感兴趣的点,或根据他(她)的专业知识判断我找的切入点没有啥新意,就直接委婉的拒稿了)。直到近期明白这种写作“套路”后,文章基本写出来投稿都会被送审的。近期投的几篇文章直接很快就送审了(有一篇很好的文章当天投,当天就送审了)。所以,建议多用点时间在这个部分。


文章切入点找到了,那么后续文章的主要研究内容、研究目标、研究方法就自然就有了。按照这种套路写下去就不会有太大的问题了。然而,在后续的写作过程中,可能还需注意的部分,我个人的经验有以下几点:


1文献综述的撰写


与前面部分提到的切入口相对应,文献综述部分极其考验个人阅读质量和总结归纳能力。文献读的不透,没抓住关键点,那这部分可能会写不出来,或者写出来也极其糟糕。我个人早期是不会写这部分的(看我早期发表的文章就知道了),那时有很重的模仿痕迹(其实,根本就是没意识去找所谓的切入口,基本是数据驱动,看已有数据能做什么),只是罗列xx做了什么,xx做了什么,归纳能力也不强,很散。身为过来人,我的建议是可以找同领域top期刊上的好文章,看看其他学者是怎么写这部分的,可模仿着其行文方式来写。这是一项可以锻炼的能力,多写一些文章,有意识的锻炼自己,注意总结归纳相信很快能力就提升上来了。


2理论框架的梳理、指标的选取和研究假设的提出


早期,我个人不熟悉人文社会学科写作的“套路”,经常会省略理论框架这一步。直到有位审稿人提出,我选了一筐指标,但这些指标选的没有啥依据。根据常识,影响XX问题的指标可以选几个,也可以选几十个,甚至几百个,所以他(她)建议我补充我研究的理论支撑是什么,研究框架是什么,要在这个的指导下选取指标开展研究。我个人经历了很长的时间,早期文章被拒很多次才明白这点。同理,理论框架有了,指标才会有。指标有了,研究假设才会有。研究假设通常需要根据已有文献来(所以在阅读文献时,可以将一些常见指标对xx问题的影响结果进行归纳总结的。即总结这些指标是否对xx问题影响显著?作用方向怎样?)。当研究中有其它研究从来没有用过的指标时,需要论述下这个指标对研究问题可能的影响方式(是正的,还是负的,还是有正有负相互影响),进而做出研究假设。

 

此外,有一点需要注意,有时并不是已有的研究框架就能涵盖研究想要解决的所有问题。

 

即在已有理论框架隐含的假设前提下,该理论框架在某些层面不能解释我们现在做的这项研究出现的一些现象。这时,可能需要对已有的理论框架进行修正(比如,修改假设条件,增加维度等),提出一个新的/修正后的研究框架来指导后续的研究(这也是为什么理论框架一直在往前发展的原因)。同时,在引言中也可以将现有理论框架不能解释xx问题的这种现象作为切入口,用一段话进行论述。


3研究方法的撰写


研究方法这部分不可少,但有时限于篇幅,可对这部分进行简单描述即可。比如,我们经常在写作前就瞄准好了一个目标期刊,而这个目标期刊有字数限制(中文期刊一般8000-10000字,外文期刊一般8000-10000字符)。通常,一项研究一般要含引言、文献综述、方法(又细分研究区和数据来源介绍、研究框架介绍、指标选取和假设、研究方法等)、研究结果、结论与讨论几大部分,怎么在有限的字符/字数内做好行文安排,在这明确文章切入点后应当对各个部分有个篇幅安排的考虑(后文有详细介绍)。

 

我个人早期写文章从来没有整体布局的思想,都是想到哪写到哪,那时秉持的观点就是能写出来文章就不错了,不用管其它的,先写出来再说。所以,按照这种思路走,我早期的文章是“又臭又长”。投稿时才发现很多期刊有字数限制,那时真是欲哭无泪。自己好不容易写出来的东西,删哪里都感觉有点舍不得。但文章已经写出来了,超过期刊字数了,要删减一部分,怎么办呢?那时我一般就去删研究方法介绍的部分。比如研究要用有序多分类logistic回归这一经典模型,我在初稿中详细的介绍了这个模型的推导公式,后来为了节约篇幅(字数),我直接用一小段话点明为什么我要用这个方法,在这个方法中我将做哪些检验,我将报道哪些结果就完了。这是逼不得已的笨办法。这件事给我的启示是在文章思路拟好后,一定要有一个全篇布局的考虑。即研究字数在8000字符左右,我要怎么安排以上提到的各个部分,每个部分大概要占多少页。这个心里要有谱。这样在具体写作时可以按照这个限定去不断压缩精简文字,以达到效果。


4研究结果、结论与讨论的撰写


在外文文献中,研究结果、结论与讨论的写作套路一般有两种。一是研究结果一部分,结论与讨论一部分;二是研究结果和讨论一部分,结论与启示一部分。我个人倾向于用第一种(我早期用的是第二种),研究结果集中报道关键的部分,不做过多的延伸。结论与讨论部分重点对比与国内外同类研究的异同,并说明存在差异的原因。


5摘要的撰写
 

摘要的撰写一般是在研究结果,结论与讨论部分完成后才写。摘要和引言部分是文章的“门户”(编辑第一眼看的基本是题目,摘要和引言,以判定是否有必要再看下去)。摘要的撰写视期刊摘要字数要求而定。我个人一般的写作套路是这样:

 

关于xx问题的研究一直是A,B,C(哪些学科)研究的热点和焦点。然而,研究多关注a,b,c(大的影响因素)对xx问题的影响,少有研究关注d(文章的切入点因素,可以包括指标、研究区域,如发展中国家)。利用xx方法获取xx数据,得到样本量xx(数据基本介绍:含抽样方法、样本量、研究区域)。构建xx模型探究d对xx的影响(研究主要做的啥)。结果发现:1)····;2)····。该项研究可以弥补xxx/加深对xx问题的理解(研究的意义)。

 

我这种摘要的写作方式比较完整,一般写作下来字数在240-350之间。如果期刊没要求,可以直接用。如果期刊有要求,直接省去头部和尾部。直接交代利用xx数据,做了什么,得到什么结果就行(这样可以将字数压缩在100字左右)。

 

按照我前面提到的摘要和引言部分的写作方式,如果文献真的读到位了,切入口(创新点)找到了,根据我个人近期的投稿经历,投出去就直接被拒的可能性会大大减小。主编这关过了,那文章只用再说服2-3个审稿人基本就没问题了。

 

PS:除了上面提到的部分,还有一点可能也需要注意。就是图表的制作。我个人有农林经济管理和地理学的交叉背景。在介绍研究区和数据来源时,我会放一个区域图,使得表达比较直观。在计量经济模型的结果输出时,我会使用stata软件的输出命令,输出的表格紧凑,简单修改一下就能用(可以节约很多时间),也很美观。所以,建议大家增强一下图表制作的技巧。这些东西看似外在,但其实都在给文章加分。


综合上面所述,按照一篇文章的行文逻辑,我尝试性的做了如下这个文章表。


A对XX的影响研究——A case study of xx, China

 

摘要:关于xx问题的研究一直是A,B,C(哪些学科)研究的热点和焦点。然而,研究多关注a,b,c(大的影响因素)对xx问题的影响,少有研究关注d(文章的切入点因素,可以包括指标、研究区域,如发展中国家、农户)。利用xx方法获取xx数据,得到样本量xx(数据基本介绍:含抽样方法、样本量、研究区域)。构建xx模型探究d对xx的影响(研究主要做的啥)。结果发现:1)····;2)····。该项研究可以弥补xxx/加深对xx问题的理解(研究的意义)。

 

关键词:d,···(其它关键词),研究区,China

 

1引言(4-5段话,1页左右)

切入口1(主题句)。引用文献佐证自己观点(1段)。

切入口2(主题句)。引用文献佐证自己观点(1段)。

切入口3(主题句)。引用文献佐证自己观点(一篇文章2-3个切入口基本就可以了)。

为什么研究d对xx的影响是重要的?(一段话分几点陈述为什么要选d,要选现在这个研究区来做此项研究——有点交代背景的意味在里面)

文章要做什么?(文章主要想做的东西是什么,即文章的研究目标)

[文章的后续行文安排](这段可有可没有,可视具体情况而定)

 

2文献综述(3-4页,重中之重。为什么说这部分重中之重,因为这部分是支撑引言部分的切入口的,这部分写的不能说服人,那切入口找的并不成立,这可能导致直接退稿。此外,这部分还会支撑后续研究假设的提出,结论与讨论部分的撰写。总之,整篇文章都是环环相扣的)

围绕切入口1论述综述

围绕切入口2论述综述

围绕切入口2论述综述

[可罗列表格佐证自己观点](表格可加可不加)

 

3方法(4-5页)

3.1研究区与数据来源介绍

3.1.1研究区介绍

研究区介绍(1段)

3.1.2数据来源

数据来源介绍(1-2段,可含区位图)

3.2理论框架和指标选取

3.2.1理论框架

介绍与研究主题相关的理论框架有哪些,其各自隐含的假设条件和适用条件有哪些。对现有研究问题,已有的研究框架能否很好覆盖。若能,则使用能覆盖的框架;若不能,研究在已有框架上要做哪些修正(2-3段)。

3.2.3指标选取

研究要测度什么?其自变量和因变量分别是什么?用哪些具体的指标进行测度?(3-4段,视具体情况而调整,下面含表格;有时,还需要对一些概念进行界定,这种界定可放在段落内,也可视情况放在表格内)。

3.3计量模型的建构

方法的简单介绍(可1段,可2-3段,视篇幅而定。同时,可将因变量和自变量间的函数关系式表达出来,这样比较直观)

 

4.研究结果(2-3页)

切入口1对应的结果(1-2段)。

切入口2对应的结果(1-2段)。

切入口3对应的结果(1-2段)。

[总结](可有可没有,1段)

 

5讨论(2页左右,这部分与前面提到的文献综述及研究结果部分息息相关。前面工作做扎实了,这部分可能才能写得有深度,给人留下深刻印象)

切入口1对应指标和已有文献指标异同。结果不同其可能原因是什么(1段)。

切入口2对应指标和已有文献指标异同。结果不同其可能原因是什么(1段)。

切入口3对应指标和已有文献指标异同。结果不同其可能原因是什么(1段)。

相比于以往研究,文章有什么创新点(1-2段)。

文章存在的不足(将来可进一步研究的空间)(1-2段)

 

6结论与启示(1-1.5页)

再次强调文章的研究目标是什么,研究做了什么(1段)。

结论1(1段)

结论2(1段)

结论3(1段)(一般文章就3个结论)

政策建议(1-2段)(这个不用提太多,因为国外的学术期刊一般更关注学术上对xx问题的认识是不是有帮助,能否吸引更多的读者,对所谓的政策建议不是太感兴趣)

 

参考文献(2-3页)

一般而言,文献引用最好不少于20篇。我看到的比较好的研究文献引用有六七十篇。我近期的文章参考文献也经常达到50篇左右。其中,既有经典的(如提出xx问题的研究,提出xx概念的研究,创造性的提出xx方法的研究。与研究主题相关的引用率比较高的实证研究),也有新的研究(如近3年在这个研究主题上的实证研究)。还有经典与最新研究间过渡的一些研究。

 

参考文献的合理引用也能帮助说服主编和审稿人。经验老道的主编,一看文章引用的参考文献大致就能判断我们对研究主题的文献掌握情况怎么样,引用的这些文献能否支撑前面提到的几个切入口。若主编决定不能支撑,文章可能会被退稿;如果觉得能,那送审的几率增加。此外,参考文献的合理引用也能帮助主编找合适的审稿人,进而加快文章审稿速度。所以,任何一个小细节都可能决定文章的成败,不可疏忽。

 

我个人关于学术写作的一点心得就在上面这些内容里面了。需要特别说明的是,不是说按照我上面提到的“套路”就真的能发表高质量的文章了。影响一篇文章发表的因素有很多,如文献查找能力、文献阅读能力、归纳整理能力、计量功底、写作技巧、期刊主编个人偏好等。我上面介绍的“套路”也只是我个人的一点实践经验,并非什么万能钥匙,只是按照这个“套路”去做可能会稍微缩短一些创作的时间,仅此而已。所以,不要怀着侥幸的心理,随便读几篇文献就认为自己找好了切入口,就匆忙的去写作。这样出来的文章可能投一般期刊还行,但真的投好的期刊(不管是国内外),都过不了对研究领域很熟悉的主编的法眼的。所以,与其浪费很多时间在投稿上,不如多发点时间在切入口的寻找上。在我个人看来,“坐得住冷板凳”是对一个人基本学术能力的考验。计量、学术写作技巧可以通过锻炼提升,但好的idea的产生是非下苦工不可的。

 

此外,我自己还是学术上的一个小兵,也没发表啥高质量期刊,囿于眼界和学术的积累,以上所说难免有误,言语不当之处还请见谅。

 



访谈2:博士阶段如何解决计量与统计学习问题?

经管之家:


两年前,定德曾经在论坛发表文章,介绍了自己作为一个外行身份出道,在学习计量统计旅途中的真实记录、心得感受和得失成败;同样,参与论坛的经管答疑也有一年了,在这里,可否与大家系统的分享一下博士阶段,如何快速突破计量与统计软件,突破实证论文?


徐定德博士:


研究方法是实证研究中比较重要的一块,这是大家公认的。然而,很多人却被卡在这关过不了。被方法论卡住会出现很多问题,其中有三个问题比较典型。一是看文献吃力;二是自己有很好的idea,却不知道怎么用软件实现自己想要的;三是有了好的idea,懵懵懂懂也知道一些研究方法,懵懵懂懂的用软件做出了结果,却没法确认自己做的对不对,老是怀疑自己的结果。在没有找到合适的契机提升自己的方法论能力前,很多人都徘徊不前,慢慢的被磨灭了研究激情。


以上三个关于方法论的典型问题我都遇到过,且被困住了很长一段时间。在那段时间,我花了很多心思选了很多关于统计的课,就想把方法论这关过了。然而,即使我选了很多统计课,且每门课都认真听,但是到具体做实证研究时,我早期还是不明白要怎么去做,很多文献中提到的一些专有名词还是看不懂(如内生性、稳健性估计等)。直到后来有次偶然的机会发现伍德里奇的《计量经济学导论》,开了我计量的大门。


关于怎么自学计量,以及自学计量中的一些心得体会,我在早期发的帖子中有详细的描述,感兴趣的坛友可链接看看。链接:一个外行的计量经济学学习之路;一个外行的计量经济学学习之路二——经管答疑有感


回到关于计量与实证的近期心得,在前面两个大问题中,我分享了我做微观实证研究的过程以及一些搜集数据的过程。在通过文献阅读明确研究空间(切入口)后,通过问卷/其它途径(如找年鉴统计资料)获得研究数据后。到具体构建计量经济模型这步时应该怎么做,需要注意些什么?我个人有几点经验和大家分享分享。


1模型、变量与方法

明确模型的因变量Y和自变量X分别是什么?数据结构类型是横截面还是面板?以便确定具体的研究方法。研究方法的确定一般根据因变量Y的类型来。如横截面数据,因变量Y是连续性变量,一般用多元线性回归;因变量类型是类别变量,那就用logit模型或probit模型(又可细分二分类的、无序多分类和有序多分类的)。


2必要的数据清洗工作


做数据的描述性统计分析看看数据是否存在缺漏值?结合箱图进一步判断数据是否存在极端异常值(异方差问题)?做做变量间的相关分析矩阵看看变量间相关程度如何(提防多重共线性)?如果存在上述基本问题,做相应的处理(如我早期写的一个利用SPSS来辅助诊断极端异常值的帖子,链接:http://bbs.pinggu.org/thread-3651449-1-1.html)。不存在,继续往下。


3模型的构建与检验


模型隐含的假设条件是什么?这些条件在研究中哪些是满足的,哪些是不满足的?还是以横截面数据的多元线性回归为例,学过计量的人都知道,多元线性回归要得到无偏一致的估计量,要满足高斯马尔科夫定理设定的几个条件。可逐一对应自己构建的模型,看看条件是否满足。满足了继续往下,不满足则要做一些必要的检验了。如:


(1)异方差问题

(2)自变量间严重的多重共线性问题

(3)内生性问题(模型稳健性的检验)


其实,很多实证研究出问题就出在这一大点上。因为很多人没系统的学过计量经济学,通常拿到数据不做基本的清洗工作,把X,Y带入模型,就直接跑出结果完事了。然而,计量模型的建构远没有想象中那么简单。需要注意很多细节的东西。


4模型结果的呈现和解读


回归结果要报道哪些检验统计量?表格要如何制作,能否直接将软件跑出来的结果直接整体输出?怎么将表格制作的简单易懂,又能尽可能的展现出回归结果的精华?这些都是一些很细节的东西,可在实证研究过程中不断提升改进的。

 

我个人总结的横截面数据实证分析的大概流程就是以上几步,早期我也写了一篇测量个人计量实证水平的帖子,链接:http://bbs.pinggu.org/thread-3641714-1-1.html。这里面虽然我只提了很多实证分析中可能遇到的问题,没有给出答案。但帖子下面的讨论中有很多各种问题的讨论,能给人不少启示。感兴趣的坛友可链接进去看看。

 

回过头来看,貌似按照上面所说的“套路”走,发现计量似乎也就那样,没那么复杂。其实,计量要解决的本质层面的东西本来就没有多复杂。只是一个研究,要解决的小问题多了,而有些小问题我们没接触过,不知道怎么处理,这就变得复杂了。所以,综合而言,系统的学习一下计量的理论知识和软件实现就显得非常有必要了。条件允许,建议报一个论坛的培训班,能快速提升自己的计量理论和软件操作能力。更重要的是,还是找准资料,“坐得住冷板凳”。然而,有一点应当引起注意,计量始终是实现研究目标的手段,虽缺少不可,但一篇好文章更重要的可能还是idea的产生过程(即广泛的阅读文献和思考)。一篇文章,计量方法可能有多种,这些方法各自有各自的优劣。在没有明显错误的情况下,我想杂志主编更多的还是看文章的idea的。

 

学术道路还长,我也只是一个刚入门或还未入门的小兵。以上分享的是我个人实证研究中的一点浅薄经验,希望对有需要的坛友有帮助。越努力,越幸运,与君共勉。

 



访谈3:如何做为科研团队带头人,带领团队进行实地调研及学术调查?

经管之家:


作为一名成果丰硕的博士,您已经有了数次带团队,深入农户展开调研的经历了。能否就科研如何进行数据的采集?科项项目的调研实务与实践操作方面,分享一下你作为过来人的宝贵经历?


徐定德博士:


调研其实和前面提到的文章写作息息相关,因为调研的目的是搜集数据,解决问题。而问题的提出离不开文献的阅读。学术界有广为流传的一句话:“垃圾进,垃圾出”。指的就是如果调研的过程没控制好,导致搜集到的数据是“垃圾”(不能反映研究区实际),那用这个数据来做研究就没意义了(即“垃圾”出)。我个人有幸参加过两次中科院农业政策研究中心张林秀老师组织的全国层面的“劳动力迁移与农村发展”调研(均在四川组),一次是做农户问卷(32页),一次是领队。此外,个人也多次在三峡库区、凉山州等地做农户问卷调研。也算有比较丰富的调研经历。结合我个人这么多次调研的经历,我个人认为要得到一份质量比较高的数据,要注意的事项有很多。下面我根据个人的经验,按照调研的流程慢慢的梳理一下,但愿对有需要的坛友有帮助。


1调研的问卷设计


一项研究的核心其实就是在找准切入口后,构建因变量Y和自变量X的关系。而在微观实证研究中,X与Y是由问卷来的。所以,调研问卷设计的开始阶段其实就是阅读文献找准研究目标,明确自己要解决的关键科学问题是什么?然后将研究问题分解为主要的研究内容,再设计指标去测度这些研究内容。这些指标很多可以从国内外的文献中直接得到,有部分可能需要我们根据研究问题自行设计问卷。

 

由于区域与区域间存在差异,其它研究区的指标和自己根据研究问题设计的指标并不一定适合自己的研究区,故而需要对设计好的问卷初稿进行修正。同时,由于个人看问题的视角有限,一份问卷设计好后,通常会请对研究区有丰富研究经验或对研究问题有丰富经验的人把把关,提提意见,再进一步修改完善问卷。随后,拿着修改后的问卷初稿到研究区进行预调研,看设计的问卷是否符合研究区实际,调研对象对设计的问题理解是否有困难,一份问卷大概需要多久等。预调研结束后,团队开会讨论,及时汇总预调研过程中遇到的问题,讨论出解决方案并完善问卷(如修正那些不符合研究区实际的指标,增加在原有问卷中没有考虑到的指标)。以上过程如果做得好,可能一次预调研就行。如果做得不好,可能需要多次反复才能达到效果。

 

除了上面这种方式设计问卷外,还有另外一种方式。即在明确研究大概要解决的问题后先不设计问卷,只列一个访谈提纲就去研究区进行个人和小组访谈,进一步细化研究内容和明确研究问题后再设计问卷。不过以上两个过程都离不开多次到研究区去访谈,以修正问卷。我个人虽然有多次的调研经历和带队经历,但真心感觉要做好访谈和问卷设计比较难。需要一个配合默契的团队通力合作才行。


2调研员的培训

问卷设计好后,在正式调研前还有一步比较重要的工作就是调研员的培训。因为每个人看待问题的视角不一样,理解能力也不一样。同样一个问题,理解不同完全可能得到不一样的答案。这会导致问卷搜集的结果和研究事实不符。此外,由于微观实证研究很耗费金钱和精力,故而一般情况下问卷量也会相对比较大(我参加的调研就没有一个是一个小时内能完成的)。在这种情况下,只有培训才能提高准确率,提高问卷效率进而节约成本。同时,培训的过程也是头脑风暴的过程。在让调研员熟悉问卷的过程中,调研员可能会结合自己的感性认识提一些问题,而这些问题可能我们在设计问卷时并没有考虑到。这时,还可以对问卷进行修正。

 

培训期间,如果条件允许,一般还会组织调研员到研究区去实战感受一下。一方面熟悉问卷,另一方面看看一份问卷一般要做多久,大家在做问卷的过程中遇到了哪些问卷中没有涵盖的问题。回去后继续培训时第一步就是大家讨论汇总预调研过程中遇到的问题,统一答案编码口径和进一步修正问卷,以符合研究区实际。


培训的目的其实就是想尽一切办法让调研员熟悉问卷,统一答案编码口径,进而保障数据质量。除了让调研员熟悉问卷外,培训还需要对安全、基本礼仪(着装、问好、离开等)以及学术道德进行培训和强调。尤其是学术道德,要反复强调。毕竟一项调研所耗费的精力和金钱是相当大的,不把学术道德强调好,调研员“乱填”问卷,那后果是极其“可怕”的,是对很多人努力的浪费。


3调研的前期准备工作和团队构成


与培训同时进行的还有一些准备工作。如调研路线的设计、经费的预算和到财务借钱、一些基本物品和材料的整理,如最终问卷的打印、调研员的调研牌、感冒药、橡皮、铅笔、问卷袋、装问卷的皮箱、出行方式是购票还是租车、给调研员购买保险等。这是一个复杂的过程,一般需要团队成员的通力合作才能做好。

 

在我们的农户微观实证调研中,一般而言团队包含以下一些人。带队的老师和队长——负责团队的整体运作和表格的抽查。队长还负责农户礼品的购买(一般都是到一个地方后,去大型的超市批发);先锋队员(打前站的人)——这个人一般由社交能力比较强的男生担任。他会比大部队早1天出发去调研地点,和村上的负责人交接上(要和村上的负责人交接上,通常需要事先拿着单位的介绍信/调研函和县级层面的相关负责人对接上才行,请县上的领导帮忙联系基层的人),确定我们随机选取的农户在大部队下村调研时在家,这是随机等概率抽样能否实现的保障。同时,还要联系好大部队到调研地点的住宿和吃饭的地方,保障后勤;财务——一般由两人担任,一人负责付款,一人负责记账。团队所有开支都由这两人负责,做好开支详细记录;叫早队员——负责团队每天早晨的叫早任务;调研员——做各类问卷的人;查表人——专门负责查调研员问卷的人。团队成员间各司其责,通力合作把调研工作做好。


4实地调研和质量的控制


所有工作准备就绪后,就是正式调研了。由于调研员对问卷有一个从不熟悉到熟悉的过程,所以最开始进行调研时不能为了节约成本而图快,要尽可能的保证质量。这种情况下,我们调研一般将调研员两两配对分组,最开始的1天-1.5天时间由两个人来合作完成前2份问卷。问卷完成后,两人先仔细的整理完成一份完整的问卷后,先交给其他调研员互查,调研员根据培训时所说的问卷前后逻辑关系和自己做问卷的经历判断自己所查其他人的问卷中有哪些地方不符合逻辑/常识,用铅笔将存在问题的页码写在问卷封面上。整份问卷查完后交给做问卷的调研员,调研员看到问题后回想调研过程并对结果进行修改(如果是笔误,直接改过来。如果是觉得自己漏问了或不确定自己答案是否正确,这时需要打电话给被访者再重新确认答案),所有问题改完后找到查表的调研员说明每个问题的具体修改,查表人觉得没问题在问卷封面上签上自己的名字。这个过程要重复两次,即调研员自己的问卷至少要有其他两个调研员检查签字。

 

当调查员间互查觉得问卷都没问题后,这时调查员将问卷交于专门负责查表的查表员(这个查表员一般不做问卷,但对问卷的逻辑关系以及问卷设计很熟悉,在调研培训期间也要单独培训)。重复调查员间互查的过程,查表员查表有问题标出来,调研员改正。

 

最后是调查员互查,查表员也查完后,带队老师或队长抽查问卷。严格保证问卷质量。基本要做到“今日事,今日毕”,不把问题留到下一个地点去。因为每天调研员的工作量都很大,很辛苦。不当天就把问题解决,越往后面走问题会堆积的越多。同时,调研员也可能把不同的调研家庭情况搞混,更不利于问卷结果的搜集。

 

除了以上几轮严格查表控制质量外,即使再辛苦,每天晚上团队也要集合开会讨论今天问卷中遇到的问题,交流解决问题的经验和技巧。一般情况下,由于问卷量比较大,在白天尤其是下午调研员还做了问卷的情况下,白天是查不完问卷的。所以晚上加班查表是正常的。我记忆中最开始4-7天大家是最辛苦的,一般都要熬夜到晚上12点左右才算基本完成任务(第二天还要继续繁重的任务)。


5问卷的录入与数据的清洗


一个地方的所有工作完成后(问卷做完,所有查表人都查完签好字后),问卷整理入袋。除非特殊情况,一直到调研结束都不再打开问卷袋修改问卷。所有调研工作完成后的下一步任务就是问卷的录入。如果数据量比较大(比如我参加的全国层面的调研,2000户农户问卷,每份问卷30多页),就只有找录入公司录入(这也是为什么要有培训和后面几轮的严格查表,都是为了让大家统一口径。

 

所有的问题答案均以代码的形式写到表中去,录入公司只认代码,其它什么都不认);如果问卷量不大,也没有那么多成本去找录入公司,这时可以由调研员各自录入自己做的问卷。不过前提还是每个问题都有明确的编码标准,大家口径都是统一的,没有偏差。

 

数据录入完成后,在正式使用数据写文章之前。还有一个数据的清洗过程。这个过程主要是看有没有漏录的地方,有没有前后逻辑不一致的地方等。通常会借助软件来进行数据的清理。

 

以上大概是做微观实证研究的过程和这个过程中的一些注意事项(我个人的经验)。实际上,要做好一项微观实证研究(调研),要注意的事项还有很多很多。远不止我所罗列的这几点可以概括的。更多更细节、更有挑战性的问题还需在具体的调研过程中才能更好的体会(如团队的管理、被调查对象不在家、被调查对象不配合等)。我个人最大的感受是,做一项研究不容易,既然选择了做,就要好好做,方不辜负这美好的青春。越努力,越幸运,与君共勉。


作者简介


徐定德是一位90后的小博士,一位经管之家的版主,也是一位深受坛友喜欢的原创达人,更是一位已经发表了19篇SSCI/SCI/中文EI/CSCD/CSSCI的高产小学霸(一作和其它作者)。截止到目前,他已在论坛发表了10篇贴子,其中《一个外行的计量经济学学习之路》、《SSCI/SCI发表的一点心路历程》等经典文章,获得了很多坛友的好评和热烈的反馈。“越努力,越幸运”是他的座右铭,而他留给小编印象最深的一句话,是这样的——“很多时候,我们明明可以再努力一点,就改变了我们的命运···,今天的选择将来都是要还的……”




《万卷方法:如何做好文献综述》


作者:阿琳·芬克 (Arlene Fink) , 

齐心 (译者)




简介

如果你已迷失在数以百计的文献中,不知如何才能识别和了解这些海量信息,也不知该使用什么标准来区分好的和差的研究?这本书兴许可以帮到你:本书就是要教会你识别、解释和分析已发表和未发表的研究文献。


书中随处可见作者精心设计的评估文献质量的一览表,为你确定文献取舍的标准,助你精确定位高质量的文献。


作者“三步一‘小例’,五步一‘大例’”,带你置身丰富的实例之中,让你对好的文献综述好在哪儿,差的文献综述又如何改进有更直观的体会。


点击“阅读原文”可直接购买此书!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存