朱玲:经验研究中的关键细节
文章来源:《经济研究》2002年第11期
这篇文章是我担任中国社会科学院研究生院经济系主任时为研究生撰写的。文章饱含自己和课题组的方法论探索,其中的体会又颇具共性,故在青年经济学人中共鸣深远。时至今日,文中所举案例或许不再新鲜,但陈述的研究路径,我依然采用,不过是随着知识和阅历的增加而略趋纯熟罢了。
承蒙孙冶方经济科学基金会选中拙文刊发于基金会的公众号,我自不胜荣幸。惟愿个人和团队的经验,对经济学的后来人仍能有所启迪。
朱玲 2020年2月2日 北京
本文论及的经验研究,专指那些基于田野调查信息所做的乡村经济发展研究。以下将主要以笔者从事此类研究的经验教训为例,从实际操作的角度对研究过程中的关键细节加以提示。这样做的原因在于,研究质量的保障往往靠的是细微之处的功夫。读者若要了解经验研究的一般方法,可以翻阅现有的教科书。
笔者在阅读国内经济学文献的过程中,常常会遇到一些题目宽泛的专著或论文,例如,论国有企业改革、社会保障制度改革、二元社会转型、西部地区开发,等等。读起来感觉作者好像什么都议论了,但似乎什么都没有研究;与题目相关的事情看似都提及了,可就是没有作者独到的贡献。撇开学风因素不谈,这种弊病至少与作者缺乏“问题意识”有关。在我看来所谓问题意识就是研究者基于已有的观察发现并提出问题,而这些问题没有现成的答案或是现有的思想材料尚不足以给出令人满意的解答,这才需要将其作为研究的主题。正因为如此,在确定主题的时候,必须对其加以明确的定义。例如,经济转型期间乡村收入不均等程度加剧的问题,农村儿童辍学率上升的问题、农民因病致贫的现象增多的问题、村庄基础设施和社会服务筹资困难的问题,等等。所有这些现实中存在的问题,都需要确认其现状、追溯其原因、预见其发展,这就分别形成了单项研究内在的逻辑主干。
为了将研究引向深入,还需要尽可能地缩小选定的主题,也就是说添加更多的限定来明确研究对象。以农村儿童辍学率上升的问题为例,我们首先可以将关注的群体设定为某个特定区域的农村儿童;其次,可以限定进入考察范围的儿童年龄或是学习期限,例如小学1-6年级的儿童;再次,还可以把研究聚焦于某个影响儿童辍学率的重要因素上,例如政府对农村基础教育的支出、学杂费、儿童家庭劳动力规模或收入状况,等等。如此这般,研究者尽可以在研究经费规模、计划期限和研究队伍能力等限制条件下,继续从外延和内涵方面多次定义所选择的主题,一直到它既具体、又明确、而且还足以使研究者按照时间表预定的节奏完成为止。
中国历史上的文人多半有做大题目的传统,动辄即著文纵论天下大事。不过,他们所论及的“天下”往往指的是中央政权附近的地域,所分析的大事牵涉的因素也极为有限,因而这些题目与当今世界面临的问题实则不可同日而语。即使如此,热衷于纵横论的倾向往往也使历代文人容易流于空谈。事实上,定义狭窄的专题与大题目相比反倒容易做得饱满充实。例如,有关儿童辍学原因的研究,可以将经济制度改革、教育筹资方式变化、地域差别、性别不平等、收入限制和教育投资回报等多种因素纳入分析框架,据此收集信息进行统计分析,很可能从不同角度探寻出导致儿童辍学的决定性因素,并由此得出令人信服的结论。这样“小题大做”可以说远比“大题小做”来得实在,至少不会使读者看过研究报告觉得上当受骗或浪费时间。
在我看来,信息的收集和筛选贯穿于研究过程的始终。只不过研究主题一经确定,信息收集工作就不大会耽于漫天撒网,信息筛选也就有了衡量的尺度。虽说笔者一贯重视通过田野调查收集第一手资料,但信息收集的起点却是阅读文献。所收集的文献可以分为如下几类:
第一,与研究主题相关的专著、论文和研究报告。如果自己对选择的主题感到完全陌生,我会从阅读教科书起步。例如,刚开始做农村合作医疗制度研究时,我先找来一本健康经济学教科书精读,然后循着教科书提供的参考书目线索寻找该领域的经典论著。在已经具备某项专题研究基础知识的情况下,我会直接从阅读已有的研究报告和经典论文开始。例如,20世纪90年代初我做扶贫信贷政策研究时,先翻阅了一些国际组织发布的有关农业信贷制度的国别研究报告。在阅读中注意到,Joseph Stiglitz关于借贷双方信息不对称的一篇论文曾多次被引证。因此,随后就精读了这篇文献。读过之后,便明白信贷制度运行的关键在那里了。
可以说,优秀的文献既能帮助研究者“站在巨人的肩膀上”开阔视野,尽可能避免无效劳动;又能刺激研究者独立思考,注意现有思想资料的不足之处,寻找那些有可能使自己的研究有所突破或者说创造出新意的切入点。值得注意的是,现在查找文献的途径很多,图书馆、书店、互联网都能提供线索,几乎围绕任何一个专题的图书、刊物和其它文字资料都汗牛充栋。这就对研究者的筛选能力提出了考验,即首先确认阅读范围,然后区分必读文献和选读文献,分别用精读和浏览的方式来处理。只有这样,才有可能在阅读中举一反三,防止自己的思维能力和创新意识被文献所淹没。此外,研究者在感到阅读收获最大的时候,最好及时写出文献回顾或者书评,以便梳理思路,构建专题分析框架。
第二,收集与研究主题相关的国家和地方法规、中央和地方文件、政府部门工作报告、简报,等等。从这些文献中不但能够了解特定专题的社会经济政治环境,而且可以知晓与此有关的组织结构和行为主体,这往往就为田野调查提供了“路标”。举例来讲,我在做“农地分配中的性别不平等”研究时,阅读了建国以来的土地法、婚姻法、继承法和妇女保护法等法规,查找到改革开放以来有关家庭联产承包制的一系列中央文件,还搜集到一些调研省、县政府制订的土地承包和调整方案,以及它们所做的有关农地分配工作的汇报。从中获得的信息,足以用来勾勒农地分配过程的决策程序以及不同参与者所起的作用。根据这条线索,我曾在田野调查中对调研县农委(农工部)、村委会、不同性别的农户户主和家庭主要劳动者分别进行访谈,很快就了解到土地承包权在法律上性别平等、在现实中性别并不平等的原因。
第三,为了对考察的地域和事件有一个概括的了解,需要在田野调查的过程中收集地方志、政府部门档案、及其它有关当地人文、地理和经济历史的文献。例如,为了弄清合作医疗制度为什么缺乏可持续性的问题,我翻看过许多调研县的县志,了解到这一制度在人民公社时代就不曾稳固过。这与以往国内的宣传和国外对中国农村医疗制度的历史评价都大相径庭。为此,笔者在浙江、安徽、吉林、河北等地调查的时候,曾与不少经历过那个时代的农民攀谈,他们的回忆证实了县志资料的准确性。这个结果,便将我们的研究从分析农户参加合作医疗制度的意愿,向探讨其它健康风险管理方式推进了一步。
总之,文献回顾工作不但能够提供进入新领域的理论路径,而且还能引领研究者从现实社会经济生活中收集、筛选和加工新的信息,从而在研究过程中有所发现、有所创造。
研究者从事田野调查的目的,在于围绕研究专题了解现实情况。从这个角度来看,调查误差可以定义为研究者获得的田野调查信息与真实世界的差别。为了尽可能准确地收集信息,从调研设计到田野工作的每一个关键环节都需要采取措施,力求减少调查误差。近20年来,我做田野调查一直采用典型调查和抽样调查相结合的方法,故而以下讨论的调研环节实质上是抽样调查过程的重要组成部分。
首先需要注意的环节,是调研地点的选择。倘若是做政策研究,课题组最好与行政主管机构协商确定调研地点,因为这些机构不仅可以提供必要的文献,而且还可以帮助研究队伍在最短的时间内进入专题信息密集的地域。如果是做非政策性专题研究,也需要通过官方或民间渠道寻找那些调研事件集中发生的地方。当然,对于所有这些机构推荐的地点,研究者还必须根据课题的需要、以往的经验和试调查的结果加以判断和选择。与此相关,抽样调查最好在曾经进行过试调查的地域进行。这点提示,恰恰来自我曾经有过的一次选择失误所留下的教训。
1996年以前,我在选择调研地区时往往避免典型调查和抽样调查的地点相重合,为的是尽可能利用有限的科研资源扩大调研地域。这样做了10年都不曾有过意外,没想到1996 - 1997年组织的一次抽样调查出了差错。当时,我与农业部农村政策研究中心的同行合作研究劳动力转移对贫困农村妇女地位的影响。此前我们曾在云南、四川、湖南、山东等省的贫困地区做过个案研究,在此基础上设计出问卷并在河北做了试调查。修改定稿后决定在山西省进行抽样调查。这项决策的理由在于,其一,山西是我国最重要的煤炭基地之一,距离京津塘地区又较近,这对农村劳动力转移可谓是得天独厚的条件。其二,农业部农村调查系统在山西11个县设有长期固定观察点,这些观察点均匀分布于全省发展程度不同的区域,其中包括太行山和吕梁山贫困地带。这一带的妇女有参与社会经济活动的传统。其三,当地调查队伍质量可靠。调查队负责人是北京大学图书馆系毕业的老大学生,自农村调查系统开始运转以来,一直承担观察点的数据收集工作,具有丰富的抽样调查经验。尽管一切都看起来近乎完美,到我们对村干部和农民进行访谈的时候才知道,在山西煤矿打工的劳动者大多来自四川、河南和山东,当地农民出外打工的人数反倒很少。他们认为外出前景不确定,在本地下矿井风险太大,所以宁可在家靠种地为生。我们跑了几个县,注意到只是在那些距县城较近的村庄,本地农民从事非农劳动的情况才较为明显。这个结果岂止是令人大跌眼镜,而是抽样数据不能满足项目设计要求的问题。可是,调查已经在11个县展开,想更换抽样地点都来不及了。在生米煮成熟饭的情况下,应变的办法只能是调整研究主题。事情的结局是,原定专题改为“欠发达乡村经济中的性别不平等”。
田野调查的第二个关键环节是问卷设计。当然,并非所有的田野调查都需要问卷,近年来流行的参与式调研法往往以开放式访谈为主。但是在不同地点用这种方法收集到的信息,难以综合处理。因此,我通常只是在问卷设计前的典型调查、问卷设计后的试调查、抽样调查过程中的随机访谈、以及个别补充调查中,采用参与式调研法。在可供使用的数据不能满足专题研究需求的情况下,我还是倾向于借助问卷进行抽样调查。抽样调查需要资金和劳动双重因素的密集投入,问卷设计的质量和篇幅将在很大程度上决定科研资源使用效率的高低。设计过程中需要注意的要点如下:
一是要注意问卷篇幅不可太大。问卷访谈最好以1个小时为限,受访者多半在超过这个时限后开始思维涣散,即使有意中断访谈、休息片刻后再接着提问,他们往往也会由于不耐烦而给出不准确的回答。
二是问卷包含的内容不可太复杂,否则就会扰乱受访者的思维逻辑。再说,内容复杂的问卷也不可能不超出正常的篇幅。这个环节在研究队伍较大的情况下尤其不易处理妥当。同一课题组的成员常常具有不同的特殊兴趣,每个人都想使自己提出的问题搭上问卷这趟车,结果就可能产生上述弊病。
三是要用调研地区的常用语简练地提出问题,例如对以工代赈项目中的基本农田建设工程,四川农民称之为改田改土,陕西农民则将其叫做小流域治理。我们在这两个地方抽样时,分别根据当地农民特有的语言改写问卷,而这并不影响每个问题原有的编码和问卷回收后的数据录入程序。又例如,1992年和1996年我在沂蒙山区调查农作物产量时得知,当地许多农民既不用“市斤”也不用“公斤”计量土豆(马铃薯)产量,而是习惯用麻袋数作为计量单位。因此,我们在问明一麻袋土豆的平均重量后,就把问题改为:“去年您家收了几麻袋土豆?”显然,到了将数据输入计算机的时候,稍加折算就可知晓样本户的土豆产量。也许,读者会认为每一麻袋的土豆重量都会有误差。然而在明知农民对其收获的作物不做精确称量的情况下,我们只能根据他们印象最深刻的记忆来选择误差较小的信息。
四是既不询问那些迫使受访者经过计算才能回答的问题,也不设计那些经过长久的回忆也难以准确回答的问题,例如对农民提问“前年种植业收入有多少”,如果今年年初询问农民去年的收支状况还不难得到回答,若问前年或更早些年的事情,除非农户存有账本,否则即使说出数字来也难保其准确性。仅就种植业收入的问题而言,最好是分解成几个小问题:“去年你家一共种了几亩地?”“种的什么庄稼?”“收了多少小麦(或其它农作物)?”“去年当地市场的小麦(或其它农作物)平均多少钱一斤(公斤)?”等等。只要问明农户一年之内收获的各种农作物产量、产品销售价格、农户花费在种子、化肥、农膜、雇工、机器、水电等项目上的成本,输入计算机做一番处理就可以知道家庭种植业的毛利润(收入),那为什么还要占用宝贵的访谈时间要求农民心算呢?
五是如果要了解同一个村庄的农户所共有的特征,最好设计村级问卷从村委会成员那里采集信息,而不必把这些问题包含在农户问卷中去询问每个样本户,例如,村庄区位、基础设施、社会服务,等等。
六是在同一项专题抽样调查中,最好将同一个问卷母本根据不同地域的特点修改成专用问卷,以便了解特定地域特有的信息,同时省略特定地域受访者根本不可能回答的问题。例如,在近两年的产业结构调整中,四川马边县的农民栽种茶树,陕西丹凤县的农民种植中药材,他们主要的生产和销售活动分别围绕各自的特色农作物展开。因此,我们在当地做过试调查之后,立即在县里修改打印问卷,分别用于两个地域的抽样调查。这两种专用问卷只是在农业生产分支方面的问题不一致,丝毫不妨碍调查结束后的数据处理。然而,这样做可以大大减少调查员和受访者浏览与他们无关的问题时可能产生的疑惑。
田野调查的第三个关键环节,是选择和培训调查员。在仅凭课题组人力难以完成问卷访谈计划的情况下,就需要事先组织调查员队伍。大学生、当地统计局调查员、政府工作人员、村委会成员和村民小组长等等,都属于优先考虑的调查员人选。无论从节约调研成本还是从提高信息准确性的角度来看,在调研乡镇和村庄聘请受教育程度相对较高的青壮年做调查员,都是一个理想的选择。一般情况下,挑选调查员的标准可以是性别中性,但若要做性别敏感的专题调查,例如妇女教育和培训、妇女就业、妇女生殖健康等等,就必须在选择调查员时持有性别视角。我在组织前述山西农村妇女抽样调查的时候,只考虑到利用现有固定观察点的便利之处却没有注意到调查员都是男性。结果,不少受访妇女都不大愿意回答问卷中有关自身健康状况和生育决策的问题。看来,做这类调查没有请当地妇联组织帮忙着实是失策。
调查员一旦选定,就要集中培训。培训的目的在于,一是使他们理解调查意图和问卷中的每一个问题以及填写要领;二是告知调查员预期的最优询问对象和抽样规则(最好在问卷上注明特定的询问对象,例如村会计、农户户主、妇女、老人、村卫生员、村小学教师等等);三是借助调研员熟悉当地社会经济生活和民俗语言的优势,把问卷中的问题转化为当地农民容易理解的语言;四是把培训本身当作一次试调查,请调查员质疑问卷,以便在抽样调查开始之前做最后一次修改;五是在与调查员的交流中建立相互信任关系,尽可能激励他们对即将承担的任务产生兴趣,在实地调查中发挥主动性和创造性。
为了确认调研员是否能够正确填写问卷,我和同事们曾经通过研讨会的形式先行讲解问卷,然后请调查员填写,从中发现问题即当场讨论解决。但在实际调查过程中,总有一部分调查员面对要求填写代码的问题不知如何是好,或者诱导受访者像学生猜测正确答案一样回答问题。为此,2002年我和几个博士生一起培训调查员的时候,改用示范的办法:在研讨会上随意挑选一个来自样本村的调查员,根据问卷上的问题对他进行访谈,将每一个问题和他的回答都写在黑板上。在示范过程中,其它调查员随时对问题的提法发表评论,或者提出填写建议。有的调查员了解受访者的家庭情况,还情不自禁地和他(她)一起提供信息甚至纠正受访者对问题的回答。事实表明,这种方法优于以往所有的培训方式。当我们进村走访已经接受过调查的样本户时,发现户主夫妇都知道问题代码或选择性回答是怎么回事。数据输入和清理结果也显示,问卷填写错误极少。
田野调查的第四个关键环节与前述调查地点的选择相关,但这里着重讨论的是样本的选择。在绝大多数情况下,我们的调查重点是村庄和农户。在选定调研省和调研县后,最好请县里负责农村事务的职能部门,根据专题研究的需要推荐调研村名单。例如,做农民收入调查时,需要能够代表当地不同区位、不同人口规模的村庄;做政策效果评价时,需要特定政策干预行动覆盖的村庄和未覆盖的村庄(对照村);等等。至于从调研村里选择样本户,教科书里介绍的随机抽样方法当然最理想。然而贫困地区的农户通常居住分散,一个聚居点上只有3-5户人家,若用标准的随机抽样法则不能满足所需要的样本户数。此外,调查期间还时常遇到访谈对象不在家的情况。因此,我们只能事先确定农户抽样原则,由调查员根据这些规定选择抽样户。
例如,2002年我和课题组的同事们进行以工代赈项目执行情况调查时,为了保证抽取的农户样本包括足够多的项目参加户和非参加户,决定在每个调研县选择4个规模较大的村庄进行抽样,每个村抽取60个样本户。我们在培训调查员的过程中获知,就一个行政村而言,明显的高收入户和低收入户所占的比率一般分别接近20%,余者尽管相互之间收入有差别,但通常都被视为中等人家。于是我们请样本村所在的乡政府负责人把调查员分成小组,要求每个小组从各自将要调查的村子里选择10个高收入户、10个低收入户和40个中等收入户进行问卷访谈。由于调查员都熟悉村里的农户生活状况,所以在培训期间就讨论决定了抽样户名单,并在组内确定了每个调查员所要访谈的人家。我们在回收问卷时曾询问调查员对访谈户进行分组的依据,她(他)们回答说,是先前观察到的家庭房屋、耐用电器、家具、劳动力数量、主要劳力的文化程度、承包地规模、大牲畜饲养量等综合情况。这些不正是反映家庭财产和人力资源状况的指标吗?当我们利用计量模型进行收入统计分析的时候,这些指标几乎都是不可忽视的解释变量。由此我们不能不佩服调查员对社会经济生活敏锐的直觉和出色的判断力。毫不夸张地说,即使我们自己去抽样,也未必会比他们做得更好。
田野调查的第五个关键环节是回收问卷。在这个环节上既节约时间又保证工作质量的办法,是研究人员在调研区域分批回收和检查问卷。我曾委托调查队邮寄问卷,结果遇到两个问题:一是问卷有缺失;二是个别调查员填写的问卷出差错。当在异地发现并试图纠正这些问题的时候,麻烦可就多了。此时打电话常常找不到特定调查员;即使找到人,对方也可能回忆不起来差错是怎样发生的。为此,在调查员培训班结束之前,就需要与每个小组分别约定问卷回收时间和地点。问卷回收时,每个研究人员负责检查一定量的问卷,专门核查容易出错的地方,尤其要留意那些给出非正常回答的问卷。如果发现问题,当下就和调查员讨论。同时,询问调查员在访谈中所遇到的特殊问题或是观察到的特殊现象,并加以记录,因为这些信息对于数据清理、统计分析和研究报告的写作往往至关重要。
田野调查犹如艺术创造,在追求完美的过程中总能发现不完美的地方。就我迄今为止参与的专题研究而言,那些我自认为设计周到、组织严密的田野调查都留有遗憾。因此,总是免不了要在统计分析阶段做些补充调查。有些缺失的信息,可以通过个案调查来回溯。例如,我做农村健康保险需求调查的时候,没有在问卷中包含足够的保险供给问题。不过,在弄清调研地区现有的保险制度安排后,课题组通过几个典型调查获得了必需的信息。然而有些遗憾却在短期内难以弥补。例如,我在上述农户问卷中没有对个人健康状况的主观评价提问,以至于后来不得不放弃对个人健康状况影响因素的计量分析。这种失误,来自我在问卷设计期间专题知识的缺乏。发现这个问题,是在研究走向深入的时候。虽然纠正这个失误只能有待于下一轮抽样调查,但是它足以作为一个警示,时常提醒我在问卷设计前竭尽可能去挖掘专题文献。
还需要强调指出的是,研究者对于乡村社会毕竟是匆匆过客,所做的专题调查只不过是撷取这个社会某个层面的部分特征。正因为如此,调查误差肯定存在。这就要求研究者除了采用技术手段减少误差外,还必须尽可能多地了解数据的背景。为此,需要在田野调查中把视野扩展到经济领域之外,全身心地感受当地的社会经济政治文化特征和风土人情,并及时记录自己的所见所闻。只有这样,才有可能在后期数据处理过程中敏锐地把握数据之间的逻辑关系,在分析过程中明晰地解释计量结果,在研究报告中写出内容丰满的篇章来。
不少研究人员虽然选择了农村经济研究专题,却不屑于做田野调查,厌烦其中包含的那些琐碎细致的工作,甚至根本不愿意到农村去。这或者是因为没有消除自身的城市偏好,或者只是把研究作为实现某种个人目标的手段,或者是由于对单纯计量手段的迷信,等等。无论出于何种原因,敷衍田野工作的行为中都隐含着一种倾向,那就是认为只要拿到数据,就可以做出论文来。事情确实如此。然而此类缺少田野工作基础的论文,往往充其量徒具学术形式,实质上却难以称得上优秀研究成果。否则为什么不少学术刊物会充斥着隔靴搔痒的文章甚至文字垃圾呢。在现实经济生活中,处于转型期的中国农村充满新事物新现象,其中不乏对现有理论的挑战,这为当代经济学人提供了绝好的思想创造机会。田野调查属于创造的基础,只能从细微之处做起,正所谓不积跬步无以至千里。这对有志于献身农村经济发展研究的人们来说是别无选择。
作者进行老年家计调查(2019 董晓炜摄)
统计谎言这个概念并不包含对研究者个人品质的价值判断,而是指这样一种现象:统计数字显示出来的事物关系实质上并不存在。记得一篇趣味短文曾提到,经济景气状况与女性的裙长成负相关关系。这两组数字或许真能形成如此统计结果,然而无论时装生产者还是消费者都未必对其认真。这里之所以要提及这个例子,只不过是为了强调指出,在数据处理过程中研究者必须保持对统计失误的高度警觉。
首先,在将问卷数据录入计算机的时候,需要有意识地避免操作失误,防止由错误的数据引出荒谬的统计结果。关于这一点,曾有人建议将同一套问卷数据由不同的操作员分别录入计算机,形成两套数据文件,然后通过对照比较找出录入错误。这在小样本调查的情况下倒是不难做到,可对于样本量和数据规模较大的调查,就有个预算约束和时间约束的问题了。目前,与数据录入和清理有关的程序越来越先进,降低失误的关键已经不在于技巧,而是取决于录入人员的认真程度和研究人员对数据特征的了解。记得1992年的以工代赈问卷数据是由人民大学两个硕士生输入的。数据盘送来之后,我和熟谙计算机操作的同事用逻辑检验的办法进行数据清理。检验中发现部分农户的肉猪饲养量都在200(头)以上,于是断定录入员把“销售重量”这行数据输进“饲养头数”名下了,因为我们在田野调查的时候就知道样本村没有这样的养猪大户。尽管如此,我们还是拿出原始问卷来查对,事情果然不出所料。问题是采取措施纠正了那些失误后,发现接下来的数据还是不对头。那位同事编了好几个程序才核对出来另有几块数据张冠李戴。问题出在录入员把A村的部分数据接在了B村数据下面。结果,我们不得不重新输入这两个村的农户数据。
其次,倘若不熟悉中国农村现状,也可能会根据“想当然”的假设进行计量分析,以至于出现常识性的统计失误。例如,将农民家庭是否享有安全饮水作为解释其生育决策的变量之一。这类常识性缺陷不仅需要研究者加强田野调查实践来弥补,而且还需要借助对专题理论分析框架的把握来校正。这与“功夫在诗外”的道理是一致的。
最后,研究者在获得与理论预设相反的统计结果时,最好反思自己的假设条件,而不必非要为了证明自己的设想去摆弄统计游戏。下面的例子可以说明,质疑自己原有的设想,往往会获得预想不到的进展。在我分析农村公共卫生服务状况的决定因素之前,曾从国内学术交流活动和文献中获得这样一些信息:近年来由于疾病预防服务和健康教育经费不足,这些服务的覆盖面降低。这些信息包含的逻辑在于,预防服务和健康教育覆盖面的增大,取决于政府投入的增加。为了证明这一点,我对样本农户获得的单项公共卫生服务分别评分,将加总后的分数作为被解释变量,把县乡政府的预防和健康教育支出、村卫生员获得的补贴以及农户区位等作为解释变量,做了一些回归分析。然而统计结果并没有显示政府投入与公共卫生服务覆盖面有正相关关系。为了解释这种现象,我先是用描述统计和Logistic模型观察单项服务供给状况与这些因素的关系,然后向一些预防医学专家请教,同时翻查田野调查笔记,发现自己的假设没有包含对公共卫生资源使用效率的考虑。事实上,调研地区政府的支出主要用于预防人员工资,开展预防活动的经费极少。而且,这些人员提供医疗性预防服务可以收费,例如注射疫苗;从事非医疗性预防服务却难以收费,例如进行健康教育。结果,免疫服务覆盖率很高,健康教育覆盖率极低。这表明,县乡政府的预防支出和村委会提供的补贴,实质上对卫生人员从事公共卫生服务还没有形成有效的激励。显然,这个结论为我们的研究注入了新意。
总之,数据处理如同连接田野调查和研究报告的桥梁,必须通过严谨细密的数据录入、清理、分析和检验工序构筑基础,容不得半点儿草率。否则,研究人员即使拥有再高超的统计技巧,也难免会不自觉地制造出统计谎言来。
这里所说的研究报告指的是表达研究结果的经济学专著、论文和讨论性文章等多种文字体裁。无论选择何种体裁,研究者在写作之前都需要先确定为谁写作,或者说确定作品未来的读者群。心中有了特定的读者群,就知道用什么样的表达方式与读者对话。例如,本文预期的读者群是经济系专业的大学生、研究生和涉足研究领域不久的青年学者,他们熟悉教科书介绍的理论,欠缺的主要是研究经验。正是基于这种判断,本文才用举例的办法来说明研究过程中需要特别关注的细节。
一般来说,有关农村经济发展问题的经验研究都具有较强的现实性。因此,为了增进不同群体对特定专题的了解,研究者有必要将研究结果送交本专业同行,将特有的发现告知公众,将有政策含义的信息和结论传递给政府部门。以专业研究者为读者对象的研究报告,最好按照学术专著或论文的程式去做。至于具体的程式,经典著作和著名期刊近期发表的论文都可以作为学习的范例,故而无需赘述。这里只针对近年来国内学位论文一些最常见的缺陷提出如下注意事项:
第一,文献回顾没有紧扣主题。有相当一部分作者回顾的并非是对特定专题做出贡献的文献,而是与专题相关的整个领域的发展,以至于文献回顾曲曲折折占用不少篇幅,而真正进入正题的文字却不多。这可能还是由于研究主题失于宽泛,或者说作者缺乏问题意识。如果在回顾文献的过程中始终尝试从理论上说明研究主题的来龙去脉,同时为自己的分析框架做好铺垫,至少不会离题太远。
第二,分析方法复杂却不得当。有些作者欠缺对论文思想深度的开掘,而只是偏好追求流行的高难度计量方法;有些论文罗列一堆复杂公式并非是为了将其用于数据分析,而只是用于表达简单的逻辑关系,以至于研究结论与计量分析脱节。这些做法的目的也许仅仅在于表现论文难度,而不是为了解决研究伊始提出的问题。对于分析方法的选择,物理学家丁肇中先生有过一席精辟的议论:最重要的不在于是否选择复杂的方法而在于是否选择适当的方法。(2002年丁肇中先生来华参加物理学家大会期间接受中央电视台“东方之子”栏目采访时的谈话)如何判断方法是否适当呢?还是要视研究什么问题而定。进一步讲,最好用简单的方法解决复杂的问题,而不是反其道而行之。这对于作者来说,可以节约科研资源、提高科研效率;对于读者而言,便于理解作者的意图、节省阅读时间。
第三,语言晦涩、用词生僻甚至文理不通。这类语言弊病产生的原因可谓多种多样,或是由于作者对自己所研究的问题缺乏透彻的理解,或是出于汉语功底薄弱,或是因为生搬硬套外语词汇,或是为了标新立异创造另类提法,等等。不过结果却是一致的,那就是降低论文的可读性。论文写出来就是为了让别人读的,即使是专为学术圈而做,也要对新概念或论文专用范畴加以注解,并力求通篇论述文字凝练、语言流畅,使同行读者在了解专业信息的同时获得阅读的享受。
为了做到这一点,最简单的办法就是与同行讨论写作提纲,向非专业人士叙述自己的思想。经验研究专题往往需要课题组成员通力合作,尽管写作是单个人的劳动,但是课题组成员之间通过讨论所引发的思想碰撞,却足以将集体智慧注入单个论文,不仅提高它的质量而且改善它的可读性。从白居易把诗句写得街上的老太太都可朗朗上口的例子推想开来,如果我们把自己的研究结果讲述得令非专业人士感兴趣,那么写出来的文字必定简明易懂。
若要向公众普及研究成果,那就除了需要采用简洁明快的语言外,还必须省略专业性较强的计量分析。在我看来,这类文字相当于科普作品。它不同于实际部门的调查报告,研究者最好把专题研究涉及的基础知识、研究中观察到的事实、分析过程所依从的逻辑和结论,在文章中通俗地表述出来。此外,这类通俗的研究性文章也区别于新闻报导。它叙述的事件必须以研究为基础,以冷静的观察为前提。如果想把研究结论传递给决策群体,那就必须从整个研究结果中抽出关键的脉络,用3000字左右的篇幅提纲挈领地把事情讲清楚,因为这个群体通常没有时间阅读长篇大论。
研究报告的写作是专题研究过程的最后一环,可是有相当一部分研究人员到了这个收获思想成果的时节,却对所做的课题兴趣大减,这与经验研究的周期较长有关。如果研究者以特定的读者群为对象去回顾所经历的研究过程,将写出的章节请同行批评,与志趣相投的朋友谈论未完成的篇章,就可能重新燃起写作欲望并保持创造激情,从而为整个研究项目奏出雄壮昂扬的尾声来。
参考文献: