学术研究、写作、批评与量化方法
周雪光,现任美国斯坦福大学社会学系教授、清华大学社会学系兼职教授、香港科技大学商学院组织管理系系主任,北京大学社会学系客座教授。主要研究领域为组织社会学、中国国家治理、官僚制度。代表作为 The State and Life Chances in Urban China: Redistribution and Stratification, 1949-1994.,《组织社会学十讲》等专著,以及《从官吏分途到层级分流:帝国逻辑下的官僚人事制度》,《从‘黄宗羲定律’到帝国的逻辑:中国国家治理逻辑的历史线索》等论文。
Works and Lives: The Anthropologist as Author(《论著与生活:作为作者的人类学家》)这本小书,正文149页,是文化人类学家克利福德·格尔兹(Clifford Geertz)以他于1983年在斯坦福大学Harry Camp Memorial Lectures的四个讲座修订而成,着眼于人类学中四位重要学者——Levi-Strauss,Evans-Pritchard,Malinowski,Benedict——各具特色的学术生涯和写作风格,解读学术研究与写作呈现间关系。如果让我来提炼其中的基本主题、并推而广之到一般社会科学领域的话,那就是,不要迷信数据或模型-不是资料通过学者说话,而是学者通过资料说话,而且怎样说话很重要。这也是格尔兹创立的文化人类学的要义这一。
--------------------------------
关于那些“既神奇又直观”的研究发现
读研第一年上马奇的"组织决策"课程,第一次听到“注意力是一种稀缺资源”的说法。如同Milgrom所说,这一命题一方面看上去如此直观简单,可以说人们在日常生活中自觉或不自觉地都在实践这一原理。例如,在多任务中按轻重缓急排序处理,在匆忙中做出粗糙的决定,等等。马奇在课上引用英文日常表达来说明“注意力”这一现象的普遍性和矛盾性时,我联想到中文中几乎对等的表达,可见不同文化下共享类似现象(“Out of sight, out of mind” — “眼不见,心不烦”;“Absence makes the heart grow fonder” — “才下眉头,却上心头”)。另一方面,这个思路有着精妙且深刻的蕴意,与组织决策理论,理性与情感等密切相关,可以说是近几十年来行为心理学、行为经济学研究主流的先声。Tversky,Kahnenman关于“Judgment under Uncertainty: Heuristics and Bias”的主题,着眼于不确定性条件下人们的行为方式,而这一不确定性在很大程度上来自注意力有限性。西蒙在Reason in Human Affair(1983)一书中将有限理性与情感结合在一起,也是从注意力分配这个角度找到了两者的关联。组织制度、决策过程、常规化过程等等都可以从注意力安排角度认识其意义。例如,质检部门即是在生产过程中配置的针对产品质量的持续注意力。在这个意义上,纪委/监察部门也可以看作是政府组织关于纪律约束的持续注意力的制度安排。
马奇提出另一命题:执行过程是政策决策过程的继续,即政策实施行过程的参与人员会按照他们自己的利益和理解来执行政策,因此会相应地改变决策的轨迹,其效果犹如他们参与了决策过程。这一思路也有着“既神奇又直观”的特点。一方面,这个现象可以说是司空见惯,直观易懂。但细想之下,其中道理意味深长:集权式决策并不一定达到其意图。虽然这一决策过程排斥其他群体的参与,但不过是推迟了他们参与其中的时间性而已。一旦进入实施过程,执行者就会带着自己的利益、信息和意愿来纠正决策过程的无知和偏差。决策越自以为是,越可能在实施过程中遭遇纠正。或曰,可以用严法峻刑来规范执行过程,强行实施之。高压之下或可一意孤行,但暂无近虑,必有远忧。可见,执行过程中产生的诸多问题不仅可能来自执行者,而且可能来自对执行过程缺乏前瞻性的决策者和决策过程。决策和执行必须放在一个整体中来认识理解方有意义:不考虑执行过程的决策不会是一个好的决策;同样地,不关注执行过程的政策研究也不是一个好的研究。
为什么“既神奇又直观”的研究发现尤其打动人心?各种研究成果层出不穷,或大或小,在学术评价上有不同分量,其成功也需要不同的条件。
有些研究发现需要有足够的资源方能实现。火星探索所带来的所有发现都可谓重大,因为前人未及,前所未有。这些科学突破需要巨大资源方能实现,非一般人所能企及。另一方面,如果给予足够资源,许多科学家都可能获得这些发现。换言之,这类研究发现更多地取决于资源占有。一位生物学家给我讲过这样一个故事。在1960年代,中国科学界人工合成结晶牛胰岛素,领先世界水平,被认为具有争取诺贝尔奖的实力。但这位生物学家如是说,这种胰岛素的化学结构早已为科学界知晓,只是因为合成需要巨大人力物力资源而无人问津。中国科学界集中资源做出成果,可喜可贺,但并没有重大的原创性意义。
另外一些研究发现需要好的机会。考古学中新出土文物的重大发现,可能会提供崭新的、丰富的资料,改写人们原来对一些历史现象的认识。例如,“清华简”的出现,提供了诸多前所未闻的战国时期史料,包括前所未见的《尚书》佚篇,可能导致对中国上古史的重新认识。但参与考古发现、整理文物的机会并不是平等分配的。
如果研究工作与资源和机会有着密切关系,拥有后者的人们有着更大优势。不过,在资源与机会的分布与分配等方面,各种人为的(政治、经济、权力、地位)因素不可避免地参与进来,使得科学发现者与科学发现之间的关系变得暧昧起来。
与那些资源或机会为基础的研究发现不同,“既神奇又直观”的研究发现通常取材于人们耳濡目染的场景和现象,发生在日常生活之中,人人得以观之,共享体验;一个学术领域中,许多现象(社会的、自然界的、显微镜下、资料中)司空见惯,习以为常;或许可以说,人人处于同一起跑线。在这一情形下,学者思他人所未思,见他人所未见,以独到眼光发掘或领悟深层的道理,这犹如控制了其他可能的噪音后提炼出研究者与研究结果间的因果关系,使得我们可以无疑地确定,发现者的独具慧眼给了我们如此“既神奇又直观”的发现。
这种独具慧眼,或许来自与生俱来的才具和悟性。但我宁愿相信,它更可能来自孜孜开掘而引起的顿悟,或随顿悟而引发的孜孜开掘。例如,前面提及马奇的两个命题,如果没有在随后的研究活动中深入开发和阐释其意义,它们充其量只会成为饭后茶余机智谈吐的话题而已。
因工作需要,不时读到不同学科关于学者研究活动的评论。特别令人眼睛一亮的是这样的评价:他/她的研究工作总是提出新颖的问题,总是试图解决有难度的问题(ask fresh questions, work on hard problems)。每每读到如此评论,对这类学者和研究的敬意和好奇油然而生,也让我想起爱因斯坦的一句话:“我不能容忍这样的物理学家,他拿起一块木板来,选择最薄的地方,在最容易钻孔的地方钻许多孔。”我们对“神奇又直观”的发现及其背后的学者肃然起敬,大概也是这个缘故。
--------------------------------
很早就想就“学术批评”这个题目谈谈自己的感想,因为在公共领域中经常读到关于学术作品的各种批评。“批评”在这里为中性意义,泛指评论,因为学术评论大多会评头品足,提出问题,是谓“批评”。提起笔来,才发现自己也没有读过关于这个题目的学理讨论,只是在学术训练和研究过程中自觉或不自觉地接触到学术批评活动;也可以说一直从事学术批评活动,从中形成了一些自以为是的看法。索性借这个机会整理一下自己的看法,一家之言而已。
首先,框定题目,用排除法来界定什么不是学术批评。可以粗略地区分出三类“批评”经常出现的领域:公共领域、政策领域、学术领域。虽然这三个领域中的“批评”多来自学人,且涉及学术作品(著作,论文),但其性质、标准和期待颇为不同,需要区分开来。
公共领域中的各种批评,可能来自学人,可能涉及学术工作,但关注点在于其公共性,即某一学术作品或学术活动的社会意义。批评者常常以学术作品为引头,借题发挥,或针砭时弊,或感慨陈言,书生意气,挥斥方遒。公共领域中的这些讨论评判有其社会功能,不容小觑。例如,各种报刊杂志中的书评,面对广大读者群,以传播知识思想为目标,一方面推广,一方面普及,一方面提高。这些议论大多不是从学术角度对学术作品的讨论,所以不是本文所关注的学术批评。
公共领域中另有政治性批评(或评论),即在“某某会议推动下……”,“在某某讲话指引下……”等种种话语,服务于各种政治需要,有着其特定逻辑,更是与学术批评毫无关联。
政策领域中的“批评”,我知之甚少。想来这一类批评涉及到学术作品与政策应用间的关系,其评估标准涉及到其作品中政策含义的可行性,成本收益分析,实施条件等等。这也是重要的一类评论,但也不是学术批评。
本文所指的学术批评是针对学术作品对知识的贡献为衡量标准而从事的评价,因此通常发生在特定的学术领域中,建立在特定的学术文献中。学术批评是学术建设的重要一环;学者是在专业化过程中习得学术批评的。阅读、写作或审阅学术著作或学术论文,同时也是一个学术批评的过程。
这个界定还嫌宽泛。这些年来接触到不同领域中的学术研究工作和活动。我注意到,即使在学术活动中,不同领域有着各自的标准规范,不可简单划一地一概而论。比如说,近来接触到的中国史研究领域,学者们的讨论更多地集中在资料甄别评估,和在资料基础上的提炼和推断。这些方面与我所熟悉的社会科学领域颇为不同。所以,更为准确地说,本文所说的学术批评,是指社会科学领域中的学术批评。
二
社会科学领域中的学术批评,建立在社会科学学术研究的逻辑之上。社会科学研究大多始于推理逻辑,即从特定文献中已为接受的前提假设和概念出发,从理论逻辑上推理发展新的命题,或建模检验其内在逻辑自洽,或从经验材料中检验之,或两者兼而有之。因此,学术评论通常有以下几个着眼点:
其一,在其理论逻辑和前提假设基础上,针对其逻辑严谨性或资料详实可靠性的审视。先说理论逻辑。社会科学研究的重要任务是在具体社会事实中抽象出具有一般性的命题。如此,其理论说法需要有逻辑性,有分类和概念化的提炼。如果一个研究中的理论逻辑时都含混不清,研究设计就无的放矢,那么我们没有理由接受或认真看待其研究发现和结论。如果是基于经验材料的实证研究,那么,我们不仅关注其理论逻辑(多隐含在已有研究工作中),而且要关注其研究设计是否针对这一理论逻辑和研究问题而来,分析手段是否得当,研究发现是否与其理论命题相吻合,关于研究发现的解释是否恰如其分。
其二,衡量一个研究对知识积累的贡献,其标准不是这一研究多么完美无误,而是比前人进步了多少。因此,学术批评的一个重要任务是讨论和评估该研究与已有的各种研究之间的关系,以及与前人相比,在哪些方面有具体的贡献或不足。这些贡献可能是在理论取向上的突破,例如,社会学中关于社会网络的开创性工作将社会结构、群体结构的关注建立在可观测、可测量的网络结构之上,由此引发了有关关系强度、关系密度和动态演变的一系列新的研究课题。贡献也可能是对某已有理论模式的精细化、简化或操作化;也可以是在经验材料上的开掘或向其他领域的延伸。这些发明恰恰是学术批评所应该着眼评估的。
其三,一个学术社区关于什么是“好的学术作品”的标准是约定俗成的,不断变动的。随着社区内部学术水准和共享知识的提高,学术评论的标准也在不断演变。这并不是说,这个过程是线性上升的。学术社区内因研究时尚或外在干预,可能一度采纳不当的标准,走弯路。因此,学术发展需要相应的纠偏机制,应该包容和鼓励不同风格和不同方向上的探索。
说了这些,似乎都是很专业、技术性的方方面面。的确,学术批评正是在这个层次、这些方面展开。换言之,学术批评需要有专业知识,需要放在一个特定的学术社区中进行,需要在已有文献和知识背景下展开,需要比较而言。那种大而化之的高低好坏评语,实在不属于学术批评领域。
三
理解了学术研究的逻辑,就不难看到貌似学术评论中经常出现的一些无的放矢的评判。
其一,“这个研究忽略了/没有考虑XXX方面……”。任何学术研究工作都只能在特定的范围内,使用特定的角度从事开掘工作,只能有所为有所不为。那种面面俱到、无所不包的研究风格,一定不是真正意义上的学术研究;这一点无需争论即可断言。如果研究作品中忽略了与主题有着内在关联的某个方面而失之偏颇,那么,学术批评的任务是要讨论和展示,为什么这一忽略导致了研究工作在理论逻辑或研究设计或资料取舍上的重要遗漏或失误,影响其结论判断,等等。
其二,“这个研究没有提供政策性建议……”。这里的道理如上。基础性的学术研究以“片面的深刻”为研究风格,即在“控制了其他因素后”,在某一个方向上对研究问题做深入分析开掘。如此,学术研究极难与现实有一一对应的关联。学术专业化的特点正是“trained incompetence”(专业训练而来的无能),即专业训练导致其特定方向的专注;与此同时,这一分析需要忽略(“控制”)其他方面。强行要求学术研究提出所谓的政策性意义,其结果只能是肤浅的、敷衍了事的甚至是误导的。据说,国家基金资助的学术研究项目,若没有政策性建议部分,则不能结项。真是令人无语。只能说,这是一个官僚逻辑而来的评判标准。
其三,另外一个常见的毛病是,做出整体性断言评判而不提供具体、实在的理由/证据。当然,这种评判不太会在学术批评的过程中出现,更多地出现在公共领域中。
小结一下。文章开始所列的三种“批评”(公共领域、政策领域、学术领域),各有使命,各有其主(读者),各有社会价值。我想强调的是,学人参与的、关于学术作品的评论,并不一定是“学术评论”。确有一些通才学者纵横捭阖,跨越不同领域而有建树。但在知识日益精细的今天,文艺复兴人那种百科全书式的学人日益稀少。学术研究的不同领域各有标准,各有知识积累与传统。没有规矩,无以成方圆,学术批评则无从谈起。作为学者和读者,我们需要区分这些不同的“批评”,以期保持不同领域间的边界,特别是保持学术研究和学术批评的尊严和独立性。
重学量化方法的观察和感受
当我在2004年开始田野研究时,自以为从此告别量化研究的学习了,不是说不再从事量化研究,而是无需再关注量化研究新技术、新模型的发展。此前主要从事量化研究,需要不断汲取新的分析手段。随着研究兴趣的转变,学习方向也相应变化了。
几年前开始的一个新研究项目,涉及到自己不熟悉的网络分析方法。起初期待只需大致了解,借用合作之力来进行这个项目。但在实践过程中发现,若不在方法上有切实把握,难以深入思考和探究,于是决定学习新的量化方法。
不料这一决定打开了潘多拉盒子。这一领域不仅仅需要网络分析技术,还需要学习全新的统计知识和统计模型,因为网络资料与传统统计学关于样本独立同分布假设(iid)迥然不同。雪上加霜的是,已熟悉的程序软件处理网络资料力不从心,又要学习新的程序语言(R语言),更兼近年来恰逢网络研究发展活跃时期,新的统计模型和分析技术犹如井喷般涌现,令人应接不暇,也留下一地废品垃圾,作为新手从中筛选,事倍功半,浪费了不少气力,自不待言。
几年下来,虽然花了一些气力学习方法,但同时在不同项目间穿梭,未进入量化研究状态。直到最近大半年才下决心暂时搁置其他项目,集中精力学习新的量化方法。于是又体会了一把小学生般的学习过程,也因此有了新的感受,其中印象最为深刻的是学习环境和学习媒介的巨大变化。
一
这次重新学习才发现,学习的媒介和渠道发生了巨大变化,可以完全摆脱传统的学习模式而达到学习目标。首先,网上视频代替了课堂,无需身临教室也能聆听教诲。我在网上看了两门网络课程的视频,均为领域中的重要推动者所授。不仅如此,Youtube上存放着众多关于网络分析专门课题的视频,可以说应有尽有,尽其所需。
学生阶段学习量化方法时,周围有一个“团队”,可以随时转身询问周围的同学。与此相比,自学的最大困难是,有了问题难以随时求教。例如学习新的程序语言时,一点小问题可能会卡上数小时。后来发现网络上有丰富的Q&A资源。编程序时出现问题,只要把“error message”拷贝到Google上,就会发现已经有人提出过同样或类似问题,而且已经有若干热心网友的解答,甚至延伸讨论。网络资源之丰富令人惊讶,实践至今还没有碰到过在Google上毫无线索可寻的情形,可以说比在计算机房转身问同学还有效率。
还可以通过email直接向素昧平生的学者远程求教,而且总会得到对方的热心帮助。有一次使用一个网络分析软件时,总是碰到bug,费尽九牛二虎之力仍不得其解,于是给软件两位作者(一位在波士顿、一位在德国)发信求教,在24小时内收到两人的回复,指点我下载最新软件,解决了bug问题。还有一次,在Google Scholar上发现一篇和自己研究相关的短文。发信给作者询问是否有完整论文可供阅读。通信后才知道对方是一位博士研究生,他不仅提供了自己正在写作的博士论文一章,而且附上分析所用的数据和R codes。后来在跑他的程序时碰到一些小问题,还有若干次email来往。此外,还可以按图索骥地通过Google Scholar寻找到各个领域中相关文献,大多还可以直接下载。
简言之,这次的重新学习,大多是在网络社区和陌生人群中进行的。
三