统计计量 | 谢宇:定量研究最重要的是什么?
本文转载自公众号量化研究方法
本文来源于访美国国家科学院院士、密歇根大学谢宇教授的讲话原文
定量研究最重要的是理念
近日,就社会科学的定量研究趋势、国内对定量研究的误解、定量研究在公共讨论中的作用等问题,本报特约记者、上海社会科学院城市与人口发展研究所助理研究员杨晓萍,在上海大学主办的“2013年社会学与人口学研讨会”会场对谢宇教授进行了专访。
谢宇(Yu Xie),美国密歇根大学社会学、统计学和公共政策教授,威斯康星大学社会学博士,美国艺术与科学院院士和美国国家科学院院士。在定量方法、社会分层、人口统计、中国研究、社会学,及社会科学调查与数据收集等方面作出了持续的贡献。
著作有:《科学界的女性》、《婚姻与同居》、《美国的科学正在衰退吗?》、《社会学方法与定量研究》(中文)、《分类数据分析的统计方法》等。
1
中国的社会科学研究
需要比较好的调查数据作为支撑
Q1:国内“中国家庭追踪调查”数据为基础的,类似的调查数据在国内越来越多,这些调查数据对社会科学研究有着怎样的意义呢?
首先,社会需要了解中国变化的真实情况,这些调查数据可以满足这一需要。比如说,大家对中国社会存在的不平等问题很感兴趣,中国民众对房价的增长很感兴趣。中国社会的不平等程度到底怎样?不平等程度未来会怎样?当前中国的房价增长有多快?不同地区的房价有什么差别?人们平均有多少套住房?不同收入的人对房价的承受能力有多大差别?这些问题大家都很关心,但却不知道从哪里可以得到客观、准确的答案。而这些调查数据可以满足民众想了解这些问题的需要。
其次,这样的调查数据也满足了中国社会科学走向世界的需要。因为社会科学要走向世界,就要用比较严格的方法,需要有很好的数据。“中国家庭追踪调查”数据和其他数据满足了这一要求。另外,也能满足政策制定的要求,因为政策制定需要比较科学的数据作为依据。政府的数据,如统计局的数据是很重要的一个依据,但是这只是一部分数据,而且可能跟我们的调查数据是不一样的。我们的调查数据能够提供更中立、更全方位的关于中国社会的信息。我想,这些对社会现象比较深入的、长期跟踪的全方位信息的提供,最终也会对政策制定有好的帮助。
Q2:从2004年起,您在中国积极推动社会科学定量研究的发展,包括培养研究人才和建立数据库,当时是出于怎样的初衷?
中国社会的变化很大,从以前比较贫困的国家发展成为一个中等收入的国家,并且自然科学、技术、艺术、电影、文学等各方面都在发展。我认为中国的社会科学也应该发展。因为中国是一个很有文化传统的国家,而且社会变化非常快,比如说工业化、城市化、教育的扩张、收入水平的差距、婚姻行为的变化等,这些社会现象都需要用现代社会科学方法加以较好的研究。而这些研究以前缺乏比较好的数据。
为了使中国的社会科学研究能够与国际上的中国研究对话,达到国际上社会科学的标准,我从2004年开始,一是在北京大学开设定量研究方法班,把国外的专家引入中国,用英文讲学;二是在北京大学建立“中国家庭追踪调查”(CFPS)项目,而且,也参与其他的调查项目,比如说中国人民大学的“中国综合社会调查”(CGSS),复旦大学的“长三角地区社会变迁调查”(FYRST),还有中山大学的“中国劳动力动态调查”(CLDS),等等。我觉得有了很好的调查和第一手的数据,以前研究中缺乏数据或者没有很好的数据的状况就能够改变;而且这些数据要公开,让不同的学者,特别是年轻人可以共享,可以对以前作的一些结论提出不同的看法,并在国外的杂志发表研究成果。
2
定量研究最重要的是如何提出问题
而不是数据和统计方法
Q3:目前,中国的定量研究还处于起步阶段,往往存在着一些误解。比如,很多人认为定量研究就是对一堆数据进行分析,或者就是用统计方法建立模型。您如何看待这些误解?
我觉得目前对定量研究确实存在着很多误解,很多人把定量误认为就是数据,或者就是统计。可以这样打个比喻:数据是原始材料,可以派不同的作用;统计是一种技术,是运用材料的手段。材料和手段都重要,但是假如说你不知道要做什么,那么就会什么也做不成。比如,研究贫困问题,有很多可以测量贫困的数据,包括官方和各类调查得到的家庭收入数据;也有很多统计方法、模型和测量标准。但是如果不知道用这些数据和统计方法去研究怎样的问题,那也还是做不成定量研究的。所以定量研究最重要的是理念,即怎么看一个问题,看问题的哪个方面,然后怎么验证自己的看法。它是一个全面的过程,不只是数据,也不只是统计,而是运用统计来研究数据,来回答我们想要了解的问题。数据、统计方法、理念,三者缺一不可,其中,理念是最重要的。有些人的研究有数据,有统计方法,但不知道研究什么样的问题,这就不是很好的定量研究。
另外,对于定量研究和定性研究的关系,国内也有误解。我认为,定量研究和定性研究并不是互补、并行的关系。定性研究是为真正的比较科学的定量研究做铺垫准备的,没有很好的定量研究,一些定性的看法或提法是不能得到验证的。也就是说,定性研究本身很难验证什么东西,它可能给出一些启发,是一个基础;在一定程度上讲,定性研究是一个做准备工作的研究阶段,而不是真正严谨的研究方式。
比如贫困问题,有一个普遍的看法认为贫困是自我生产的,也是长期的。然而,美国“收入动态追踪调查”(PSID)的数据研究发现,在美国,并不是所有贫困人口或家庭长期贫困、依赖社会福利。即使当贫困人口在总人口中的比例没有下降的时候,构成贫困群体的具体贫困个人和家庭也在不断变化。“中国家庭追踪调查”(CFPS)2010-2012年的追踪数据对中国的家庭也有同样的发现——70%的贫困家庭在两年间实现了脱贫。这是一个通过定量研究验证定性假设的很好的例子。
3
定量研究呈现了学科、多方位的
电子数据采集和国际化发展趋势
Q4:国外社会科学界对于定量方法的应用已经相当普遍,而且定量方法似乎已经成为跨学科研究的重要媒介,可以将脑科学、行为科学、经济学、社会学、政治学、心理学等理论容纳到对一个问题的研究中。这是定量研究的一个趋势吗?定量研究还有哪些发展趋势?
的确,社会科学本来就是一个大的领域,我们由于种种原因把它划分为不同的领域,比如经济学、社会学、政治学、心理学、教育学等。实际上,我们的研究应该是跨学科的。这有几个原因,一是,研究方法是通用的。方法不能分为这个学科或者那个学科的方法,方法只有适用不适用、科学不科学的问题。没有哪个学科能垄断一个方法或一种数据。二是,一个社会现象本身涵盖的内容就很多,比如社会地位就涉及到经济学,因为对社会地位最直接的一个衡量标准是收入水平;它涉及到社会学,社会地位的获得与家庭背景紧密相关,而家庭作为一种社会结构,是社会学所关注和研究的一个重要领域;它也涉及到教育学,因为社会地位的流动很大程度上通过教育来实现。
此外,它还跟社会心理、政治、法律、公民健康等有关,因此涉及到心理学、政治学、法学、医学等学科。所以每一个研究问题涉及到的领域很多,人不能画地为牢,而是要看所研究的问题把你带到哪里。所以,定量研究不是数据导向,不是方法导向,也不是学科导向,我比较提倡的是问题导向。提出一个问题,最终目的是要回答这个问题。只要可以解答这个问题,任何数据、方法、理论、知识都可以用,而不分领域或学科。
除了跨学科研究的趋势,定量研究还有一些其他的发展趋势,比如多方位电子化数据采集的趋势。随着信息化的发展,很多信息比如医疗情况、学习情况、手机使用情况、交通卡使用情况,都被电子化了,我们可以多方位地采集电子化数据,并运用到定量研究中。还有国际化的趋势。以前定量研究主要在美国,现在不光在美国,从欧洲到亚洲,从非洲到拉丁美洲,几乎所有地方都有定量研究,定量研究正在国际化。
Q5:您刚才讲到多方位电子化数据采集的趋势,“大数据”(Big Data)在当下的网络时代成为一个热门词汇。英国学者维克托·迈尔-舍恩伯格(Viktor Mayer-Schnberger)和肯尼思·库克耶(Kenneth Cukier)著有的《大数据时代:生活、工作与思维的大变革》(Big Data: A Revolution That Will Transform How We Live, Work, and Think)也成为《纽约时报》的年度畅销书。他们认为随着信息化程度的提升,我们可以不用抽取样本而得到总体数据。您认为“大数据”会替代抽样数据吗?
中国的社会科学研究大数据的产生是一个社会现象,它会为我们提供更多的数据。我们以后做研究会不可避免地用到这些数据。但是大数据也是有缺陷的,所以也不要迷信,认为有了大数据,其他数据都不要了,这也是错误的想法。现在有了大数据,只是多了一种工具、一个手段,由于它存在一些问题,如数据的深度问题、覆盖率问题、样本选择问题、准确性的问题等,所以大数据本身不可能替代其他数据。当然,它还是弥补了很多以前数据的缺陷,这会是一个弥补性而不是取代性的变化。
4
学者们参与公共讨论要
有依据、负责任,不能超过研究专长
Q6:定量研究在公共争论中也能起到正本清源的作用。中国当下的一些公共话语比较混乱,而一些学者加入之后,往往加剧了这种混乱。如果要做出比较好的研究,对于公共争论起到实质性的贡献,应跨过哪些差距?
我觉得这是中国学术界的一个很大的问题,不是所有参与公共讨论的学者都是负责任的。社会需要一些学者对社会现象作一些评价和讨论,但是国内一些学者,当然不是全部,在公共场合做的一些讨论,我觉得是缺少依据的。因为他们对讨论的问题还没有做过很严谨的研究,或者其观点只是得到部分验证,还没有得到其他人的认可。我觉得这种情况很不好,特别是对年轻人,他们会觉得只要有名望有地位,就可以对任何事情作出一些并没有依据的评论。而有些评论在我看来只是一种观点,比如房价会跌多少涨多少;GDP应该增多少涨多少,等等。严谨的学者也可能作出这样的结论,但是,在作出这样的结论之前,他会做大量的工作。他有很多的假设,没有假设是不可能作出这些结论的,但是这些假设大家是可以讨论的,比如说,这些假设对不对,为什么做这样的假设,是不是有可能导致推测、结论出现问题。
不把这些东西讲清,别人会以为你讲的就是真理性的、必然会发生的事情,也不可能对你提出批评。所以,公共讨论是可以的,但一定要对问题做了研究,一定要有严谨的研究步骤,而且经得起时间的检验和别人的批评。所以对学者参与公共讨论就有几个要求:第一,一定要有依据,要把结论的来源和依据讲清,要有依据,要有交代,不是以名望和地位来作为支撑,而是要以研究作为支撑;第二,参与公共讨论的学者,应该只是参与讨论他专长的做过研究的领域。没有做过研究就没有发言权,讨论的问题不能越过他的专长。(1390期 第5版)
星标⭐我们不迷路!想要文章及时到,文末“在看”少不了!
点击搜索你感兴趣的内容吧
往期推荐
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
推荐 | 青酱