「观点」社会科学研究如何用数据说话
本文原载于《中国妇女报》2020年8月18日,原标题为《规范科学的社会科学研究,如何用数据说话》,作者为陈业强教授。
✤ 确定研究问题、开展文献综述与研究设计
◉ 确定研究问题、开展文献综述、做好研究设计是社会科学研究的前提和基础工作。
◉ 好的研究问题有两种视角,一是理论视角,二是经验视角。文献综述首先要识别有效研究,剔除无效研究。社会科学设计取决于研究目的或要回答的问题。
✤ 对真实世界的抽象描述与操作化
◉ 确定研究问题、做好研究设计之后,要将学过的理论转化为数据分析计划,进一步将研究问题操作化。
◉ 其一,对真实世界的抽象(模型和数据)描述。
◉ 其二,做一个好的测量。
✤ 抽样与统计推论
◉ 很多研究是通过以样本推论总体的方式实现的,这其中涉及界定研究总体、抽样方法选择、统计推论等步骤。
◉ 其一,明确研究对象和总体。
◉ 其二,样本必须对总体有代表性。
◉ 其三,对总体的推断问题。
◉ 其四,合理选择样本规模,保证结论有效。
◉ 其五,多变量研究与模型的选择和使用。
◉ 科学研究的目的就是揭示客观事实及其规律,反映一般性和普遍性规律。科学研究的方法就是如何反映客观事实、如何揭示客观规律。科学理论就是哪些规律已经被揭示出来了,哪些还需要后人继续揭示。一个好的研究者需要不断加强研究方法和理论的学习和训练。
规范科学的社会科学研究,如何用数据说话
陈业强
8月14日,北京大学乔晓春教授在山东女子学院举行题为“如何做规范、科学的社会科学研究——以性别研究为例”的网络视频讲座。乔晓春教授认为:社会科学研究者要知道如何用数据说话,学会和用好研究方法。“用数据说话”有一定规矩,需要遵循一定的程序,包括发现问题、提出假设、收集数据、分析数据、检验假设和得出结论。
乔晓春,1958年生,北京大学人口研究所教授。主要作品有《中国社会科学离科学还有多远?》《人口学教程》(合编)等。
确定研究问题、开展文献综述与研究设计
确定研究问题、开展文献综述、做好研究设计是社会科学研究的前提和基础工作。
——提出好的研究问题。好的研究问题有两种视角,一是理论视角,二是经验视角。理论视角就是已有理论已经指明了研究方向,你要做的就是沿着这个方向往前走。理论提供了对社会现象的解释,再把这种解释转换为研究假设,这样的研究从描述理论说起。以性别研究为例,西方妇女研究的理论学派给出了研究方向,我们可以从中找出研究问题,比如,为什么越来越多高学历女性不想结婚?为什么越来越多年轻女性不想生孩子?生孩子是否真的导致了失业、工资减少、阻碍晋升……?经验视角就是选择老百姓关注的、社会上谣传的、自己感兴趣的问题,这样的研究从讲故事说起。
——文献综述。文献综述首先要识别有效研究,剔除无效研究。文献综述不是要“述”,而是要“评”。文献综述要处理好“别人已经做”和“你将要做”的关系,“你将要做”是目的。另外,文献综述不是回顾和罗列别人做了什么,而是要发现别人哪里做的不对,找出别人没做过的地方。
——研究设计。社会科学设计取决于研究目的或要回答的问题。不同问题有不同的理论框架,涉及不同的关系、不同的变量,不同收集数据的方式、使用不同的模型等。研究设计相当于写开题报告,好的研究计划相当于已经完成了研究的90%。做研究设计的主要问题:一是核心变量的概念界定和操作化界定模糊或者错误;二是数据只涵盖研究对象,而忽略对照组;三是用截面数据,将“数量关系”当做“因果关系”来研究。
《中国社会科学离科学还有多远?》
对真实世界的抽象描述与操作化
确定研究问题、做好研究设计之后,要将学过的理论转化为数据分析计划,进一步将研究问题操作化。
——对真实世界的抽象(模型和数据)描述。科学研究一般要从真实世界到理论模型,从理论模型到精细模型,从精细模型到操作模型。由于学习理论和学习方法的分离,不会把学过的理论转化为数据分析计划是常见的科学研究问题。过渡模型(精细模型)被称为基于理论的数据分析。模型的最优和理论的最优,有时是两回事,甚至会有矛盾。我们应坚持理论优先原则,避免理论脉络的不清晰导致操作模型关系混乱、重要变量缺失或被忽略。
——做一个好的测量。做一个好的测量的目的是将事实转换成数据。数据是事实的抽象,方便分析和处理。存在能否测准的问题。第一是测量工具是否存在问题,从而影响测量的信度和效度;第二是被测量对象的抵触性反应,导致测不准的问题。测量对象包括两类事实:一类是直观事实,如性别、年龄、受教育程度等;二类是抽象事实,如幸福、痛苦、孝顺、抑郁等。一个好的测量应该采用社会公认的测量尺度和工具,尽量避免使用自己开发和创造的测量工具。
《人口学教程》
抽样与统计推论
很多研究是通过以样本推论总体的方式实现的,这其中涉及界定研究总体、抽样方法选择、统计推论等步骤。
——明确研究对象和总体。任何一项研究都必须有一个明确的研究对象,可以是全国、或一个省、一个市、一个县、一个街道,甚至可以是一个学校。研究一定是针对研究的整体,结论是针对样本所代表总体下的,不存在针对样本的研究。研究者必须在论文中明确表述研究总体,以及样本是否对总体有代表性。
——样本必须对总体有代表性。样本和总体的差异是随机带来的,不是人为带来的选择性偏差。必须保证数据来自概率抽样:随机+总体已知(保证总体的每个单位都有被抽中的可能性且可能性是已知的)。概率抽样有很多种方法,如简单随机抽样、分层抽样、整群抽样、等距抽样、多阶段抽样等。不同的抽样方法解决的主要是三个问题:无偏差性、精确性和方便性。由于复杂抽样绝大多数都不是等比例抽样(不是自加权抽样),通常都要做事后加权处理。研究者必须在论文中明确表述:数据是否是概率抽样,是哪一种抽样,是否做过加权处理,是否能够代表总体。
——对总体的推断问题。研究通常要反映“是什么”(描述)和“为什么”(解释)两个问题。这都是针对总体而言的。我们必须回答:样本结果在多大程度上可以反映总体?样本两个变量存在差异,到总体是否仍然存在差异?样本事实是否在总体上也是事实——对总体进行推断。
——合理选择样本规模,保证结论有效。一项研究在开始研究以前就要判断需要的样本规模。样本太少不行,估计不准;太多也不行,经费有限。样本规模的确定要有科学依据——总体有差异且能够证明有差异的可能性。方差越大,需要的样本规模越大。
——多变量研究与模型的选择和使用。很多研究都不关心模型假设,直接套用软件计算结果,并依次下结论。实际上,数据只有在满足模型假设时,模型才可以使用。不同目的,不同数据类型和结构,使用不同模型。
总体而言,科学研究的目的就是揭示客观事实及其规律,反映一般性和普遍性规律。科学研究的方法就是如何反映客观事实、如何揭示客观规律。科学理论就是哪些规律已经被揭示出来了,哪些还需要后人继续揭示。一个好的研究者需要不断加强研究方法和理论的学习和训练。妇女/性别属于跨学科的社会科学研究,同样离不开科学方法和理论的指导。
作者简介
陈业强,1970生,山东女子学院妇女研究与发展中心教授。著有《女性的反响:加速实现性别平等与妇女赋权》等。
往期推荐
观点
论人文社科学术期刊十大关系
刊界
方圆
政府工作报告双语学习词典
数迹
智汇
2022年哲学社会科学研究发展报告
书简
没有时间读书怎么办?
撷英
声明:推文基于更好更多传递信息之目的,限于视野和能力,可能会有疏漏及不足之处,请随时指正。若有来源标注错误或侵犯了您的合法权益,请致信zhpj@nju.edu.cn,我们将及时更正、删除,谢谢!
转载请按以下格式注明来源 ↓ ↓ ↓
本文转自微信公众号“中国人文社会科学综合评价研究院”
长按二维码即可关注,第一时间获得我国人文社会科学学术动态与研究资讯。
觉得“好看”请点赞或在看