如何用调查实验法测量生育意愿?
在超低生育率和生育意愿普遍低迷的现实下,如何科学测量生育意愿?如何科学评估各项社会经济因素对生育意愿的影响?别着急,调查实验法来帮忙。
严肃的人口学八卦
01.
什么是调查实验法?
调查实验法又称问卷实验法,是在问卷调查中嵌入实验设计。也就是说该方法包含实验设计的基本要素:由研究者操控呈现的实验刺激材料(通常是不同版本的问卷设计)和对受访者的随机分组。这样的研究设计结合了实验法的因果操控和问卷调查的大样本量,从而兼顾研究的内部和外部效度。
严肃的人口学八卦
02.
调查实验法在因果推断
上的优势
用问卷做实验在因果推断上的优势显而易见。王森浒(2022)等人的文章有具体论述。因果推断的原理是引入反事实(counterfactual)的框架,比较一件事情在相反的情况下的状态。然而我们在现实中永远没有办法观察到反事实的状态。因此,实验法采用随机分组帮助模拟反事实状态。在问卷调查中,通常采用统计控制模拟反事实状态。然而,随机分组可以消除实验组和控制组在个体特征上的差异;统计控制却无法消除不可观测到的个体差异。简单来说,将实验设计融入问卷调查,检测因果关系的“实验研究”将不再是社会科学的软肋。
严肃的人口学八卦
03.
调查实验法的类型
与发展
调查实验法的应用有多种情境和类型。一类是用于提升敏感问题、主观问题的测量信度与效度的设计。包括虚拟情景锚定法、列表实验、随机应答实验等。虚拟情景锚定法的设计应用于中国家庭追踪调查(CFPS)中的主观社会地位测量(宋庆宇& 乔天宇,2017)和中国健康与养老追踪调查(CHARLS)中的自评健康测量(Mu,2014)等。。
虚拟情境锚定法的应用案例
— 自评健康 —
自评健康是健康测量中常用的收集指标。由于受访者回答的异质性,身体健康相同的个体的自评健康可能完全不同;或不同健康状况的个体可能回答相同的自评健康水平。使用虚拟情景锚定法,在自评健康水平后加入虚拟情景题,以控制不同个体自评健康中的尺度差异。以CHARLS的虚拟情境锚定法为例,受访者在回答自评疼痛后会给出对应的三个虚拟情境题:
张军/王红每月都有一次头痛,吃药之后会得到缓解。头痛时,他/她能继续做日常工作。您认为,在过去一个月内,张军/王红身体有没有疼痛?程度如何?
在过去一个月内,周伟/李丽白天在电脑前工作时,他/她右边的胳膊和手腕都会庝,晚上在家不用打电脑时,疼痛会略微减轻。您认为,周伟/李丽身体有没有疼痛?程度如何?
在过去一个月内,赵亮/张燕的膝盖、肘部、腰部和手指都有疼痛,而且疼个不停。他/她吃药以后会减轻,但走路、拎东西和举东西仍然吃力。您认为,赵亮/张燕身体有没有疼痛?程度如何?
基于“情境等值性”(Vignette Equivalence)的原理对受访者的回答进行调整,调整后的自评健康就能够很好地反映个体的身体健康状况差异。
另一类设计通过创建信度与效度相近的短问卷版本,通过随机分组等方式控制问卷作答时长,减轻问卷过长对应答率与应答质量的负影响。这一设计同样可见于2016年中国家庭追踪调查(CFPS)中的CES-D抑郁量表的长短表设计(吴琼等,2018)。
长短问卷设计实验案例
在CFPS2016的问卷设计中,CES-D抑郁量表沿用了20道题的长表和8道题的短表两种形式。调查执行中,受访人群的1/5随机使用了CESD20长表,剩下 4/5 的样本使用 CESD8短表。后期分析表明,长短表具有完全对等的测量效果;基于百分位数等化方法(equipercentile equating)生成的可比分数,也与CFPS12中的CESD20得分也是可比的。此后CFPS2020全部沿用了CESD8短表设计。这一实验为主观量表题在大规模问卷调查中如何更有效率地应用提供了一个很好的案例。
CFPS2016 CESD模块设计
CFPS2020 CESD模块设计
还有一类应用设计则是将虚拟情境与随机分组结合,从而获得确定的因果关系。这类设计也被称为情景实验(vignette experiment),也是应用最为广泛和应用前景最广阔的实验设计方式。
情景实验又可以分为单因素和多因素的设计。单因素设计只包含一个实验变量,多因素设计又名析因设计(factorial design),是将两个及以上的实验因素进行组合,探究各实验因素对结果的影响。因此,又名联合实验设计(conjoint experiment design)。联合实验设计能在不大量增加被试数量和成本的条件下同时研究多因素多水平的处理效应,广泛应用于市场调查、产品研发、公众对政策接受度等公众偏好研究中。后文将对联合实验设计的要素和案例进行详解。
严肃的人口学八卦
04.
联合实验设计的要素
自变量的数量和水平
自变量数量是虚拟情景中需呈现的因素个数。自变量水平的乘积构成了所有虚拟情景的个数。例如,一个联合实验设计考虑了4个自变量,每个自变量分别有2、3、4、5个水平取值,那么将得到2*3*4*5=120种自变量水平组合的虚拟情景。
情境题组
(vignette universe/population)
/全因子(full factorial)
根据所确定的因素与水平,全因子实验是指各因素的各水平全面组合,也被译为完全析因设计。完全析因设计允许估计所有可能的交互作用。但需要更大规模的样本量,并且在高水平交互作用不显著的情况下效率低下。因此仅在仅有少量因素和水平的情况下使用完全析因设计。
部分析因设计
部分析因设计是从情境题组中选择一个小样本,假定高水平交互作用为零的情况下确保对各因素的主效应的估计。选择方式有两种:随机抽样法和效率指标法。随机抽样法是在完全析因实验设计基础上随机抽取一个情景题组数。效率指标法是根据各类效率指标确定析因设计方案,其效果比随机抽样好。最为常用的是D-efficiency指标,可以确保筛选出的实验设计具备正交性和均衡性。
试验集(sets/blocks)
在部分析因设计的基础上,为了节省样本量,通常根据每个受访者需要回答的虚拟情境的数量,将实验情境分成多个组合(sets),每个受访者仅回答其中一组。
严肃的人口学八卦
05.
调查实验法在生育意愿
调查中的应用
&
单因素实验设计
Gong & Wang (2022)使用了问卷实验法考察日本家庭政策对青年结婚以及生育意愿的影响。该研究采用了来自日本明治安田研究所实施的“婚姻与生育相关的调查”数据。该项目按照奇偶数将问卷随机分为A卷和B卷, A卷向受访者展示了日本的17条家庭支持政策信息,并将相关家庭支持政策所提供的结婚与生育支援换算成具体数额;B卷则没有对受访者提供任何日本的家庭支持政策的信息。两份问卷都询问了受访者的结婚与生育意愿。这样一份为了节省问卷空间的设计将受访者随机分为了是否受到家庭支持政策刺激的实验组和控制组。Gong & Wang (2022)的分析发现实验组的受访者比控制组的受访者更可能回答他们有“高结婚意愿”。这意味着接受家庭政策信息披露可以显著提升年轻人的结婚意愿。
&
联合实验设计
完全析因设计
於嘉等(2023)利用搭载于2021年中国综合社会调查(CGSS)的联合分析随机实验法调查了育龄人群在虚拟情境下对他人生育潜力的评估。该实验包含了一项由家庭年收入、家庭照料、市场化育儿服务和已有子女的性别构成组成的虚拟情境陈述,评估对应情境的二孩和三孩的生育潜力。根据情境因素的取值,二孩生育潜力实验包含了3*2*3*2=36种虚拟情境;三孩生育潜力实验共有3*2*3*3=54种虚拟情境。以上所有情境随机呈现给受访者,每个受访者回答两道二孩情境实验题和一项三孩情境实验题。借助于CGSS的全国代表性样本,该研究实现了完全析因设计这样奢侈的实验法。联合分析结果表明,家庭经济资源和照料资源可以显著提升二孩和三孩的生育潜力,已有子女性别构成则没有显著影响。换言之,中国当下育龄人群的生育潜力仍有空间,如何设置生育配套设施缓解家庭经济资源对生育意愿的限制,应当成为提振生育水平的施政方向。
D-efficiency析因设计
介绍一项来自跨国团队的研究,Karabchuk et al (2022)调查了德、日、俄、乌克兰和阿联酋五国的受过高等教育的年轻人的生育态度。研究基于文献,设计了包含夫妻的教育、职业状态、家庭收入、家务分工和儿童照料7个因素共计1024种虚拟情境的联合实验。如此多的组合显然不能全部呈现给受访者,研究者筛选出D-efficiency 得分最接近100的32个情境,并分成2组,每组16个虚拟情境。每个受访者回答其中一组。研究结果揭示出影响生育意愿的因素的效应大小和国别差异。这个研究展示了基于D-efficiency的联合实验设计在生育意愿研究上的效应和潜力;不过,调查采用线下纸笔问卷的方式进行,随机分组不足使得每位受访者回答的虚拟情境过多,也削弱了联合设计实验的效力。
严肃的人口学八卦
06.
一项基于D-efficiency
的联合实验设计介绍
最后介绍一项面向大学生的虚拟情境联合实验调查。为什么是面向大学生呢?首要原因自然是因为研究团队都是来自深圳大学社会学系的大二学生。和成为被研究的他者相比,她们更想采用科学的方式为自己代言发声。其二是当下以大学生为代表的青年群体中“不婚不育”的观念逐渐流行。然而,大学生离生育议题还相对较远。沿用传统的生育意愿测量方式,将无法反映大学生在生育议题上对现实的复杂感知。联合实验设计的优势在这一议题上毫无疑问显现出来。
我们设计的这一实验包含了职业、家庭年收入、住房情况、家务分工和儿童托育五个维度组合而成的216种虚拟情境,采用D-efficiency指标筛选出32种组合,并分成8组。也就是说,问卷打开后将随机掉落4种虚拟情境。本轮为研究的第二期设计,问卷一共有11道题,其中有4道虚拟题,答题仅需1-2分钟。只要您是在读大学生,包括专科生、本科生、博士生,欢迎点击下方链接,或扫描二维码,参与答题。如果您不是在读大学生身份,想要参与或了解这份问卷?没问题,在读阶段选择其他即可。
参与方式:点击下方链接或扫描二维码
https://www.wjx.cn/vm/rZXdDsC.aspx#
作者:深圳大学政府管理学院社会学系 黄国英
责编:中国人民大学社会与人口学院 靳永爱
参考文献
Gong S, Wang S. Family policy awareness and marital intentions: a national survey experimental study. Demography, 2022, 59(1): 247-266
Karabchuk, Tatiana & Duelmer, Hermann & Gatskova, Kseniia. (2022). Fertility attitudes of highly educated youth: A factorial survey. Journal of Marriage and Family. 84. 32-52. 10.1111/jomf.12790.
Mu, R. (2014). Regional disparities in self‐reported health: Evidence from Chinese older adults. Health economics, 23(5), 529-549.
宋庆宇, & 乔天宇. (2017). 中国民众主观社会地位的地域差异: 基于对 CFPS2012 成人问卷数据的 “虚拟情境锚定法” 分析. 社会, 37(6), 216-242.
王森浒, 李子信, 陈云松, & 龚顺. (2022). 调查实验法在社会学中的应用: 方法论评述. 社会学评论, 10(6), 230-252.
吴琼 戴利红 甄祺 张婧申 谷丽萍 张聪 赵方圆. (2018). 中国家庭追踪调查2016年数据库介绍及数据清理报告. http://isss.pku.edu.cn/cfps/docs/20181229160348287861.pdf
於嘉等:中国育龄人群生育潜力影响因素的随机实验研究,《中国人口科学》2023.2