20世纪80年代以来,市场机制的引入对公共教育体制、学校管理模式、教育资源分配方式等产生了全方位的影响(Ross and Gibson,2007;贺武华,2009),催生了传统学校教育体系之外的教育形式,激发了个体教育机会选择的多样性需求,如参加课外补习。近十几年来,课外补习产业在中国迅速兴起,越来越多义务教育阶段的学生参加课外补习以提高考试成绩,从而在升学考试中获得优势。中国教育学会中小学课外辅导家长调查结果显示,超过80%的家长非常或比较赞同课外补习是中小学阶段教育必不可少的一部分(中国教育学会,2016)。
课外补习的盛行对中国公共教育体系形成了冲击,引发了公众对于教育公平问题的担忧(闫闯,2019)。2021年7月,中共中央办公厅、国务院办公厅印发《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》,正式明确“双减”政策并主动管制校外培训机构的无序扩张。在此背景下,研究课外补习现象,可以使我们从教育社会学的视角认识中国教育资源市场化配置下的个体教育选择机制及其影响,并深入探究影响教育不平等形成的个体和社会动因。在教育社会学领域,被称为“影子教育”的课外补习和教育公平的关系问题一直是争论的焦点(Stevenson and Baker,1992)。一方面,根据批判教育社会学理论,虽然市场化使得大多数家庭拥有了除公共教育之外更多的教育选择机会,但如果任其发展,将会造成既得利益群体对优质教育资源的垄断,并且,他们可以通过影响学校教育和社会化过程,从道德和意识形态领域去合法化自己所拥有的支配权力,从而固化社会再生产过程,加剧教育不平等程度(Bourdieu,1973;Bowles and Gintis,1976;钱民辉,1997)。这一论点的支持者反对教育领域过度市场化,认为课外补习会加深社会再生产,导致教育不平等。
另一方面,也有研究认为,由于缺乏竞争,传统的学校体制对教育资源的配置和利用是低效的。这一弊端应当通过市场引入竞争机制进行修补。对于弱势群体而言,正是由于公共教育资源的分配过程可能存在不平衡和低效率等弊端,他们的利益反而得不到有效保障。因此,这些研究认为,强化公共教育并不能缓解教育不平等,而市场机制会使教育资源的配置和利用达到优化,从而改善弱势群体的境遇,促进社会流动(Hanushek,1986;Howell and Peterson,2006)。所以,这一论点的支持者认为,课外补习将有益于弱势群体,能促进社会流动,减少教育不平等。两种不同论点为研究中国的课外补习现象提供了重要的理论视角,但哪种视角对理解市场化条件下课外补习和教育公平之间的关系更有说服力,仍然是当下需要探讨的重要问题。随着相关领域全国代表性调查数据的丰富和完善,越来越多的研究开始关注课外补习对学生学习成绩的因果效应(丁亚东、薛海平,2016)。然而,参与课外补习是否有益于学生提高学习成绩,现有研究并没有达成共识。父母及其子女选择参与课外补习的动机是复杂的,受诸多因素共同影响。在应试教育体制下,父母和孩子不是完全被动地接受制度的安排,而会从自身的境遇出发,充分发挥自主性,在既有体制框架内合理寻求利益最大化。以往研究表明,个体、家庭、学校等背景因素差异会导致课外补习效应的异质性,但以往研究仍未厘清个体选择倾向性对课外补习效应的影响。在此基础上,根据中国的教育市场化变革的实际情况,本研究提出两个相互关联的研究问题:个体、家庭、学校等因素是如何影响学生参与课外补习的倾向性的?根据这种倾向性差异,课外补习对学生成绩的影响又是如何产生异质性变化的?对这两个问题的探究可以使我们更好地掌握个体课外补习的选择偏好及其对学生学习结果影响的异质性,并正确认识中国教育资源配置市场化下课外补习对教育公平的影响。
关于课外补习效应异质性的研究,传统的分析方法主要是在回归模型中加入“课外补习”与某个可能产生效应异质性的变量之间的交互项,并假设影响课外补习效应异质性的选择机制可以简单归结于某一因素。然而,能够调节效应异质性的潜在因素可能不止一个,单纯关注某一个或几个因素会忽视复杂的个体选择偏好机制对课外补习效应异质性的影响。在数据受到限制的情况下,在回归模型中加入太多的交互项也会产生模型估计问题,同时需要有力的理论支持对交互作用的解释。另外,传统回归模型中交互项的作用是基于线性关系假设,并不能有效检验非线性的交互作用(Brambor,et al.,2006;Hainmueller,et al.,2019)。随着基于效应异质性的倾向值分析方法被广泛使用,研究者对个体选择如何影响行为效应异质性也有了更深入的认识(Xie,et al.,2012;Zhou and Xie,2020;胡安宁等,2021)。有研究表明,参与课外补习的倾向性会影响其效应异质性(李佳丽,2016)。参与课外补习的倾向性是指在复杂的个体选择背景和影响因素下学生参加补习的概率。基于倾向值的效应异质性分析的主要目的是探究课外补习效应是如何随着倾向值取值的变化而变化的。倾向值分析方法对研究课外补习效应的异质性有其独特的优点。第一,在对课外补习参与机会的研究中,倾向值能够区分不同学生在家庭、学校等背景因素和父母教育参与方式上的差异,从而有助于对课外补习受益群体的特征进行理想型描写,进而为课外补习政策的制定提供针对性建议。第二,通过对复杂影响因素的降维处理,课外补习效应及其倾向值构成一个简化的二维体系,因此,其交互作用可以突破简单的线性假设,使用非参数和半参数平滑分析方法检验可能存在的非线性关系(Zhou and Xie,2020)。从教育机会、教育过程和教育结果公平的角度看,关于倾向值的效应异质性分析大致可以归为三种研究假设(Brand and Xie,2010;李佳丽,2016;郭冉、周皓,2020)。这三种假设提供了理解课外补习效应和教育公平关系的不同视角。
第一部分为描述性分析。将个体、家庭、学校等背景变量按照课外补习的参与情况进行描述统计分析,着重探究参加和未参加课外补习的群体在背景因素上的差异是否统计上显著。第二部分为课外补习倾向值模型分析。该分析探究个体、家庭、学校等层面的因素对课外补习倾向性的影响。基于Logistic回归模型(见公式1),令di=1表示“学生参加课外补习”,di=0表示“学生未参加课外补习”。对于每个样本中观测到的学生来讲,其课外补习倾向值便是该Logistic回归模型下的预测概率(Rosenbaum and Rubin,1983)。基于以往研究,本文的课外补习倾向值模型加入个体、家庭、学校等层面的众多可观测变量,并充分考虑变量间的非线性关系,以提升对倾向值预测的可靠性。
第三部分为课外补习同质性效应检验。根据反事实因果推断,本文利用倾向值匹配探究课外补习对学习成绩的同质性效应。同质性效应分析基于的假设是课外补习效应对于不同个体的影响是稳定的。利用“近邻匹配法”(NearestNeighbor Matching)、“半径匹配法”(Radius Matching)和“核匹配法”(Kernel Matching),本研究分别计算了干预组平均效应(ATT,即课外补习干预对于参加课外补习样本的平均效应)和控制组平均效应(ATU,即课外补习干预对于没有参加课外补习样本的平均效应)。ATT和ATU之间的差异表明了课外补习效应异质性的存在。需要注意的是,倾向值匹配分析不能从根本上解决内生性选择偏误的问题,其整个分析是基于“可忽略性假设”,即除了观测到的协变量外,学生是否参与课外补习不受其他未观测到的干扰变量影响。第四部分为基于倾向值的课外补习效应异质性探究。目前,谢宇等提出了三种以倾向值为基础的效应异质性分析方法(Xie,et al.,2012;Zhou and Xie,2020)。第一种方法为“细分—多层次法”,即将计算出的倾向值分成不同的取值区间,然后在每个区间内估计课外补习效应,最后将计算出的每个区间处理效应作为因变量使用加权最小二阶乘法计算处理效应变化趋势的斜率。这一方法是基于参数估计的线性假设,即处理效应和倾向值之间是线性相关的关系。第二种方法是“匹配—平滑法”,即通过倾向值匹配,计算每个观测样本的处理效应,然后对匹配得到的处理效应和倾向值进行曲线拟合,观测处理效应是如何根据倾向值的变化而变化的。第三种方法是“平滑—差值法”。这种方法分别对实验组和控制组的每个观测样本的因变量值随着倾向值的变化而变化进行曲线拟合,然后再计算两条曲线之间的差值,从而得到处理效应的异质性估计。后两种半参数估计方法是基于处理效应和倾向值之间的非线性关系假设,从而使研究者可以探究它们之间的非线性关系。综合上述三种方法,对于以倾向值为导向的效应异质性分析归根结底是探究倾向值和课外补习干预之间的交互作用。从理论上讲,这与传统回归模型中的交互作用并无差别,但研究者需要注意以下三个重要问题。第一,倾向值模型是否可以准确预测干预变量的个体选择倾向值(Xie,et al.,2012)。也就是说,倾向值模型设定是否受到缺失变量的影响。一方面,倾向值模型会受到未观测混淆变量的影响,另一方面,背景因素变量与干预变量之间的非线性关系也会影响模型预测的准确性,因此,倾向值模型的估计是基于“可忽略性假设”。本文分析中加入个体、家庭、学校等控制变量,旨在更接近满足“可忽略性假设”。第二,研究者需要注意倾向值与干预变量之间交互作用的线性假设在理论上是否成立(Haimueller,et al.,2019)。如果线性关系假设成立,传统的线性回归模型就可以分析该交互作用,即在模型中加入干预变量和倾向值的交互项;如果交互作用是非线性关系,可以使用非参数化或半参数化方法对非线性关系进行曲线拟合。第三,干预变量和倾向值的样本分布情况会影响交互作用的实际效用(Haimueller,et al.,2019)。对于观测到的每个倾向值,都应满足附近有足够多的临近观测数据点,即倾向值是连续的。此外,对于观测到的倾向值,对应的干预变量应该有相应的差异性,即满足干预组和控制组同时出现,也就是所谓的共同支持区域。
基于谢宇等和哈缪尔勒等关于效应异质性的研究(Xie,et al.,2012;Haimueller,et al.,2019;Zhou and Xie,2020),本文使用非线性效应异质性估计方法——“交互核密度平滑估计法”——对课外补习的非线性效应异质性进行估计。核密度平滑估计基于以下半参数交互回归模型: