查看原文
其他

宋映泉:教育公益要关注终极指标|益盒对话笔记001

He666 益盒 Charity Box 2022-10-09

全文约8000字

预计阅读时间 10 分钟


文章纲要:
  • 前言(900字)

    - 新栏目介绍

    - 第一期对话简介

  • 对话笔记正文(6324字)




前 言 

欢迎大家来到益盒的新栏目——对话笔记  



·这是我们的一次新尝试

很多时候,公益就像一个外表光鲜的“黑匣子”。虽然很多公益组织有漂亮的网站、厉害的资方背景、看起来情怀满满的创始人,但是内部情况究竟如何?项目效果如何?社会问题有多严重?旁人往往有些“雾里看花”、看不透,于是只是匆忙点赞,无法对公益产生可靠的判断。


作为一个热爱研究的小团队,公益盒子自然不满足于公益表面的光鲜。我们渴望挖掘公益的内情,从而发现中国最好的公益项目。因此,我们的研究员们查阅大量文献,主动了解各个领域、有效的干预措施和相关公益组织。在知识积累的过程中,我们在经常与行业领袖和专家学者们对话,试图快速、准确地理解中国公益。



逐渐地,我们积累了许多干货满满的专家分享,这些专家意见塑造了我们的判断。对广大捐赠者而言,与专家逐一对话是很困难的,时间、社会网络、金钱成本都很高。为了给大家节省精力,我们何不与公众分享我们的对话,让大家都看到这些有趣、有料的信息呢?在征求受访者的同意后,我们得以将对话内容几乎原汁原味地保留下来,呈现给大家,为期待做公益的朋友们提供专业信息,辅助大家做出知情的决定,让公益更有成效。


我们相信,知识是公益进步的阶梯。对话笔记将为中国公益打开一扇窗,提升行业的效率和透明度,让公益不再是个“黑匣子”。我们得益于专家们的开放、诚恳、博学,也期待通过我们的一点努力,为你打开公益之门,帮助大家更清晰地看到公益、公益项目、社会问题内在的状态,从而共同探索更好地做公益的路径。


·关于第一期

在本系列的第一个访谈中,我们很荣幸地请到了宋映泉老师开启一场思维盛宴。宋映泉教授是北京大学中国教育财政科学研究所副研究员,博士毕业于美国加利福尼亚大学伯克利分校教育经济学专业。他的研究领域包括:教育经济学、教育财政、中国职业教育与培训的资金来源问题、中国城市外来务工子弟教育的资金来源问题、儿童早期教育和护理问题。



宋老师是教育效果评估领域的专家。在本次采访中,他着重分享了关于如何衡量教育有效性的经验。对他而言,教育项目的效果要从认知和非认知两个层面去思考。虽然相比之下,认知层面(比如考试分数)较容易衡量,但非认知层面(比如孩子的品格、价值观的成长)才是影响深远的维度。因此,切勿为了追求可知的成果而忽略了关键的不好衡量的维度。对宋老师而言,在教育领域讨论“有效性”是必要的,评估仍然是实施政策和公益项目时的关键一环,但要对指标设计尤其谨慎,才会让评估发挥它应有的价值。


话不多说,快来听听宋老师干货满满的分享吧!



TIME

时间

2021年4月22日15:00 - 17:00

PLACE

地点

北京大学教育学院

METHOD

方式

实地采访

INTERVIEWEE

受访者

宋映泉,副研究员

北京大学中国教育财政科学研究所

INTERVEWER

采访者

李治霖,公益盒子研究总监 

 何流, 公益盒子CEO   

TOPIC

主题

教育、公益、有效性、实验方法




在思考教育有效性时,什么指标比较重要?应该如何看待这些指标?


教育的指标主要可以分为认知和非认知层面。在认知层面,成绩是一个很重要的指标,比如学业成绩,包括阅读、数学和科学等。在做经济学研究时,通常会用数学或科学成绩作为产出变量。在非认知层面,国内外对指标的关注越来越多,针对学前教育一直到小学、初中和高中等阶段。不过非认知方面的测量比较麻烦,不同的研究者会用不同的量表,导致成果很难进行相互比较。


我过去做基础教育阶段的研究会主要关注四个层面:


1. 身体健康,这是最基础、最重要的,包括睡眠、身高体重及体质健康指数;


2. 心灵发展,比如自尊、自我效能、抗逆力(resilience)和大五人格(编者注:即开放性、责任心、外倾性、宜人性、神经质性)等;


3. 学业成绩,测度学业表现(比如数学、阅读等)、学业积极性和学业障碍等等;


4. 人际关系,从正向测量的有朋友数、友谊质量等,负向测量的有校园霸凌等;


此外还有一些研究设计中缺乏但很关键和重要的要素,比如对自我使命、价值观、对自然的敬畏及人生意义思考的测量,这些要素是终极价值,是衡量个人发展的关键因素。



您的研究如何权衡不同指标的重要性?


最重要的是一个人的价值观、人生的意义和自我与自然的关系,这些决定了一个人最终将成为什么样的人,他怎么去做人生的选择。但当下的教育达不到这种深度,造成了很多悲剧。目前这方面的测量和研究是有缺憾的。我认为在一个好的教育里,就应该是学生跟自己的关系要好,他跟别人的交往才不会出问题。另一方面,一个人和自然、永恒的关系也非常重要。




在您心中,一个好的教育公益项目应该是什么样的?要变得更有效,至少需要去关注哪些事情?


从评估方法来看,干预项目可以分为"中药型"和"西药型"。“中药型”项目关心整体、综合,“西药型”项目关心局部、聚焦。我倾向于西药式的干预,在识别某一个问题之后进行点对点的解决,虽然存在局限性,但可以解决一些关键问题。目标越是简单、逻辑链条越是单一的项目越容易证明其有效性。中药式干预也有其价值,像质性研究,从人类学的角度出发深入扎根,得到一些启发。孩子的成长是系统性的生态,西药式干预有时导致结果太过聚焦,需要大量的研究和各类型公益组织的投入,缺乏宏观和系统性的视角。中药式干预的问题在于项目推广非常困难,且评估过程很难去测量与评价因果性与有效性。



您关于“中药式”和“西药式”的干预项目分类做得特别好,不过我们也感到在局部实施“西药式”干预有时存在困难。拿“养育未来”这个公益项目举例,他们在0~3岁儿童早期发展上做的很好,但如果同样一批困境儿童在3岁之后的营养与成长支持没有跟上,单一阶段的干预做的再好,10年后再去测量或许也不有效了。您觉得捐赠人在为一个公益项目捐款时,是否需要考虑它系统生态链的问题?


David Card在劳动经济学手册上用人的生命发展周期来解释教育领域的干预,比如义务教育阶段前分0~3岁、3~6岁,义务教育阶段中有小学、高中等,人在不同阶段的问题不同。


在0~3岁,孩子的成长跟母亲的关系很大,而且正在形成语言和社会情感,所以早期的非认知教育是非常重要的。在中国,目前大家还没有对高质量的亲子陪伴形成广泛关注。


在3~6岁,孩子的成长跟幼儿园的关系很大,中国存在大量的留守儿童、回流儿童,幼儿园的质量亟待提升。



在义务教育阶段,校园霸凌、青春期的校园恋爱、性教育等也需要干预。


在中职和大学阶段,像学业和实习的选择、学业质量和课程安排的问题、阅读思考、人际交往和价值观的形成也是容易被忽略的部分。这个过程当中需要培养孩子的责任感,也属于非认知方面。


中国的国情和文化和其他国家相比有很不一样的地方。一些机构会得出“国内的儿童0-3岁认知能力、非认知和身体发展都有待提高”的结论,不过像中科院心理所等机构,他们未必认同。这里主要是存在测量工具的文化适切性问题。资方知其总体状况就足够了,没必要也不可能去解决人每一个生命阶段的问题,并且人的不同年龄阶段是相关的、连续的,所以早期干预会产生沉淀效应。



感谢您梳理出不同教育阶段中值得关注的干预方向。公益盒子希望关注那些大规模(能影响到很多人)、被忽略(在该领域投的资金或者说资源支持、意识倡导相对较少)、可解决(存在有效的干预方法)的议题,因此也关注到儿童早教、义务教育及职业教育等方向。据您了解,这些领域里是否存在干预效果良好的措施?


首先需要判断干预对象。


教育体系的参与者包括学生、家长、老师、学校等,有的时候的干预对象甚至是学生的学习时间等等。比如有一个机构做生命和死亡教育,专注孩子课后活动的阅读。评估结果显示,这个项目对阅读成绩无显著影响,但对激发孩子的阅读兴趣有持续影响,15分钟一天的课程内容看起来弱,但持续性的影响力很强。


再比如,真爱梦想基金会做K12期间素质教育类型的干预,虽然课程体系完好但评估结果显示干预效果基本为零(此处有修改,详见评论区)。他们的故事框架很宏大,筹款能力很强,硬件设施,也足够支撑项目的运营,包括教材、课程内容、教师等非常优质且完善,但实施可能会出问题。机构在考虑落地时,可执行力对效果影响同样关键。



REAP(编者注:斯坦福大学“农村教育行动计划”,Rural Education Action Project)团队做住宿生的宿管老师培训,效果不错,潜在的影响力也很高,不过干预的可推广性未知。因为宿管老师的质量很关键,可以选择由校内老师转化,有时也需要有国际视野的人才。看教育领域干预措施去找组织,看到的比较多的是陕西师大做的,比如生活老师培训、乡村教师技能培训、计算机辅助学习等。



我们关注到计算机辅助学习、双师课堂等在近两年比较热门,也阅读了国内针对信息化技术辅助教育的随机干预实验研究。听说您目前正在对U来公益开展评估,不知道您对这类干预有效性的整体判断是?


理论上讲,技术化辅助的落地和可操作性与乡村教育的关系是非常密切的,信息技术实施得当,会有所改善。现实来讲,虽然有时技术本身看上去有保证,但对于学生学业的影响是不确定的。像之前成都七中的“一块黑板改变命运”的报道(编者注:2002年起,成都七中把课堂教学常态化地向教育资源缺乏地区和少数民族地区的远端学校进行同步直播),如果用我们评估的观点去看,这个结果是一个优选出来的结果。如果用评估的方法随机去做,在认知层面的效果上可能会有很大差异。而且在中国课堂人数比较多的情况下,这些干预对于学生来说更重要的非认知方面的影响可能是弱的。



我为什么看好U来项目?首先,U来项目是自下而上的模式,在网络支教方面,他们没有雇佣知名的老师来做公益,而是通过县城的优秀老师来带动项目村小的老师,从这个维度上来看,他们更了解当地学生需求和文化。相比之下,我不看好人大附中-内蒙古的农村学校的项目。他们尝试通过网络教学,用人大附中的师资实现城乡教育不均衡弯道超车,但这个构想过于从上到下,效果不见得很好。


不过从政策角度来说,公益组织需要与政府保持的密切合作,引导政府加入并且推广项目。当政府能从财政上支持公益组织探索出来的创新模式,公益的力量才会实现可观的效果。



您觉得公益项目是否能促成实现政策影响?有过往的案例吗?


政府部门往往偏向保守,基于实证证据的研究结果只是很多决策的参考因素之一。有一些公益组织确实影响到了国家政策,比如营养午餐项目,其实不是某些人宣称的某个知名媒体公益人努力的结果,而是中国发展研究基金会这样的类政府机构提出解决方案和建议。他们切实关注到了政府的利益诉求,符合当时政府的意图,因此得以迅速落地和推广。



您认为学术机构推动政策倡导有优势吗?以您所供职的北大教育财政科学研究所而言,各位老师们的研究能否有效地为决策提供建议?


北大财政所的优势在于与财政部和教育部的有关司局有直接联系,弱势在于不能直接干预政策,只能作为智库提出建议。很多政策出台前后,北大财政所的老师们往往可以参与其中。比如2005年前后出台的农村义务教育财政保障新机制,财政所的王蓉老师直接参与了政策设计。后来的高等学校学生资助政策(比如生源地助学贷款政策),财政所的魏建国老师有直接参与。



目前一个关键的政策是学费调整。从投资回报来看,研究生带来的回报往往属于私人回报,再加上教育财政吃紧,不能全部由政府负担,因此我们建议应该在硕士阶段一定程度地加收学费。又比如,现在公立幼儿园的收费非常低,家长负担太少,我们建议要适当提高公立幼儿园的收费标准。当然,普遍提高学费的前提是保证经济贫困家庭子女入园的可负担性。



养育未来关注以低成本实施0~3岁的教育干预。从国家角度,应该由谁来承担0-3岁的教育成本?


养育未来的大方向是正确的,教育的干预措施一般越早越有效果。至于责任,我认为早教阶段应该以家庭责任为主,并且注重养育的质量,不应该由政府责任。由家庭负责孩子的早教阶段更放心。但是对于低收入家庭来说,他们在早期教育方面是需要政府提供有效帮助的。目前我国0-3岁儿童的许多工作是由计生干部承担,他们能否做好这项工作还需要考察。



我们关注到您非常积极地进行公益项目的评估,也一直在采用严谨的实验与准实验评估方法赋能公益项目。从一个教育经济学学者的视角出发,您认为在中国目前的公益评估生态中,有哪些仍然欠缺的要素?


第一,从需求端来看,我国许多的公益组织并没有这方面的意识,缺少对于评估目的的了解,因此不愿意出资参与评估。第二,从供给来看,中国的评估机构是供不应求的。第三,平台需要引导项目,甚至是培育项目逐步完善。第四,捐赠人需要一定的教育,让他们认识到项目评估的重要性



作为评估方,相信您一定希望出具客观全面的评估报告,即分析优势又指出不足。在您过往的经历中,公益组织一般会如何看待说他们“不好”的部分?评估的结果是否能被用于促进项目的改进?


许多公益机构具有迭代反思意识。比如互满爱,这是一家总部在德国、聚焦在中国山村幼儿园的慈善机构。在评估后,我们发现项目对儿童的发展有一定积极影响。不过当地有关部门对幼儿园聘任有着很高的学历要求,让项目的师资很不稳定,教师流动率很高。


另一个例子是中国扶贫基金会的加油计划,它聚焦在汶川地震后,通过游戏手段帮助灾区儿童的心理康复。我们曾经在贵州做过两年的跟踪评估,项目的效果不错,但项目包含的内容太多,所以有一部分并没有明显的改善。项目在硬件的投入非常多,平均每个学生每年1200元,去布置阳光操场、未来空间、爱心厨房等。软件方面也有一些投入,主要是培养学校的音体美教师。虽然中国扶贫基金会是国字头的NGO,看起来不缺钱,但他们的实际力量还是薄弱的,而面对的农村教育的挑战极为巨大、复杂、困难,因此需要整合在垂直领域的优秀组织共同在县域开展干预。




如果目前有充足的资金,凭借您对教育的观察,您会怎么建议捐赠呢?


第一,识别需求很重要。有钱人偏好教育,因为大部分有钱人都是通过教育改变命运的。在教育公平方面,乡村教育有很多空间。即使资金量比较小,也可以配置不同的方面,或者叠加资金池以达到更好的效果。


第二,目前我们国家的教育忽略人的全面发展,导致音、体、美、生命教育、性教育等课程缺失,尤其在乡村教育领域。但近年来也有一些做的比较好的例子,比如某人大毕业生做的是光诗歌, 带领农村学校孩子进行诗歌创作,他们的口号也很响亮, "写诗的孩子不会砸玻璃"。在阅读方面,心平基金会也非常有想法,是一家很值得期待的公益组织。石门坎基金会的梁俊结合诗词和韵律等提升孩子传统文化积淀,上过央视的春节节目,那首袁牧的《苔》可以说感动了成千上万的中国民众。



随机干预实验(Randomized Controlled Trial, RCT)是评估的金标准,确实很有价值,但也需要考虑到它的局限性。我记得在一次教育公益年会上,心平基金会的负责人提出, 许多创新在没有规模化时很少能通过RCT评估出它的价值。



这个问题我们也想进一步请教您。公益盒子非常重视RCT证据,认为它是影响力评估、测量因果性的金标准。但同时我们也了解到其局限性,尤其是对很多专注于公益项目执行的小组织来说,做一个RCT评估所耗费的资金、时间与人力成本都太高了,很不现实。在这种缺乏有效性证据的情况下,我们应该如何思考、判断新兴的小规模组织的影响力呢?


我想起两个例子。


在沪沽湖旁边有一所四川达祖小学,结合了当地有独特的东巴文化,每年运营经费50万左右,学生60-70人,教师全部是民办身份。如果纯粹用学业成绩看,他们做的非常好,并且老师会带孩子骑马射箭划船。但他们模式是基于当地文化的,因此很难推广和复制,不过效果确实不错。


此外,一个硕士生从美国圣路易斯华盛顿大学社会工作专业毕业后,一头扎在陕西做了一个NGO,是陕西妇联下面的一家关注校园霸凌的机构。他们机构太小,比较草根。不过干预的措施很有意思,通过戏剧等很多非认知方法试图改变校园中各种复杂的人际关系:教师和学生、同学之间,父母和孩子之间。其中的一些措施是可以被推广的,但是他们始终没有发展成一个拥有特别大的影响力的模式,一方面跟团队负责人的个性有关,不很想做大规模。另一个可能是总结的方式还不够,没有推广模式下的证据支持。



作为一个经济学学者,您如何看到RCT在公益发展中的重要性?


考虑到时间和资金成本,RCT适用于需要推广与复制的项目。当一个项目足够标准化、成熟的时候,病采取相对简单的模式,比较适合用RCT评估。从生命周期来看,NGO应该长到什么程度做什么样的事情,不是所有的机构的所有的干预措施都必须做RCT。RCT要通过大量实验来获取结论、解释机制,昂贵、耗时间,肯定存在局限性,但我也毫不质疑它的重要性




国内目前在给公益组织做评估的团队除了陕西师大、上海纽大还有别的吗?


高校学术团队基本就是这些,社会团队不是很了解,有些机构在做类似合规审计的工作,他们不能被称为真正的评估。



从生产创新来讲,我们经常看到公益创业经常是大学毕业生或者企业家在缺乏信息的情况下“拍脑门”成立项目,而社会科学的知识往往在专家手中。您是否认同让了解干预措施有效性的专家们去设计公益项目,同时有社会资源支持专家去做实验?谁生产创新是最可靠的?


应该有一种机制让背景不同的人一起碰撞。我比较幸运,有机会接触到公益组织的人,可以了解干预措施。其实不止是学术专家了解干预措施。像马云、俞敏洪这样的企业家,他们有自己的判断,手下都有基金会,其中有些年轻人都非常好学,去参加会议、了解相关知识,然后回去跟老板说能做什么,提出方案。马云过去觉得应该用高质量的寄宿制学校取代农村学校和小规模学校。虽然招来一片骂声,但他也有自己的判断,因为他认为,校长和教师是最重要的,所以要做这方面的干预。


俞敏洪非常有企业家精神,对乡村教育很关注。他说接下来要花许多时间在乡村教育上,因为提升乡村教育质量的意义胜过造原子弹,他是真有这种热忱。他曾经请我们去一个训练中心,大家出谋划策,一起来讨论如何发展有根的乡村教育。他说,乡村教育的振兴跟乡村的振兴有关。他也有他的想法,觉得将来教育的重点是在乡镇一级发展学校,然后通过校车接送等。


但是另一方面,信息的对称始终是很难解决的,纯粹通过整合知识、用计划来解决社会问题的话,可能会被限制。它的前提是你对决策和知识有全面整体的了解,但是往往只有当地人才能做那种决定。公益盒子要做知识平台,需要充分认识到地方知识无处不在。越往下做,越要避免从上而下的上帝视角,充分尊重地方的知识




公益资源的分配似乎很难依靠隐形的手来做优化。您觉得公益行业的资源应当以什么机制分配?


如果你的服务对象是捐赠人,最重要的是你拥有足够的能力整理知识。公益行业跟纯粹的市场差别不大。从经济学角度看,NGO跟企业相似的地方在于都要追求最大化,只不过企业追求利润,而NGO追求民生。


如何以更好的方式来整合知识对于公益组织很重要。瑞银UBS的公益基金会专注卫生健康和教育,其中卫生健康方面聚焦在一个非常狭窄的领域,通过干预刚出生很短时间内婴儿的健康降低婴儿死亡率。对于这种资助型基金会,他们非常愿意学习和钻研。不过资金与研究有时是矛盾。瑞银的捐赠金额绝大多数来源于瑞银的客户,但客户会独立地要求投哪个项目,并不那么关注项目的有效性和循证评估。哪怕在资金满足的情况下,做研究是否就会让公益项目更加有效,也是值得商榷的。






宋映泉,北京大学中国教育财政科学研究所副研究员。他的专业为教育经济学和教育财政学。其主要研究兴趣是弱势群体学生教育及财政问题, 包括学前教育财政、流动人口子女教育及财政问题等。他多次承担财政部、教育部、世界银行、联合国儿童基金会委托研究课题。他的论文在《社会科学研究》《中国经济评论》《教育经济评论》《发展经济学》《北京大学教育评论》等国内外刊物上发表。他从加州大学伯克利分校获得博士学位,专业为教育经济学。




转录:农雨笛

编辑:何流、农雨笛、李治霖

制图:苏熙洋、陈思晓

排版:陈思晓

(部分图源网络,侵删)



Recommend

往期推荐

|卫生公益项目你好,益盒正在关注你

|益盒为什么关注卫生健康?

|捐赠人,请放过管理费


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存