何挺|司法改革试点再认识:与实验研究方法的比较与启示
何挺:北京师范大学刑事法律科学研究院副教授,博士生导师
内容提要 试点对于推动我国司法改革具有独特的功能。近年来司法改革试点进入“活跃期”,呈现出从自发分散试点到整体规划授权试点的变化。试点与社会科学实验都建立在实证经验的基础之上,共享“改变带来效果”的基本逻辑,通过适用于多数对象实现可重复性,并都具有将局部结论外推到更大范围的强烈倾向。但试点并不仅仅是实验研究的一种表现形式,两者之间存在显著差异:试点内容的整体复合性明显有别于实验研究内容的单一性,试点难以达到实验的严格规范要求,试点还具有实验所不具备的功能等。应当借鉴实验研究方法,理性对待试点的验证功能,全面认识试点的其他功能,建立试点的实证数据基础与开展第三方循证评估,并从多方面改进试点的具体操作。
关键词 司法改革 试点 社会科学实验研究 循证评估 试错
一、司法改革试点的发展:从自发分散到整体规划
20世纪80、90年代以来我国司法领域的试点大致可分为三个阶段:第一阶段是20世纪后期至21世纪初的分散试点;第二阶段是21世纪初至2013年十八届三中全会召开前,这一时期的试点开始呈现出一定的整体性,即根据中央的整体部署围绕中央提出的改革任务而开展试点;第三阶段是2013年十八届三中全会召开后大规模的整体规划试点时期。
近年来整体规划性试点呈现出以下特征:第一,内容上不再限于对具体制度的小修小补或为了解决实际问题而完善具体工作机制,而是直指具有宏观性、全局性甚至根本性的体制改革以及带有变革性的诉讼制度,试点所带来的改变更为宏大整体;第二,大多数采取由立法机关的常设机关授权由中央司法机关具体负责开展试点,是一种“顶层设计式”的试点;第三,对于尽快检验改革方案效果的追求更为明显,并有明确的时间和进度的规划;第四,试点建立在中央机关所发布的授权决定、试点方案、实施办法等一系列规范性文件基础之上,不再是之前的“摸着石头过河”;第五,通常选择一定数量并具有一定代表性的省份或城市开展试点,试点的“点”不再是零散、个别的“点”,而形成了具有一定规模化效应的“面”,试点的“由点到面”发展为“由面到全面”;第六,多项大规模试点同步展开,有的地区同时成为多项试点地区,试点所导致的改变可能重叠。
在试点的内外差异方面,这一阶段顶层设计的试点及其规模化效应在客观上还导致:一是试点地区内部在具体开展试点时存在差异,不同试点地区进行的再次创新形成了“试点内的试点”或“大试点内的小试点”;二是试点地区以外的非试点地区会受到试点的影响,从而形成“试点外的试点”。
二、试点与实验的共性:基于社会科学实验研究基本原理的分析
(一)社会科学实验研究的基本原理
实验是一种受控的研究方法,即通过实验的方式控制一个或多个变量的变化来测量对其他一个或多个变量产生的效应,进而揭示变量之间的因果关系。实验也是社会科学研究中建立因果关系的最好甚至唯一方法。为满足严格的因果推断逻辑,社会科学实验研究一般还具有以下特征:第一,精心的事先设计和实验过程中的严格控制;第二,实验的可重复性是实验结果具有高度确定性的前提条件;第三,实验研究的总结归纳围绕因果关系是否被验证展开。通过实验过程中的测量与数据收集,实验结束后需要经由统计分析来检验实验开始前理论假设中的因果关系是否得到验证。
(二)社会科学实验研究的不同分类与设计
实验根据空间的不同可分为实地实验和实验室实验。实地实验是在自然状况下的实验研究,实验室实验是在人工环境下或在实验室中进行的实验。后者能够更好地满足上述精心设计和严格控制的要求,通常有着较高的内部效度。但实验室实验与真实情境存在差别,其结论在概化和可推广性上较差。实地实验的内部效度相对较低,但外部效度相对较高,较易于结论的概化。
实验研究还可以按照因果关系推论的逻辑严格程度的高低区分不同的实验设计。真实验设计是所有实验设计中最为严格、推论因果关系最为可靠的设计,其核心特征是要求通过随机分配产生实验组与对照组。在真实验设计中,经典实验设计是实验要素最为齐全的实验设计,包括三方面要素:(1)自变量与因变量;(2)实验组与对照组;(3)前测与后测,前测与后测之间的差距就是因变量受自变量的刺激而产生的变化。
研究者逐渐在经典实验的基础上,降低随机分配的要求或者省去一部分要素,形成了准实验设计和前实验设计。准实验的对照组不是通过随机分配产生的,而是通过配对等非随机方法产生的,或者没有对照组而采用多时间段设计,随着时间的变化观察自变量对因变量的效应而得出相应的结论。准实验设计通常包括时间序列设计、非同等对照组设计和多元时间序列设计等。
(三)司法改革试点与实验研究的共性
司法改革试点遵循相同的基本逻辑与步骤:首先是发现问题,之后是寻找解决问题的方案,然后是将试点方案付诸实施,重点关注这一创新措施是否解决或在一定程度上缓解了存在的问题,最后则是总结试点中的经验并予以推广。
试点与实验有基本相同的逻辑框架:试点(实验)主体有意识地改变某种情形,并观察改变对结果产生的影响,在实施改变之前,试点(实验)主体都假设这种改变很有可能产出所希望的结果,在实施改变之后,则希望将结果的变化归因于措施上的改变。实验与试点具有如下共同点:第一,试点与实验都围绕创新与改变这一核心进行建构。这要求试点也需要明确改变的具体内容,使创新措施与日常情况明确区别开来;第二,试点与实验都通过适用于多数对象实现可重复性;第三,试点和实验都在限定的局部范围内开展,并都具有将局部结论外推或概化到更大范围的强烈倾向;第四,试点与实验都建立在实证经验的基础之上。试点需要借鉴实验研究在设计、收集和分析数据方面的方法,以将试点的总结更好地建立在蕴含着经验的实证数据基础之上,并使下一步的司法改革真正成为实证数据驱动式的改革。
三、司法改革试点与实验研究的差异
(一)实验内容的单一性与试点内容的整体复合性
实验研究通常能够建立的是个别自变量与因变量之间的因果关系,而试点所尝试的是一种包含一系列要素的改良或创新的制度或机制,是一种整体性与复合式的改变,而这种整体复合性改变在近年来的大规模整体规划试点中表现得愈加明显。
(二)试点难以达到实验的严格规范要求
司法改革试点的严格规范程度受制于一系列因素:一是试点在真实的司法环境中开展,各种主客观因素都会对试点的过程和结果产生影响;二是试点的开展会受到道德与法律的限制;三是试点由于与法律或政策的下一步改革密切相关而具有很强的时效性并进而影响规范性。
(三)试点具有实验所不具备的功能
试点对法律改革方案可以产出预期相应效果的验证,是一种探索性的验证或者在探索过程中的验证,试点具有实验所不具备的一系列探索性功能:第一,“试错”并相应调整方案的功能。对试点不能简单进行“成功”或“失败”的二分法评价,而应站在更为客观也更为包容的立场,因为试点的猜想与探索未达预期而被证否本身就是试错过程不可或缺的组成要素;第二,探索“副产品”的功能。试点作为局部性的改变被“嵌入”到各种制度高度关联的真实司法情境中时,试点有可能探索出意想不到的效果;第三,探索与调整司法改革目标的功能,能够调低不适当的目标以进行目标再设定与目标合理化;第四,探索试点参与者及利益相关方的主观认识的功能,而这些主观认识实际上是试点方案被推广后更大范围的相关人员主观认识的“缩影”或者“样本”。
四、司法改革试点的有效开展:源自实验研究方法的启示
(一)理性对待试点的验证功能与全面认识试点的其他功能
第一,需要明确试点对改革方案的检验并非实验研究对因果关系的验证,打破试点可以验证改革方案与产出效果之间因果关系的“奢望”。试点检验的只是一种在一定环境下实施改革方案很有可能产出预期效果的可能性或趋势。
第二,试点有可能无法验证预期效果。试点的猜想与探索未达预期而被证否本身已经实现了试点的“试错”功能。与实验研究的比较所带来的一方面重要启示正在于应理性界定试点的成败,并正视试点未能验证预期效果这种可能的“失败”。
第三,试点所得出的结论不必然可以外推。试点方案在试点地区产出效果这一结论的外推应建基于试点以外的其他依据之上,而将试点方案适用于更大范围后未获得如同试点般的效果或遭遇新的问题也实属正常并可以接受。
综上,应当理性看待试点的验证功能,不应过度追求试点对于预期效果的验证甚至视之为试点的唯一目标,应当对试点验证改革方案预期效果的结论抱有适度的谨慎,并做好继续探索与修改完善改革方案的充分准备。还应当全面认识试点的一系列探索性功能,包括:调整改革方案的“试错”功能、产生其他未曾预期“副产品”的功能、调整司法改革的远期与近期目标和理顺司法改革发展路径和步骤的功能等等。如果能够超越尽快验证试点方案效果这一简单逻辑,而采用一种更为系统、动态、发展和开放的功能观来看待试点,将使试点最大程度地发挥其在推动司法改革方面的独特功能。
(二)建立试点的实证数据基础与开展第三方循证评估
试点各方面功能的发挥根植于在真实司法情境中开展这一点,依赖于试点过程中生发的真实经验。亟需借鉴实验研究设计、收集与分析数据的观念与做法,回归试点的实证经验这一根源。第一,树立试点过程中实证数据无处不在的观念,使数据成为呈现试点状况与检验试点效果的最主要依据。第二,参考实验研究方法,强化试点前数据收集方案的设计和试点过程中的数据收集。第三,依据数据进行论证并得出结论,使试点的效果呈现、经验总结与方案的进一步调整围绕着蕴含真实经验的数据而展开。此外,对试点的总结与推广应建立在由中立第三方所进行的依赖实证证据的循证评估基础之上。
(三)借鉴实验方法改进试点的具体操作
第一,试点方案借鉴准实验设计,今后的试点应该尽可能地设计有相应的对照组或比较的对象。只有建立在科学的比较对照基础之上,试点所带来的改变与效果才能更为真切准确地呈现出来。
第二,适当降低试点内容的复合性。一是使不同试点分地点和分阶段开展,避免在时间和地点上的重叠;二是在选择一定数量地点开展试点的情况下,可以考虑在事先设计时将综合性的试点方案进一步拆分细化,在不同的试点地区尝试有所区别的单一性试点方案。
第三,保证试点的自然真实环境,避免“温室花朵”效应。应防范“人为干预”改变试点的“原生态”,避免试点“沦落”为被精心保护和控制而外部效度较低的实验室实验。
第四,改变试点的政绩观与成败观,避免试点过程中的“霍桑效应”,以此来弱化试点主体对于结果的追求,进而减少试点主体的主观倾向对于真实试点效果的影响。
第五,在考虑试点时效性的前提下适当参考实验研究规范性在时间方面的要求。一是在试点开展前留有准备与前测的时间,以为试点效果确定比较的基准线;二是可根据试点内容的具体情况在允许的范围内适度延长试点的时间,尤其是涉及全局性甚至根本性改变的改革试点;三是在试点结束后仍留有一定的时间对试点的效果进行回访或“后后测”,以观察试点带来的改变所导致的长期效应。
本刊已发相关主题的文章还有:
1.徐向华课题组:《审判委员会制度改革路径实证研究》(2018年第2期);
2.周翠:《我们民事司法多元化改革的现状与未来》(2018年第1期);
3.陈光中 魏晓娜:《论我国司法体制的现代化改革》(2015年第1期);
等等。
文摘来源:《中国法学》2018年第4期
图片来源: 百度百科
长按识别图中二维码,快速关注我们!