【理论建设】人工智能在司法审判中的定位和局限 ——基于威斯康辛州诉卢姆斯案的分析

智慧法院进行时 2019-12-15

以下文章来源于最高人民法院司法案例研究院，作者王新锐

内容提要

COMPAS是一种基于大数据识别罪犯风险程度的风险评估工具。威斯康辛州诉卢姆斯案中，被告认为，法院在量刑环节参考COMPAS风险评估结果侵犯了其未经正当程序不被剥夺自由的宪法权利，因为COMPAS算法保密导致其无法质疑风险评估的科学性和公允性。威斯康辛州最高法院认定，一审法院在量刑时非决定性的使用COMPAS评估工具并未侵犯被告的正当程序权利，也不属于自由裁量权的滥用，并提出了量刑环节使用COMPAS技术工具应当遵循的要求和限制。该案中确定的“非决定性原则”对于把握如何在审判活动中发挥人工智能的作用具有重要参考价值。

一、卢姆斯案的基本案情

2016年4月，威斯康辛州对卢姆斯提起公诉，指控其犯有一级肆意危及安全、驾车逃避警察执法等五项罪名，卢姆斯对其中两项较轻的罪名表示认罪并请求法院判处缓刑。量刑调查环节中，法院使用COMPAS工具对卢姆斯进行了风险评估，并基于评估结果和其他量刑因素，判处卢姆斯入狱八年。卢姆斯对量刑结果提出异议，被法院驳回。案件上诉后，二审法院将争议提请威斯康辛州最高法院处理。威斯康辛州最高法院于2016年7月13日作出终审判决，维持了一审法院的量刑意见。

二、法院使用技术工具辅助量刑引发争议

COMPAS是Northpointe公司设计的一款风险需求评估工具，该工具最初被设计用于在收监、管理囚犯和规划惩治手段的过程中为监狱管理部门提供决策支持。COMPAS通常会根据被告犯罪档案和问卷调查中记载的信息对其再次犯罪的可能性进行风险评估，同时还可根据需要进行就业、住房和药物滥用等领域的专项风险评估。通常而言，COMPAS会从审前风险、再犯风险和暴力风险三方面进行打分，区间均为一到十，数字越大风险程度越高。

本案中，卢姆斯三项内容的风险值均为高，被识别为对社会具有较高危险性。一审法院综合考虑其所犯罪行的严重性、个人经历和监视记录以及COMPAS风险评估工具等各种量刑因素，未支持卢姆斯的缓刑请求，判决其需要因驾车逃避警察执法和未经车主同意驾驶汽车入狱八年，出狱后还要接受5年的监视。

卢姆斯对量刑结果提出异议并请求进行量刑听证，其认为：一审法院使用COMPAS进行风险评估违反其依据宪法享有的 “正当程序（Due Process）”权利。COMPAS的专有保密属性使其无法对风险评估的科学有效性提出质疑，调查报告中使用COMPAS进行风险评估剥夺了自己获取量刑报告全面信息的机会，因此无法确保自己基于准确信息而获得量刑的权利。

一审法院认为，其在量刑判决中引用COMPAS评分是为了证明判决内容，无论是否使用该工具都不会改变判决结果，继而驳回了卢姆斯的异议申请。卢姆斯不服提出上诉，二审法院将案件提请威斯康辛州最高法院处理。

三、终审判决认定法院可在量刑环节有条件的使用技术工具

威斯康辛州最高法院认为，COMPAS给出的风险评估可以在一般意义上判断具有类似前科的人被释放后再次实施犯罪的可能性，其评分基础是将该个人的信息与具有类似特征的群体信息进行比较，而非直接预测特定个人的再犯风险。评估的目的是识别出那些能够通过评估获益的罪犯，以及提示监管中需要注意的风险点。因此，该风险评估工具有助于法院衡量所有量刑因素。如果使用得当，并遵守其明确要求的限制和注意事项，法院在判决中考虑COMPAS工具的风险评分并未侵犯被告享有的正当程序宪法权利。

威斯康辛州最高法院进而指出，尽管被告无法查看和质疑COMPAS算法如何计算风险评分，但他至少可以审查并质疑量刑调查报告所附COMPAS评估结果的风险分值。因为，Northpointe公司在公开发布的《COMPAS实务操作指南》中解释过风险分值主要基于犯罪历史等静态信息和犯罪同伙、药物滥用等少数动态变量计算所得。作为量刑调查报告之一部分的COMPAS报告载明了21个静态信息方面的问题和被告的回答，例如：此人在假释期间有多少次被羁押？（5次以上）；此人在缓刑期间有多少次新的指控/逮捕？（4次）等。被告的风险评估结果是依据他在回答上述问题时提供的信息以及其犯罪档案的公开数据计算所得，被告完全有机会核实COMPAS报告中列出的问题和答案是否准确。一审法院和被告能够看到的COMPAS风险评估报告内容相同，该案中被告并非没有机会获取法院依据的信息进行反驳、补充或解释。最终，威斯康辛州最高法院驳回了卢姆斯的异议。

四、法院量刑环节使用技术工具应当遵循的条件和限制

2007年，美国首席法官会议签署了《支持促进公共安全和减少再犯的审判实践》的决议，强调“司法部门应通过减少再犯和增强刑事判决可解释性（accountable），在提高司法效率和保护公众有效性方面发挥重要作用”，并提出“支持州政府使用经过充分研究证实能有效减少再犯的量刑和矫正政策及工具”。美国律师协会也呼吁政府使用风险评估工具减少再犯率并增进公共安全，其认为将再犯风险较低的人和具有较高再犯风险的人关押在一起，可能增加前者的再犯可能性。根据上述文件关于减少再犯率的精神，威斯康辛州最高法院在本案中明确法院量刑时可以使用COMPAS工具的风险评分，但对具体的使用方式提出了限制和警示要求：

首先，量刑法庭可以使用非决定性的使用COMPAS工具作为以下事项的参考因素：（1）对可能入狱的低风险罪犯改为判处非入狱方式的刑罚；（2）评估罪犯是否能够安全、有效的在社区适用监视居住措施；（3）根据罪犯风险程度不同设置缓刑、监视的条款或条件以及违反规定的后果。上述应用过程中，COMPAS工具的作用，在于帮助法官针对每个被告的个体情况，更好的评价、衡量和适用其他量刑因素。

其次，量刑环节使用COMPAS工具的使用需要遵守相应的限制。具体而言：（1）风险评估不得用于决定刑罚的严重程度或罪犯是否需要收监；（2）施加刑罚的目的通常包括威慑、改造、惩罚和隔离等，减少再犯率只是量刑时考虑的诸多目标中的一种，因此，COMPAS评分结果不应成为决定对罪犯采取监视居住措施是否安全有效的决定性因素。

最后，任何含有COMPAS风险评估的量刑调查报告，都必须告知量刑法庭关于COMPAS风险评估准确性的以下注意事项：（1）COMPAS的专有保密性质导致无法公开披露风险评分到底如何确定以及评估因素的权重信息；（2）风险评估将被告与全国范围的样本进行比较，但对威斯康辛州人口的交叉验证研究尚未完成；（3）部分研究指出可能存在少数群体犯罪者被COMPAS工具不均衡地认定为具有较高再犯罪风险的情况；（4）随着人口结构的不断变化，风险评估工具必须不断监测和调整以维护准确性。这样，量刑法院才能够更好地判断风险评估的准确性并赋予风险分值适当的权重。

五、人工智能在审判活动中应当发挥辅助作用

卢姆斯案的最终结果实际并没有其提出的问题重要，即审判活动中采用自动化算法对程序正义的影响。

在国外，人工智能产品的算法歧视（algorithmic bias）带来的相关问题已日益引起关注，用看似客观公平的人工智能算法代替人进行自动化决策，虽然肯定会带来效率的提升，但也同时有可能带来难以预料的风险。从技术原理上讲，人工智能主要由数据和算法两部分组成，通过用海量数据不断地训练算法而提高决策的效果（当然也有部分技术可以不依赖于数据）。不论是在数据中已经存在的不公平结果（如少数族裔或弱势群体被歧视对待），还是算法在设计中考虑不周，都有可能导致整体效率提升、个体利益受损的结果发生。目前在国内外法律领域采取的人工智能技术普遍应用深度学习技术（deep learning）,而这一技术本身的特点就是决策过程难以具体解释，有所谓“黑箱”的特点，就像AlphaGO先后战胜了世界冠军李世石和柯洁，但其每一步棋后的具体判断连其设计者也无法预测和解释。如果人工智能本身有可能因为其现阶段的技术特点（依赖历史数据）带有不公平性，而又无法做出确定性的解释，那么在司法领域可能需要做出更谨慎的审视，先作为辅助性的工具，而不是决策的唯一依据。

把人工智能作为决策的参考，严格限制在辅助性地位，而不是唯一的依据，目前在医疗领域也是监管部门的普遍共识。例如，国家卫生计生委于2017年2月份发布的《人工智能辅助诊断技术管理规范及其临床应用质量控制指标（2017版）》和《人工智能辅助治疗技术管理规范及其临床应用质量控制指标（2017版）》中，便确立了对于人工智能辅助诊疗技术的应用规范原则，即，人工智能辅助诊断、治疗技术作为支持系统，在医学实践中仅处于辅助性地位，最终决策和重要实施步骤仍然需要由具备一定资质和经验的医师来完成。

2017年7月，国务院发布了《新一代人工智能发展规划》，在鼓励发展人工智能的同时，也明确提出“加强人工智能相关法律、伦理和社会问题研究，建立保障人工智能健康发展的法律法规和伦理道德框架”，尤其是“制定人工智能产品研发设计人员的道德规范和行为守则，加强对人工智能潜在危害与收益的评估”、“建立健全公开透明的人工智能监管体系，实行设计问责和应用监督并重的双层监管结构，实现对人工智能算法设计、产品开发和成果应用等的全流程监管”。这说明，从国家层面，面对人工智能发展的新一轮高潮，技术发展过程中所面临的法律风险及其规制，也是值得研究和不容忽视的重要问题。

六、人工智能能否解决法院工作中的矛盾和痛点

发展人工智能在中国已经成为一项重要的国家战略。2017年11月15日，科技部召开新一代人工智能发展规划暨重大科技项目启动会，宣布全面启动实施新一代人工智能发展规划，并将依托百度公司、阿里云公司、腾讯公司和科大讯飞公司建设自动驾驶、城市大脑、医疗影像和智能语音人工智能开放创新平台。司法活动中，各地法院也纷纷开始了人工智能项目试点。

根据笔者的观察，人民法院目前开展的司法人工智能项目，主要集中在以下三个方向：

一是自动化。此类项目旨在通过计算机自动操作，减少机械化重复性劳动。在司法活动的特定环节和特定案件类型的审理中，自动化能够显著提高司法效率。

二是规范化。此类项目旨在借助大数据和算法分析证据和裁判文书，挖掘司法规律，辅助法官进行决策。受制于图像识别和自然语言识别技术的发展水平，此类项目在数据训练、输入、标注等环节需要投入大量人力，将算法与具体案情匹配时的准确度也有待提高，其应用价值更多体现在通过集中整理类案审判规律，节约法官的类案检索成本。

三是综合化。此类项目将自动化与规范化结合，旨在通过深度介入数据输入、处理和输出全过程，全面提高工作效率，为审判活动提供全程辅助和信息化管理服务。此类项目想要发挥作用，必须依赖于全部司法活动信息的标准化录入，模型和算法的准确训练，以及证据、案情等小前提的有效匹配，其必要前提是审判活动完全信息化。在不具备上述前提的情况下，此类项目仅能提高局部效率，难以根本性的改变全系统的生产力水平。

人工智能能否取代人类法官？笔者给出的答案是否定的。人民法院的审判活动本质在进行司法判断，法官需要对司法判断的后果负责。无论使用怎样的技术手段，只要人工智能技术还无法做到百分之百准确，就必须有人类法官进行复核，由于复核的过程无法跳过任何环节，其效率与传统的办案方式并不存在根本性的差异。因此，期待人工智能技术根本上改变审判方式甚至替代人类法官，在现有技术发展水平下可能还为时尚早。

回到人工智能司法项目上看，笔者认为三种方向中，自动化和规范化的方向，可以在一定程度上提高法官的工作效率，缓解法院当前案多人少的主要矛盾，而综合化的应用方案发挥作用需要的前置因素和资源过多，不应被视为最优先的发展方案。（作者为北京市浩天安理律师事务所高级合伙人）

往期回顾

【成果巡礼】四川武侯：智慧的力量“刚柔并济”——这里的干警执行有力度，生活有温度

大片来袭！6分钟告诉你什么才是智能化的诉讼服务

【成果巡礼】行动派出击！看重庆江津法院跑出执行“加速度”

【成果巡礼】科技驱动效率！广东中山第一人民法院信息化有多6？一起来看！

作者：王新锐

来源：最高人民法院司法案例研究院公众号

本期责编：文慎楠

注：文章不代表平台观点