魏斌 | 智慧司法的法理反思与应对

数字法学 2022-04-09

The following article is from 政治与法律编辑部 Author 魏斌

点击蓝字关注我们

本文作者

魏斌

浙江大学光华法学院

百人计划研究员、博士研究生导师

本文发表于

《政治与法律》2021年第8期

“争鸣园地”栏目

摘

要

智慧司法进入了全面应用的阶段，也产生了新的实践问题。智慧司法之法理反思直面实践问题背后的本质，从本体论视角批判性分析法律代码化、审判模式重塑和审判权嬗变等困境。从方法论视角反思“同案同判”、道德推理和价值判断、法律预测等法律方法的功能替代效应。从技术视角反思智慧司法自身面临的大数据挖掘难题、算法偏见和其他技术瓶颈。法理反思不是为限制智慧司法，而是探究问题背后的深层次原因，启发找到解决问题的思路和方案。法理反思的价值在于引导智慧司法理解法理，遵循司法规律，满足司法实践的需求，使之与法律人的思维和方法相适应，推动人工智能等新科技与法律的深度融合。

关键词：智慧司法；法理反思；本体论反思；方法论反思

智慧司法在第四次工业革命和新一代人工智能变革的推动下进入了全新的应用阶段。我国以“智慧法院”“智慧检务”“智慧司法行政”为核心的智慧司法建设在提升检察监督能力、审判能力和司法行政能力现代化水平方面进行了深入探索，为提升法检司核心业务运行与协同质效，实现公正司法与司法为民提供了智能化方案。当前，智慧司法建设初步实现了司法大数据资源的汇聚、管理和融合运用，提供了多样化司法大数据分析和挖掘服务，推动了语音识别、图像识别、深度学习、知识推理等人工智能技术在司法领域的深度应用。然而，智慧司法建设“先行先试”的探索模式在理论和实践层面也产生了新的问题。智能合约的应用使得法律规则被代码化为技术规则，远程审判和异步审理的新模式超越了现有的司法程序和审判模式，人工智能辅助裁判与法官裁判的思维和方法发生了不同程度的偏离，由此引发了智慧司法与现有司法制度不相融合等诸多问题。客观上，法律大数据的多元和异构属性、法律命题和规则的模糊性、算法偏见和不可解释性等特征使得智慧司法面临极为混杂的困境，这些问题导致智慧司法在实践应用中的表现与预期有较大落差。全局性和系统性的法理反思有助于从深层次探寻当前智慧司法实践中所遇到问题的本质，进而思考可能的解决办法，构建合理的应对方案，促进我国智慧司法建设行稳致远。

一、智慧司法及其法理反思的维度

我国智慧司法建设以“智慧法院”、“智慧检务”、“智慧司法行政”为代表，将人工智能等新一代科学技术应用于检察监督、司法审判、诉讼服务和司法管理，以实现司法业务全流程、全节点的智能化为核心，实现业务及其流程的数据化、平台化和智能化，从而提高司法任务的准确性、精确性和效能。智慧司法可以看作是人工智能等现代科学技术赋能司法的一种新的司法运行和管理形态，其快速发展得益于国家政策的推动，《国家信息化发展战略纲要》和《“十三五”国家信息化规划》等重要规划都将建设智慧司法列入国家信息化发展战略。国务院印发的《新一代人工智能发展规划》更是明确要建设“智慧法庭”，提出要建设集审判、人员、数据应用、司法公开和动态监控于一体的智慧法庭数据平台，促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用，实现法院审判体系和审判能力智能化。

智慧司法建设主要是围绕“平台化+智能化”的模式来打造，因而，智慧司法的应用可以分为平台化应用和智能化应用两类。平台化应用主要是将线下工作搬到线上，实现司法任务执行网络化、可视化和平台化。以“智慧法院”建设为例，智慧法院构建了智慧审判、智慧管理、智慧执行、智慧服务业务模块，还搭建了司法大数据管理和服务平台、司法知识平台和通用管理平台，通过司法人工智能引擎将大数据平台与知识平台相连接。杭州互联网法院就建立在在线审判平台之上，即网上诉讼平台、在线调解平台、电子证据平台、电子送达平台、在线执行平台以及审判大数据平台。最高人民法院还建成了“法信——中国法律应用数字网络服务平台”，充分利用信息化手段，满足法官在办案过程中对法律、案例、专业知识的精准化需求，并向社会大众提供法律规范和裁判规则参考。为推动司法公开，人民法院在裁判文书公开、庭审公开、审判流程公开和执行信息公开领域建设了四大公开平台，即中国裁判文书网、中国庭审公开网、中国审判流程信息公开网和中国执行信息公开网。

智慧司法的智能化应用需要在一般人工智能技术的基础上融合司法实践的特征，产生出既能够满足法律实践需求，又能够遵循司法规律的软件、系统和装备。基于机器学习的司法人工智能尤其侧重于技术的开发和应用，这类技术需要语音、图像、视频、个人信息、法律文书等大数据作为训练素材，司法大数据的应用成为这类技术发展的基本前提，深度学习算法在这类技术中得到普遍应用。在语音技术方面，主要有用于庭审或讯问语音转录的语音识别技术。在图像和视频处理方面，主要有用于庭审辅助的图像识别技术、异常行为识别和庭审公开的视频处理技术。在法律信息检索方面，主要包括用于类案推送、法律法规推送的技术。自然语言处理（NLP）是目前法律人工智能最为复杂的技术之一，它也往往与其他技术混合交叉，其在法律领域表现为法律文本分析和挖掘的技术，由此还可以延伸到知识图谱的构建技术和司法画像技术等，产生的司法应用包括电子卷宗自动生成、繁简案件分流、虚假诉讼甄别、司法判决预测额、法律文书辅助生成、法律文书审查和自动纠错等。

智慧司法的实践反思需要运用法理思维。法理思维的“反思性”意味着：“在法律的有效性之上，要提升法律的合规律性、合目的性；……在法理的法源性之上，要增强法理的说理性、论辩性。”智慧司法的研究和应用应当合乎司法规律，既要反思人工智能赋能法律实践的合理性和正当性，也要增强法理对人工智能赋能法律的说理性。法理反思既要思考人工智能与现行法律体系和制度的融合关系，尤其是司法体制和运行机制，也要思考人工智能技术对现有法律方法的替代效应，尤其是司法裁判中的法律方法。法理反思不仅要探究人工智能与法律融合的实践所呈现的问题，更要从本源的法理视域当中去发掘问题背后的深层次原因，为探寻针对性的解决思路和方案提供法理依据。法理反思旨在构建智慧司法的批判性理论，探求实践问题背后深层次的原因，使得实践中的问题从法理层面来寻求解决之道变得可能。

智慧司法的法理反思藉由三个维度展开。首先，从本体论角度看，法理反思在于思考智慧司法对现有法律体系的影响。人工智能的变革加速了法律代码化的设想，部分实践导致公正和效率价值的失衡，远程和线上审判改变了传统审判模式，智能化审判系统使得审判权双轨运行。其次，从方法论角度看，智慧司法在功能上替代了“同案同判”、价值判断和法律预测等传统法律方法。人工智能“同案同判”在处理复杂案件时容易忽略个案的特异性，导致“异案同判”的结果。同样，人工智能难以进行道德推理和价值判断，缺乏裁判所追求的“法理、事理和情理的统一”。法律预测存在深度学习引发的不可解释性问题，预测结果难以体现“透明”这一基本司法价值。最后，从技术角度看，人工智能由于数据标注、算法偏见、特征工程和过拟合等技术问题仍然无法满足法律实践的需求。三者的关联在于，本体论反思是对智慧司法在实践中的问题进行深层次和抽象的理论分析，它又体现在实体性的方法论问题和技术问题当中。

二、智慧司法的本体论反思

本体论反思关注智慧司法对现行法律体系与制度基础的影响，尤其是对司法体制和运行机制中的司法价值、审判模式、审判权等本体要素的冲击，其正当性在于从本体论角度探究人工智能等科技改变传统法律体系和制度的元问题，思考如何引导新科技与现行法律体系相协调。本体论反思主要体现在三个方面：第一，人工智能再次激活了法律代码化的假想，代码化试图以代码运行替代法律运行，颠覆了现有法律运行机制；第二，人工智能辅助实现了线上和远程审判，审判模式的重塑对传统司法程序构成冲击；第三，智能化审判系统替代法官审判民商事热点案件，使得法官审判和机器审判双轨并行，法官独立审判权受到挑战。

（一）法律代码化的法理反思

人工智能的算法变革使得产生了这样一种声音，算法是一种代码式的法律，它以另一种法律规则运行来替代现实法律的运行，犹如莱斯格的著名论断：“代码即法律。”区块链技术在智能合约中的应用验证了“法律代码化”的合理性与现实性。智能合约将法律代码化，将法律规则转化为技术规则，以技术契约的形式自动化地执行法律规则，合同条款被代码化之后作为自动化履行的合约，代码替代法律起到了制约权力和义务关系的规则。有学者甚至提出智慧检务视角下的共性问题是用代码实现法律规则，即“以代码实现法律规制，用技术促进司法公正”。智慧司法的技术逻辑体现了另一种模拟法律运行的规律，法律代码化具备了现实的技术可行性。考夫曼就以批判式态度探讨了法律代码化的问题，他认为通过符号表达所产生的法律是另外一种“法律”，这与法官通过判决所表达的法律是不同的——“法律”在平等原则中将被机械地操纵。根据其观点，计算机审判所援引的法律规则并不是人类审判的法律规则，而是计算机执行审判程序的规则，这是由于彼时的计算机还不能模拟人类在自然语言理解和生成以及法律推理等方面的功能，因而计算机尽管能够用符号表达语言，但是缺乏法官在裁判案件过程中推理和论证的能力。

符号化和算法化的裁判是一种机械的裁判，正如他所指出：“如果人们在其中不保证将始终变动的生活关系的独有性和特殊性在法律的发现过程中引入，那么纯粹从法律规范演绎出来的‘争议’将会是一种‘永久的，重复相同的’僵化机械论，一种是电脑的‘正义’，一种是非人性的‘正义’。”考夫曼提醒要时刻保持清醒的是，要谨慎运用符号系统，避免导致法律代码化的异化。算法由代码序列构成，法律代码化不难被同构为法律算法化。不可否认，算法与法律有相似之处。“法律与算法都是为实现特定目标而构造的指令集。两者都以过滤信息、建构模型为手段，具有降低认知负担、提高认知效率的功能。算法设计中的一些基本原则可以供法学参考。”代码表征的算法规律在一定程度上也能够表达法律的运行规律。区块链代码在智能合约中的实现就是法律代码化或算法化的范例。但以算法替代法律，或者以人工智能的运行规律来取代法律实践的运行规律，这极可能使智慧司法被错误引导而走向“算法独裁”。“法律的算法化在倒逼法律人更加精准和体系化地表述法律知识。”

然而，这并不意味着算法或代码可以替代法律。一方面，由于算法的原理与法律的法理有本质的区别，两者的差异在于算法的设计遵循数字逻辑，反映代码有穷步骤运算得到结果的规律，而法律在立法意图和裁判逻辑之外还要遵循道德和伦理价值，体现对人的行为的约束和指导价值，反映司法裁判的规律。另一方面，代码或算法自身的问题将导致法律严重偏离立法意图，违背司法规律。代码或算法天然的偏见属性将放大算法异化为法律的后果，客观上是由于数据自身的缺陷和算法不可解的缺陷，即由数据的缺陷经过算法传导所引发的结果不公正。主观上是由算法设计者恶意设计或使用者根据主观偏好所导致的不公正。如果以此类算法辅助司法裁决，那么将违背司法公正的规律。因而，要否定法律代码化或算法化的假想，警惕以代码替代法律的观点，防止智慧司法的算法异变。

（二）审判模式重塑的法理反思

在线审判重塑了传统审判模式。“智慧法院”利用ODR技术的开放性、经济性、公平性、较弱对抗性、仲裁和调解灵活等特点创新了民商事案件纠纷解决的新模式，通过借鉴互联网多元纠纷解决机制搭建了“人民法院在线调解平台”，对婚姻家事、合同纠纷、侵权纠纷类案件实现了在线评估、在线仲裁、在线调解和在线司法确认，“移动微法院”等高效简易在线程序极大地缓解法院“案多人少”的矛盾。在线审判模式突破了传统法庭的空间制约，尤其在突发性疫情等极端状况下仍能够在线开庭。互联网法院探索的异步审理将在线审判从突破空间制约扩大到突破时间限制。“异步审理模式突破时间限制，当事人可利用空余时间，不同时、不同地、不同步参与诉讼活动，充分保障诉讼权利。”从在线纠纷解决到异步审理，智慧司法都在不断挑战传统审判模式。远程审判的程序正当性受到极大的质疑，也亟需新的理论思考和辩护。

然而，在线审判模式有其局限性，目前只适用于固定电子证据的简单案件，对于需要经过辩论来认定案件事实的复杂案件显得力不从心。法庭审判设置了严格的程序和规则，需要经历法庭调查和法庭辩论环节，案件事实在对抗双方的辩论之下越辩越明。传统审判模式有其不可替代的优势，它在保证双方辩论权的基础上最大程度地保证了程序正义。互联网审判或在线仲裁模式尚只适用案件事实清楚的简单案件，并不适合处理案件事实有待查明的复杂案件，人工智能尚难以在需要综合分析和评价证据的复杂案件当中有效发挥作用。因而，案件事实存疑和法律法规适用有争议的复杂案件尚不能有效适用人工智能辅助审判，传统审判模式仍不可替代。

审判模式的变革在一定条件下还会削弱控辩的平等地位，在线审判模式的不当应用甚至不利于审判中心主义的诉讼制度改革。“在庭审的对论过程中，检察官、辩护律师和法官的推理形成一种互动关系，判决结果则产生于三方相互作用的合力。正是通过平等辩论，才使案件事实越来越清楚、法律解释越来越一致、判决理由越来越凸现。”然而，在线审判暂不具备传统庭审中举证、质证和辩论的特点，尤其在刑事案件审判中，在线审判模式会削弱被告人的请求权。数据获取能力和数据分析能力的差异也将导致控辩不平等。刑事案件的风险评估模型忽略了被评估人请求举证和辩护的权利，形成了一种不对等的决策偏移。过度追求审判模式的智能化还可能造成审判场域弱化：一方面，审判具有严肃的仪式感，而在线审判场景缺乏场域控制，削弱了当事人对公正审判的感知，也容易造成对裁判结果公正性的质疑；另一方面，过度追求技术替代可能引发技术蒙昧主义，剥夺了当事人的知情权与选择权，也因失去发泄不满或寻求倾诉及心理治疗的情境而削弱了审判的参与感。

（三）审判权嬗变的法理反思

审判模式的变革直接导致法官的主体地位受到威胁，引发审判权的嬗变，这也是人工智能用于规范司法权运行的必然结果。“以毫无节制的‘人工智能+’方式改造审判空间后，这样的法官定位势必发生极大的动摇，甚至造成审判系统乃至司法权的全面解构。”当前，智审系统在道路交通事故纠纷、金融借贷、民间借贷等简易案件中替代法官行使了审判权，浙江省高级人民法院组织研发的“凤凰金融智审”实现了在真实诉讼环境下金融借款案件大批量、全流程无人工干预的智能审判，智能审判和法官审判的结合实质上暗含了审判权的双轨模式。“审判权一般是由国家专门机关专属行使，由法院受理案件，法官主持诉讼活动，依审判权力对纠纷进行处理。”审判权属于由国家主导和保证实施的国家权力，审判权的嬗变还可能与人工智能在社会综合治理中的权力替代效应连锁引发国家权力体系的异化。更为直接的后果是，审判权的嬗变将削弱甚至颠覆法官审判的主体地位。“法官主体就是在诉讼过程中，只能由办案法官完整地享有对案件的审理权和裁判权，并由办案法官承担责任。”如果由人工智能主导司法裁决，那么极可能与传统司法权运行的规律相悖，由此掩盖审判权所应当体现的判断权和裁决权属性，影响法官的自由裁量。

在法理视角下，审判权的嬗变是人工智能对法官审判权的消解，本质上与法官独立行使审判权的司法原则相违背。其一，审判权的嬗变将削弱司法公信力，人工智能辅助审判将增加司法审判的肆意性和不确定性的风险，弱化社会公众在案件中感受到公平正义的体验感。其二，审判权嬗变将导致审判权难以被监督，计算机程序的专业性使其难以被非专业人员理解，加之机器学习算法的不可解释性等因素，使得澄清算法的运行逻辑并非易事。其三，审判权嬗变削弱了法官审判的独立性，法官裁判极可能受到人工智能辅助结果的影响，尤其是强制类案检索等制度将对法官裁判的独立性构成威胁。其四，审判权嬗变将难以保证审判方的中立性。法官中立是审判权独立的本质规律，也是保证审判权独立运行的要素，算法偏见使得裁判结果呈现一定的偏好和倾向，导致裁判结果的不公正。

审判权的双轨模式会引发审判责任的分配问题。如果法官过度依赖人工智能作出司法裁决，而不是基于自身的裁判逻辑，那么极可能架空司法责任制，使得对法官履行审判责任的行为责任难以判定。其中的主要问题在于，当法官依据人工智能辅助作出错误决策时，是否需要对该案承担责任？如果法官参考或直接采纳人工智能辅助意见作出司法裁决，那么最终决策混合了机器决策和法官决策。当这种决策导致裁判错误时，如何判定是否有重大过失导致裁判错误就变得十分复杂，“审判者通常难以审查机器算法的正当性，即便获得计算机专家的帮助，也有可能受制于当时科技水平而不能及时查证”。审判责任分配要避免两种极端：第一种是完全让法官承担责任，这种分配方式会导致法官拒斥人工智能辅助，引发法官对人工智能的不信任，甚至彻底否认人工智能对司法的积极作用；第二种是完全由人工智能的设计者或生产者承担责任，这极可能导致智慧司法的滥用，使得其难以受监管。人工智能引发审判权的嬗变使得司法责任分配混乱，法官责任的重新分配必须建立在人工智能责任确定的基础之上。

三、智慧司法的方法论反思

从方法论角度看，智慧司法为法官等司法人员决策提供了技术支撑，也给传统的法律方法带来了新的挑战，主要表现在“同案同判”、道德推理和价值判断以及法律预测等应用当中。方法论反思的正当性在于从方法论视角来区分人工智能与法官等在法律思维和决策方法的异同有相当紧迫性，它有助于分析和批判人工智能的功能替代作用和应用缺陷。“方法论上的反思不足使得现阶段法律大数据应用领域已经出现了完全不考虑法学理论而进行的应用开发。”方法论反思至少需要考虑三个问题：人工智能辅助“同案同判”是否与法官同案同判的类型化思维和归纳思维相一致？人工智能能否像法官一样进行道德推理和价值判断？人工智能预测判决结果是否与法官预测判决结果相似？

（一）“同案同判”的法理反思

智慧司法进入第三次变革以来，“同案同判”辅助是司法实务部门最为关注和最抱有期待的应用，也是最能够发挥机器学习和司法大数据挖掘能力的应用。最高人民法院发布的《关于统一法律适用加强类案检索的指导意见（试行）》就试图通过类案及关联案件强制检索机制来推动“同案同判”。“同案同判”意味着如果两个案件“同案”，那么应当得到“同判”的结果。但何为“同案”的法理争辩一直未有定论。有学者认为：“严格意义上的同案并不存在，致力于结果平等的”同判“主张的理论逻辑是非常脆弱的。”但多数学者还是持有乐观的态度，认为“同案”还是可以遵循一定的标准，有观点认为“同案”指的是：“在指定性分析上确定待决案件的事实与指导性案例的事实在整体性质上是否涉及相同的法律问题，以及在定量分析上看两个案件的具体情节是否可以视为相同。”实务工作者则给出更为实用的标准，“同案”的标准应当满足：“两个案件中当事人主张的事实一致、法院认定的案件事实一致、实现法律效果、政治效果、社会效果三个效果一致、受到审判监督一致。”法官进行“同案同判”的过程是根据“同案”的这些标准，就当前案件的关键要素识别和选择最相似的先例，再做出与先例判决相一致的判决结果。

人工智能如何识别“同案”呢？人工智能识别“同案”的方法是利用机器学习和自然语言处理技术，采用由监督学习来训练“同案同判”预测模型，从包含先例数据的裁判文书等法律文本当中抽取文本描述信息，然后再应用这些信息去预测新案例的结果，从而达到“举一反三”的效果。具体而言，首先，构建特征工程需要按照“同案”的标准选取一些关键要素以供标注和训练，接着对法律问题相关的事实文本描述进行分类，而后在这些分类之下，进一步评价和解释如何从此前已经分类的案例当中预测当下法律问题的结果。与人类识别同案的类型化思维不同的是，人工智能是需要对大量的数据进行预训练，通过标注要素的方法建立训练数据集和测试数据集之间的统计关联性，再由模型来预测“同案”的判决结果。从人工智能的理解来看，“同案”的标准决定了如何选取训练模型的标注，通常指案件所包含的可以量化的要素，不难提取出比较两个案件相似性的关键要素：案件事实的构成要件、适用的法律法规、案件的争议焦点、案件的推理类型和论证模式等。

人工智能识别“同案”的方式也暴露出其问题所在。人工智能将“同案”理解为案件要素的相似性比较，即两个案件的关键要素越相似，那么案件的相似性就越高。智慧司法虽然提高了同案同判的效率，但其运算机理反而降低了同案同判的可信度，这是由于机器学习的统计相关性并不能够代表因果关联，而且机器学习采用分类方法所得到的准确率和召回率（recall）再高也不能保证结论必然为真。更严重的问题在于，案件的特异性会使得“同案同判”算法完全失灵。因为，“法律实践中的一个悖论是：一方面，司法裁判受到同案同判的拘束；另一方面，某些情况之下的特殊对待又被认为是合理的”。智慧司法辅助“同案同判”看似提高了准确性，这可能对大多数简易案件是有效的。然而，对于特殊案件，尤其与其他类案看似高度相似，但却有特异性要素的复杂案件而言，通过机器学习来预测案件结果极可能忽视该案件的特有属性，仅根据与类案相似的共性特征，得不出公正的结论。

从法理角度来看，智慧司法辅助“同案同判”，是作为科技赋能司法的范例而辩护了“同案同判”理论呢？还是因其出现的诸多问题反而起到削弱作用呢？实际上，人工智能发挥了“双刃剑”的作用：一方面，智慧司法较好地模拟了人类的类型化思维，深度学习也是采用分类和聚类的方法来处理数据，提升了“同案同判”的效率，统一了司法裁判尺度，避免了司法裁判不公，纠正了裁判的偏离度，这些都强有力地证成了“同案同判”的必要性和可行性；另一方面，人工智能同样放大了“同案同判”的弱点，从学理上削弱了“同案同判”的合理性，因为并非“同案”中的所有的要素都可以量化并进行比较，即便可以量化比较的关键要素相同也不能代表两个案件全部相同，因其极可能遗漏案件当中容易被忽视的特征，而这些特征也极可能使得其并非“同案”，而是“异案”。如果人工智能在构建特征工程时无法捕捉这些特征，那么极可能导致“异案同判”的结果。

（二）道德推理和价值判断的法理反思

智慧司法难以处理复杂案件，除了案由复杂之外，更多的是复杂案件可能包含道德推理和价值判断。智慧司法除了技术上难以表达伦理和道德，从法律与伦理和道德的关系来看，道德往往在法律的规范性之外发挥作用，法律以规则的形式发挥效力，而道德和伦理却难以表现为有约束性的规则，智慧司法建设“不应当”用规则思维来约束价值判断和道德推理。智慧司法以算法和模型实现对法律命题和推理的抽象化，这才使得计算法学变得可能。对于法律语言中的概念、规则、原则进行抽象化和形式化是对所有具有同一种抽象形式的具体命题的形式化。例如，司法三段论所提炼的大前提、小前提和结论都是全称肯定命题，最终的司法裁决所以依据的命题都必须转化为这种抽象的命题形式，这种形式化能够平等地处理所有具有同一抽象形式的命题，抽象化的推导模式有效防范司法裁判的任意性，实现司法裁判严格和统一尺度。例如，在司法三段论中，满足法律法规适用的大前提、案件事实认定的小前提，那么根据三段论的抽象形式，可以得出全称性和排他性的结论。

然而，法学家担忧过度形式化会忽略法律命题抽象形式之外的价值因素，如果所有的法律命题都按照抽象的形式来进行推理，那么情感、道德、伦理、政治等因素都完全被排除在外，以哈特与富勒关于“不允许车辆进入公园”的经典辩论为例，容易构造一个这样的三段论推理的形式：所有的车辆都不允许进入公园，救护车是车辆，因而救护车不被允许进入公园。根据推理的有效性标准，容易得到前提为真则结论必然为真的结论。然而，这个推理显然与人们的常识和情理不相协调，严格地按照命题的抽象形式来推理会造成同种抽象形式同种对待的结果，这必然会丧失掉法律命题自身的个别化特点，这种差异性并不表现在命题的抽象形式上，而是法官价值判断的主观性特质。

“算法决策要达到绝对的客观和精准并非易事，面对复杂疑难案件，其能够促进形式正义，却很难实现实质正义。”判断诸如“法律权利”“法律义务”“违法”之类概念以及判断立法活动和法律公正与否等，可以归为价值判断。法律推理不仅仅依赖形式理性和逻辑抽象，案件事实的认定和法律法规的适用也绝非是形式逻辑的专利。“法律推理不仅仅是依据明文规则进行的形式推理，往往还需要依据法理进行复杂、严谨的实质推理。此时，需对各种价值、利益、政策进行综合平衡和选择，属于实践性法理推理。”法律推理按法律范畴或规范要件对证据事实进行评价和筛选进一步限定、确立了作为法律推理之小前提的案件事实或裁判事实。但要指出的是，其中每一个环节都可能出现死结或谬误。“因为每一环的推进都仰仗于认识主体的感知、经验和信念，以及隐身其后的潜意识、道德情感和个人价值观。”这意味着对法律命题的评价离不开人的价值判断，尤其对案件事实评价要判断是否与对应法律命题的价值原有之意相符合。

（三）法律预测的法理反思

法律预测算法最为人所诟病的问题是算法的不可解释性，这也是对机器学习算法的预测功能最大的质疑。法律预测算法的不可解释性主要指算法用于预测决策结果时是不可解释的，这种不可解释性饱受诟病，尤其是在决策透明性有极高要求的法律领域，决策不可解释意味着最基本的公平正义受到质疑，深度学习的“算法黑箱”严重侵蚀了司法的透明性。预测模型因不可解释而引发了极大的关注和批判。2017年，有研究团队建构了预测美国高等法院判决的预测模型，训练数据库选择了美国高等法院在近两个世纪（1816-2015年）所做出的24000份法官投票和28000个案件判决结果，学习的特征在案例涉及的240个变量中选择了15个常见的类别变量，基于时间演化的随机森林算法来训练预测模型，研究结果显示在法官投票任务方面实现了71.9%的成功率，在预测判决结果任务方面则取得了70.2%的成功率。

然而，该研究无法展示由数据投喂到模型训练再到预测结论的过程，数据输入和预测结果之间缺乏基本的关联解释。由不可解释性引发的问题已经有所反馈，法国于2019年3月通过立法禁止对法官判决数据进行司法画像，其原因就在于司法画像被用于预测判决，而预测算法使用了深度学习来训练数据，不可解释性使得预测决策面临极大风险，尤其在刑事判决预测当中。深度学习“是一种数字机器学习的算法，它是基于对数据进行表征学习的方法”。其基本原理是以端到端的方式进行特征学习，通过采用多隐层神经网络和反向传播方法学习隐含在数据内部的规律，从而使学习得到的特征具有更强、更泛化的表达能力。然而，深度学习忽视了学习过程中产生描述高层语义的中间特征层，使得难以呈现数据输入和预测结果输出之间的关联，即缺乏可解释性。

可解释性被认为是一种因果关联性，它能够解释由前提（数据）到结论的推理过程，这也是法官推理裁判结果的基本要求。法官需要判定证据与事实之间的因果关联，而无需关注大数据当中特征的统计相关性。深度学习忽略了数据中要素之间的因果关联，只是学习要素之间的统计意义上的相关性，甚至只是统计频次上的显著性。也就是说，深度学习只是学习到某两个概念之间存在统计意义上的关系，而并不知道这两个概念之间存在逻辑上的因果关系。不可解释更深层次的原因在于深度学习采用了一种与法官推理和决策完全不同的推理模式。法律推理是一种基于领域知识的知识推理，而深度学习的人工智能则依赖大数据推理。法官主要是基于证据和经验，根据逻辑推理和价值判断，凭借自由心证来推出结论，它被归入为一种“自顶向下”的“演绎式”推理模式，这种模式强调证据和经验对内心的理性说服。

四、智慧司法的技术反思

智慧司法还存在人工智能在其他领域应用的共性问题，主要体现在法律大数据的挖掘、算法偏见和过拟合等其他技术瓶颈。“大数据研究涉及海量数据的收集、脱敏、清洗、整理和分析，这对数据收集、分析主体的专业水平，特别是研究规范提出了较高甚至是苛刻的要求。”机器学习的技术逻辑为追求“曲线拟合（curve fitting）”而必然会出现过拟合（overfitting）问题，而且机器学习预测的结果受到特征工程的直接影响，在监督学习的前提下，特征工程甚至决定了机器学习的成败。从法理角度反思人工智能的技术缺陷，不难发现，当前的人工智能的技术特点仍然无法满足法律实践的需求，与司法规律的契合还存在较大差距。

（一）司法大数据挖掘的反思

智慧司法以大数据分析技术结合机器学习在自然语言处理、图像识别和语音识别领域取得了极大的进展，尤其在法律文本分析中的应用最为深入，产生了法律信息抽取、法律文本分类、摘要和法律结果预测的诸多应用。然而，大数据挖掘技术仍然面临诸多难题，在目标变量定义、数据训练（数据标注和数据收集）、特征选择、代理等多个方面面临挑战。这当中用于训练的数据标注就是首要面临的困难。目前深度学习的技术路线仍然采用有监督的学习方式，这意味着需要对大量的数据进行标注。以图像识别领域的国际性竞赛“大规模视觉识别挑战赛”（ILSVRC）为例，该竞赛所使用的图像数据库Image Net包含了1500万张照片，涵盖22000种不同类别，先后由来自167个国家的48940名工作人员标注了近10亿张图片而得到的。然而，法律文书的标注与图像标注不同，法律文书中的实体以及实体关系的标注需要接受过专业训练的人才能完成，如果数据标注的质量低劣，那么无论是何种机器学习算法模型都难以得到好的结果，这在机器学习的初始阶段就设下了极大的难题。

数据标注的困难将直接导致语料库（corpus）建立失败。语料库是用于训练模型的数据库，海量和高质量的法律大数据是支撑精准数据挖掘的前提，然而，获取高质量的数据一直是困扰智慧司法应用的难题，法律文本和先例的多元和异构特点给数据处理和分析带来极大挑战。更令人担忧的是，语料库中可能会夹杂一些劣质数据，如不公正或带有偏见的先例判决，劣质数据作为训练集，会训练出不公正模型，预测结果必然导致不公正。语料库中的数据错误会被模型转移至预测结果当中，而且这种错误几乎难以被发觉和识别。这意味着数据输入端的错误转移至预测输出端，由错误大数据推理得到的结果必然有违公平正义。从法理角度反思，无论是标注方法问题，还是语料库不适用，或是特征选择不当，都说明了技术能力尚不足以达到挖掘隐含在大数据当中的法律形式理性。大数据挖掘难题本质上属于科学技术与法律之间融合的问题，即当前的技术能力仍难以满足法律实践的需求。

（二）智慧司法算法偏见的反思

人工智能在司法中的应用难以避免算法偏见所带来的危害。算法是指一系列有限的、定义明确的计算机可执行指令，它用于解决一组特定的可计算问题。它需要在有限时间内明确地处理初始输入，然后再得到其输出。智慧司法的算法广泛存在于法律决策的计算、法律大数据处理、法律推理的自动化等任务中。算法存在偏见或歧视不可避免，因为算法是由人根据问题求解或任务需求来设计的代码化程序，有明确的主观目的性，因而必然带有设计者的主观思想。计算机系统的算法偏见通常包含三种类型：第一种是先前存在的（preexisting）偏见，它反映了对系统设计有重要影响的客户或系统设计师的个人偏见，这种偏见可以是有意或无意的。第二种是技术偏见，它是由技术设计中的问题求解而引发。第三种是紧急（emergent）偏见，它是实际使用者的变化而产生的结果上的变化。智慧司法的偏见可能出现以上情况，既包括算法设计者和使用者做出决策时的某种主观偏见，也包括数据端和算法缺陷所导致的技术偏见或客观偏见。

从智慧司法的算法类型来看，引发算法偏见有两种情况。第一种情况是以法律知识驱动的逻辑算法，模拟法官等司法人员的决策思维和方法，以技术的形式再现司法人员的决策，体现了司法人员的逻辑推理思维。常见的方法是基于规则（reason-based）和基于案例（case-based）的司法决策辅助系统，如美国开发COMPAS等风险评估软件，本质上属于一种基于规则的法律专家系统，这种人工智能是根据专家经验来制定决策的程序。该算法是根据人为设定的再次犯罪的要素来进行赋值和量化，包括工作经历、经济状况、家庭成员犯罪记录、年龄、性别、婚姻状况、福利、教育水平等要素。显然，这类算法的偏见是由人在制定规则时的主观偏好所导致的。第二种情况是带有偏见的大数据和机器学习诱导形成的算法偏见，主要原因是特征工程（feature engineering）构建失败。特征工程是通过特征选择使得机器学习算法达到最佳效果的过程，它决定了训练模型算法的稳定性和预测结果的可靠性，选择的特征越接近数据间共性的特征和规律，就越具有统计学意义，最终算法模型训练的效果就越好。构建特征工程需要观察数据样本的关键组成结构，然而，缺乏法律专业知识的工程师难以理解法律文本和先例的关键特征，而且容易加入个人的主观偏好，这使得数据的特征选择极可能发生偏移，进而影响算法模型的训练效果，最终丧失准确预测的功能。

五、智慧司法困境之应对思考

智慧司法在应用中所产生的问题繁复，从法理角度挖掘背后的深层次原因，对于探求可行的应对之策有所帮助。智慧司法引发的问题多数是新一代科学技术与司法实践的双频共振，不是仅凭某一项方案就可以轻易解决的，解决任何一个问题都是系统工程。这需要从人工智能技术突破、司法体制创新、法律规制等多个方面发力，目的是使智慧司法更好地适应司法实践。要清醒认识的是，对于大多数问题，都难以找到“特效药”，也不可能找到一劳永逸的解决方案，更多的是减弱问题所带来的负面影响。智慧司法之困境还可能迭代和升级，人工智能等新科技的技术优势与智慧司法所产生的问题将长期共存。

（一）本体论问题之应对思考

法律代码化的悖论消解主要是要界定代码化的场域，即在什么情况下可以代码化，什么情况下不应当代码化。法律不可能全部被代码化，代码运行的规则不能完全替代法律规则。技术上，代码是机器语言，它将规则编码为机器可理解的形式语言，但并非所有法律都是机器可读的，机器本身无法理解法律概念、法律规则和法律原则的含义，法律的开放性和模糊性都是代码化的障碍。技术规则是高度形式化的且不给模糊性留有任何余地，这与传统法律规则是相悖的。因而，法律代码化的作用是有限的，代码化只能形式化表达法律命题的句法结构，而无法理解其语义，更无法体现其背后的立法意图。法理上，完全代码化的思路也会剥离法律形式之外的实质特征。“法律一味模仿数学，以抽象的法律命题去剪裁层出不穷的生活事实，只能陷入形式主义或机械主义的泥淖。”兰德尔（C. C.Langdell）的“法律公理化之梦”试图构建一个逻辑自洽的法律公理化体系，但经验性的法律强调法律的开放性，并非所有的法律概念、法律规则和法律原则都可以被形式化。因而，法律的代码化应当被辩证看待其价值，要避免绝对的代码化观点。对于法律代码化悖论，应当考虑一种局部代码化的设定，即法律只能部分被代码化，法律决策也只有部分被算法化。局部的代码化的观点在于既保证法律自身的特点，又能最大程度地发挥技术本身的作用。因而，这就需要研究法律代码化和法律任务算法化的标准，分析哪些法律规则可以代码化。这样的法律规则必须以命题形式来表达，它应当包含内涵清晰的概念和逻辑语法结构。法律任务算法化也必须被表达为某种程式化的结构，通过知识或数据输入，能够输出明确的决策建议。代码化的标准应当依赖于可操作的评估程序，尤其是法律任务算法化需要专业的第三方机构来进行评估。

对于审判模式的变化，智慧司法不能因为追求审判效率而忽略审判规律，要警惕采用与人类审判规律无关或者相距甚远的审判模式，时刻保持对传统审判方式和方法的敬畏，避免以算法的规律代替审判的规律。尽管远程审判和异步审理在打破时间空间限制、减少司法资源、缓解案多人少等矛盾方面有显著优势，但并非适用于所有类型的案件。远程审理或异步审理模式主要面向案件事实无争议的简易案件，疑难或复杂案件仍然需要通过传统庭审来证立案件事实。以互联网金融借贷案件为例，这类案件的证据主要是电子借款合同，因而庭审的焦点不是借款事实的争议，而是主要在合同中关于利息、复利、罚息的计算标准不统一等问题上。因而，互联网审判的案件应当选取案件事实无争议的案件，案件事实无争议应当作为前提条件，而且还应赋予当事人决定是否接受在线审判的选择权。采用何种审判模式还取决于如何界定智能化辅助审判的范围，对纳入线上审判的案件类型进行深入论证，综合判定案件的数据量和繁简程度等要素。从互联网法院和智慧法院探索的经验来看，简易民商事热点案件（如金融借贷和民间借贷案件等）采用在线审判模式实现了快速审判。对刑事案件而言，刑事司法在使用大数据工具时需要注意这些工具的程序正义层面，除非算法被认为是公正和合法的，否则它们将一直受到公众的反对。由于刑事案件极为严苛的证明标准和极大的试错代价，因而需要极为谨慎地对待刑事案件的在线审判模式。

智能化审判系统的价值在于辅助法官更好地行使审判权，而不是替代法官判决。“司法信息化要避免过度迷信和依赖信息技术和智慧司法而忽视人类的复杂命题。”法官审判依赖于自由心证，证明的逻辑除了依赖逻辑规则，还依赖于经验，正如霍尔姆斯（O. W. Holmes）的名言：“法律的生命从来都不是逻辑，而是经验。”智慧司法辅助法官审判应当稳固法官的审判权，而不是削弱或消解。因而，对于审判权嬗变的问题，应当明确智慧司法的辅助地位，将审判权牢牢掌握在法官手中。“司法大数据与人工智能技术的应用要尊重法官的独立性和亲历性。”任何人工智能的辅助系统都是为人服务的，不能以机器的决策替代人的决策。智慧司法的设计可以借鉴“人在回路（human-in-theloop）”的新模式，强调智能主体在技术闭环中的控制地位，为法官主导提供接入途径。由此，智能化辅助系统不再是完全自动化的程序，而是在关键环节由人来参与程序运行，把握系统决策的方向。智慧司法挑战了司法责任制，还应在使用辅助系统之前就明确人工智能设计者和使用者的责任，智慧司法在研发中应当建立清晰和可操作的标准体系，明确人工智能的作用和限度。对于任何开发用于辅助法官决策的人工智能系统，都不能以替代法官决策为目的。为保障法官独立审判不受干扰，即便推广使用人工智能辅助系统，也不能强制要求采纳辅助系统的决策结果。任何辅助系统都不应当减损法官的独立裁判权。

（二）方法论问题之应对思考

对于“同案同判”难题，要明确的是，智慧司法辅助“同案同判”不可能扩大到所有的案件，或者说，能适用的案件类型也十分有限。同案同判辅助系统受到神经网络等机器学习算法缺陷的影响，无法避免数据标注和特征工程构建的问题，但仍可以从案件类型选择上做一些限制。从当前智慧司法辅助审判所取得的成果来看，互联网法院和智慧法院建设在简易民商事案件类型中取得了良好的效果，浙江省人民法院组织研发的“凤凰金融智审”系统实现了对金融借贷和民间借贷案件的智能化审判。对于案件量大的简易案件而言，如道路交通、金融借贷和民间借贷案件等，应适用和推广人工智能辅助“同案同判”的经验。然而，对疑难或复杂案件而言，机器辅助“同案同判”会暴露和放大机器学习的缺陷，为降低案件特异性带来的问题，应避免强制采纳复杂案件的预测结果，防止“异案同判”。我国人民法院已推行强制使用类案检索工具，建立类案强制检索报告制度，其目的就是为了实现“同案同判”。然而，类案检索工具是把“双刃剑”，它既有利于统一法律适用，规范法官自由裁量权，但同时又会减弱法官独立判断的能力，使得判决流于机械推理的形式。法官应避免机械地采纳类案的判决结果，而应当根据案件的特有属性，认真分辨与类案的异同，独立思考并做出判断。

对于道德推理和价值判断难题，应始终坚持以法官为中心的原则，尊重法官的自由心证，包含道德和价值因素的案件必须由法官来裁判。“在法律推理过程中，要想让当事人承担同样的法律效果，就必须对当事人的行为事实进行价值评价，判断这个特定的行为事实所蕴涵的价值判断，是否与预设于法律构成要件中的价值判断相同。”人工智能擅长“是”的逻辑判断，但尚难以做出“应当”的价值判断。因而人工智能难以在道德和价值判断上替代人类，智慧司法与法律职业者最大的差距就是在道德推理和价值判断方面的缺失。“尽管人工智能的设计者可以将自己的价值观、自己的道德准则等注入人工智能之中，但它们永远是有限和僵化的。”道德推理和价值判断属于感知与高阶认知的混合智能，目前人工智能还远没有达到理解的水平，即技术上有所不能。机器推理不能替代法官的道德推理和价值判断，尽管科学家尝试机器伦理中加入了价值规则，目的是使得机器能够像人一样做出伦理决策，但在价值偏好的发生原理和机制仍然是人工智能的难题。人工智能无法替代法官，但是仍可以识别道德推理和价值判断，即识别出包含道德和价值因素的复杂案件，再交由法官来审判。符号学方法可以识别法律推理中包含“允许”和“禁止”等道义模态词的规范命题和道义逻辑推理。机器学习方法可以通过标注法律文本中关于道德、情理、伦理、价值等要素，构建相适应的特征工程，由此识别包含道德推理和价值判断的复杂案件。

对于法律预测的难题，在当前可解释性技术难有突破的情况下，应对的方法主要是减弱不可解释所带来的后果。法律预测依赖大数据推理，它与法官的知识推理不同，是以深度学习等算法来学习大数据当中隐含的特征或规律，因而被归入为一种“自底向上”的“类比式”推理模式。从推理的有效性来看，大数据推理不具备保真性，即便先例的判决正确，也无法确保当前案件的预测结果必然正确。从法理角度看，不可解释的推理将使得法律失去安定性，法律推理的每一个步骤应当都是可解释的，每一个错误的结论也都可以溯因。法律大数据推理必须与法官的知识推理相融合，一种可行的思路是采用知识引导和数据驱动互补的方法。知识引导是根据逻辑图谱等来判定案件事实，优点在于可解释性。数据驱动是通过机器学习来实现“同案同判”，优点在于有强大的结果表现力。两者的结合能够弥补机器学习的不可解释性缺陷，同时保证有良好的输出表现力。在算法规制方面，法律预测的应用（类案检索、判决预测、量刑辅助等）应当主动公布算法信息，主要包括特征工程的构建方法、数据标注的要素、训练模型的算法类型等，再由第三方测评机构根据这些要素来综合评价预测算法的可靠性。为保障当事人的知情权，还应当为当事人提供事后救济和申诉的渠道。

（三）技术困境之应对思考

智慧司法的技术困境之化解与人工智能的技术突破紧密相关，技术问题在多数时候还应当由技术自身来解决。为防范智慧司法引发机械决策和裁判的后果，应当避免完全按照业务需求去寻找技术，这种思路要求根据业务逻辑来定位适用的技术。智慧司法的“平台化+智能化”模式是试图通过技术手段改变原有的传统业务，实现全业务、全流程、全节点的智能化。然而，这种思路容易造成人工智能技术盲目应用，走向为了“智能化”而“智能化”的误区，使得人工智能的技术无法满足真实的需求。这种思路往往容易混淆司法任务的信息化与智能化之间的差异，平台化和信息化的应用并不是直接应用人工智能的技术。在数据源头治理方面，对于司法大数据标注和语料库构建困境，应当对不同类型的法律大数据建立标注方法，提炼法律文本标注的特点，发展自动标注技术，培养专业的大数据标注团队。语料库构建从数据端生成伊始就被严格要求，提高数据清洗和预处理的质量，对案例等数据的质量进行评价，识别和筛选符合标注条件的数据，淘汰劣质的数据。为在数据生成和收集阶段就甄别出有偏见的数据，可以通过设立数据活动专家和专门的数据监管部门来实施监管。

对于算法偏见的困境，要明确的是，由于算法设计的主观性，不可能完全消除偏见。破解算法偏见应坚持算法中立的原则，在程序正义背景下，中立性是指决策者是否公正地遵循了规则，并基于事实做出客观、无偏见的决策。算法中立是运用算法软件对于它做出的每个决策都以相同的方式来遵循相同的规则。法律规制和技术制约的途径主要从事前预防、过程管理、事后追责三个方面着手。首先，事前预防可以从技术上建设开源社区，使用开源方法来审查和分类大数据，开发消除偏见的程序（公平、透明和负责任的算法程序）。设计算法监督和偏见修正的机制，在识别偏见后能采取校正措施。其次，过程管理可以建立算法审查机制，算法运行过程中需要接收算法专家的测试，尤其针对算法中的变量（如种族、性别、犯罪记录和职业等）是否有偏见倾向、运算规则是否有显著的权重差异等。最后，事后救济可以建立责任追究机制，明确追责的责任主体。当算法偏见造成负面后果时，通过立法和公开政策制定启动对算法设计者和侵权者的追责。算法偏见还可能来自于数据自身的偏见，为避免数据受到恶意篡改，要防范司法大数据交换和共享过程中泄露当事人和司法人员的个人信息，因而智慧司法建设还需要专门构建司法大数据的安全使用制度，尤其是要保护法官的个人信息，防范人工智能算法对法官的裁判进行统计学画像，避免预测判决干扰法官独立审判。

六、结论

智慧司法的法理反思从本体论、方法论和技术视角分析人工智能赋能法律实践中的问题。法理反思不是为限制智慧司法，而是探究问题背后的深层次原因，启发找到解决问题的思路和方案。本体论视角下，法理反思在于调和人工智能与传统法律体系和制度的紧张关系，减少冲突和不协调。在方法论视角下，法理反思应警惕人工智能对传统法律方法的功能替代，吸收传统法律方法的优点，尤其是裁判方法的精华，引导智慧司法设计理念践行“公正、效益、权威、为民”等多维司法价值，实现均衡发展。技术视角下，法理反思应正视人工智能的技术缺陷，使得智慧司法理解法理，遵循司法规律，满足法律实践的需求，使之与法律人的思维和方法相适应，推动人工智能与法律的深度融合。法理反思为智慧司法的理论体系构筑了“反向基础”，也为后续建立必要的规范体系提供了法理依据。未来，智慧司法之法理探讨将随着科学技术的迭代和升级不断深入，随着混合人工智能、可解释人工智能、脑机融合、人机协同、量子信息等更前沿技术的应用，法律融合人工智能将产生新的实践问题，也必将激起新的法理反思。

END

本文发表于《政治与法律》2021年第8期

本文作者：魏斌

本文编辑：吴芮

本文审阅：涂懿敏

（限于篇幅，本文注释均已省略）

（本文观点和内容与本公众号无关）

刑讯逼供、管辖异议，唐山杨立国涉黑案争议

大瓜！找工作太难了：私募大佬白嫖95后小姐姐事件刷屏！

深度 |台积电断供大陆芯片，任正非罕见感谢特朗普，美霸权摇摇欲坠

福建一地公示！1989年出生的她，拟提任正处

马斯克：不新生毋宁死！

魏斌 | 智慧司法的法理反思与应对

您可能也对以下帖子感兴趣

刑讯逼供、管辖异议，唐山杨立国涉黑案争议

大瓜！找工作太难了：私募大佬白嫖95后小姐姐事件刷屏！

深度 |台积电断供大陆芯片，任正非罕见感谢特朗普，美霸权摇摇欲坠

福建一地公示！1989年出生的她，拟提任正处

马斯克：不新生毋宁死！

生成图片，分享到微信朋友圈

魏斌 | 智慧司法的法理反思与应对

您可能也对以下帖子感兴趣