左卫民 | 从通用化走向专门化：反思中国司法人工智能的运用

法学论坛 2021-09-10

左卫民

（四川大学法学院教授、博士生导师）

摘要：随着人工智能技术在司法领域的应用，相关研究的热度持续高涨，但仍需要探讨的是人工智能在司法实践中运用的实际情况:包括何种人工智能发挥了作用、作用何在以及为何会在有些方面产生效果而其它方面又效果不彰。总体而言，人工智能在中国司法实践中取得了一定的成效，主要体现在警务活动与司法辅助性活动中，但仍难称理想。小范围的成功是源于成熟通用人工智能技术的普适性适用，而大部分司法人工智能产品难以发挥作用是由于未结合专门司法需求展开，所投入的资金与人才资源远远不足。未来应当降低对于司法人工智能的盲目期待，将研发重心从通用领域转向司法专用领域，转变司法人工智能的投入模式，大力培养既懂法律又懂技术的专门化、复合型人才。关键词：法律人工智能；司法人工智能；司法；通用化；专门化

《法学论坛》2020年第2期（第35卷，总第188期）

目次
一、个别开花：司法人工智能的运用现状二、何以如此：通用化的成熟与专门化的缺失三、未来展望：从通用化走向专门化

　引言

　　近年来，随着大数据、人工智能技术的兴起与发展，人类社会仿佛一夜之间进入了一个崭新的“智能纪元”，中国法律界似乎也紧紧跟上了这股人工智能风潮。2019年世界互联网法治论坛，笔者与来自多国的司法官员、专家学者就司法（法律）人工智能的应用问题进行交流时，亲身感受了这场人工智能技术风暴如何席卷全球法律界。与此相关，司法（法律）人工智能成为近两年中国法学理论界和实务界俏热一时的话题。一方面，理论界围绕人工智能这一新兴事物展开一场新兴技术与传统理论的大讨论。例如人工智能对既有法学理论带来的问题与挑战、人工智能运用中产生的信息公开和透明化等法律问题、人工智能在法律领域的运用等现实问题。另一方面，实务界也迎上了这股风潮，甚至在某种程度上走在了理论界的前头。在中共十九大报告、国务院政府工作报告以及《新一代人工智能发展规划》等中央有关文件的支持下，智慧警务、智慧检务、智慧法院等规划方案纷纷出台，在司法人工智能的探索之路上跃马扬鞭。但是，话语的轰轰烈烈并不等同于实践的有效展开，况且，这种热闹背后也许隐含的是司法人工智能研究的空泛化、泡沫化。我们似乎应当警惕逐利者迅速涌入又迅速抽身离去后的一地鸡毛。笔者认为，传统上保持审慎、理性的法律行业更需要克制，应当对司法人工智能的现状有足够清醒、客观的评估。

一、个别开花：司法人工智能的运用现状

　　纵观运用实践，笔者的整体看法是：到目前为止，司法人工智能在实践中取得了一定成效，但其运用现状仍难称理想，至少大部分的实际运用并未达到开发者或使用者先前所期待的功效，故而只能被称作个别开花”。应当肯定的是，司法人工智能目前已取得一定效果。这种成效主要集中在两个领域：

　　第一是警务活动中较好运用。典型运用如人脸识别技术，被广泛布置于机场、车站、广场等人员密集区域，能自动捕获、抓取动态人脸图像，并与公安机关数据库中的图像进行比对、核实。其已在公安机关的侦查活动中发挥重要作用，使演唱会上抓获逃犯等新闻频登头条，成为公安机关追捕逃犯的得力助手。尽管人脸识别技术引发了一些隐私权方面的争议，但应用实效毋庸置疑，其在实践中的运用也是相当广泛。

　　第二是司法辅助活动中的相对有限运用。典型运用如“智慧法院”建设中推出的庭审智能语音识别、电子卷宗生成、类案推送、量刑辅助、法律问答机器人等等，这些运用似乎在某种程度上满足了当事人的需求，减轻了法官的工作量。同时在司法活动中也开始发挥提高效率、节约司法资源的作用，但其效果似乎相当有限，在司法实践中并未如预期般普遍运用。更重要的是，其中一部分技术虽被冠以“智能”的称谓，但其是否属于真正意义上的人工智能可能还存有争议，尤其是其是否体现出类人类一般的自主思考能力这一人工智能最为核心的“拟人性”特征更值得商榷。具体而言，在以下运用实例中有所反映：

　　其一，电子卷宗生成技术、网上办案平台、在线庭审等技术，其核心仍是一种电子化的信息处理方式，旨在实现法院办案方式由纸质向电子、由线下向线上的转变，其间并未体现计算机自主思考后进行加工的“额外知识”，而仍是需要由人进行操作的信息化方式（尽管这种操作手段可能进行了更新）。简言之，其运用模式是“人+电子化”，或者说是数字化、在线化。

　　其二，庭审语音识别、卷宗OCR识别，其属于典型的感知智能技术，在智能化程度上相较于传统录音、扫描等信息技术等有了相当程度的提升，但是其并非专门针对司法活动开发的人工智能，未能将通用的感知智能技术转换、发展为专用的司法感知智能技术，从而也未能解决复杂的法律场景难题（如法庭审判中多方互动及争论场景），所以在当下的审判实践中也未获得普遍运用。

　　其三，类案推送系统，其在主动推送类案层面看似具备了些许智能化的因素，但在实践中的运用却并不如预期般有效。一方面，开发群体过多导致类案标准混乱，除了最高法院开发的类案推送系统，多个地区的高级法院也开发了类似的系统，而各自的系统又分别由不同的法律科技公司设计、研发，从而使得检索结果不一致。另一方面，智能化程度有限使得检索推送案例不精确、案由覆盖率不足，无法解决法官实际需要。

　　其四，法律问答机器人。其在外观上似乎更近似一般认知中的人工智能想象，但就实际运用而言，所谓的问答，大多要以点击相应问题的固定模式或采用相对专业的提问模式进行。这是由于法律问答机器人的信息库相对封闭，无法自主产生额外信息，所以如当事人与法官面对面沟通般不固定、自如的问答模式无法完全实现，其实质上更类似于一台诉讼信息汇总的计算机。这种信息在信息爆炸、网络技术高度发达的当下，通过查询书籍、网络等方式同样不难获取，所以问答机器人只是便捷程度的有限提升，而非理念、方式的全面升级。

　　虽然这些运用集中于较浅层面，但探索的正面意义仍值得肯定。不过在肯定之余更需警醒的是，无论是在警务活动还是司法辅助性活动中，这种运用只能算作基础性的浅层探索，当下的司法人工智能整体上仍然是一种浅度人工智能运用，与理想中的人工智能尚存很大差距，所以，当前司法人工智能还有待大幅提升。同时，由于发展的不成熟，市场上还充斥着大量的“伪人工智能”，有学者便指出当下人工智能的自主性与机械自动化的混淆现象，将一些典型的自动化技术与人工智能技术混为一谈。这种混淆，可能源于法律界对人工智能技术的陌生与误解，也可能是由于追逐学术热点而主动强加的概念附会，对于后者，尤需警醒。

　　综上所述，就现状而言，当前司法人工智能的实际运用在深度和广度上都相当有限。在深度上，目前司法人工智能在实践中仍限于充当辅助法律人决策的角色，仅适宜作为法官裁判的助手而不能完全替代法官。从提高工作效率的角度而言，其可能更适宜于处理技术性、辅助性的工作。在广度上，司法人工智能被集中运用在警务活动及司法活动的少部分环节，在通用技术相当成熟的如人脸识别、语音转换领域比较成功。同时，在技术要求不特别高、已有适当投入并成功克服难题的领域（如数据的电子化），其运用也相对成功。但在关涉效率与公正等司法决策的真正疑难问题上，司法人工智能的应用仍是浅尝辄止，存在应用不多、不具体、实效不够等问题。

二、何以如此：通用化的成熟与专门化的缺失

　　何以出现上述小范围开花、大范围失意的鲜明对比？笔者以为，主要有以下几点因素。

　　其一，司法人工智能小范围的成功是源于成熟人工智能技术的普适性适用。目前发挥较大作用的司法人工智能运用如人脸识别技术、语音识别等感知智能技术，一方面均是先在商用、民用领域研发并使用的通用技术，这些技术经过长期的广泛实践与反复改进已趋于完善。另一方面，这些技术在司法活动中的运用场景与普通的商用、民用的运用场景在本质上是一致的，其实质是通用技术在司法领域的直接复制，例如警务活动中使用人脸识别追逃与商业公司使用人脸识别抓取数据依赖同一种技术逻辑。再如语音识别（转换）技术，无论是在庭审中使用，抑或是在商务会谈、学术会议中使用，虽然运用场景有所不同，其核心需求均是将语音转换为文字，即使由于司法活动（尤其是庭审活动）的特殊性，导致语音的识别具有一些额外的要求，但仅仅是技术难度上的区别而非技术逻辑上的相异。因此归根结底，司法人工智能的部分成功运用是由于成熟技术本身的无障碍，而对于其它司法活动而言，其技术需求便不仅限于这些通用技术，而是需要为司法运用“定制”一套专门技术，其间必然涉及供需双方的有效沟通、人工智能知识与司法知识的深度融合以及研发技术的高度成熟，其开发无疑是“另起炉灶”且难度往往高于通用技术。所以，当没有成熟的“专用化”的人工智能技术应对司法活动的大部分问题时，目前小范围开花的尴尬局面也就顺理成章。

　　二是司法人工智能产品的现有技术未能克服司法实践难题，也未适应司法规律与特征。技术开发没有真正掌握司法活动的“痛点”，而是将人工智能技术往司法活动上“硬套”，其结果是在一些外围式、边缘式活动中有所成效，但在主要、核心的活动中却难以配套。当然，也应当承认人工智能技术与司法活动的有效结合存在一定客观困难。司法活动有其独特性，是凝结了法律人智慧的判断性活动，因此人工智能要想在司法活动中真正发挥作用，需要理解其特殊性，并不断模拟和练习法律人的思维。而这种法律人思维的模拟并非易事：一是需要足够的模拟基础来源即数据。目前，我国的司法数据公开取得了长足的进步，裁判文书网成为了全球最大的官方司法判决书公开网站，尽管裁判文书网上传文书数目巨大，但是却并不能刻画出审判活动的“冰山全貌”，因为仍有数量众多的文书未上传，在已上传的文书中，排除文书信息不真实、不客观的干扰，想要对其进行有效的数据模拟，仍需经过数据清洗、数据标注等多重加工步骤。二是人工智能需要有适配司法领域的算法。相较于通用领域，司法领域尤其强调逻辑性和论证说理。在此影响下，司法领域人工智能算法的把握力与可解释性就显得更为重要。以量刑辅助的人工智能研发为例，在模型训练过程中，研发主体可以依托神经网络、决策树等不同算法，每种算法的准确性和可解释性也有所不同。在司法人工智能的开发中，除了考虑算法结果的准确性外，选择具有可解释性的算法并进行领域优化就至关重要。

　　三是所投入的资金人才资源不足与投入模式不佳。应当承认的是对于司法人工智能的投入，其绝对数量相较于其它人文社科已属不少并且仍在逐步增加之中，只是相对于人工智能领域所需要的投入量而言，目前的投入仍显得相当有限。一方面是国家层面的投入有限，由于法律归属于传统的人文社科，其研究经费投入本身难以与需要搭建实验室的理工科相提并论。但是，司法人工智能显然已经难以再归属到传统意义上的人文社科当中，对其研究也需要更多的资金投入，甚至也需要建设法律人工智能研发的“实验室。”因此，从国家层面而言，需要革新将法学一概视为传统人文社科的视域，从国家研究经费方面给予司法人工智能领域更多的资金和人才支持。另一方面，或许更为重要的是社会层面的投入亦远远不够，当然，这或许与司法领域并非具有高回报率有关，就连号称人工智能第一股并且与法律行业合作密切的公司，其部分利润可能也源于政府补贴。科技公司不愿投入过多资源开发仅在法律领域适用而无法普遍使用的产品，而法律领域的消费者又“购买力”有限，往往无法独自承担定制法律专用人工智能产品高昂的研发成本。因此，也就形成了目前司法人工智能开发多是某些地区甚至某个司法机关与科技公司单独合作的“小打小闹”局面，这样缺乏统一规划、个别化的投入模式使得投入产出率不高，其结果往往是投入的资金和人力未能得到充分使用，产出的人工智能产品也无法有效运用。

三、未来展望：从通用化走向专门化

　　针对上述问题，未来的司法人工智能到底路在何方？笔者以为可从以下方面努力：

　　第一，降低对司法人工智能的盲目期待。尽管人工智能技术的发展一次次打破人类的传统技术认知界限，但也要警惕人工智能的万能论，即无论在何种领域，人工智能都能完美替代人类。司法活动尤其是审判活动应当如此吗？近年来，智慧司法建设如火如荼展开，人工智能似乎大有替代法律人之势。但是细想之下，司法活动本身便凝聚着人类的智慧，即使用AI法官来替代人类法官的愿景美好，但这种期待一方面高估了当下人工智能的发展程度--即使在人工智能技术最为领先的美国也未研制出能在审判活动中完全替代人类法官的人工智能产品。另一方面，也低估了人类法官在司法活动中独特的审判智慧，审判活动从古代神明裁判发展到当下的证据裁判，是一种非理性到理性的演变过程，这个过程中无疑彰显着诸多审判智慧，即哈耶克所谓“从长期审判实践的经验和丰富的观察中获得的可靠而周密的判断力和裁决力”。在古代中国，便出现了五听断狱的审判技巧，即通过表情、气色、声音等方面来综合定案。再如将审判和调解相结合的马锡五审判方式，其对人情事理的精到把握是冰冷屏幕中的AI法官所不具备的。有研究者甚至认为“人工智能对审判经验的吸收和设计者对经验的标准化和规范化总结仅是审判所需经验的很小一部分，人工智能仅是对智性部分模仿的初级阶段。”因此，“我们应当充分认识到法律人工智能的运用是一个长期性、艰巨性的过程，并将面临艰巨挑战。热闹的现象并不表明中国已经进入了法律人工智能时代，更不意味着市场已经有了成熟的法律人工智能产品。”

　　第二，研发重心从通用领域转向司法专用领域。当下通用领域的人工智能应用已经取得了一定的进展，但需要有清醒认知的是，在司法领域中通用技术的使用似乎已经快要触及“瓶颈”，其技术已经难以满足司法的独特性需求。因此，对于今后司法人工智能技术的发展方向，应当明确的是，要立足于司法活动的专业特性，尤其是要着眼于审判等核心活动的技术需求进行深耕，挖掘司法实践对于人工智能的真正需求点。否则，即便继续运用通用技术展开外围性研发，但始终无法触及司法活动的核心需求，其收益将会边际递减，也慢慢消耗着司法实践者对其的期待和耐心。

　　第三，司法人工智能的投入从地方、部门主要参与转为统一规划，投入重点从通用技术转向司法专门领域。毋庸讳言的是，司法人工智能的开发需要成规模的资金投入，业内俗语“有多少人工便有多少智能”便道出了其中的奥秘，这种投入的量级并非过往司法机关进行技术设备升级的投入可以相提并论，而地方司法机关如法院、检察院的资金源于财政给付，任何一项支出均需要制作详细的预算，进行司法人工智能研发所需要的大规模投入显然是有限财政投入所难以独支的。因此，不从投入来源考虑而盲目要求加大投入无疑是隔靴搔痒。笔者认为，继续加大对于司法人工智能的投入需要从根本上进行投入模式的转变：从目前的地方、部门参与转变为高层统一规划，并且资源投入的重点要向专门化的司法人工智能倾斜。虽然地方、部门投入具有充分利用本地、部门资源、针对本地、部门需求开发等优势，但其弊端也显而易见。一是缺乏统一的技术标准。这导致开发的司法人工智能适用范围极为有限，甚至只能在本院适用，大大限缩了技术的广泛性。全国各地的司法人工智能到处开花，却又花开各异。二是投入的规模有限。以当下司法人工智能领域的研发经费为例，尽管数千万的项目经费在法律领域已属罕见，但与人工智能研发所需的巨额投入相比仍是杯水车薪。全球知名科技公司对AI的研发投入更是以十亿甚至百亿计。这种投入的规模显然是地方财政所无法承担的，而投入资金的有限性则阻碍了技术的成熟程度，最后研发出的司法人工智能产品往往由于技术的缺陷而难以在实践中运用。三是投入的持续性不足。单个司法机关的独立投入可能难以长期持续，并且希冀于中短期内能有相应“成果”，而这可能与高科技研发的规律背道而驰。科技公司对于AI的研发投入往往是“烧钱”进行试错，然而地方、部门一旦长时间无法研发出产品，可能难以承担如此高昂的成本。显然来自于顶层设计的统一规划具有相当程度的优势：首先，司法权本质是一种中央事权，将司法领域运用人工智能技术的主导权牢牢抓在顶层手中是一种最为稳妥的方式。其次，对于司法人工智能技术运用的规划更具整体性、统一性和权威性。相较各地司法机关的单兵作战，来源于顶层设计的统一规划无疑会使法律人工智能运用的开发更具目的性与前瞻性，某种程度上降低了地方部门各自为政的试错率。再次，来自于顶层设计的主导能提供更大规模、持续性的开发投入，这不仅包括资金投入，也包括政策支持、人员投入。

　　第四，实现研究范式转向实证研究。当下司法人工智能是理论界的研究热题，但是对于这道热题的回应却是“新瓶装旧酒”，中国法学理论界对于司法人工智能的研究路径仍局限在话语层面反复讨论司法人工智能的可能性、风险性等通用、概括的问题，而对“司法人工智能具体运用”提之甚少。实际上，理论界对于实际运用问题的关注，也会在一定程度上推动司法人工智能的实践运用。以统计学为重要根基的人工智能，似乎天然便与传统法学难以“相融”。传统的法学以理论分析见长，对于数理统计分析涉及甚少。近年来，在一批学者的倡导之下，“以数据说话”的实证研究方法在法学领域开始逐步有了一席之地，但仍属小众。而在域外，例如在美国法学界，实证研究已经成为主流研究范式。基于长期实证研究训练得以成就的统计分析能力，又成为与人工智能界跨界合作的关键性助手。于是我们得见域外的司法人工智能产品研发中总是伴随着理论界的身影。例如美国法律人工智能平台Law Geex与斯坦福大学、杜克大学法学院和南加州大学的法学院教授开展合作，设计人工智能程序就四小时审查五项保密协议与20名有经验的人类律师展开竞争，主要考察如何就仲裁、关系保密和赔偿的准确界定问题。康奈尔大学、哈佛大学、斯坦福大学等高校的一批学者利用决策树、迭代算法等机器学习算法，分析了美国法院15万余份重罪案件的承办法官所做的保释或假释决定，研究美国法官在给予嫌疑人保释或假释决定时究竟考虑了何种因素。以上研究均具备一个共通性：对数据的收集、整理与分析、运用，并且都着眼于司法人工智能的某一专门领域，而这恰恰是实证研究的擅长之地。平心而论，中国裁判文书网给广大的中国法律研究者提供了一个研究富矿，然而大多数人却对这片研究的“蓝海”视若无睹，却又希望在司法人工智能的研究中占得一席之地，不得不说有本末倒置之嫌。此外，法学研究紧紧围绕事实认定与法律适用中的智能化发展方向也是拉动司法实践发展和回应司法需求的重要一环。例如，当前如何进一步强化人工智能背景下的证据与证明理论研究就是十分重要的命题。

　　第五，大力培养既懂法律又懂技术的专门化、复合型人才。针对司法活动核心需求的研发，必须由司法人员以及其他法律从业人员与技术人员的共同、深度合作，而非技术人员不懂需求、司法人员不懂技术的自说自话式合作。但由于既往教育体制的因素，造成多数法律人对于数学、统计学等学科处于一种高度疏离状态，无法与技术人员在技术层面进行充分的对话、沟通，这就造成了在司法人工智能设计中法律人的有限参与，这种参与的有限性也影响了司法人工智能产品效果的发挥。为了弥合这种司法人工智能产品设计生产中的“沟通”难题，一方面当下的团队参与模式当然应该继续推行，因为既擅长人工智能技术（计算机科学、统计学）又精通法律知识的双栖人才的培养是需要长时间、多投入的坚持，绝非一朝一夕可完成。另一方面，需要逐步提高法律人在司法人工智能产品中的参与度、重要性，根本上的解决之道在于培养法律和技术的复合型人才，这就涉及培养体制层面的变革，需要彻底扭转当前将法学视为纯粹人文社科的旧观念，将交叉学科培养理念引入到法学培养体系当中。已有院校对此展开尝试，例如西南政法大学成立人工智能法学院，清华大学法学院设立计算法学研究生项目。笔者也强调并一直努力践行引进及加强对于数学、统计学、计算机科学等与人工智能密切相关的专业到法学教学培养体系中，通过引入统计学、计算机科学的人才并开设法律大数据、法律人工智能、计算机等相关课程，使得法律人在接触法律之初便能同时培养多学科尤其是数据思维。

END

作者：左卫民(1964-)，男，四川成都人，法学博士，四川大学法学院教授、博士生导师，主要研究方向：诉讼法学。来源：《法学论坛》2020年第2期

分享本文：点击界面右上角按钮，在弹出框中选择“发送给朋友”或者“分享到朋友圈”本刊微信号：FXLT2019本刊微信二维码：

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

吴京捧红的白眼狼，爆红后却反咬一口，如今落魄到无戏可拍

左卫民 | 从通用化走向专门化：反思中国司法人工智能的运用

您可能也对以下帖子感兴趣

大摩宏观策略谈：2025中美变局展望

假设，你遇到麦琳怎么办？

董事长两口子不干了，至暗时刻谁是白衣骑士

2024年心理咨询师报名通道开启！可考心理证书，无需辞职，名额有限，11月30日截止报名！！！

吴京捧红的白眼狼，爆红后却反咬一口，如今落魄到无戏可拍

生成图片，分享到微信朋友圈

左卫民 | 从通用化走向专门化：反思中国司法人工智能的运用

您可能也对以下帖子感兴趣