左卫民:如何通过人工智能实现类案类判? | 中法评
“没有信息化就没有现代化”,司法信息化建设是中国走向司法现代化的最新方向,而“智慧司法”建设则是司法信息化建设的关键所在。
如何深度融合法学知识与科学技术,将科学技术驱动的司法现代化建设与中国特色社会主义司法制度的发展相结合,同时破除绝对技术主义的误区,借助司法大数据突破司法现代化过程中的困境与悖论,有力推动司法改革,实质提升司法公开、诉讼服务、案件审判、判决执行和司法管理的信息化水平,就成为当下一个重大研究课题。
《中国法律评论》2018年第2期专论栏目“大数据与人工智能的司法实践”,由左卫民老师主持,特邀赵志刚、陈增宝、王禄生、李本(Benjamin L. Liebman)五位来自国内外理论界和实务界的专家,从不同视角分析和探讨新形势下司法大数据与人工智能在法院、检察院的应用情况,文章既关注相关应用的实际效果,又对其进行学术凝练与理论反思,力求为大数据与人工智能的司法应用提供方向。
我们期待同人的关注与回应,希望相关论述能够有助于推进理论研究的进一步展开。
左卫民
四川大学法学院教授,院长
国家2011协同创新计划"司法文明协同创新中心”研究人员
法院现有的类案类判系统存在检索推送案例不精确、推送案例的范围过窄、来源不明、层级不清、类案类判实践差异显著等诸多问题。这背后有技术无突破、数据不全面、制度不健全的现实原因,同时就司法逻辑层面而言,类案类判能否以及在何种程度上取代司法解释与指导性案例的地位值得怀疑与考量。
因此,需要思考如何充分捏合算法与法律,建立真正的法律案例大数据库。同时,加强“类案”本身的建设与管理,确立国家层面类案类判的管理机制与标准流程,建立一套类案类判、类案推送、类案检索的国家标准。
目次
引言
一、对当前类案类判技术实践的简要考察
二、当前类案类判技术实践问题的原因分析
三、类案类判背后的司法逻辑之争
四、类案类判将向何处发展?
本文首发于《中国法律评论》2018年第2期专论栏目(第26—32页),原文10000余字,为阅读方便,略去脚注,如需引用,请点此购刊,参阅原文。
引言
在法律大数据与人工智能技术正在助力掀起的中国司法“技术革命”中,通过人工智能实现类案类判已被视作贴近一线法官需要的重要内容。
类案类判意味着相同或者类似案件能够得到相同或类似判决结果,其机制在于通过被动或主动的方式,为法官寻找与手头正在处理案件相似甚至相同的案件,以达到启发、拓展法官判决思路、帮助法官正确裁判之目的。整体上,类案类判不仅可以为疑难案件提供新的解决途径,也能够统一司法裁判尺度,避免司法裁判不公。
特别是在司法责任制改革背景下,伴随着审判权力下沉至一线法官,类案类判有望成为控制裁判偏离度的“纠偏机制”,管控法官的办案质量。在此意义上,类案类判可以成为一种新型的司法控制手段与审判管理技术。可以说,类案类判是当前法律大数据与人工智能在司法领域最为热门的一项实践尝试,司法实务部门对类案类判抱持强烈的需求与期待。
借助人工智能的类案类判尽管在话语层面热议,但在实践中的运用情况宄竟如何,有何种问题?中国的类案类判前景如何?
对于上述问题,目前尚缺乏充分的学术探讨与清晰的答案。有鉴于此,考察其在中国司法实践中的运用,并在此基础上展开理论阐释显得尤为必要。
对当前类案类判技术实践
的简要考察
在中央层面,2018年1月5日,最高人民法院正式上线运行了“类案智能推送系统”,期冀以类案的快速查询和智能推送,来辅助量刑决策、规范裁判尺度、统一法律适用,并进一步提升审判质效,促进司法为民、公正司法。
据介绍,该系统从“案件性质、案情特征、争议焦点、法律适用”四个方面,覆盖全部1330个案由,通过机器自动学习构建出超过10万个维度的特征体系;在精准度方面,做到全案由文书数据整体搜索推送准确率达到63.7%,民事、刑事Top10类型的准确率达到85.5%,其中检索全案由整体准确率61.6%,热门类型案由整体准确率81.8%。需要指出的是,该系统目前仅在最高院、省高院试点,尚未正式在全国范围内全面铺开。
在地方层面,各省法院先后分别开发各自的类案类判系统。
例如,安徽省高院与安徽富驰信息技术有限公司合作开展了“类案指引项目”,该项目旨在“以大数据挖掘分析为前提”开展同类案件分析研究,为法官提供“多维度、多案件的分析场景”,“实现了涵盖离婚纠纷、民间借贷纠纷、机动车交通事故责任纠纷、盗窃罪、诈骗罪以及交通肇事罪六大案由的软件试用版功能设计与开发”。
又如,重庆市江北区法院自2017年4月运行了金融案件“类案智能专审平台”,利用该平台“自动向法官推送相似度较高的案例,并对法官拟做出的裁判进行智能评析”。
再如,贵州省高院“以大数据挖掘分析为前提,建立类案裁判标准数据库,建立类案及关联案件强制检索机制,为法官提供多维度、多层面的分析场景,通过自动检索、类案推送、裁判文书语义分析、对比分析等大数据方法避免类案非类判现象”。
那么,实践中普遍、真实的情况究竟如何呢?
近日,笔者实地考察了S省有关法院的类案类判技术实践,同时对若干省市特别J省类案类判系统相关设计参与人员进行了访谈,发现类案类判技术在实践中主要有两种形态。
第一种是自动推送。所谓自动推送,是指技术人员先依托裁判文书网上的司法案例建立数据库,在此基础上对相关案例进行人工“贴标签”,将每个具体的司法案例结构化为数十个法律标签。
例如在刑事案件中,将主动投案交代罪行的行为标注为“自首”标签,将多次犯罪的行为标注为“累犯”标签。之后,将电子化后的起诉书接入该系统,系统将自动生成该起诉书的一整套标签,再将这些标签与系统中的标签进行对比,最终推送标签最为类似或相近的案例。
第二种是主动搜索。所谓主动搜索,是指当法官对系统自动推送的案例不满意时,自主选取系统中事先罗列出的法律标签,并且在此基础上输入关键词,通过这一整套的菜单式标签选取与自主搜索,在数据库中比对类似标签,最终获取类案。
详言之,法官可先在系统事先设置的各种刑事案件罪名栏或各类民事案件案由栏中自由选取与手头正在裁判的案件类似的罪名或案由,然后再在搜索栏中输入与本案相关的关键词,并且为了缩小搜索范围,增强搜索精度,法官还可以选择关键词在裁判文书中出现的位置,例如,可将搜索范围限定在裁判文书的“法院认为”部分。
在点击“搜索”按钮后,系统会为法官推送三种案例类型,分别是“典型案例”“本院及上级法院案例”和“其他案例”,每种案例类型的数量在十个以下。
笔者通过亲自搜索发现,“典型案例”有些是高级法院的案例,有些则来源不明,笔者推测或许是公报案例,其仅显示了裁判要点、判决结果和推荐意见。“本院及上级法院案例”主要是该地及其上级法院近年来的案例,但时间上往往集中于某些具体的年份,而非大跨度的时间范围。
另外,上级法院的案例也较为稀少。“其他案例”则十分庞杂,全国各地、各审级法院的类似案例均列其中,且集中于特定年份以及特定省份。
那么类案类判系统的效果如何呢?
笔者发现,类案类判系统在司法实践中并未受到法官们的普遍欢迎,许多地方法院或者没有建立起类案类判系统,或者即使建立了,所推送的类案并不符合法官的要求,而法官通过法院内部智能辅助系统主动搜索案例也无法获得理想的可参考的案例,许多法官甚至需要求诸一些商业公司开发的案例检索系统。
在访谈过程中,有法院院长坦言,现阶段使用法律智能科技手段的法官数量不多,且主要集中于年轻法官群体,上了年纪的法官接受法律新科技手段的意愿普遍不强。在愿意使用智能办案系统的法官群体中,许多也不是冲着类案类判系统去的,在他们看来,类案类判系统显然不及“裁判文书自动生成工具”实用。
原因很简单,“裁判文书自动生成工具”能够自动、半自动地识别、提取起诉书、庭审笔录中的要素,自动生成裁判文书草稿的功能实实在在地减轻了法官的工作负担。
相比之下,现有类案类判系统对于复杂案件的类案推动准确性不够,而对于简单案件的类案推送往往并非基层法官痛点所在,由此降低了法官的用户体验与使用意愿。在调研中,许多法官即反映,类案类判系统对法官办案“帮助不大”“作用很小”。一些法官甚至坦言,“真正要用的时候还是要到外网用商业公司开发的案例检索系统去搜”。
可以说,当前类案类判在实践中的运用并不普遍,有限的实践也存在这样或那样的问题,归纳起来主要有以下几点:
其一,检索推送案例不精确,无法解决法官实际需要。
笔者在考察中发现,有些类案推送系统在推送案例时对案例的数量进行了一定的限定(如10个),但这些案例并未做到“同案”,有时甚至连“类案”的标准也未达到。而在主动搜索时,法官往往会搜索出上万个司法案例,尽管改进检索方法可以将案例数量限缩至百个以内,但法官需要参考的案例仍面临着过量的问题。如此一来,类案推送系统实际上并未很好地契合法官的办案需求。
事实上,在很多时候,困扰法官的仅仅是案件中的若干技术细节或法律难点。遇到这种情况,法官急切地想参考其他法官的判案思路与做法,至于案情是否类似、是否相同则是法官次要考虑的内容。
因此,仅仅通过大规模的法律标签比对去寻找类似的案件,即便标签相同,倘若在核心法律技术细节上没有获得法官预期的检索结果,对于法官而言,就没有类案的参考价值。就这个角度而言,现有的类案推送制度太过粗糙,无法解决业务核心难点。
其二,推送案例的范围过窄、来源不明、层级不清。
笔者发现,系统中的类案往往集中于若干年份,许多案例在某一年份大量涌现,在接下来的年份却销声匿迹。同时,法院的诉讼档案电子化进展迟缓,使系统无法推送未完成诉讼档案电子化年份之前的司法案例。
与此同时,类案类判系统所推送的案例在来源上没有清晰注明,许多案例只给出了裁判要点、评析,至于文书制作者是何人,基于何种立场与目的所作的评析也不甚明晰。
此外,当前类案类判系统所推送的案例既有判决书又有裁定书,一审法院所作的判决结果是否在二审过程中发生了变化,一审判决的效力是否仍然存在等均未予以标明,由此导致了检索结果混乱,检索案例的参考价值不确定。
其三,地方各自为政,类案类判实践差异显著。
当前,类案类判在地方各司法机关还存在系统不统一、检索结果不一致的问题。这主要体现在,各地类案类判系统分别由不同的法律科技公司设计、研发,并无统一的顶层规划与设计。各地法院的类案类判系统所提供的类案推送、搜索服务,千差万别。
当前类案类判技术实践问题
的原因分析
上文梳理了当前类案类判技术在司法实践中的运用情况,指出类案推送效果欠佳以及不适应法官需求等问题。在笔者看来,上述问题的出现,与当前的类案推送技术、类案检索范围以及支持类案类判的配套机制缺乏等紧密相关,具体而言:
1.技术无根本性突破
一方面,就自动推送式的类案推送技术而言,现有的技术尚难以准确识别出案件的核心区别点,尽管通过大量标签的匹配来寻找类案确实可以在一定程度上寻找到类案,但是由此产生的问题是推送的类案数量过多,法官无法甄别出具体哪个案件中包含了自己需要解决的法律难点,因此需要法官花费大量时间去逐一查看、分析所推送的案件。对法官而言,与其花费这么高的时间成本还不如直接询问其他经验丰富的法官或者查询相关法条和法律资料。
此外,由于现有的人工“贴标签”技术过于粗糙,对法律事实的归纳存在疏漏,很多法律细节未被标签化或未被准确地标签化。而类案推送系统是以大量标签化、结构化的法律数据为支撑的,需要大量的人力投入到基础性的“贴标签”工作中。
在中国现有的法律人工智能领域,我们既缺少海量翔实的标签化法律数据,也缺少既懂法律又懂技术的跨界人才,更缺少有意愿、有热情投身到这项繁杂、艰难却又意义深远的工作中去的年轻人。这就造成了法官对推送的案件“类似而无用”的认知与感受,进而导致其使用类案推送系统的意愿普遍偏低。
另一方面,就主动搜索式的类案推送技术而言,这一技术在性质上与谷歌、百度等搜索引擎所使用的技术差别不大,都是通过多个关键词叠加并一定程度上限定搜索范围的方法进行检索。在某种意义上,法院内部自主(联合)研发的智能辅助系统很多时候甚至无法比拟谷歌、百度等巨头所拥有的语义库,其在词向量算法方面的突破尚不及搜索引擎,由此导致检索结果的准确性、针对性偏低,无法实现类案的参照性、指导性功能。
2.数据不全面
要想让类案类判系统真正发挥作用,有赖于较大规模的裁判文书数据。然而遗憾的是,这在中国法院实践中尤为不足。
首先,从时间上看,直到2013年,最高人民法院才建立中国裁判文书网,构建裁判文书的统一集中上网渠道。在此之后,生效裁判文书才开始大量、集中上传至这一平台。在此之前,各级法院主要依托自身的门户网站选择性的公布部分裁判文书。
这就意味着,当前的类案类判事实上缺乏足够的、历史的“数据储备”。尽管可能会有人质疑,我们不是已经公布了二千多万份裁判文书吗?但需注意,这两千多万份裁判文书主要是近几年的,缺乏时间变量的检验,无法识别、提炼不同历史条件下相对稳定的司法经验,类案参考价值有限。因此,除非进行大规模的案卷诉讼资料(2013年之前的)电子化工作,否则类案类判所依托的数据库都将面临某种限制。
其次,从近年上传的文书情况看,也面临较大的“数据漏洞”,且存在明显的地域差异。例如,有研究指出,“经济发达省份的公开文书量不仅超过经济落后省份,公开比例也相对更高”,有些省份如浙江、陕西、安徽可以达到60%甚至70%以上,而有些省份如黑龙江、西藏要低于20%。
整个中国地方法院裁判数据在时间与结构上的“先天不足”,直接造就了类案类判系统在实践中的推进乏力。很难想象,一个只能推送特定时间段以及特定区域内案件的系统能够为法官裁判案件带来多大的帮助。也不难想象,当面对受时空限制且权威不足的类案推送结果时,法官会抱以怎样的失望。
3.制度不健全
2017年8月1日,最高人民法院印发《最高人民法院司法责任制实施意见(试行)》(以下简称《实施意见》)。《实施意见》指出:“承办法官在审理案件时,均应依托办案平台、档案系统、中国裁判文书网、法信、智审等,对本院已审结或正在审理的类案和关联案件进行全面检索,制作类案与关联案件检索报告。”
值得一提的是,该《实施意见》还对检索后的情形做了具体划分,当拟作出的裁判结果与之前的裁判尺度不同时,将会受到更严格的审查。
然而问题是,该《实施意见》并未对法官如何进行类案检索作出具体的规定,我们无法确知类案检索的范围、层级与效力。
首先,类案检索缺乏有效的时间指引,是十年内的案件、五年内的案件抑或三年内的案件?在司法面临新情况、新类型案件不断涌现的背景下,缺乏时间范围规定的类案检索与推送制度显然不合时宜。
其次,类案检索在案件检索的地域范围上有所阙如。地方法院法官,是否要优先参考上级法院法官所作的判决?是否需要参考其他省份法院法官所作的判决?外省法院、同级法院的类似案件对正在办理的案件有何具体影响,是否应当遵从?
再次,《实施意见》并未明确类案检索的效力问题。例如,哪些法官判的案子属于质量高的案例?二审案件的质量就一定比一审案件的质量高吗?如果出现不同省市、不同审级法院在同一法律问题适用上的冲突,是否就一定以高审级法院的判决为准?谁来评价检索出来的案例的效力?
事实上,如果没有一整套的操作标准,那么法官所选择适用的案例可能只是迎合法官“胃口”的案例,而非真正的“类案”。如此一来,一些裁判质量不高的案例则会因为法官的固有前见而不当地进入法官的类案“篮子”,由此可能产生选择性适用检索案例的问题。
最后,案例检索缺少具体的操作规程。
何种情况法官可以寻求类案检索与推送,是否具有一定的条件、标准、案件性质、类型或范围的规定?
类案检索与推送是否应当是一种强制性的活动?
检索或推送后,法官是否还需要针对所参考适用的案例进行某种说明抑或回应,尤其当裁判结果与其他类案结果有所出入时?
应以何种方式回应,如何回应?
这些都有待司法解释的进一步明确与规范。
类案类判背后
的司法逻辑之争
事实上,类案类判所要解决的根本性问题,是中国法院长期存在的同案不同判或者类案不类判的问题。正如笔者在一项研究中曾指出的,“事实相同的案件在不同法院甚至同一个法院的不同法官中可能出现大相径庭的判决,由此导致的裁判不统一现象严重损害了法律权威,成为当代中国司法实践亟待解决的重要问题”。
例如,在某些刑事案件中,某些罪行在甲地仅作拘役处理,在乙地却会被科以有期徒刑。又如,在某些民事案件中,丙地法院会支持原告的诉讼请求,在丁地却会判决被告大获全胜。这其中的原因,固然有司法地方保护主义在作祟,当然也与审判技术、审判理念的地方性等密切相关。
长期以来,中国司法活动过程中主要通过制定司法解释或规范性文件、召开审判业务会议、组织法官培训等形式来弥补法律漏洞,以解决法律适用过程中所面临的司法难题,达到统一司法尺度、维护司法公正的目的。然而,上述措施仍未取得预期效果,中国法院在此基础上又开始研究设立案例指导制度。
《人民法院第二个五年改革纲要(2004—2008)》明确提出了要建立和完善案例指导制度。2010年4月,中央政法委协调公检法召开会议,要求推行案例指导制度并在年内公布一批指导性案例。11月,最高法院酝酿五年之久的《关于案例指导工作的规定》出台。2011年年底,最高法院发布了第一批指导性案例。
截至今天,最高法院共发布了17批92个指导案例。此外,还有各种如婚姻家庭纠纷、打击危害食品、药品安全违法犯罪、合同纠纷、未成年人审判等典型案例与数量众多的最高人民法院公报案例。
因此,在使用类案类判系统之前,我们首先应当思考以下问题:
其一,弥补法律漏洞,是通过司法案例还是规范性法律文件的形式为佳?
其二,现有的指导性案例、典型案例、公报案例满足了我们通过司法案例实现上述目的的需求了吗?有必要再使用在权威性上有所缺失,仅在细节性上更胜一筹的“类案”吗?
其三,如果使用“类案”,是使用一种指导性的“类案”,还是参考性的“类案”,有多大程度的指导和参考作用?
笔者认为,借助人工智能的类案类判或许不应被赋予过高的地位与期望,司法解释或最高法院的指导性案例应当并且可以肩负起统一司法裁判尺度、维护司法权威公正的使命。
在实践中,中国法院应当更多地通过司法解释、规范性法律文件的方式,同时辅以指导性案例、法院内部的法官会议以及极少数案件的审委会讨论的方式,解决类案类判的功能性障碍。或许更悲观一点,类案类判很难成为司法领域法律人工智能的下一个大突破口。
原因在于,类案类判系统所能够提供的司法产品质量有限。中国法院正在使用的类案类判系统所提供的“类案”更多的是一种质量不佳、缺乏权威、指导意义有限的案件。同时,类案被摆送至法官案头的过程不同于指导性案例的层层选拔,次次挑选,经历了明确的淘汰机制与程序。而类案仅经过了“搜索”“推送”工序,筛选太不严格,质量令人担忧。
由此出发,指导性案例、典型案例、公报案例之外的“类案”应该具有一定的“参考性”,但难以具有充分的指导性。法官或许应更多地注重类案裁判中的思维进路、思考方式,以拓宽自身在裁判中的思路,而不应被他人类案的裁判结果所禁锢,我们有时甚至可以适当鼓励法官开拓出与之前“类案”不同的裁判结果。
类案类判将向何处发展?
从小处看,人工智能辅助类案类判可以起到拓宽裁判思路,发散裁判思维的作用。从大处看,类案类判技术具有一定的发展前景,未来也可能成为确保司法统一适用,维护司法公正,避免司法不公的手段,还或许能成为一种新型司法判决质量控制机制。然而,基于目前在类案类判技术上有限的人、财、物力投入,匹配精度准、推送质量高、案例权威强的类案类判时代尚未到来。
笔者认为,需要从以下几个方面改进人工智能辅助的类案类判。
第一,系统的进步离不开技术的发展。
单纯依赖传统搜索方式的类案搜索在时间成本与效率成本上均受到了极大的限制,不仅数量过多,精度也不准确。因此,未来需要由案例搜索向案例推送转型,向法官精准推送其所需要的类案。这不仅依赖现有人工智能领域算法新的突破,更需要努力思考如何将人工智能领域先进的算法与法律行业的特性结合起来。
未来,类案类判尤其是类案推送有赖多种算法相结合的新尝试,而不是单一算法的突进。
第二,需要建立真正的法律案例大数据库。
没有法律案例数据,试图建立类案类判系统无疑是沙上堡垒。
笔者认为,首先,应当推进全国法院历史裁判档案的电子化、数据化工作,将能够信息化的裁判文书年份向前推进。其次,应当进一步加强裁判文书公开上网工作,让裁判文书尽可能上网公开。通过各种方式督促文书公开工作落后的地方法院转变思路,促成基础信息化工作的完成。
第三,加强“类案”本身的建设与管理。
其一,需要对类案的“标签化”“结构化”工作做进一步精细化的提升。在现有的环境下,有多少人工就有多少智能。我们需要更多的经验丰富的法律工作者加入基础性的标签数据工作中,需要具备深厚法律学识素养的法学专家为纷繁复杂的法律事实界定更为清晰明确的法律标签。唯有如此,类案推送系统方能在此基础上寻求到更佳的数据匹配。
其二,需要对类案系统的案例进行来源、级别与质量上的明确标示。首先,应当对每个案例库中的案例标示清楚来源,是指导性案例、公报案例、典型案例,还是一般的案例。案例的地域来源、来自何方,审判流程、是否上诉,效力状况、是否改判等情况应当标注明了。其次,应当参考性地标注案例的质量高低,供法官参考,当然,这部分工作需要法学研究者的联合投入。
第四,确立国家层面类案类判的管理机制与标准流程。
尽管最高法院业已开发了未来将在全国范围内铺开的“类案智能推送系统”,但现在仅在最高院与省一级法院试点,何时能够真正让全国的每位法官都能用上类案推送系统仍未明确。
因此,当务之急是统一全国范围内驳杂的类案类判系统,摆脱各地法院各开发一套系统、各自为战的局面,至少让法官在检索类案时获得相同的案例,而不是基于各地法院各自法律数据库基础上检索出的案件。如果摆在法官案头的所谓“类案”都不尽相同,意欲达成统一司法裁判尺度的目标更是难上加难。
第五,应当确立一套类案类判、类案推送、类案检索的国家标准。
笔者认为,可以从以下几个方面着手。
首先,明确类案检索机制的启动标准。笔者认为,不应设立强制性标准,是否检索类案应当以法官的实际办案需要为标准,设立一套强制性的标准只会人为增加法官的工作负担。
其次,通过技术手段明确案例库中案例的权威性高低与质量差别。
最后,要建立一套类案类判机制的记录和监督手段,如果法官通过类案系统发现手头正在裁判的案件结果与多数法院相似案件的判决结果出入太大,系统应当及时提醒、记录并跟踪,必要时可以集体讨论案件。
总之,通过人工智能的类案类判是我们对法律的美好憧憬与希冀,在法律人工智能与法律大数据飞速发展的今天,我们也似乎看到了实现这一夙愿的曙光。
然而路漫漫其修远兮,类案类判制度在中国正遭遇重重困难,这不仅有技术壁垒的原因,更多的是法官理念的原因。不止一次,我们听闻法官对法律科技手段的拒绝与排斥,除了产品用户体验不佳的原因,更多让人黯然神伤的说辞是法官认为现有的手段即可解决案件,没有必要使用自己不熟悉、可能用不好的新工具。
法律人工智能的发展壮大绝非一朝一夕之事,我们现阶段缺少的法律语料库、法律语义词,也许正是在法官每天的敲击键盘声中,当事人无数次庭上的语音转换过程中不断增长。使用法律科技工具,或许未来成功的希望难以确定,但不使用法律科技工具,将永远没有成功的希望。
感谢洪凌啸、叶燕杰、唐清宇、王禄生提出的修改意见,感谢有关调研法院领导与法官的协助。