查看原文
其他

刘品新 | 论大数据法律监督

Editor's Note

大数据法律监督和数字检察。

The following article is from 国家检察官学院学报 Author 学报编辑部

刘品新


中国人民大学法学院教授,中国人民大学刑事法律科学研究中心、未来法治研究院研究员



摘    要

 当下我国大数据法律监督实践存在成绩突出与问题徘徊并存的局面,学术界应当提炼标识性概念、建构原创性理论予以回应。以纵向沿革和横向比较的角度观之,相关探索呈现为由国家力量主导的现实样态,所处阶段展现回归、升级进而穿透事实查明层面的内在规律。此类法律监督以大数据及相关科技为支撑力,以多案监督为着力点,以促进国家、社会治理现代化为大目标;关键要素包括检察大数据、批量异常案件发现模型、人机耦合技战法等,重中之重则在于适用不同场景的模型研发。今后我国应当以实践持续改进为面向,出台配套提升国家治理大局的多案监督规则,并鼓励对成熟可用模型提级扩围。











 

 2021 年《中共中央关于加强新时代检察机关法律监督工作的意见》出台,为检察机关充分发挥法律监督职能提出了智能化建设的明确要求。随之全国检察机关启动检察大数据战略,强调以大数据赋能法律监督。截至目前,这一新事物已然成势,全国在平台建设、模式重塑与社会治理等方面取得了不俗成绩,以浙江省为代表之先行先试区形成了成熟示范。与此同时,有的地方检察机关认识不深,依然秉持等靠慢的观望态度;有的泛泛地给既有检察信息化产品改贴标签,做“换汤不换药”的应对;有的耗资研发花式“泡沫”产品,并不会产生任何实际效能;还有的单纯寄希望于法律监督模型或平台建设等技术创新,忽略了体制机制配套创新的并驱效应;更有主导者将大数据同法律监督的融合应用搞成“大杂烩”,勾勒出一幅华而不实的图景……面对实践中趋势与异象共现,法学界需要开展专门的理论建构,以正本清源助推实践改良,进而夯实国家、社会治理现代化的基础。

 理论的最基本要素是概念。关于概念在理论建构中的重要价值,牛津大学玛丽斯教授指出,“‘概念’在理论形成前就像一幅地图,能够让我们走入正确区域,并进行定位。”从世界范围来看,以美国为代表的西方国家并没有类似于我国法律监督的概念,其检察机关运用大数据办案主要限于“大数据起诉(Big Data Prosecution)”“预测性起诉(Predictive Prosecution)”等。在我国,除了检察系统广泛使用的“大数据赋能法律监督”外,常见的表述还有“大数据助力法律监督”“大数据+检察监督”“大数据司法监督”“大数据法律监督”“检察监督智能化”“法律监督数字化智能化”“ 数字赋能监督”等等。不难看出,它们系从本体、现象及策略等诸多角度进行表达。若就指代本体而言,“大数据法律监督”能够妥当地概括中国检察机关依托大数据等技术手段开展的新型法律监督,且符合用作法律概念的科学性、规范性要求。本文将用之作为核心关键词展开,另有特别注明的除外。全篇贯通大数据法律监督的由来、现实与未来,遵循从实践到理论的范式,提炼有中国特色的标识性概念,在此基础上给出相关制度与技术改进方案。











一、大数据法律监督的实践规律











(一)探索样态及基本特点

 大数据法律监督的当下探索代表了大数据技术驱动法律监督工作的新动向,用简单的公式表达就是“法律监督+ 大数据”。其中,法律监督指的是“专门的国家机关根据法律的授权,运用法律规定的手段对法律实施情况进行监察、督促并能产生法定效力的专门工作”,是我国检察机关依法履行宪法法律赋予职责的特殊监督;大数据可以被简单理解为“为决策问题提供服务的大数据集、大数据技术和大数据应用的总称”。以此框定之,大数据法律监督的相关探索在我国呈现为“由国家力量主导”的一种特殊样态。

 其一,该类探索获得国家战略顶层设计的指导。《中共中央关于加强新时代检察机关法律监督工作的意见》《法治中国建设规划(2020-2025)》均对大数据法律监督提出了原则要求。最高人民检察院还将落实国家大数据战略具体化为检察大数据战略。检察大数据战略虽无正式文本对外,但是经由全国检察机关数字检察工作会议等活动的传导,得到系统内的普遍认知和贯彻执行。2022年,为支持走在大数据运用前列的浙江省检察机关深耕探索,最高人民检察院专门发布《关于支持和服务保障浙江高质量发展建设共同富裕示范区的意见》,明确浙江检察“加快推进‘数字赋能监督,监督促进治理’的法律监督模式重塑变革”“深化检察大数据法律监督平台的建设和应用”等专门要求。

 其二,该类探索带有检察条线上下共频的特点。开展大数据法律监督探索的主力军是检察系统,四级机构采取的是上下一体化行动。2022年,最高人民检察院在多次高层级会议上精细部署,内设厅局在四大检察十大业务中全面试验。各地方检察机关纷纷将大数据法律监督列为“一把手工程”。部分先行地区更推出了“一域突破、全省共享”的经验做法,成为辖区内检察院“一个都不能少”的保障。

 透过现象看本质,大数据法律监督探索应当被理解为国家意志的表达。它源起于全国检察系统,辐射至相关部门、行业,成为促进国家、社会治理现代化的联合举动。例如,2018-2022 年浙江省仙居县人民检察院运用政府补(救)助大数据等办理一批专项监督案件(以下简称“实例1”),引起人社部等部委的重视并出台相关文件,推动全国范围内形成关于涉刑人员违规领取养老金保险问题的治理闭环;又如,2020 年最高人民检察院、最高人民法院达成《关于建立全国执行与法律监督工作平台进一步完善协作配合工作机制的意见》,表明检法两家协同启动以执行文书大数据开展法律监督的行动。

(二)演进阶段及内在规律

 如何理性看待我国经过广泛而深入探索催生的新事物——大数据法律监督?除了前述抽象判断外,还可以从纵向沿革和横向比较的角度透视内在规律。前者有助于回答大数据法律监督在科学技术走上法律舞台的历史中因循的规律,后者有助于回答大数据法律监督跟近似探索相比显现的规律。

 近代以来,世界范围内各种“法律+ 科技”探索成为一股股不断扩增的洪流。它们大体上有两种模式:其一始于20世纪初至今的证据科学涌现,如指纹、足迹、DNA鉴定、电子证据鉴定等大发展,反映的是物理学、化学、生物学、信息科学等自然科学知识促进了案件事实查明的科学化转型;其二始于21世纪初至今的智慧司法迸发,如基于大数据的类案推送、判决预测、人身危险性评测、机器定罪量刑等的迭代,主要是大数据、人工智能、移动互联网、云计算、区块链等新兴智慧科技牵引着全方位办案工作(特别是法律适用方面)的智能化转向。与之相配套,大数据法律监督虽然借助的是后一模式所主要依赖之大数据手段,但在促进司法改变方面显然偏向于前一模式。因为它是对案件事实查明方面的支撑,而非对法律适用方面或全方位办案工作的改造。从我国科技强检的发展历程窥之,亦可以得出同样结论。科技强检起步于世纪之交而历经迭代,大约自2016年始进入智慧检务建设阶段。智慧检务强调建构“全业务智慧办案、全要素智慧管理、全方位智慧服务、全领域智慧支撑”的总体架构,特色产品包括数据化的证据标准、智能辅助定罪、智能辅助量刑、类案推送、案件偏离度分析等。如今大数据法律监督探索的主阵地在于以科技赋能寻找纳入监督视野的异常案件,这属于有关案件事实查明的特定范畴。相较于典型的智慧检务运用,大数据法律监督在侧重点方面明显有回缩的迹象。不难发现,回归案件事实查明层面且聚焦于此,是大数据法律监督呈现的第一条规律。

 从技术源起上讲,当下的大数据法律监督不是任何意义上的“原创”或“独创”,而与国家治理领域早期出现的大数据运用实例有着显见的近缘关系。详言之,同大数据法律监督具有良好可比性的是检察机关开展的大数据侦查/调查、大数据证据运用等,以及公安机关的侦查信息化、纪检监察机关的大数据反腐等,它们的共同特点是使用大数据及相关技术为查明案件事实赋能。其中,检察机关的大数据法律监督在技术形态上最接近于纪检监察机关的大数据反腐。它们均强调进行数据碰撞、画像、挖掘等分析,各种技术方案在相互间近乎通用。从字面上看,大数据反腐也被称为纪检监察机关的“大数据监督”,故与大数据法律监督在技术上互通似乎理所当然。不过,它们间亦有细节上的差异:大数据反腐是要洞悉数据、找出“异常”之“人”,大数据法律监督则是要穿透数据、甄别“异常”之“案”;大数据反腐通常针对的是个别案件,大数据法律监督通常要锁定个案背后的系列案件。这两点差异反映的是两者技术方案的重心略有不同。作为后起之秀,大数据法律监督完全可以承继大数据反腐等的诸多现成技术并加以改进。不难发现,升级并穿透事实查明层面,是大数据法律监督呈现的第二条规律。

 为了形成直观的认识,不妨对比两起相似实例。前述实例1中,检察机关调取人社局基本养老金、医保局医保金结算、民政局低保、卫健局计划生育奖扶、残联残疾人两项补贴、退役军人事务局抚恤优待金、党政机关生活困难补助领取人和报销人的各种数据,合成为“政府补(救)助资金领取者信息”;同时采集来自裁判文书网、检察业务应用系统以及民政局、人社局相关系统的刑事裁判信息、民事裁判信息、死亡人员信息、基本养老金领取人员信息,合成为“不符合政府补(救)助资金领取者信息”。办案人员将两组信息进行数据碰撞分析,筛查出不符合条件人员,启动专项监督,与有关部门共同打造堵塞监管漏洞的长效机制。实例2是2015年黑龙江鹤岗市人民检察院运用社保大数据等办理的一起腐败案件。当时检察机关查处由冒领低保户困难补助金引发的渎职行为,主要采集了跨多部门的低保发放明细信息(社保数据)、LM公司(系当地一家超大集团)在职人员数据以及城镇人口的财政供养信息、车管信息、房产信息、企业注册资金大于5万的信息、死亡人员信息等社会数据,统一导入大型数据库系统中进行查询分析,以筛选出可疑违规领取人员。例如,查询时以“低保发放明细中人员+ 车管信息中有车辆”等条件进行社保数据及相关数据的碰撞,查实9000多人涉嫌违规领取低保金,查处社保领域渎职犯罪案件20件。对这两例进行比较,差异点仅在于所采集大数据的数量多寡和所使用技术方案的些微提升(见表1)。

 同实例2相比,实例1在技术上是同一路线的,在效果上有明显的进步。据报道,截至2022年3月,该项监督“办理行政公益诉讼案件623件1317人”,办理刑事检察监督案件、民事检察监督案件若干起,且发现政府补(救)助资金监管漏洞以促进诉源治理——“推动有关行政机关建章立制”。如此既查系列案、又促大治理,在效果上远远超越了既往仅查处个案的做法。应该说,达到这一效能是由内在规律所决定的,因为大数据法律监督已跃升到更高的事实查明层面。

 实例1与实例2绝非偶然的趋同事例,还有很多事例。例如,浙江省舟山市普陀区人民检察院、贵州省六盘水市人民检察院亦在运用社保数据,进行数据碰撞、发现冒领问题、开展法律监督、加强系统整治,表明更多检察院选取了同以往通过大数据查处渎职腐败的一样道路。又如,湖北省人民检察院、浙江省义乌市人民检察院、济南市槐荫区人民检察院等地推出的“政务数据云监督模型”“检察大数据法律监督平台”“行刑衔接闭环管理数字应用平台”等法律监督模型,实际上均可视为既往行政执法与刑事司法衔接软件的升级新版。

 大数据法律监督的具体探索是对以往大数据运用经验的继承发扬,这一特点符合马克思主义经典作家论证的螺旋形上升原理,即事物发展遵循的“肯定- 否定- 否定之否定”周期规律。恩格斯指出:辩证法是关于普遍联系的科学,主要规律之一是“由矛盾引起的发展或否定的否定- 发展的螺旋形式”。列宁也说过:“发展似乎是在重复以往的阶段,但它是以另一种方式重复,是在更高的基础上重复(‘否定的否定’),发展是按所谓螺旋式,而不是按照直线进行的。”总之,大数据法律监督的兴起不是一种简单的回潮,而是达到一个更高层次的飞跃,是我国法律+ 科技探索领域中“波浪式的前进”“曲折的进步”。











二、大数据法律监督的本体阐释











 大数据法律监督反映的是新时代中国特色社会主义法治体系建设的生动实践,不宜作为一般性的法律概念,值得打造为国内起源、国际接受的标识性概念。关于如何理解标识性概念,有研究者指出,它是“理论体系建构、话语表达和思想理论传播的核心元素”,“对标识性概念的提炼和表达是进行理论建设、建构理论体系的基本前提”。关于如何提炼标识性概念,另有研究者提出“要扎扎实实地搞研究”“要掌握第一手材料”“要同学科体系、学术体系建设相联系”三项主张。将大数据法律监督打造为标识性概念,自当遵循此理,关键在于归依探索实践,展开“对于事物本身的理解和研究”。我们多次深入一线调研并获取了大量素材,并以民间借贷纠纷异常诉讼等场景为例进行模拟解析,强化对实践中规律的认识,形成了由具体到抽象思考的学术管见。

(一)基础概念的定义

 理论生成的一项基本任务是对特定事物概念进行合理界定。而要获得大数据法律监督概念的确切表述,知识之源在于丰富实践及其成果经验。许多大数据法律监督产品在我国产生了良好的标杆意义。2022年全国检察机关大数据法律监督模型竞赛值得特别一提,最高人民检察院在参赛作品中评出一等奖5个及其他奖项若干。这些产品虽名为模型,实乃产生影响力的具体运用。解析以相关监督模型为代表的实践作为,有助于提炼相关概念的定义。为行文方便,下面遴选全部一等奖产品为主、并辅以部分其他特色产品加以辨析。

 由各种实例可见,大数据法律监督涉及到检察系统借助大数据对刑事法律监督、民事法律监督、行政法律监督以及检察公益诉讼等的全面改造,涉及到通过刑事诉讼抗诉、民事诉讼抗诉、行政诉讼抗诉以及公益诉讼、检察建议、社会治理建议等方式对各种违法问题的普遍治理。基于此认识,并结合前述纵横比较,人们可以形成一个基础性的定义:大数据法律监督指的是一种以大数据及相关科技为支撑力,以多案监督为着力点,以促进国家、社会治理现代化为大目标的高级法律监督。

 特征之一为“以大数据及相关科技为支撑力”。传统法律监督主要依靠办案人员的脑力体力投入,面临着动能不足的问题。大数据是当下时代的“新石油”,开启重大的能量转换。2013年英国学者舍恩伯格做出的断言已被证实:“就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在改变我们的生活以及理解世界的方式……”大数据对法律监督的重塑变革是划时代的。实例1、3-7的法律监督无一不是使用了海量的数据(包括裁判文书、执行文书等法律文书、发票数据等各种政务数据、轨迹数据等各种社会数据),极大地提高了效率。

 同时,各种实例亦均使用了专门的数据分析方法。有的是面对一个数据集内的海量数据,按照一定的条件筛选出指向违法犯罪等行为的异常数据,如实例3;有的是面对存储海量数据信息的两个或多个数据集,就相关联信息进行匹配,撞出指向违法犯罪等行为的异常数据,如实例1、5-7;还有的是面对存储海量数据信息的不特定数据集,基于办案经验进行建模分析,刻画符合异常案件的形象,如实例4。它们分别是基于一个数据集、两个或多个数据集、不特定数据集进行的多重数据分析,即数据挖掘、数据碰撞或数据画像方法。这是基于求同、求异或共变思维的大数据技术。最高人民检察院检察长张军称之为科技、大数据手段:“监督办案就好像农耕,不掌握春种夏锄秋收传统知识、基本农技不行,但信息化时代,必须用科技、大数据手段提升质效,才可能提高‘产能’!”

 特征之二为“以多案监督为着力点”。长期以来,法律监督是固守个案的。而随着各地借助大数据拓展监督渠道,一种针对批量异常案件提起法律监督的常态模式悄然出现,成为主流。这种模式表现为检察机关既要提起一批针对侦查机关、审判机关、行政机关的刑事法律监督、民事法律监督、行政法律监督和公益诉讼的案件,也要做出改良国家治理的检察建议等治本之举。实例1、3-7所提起的法律监督均属于此等情形。这是一种同个案监督既无法割裂、又有重大提升的高阶状态。先行者们评价为“由个案办理到类案监督的新跨越”,学术界评论道“法律监督方法发生了转变,即由传统的、基于少量裁判文书而展开的个案监督转向大数据全样本的、基于海量乃至全部公开裁判文书而展开的类案监督”。

 这里的表述存在改进空间。“类案”是“同案同判”法律原则中“同案”的近义词,其约定俗成的意思是在基本事实、争议焦点、法律适用问题等方面具有类似性的案件。大数据法律监督的主要对象不同于通常意义上的“类案”。我国有学者专门以民事智慧系统的类案监督点进行说明,指出其“尚未实现‘同案不同判’类案的识别”。另有学者敏锐地指出,大数据法律监督的许多案件是以“多被告、一原告”或“多原告、一被告”的形式出现。实践中确实存在‘一人多案’的情况,比如一人起诉多案或被诉多案等。此外,大数据法律监督也要针对不同主体的批量相似案件着力。这虽然类似于通常意义上的“类案”,但却是负面评价意义上的类案之义。将这两者合并起来,统称为“批量异常案件”,在理论上更为妥适。相应地,这种对批量异常案件进行的法律监督可简称为“多案监督”。

 诚然,人们在工作场景中基于用语惯性而以“类案监督”指代之,亦无不可。对于两种意义上的批量异常案件,检察机关纳入法律监督均须满足特殊的前提条件,即它们要么反映出既有法律制度的内生缺陷,要么反映出执法司法中的普遍性缺失。前者如,有的检察机关对批量的职业诉讼案件分析后发现,其中存在着我国法律设置的民事撤诉条件过于宽泛、司法人员疏而不察等隐性原因;后者如,有的检察机关对醉酒驾驶机动车行为是否应该追究刑事责任的32起案件分析发现,其中存在着不同办案主体对《道路交通安全法》第91条第2款“误读”“误用”的惯性现象。两种情形实际上反映的均是社会治理方面的惯性问题。对于第一种情况,检察机关可以基于批量异常案件中的共性错误进行制度性纠偏;对于第二种情况,检察机关可以基于批量异常案件背后的深层问题,直接推动国家治理上的一体化解决。

 特征之三为“以促进国家、社会治理现代化为大目标”。党的十八届三中全会提出“国家治理体系和治理能力现代化”的重大命题,十九届四中全会明确“加强系统治理、依法治理、综合治理、源头治理”的转型要求。检察机关必须参与其中并贡献力量。以往各地检察机关也在办案中提出过各种检察建议、意见等软性治理方案。如今大数据法律监督的推行,将更多地鼓励通过纳入刑事抗诉、民事抗诉、行政诉讼抗诉、公益诉讼等硬性手段参加治理,且主要致力于改变潜规则、暗规则等各种社会问题。如实例1、3-7分别促进了政府补(救)助金、车辆保险理赔、破产领域虚假劳资债权、政务管理、网络司法拍卖、非标油治理领域的制度、机制改进,达到从源头上解决问题的目标。

“大数据法律监督的路径是从个案中总结规律、特征,后根据规律、特征在海量数据中筛查出类案,在批量类案中发现立法、执法、司法、机制等方面存在的漏洞,最终落脚点是解决社会治理问题。”例如,在绍兴市人民检察院虚假诉讼类监督模型中,主要做法是解析民间借贷纠纷个案,提炼同一原告、密集起诉、公告送达、缺席判决等要素特征,对相关民事裁判文书进行检索,梳理出涉“套路贷”的虚假诉讼线索,转入重点调查、移送侦查,开展融合监督,形成“智能排查—人工审查—深入调查—移送侦查—判决监督”的虚假诉讼监督模式,将民事检察监督从个别、偶发、被动监督,转变为全面、系统、主动的监督。这是检察机关在国家治理体系架构中的角色重塑。实例1、3-7彰显出的重要价值,正在于促进相关领域国家治理的水平提升。

(二)基本构造原理

 理论生成的另一项基本任务是解析特定事物的构成要素及关系原理。大数据法律监督可以拆解为不同的要素。有些要素是通用性质的,如大数据理念、人才和制度等;有些要素是个性化的、关键性的,且形成一个完整而稳定的架构,主要包括检察大数据、批量异常案件发现模型和人机耦合技战法等。洞悉这些关键要素及其关联规律,可以强化对大数据法律监督概念的认识。

 1. 检察大数据

 检察大数据是支撑检察机关开展法律监督模型建设及实操运用的海量数据。既有检察机关的内生数据,如检察办案数据、检察文书数据等;也有源自其他机关的外延数据,如裁判文书数据、执行类案件数据、司法网拍数据、警综警情数据、仲裁类案件数据、行政执法案件数据等;还有各种覆盖广泛的社会数据,如民生数据、环境资源保护数据、网络舆情数据、保险理赔数据、企业合规数据以及法学研究常用的学术论文、数字档案馆等电子资源。这些数据被检察机关用于法律监督,故检察大数据作为一个统括性的术语应运而生。从实践来看,检察大数据用于开展法律监督的模式主要是两种:一是以裁判文书数据为主,辅以其他数据进行联动分析,如实例3、4;二是突破至使用多元化的案件数据,开展不受限的数据分析,如实例5-7(参见表3)。它们采用的数据分析方法具有明显的差异,前者较多地采取语义分析方法,后者则可以寻求不限于语义分析的庞杂方法。这又涉及大数据建模问题。

 2. 批量异常案件发现模型

“大数据运用能否输出有用结论取决于(主要以‘算法’形式表达的)计算模型的有效构建”。大数据建模是大数据法律监督的重中之重,可分为逻辑驱动型和数据驱动型。前者要求模仿检察官甄别异常个案的思维方式,即设计一台遵循同样逻辑的机器进行批量异常案件的判断;后者要求其按照“(海量)信息数据输入—程序处理输出”的路径进行判断。后者可以被理解为一种基于超大样本的统计学建模方法。以实例3为例,检察机关通过关于车辆保险理赔的裁判文书甄别异常案件,基本方法是根据“原告频繁起诉”特征,以“同一原告或原告代理人起诉2 次以上”为标准进行筛选(参见表3)。这一筛选方法是将检察官的办案经验融入所设计系统来执行,显然归入逻辑驱动型。假如开发者找到关于车辆保险理赔案件的海量异常文书,之后由机器统计分析得出满足“原告频繁起诉”或“同一原告或原告代理人起诉2 次以上”之特征的车辆保险理赔案件,并纳入法律监督的范围。那就是数据驱动型。

 在现阶段,逻辑驱动型的大数据建模居于主流。我国有人将大数据赋能法律监督线索发现的路径确定为“典型个案分析→案发规律梳理→数据共享归集→数据碰撞比对→类案线索研判→移送线索核查→开展精准监督→跟踪督促落实→推动社会治理”。这里的“案发规律梳理”,是搭建大数据法律监督模型的关键节点。该环节要归纳提取出异常案件的特征,并通过数据化方式加以实现。

 能否通过数据化方式发现批量的异常案件,是此等模型研发成败的关键。其核心要义包括:一是区分案件的正常性与异常性;二是进行批量识别;三是追求快速地、智能化地识别。我们组织科研团队收集了我国2021年民间借贷纠纷案件的1125799份裁判文书,尝试搭建面向民间借贷纠纷的批量异常案件发现模型(简称“模拟实验”)。我们设计模型的基本思路是“通过数据分析遴选涉及同一主体100件以上的异常诉讼”,主要是通过四步法完成的:第一步,通过锁定原告身份的正则表达式进行搜索匹配,统计裁判文书中重复出现的自然人原告并排序。第二步,识别原告多次重复出现的裁判文书系由哪些人作为诉讼代理人的,并排序。第三步,将多次重复出现的原告与代理人进行碰撞,识别出它们之间的对应关系。第四步,统计重复出现100次以上的原告及其代理人的案件。结果是发现了高度符合异常诉讼的一大批异常案件。例如,自然人许某在2021年共计有作为原告身份的123份民事裁定书,全部案件中“原告的诉讼代理人均为黄某”“第二被告均为作为担保人的××信息咨询公司”,且这些案件“均以撤诉结案”“承办法官、书记员均为吴某、张某”。这就是批量异常案件发现模型的威力。至于这一批案件应否作为虚假诉讼提起法律监督,可以在实践中启动包括数据化续查在内的人工核查。

 3. 人机耦合技战法

 迄今为止,尚无任何大数据法律监督模型能够独立完成确认批量异常案件的任务。在相关模型推送批量异常案件线索后,办案人员仍然需要启动调查。这就出现了办案人员同基于相关监督模型的平台实现人机耦合之必要。何谓人机耦合,简单地说,是“在AI擅长的领域,解决人类智能比较困难的问题;在人类智能比较擅长的领域,解决AI比较困难的问题”。人机耦合在法律监督领域中不是权宜之计,在未来监督模型不断优化后亦得延续。这是由刑事司法的程序正义观念所决定的。美国学者西蒙指出,“关键的刑事司法决策是由计算机程序而不是人类做出的或产生关键影响的,将会令公众感到不舒服”。学者亨德森强调,“在目前(直至永远),刑事司法的终极决定应当由人做出。”可见,法律监督由负责办案的检察人员决策,乃司法正当性之精义。

 大数据法律监督的“人机耦合”需要落实到具体数据分析方法上。其中的路径设定要克服机器智慧之不足,完成锁定确认拟提起法律监督的批量异常案件的任务。实例1、3-7的共同做法是,先由系统推出批量异常案件的线索,再由检察官从多角度介入开展后续调查(参见表3)。这就自然形成了两步法的工作流程,形成人机耦合技战法之基础。


 当下检察官开展后续调查主要是传统的线下调查取证。浙江省检察机关称之为审查、调查、侦查的“三查融合法”。其实,检察官的人工介入亦可以再借助相关监督模型的平台或者其他的数据平台。笔者在模拟实验中就开展了续用数据平台的补充分析。鉴于许某作为原告的123份法律文书均是民事裁定书,笔者决定搜索中国裁判文书网,找到一份详细的民事判决书——(2019)××民初23941号民事判决书,提到许某是××金融信息服务公司的法定代表人。再通过企查查平台查询工商注册信息,发现第二被告××信息咨询公司系××金融信息服务公司的股东,两家公司登记的注册地址在同一大厦同一楼层,且法定代表人雷同。据此足以确信,这一系列案件存在违法放贷的重大嫌疑而审判机关失职不察,可以纳入法律监督的范围。模拟实验中对有关网站的数据查询,构成人机耦合技战法的升级版。











三、大数据法律监督的探索改进











 标识性概念的提炼不能止步于现象观察和逻辑演绎,仍需回到实践场景以促改进。玛丽斯教授打过一个比方:作为理论形成前的地图,概念“不能替代人们亲自对地形的查勘”,“反过来可能导致人们调整或优化地图”。将大数据法律监督用作标识性概念,意味着它不能被狭隘地认定为检察机关的“家务事”,而必然被纳入国家治理体系和国家治理能力现代化的大局。依此站位,大数据法律监督的探索进路应当同机制体制创新形成紧密的互动关系。这就需要强化“两手抓”,一手抓制度创新,一手抓科技创新。前一任务表现为针对多案监督搞配套规则建设,后一任务表现为针对技术方案搞多维度的提级扩围。

(一)多案监督规则的配套

 检察机关推出的多案监督,是由各级检察机关针对系列案件办理中发现的共性问题,实现一并解决的精准高效监督。它是大数据法律监督的主要进步,也是促进国家治理转型的具体承载。它不是个案监督,也有别于通常意义上的类案监督,现有制度均不能很好地加以调整。现行法律规范中与之最相关的是两处粗疏规定。一是最高人民检察院发布的《人民检察院行政诉讼监督规则》第119条第1款:“人民检察院发现人民法院在多起同一类行政案件中有下列情形之一的,可以提出检察建议:(一)同类问题适用法律不一致的;(二)适用法律存在同类错误的;(三)其他同类违法行为。”二是《人民检察院民事诉讼监督规则》第117条第1款的类似表述。这两款虽然指向“多起”案件,但强调的是“同一类”行政、民事案件,即函涉“同类问题”“同类错误”“同类违法”等类案元素。它们的突出不足是不能清晰覆盖应予监督的“一人多案”情况。至于刑事检察法律监督、公益诉讼检察的规则,则完全不涉及多案监督的内容。

 我国推出多案监督制度,不仅是实践发展的需要,更是依法治国的要求。澳大利亚邦德大学法学院凯特·洛韦教授告诫道,“大数据是一种‘颠覆性’的技术,需要对政府权力的界限进行检查”,“法律本身必须清楚地阐明国家权力面对数字化转型时的界限。”推行基于大数据赋能的多案监督,应当做到“重大改革于法有据”;而关于多案监督如何推动国家、社会治理现代化的方面,更需要立法明确检察机关促进诉源治理的职责依据等。这有两种方案:一是由最高人民检察院出台司法解释性质的《关于检察机关加强多案监督若干问题的规定》;二是由全国人民代表大会常务委员会制定《人民检察院法律监督法》。前述任一立法例的主要内容均应包括宗旨原则、基本定义、甄选方法、类型界限与机制规则。

 下面择其要者展开说明。1.关于宗旨原则。应当明确鼓励各级检察机关深度运用大数据强化法律统一正确实施,以实现法律监督由个案向多案、由被动向主动、由办理向治理的转变,实现“办理一案、监督一批、治理一片”的效能。关于促进国家、社会治理现代化的内容,亦可以单独作为一项宣示性的原则。2.关于多案监督的甄选方法。应当明确检察机关可以借助多案监督模型或产品实现人机耦合。其一,要明确鼓励开发指向批量异常案件的大数据监督模型及技术产品;其二,要确立以机器初选、人工确认为内容的两步法工作流程;其三,要鼓励检察机关创造条件开展两步法融合的攻关,推出预设自动执行方案的智能合约式监督。3.关于多案监督的形式与界限。应当明确各级检察机关启动多案监督时,采用抗诉纠正意见或者具有纠正违法性质的检察建议、检察意见、通知书等形式的适用条件,以及采用具有社会治理性质的检察建议等形式的适用条件。后一种情形下,检察机关往往采用社会协同共治的方式,需要针对特殊情形进行专门设计。举例来说,关于检察机关在对行政机关进行多案监督时如何遵循“在履行职责中发现违法”之限制、践行“依法能动履职”的要求,需要具体规则加以明晰。4.关于多案监督的机制规则。这涉及到两项特殊任务:一是跨区域多案监督的机制建设。当下大数据推送的多案监督线索往往跨越不同省市司法机关区域、甚至覆盖全国范围,理应由有关检察机关进行协同监督或者上级检察院进行指定监督,实现跨区域的溯源治理。二是大数据法律监督的方式转换,如明确区块链技术加持下法律监督的静默实现。我国三家互联网法院建设的司法区块链均是一种联盟链,容纳了法院、鉴定机构、公证处、行业组织、大型企业等单位作为节点,它们共享数据并共同确认。如果检察机关加入司法联盟链成为节点,理论上可以将有关数据用于法律监督,且不会干扰法院的审判行为、行政机关的执法行为或者检察院内设机构的办案行为。

(二)技术方案创新的提级

 我国大数据法律监督的现阶段探索表明,各种技术方案的创新存在着“123”规律。一是“一个转向”,即由面向人员转向面向案件(批量异常案件);二是“两个步骤”,即采用“机器判断+人工确认”的两步法工作流程;三是“三个特征”规律,即检察机关开展大数据法律监督的监督对象要满足数量特征(异常案件达到3件以上)、质量特征(异常案件反映出法律制度的普遍性问题)以及工具特征(异常案件可以通过机器算法识别)。这些规律是此类技术方案创新的基本要求。随之而来的问题是,现在被证明行之有效的大数据法律监督平台如何发挥更大的作用?

 这不仅取决于一地突破、全国推广的简单复制,更取决于改善方案、增强效能的实质推进。前一情形会遭遇南橘北枳之忧,像浙江省当下探索的领先经验难以在其他很多省份简单推广,反映出省际间资源有别、全国性适用不足的现实困难。后一情形需要从根基上思考大数据法律监督模型及产品的效益最大化方案。对此,人们依然可以借鉴大数据侦查、大数据反腐领域扩增数据模型效能的既有经验。它们通常采取行为特征数据化与情节特征差异化两种方式,对于大数据法律监督技术方案创新的提级扩围也是可予借鉴的。

 1. 基于行为特征数据化的改进

 行为特征数据化是将行为主体的各种违法行为特征尽可能地数据化,便于机器便利地替代人力工作。以大数据反腐作类比,侦查人员在查处招投标腐败案件中发现行为人存在“多家投标公司围标”“在投标政策公布前已经开始制作标书等材料”“在投标截止后才提交标书等材料”“与招采负责人频繁私下联系”等违法行为特征,就可以设计出方案将这些违法行为特征通过数据化方式进行识别。实践中,一些招投标项目智能监督系统针对性地提取各投标者的标书文件发送IP地址,发现相关IP地址雷同的,就自动推送为“多家投标公司围标”嫌疑;同理,该类智能监督系统还会针对性地提取标书文档的各种时间信息、招采人员登录账号的时序信息,用于自动甄别其他异常情形。特别是,若能将行为人在预备阶段的行为特征数据化,特定系统能产生更好的效能。如招投标腐败案件中行为人可能委派“职业行贿人”实施投标,或者临时入股多家投标公司实施投标,这些预备行为特征都可以数据化纳入投标项目智能监督系统。

 如前所述,大数据侦查、大数据反腐关注的是违法人员、腐败分子的行为特征,大数据法律监督关注的是异常案件的“行为”特征。以前者为鉴,后者同样需要将各种“行为”特征、包括预备阶段的“行为”特征予以数据化。我们分析过一起被改判的虚假民间借贷案件,研判其反映类似案件的潜在共性要素30处,再从中选择容易数据化的特征(如“一人多次被告的”“一人多次以同一事由起诉他人的”“案件系公告送达的”“案件系缺席审判的”“证据是借条复印件的”等),进行转化后就形成了甄别虚假民间借贷案件的数据模型。

 这些数据模型的研发不是一蹴而就的,需要持续的迭代升级。实例1、3-7均显示了将异常案件“行为”特征进行数据化而后不断提升的奥秘。以实例7为例,嵊州市人民检察院在模型研发早期是将税务申报数据同企业登记柴油车数量、可消耗非标油的特种设备等数据进行比对,形成第一代监督模型;之后调取了相关的卫星图像、地理信息等数据,通过每辆油罐车在加油站的停留时间,计算出了一定时间段内加油站的累积卸油量,形成了第二代监督模型;现阶段已转向进一步创新研发重点车辆未正常运行定位系统的监督模型,将跨区域运输非危化品罐体车辆轨迹纳入“非标油”监督模型。这说明行为特征数据化可以持续升华。

 2. 基于情节特征差异化的改进

 情节特征差异化是将异常案件“数量特征”“质量特征”“工具特征”进行组合后予以分级设置,分别适用于严厉程度不等的法律监督方式。这一技巧在大数据反腐领域较早得到使用。例如,某地针对惠农资金冒领情况开发了村干部优亲厚友比对模型,收集了全区所有村干部及其三代内近亲属的信息,并与他们所享受的惠农资金情况进行关联。结果发现村干部王某名下关联了9名亲属、享受高达500多亩土地的惠农资金,之后此人因违法犯罪数额较大被立案审查。这是党内监督最严重的“严重违纪涉嫌违法立案审查”形态。那么,如何利用该模型早发现苗头性问题及时制止村干部从违纪走向违法呢?该平台搭建了预警模块,预警功能中包括金额预警和种植面积预警,又分出三个档次分别对应“党纪重处分、重大职务调整”“党纪轻处分、组织调整”“开展批评和自我批评、约谈函询”形态。这种简单分级起到了对不同程度腐败分而治之的作用,产生了分层次预防腐败的功能。

 基于同理,假如能对现有大数据法律监督模型围绕异常案件三大特征进行差别化设立并实行预警功能,那么其功能就能够为刑事检察监督、行政检察监督、民事检察监督、公益诉讼检察提供不同的批量线索或案源,能够对法律实施中严重违反法律的情况进行溯源治理。

 此中“差别化设立”的基本方向是量化分档。以实例3为例,现有车辆保险理赔监督模型的主要数据分析方法是在涉车辆财产保险纠纷案件的裁判文书中按照“同一原告或原告代理人起诉2次以上”“理赔权转让”“保险公司定损异议”等特征进行筛选,并与社保等信息“碰撞”。这里就存在判断违法严重程度的不同维度。其中,起诉次数即牵涉的案件数是一个指标,目前设立的“同一原告或原告代理人起诉2次以上”是一个固定标线,是不是可以调整扩增为一年内同一人起诉“2-20件”“20-50件”“50-100件”“100件以上”等梯度,以对应不同方式进行法律监督。同理,违法所得额、是否转让理赔权等情节也可以具体分化,进而形成大数据法律监督的指数。诚然,这些档次的区分如何科学设置,有待于实践中累积经验。

 英国学者理查德·萨斯坎德在《法律人的明天会怎样?》一书中,告诫法律人要睿智地思考未来。相较于认识停留于过去与现实,预测人类世界的走向,是更广泛而有意义的挑战。于大数据法律监督的探索而言,这就要求检察人群体要勇做行动派,实现数字检察转轨,依托大数据技术铺开多案监督。于国家、社会治理现代化的推进而言,检察机关同有关机关要拓展“同心圆”,以法律监督之多赢双赢共赢方式,协同建设“中国之治”。

 我们基于对大数据法律监督的基础论证,得出具体建议两条:其一,检察机关应当注重对批量异常案件特征的归纳总结,转化成数据模型,进行自动化发现,完成从个案监督到多案监督的转型;其二,检察机关应当从传统思维转向大数据思维,打通检察大数据并开展多维分析,挖掘批量异常案件背后的根源,以法律监督的智能化促进国家治理的系统化。此外,考虑到大数据法律监督必然引发检察机关的跨区域法律监督,本文也建议,国家及时启动互联网检察院的试点,拓展法律监督的射程范围并建立与之匹配的体制机制,实现新时代法律监督力量的优化配置。











THE END



作者刘品新,中国人民大学法学院教授,中国人民大学刑事法律科学研究中心、未来法治研究院研究员。文章发表于《国家检察官学院学报》2023年第1期。微信公众号文章有删节,引用请参照原文。


《国家检察官学院学报》是最高人民检察院主管、国家检察官学院主办的法学综合性学术期刊,入选中文社会科学引文索引(CSSCI)来源期刊、全国中文法律类核心期刊、中国人文社会科学核心期刊和最高人民检察院检察理论研究知名期刊。

征订邮箱:jcgxb1004@qq.com

发行联系电话:010-61719513

传真:010-61731662


欢迎订阅


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存