【数据法学】刘雁鹏:司法大数据的现状、困境与对策
The following article is from 中国社会科学院研究生院学报 Author 刘雁鹏
B D A I L C
欢 迎 关 注
中国司法大数据建设经历了数据拓展由内而外,数据整合由下至上,数据应用由简至繁的过程。司法大数据的广泛应用对于审判管理的影响是深刻的,不仅能够辅助司法判决,助力司法管理还能够化解矛盾纠纷,服务社会管理。但上述作用仅仅是司法大数据建设的理想愿景,目前司法数据质量不高,数据壁垒难以打破,信息孤岛仍然存在,导致司法大数据的部分应用无法全面推广。今后应当进一步提高数据质量,加强数据应用,强化顶层设计,保障司法大数据健康发展。
Paul Gauguin
司法大数据的现状、困境与对策
文 / 法学博士 中国社会科学院法学研究所助理研究员 刘雁鹏
一. 司法大数据的现状
人民法院加强司法大数据建设既是国家战略的重要体现,又是提高审判管理水平的主要抓手。经过多年发展,中国司法大数据建设取得了令人瞩目的成绩:在纵向上,法院系统内部完成了从下至上的数据汇聚;在横向上,法院逐步实现吸收系统外的数据;在效果上,法院经历了从简单数据处理到复杂报告分析的飞跃。
(一)数据拓展由内而外
司法大数据建设初期数据主要来源于法院系统内部,最高人民法院建立了包括裁判文书、流程节点、执行信息以及庭审直播在内的四大公开平台,汇聚了全国法院的大部分审判管理与执行信息。上述信息的汇聚和积累可以帮助最高人民法院清晰地了解全国法院基本情况,并对司法规律做出简单的分析和判断。随着司法大数据建设的深入,法院内部数据已经无法进一步满足审判管理的需求,很多数据由政府、企业甚至其他机构掌握,单独依靠法院信息无法正常发挥大数据的作用,在这种情况下法院逐步开始了数据拓展的道路。以基本解决执行难为例,被执行人是否有财产、有多少财产、被执行人在哪里成为执行工作最大的困难之一。被执行人是否有房产由国土住建部门掌握,是否有存款由各个商业银行掌握,是否有轿车由车管所掌握,是否开设公司由工商管理部门掌握,是否有第三方支付存款由支付宝和微信支付等掌握。汇聚上述信息是解决执行难的关键,有的信息是通过协议的方式实现互联互通,例如,法院通过“总对总”和“点对点”系统查找失信被执行人的银行存款信息;而有的信息则是通过购买的方式获得,例如,浙江法院突破司法审判数据的范畴,充分利用阿里巴巴的相关数据,着力破解诉讼送达难和被执行人居住地、涉案财产难找等难题。
数据拓展的效果并不仅仅是数据量的增加,其结果将进一步强化司法权威、提高司法公信。在司法大数据推动过程中,法院不仅掌握了审判管理过程中形成的信息,而且还成为继政府之后的第二大数据汇聚机构。拥有这些数据不仅能够帮助法官审判执行,还能够对社会产生重大影响,甚至重塑权力结构。例如,浙江高级人民法院依托大数据生态圈,汇集公安、交通、房产、银行、出入境等多个部门的重要信息,将婚姻、信用、电商、社交、金融、交通、房产等多个维度近千个数据纳入大数据之中,全方位评价当事人的身份特质、行为偏好、资产状况、信用历史,实现了多维度、全方面地展现被执行人的信息状况。上述信息不仅成为法官办理执行案件的重要依据,而且成为当地党委政府工作的重要参考。随着信息的汇聚整理,一份份大数据报告持续发布,公众对法院的感官将会从信任转变为信赖,司法权威随之会逐步得到提升,司法公信亦将逐步得到加强。
(二)数据整合由下至上
数据整合需要依托平台建设,司法大数据建设初期各地法院为了解决自身需求,纷纷独立委托软件公司开发属于自己的系统或平台,例如河北的智审系统、浙江信用画像系统等,上述系统或者平台都能够保障数据的搜集和汇总,还能为审判执行提供重要参考。例如,北京探索构建了服务统一裁判尺度的大数据研究平台,帮助北京实现统一裁判;上海构建了12368诉讼服务平台,利用该平台实现督查考核、联系法官、诉讼咨询等八项重点功能。由于不同平台并非由同一软件公司开发,故平台与平台之间的数据无法做到互联互通,为此最高人民法院通过多年努力,逐步打通不同法院之间的数据。截止目前,全国3500余家法院能够实现数据共享,业务信息能够实现一键送达,同时最高人民法院平均每5分钟更新一次全国收结案情况,实时生成全国法院案件信息。
汇总全国数据使得精细化管理成为可能。首先,为完善司法资源配置提供数据支撑。目前“案多人少”成为学术界和理论界的共识,例如通过数据汇总发现朝阳区人民法院2017年的收案量超过了13万件,平均每位法官每年办结348件案件。在人案比较为突出的法院甚至出现了取消节假日的情况。但是从另一个方面来看,法官的审判能力仍然有待挖掘,随着法院信息化的建设,通过汇总全国数据,综合分析人员和案件数量比例,动态调配各种司法资源,今后“案少人多”可能成为全国大部分法院的常态。其次,为法官绩效考核提供科学依据。通过运用审判动态、统计分析、人员绩效和司法事务等大数据,全国法官的业绩情况均可以实现网上自动生成,一览无余,通过汇聚全国数据,能够横向比较、纵向了解每一位法官的业务能力,这些数据能够为法官遴选、法官评优、各级法院培训教育、司法保障等提供重要的参考和依据。最后,为落实司法责任制提供便利。目前全国司法文件全部网上流转,全要素网上公开,无纸化、公开化、可追溯的信息流,为司法责任制的落实提供了重要技术保障。
(三)数据应用由简至繁
若以数据应用的复杂程度划分,中国司法大数据的应用大致可以分为三个阶段:数据统计阶段;简单分析阶段;复杂应用阶段。目前全国法院已经基本达到了第二阶段,部分法院已经在复杂应用的道路上不断尝试。
第一,数据统计阶段。主要汇集全国、全省、全市各个类型案件的数量,为政府管理、经济发展和社会管理提供重要参考。例如,余杭法院电子商务网上法庭自收案以来,发现98%的案件系职业打假人提起,据统计同一职业打假人提起诉讼超过10件的达到30余人。通过统计该类案件发现,一批懂法律、懂技术、懂产品的职业打假人大量涌现,其职业化程度较高,对市场经济正常秩序产生了一定影响,应当引起地方政府的重视。
第二,简单分析阶段。随着大数据算法的改进,对于数据的挖掘进一步加深,法院不仅能够得到某区域的宏观情况,而且还可以就某一特定案件进行详细分析。例如,北京市高级人民法院课题组对2013年至2015年三年的离婚案件进行了大数据分析,发现女性(1,870,874人)提起离婚诉讼的数量普遍高于男性(870,408人),此外,无论原告是男性还是女性,进行离婚诉讼的年龄相对集中的是25~35岁(含25岁,不含35岁)之间,占当事人总数的24.6%,第二集中年龄段是35~45岁,占比为16.8%。离婚当事人45岁以上的数量明显减少。通过大数据对离婚纠纷当事人情况的分析可以看出,婚姻矛盾纠纷的多发点在中青年人群中。在这一阶段的分析,主要将案件和诸如地域、年龄、性别、职业等特殊要素结合,寻找要素和案件之间的关联,得出各个要素对于案件结果的影响。
第三,复杂应用阶段。大数据不仅能够对要素和案件进行分析,还可以成为修改法律法规的重要参考、制定国家大政方针的重要依据、筛查社会管理漏洞的重要参照。目前全国仅有部分法院能够做到复杂应用。例如最高人民法院在中国司法大数据网中公开了知识产权侵权纠纷、中小型股份制商业银行涉诉纠纷、电信网络诈骗、信用卡诈骗等分析报告。这些成果关乎民生大计和经济社会发展,多项成果摘要上报中央有关部门,并成为中央领导决策的重要参考依据。例如,针对民间借贷纠纷,最高人民法院2015年9月1日出台了司法解释,截至2016年7月31日,约有20.74%的司法判决引用了该解释,在引用该解释的判决中约有67%的文书引用了解释第29条。这些具体数字有力说明了司法解释施行以来的效果,可为相关法律规定的颁布、修订等司法研究提供重要参考。
二. 司法大数据的功能
(一)辅助司法判决
司法判决中难免出现因适用法律不准确而导致的错案、因时代技术所限而导致的冤案、因法官精力有限而导致的瑕疵案件。冤案、错案及瑕疵案件不可能被消除殆尽,但利用技术和制度设计可以减少冤案的发生,可以降低错案发生的概率,可以消减瑕疵案件的数量,部分地方法院法院利用司法大数据,在减少冤案、错案和瑕疵案件的道路上进行了积极的尝试。
第一,推送类似案件,实现同案同判。“努力让人民群众在每一个司法案件中都感受到公平正义”最好的实现方式便是尽量做到“相似案件相似处理”,尽量消除“同案异判”的现象。通过大数据辅助系统,可以向每一位法官推送类似的案件,为法官判决提供参考。同时通过大数据分析,还可以为每一类案件设置警戒值,当判决可能出现严重偏离时便会予以提醒。例如,江苏法院运用大数据辅助法官办案,构建智能检索分析系统,收录案件裁判文书、审判信息、电子档案以及法律法规、社会热点等信息数据,进行全数据关联、全网络打通,构建江苏法院基础案例资源库。通过同类案例推荐、热点信息发送和智能搜索引擎等功能,实现案例比对分析、类案专题分析和案件基础指标展示对比等关键业务辅助,开发涵盖各审判条线的数据分析系统,包括40多个审判业务类数据分析模型,为法官办案提供参考。
第二,建立辅助系统,寻找案件瑕疵。有的法院将案件的关键信息节点作为重点审查对象,通过系统审查可以发现案件的瑕疵,从源头上杜绝冤假错案。2017年5月3日,上海刑事案件智能辅助办案系统试运行(法院6家、检察院6家、公安机关13家,共计25家试点单位上线)。试点单位于5月1日起立案的故意杀人罪、盗窃罪、非法吸收公众存款罪、诈骗罪(电信网络诈骗)4个罪名案件,均进入该系统试运行。截止2017年10月,系统录入案件共计451件,包括故意杀人案件127件,盗窃案件291件,电信网络诈骗案件33件;录入证据60150份;提供证据指引11509次;发现证据瑕疵点317个,其中证据收集程序瑕疵52个、证据形式瑕疵51个、证据内容瑕疵214个;提供知识索引查询1387次;总点击量达9.1万余次。
(二)助力司法管理
司法大数据在法院立案、审判、执行等各个方面都能够帮助法官提高司法效率,减少司法资源浪费,并最终实现精准管理。
第一,案件繁简分流,提高立案效率。北京法院整合网上立案的数据,通过回溯历史案件数据、当事人历次来院数据等内容,在立案法官登记案件信息前,通过内外网数据共享、历史数据对比等方式,为立案法官呈现当前案件的“案件画像”。立案法官可通过此“案件画像”判断案件管辖问题、判断案件是否重案、标记案件重大敏感信息、核实当事人身份信息,实现案件分流,提高立案质量。目前,通过“案件画像”的风险预警与自动拦截,已经成功预警案件2528件、分流民事及行政案件218357件。根据大数据分析平台的统计分析,2528件预警案件中,涉及当事人261名,同一个预警信息有效预警案件235件,同一名当事人被预警次数高达72次,同一名当事人最多被6家法院预警。被预警的案件中,2129件经法官处理并审理完毕,399件经法官确认确有瑕疵,无法立案。218352件民事及行政分流案件中,274件被认定起诉材料不全,需当事人补充补正后再次来院;218078件被认定为符合化解调解,分流至多元调解组织,案件分流率高达35%。分流至多元调解组织的案件,从调解结果上看,45290件调解成功,121477件未调解成功,51298件正在进行调解,13件调解中止,调解成功率为21%,较好地化解了社会矛盾,减少了司法资源浪费。
第二,评价执行能力,提升执行质效。执行工作对于数据的依赖不言而喻,被执行人的房产、轿车、股票、存款等相关信息高度依赖于国土住建部门、车管所、证监会、银行等机构和部门的信息。部分法院打通与其他部门之间的数据,为基本解决执行难插上了信息化翅膀。例如,2017年无锡市中级人民法院首次将全市私立高收费学校招生名录导入大数据分析系统进行自动比对,显示有11名失信被执行人子女准备就读私立高收费学校,属于违反限制高消费行为,遂及时将相关情况反馈给无锡市教育局,并向其发出协助执行书,通知相关学校停止招录,事后8名被执行人当即履行了义务,3名被执行人子女重新选择公立学校就读,起到了良好的震慑效果及联合惩戒作用。据统计,无锡大数据分析系统自运行以来,对被执行人采取罚款、拘传等强制措施的人次增加了357%,被执行人自觉履行率上升45%。
(三)化解矛盾纠纷
部分法院依托司法数据,开发诉讼风险智能评估系统,精准评估案件成本,准确引用案例,引导当事人理性诉讼,从源头上减少涉诉讼矛盾纠纷。
第一,纠纷成本智能预测。当事人解决矛盾纠纷既可以选择调解,也可以选择仲裁,还可以选择诉讼。每一种解决方式都会存在成本和收益,对于诉讼而言,双方当事人一旦进入既定程序,便会面对来自心理、经济上的负担和成本。通过司法大数据的应用可以为当事人推送诉讼所经历的周期,所需要的费用,所耗费的时间等相关信息。一般而言,若诉讼收益大于诉讼成本,则理性人会选择通过诉讼的方式解决矛盾,若诉讼成本远远高于诉讼收益,则理性人会选择其他处理方式。通过司法大数据构建的风险评估系统以详实的数据、客观的分析,引导诉讼当事人回归理性,选择最佳的纠纷处理方式。
第二,诉讼结果智能评估。对于大多数当事人而言,案件适用的法律是否正确他们不知道,案件所采纳的证据是否合法他们不清楚,案件审理过程中的必经程序他们不关心。在司法信息不对称的情况下,当事人对于案件结果可能存在不合理的心理预期。一旦判决结果与不合理的心理预期不一致,他们就会认定司法不公,便会开始上诉、申诉甚至上访。通过司法大数据的应用,法院可以根据当事人选择案情描述,匹配案由模型,精准推送相关判决依据和法律法规,帮助当事人对案件审判结果形成预期,实现司法信息对称,维护司法公平正义,促进审判体系和审判能力现代化,促进当事人服判息讼。例如,2016年10月,贵州开发完成了刑事四类案由证据大数据分析平台,选择了贵阳花溪、毕节织金等4家基层法院作为刑事案件大数据试点法院,向被告及被害人推送生效的类似案件。截止2017年9月30日4家试点法院通过大数据系统共办结试点案件734件,结案率高达100%,平均审理时间18天,当庭裁判率为81.60%,服判息诉率为85.30%,案件质效明显提升。
第三,调解人员智能匹配。不同类型的矛盾纠纷有其自身特点,需要不同专长的调解人员介入,有的需要调解人员拥有一定的专业知识,有的需要调解人员有丰富的社会阅历,有的需要调解人员有一定的社会威望。因此能够根据具体情况选择合适的调解人员至关重要,眉山法院综合调解员个人信息、历史数据及案件情况,为当事人匹配擅长调解其纠纷的调解员,极大的提高了调解成功的概率。
(四)服务社会管理
通过智能统计分析当地案件的数量、类型、内容等当地党委政府关注的案件信息,可以生成表现直观的柱状图、地图分布等提供给当地党委政府,充分发挥司法诉讼“社会矛盾晴雨表”的功能。通过司法大数据可以分析诉讼中折射和反映的突出问题,法院据此提出司法建议,为党委政府决策参考提供服务支撑。
第一,发现未成年人保护重点。未成年人是国家的未来和希望,强化未成年人保护,预防未成年人犯罪,既是司法机关的责任,也是全社会关注的重点。最高人民法院通过分析2016~2017年涉未成年人保护案件得出如下结论:盗窃罪、抢劫罪和故意伤害罪是未成年人犯罪预防的重点领域,其中盗窃收案超过1.4万件,抢劫罪和故意伤害罪收案近5千件;农村地区未成年人犯罪预防形势比较严峻,人数占比为82.06%;流动、离异等家庭的未成年人更容易走向犯罪道路;网吧、KTV、酒吧成为未成年人犯罪案件高发地。通过最高院发布的大数据分析报告,可以清晰的知晓未成年人保护的重点和难点,能够精准发力保障未成年人的合法权益,预防未成年人走向违法犯罪道路。
为打击电信诈骗提供方向。电信诈骗覆盖面广、隐蔽性强、涉案金额较大,令人防不胜防。无论是学富五车的教授还是初入社会的青年都沦为电信诈骗的受害者。最高人民法院通过分析2016~2017年电信诈骗案件发现:2017年电信诈骗数量同比增长70%,全国电信诈骗犯罪高速增长,打击电信犯罪的力度仍需加大;电信诈骗主要集中在福建、广东、浙江等沿海地区,但2017年河南案件量大幅上升,位居全国第三;电信诈骗案件中被告人为累犯或者再犯的案件数量占比有所上升。该大数据分析报告不仅为全国打击电信诈骗指明了重点,同时也明确了打击的方向。
三. 司法大数据面临的困境
尽管部分地方司法大数据的实践能够帮助减少冤假错案、实现精准管理、化解矛盾纠纷、助力社会治理,但事实上司法大数据面临着以下困境,不但影响司法大数据的发展,甚至可能造成司法大数据无法有效应用。
(一)数据质量不高影响数据分析
全面、准确以及高质量的数据是司法大数据分析的基础,若数据不全面,则司法大数据的结论则可能有失偏颇;若数据不准确则司法大数据的结论便可能失真;若数据质量不高,则司法大数据得出的结论无法被运用。当前四级法院在推动司法大数据建设过程中,发现数据质量还有待进一步提高。
第一,数据并非全样本。大数据分析以全量样本为基数,若结论是由部分样本或者抽样运算得出,则不能称之为大数据运算。当前司法大数据的来源并不全面,很多数据处于缺失状态。以裁判文书为例,根据《最高人民法院关于人民法院在互联网公布裁判文书的规定》,凡是涉及到“国家秘密”、“未成年人犯罪”、“调解结案”、“离婚诉讼”以及“其他不宜在互联网公布的”案件,经过主管副院长的审定,便可以不上网。事实上,各级法院对于是否符合上述五种情形判定不一,大量不涉及这五类情形的案件被签发了不上网审批单,没有进入裁判文书网之中。若以裁判文书网作为基数,则可能存在分析结论有失偏颇的问题。
第二,数据准确性不高。大数据的采样过程以及计算过程依托于某种电子数据系统,其最终呈现载体大多为电子数据。故如果数据系统处于非正常运算状态、电子设备的清洁性存在隐患(如被植入木马),采样过程和计算公式的输入存在人为的偏差(如故意漏掉某部分样本数据)等,均会导致结论的不客观与不真实,尤其在大数据分析结论系由一方当事人提出,由非官方机构进行收集和计算的情况下,该结论的客观真实性更难以保障。
第三,数据来源有杂质。造成数据来源有杂质的原因一般包括以下两种:其一,存在冤假错案;其二,新法出台。当冤假错案被改判之后,原有的错案不应当继续作为案件来源,同样一旦法律法规修改,新司法解释出台,依照原有依据做出的判决也不宜继续作为数据来源。目前在构建司法大数据过程中,很少关注数据的来源,数据中包含了错误和虚假的信息分析系统无法识别,需要花费很长时间对数据进行“清洗”,舍弃那些可能会影响大数据分析的碎片化数据以及不宜数据。
(二)三大壁垒限缩数据发展空间
从目前的司法实践来看,大数据建设仍然存在专业壁垒、投入壁垒以及融合壁垒。这三个壁垒限缩了司法大数据的发展空间。
第一,数据分析存在专业壁垒。大数据分析以及基于大数据开发的各类审判辅助系统均是基于历史数据产生,这些系统暂时无法从新的案例、新的数据中学习新知识,无法做到像AlphaGo一样可以自我学习,自我更新。而法律的修改、司法解释的做出速度极快,可能几年之内同样的案件审判依据就会发生变化,之前的数据库很快就会被淘汰出局,而新形成的数据还很难迅速发挥作用,这就为司法大数据的发展提出了新的挑战。要么提高系统的数据分析能力,让其能够自我进化、自我学习,成为一名与时俱进的“法官助理”;要么就通过人工方法不厌其烦的筛查数据、更新数据、替换数据。
第二,深度挖掘存在投入壁垒。司法大数据建设本身需要硬件、软件、人力等多方面的投入。从硬件来讲,需要购买或租借大量服务器储存数据;从软件来讲,需要研发大量的应用平台和系统;从人力来说,需要一些专业人才进行建设和维护。且不说未来司法大数据产生的效益能否弥补现有的投入,仅数据搜集一项就占了法院经费的大部分支出。例如,基层法院每年需要花费上百万租借服务器用以存储庭审录音录像、裁判文书、司法数据等内容。在数据积累的基础上,数据的深度挖掘还需要投入更多的成本,对于某些人力物力财力不足的法院来说,已经成为发展大数据的重要障碍之一。
第三,业务技术存在融合壁垒。当前中国缺少大数据人才,更缺乏懂法律、懂数据、懂技术的人才。从地方法院反馈的情况来看,业务精纯、能力极强的老法官往往很少接触智能审判系统,更无法为大数据建设提出建设性的意见;而初出茅庐、刚毕业不久的法官助理则对法院信息化系统、大数据分析展现浓厚的兴趣,但他们不接触一线审判,不了解法官的办案体会,无法真正改进系统本身。而目前司法大数据的发展,面临着法律人员不理解技术思维和技术路径,技术人员不了解法律知识和司法规律,最终出现了业务和系统两张皮,大数据分析系统不能用、不好用、不想用的结果。
(三)信息孤岛影响数据互联互通
目前,法院已经积累了海量的数据,可以有效的了解审判管理的各种情况,但信息孤岛现象仍然存在,无论是法院系统内部还是法院系统外部都存在数据无法彻底互联互通。
第一,内部数据衔接不畅。在司法大数据建设过程中,各地都开发了自己的系统,例如,天津建立了“刑事速裁案件管理系统”、重庆开发“类案智能专审平台”。这些系统为审判管理提供了强大支撑。但由于各地平台和系统相互独立,委托的开发公司各不相同,直接导致系统与系统之间、平台与平台之间的数据无法直接互联互通。最高人民法院为了统筹协调全国数据,建立了全国通用的管理平台,但该平台在运行过程中仍然会出现数据无法调取,信息无法汇总的情况。
第二,外部数据很难获得。司法大数据建设不仅涉及到法院内部信息,很多情况下需要整合来自检察院、司法行政部门、公安、工商、税务等多个部门的业务信息。只有将与审判执行相关联信息最大限度的整合,才能发挥司法大数据的真正功效。从目前各地反馈的情况来看,法院的外部信息整合难度较大,尤其是涉及到公安、检察院、司法行政等部门的信息,很难顺利获得。有些地方法院依托地方党委支持,与公安部门、检察院、监狱管理局、司法行政部门等实现了信息互联互通。例如,安徽省高级人民法院和省司法厅共同打造了减刑假释网上办案平台,实现了业务和技术方面的全面对接,有效解决信息数据共享问题,大幅提高了办案效率。但从全国范围来看,法院与其他部门、机关之间的信息互通仍然需要一家一家地谈、一家一家地商议,有些部门以涉密为由阻碍信息共享,导致法院外围数据收集步履维艰。
四. 司法大数据建设的对策
中国司法大数据建设从无到有,从简单到复杂,从统计到应用已经取得了令人瞩目的成绩,今后应当进一步提高数据质量,完善数据瑕疵,打破数据壁垒,提高应用价值,实现数据联通。
(一)狠抓数据质量,守好大数据生命线
数据是司法大数据的前提和基础,数据质量是司法大数据的生命线。法院应狠抓数据质量,扩大数据采集范围,推进数据分析项目建设,提升数据应用效果。首先,广泛采集数据。在采集内容上,不仅要采集传统的案件信息数据,还应采集案件稳定风险、当事人对判决意见、公众对法院判决认同度、司法热点等与审判执行有关的数据信息。其次,认真筛查数据。建议各级法院将信息筛查作为工作常态,一旦出现改判、修法等特殊情况,就要分析研判对数据库信息的影响,及时将杂质信息、错误信息剔除出数据库。及时更新数据库的资料来源,将最新的法律法规、司法解释、指导案例等内容纳入系统中。最后,充分利用数据。加大对海量数据的自动挖掘和分析开发,运用大数据分析原理对法院种类案件的审判工作建构裁判模型,为法官裁判案件提供参考。此外,各级法院还应当牢固树立大数据分析思维,总结各地推广的经验和做法,巩固和发展现有成果。
(二)破除三大壁垒,保障大数据建设健康全面发展
面对三大壁垒,法院可从以下几个方面着手:首先,提供专业支持,提高系统学习适应能力,打破专业壁垒。打破专业壁垒,不仅要求在锁定争议焦点、分析事实认定、引用法律法规基础数据分析等方面提供资深的专业实务人员支撑,而且还需要进一步提高系统的学习能力、适应能力。需要通过用户行为分析持续提高目标案例推荐准确度,以及持续通过机器学习提升输出法言法语的能力,持续提高系统的学习能力;其次,理清投入重点,减少资源浪费。最高人民法院应当确定建设标准,统一数据接口,降低各地信息建设和汇集成本。地方各级人民法院应当根据自身情况,由简入繁、先难后易的深入大数据开发,将大数据的研发与地方实践相结合,与地方突出的问题相结合。最后,培养全方位人才,加强业务与技术交流。打破融合壁垒,一方面要求培养全方位人才,让一些懂技术、懂数据、懂法律的复合型人才进入法院;另一方面则要求加强法官和技术人员的交流,让法官了解技术思维和技术路径,让技术人员学习法律知识,做到业务部门和技术部门共同学习,紧密配合。
(三)开放数据信息,提高数据利用价值
开放共享服务是中国智慧法院建设的重要理念,也是实现司法公正、满足群众诉求、助力司法改革和司法管理的重要手段,还是法学学术发展的重要养料。从数据中得出研究结果是当前法学学术进步最为重要的方式之一,也是今后发展的重要方向。通过大量的数据,可以帮助学术界从理论探索转向实证分析,学术界得出的结论也就更加科学,更有依据,更符合实践需求。但是目前数据获取难度非常高,以中国裁判文书网为例,裁判文书网对网上浏览、下载设置了重重验证,不方便高校和科研机构进行研判和分析。很多研究人员不得不转向openlaw中获得数据,并支付技术公司一大笔经费。为了提高数据的利用价值,建议法院充分利用高校、科研院所以及社会其他组织的力量,开放更多的数据信息,提高数据开放程度和开放范围,拓展大数据运用的广度和深度。
(四)加强顶层设计,实现数据互联互通
大数据是人们获得新的认知、创造新的价值的源泉,还是改变市场、组织机构,以及政府与公民关系的方法,可以说,谁掌握大数据,谁就掌握未来。大数据作为大国战略,不应当也不可能由单个机关或部门推动。同样,司法大数据建设也不应当是仅有法院单方面的努力,而应当上升到国家战略的高度。当前法院在推动司法大数据建设过程中遇到了瓶颈,仅凭法院一家之力,无法将大数据建设推向新的高度。因此建议加强顶层设计,由中央协调法院、检察院、公安部、银监会、证监会等相关部门,打破各个部门之间的数据孤岛,实现跨部门、跨地区之间信息的互联互通。此外,建议全国人民代表大会常委员会就数据共享、信息互联互通出台相关立法,明确各个部门的权力、划分相关部门的职责,保障信息交流有法可依。
参考文献
[1] 参见熊丰:《信息化手段助力全国法院决胜基本解决执行难》,《信息系统工程》2018年第7期,第177页。
[2] 参见孟焕良:《浙江司法拥抱大数据时代》,《人民法院报》2016年3月11日011版。
[3] 事实上,大数据的产生冲击着权力结构,谁拥有大数据,谁就拥有权力,数据在某种程度上可以重塑甚至终结权力。政府如此,法院亦如此。参见刘建义、陈芸:《大数据、权力终结与公共决策创新》,《天府新论》2017年第6期,第74页。
[4] 高敏等:《借力互联网,问计大数据》,《浙江法制报》2016年10月27日。
[5] 佘贵清、叶欣:《北京法院服务统一裁判尺度的大数据研究》,《法治蓝皮书·中国法院信息化发展报告(2017)》,社科文献出版社2017年版,第299-305页。
[6] 杨敏、罗健豪:《上海法院12368诉讼服务平台建设》,《法治蓝皮书·中国法院信息化发展报告(2017)》,社科文献出版社2017年版,第257页。
[7]《为实现公平正义砥砺奋进----党的十八大以来人民法院司法为民公正司法新进展新成就述评》,《人民法院报》2017年3月12日。
[8] 参见刘洋、吕烨馨:《北京朝阳法院建起新型审判团队、全年收结案均突破13万件》,《新京报网》2018年9月16日,最后访问2018.12.18,http://www.bjnews.com.cn/news/2018/09/06/503503.html
[9] 张千帆:《如何设计司法?律师、法官与案件数量比较研究》,《比较法研究》2016年第1期,第59页。
[10] 刘克勤:《浙江法院电子商务网上法庭运行成效分析》,《法治蓝皮书·中国法院信息化发展报告(2017)》,社会科学文献出版社2017年版,第232页。
[11] 参见北京市高级人民法院民事离婚纠纷类案同判课题组:《民事离婚纠纷类案同判专题分析报告》,《法律适用·司法案例》2017年第6期,第98页。
[12] 刘雁鹏、田禾:《司法大数据的建设、应用和展望》,《法治蓝皮书·中国法院信息化发展报告(2017)》,社科文献出版社2017年版,第98页。
[13] 参见周少华:《同案同判:一个虚构的法治神话》,《法学》2015年第11期,第131页。
[14] 参见王禄生、刘坤、杜向阳、梁雁圆:《江苏法院“同案不同判预警平台”调研报告》,《法治蓝皮书·法院信息化蓝皮书(2018)》,社会科学文献出版社2018年版,第351-363页。
[15] 参见杨敏:《上海刑事案件智能辅助办案系统调研报告》,《法治蓝皮书·法院信息化蓝皮书(2018)》,社会科学文献出版社2018年版,第186-200页。
[16] 参见佘贵清、李响、孙冰、吴娟:《借力大数据、智慧助法官----北京法院睿法官系统》,《法治蓝皮书·法院信息化蓝皮书(2018)》,社会科学文献出版社2018年版,第345页。
[17] 王小梅:《中国法院“智慧执行”发展报告(2017)》,《法治蓝皮书·中国法院信息化发展报告(2018)》,社科文献出版社2018年版,第110页。
[18] 参见赵正辉:《无锡运用大数据开启精准执行模式》,《人民法院报》2017年8月3日。
[19] 参见梁国昕、陈昌恒、马娅宏:《司法证据的大数据分析----以贵州法院的实践为例》,《法治蓝皮书·法院信息化蓝皮书(2018)》,社会科学文献出版社2018年版,第374页。
[20] 张能、彭惠琴:《应用大数据+人工智能助力矛盾纠纷多元化解的眉山实践》,《法治蓝皮书·法院信息化蓝皮书(2018)》,社会科学文献出版社2018年版,第282页。
[21] 参见最高人民法院发布的“从司法大数据看我国未成年人权益司法保护和未成年人犯罪特点及其预防”,最高人民法院网,http://www.court.gov.cn/fabu-xiangqing-119901.html,最后访问2018-10-01.
[22] 参见最高人民法院发布的“司法大数据专题报告之电信网络诈骗”,最高人民法院网,http://www.court.gov.cn/fabu-xiangqing-63132.html,最后访问2018-10-01.
[23] 刘华、张新龙:《安徽法院推行法院与司法行政机关网上联合办案调研报告》,《法治蓝皮书·中国法院信息化发展报告(2017)》,社会科学文献出版社2017年版,第210页。
原载于《中国社会科学院研究生院学报》2019年第5期
仅作学习交流之用
Paul Gauguin
往期荐读
编辑:韩雨硕
欢迎点击“阅读原文”