其他

大数据:让国家公诉更智慧、更有力

2017-01-28 李斌 法律读库

读库

原  创

日前,作者在最高检公诉厅、信息中心联合举行举行的“检察大数据应用沙龙”中进行了主题发言,对大数据给检察机关能带来哪些变化提出了个人见解,认为只有将数据在线产生、交互运用,才能发挥大数据的力量,并结合既往的检察工作经历设定了五个常见场景,设计了相应的解决方案。

 信息化、数据化 

应该是什么

在探讨这个问题的时候,我想先谈谈我们之前理解的信息化、数据化是是什么。

1有关信息化

最高检和最高法的官方网站可以视为两高在信息化道路上的风向标。对比两家的网站信息,似乎并没有太大的区别。

但详细使用后,就会发现最高法官网下面还有7个有关信息公开、信息利用的子网站:

①中国审判流程信息公开网;②中国庭审直播公开网;③中国裁判文书公开网;④中国执行信息公开网;⑤最高人民法院诉讼服务网;⑥全国企业破产重整案件信息网;⑦中国司法案例网。

这七个子网站,从文书公开、庭审公开、审判流程公开、执行信息公开等多个维度,将法院的审判过程、结果能够透明化、连续化的展现出来,数据的有序流动初现端倪。

最高检也有自己的案件信息公开网,对法律文书、案件程序性信息、辩护代理预约申请等有关程序问题、案件处理结果等也进行了适度公开,但无论是公开的力度还是效果来看,都不及最高法。

2有关数字化

因为从检察院离职之前是在案管办工作,对统一办案系统上线以来我们的数字化工作还是稍有了解的。无论是电子卷宗、网上办案,还是开庭时的多媒体示证、诉讼可视化的呈现,都只是案件信息数字化的一些表现,还没有达到数据化的程度。

3什么是数据化

要谈论大数据,就要先解决数据是什么的问题。在此,我同意王坚博士在《在线》一书中提出的数据是沉淀下来的,如果只是搜集起来的那只能称之为信息。数据和信息的差异就在于是否自动生成,也就涉及到体量的问题。信息只能通过搜集的方式获取,搜集的手段和范围总是有限的,与人员投入密切相关,而数据则不然,它是在互联网时代的新型生产资料。

工业4.0时代一个最重大的变化就是互联网成为了基础设施,数据成为了生产资料,而计算(算法)则是能源动力,这三者结合就产生了新型的生产关系,这是既往的工业社会无法比拟的,也是人类第一次脱离自然界自己开发出的新的生产资料——数据。而这种数据并不简单等同于信息,是一种在线的、交互的信息,随时都在产生,随时都在更新,是有生命力的,如何利用数据更好的服务各行各业,就是当今我们在谈论的大数据问题。

之所以要强调在线的重要性,其实是想强调数据交互的重要性,任何信息,如果是单向的,就不会有生命力,发挥的作用也是有限的。

比如,我们与他人交往之初,会交换名片,但这种信息就是一种单向的,只是会记载你的姓名、联系方式、单位等,除此之外,你无法了解名片上这几个字背后的那个真实的人是什么样的。但通过数据的交互就不一样了,大家通过微信直接扫一下就成为微信好友,每一个人随时随地都是可以联络,他的一言一行也会通过朋友圈分享的方式呈现出来,在线,数据的交互、沉淀,为每一个动作留痕,为每一个人画像。 


 信息化、数据化 

应该是什么


1 传统的办案方式,未能解放人力

十二年前我成为了一名公诉人,十一年后我离开了检察院,但我离开时看到身边小伙伴们的办案方式与十二年前并没有太大的差别:

阅卷、证据摘录还是一如既往的,靠书记员或承办人自己来完成证据的电子化,稍有进步的就是我们之前依赖《刑法一本通》、《刑事审判参考》等纸质书籍来做法规指引、案例指导,现在我们可以通过搜索内部的法规数据库、外网还有无讼案例、裁判文书网等在线的数据库可供查询,信息来源扩充了,但我们制作审结报告、制作起诉书,甚至出庭举证质证、法庭辩论的时候还是延续十几年前的样子,当辩护人提出一项新的法规、提出一个新的判例的时候,我们无所适从,无法及时进行回应。

现在我们在电子化方面已经有很多的努力,比如OCR技术可以很好的解决纸质文档电子化的问题,但如何自动提炼出证据要点,如何智能的识别所需要的法规和案例,机器学习这些先进的科学技术还未能给检察官们赋能,我们的检察官还停留在精耕细作年代。

另一方面,随着认罪认罚程序的推广,大量的案件将由公诉人的裁决来决定是否起诉,以及相应的量刑情况,这种案件如何更加标准化、文书的制作、证据的审查、量刑建议的规范,都需要技术的大量参与,使人力大大解放出来,可以从事更加有意义的工作,如法律监督,如疑难复杂案件的审查起诉。

这些都是需要用互联网化的思维来思考,来解决,让一些重复性强、人工价值低的工作从整体的案件审查办理工作中分离出来,该机器解决的就机器解决,这也是互联网时代的应有之意。

2 单向的数据输入,未能形成数据交互

统一案件管理系统的使用和初衷都是非常好的,要形成大量的数据沉淀,更好的服务检察办案,但这些数据基本上都是人为输入的,数据之间是否形成交互,这些数据的输入是否给予检察官更多的办案辅助?每次检察系统采集数据的时候,为何不能直接从系统中进行识别、抓取,还是通过传统的层层呈报的方式来获取数据?这些问题的产生,都与数据未能形成交互利用有一定关系,传统的想法是拥有数据就强大了,就足够了,但只有让数据流动起来,才能发挥其真正的作用。

3 单维的评价体系,未能充分挖掘办案潜力

以往评价一个案子办的好不好,评价一个公诉人办案水平如何,评价一个公诉部门办案能力如何,往往就集中在效率和效果两个层面。效率的层面也通常是以结案率、结案周期、退补率、退补补查到位率等来衡量,有关质量方面的评价维度,一般包括是否获得有罪判决、量刑建议是否被采纳、是否追捕、追诉、是否不起诉、是否抗诉、抗诉是否被采纳,等等。这些维度看上去已经很多了,但它们的统计标准往往是一时一地,没有将其放入全国的大盘子里来统一衡量,比如关于职务犯罪案件,平均的审结周期是多长时间,该地的审结周期又是多少,即使都在法定审限里完成了审结工作,是不是这个效率就是没问题呢?

通过在线的办案方式,可以明确记载一名公诉人阅卷的时间长短、制作审结报告的时间长短,甚至与侦查机关的联网,还可以获取案件退补补查的进展情况,这些数据可以汇总勾勒出一个案件办理过程中到底需要多少有效工作日,哪些无谓的时间消耗都在哪里,是在途时间还是审批用时太长?然后可以针对性的解决这些问题。过去我们所有的问题,都是通过人工识别出来的,未来,通过在线的数据生成方式,我们的问题,可以自动暴露在我们面前,甚至会有一些让人意想不到的结论出现。

比如,佛罗里达州电力公司在调查停电原因时,发现飓风、交通事故等都是导致电线杆倒伏、断电的原因,其将上述断电地址统一绘制在数据地图上,就发现大部分的断电地址都是在公路的外环,究其原因,就是公路上的车祸往往都是在外环发生的,也就导致相应位置的电线杆容易被砸倒,查明这个原因后,他们就简单做了一个修正:将外环的电线杆都改置到内环,仅此一项,就将断电事故率下降了34%!我们也需要早日建立公诉数据地图,从而更好的提速,更好的办案。


 数据在线让公诉 

更智慧、更有力

1 数据的使用交互化

只有在线的方式才能让数据真正有力、有用,那如何做到在线?首先就要做到数据的使用交互化,而不仅仅是单一的输入。

场景一 针对公诉人办案的同案推送 

例1:对于非法获取网络游戏游戏币、充值卡,并予以转让牟利的行为如何定性

虽然认定犯罪并无争议,但认定为盗窃罪还是破坏计算机信息系统罪对被害人而言有很大区别,如果认定为盗窃罪,意味着涉及的游戏公司可以作为被害人获得赔偿,如果认为破坏计算机信息系统罪,就不存在被害人,游戏公司无法获赔。由此,准确的定性,不仅涉及到被告人权益的保障,也涉及到被害人权益的保障。

当公诉人将此类案件的证据材料、侦查机关的起诉意见书载入系统后,系统可以自动识别该类案件的常见处理方式,比如通过无讼案例,就可以查到此类案例共集中在三个案由:盗窃罪、非法获取计算机信息系统数据罪、破坏计算机信息系统罪。从审判年份来看,自2006年-2016年每年都有数量不等的盗刷游戏币案件被认定为盗窃罪,而认定为非法获取计算机信息系统数据罪是从2013年才开始产生类似判例,认定为破坏计算机信息系统罪是自2014年出现相关判例。(以下数据,如无特殊说明,均来自于无讼案例www.itslaw.com,数据分析结论与裁判文书公开有一定关系。)

从作出判决的地域来看,认定成立盗窃罪的省份在多数,在江苏、浙江等19个省份中都出现了类似判决,而认定构成非法获取计算机信息系统数据罪的只有浙江、江苏、山东、湖南、广东、四川等7个省份,认定构成破坏计算机系统罪的更少,只在北京、吉林、湖南、广东、四川5个省份查询到了类似判决。

多数认定为盗窃罪的案件,都是将游戏币视为虚拟财产,并以销赃价格认定盗窃数额,对被告人获取的非法利益予以追缴或退赔。部分认定为破坏计算机信息系统罪或者非法获取计算机信息系统数据罪的案件中,法院一方面承认游戏币系虚拟财产,但又称其法律性质为电子信息数据,故非法获取行为应该认定为计算机类犯罪,对非法所得只是予以没收,并未返还被害人。

如本案涉及利用植入木马病毒的方式,控制他人账号,窃取他人账号中游戏装备、游戏币的行为,系统会自动识别出各地的不同判例,如广东惠东县人民法院 一审 (2016)粤1323刑初144号判决书中,公诉机关认定这种行为构成盗窃罪,但法院认为“本案被告人窃取的是网络上的游戏币和游戏装备,网络上的游戏币和游戏装备在现实生活中没有实际的使用价值,其价值现无法评估,因此,被告人虽有盗窃的行为,但因本案的客体不符合盗窃罪的客体要件,其行为不构成盗窃罪。但被告人××入侵他人计算机,并获取他人的计算机信息达到20台以上,宜以非法获取计算机信息系统数据罪定罪量刑,其行为构成非法获取计算机信息系统数据罪定罪。”

而同样的案件在吉林省公主岭市人民法院 一审 (2014)公刑初字第270号中,认定构成盗窃罪。甚至在谷昭盗窃案【上海市黄浦区人民法院 一审 (2012)黄浦刑初字第1383号】中认定被告人谷某利用木马程序秘密侵入计算机网络窃取大量游戏币的行为构成盗窃罪,否认了辩方提出的“谷昭是秘密入侵他人的计算机系统后添加M币并销售谋利,更符合非法获取计算机信息系统数据罪”的辩护观点,认为“谷昭入侵久游公司服务器只是手段,其目的在于借用久游公司服务器这个特殊环境,通过修改数据并以秘密的方式,非法获取M币予以销售谋利,构成盗窃罪”。

上述的同案推送,一方面可以让公诉人了解各地的裁判趋势,也更加方便的判断最新的裁判思路。

2 数据的利用多元化

要打破单一维度的使用数据,就要做到数据利用多元化。

场景二 定性、定量指引 

可以通过大量的裁判文书数据,识别出同一案件中同法官类似案件的裁量结果,同一法院类似案件的裁判结果,同一省份法院类似案件的裁判结果,乃至全国类似案件的裁判结果,从而对本案的裁判趋势进行预测和指引。

例2:贪污案赃款没收还是发还?

这个问题虽然不涉及定性问题,但同样也是涉及被害人权利保障的问题,今后此类问题应该是作为检察监督的重点。

将此类案件放入无讼案例中进行检索,可以发现全国将近9000个案件中载明了赃款的处理情况,其中超过八成案件都是认定要上缴国库,只有不到两成采用了发还被害单位的方式。

具体到各个省份来看,北京、上海、天津更倾向于发还被单位,但除此之外的省份,基本上都更多的采用了没收的方式,哪种方式更加合理、更加符合法律设置的初衷、当前的社会经济形势?

2 数据的用户明确化

数据应用的目标用户必须明确,这样才能更加贴近用户需求、客观真实的实现用户的使用场景。

从这个角度来看,公诉数据的用户应该分为两个维度,一个是一线的公诉人,他们既是数据的生产者也是数据的使用者,另一个就是公诉的考评委员会,他们可以利用数据在前期做好员额的测算,在数据运行中来评价和考核员额检察官。

场景三 司法趋势反推司法政策改革 

例3:酒驾如何能除罪化?

一线的公诉人可能有个感觉:修八之后,酒驾的案件已经越来越占据日常案件的重头,无讼的2016年度报告也反映了这一事实,在危害公共安全犯罪中,将近9成都与机动车事故相关,其中六成为危险驾驶罪,将近3成为交通肇事罪。

而这些酒驾、交通肇事案件绝大部分都被施以轻刑,刑罚的使用在此类案件上是否有必要?司法资源需要有理有节的使用,我们看到,浙江的酒驾案件近年来一直是全国数量第一,在这种办案压力下,浙江的司法机关开展了刑事政策的调整。

在2017年1月17日,浙江高院、省检、省厅联合颁布《关于办理“酒驾”案件的会议纪要》,通过内部司法指引的方式,提高的酒驾的定罪量刑标准,并对酒驾二轮电动车、三轮摩托车的情形进行了适度的除罪化处理。通过司法形势的预判来反推司法政策的调整,甚至调整立法,这也是大数据的魅力所在。

场景四 研判案件智能化 

例4:针对雷洋等敏感案件,如何正确做出公诉裁量?

雷洋案作出不起诉决定后,我个人是非常赞同和支持检察机关的处理决定的,甚至通过数据分析的方式,为检察机关作出上述决定找到了相应依据。

通过无讼案例查询得到900余件公职人员玩忽职守致人死亡的案件,在全国28个省市都有类似判例,例外的是北京、上海、西藏三个地方尚未有公布的类似案例。

将近九成的案件都未判处实刑。其中最终被判决免予刑事处罚的有768个,免罚比例超过八成。

案件免罚率在八成以上的地区有14个,其中辽宁、江西、新疆三地的类似案件全部免予刑事处罚,其他如吉林、甘肃、山东、河北、内蒙、河南、陕西、山西等几个省份的免罚率也在八成以上。

免罚率较低的甘肃,24个类似案件中,13个免予刑事处罚,刚刚接近一半。其他案件数量较多的省份如湖南、浙江的免罚率也低于七成。

此类案件存检法分歧,检察机关抗诉比例高于普通刑事案件,但二审改判率不高

检察机关因不服一审判决提起抗诉的有53件,被告人不服上诉的有111件,抗诉比高达5%,与平均抗诉率不到1%相比,此类案件的抗诉比例已经非常高。从实际抗诉效果来看,只有12个案件被法院改判,其中不少是将无罪判决改判为构成玩忽职守罪,同时免予刑事处罚。

基本上可以看出类似雷洋案中的邢某某民警的行为在实践中正在大大减少,而且主流的司法实践都将其作为情节轻微的案件处理,即使检察机关起诉后,被认定免予刑事处罚的可能性非常大。因此从节约诉讼资源的程度,做出相对不起诉处理也是合理的选择。

场景五业务考评智能化

既往无论是公诉人比武还是业务考评,往往都是依赖于个人填报的信息,一方面人工收集信息的方式就需要改变,另一方面如何保证数据的真实性、客观性也是考评委员会更加关注的。可以参照无讼已经构建的律师名片项目,将裁判文书网中已经公开的律师代理案件情况,自动识别、解构为其专业领域、办案能力标签。如果我们的公诉人可以有自己的公诉人名片,上面有其个人的全部办案信息,甚至包括同行评价、对手律师、法官的评价,这样,不仅是更加客观的反映了公诉人的实际办案情况,也可以通过公开方式,大力提升公诉办案质量,阳光下不存在腐败,而且更是让公诉人找到可以打造个人品牌,形成专业影响力的良好渠道,树立更加专业、更加高效的公诉形象。

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存