查看原文
其他

赵志刚:大数据与司法

赵志刚 大数据和人工智能法律研究院 2020-02-27

点 击 蓝 字 

 欢 迎 关 注 


2018年3月30日晚七点,中国政法大学法学院大数据和人工智能法律研究中心(以下简称“大数据中心”)与最高人民检察院检察技术信息研究中心签署合作会谈纪要,并顺利举行大数据中心成立以来的首次公开学术活动,由最高人民检察院检察技术信息研究中心赵志刚主任作了以“大数据与司法”为主题的学术讲座。本次讲座由焦洪昌院长主持。


Paul de Longpre



大 数 据 与 司 法

主讲 / 最高人民检察院检察技术信息研究中心主任 赵志刚




开 场 环 节

焦洪昌院长(主持人):各位老师各位同学大家晚上好。非常感谢赵志刚主任今天能够来法大分享他的在大数据司法这一领域的研究心得。今天讲座的主题是“大数据与司法”。我觉得这个主题非常好。我们知道,大数据与人工智能等新技术对当下的法学研究、法律实务以及法学教育均带来了较大的机遇与挑战,特别是作为法学院而言,大数据等新技术对传统的法学教育能够带来什么样的革新,还很值得关注与研究。将来如果法学院能够在这方面取得突破,形成一种人才培养的新模式,肯定会有益于法学教育进而推动社会发展。我也非常期待大数据中心的后续活动,希望能多邀请到赵志刚主任这样的嘉宾来中心作学术讲座,推动中心的工作越办越好。

今天我们也非常荣幸同时邀请到了其他几位嘉宾老师来作点评。他们分别是最高人民检察院检察技术信息研究中心信息化三处缪存孟处长,中国政法大学法学院副院长许身健教授,中国政法大学法学院大数据和人工智能法律研究中心主任汪庆华教授,以及中国政法大学刑事司法学院戴士剑教授、李小恺讲师,中国政法大学证据科学研究院周蔚博士后,以及法学院苑宁宁博士。欢迎他们!下面有请赵主任发言。




主 讲 环 节

赵志刚主任:谢谢法学院大数据中心的邀请!感谢焦院长的主持!去年成立仪式我也受邀出席,没想到今年成为中心成立以来的第一位学术讲座的主讲人,非常荣幸。今天的讲座环节主要由两部分构成。分别以“我眼中的大数据”与“大数据与司法的若干问题”为主题先后展开。下面直接进入第一部分的讲座主题。当我们谈论起大数据的时候,许多人都在困惑大数据究竟是什么。其实就大数据的概念而言,对于“大数据是什么”这一问题目前还很难做出准确的回答,不同的人有不同版本的答案。这正如你不问我,我还知道;你一问,我反而糊涂了一样。对于大数据的定义,可以引用《数据之巅》一书中的一句话作为理解的桥梁,即

“大数据不是矿藏,而是土壤,开放的数据即为土地上的河流,河流流过之处,就会孕育起发达的数据文明”。

就大数据的基本特征而言,主要包括以下四点。第一,数据量大。是指大数据一般是海量数据,数据存储单位由GB到PB甚至ZB。第二,类型繁多。是指大数据的来源主要可分为三类,分别为商业数据、人为数据以及机器数据。这三种来源的数据格式异构、类型繁杂、形式多样。第三,价值密度低。则是指虽然大数据拥有价值,但价值密度却非常低,往往需要沙中淘金,所以必须要有海量数据作为支撑。第四,实时高速。实时高速是指大数据是高速流动的数据,而不是静止固定的数据。

在对大数据的定义和特征进行初步了解之后,我们必须关注建构大数据思维的重要性。而大数据思维的建构主要包括定量思维、相关思维、实验思维等三大方面。定量思维是指一切即可测量,相关思维是指一切皆相关联,实验思维是指一切皆可尝试。这些新的思维特征给我们传统的思维方式带来了巨大的挑战。再一个需要关注的地方就是大数据的功用与价值这一实践应用方面,主要包括提高效率、趋势评估与预测、减少风险以及节约成本等四个方面。就提高效率而言,大数据这一领域好比磨刀不误砍柴工,它是一个需要长期投入、建设和不断发展的行业,其功效不是立竿见影的,可一旦有回报,则是“超高回报”的。趋势评估与预测则是指大数据能有助于预测社会现象的发生,比如其可以利用大数据预测犯罪高发地点,从而可以降低犯罪率。减少风险是指能够利用大数据规避潜在风险,做到有备无患。节约成本则是指利用大数据可以降低社会交易成本。比如以“超市比父亲更加了解女儿”为例,商家利用消费者的消费行为产生的数据预测消费者的消费价值偏好乃至其他个人信息,从而做到比父亲更加了解女儿。

以上就是我眼中的大数据,其实值得与大家分享地方还有很多,由于时间关系,暂时按下不表。我接下来拟就“大数据与司法的若干问题”为主题进行介绍,这也是本次讲座的中心环节。

首先,第一个问题就是“为什么在司法领域强调大数据”。据我所知,检察系统近些年来智慧检务的发展提速很快,检察系统通过建立电子检察工程,建设了几乎可以覆盖所有检察业务的信息工程。检察机关的信息化与法院、公安部门不同。公安以局为单位,建立涉密网和非涉密网、互联网,呈条状;法院部门以省为单位,省高院来建立信息网,呈块状;检察院条块结合,从最高检到省、市、区、县,组成一张信息网。检察系统信息网数据的标准和规范是统一的,任何一级检察院用的都是同一个系统。这个系统遵守刑法、刑诉、民法、民诉等法律法规。除了绝密案件,无一例外。所以数据基础具有很大优势,非常便于开展大数据的相关研究。这也是与法学院开展深度合作的良机之一。而且,中央如今非常重视大数据的研究,强调要将司法改革和科技创新结合起来。就我国的法系背景而言,我国属于成文法国家,而且检察机关是上下级领导体制,使得我们可以在一个统一的平台上就能检索到整个检察系统的信息,这一点欧美等判例法国家很难做到。大数据司法与司法改革如车之两轮,鸟之双翼。大数据司法是司法改革的一部分,司法改革是大数据司法的一部分,你中有我,我中有你。从技术主义驱动司法,以及建设新型法制中国的角度说,大数据司法改革都是必要的,是一个宏观的大趋势。

第二个问题就是“大数据司法是什么”。如今“智慧司法”这一提法主要是指法院和检察院。两高也分别提出了智慧法院和智慧检务的概念,智慧法院是建立在信息化基础上的法院工作的一种形态,是人类进入信息化、智能化时代后,在一系列先进的信息系统支持下的法院的新型组织、建设和运行形态。智慧检务,是依托大数据、人工智能等技术手段,进一步发展检察信息化建设的更高形态,是实现检察工作全局性变革的战略转型,也是影响深远的检察工作方式和管理方式的重大革命。当前和今后一个时期,智慧检务工作的主要目标是加强智慧检务理论体系、规划体系、应用体系“三大体系”建设,形成“全业务智慧办案、全要素智慧管理、全方位智慧服务、全领域智慧支撑”的智慧检务总体架构。而大数据司法的特征主要体现于,在法官和检察官行使司法决定权的过程中,要包括一定的新科技要素的支撑。举例来说,包括以下八点。

第一,类案推送。利用大数据技术建立的数据库里有各种案件,办理案件时可供参考。当输入详细的关键词时,数据库通过文本相似度分析,以及在实现要素信息抽取的前提下,依据案由、犯罪手段、量刑情节、刑罚、法院、地区、相关法条等多种关联因素综合检索同类案件,此时就可以参考前辈的经验,效率很高,同时还可以促进同案同判。目前司法实践中,沿海众多检察机关已经使用了这种类案推送的技术。

第二,智能计算法律法规。与北大法宝等公司合作,建设大数据法律法规平台。相关法律法规都会输入这个平台中,办案人员在写法律文书时,平台会自动关联相关法律法规,便于办案人员查阅信息。

第三,大数据定罪。大数据辅助定罪量刑是指借助技术手段,挖掘历史上法官、检察官定罪量刑的集体经验,计算出各个案件定罪量刑情节对刑法的影响程度,赋予各个情节不同的刑罚系数,从而使定罪量刑的方法更具个性化。

第四,案件偏离度分析。根据之前所说的大数据辅助定罪量刑,对某类具体案件,通过技术手段,可以得知一个量刑基准线。具体实务中,某类案件可能会重罪轻判和轻罪重判。我们可以利用大数据得出的基准线,进行案件偏离度分析,如针对批捕的偏离度分析,从而监管批捕决定的准确程度,达到司法监督的目的。

第五,基于大数据的证据认定。目前创建了部分罪名的犯罪构成知识图谱,将案件信息数据化。通过个案要素的证据摘要,进行证据分析。

第六,大数据自动生成法律文书。目前很多检察院在做试点,效果较好。通过一定的模型,将案件中关键的变量带入模型,即可生成各种法律文书。

第七,“智能语音”技术。语音技术与科大讯飞公司合作,有专属的检务输入法,智能会议系统和审讯系统。维汉语音翻译、维汉文书翻译等也是特色功能,极大地提升了司法效率。

第八,基于大数据的法律咨询回答。法律咨询回答是基于互联网、裁判文书和司法人员回答的累积。

面对大数据司法不可避免的趋势,如何评价和应对这一问题就显得十分重要。大数据与司法其实从本质来看,其实是科技与司法的关系问题。或者主要是说是科技对司法产生的影响问题。简言之,即科技可以保障司法,科技支撑司法,科技引领司法,科技驱动司法。我们一方面既要实现自主开发、自主可控,一方面又要树立烟囱思维与共享思维,实现数据共享。就下一步来讲,面对这一不可逆的大趋势,我们应当进一步深入开展高科技企业、科研院所与司法机关之间的合作,最终从实现大数据与人工智能司法到实现大数据法治。




点 评 环 节

中心主任汪庆华教授:非常感谢赵主任今天能够来大数据中心作学术讲座。这是我们中心成立以来的首场公开学术讲座。从赵主任的讲座中可以体会出人文关怀与新技术的高度融合。这也是与赵主任进行合作的一个非常重要的共识。我想就本次讲座进行了三个方面的点评,与赵主任交流。

首先,我们法律人关心司法中的大数据,更关心大数据对司法实践中起到什么样的变革和推动作用。其中比较重要的是在事实认知方面,大数据技术可以改变从前对案件事实认知模糊的地方,可以部分打开法官自由心证的“黑盒子”。其次,赵主任也说过大数据应用中会发生个人隐私泄露。就最近facebook信息泄露事件而言,法律人不仅要关注大数据在提高效率、节约成本上的作用,更要关注大数据如何造福于人本身。最后,平台司法。目前多地多家司法机关都陆续采用大数据的司法平台,一方录入多方使用。比如苏州政法信息综合管理平台,就把海关等执法部门的信息接入进来,多方共同使用。这可能跟我国宪法规定的公检法机关之间相互制约相互配合的规定产生矛盾。包括我们去杭州互联网法院调研的时候,也觉得像电子送达这样的技术容易产生一些问题,法律规定送达必须双方当事人同意,而电子送达如何征得当事人的同意是一个问题。所以,现有的前互联网时代的立法和大数据时代司法技术的变革之间如何互相适应,技术如何适应现有的法律框架,法律框架又如何作出相应的回应等等问题,想请赵主任解答。

 

戴士剑教授:我现在主要在做信息化侦查和大数据的应用。这一方面存在很多问题,因为大数据侦查对司法公正造成严重的损害。政府掌握这么多信息,这些数据如何应用,不仅仅在检察院这个阶段,包括法院的审判阶段,公安机关的侦查阶段,以及新成立的监察委,他们该怎么用这些数据。今天看到赵主任的发言,没想到我们的检察院已经做到这个程度,这是非常值得好好学习的地方。

 

缪存孟处长:赵主任对新事物把握的方向非常精准,而且讲座的安排也非常好,首先让各位同学建立起大数据思维,然后从思维的角度再引导到对实务的应用上。另外,赵主任介绍了大数据技术在我们现实工作中的一些应用并就下一步发展指明了方向。也希望通过这次学习,将来能和法学院进行更多更好的合作。

 

许身健教授:本次讲座给我带来两点启发。第一点启发就是大道至简。在法学教育上大数据的应用问题,我们要寻找其中的规律,让法学院回归法学教育的本质,做到有章可循。第二个问题就是大数据互联网对于现在的生产方式产生了巨大的变化。有这样一种说法就是法律职业是一种后天学得的艺术,是需要有情感的。现在大数据辅助司法,会不会和个人情感离得更远?有些问题已经显现了,比如说对隐私权的侵犯,所以我特别想听到未来大数据中心的工作能够回答这样的疑问。

 

李小恺讲师:今天听完赵主任的讲座之后有三点感受。第一是震撼。从2012年司法信息公开平台刚上线的时,那时候我在美国,我就在想这个东西做大数据比较好。自己也学习了计算机方面的知识,也做了相关研究,但是跟今天赵主任介绍的相比,还有很大差距,所以感到很震撼。第二,我们在研究的时候,技术的使用是一方面,更重要是思维。法学院现在搭建了这么好的平台,赵主任给了我们这么大的支持,这个平台如果用起来,老师和同学在做科研的时候都会从中受益。第三,大数据的特点之一是只关注相关性。这给我们提出了一个新方向,我们要借这个相关性进行探索和应用。这可能是大数据留给我们做学术研究的一个空间。

 

周蔚博士后:我主要想结合自身最近的研究来做几点分享。法律大数据需要投入大量的技术和人力做技术的支撑。我自己做过三个与大数据有关的项目。从全网收取公开的材料文书研究普惠金融的风险控制,这对于判断借款人的资质风险有一定的价值。以及与中国人民银行金融信息中心合作的项目。还有就是互联网仲裁平台。在这个平台上面,仲裁委实现了一千多份的法律文件和知识的调取,形成了自动生成仲裁裁决的完整机制。我们也尝试了区块链技术,建立一个联盟链。希望将来在开展检察大数据相关工作的时候,能够得到数据方面的支持,从而使我们更加完善研究的思路。

 

苑宁宁博士:我想用四句话来概括今天聆听赵主任讲座的感受。第一个就是大数据司法为中国法制提供了一种技术主义路线。第二就是大数据的司法价值就是让每一个公民在每个案件当中感受到司法的公平正义。第三个就是大数据对传统的法学也提出了一些挑战。比如隐私权的问题,以及刑诉法上的自由心证原则等等。第四个是大数据思维,将来司法改革能不能智慧化,都需要借力大数据思维。




提 问 环 节

嘉宾点评结束之后,在场的部分同学也对本次讲座提出了很有价值的问题。

提问一:赵主任提到大数据法律文书制作前端的录入比较辛苦。所以,法院在录入的时候,包括收入基本的案情等,能否采用电子化的形式。请问有没有这方面的设想?

 

提问二:当下的学术研究,往往掌握新技术的学者,可能会在这个方面做得比较好,那么以后会不会形成这样一种现象,就是说技术会逐渐趋于主导地位,形成一种技术权力制约人类的可能?

 

提问三:如何平衡被遗忘权利和进行天眼之类的技术侦查之间的矛盾?还有一个问题是什么机关可以用个人信息,有没有相关界定?另外,在做大数据研究的时候,会不会把“暗网”纳入这个研究范围之内?从实务部门看,是不是大数据研究已经成为刑事司法研究的一个新的导向?




回 应 环 节

赵志刚主任:感谢大家耐心的倾听并做出精彩的评论和提问。焦院长提出,我们要基于这次合作,让法学院的同学深入到司法实务部门,用技术的思维来研究我们的学术问题。刚才有位同学也讲得很好,就是理工科等代表的技术会不会主宰我们?我觉得技术可以提供辅助,技术提供方法,北大的白建军老师的研究是一个很好的导向。基于大数据的司法,一定会成为未来的方向。我们要强化和法学院的合作,除了合作课题,也要把检察官送到我们政法大学来做培训。刚刚汪教授提出了公法上的问题,认为苏州市司法办案共享平台可能会导致宪法上公检法机关间的权力失衡问题。我认为公法上的问题并不存在,因为在刑事诉讼中分工负责互相配合互相制约是原则,恰恰是我们通过这样的联通,使得监督成为一种日常的状态。这正好体现了互相配合、互相制约的关系。周博士后提到了区块链技术,我们也专门建立了一个区块链实验室,积极与相关部门合作,利用国家地理测绘数据,扫描我们的山河大地,湖泊河流,把可能存在水土环境污染、生态破坏的点都通过卫星图像标注进行比对。然后把这些信息提供给检察机关,他们会做出检察建议或者提起公益诉讼等等。至于许老师讲的大道至简,包括刚才同学讲的被遗忘权,现在对这些数据的使用,目前确实在法律上没有很好的界定,对数据使用的权力也依然没有规范,这方面我想还是有很大的空间。目前立法部门已经开始对这些个人信息进行立法保护,有大量的案例正在出现,我想我们以后可以再做更深入的交流。谢谢各位!






傅抱石 · 春风杨柳




讲 座 信 息 




往 期 荐 读





欢迎点击“阅读原文”

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存