其他

技术能为审判公正做什么?| 法律人在云栖大会上的演讲

2017-10-20 智善法律新媒体 智善

作者:邹劭坤

来源:元典法律大数据

投稿邮箱:zhishantougao@163.com

首席内容官:智善爷爷(18995580086)



刚才听了很多技术方面的专家分享,我发现其中有一个共识:技术要应用到行业,要走到最后一公里或者说技术要实现自我突破, 就需要在行业内找到切实的痛点,能够让用户愿意用、更多地用,如此技术才能真正实现落地。



你的一生可能不会和医院打交道,除了出生和死亡。但你的婚姻、你的劳动关系、你的买车买房等行为一定会和法律发生联系。某种程度上可以说,技术和法律的亲密度应该超过多数行业,那么技术能给法律带来什么样的变化呢?


中国古人有句话叫做【天行健,君子以自强不息】,古人把公平、正义这样的责任交给上天,希望上天是全知全能的,天道可以还给每个人公正。而现实中有这样的一群人实际上代表着或者说被寄托着我们对公平正义的期望,这群人就是法官、检察官和我们的公安干警。他们在自己的工作岗位上通过每一个案件去实现我们期望的公平正义。


但现实中公平正义的实现也不是一件容易的事。比如一个刑事案件的庭审中会包括控辩双方,控辩双方为了说服法官,实现自己的正义,让法官支持自己的请求而不是对方的请求,就需要向法官提交更多更充分的材料。而且很多的案件,尤其是复杂的民事和商事案件中,双方往往会陷入一个认识误区,就是我们提交的证据越多就越有理。法官需要从浩如烟海的证据中抽丝剥茧才能找到还原最客观的真实、能够支持最后裁判的有效证据。


我们来看一组数据,仅在2016年一年全国总共开庭1500万次,涉及金额4.98亿元,而我们的法官有多少呢?只有区区12万的员额法官。



大家可以想象一下这么一组数据背后代表的是巨大的业务压力和行业现状。就以我们现在这个点来说,在已经过去的一个小时中,10000起案件正在开庭,有超过60000人正在参加庭审。


法律是我们生活的一部分,它像空气一样时时刻刻都存在,你虽然可能没有感知到它,但你的生活不可能离开法律。对我们很多人来说可能没有去过法庭,所以在此我准备了一个示意图:



大家可以看到,现实中法庭的格局其实是有一些拥挤或者说拘束的。法官坐在正中间,书记员坐在法官的下首,控辩双方坐在法官的左右两端。在这样的一个格局里,法官要在有限的时间内去听取控辩双方的意见,去还原一件几个月、几年、乃至十几年之前的发生的事情。


这个场景下,法官的困境一目了然:在一个固定的场景内充分听取控辩双方的意见,并在有限的时间内还原案件事实,做出合理、合法、有依据的裁判,这是摆在每一个法官面前的难题。


对于这个困境,我们还是回到中国古代的智慧里寻找答案。还有一句古话,叫做【君子善假于物也】。从无至今,我们发明了各种各样的仪器来突破我们人类肉体的限制,借助器物的力量来完成我们无法完成的任务。而在科技时代,我们要做的就是借助科技的力量给法官赋能,帮助他们解决面临的困境。 



这是今年9月26日央视的一个报道,报道的是北京西城法院利用互联网审理案件。我们可以看到这个庭审是通过互联网直接完成的。我的一个法官朋友对这次的庭审做了一个特别好的总结,叫做【千里恩怨一线牵】。这个【线】可以是互联网的网线,也可以是庭审数据的数据线。这样的方式,实际上是技术为法官赋能最简单的一个应用,解决的是一个最实际的问题,就是用远程视频庭审的方式解决固定场所的困境,参与庭审的人不用再聚集到一个地方了。


但是我们做个延伸思考:如果你足不出户就可以很方便地向法院提起诉讼,那么产生的直接后果是什么?


我想最直接的后果就是诉讼大量增加,相应的法官的工作量会巨幅地增加。因为诉讼成本虽然降低了,但相应的矛盾并没有消除,这些案件的解决最终还要依靠法官的裁判。相信很多人也遇到过一些法律纠纷或者我们朋友碰到了一些法律纠纷,之所以没有去法院,很大程度上是因为地域的因素,诉讼成本太高,所以最后不了了之。


而现在,借助科技的因素,我们可以很轻松地提起诉讼。虽然我们轻松了,但法官就不轻松了,这个时候我们需要借助科技的力量为法官【赋能】。


我们先来看一个例子 :


(点击图片可查看大图)


左边是语音输入技术,相信这个技术大家都很熟悉,但对于右边生活用语转化为法言法语的技术估计很少人有接触。我们为什么要做这样一项技术呢?


大家都知道人的说话速度是300字/分钟,那么在一个小时的庭审中,控辩双方激烈交流,再加上相互之间激烈的诘问,如果这样语音全部转化为文字,我们得到的是50页的庭审笔录。


根据我们现行诉讼法的相关规定,庭审笔录必须经过庭审参与人的签字确认。一个案件庭审开了一个小时,而50页的庭审笔录要签多久,字斟句酌地回顾庭审笔录,可能耗费的时间要超过一个小时。


同样的,法官要从这50页的庭审笔录中寻找有效信息,也是一件耗时耗力的事情。所以我们研发出这样的一个技术,将庭审过程中当事人的陈述直接转化为法言法语,大量减少了法官记录、理解和查询的工作量。


这个案例也是技术到应用最后一公里的跨越。


当然这一切不是一蹴而就的,我们有一个后台的支持产品,叫做华宇拼音输入法,它还有一个大家都熟悉的名字,叫做紫光拼音输入法。这款产品面世十八年以来,我们已经积累了4万条法律概念,超过6万条专属场景下的法律词汇。借助这些技术,我们在过去的一年中和各方的合作方建立了超过5000家科技法庭,累计了超过30万小时的庭审视频。 


在这个过程中我们让技术和场景实现了完美融合。我非常喜欢王坚博士《在线》中的一句话:大数据是要用到场景中来让你的客户更好地完成业务,他才会有动力去拥抱这项技术,这个时候你的数据才是活的。


让法律数据变成活动,升级到数字法庭,我们的核心是【华宇法庭之芯】。借助法庭之芯,我们不需要升级硬件,只需要借助系统就可以完成数字法庭的升级,让技术变得方便、快捷、即插即用。


这个时候我们可以看到,通过技术我们实现了对法庭的数字全纪录。但这不是全部工作,也不是终极目标。之前我在研究IBM watson的时候,最欣赏他们的一个概念是:当数据被记录下来以后,最需要的是提升对数据的洞察。记录数据不是我们的目标,我们的目标是从大量的数据中洞察出对司法人员、对庭审的参与人员最有价值的信息。


而最能体现数据洞察的就是我们的智能证据调用。


法律行业有一句谚语,叫做【法庭之上没有事实,只有证据】。听起来似乎有点蒙,但对于法官来说这是一条真理。只有证据证明的事实才能被法官认可,可以想见庭审的主要环节就是举证质证,从证据中再现事实的真相。但在传统的方式中,比如我们在美剧、在《人民的名义》中看到的,法庭中对大量的证据是以纸质的方式呈现,是通过翻阅、传阅的方式来完成质证。而现在随着技术的革新,我们有了新的证据处理方式:


(点击图片可查看大图) 


借助智能证据调用系统,我们可以实现让机器根据人的指令对特定证据做调用、呈现,消弭了控、辩、审三方在法庭上信息的不对称和展示的困难,不用再经过翻阅传阅,三方都可以实时地看到所需要的证据。


但这个还不是全部,这只是我们做的第一步。


正如上面说到的,法庭是根据证据来还原事实的,那么随着证据的出示,证据所证明的事实也会不断地被梳理。第二步,智能证据调用系统会在后台记录这些事实。


比如通过对证据证明时间线的梳理,系统就可以按照时空的维度对证据证明的相关事实作出可视化的图示,从而还原整个案件的全貌。


说一件我个人的经历,我经过的一次庭审涉及诉讼报告20万字,庭审整整开了两天,从早上八点一直到晚上八点。大家可以想象,第二天参与庭审,不管是

我还是法官或者对方对前一天的案件事实的记忆都会很模糊。但如果我们引入机器在后台做全程辅助,并建立起相应的数据循环,那么机器就可以帮助我们完成相应的事实梳理。


但同样,这个还不是全部。第三步是法律人最喜欢说的【法律之美在于逻辑之美】。就像医生看病需要望闻问切,法官也需要有一套法律逻辑来分析案件事实。这套法律逻辑怎么来的呢?是基于我们多年的法律训练,是从大量的实践经验中积累出来的。我们借助科技的力量,通过公开的裁判文书中进行机器学习,对每一个案由下的法律逻辑由机器辅助人类进行详细的梳理,可以清晰地呈现出每个案件的争议焦点以及证明案件事实所需要的证据材料。 


(点击图片可查看大图)


这是从事实到逻辑的一个飞跃。但做到这一步,依然不是我们的全部。


有人曾经说过【法律的生命从来不止于逻辑,更是经验】。比如我们在选择律师的时候,一个年轻律师和一个老律师,多数人会选择后者,因为后者的经验更加丰富。


传统的法律人积累经验是一件非常漫长的事情,需要通过长时间的学习、实践、领悟才能获得经验。我们常说的一万小时定律就是对传统经验积累最好的注解。我们希望通过法律人工智能来加速法律人经验的积累。


那么现在的法律人工智能能做到什么程度呢?我们来看一个案例:


假定有一天某人喝着小酒开着车,在回家的路上发生事故,连续撞了好几辆车。这个案例在事实上会被称之为醉驾或者酒驾,这样的行为需要承担什么样的法律后果呢?遇到这样的方式,多数人的选择肯定是第一时间咨询律师。但除了律师之外,我们现在有了第二种选择。我们可以把这个事实输入给机器,机器通过对已有裁判文书的分析和学习,首先会提醒这样的事实有可能会构成刑事上的危险驾驶罪,还有可能会涉及责任保险方面的赔偿纠纷 。




同样,这个还不是全部。机器可以在事实分析的基础上为我们定量分析可能承担的法律风险或者法律后果。 


(点击图片可查看大图)

正如大家看到的,机器会通过对事实的识别将影响裁量结果的因素识别出来。借助法律知识图谱,分析出与事实相关或者相似的案例,对相关事实做量化的分析。


(点击图片可查看大图)


还是以上面的案例为例,我们可以通过机器的分析看到超过70%的案件被法官判处刑期为3-4个月有期刑,同时还有不到10%的案件判处刑期超过5个月,过半的案件被判处了缓刑,将近100%的案件判处了罚金。


也有人会说这样的数据过于冰冷,而且只能用于个案。假如说我没有什么具体的法律纠纷,就想简单了解下某个地区的裁判口径或者要旨。比如说我住在北京东城区,我想知道东城区法院对上面的案件怎么判。我们同样可以以法院或者法官为维度,提供针对特定法院或者法官的裁判数据分析。这个功能在我们新上线的一款产品【元典智库】中已经可以看到。 


(点击图片可查看大图)


也有人会说你说的这些都是实战的例子,但不同的法官在能力、认知方面都存在差异,为应对这个问题,我们还增加了对案件学理分析的信息,我们把所有的学术观点通过知识图谱的方式加以组织、呈现。


(点击图片可查看大图)


回顾整个流程,我们所有的输入只是最前面的一段事实。而随着语音技术的发展,后续甚至可以通过说的方式便捷地完成事实的输入。


从某种程度上来说,我们实现的是全场景下的知识辅助,从案由甄别到量刑辅助、到智能推送、裁判观点、专家精释。我们把一个场景下你需要知道的或者你应当知道的法律知识做了完整的呈现。 



借助这些技术,我们可以有效地减少至少75%的庭前阅卷时间、可以将案例推荐匹配度从20%提升到90%,实现精准推荐效果;还可以将笔录的修改时间从五十六分钟缩减到八分钟,将庭审记录的信息完整度从30%提升到100%,同时可以提供超过80%的量刑精准度分析、70%以上庭审文本的自动生成。


在过去短短的一年时间,我们通过对全国各地数字法庭的优化,逐渐形成了我们称之为【智慧法院】的载体。从去年十八大四中全会开始,我们国家提出了以审判为中心的法治中国路线图,我们希望未来可以以智慧法院为核心串联检察院、公安、司法行政、社区矫正,形成一张中国法治的数据云图。



我们希望【让机器逐渐具有法律概念的认知能力】,帮助人们降低获取法律知识的门槛;我们希望【打破数据的孤岛】,将和法律相关的应用集成循环,把数据和场景集成循环,为数据的运用和技术的迭代去打破最后一公里;我们希望将语音识别、知识图谱这样的智能科技和华宇十六年来建立起来的法律生态相结合,还给这个社会、这个行业一个有智慧、有温度的、懂我们的法庭。








责编 | 方晶

戳“阅读原文”看更多“精选文章”

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存