从“绿皮车时代”迈入“高铁时代” ——智能语音识别全面进入浙江法院庭审记录
日前,浙江省高级人民法院自主研发的首台智能语音识别一体机成功推出,并将在全省法院范围内推广应用。智能语音识别机将进一步推进浙江法院庭审记录改革和审判工作效率的提升。
便携式智能语音识别一体机将原本较复杂的软、硬件系统高度集成化,装在小小的手提箱里,能够在多种庭审、合议及会议场景中提供智能化、系统化的语音识别转写服务,携带方便,操作简单,且保密性强。
作为深化改革的先行地区,浙江市场化程度较高,一些矛盾纠纷也先发、易发,浙江法院受理的案件量近年来持续高位攀升,10年间增长了1.6倍。为缓解案多人少的突出矛盾,浙江法院向科技要生产力,开发应用智能语音识别系统,目前已在全省105家法院推广应用,以科技进步保障庭审记录的革命性变化,使信息技术带来的改革红利转化为审判效率、促进司法公正。浙江被最高法院确定为全国唯一的庭审记录改革试点省。
录音录像代替传统书面记录
传统庭审,书记员要全程记录。庭审记录方式经历了诸多换代升级,最早是手工书写,后来是键盘录入电子文档。
为方便书记员记录,诉讼参与人庭审发言时往往要刻意放慢速度;庭审后,当事人、律师、公诉人还要花上大量时间核对笔录;庭审笔录经过书记员的理解、归纳或多或少会存在偏差,有时还可能因书面庭审笔录记录不全面或不准确,引起当事人对司法公正的质疑。
浙江高院为深入推进司法公开,倒逼庭审规范,提高办案效率,进一步深化以审判为中心的诉讼制度改革,学习借鉴域外法院先进做法,依托全面覆盖所有审判用法庭的2078个高清数字法庭,于2014年8月在全国首开先河,积极探索以庭审录音录像代替传统书面笔录。截至今年1月,全省法院已试行476729件,其中,2016年试行319951件,占同期开庭案件数的58.16%,28家基层法院的试行率超过80%。
“庭审记录改革后,书记员记录负担显著减轻,有了更多的时间和精力从事其他辅助工作。”浙江高院审判管理处处长姚海涛介绍,庭审记录改革的“蝴蝶效应”显现,整个审判流程都发生了一系列重大变化:法官的庭审注意力更加集中,庭审节奏更加紧凑,庭审活动更加规范,庭审驾驭能力得到提升,不仅庭审用时明显缩短,而且调解撤诉率、当庭宣判率、平均审理天数等审判质效数据全面提升;对当事人及其他诉讼参与人而言,庭后校对笔录的时间也省略了,同时有利于规范庭审言行,落实直接言辞原则,防止随意否定、修改庭审发言;此外,简式裁判文书、文书签发权限等改革措施也在庭审记录改革的倒逼之下得到了显著推进。
“视频+音频+文字”记录体系
录音录像代替书面庭审笔录后,也给法官和当事人带来不适。对法官而言,要直接采集笔录内容制作文书不便;当事人上诉或申请再审的,书记员需要誊录笔录,比较费事。
为此,2016年3月,浙江高院启动智能语音识别项目的研发工作,5月智能语音识别系统在杭州西湖、上城、下城等部分法院试运行,并于8月底正式在全省法院推广。配合现有完善的高清数字法庭系统、庭审录音备份系统和“审务云”,形成了“视频+音频+文字”的全链路、多层安全、同步识别的智能记录体系。
据介绍,浙江法院智能语音识别系统具备语音自主学习能力,可以自动学习历史案件数据,结合不同法官和诉讼参与人的语音资料进行有针对性的学习,哪怕带有一定口音的普通话,机器经过反复的学习和模型训练,识别率也可持续提高。
为提升当事人姓名、案件特定关键词的识别率,还可以提前导入案件起诉状等内容,让机器进行提前学习。在试点初期,机器对“闭庭”“上诉人”“异议人”等法律用语的识别率不是很高,浙江高院安排语音识别服务器对司法审判有关的知识库进行了大量学习, 51 29599 51 15231 0 0 4025 0 0:00:07 0:00:03 0:00:04 4025大提升了对于庭审过程中法言法语的有效识别。目前整体识别准确率可以达到90%以上。
浙江全省法院2078个审判用法庭已全部建成高清数字法庭,并在全省90个看守所和21所监狱全面建立远程视频室或数字法庭,所有开庭案件全程同步录音录像。语音智能识别系统,能够最大程度地利用数字法庭的现有设备,比如麦克风、语音采集主机、语音分频器以及显示设备,保证了数字法庭设备的高效利用,无需另起炉灶,一般情况下,每个法庭只需新增一台语音采集设备即可。
同时,该系统由浙江高院在云平台上一次性集中部署,不需要每个法院分别购买服务器硬件,有效降低了法院的采购时间、经费投入和运维成本。
庭审记录“一键开启”
智能语音识别系统专门针对法院工作场景开发,主要为庭审、调解、合议、听证、审判委员会讨论、制作文书、文书校对、12368诉讼服务热线等办案环节提供语音转写服务。
记者进行体验,操作很简单,只要点击安装在电脑桌面上的软件即实现“一键开启”,还提供开庭、休庭、复庭、闭庭等操作。系统可根据案件性质、诉讼参与人多少等不同情况,预先设置身份,语音文字转换时自动注明发言人角色,自动区分庭审发言对象及发言内容。语音识别过程中,法官或书记员还可对识别出的文字进行实时修改或标注,系统会自动匹配标注部分的录音,方便查看、编辑。
截至目前,全省法院数据中心已汇聚近300万个案件的庭审录音录像。“由于庭审中产生的大量语音属于非结构化数据,以前无法直接对这些进行数据分析、挖掘和利用。”姚海涛说,现在借助语音识别技术,可以充分挖掘这一“富矿宝藏”,将语音数据不断转化为文字数据,可以进行高频词分析、内容检索、争议焦点归纳、法官庭审习惯分析、当事人画像、案件预判、知识挖掘等大数据利用,更好地服务法官办案、服务审判管理、服务人民群众。
语音智能识别系统的全面推广,推动庭审记录从“绿皮车时代”迈入“高铁时代”。
搭上这列“高铁”的杭州市西湖区法院法官林阳说:“以前庭审笔录经过书记员的理解、归纳,或多或少会存在偏差,而现在能够原原本本记录发言人的意思。作为法官,能更好地把握当事人的情绪及意向,有利于之后的调解工作或者判决书的撰写。”
杭州市滨江区法院法官叶伟说:“语音识别自动生成笔录,书记员就可以从记录这块工作中解放出来,用更多的精力和时间辅助法官从事其他工作。另一方面,语音识别自动生成笔录还可以提高庭审效率,法官也可以在庭审中全神贯注集中精力主持庭审,这样可以提高庭审效率,更有利于公开、透明和公正。”