【专论】检察机关如何跟上大数据时代
大数据在应用过程中,其所侧重的量化分析、相关关系以及概率思维等将对司法环境带来诸多改变,如提升司法公信力、快速预测类案发展态势以及规范司法等,同时也对检察机关提出了理念、体制和应用上的种种挑战。检察机关要实现管理模式的精细化,必须转变观念,培养大数据意识,建立数据基础平台,开发业务应用,加快复合型人才的培养,同时加大个人信息保护力度,从而真正做到全方位的信息共享,实现“智慧检察”的目标。
若想大数据成为新时期检察工作突破瓶颈的新思维、新路径,必须抓住大数据的时代脉搏,学会三样技能,即收集数据、使用数据和开放数据,且应围绕这三项技能构建机制。具体而言,可以从以下几个方面着手。
大数据不仅带来技术上的变革,更带来人类思维模式、意识理念的变化。检察人员不仅要熟练掌握法律规定,更要与时俱进,充分了解并跟上时代的发展、社会形势的变化,尽快转变传统的办案思维,树立大数据意识,学会运用大数据方式办案、办公。当然,大数据意识本身是个复杂的体系,包括数据开放共享理念、数据化理念、数字化管理理念等多元化体系。检察人员在具体工作中,应重视数据、尊重数据,“让数据发声”,从关联数据信息中发现问题、判断趋势、策划解决方案。
与此同时,还应转变原来的管理观念,增强服务意识。很多检察人员对全国检察机关统一业务应用系统的运行效果不甚满意,有些工作数据在纸面上完成后,还需要再录入系统中,某种程度上反倒加重了工作量。有鉴于此,有关部门在进行相关系统、应用设计时,应转变传统的“管理意识”为“服务意识”,从服务于检察官办案、辅助检察官办案的角度出发,确保大数据办案系统操作的便捷性,如此才符合提高办案效率的大数据司法应用初衷。在大数据时代,费时费力的资料收集等工作,可以交给大数据系统的人工智能操作完成。这不仅是人力的大解放,效率的大提高,也是科技辅助办案,智能办案的大进步。
大数据在改变我们生活方式的同时,也会带来新的社会风险,改变原有的信息秩序。毕竟,大数据的核心思想就是用数据规模剧增来改变现状。尤其是信息收集的广泛性使得公民的所有隐私均有暴露于众的可能性,因此,对公民、企业信息的保护应该在立法层面予以重视,尽快完善相关法律制度。
另外,在大数据时代,对信息的保护不仅应着眼于静态的数据信息本身,还应着眼于动态的数据处理过程。因为大数据时代是动静态相结合的信息秩序,对两者状态的任一破坏,都是对大数据信息秩序的侵害。传统数据信息保护模式侧重于数据本身的保护模式——结果犯保护模式,注重静态数据本身的保护,对数据本身的破坏,如对以窃取、收买或者其他违反国家规定的方式,向他人出售或者提供个人、企业信息数据的行为,均进行否定性评价,以刑法加以规制。在大数据时代,对信息秩序的保护应同时侧重于数据动态处理过程的保护——行为犯保护模式,对合法的数据处理过程进行非法破坏,如擅自收集、分析、利用他人信息的行为,或者非法对数据加以处理加工的行为,均进行否定性评价,以刑法加以规制。采用“结果犯”加“行为犯”相结合的保护模式严密了信息秩序的保护网,更能有效地打击各类非法采集、利用数据的犯罪,助力于大数据的可持续发展。
信息素质,顾名思义,就是利用信息的素质能力,在大数据时代,主要是指主动收集、分析研判、甄别使用信息的能力。身处大数据时代的检察人员,应当对各类新事物保持一定的认知能力,并能将法律规范适用于新类型案件,能在司法实践中对新事物、新案件进行准确的表述和概括。在大数据时代,仅靠法学专业知识是无法适应时代发展需求的,因此需要具有多学科背景特别是计算机技术背景的人才,如引进具有大数据应用经验的专家等,充实到检察队伍中,同时应积极创造条件,培养高端的复合型人才。
诚然,培养高端复合型人才需要一定的时间,当务之急是要提高经验丰富的司法人员的信息素养,让能熟练应用大数据去解决司法问题的经验丰富的研究者或者实务者参与检察系统人才培训方案的设计,培训时聘请实践经验丰富的专家、学者等讲解大数据相关知识、程序规则、数据挖掘、网络电子证据固定、司法实践案例解析等内容,加强新知识、新技术的学习更新,提高司法人员的大数据运用能力。唯有如此,方能在办案过程中做到事半功倍,让科技力量在检察业务中的作用得以充分发挥,从而真正实现办案的精细化、现代化。
拥有海量数据源是进行检察大数据应用的基础。当务之急是打通检察系统数据壁垒,盘活已有的数据资源,并推行“人—机”互动的数据自动采集机制。具体可从以下几方面展开探索:
01
建立数据共享机制
借助当前建设国家检察大数据中心、“检务大数据资源库”的契机,最大程度打通数据壁垒,建立检察数据共享机制。具体而言,可以从以下几方面展开工作:第一步,各检察机关的统一业务应用系统中都积累有海量的文书等数据,可充分盘活系统中数据,作为大数据检察应用的基础。第二步,在此基础上,不同地区的检察系统应当有权限地开放数据系统查询、共享机制;不同级别检察系统之间应当适当开放数据查询、共享机制。第三步,检察机关应进一步与社会其他行业,如银行、税务、金融、证券等行业建立数据共享机制,将外部行业数据资源引入检察系统。
2
推行卷宗数据化
卷宗和法律文书是最主要的数据来源,卷宗包括历史卷宗和在办案件卷宗,其中也包括刑事裁判文书。通常将经过数据化处理的电子卷宗称为“数据卷宗”,其比“电子卷宗”的定位更进一步。具言之,从卷宗里抽取出罪名、地点、手段、情节、量刑以及其他要素,并将各要素汇集存入数据库,在此基础上进行数据化处理,开展各类大数据与人工智能的开发。
制作数据化卷宗主要依据文本分析技术。具体而言,将卷宗、裁判文书和法律法规进行扫描识别,然后应用语义分析的分词软件程序,将卷宗中的文字按词汇进行分割,分出一个个的独立的词语,并进行词性及词意褒贬判断。在此基础上,建立相应的字典库,如:法律法规库、卷宗库、裁决文书库及量刑库等,数据可检索、可关联,为大数据检察应用提供条件,也为针对新卷宗抽取数据提供方法策略。
3
物联网数据采集
大数据时代的特征之一便是“万物皆可数据化”,而将万事、万物进行数据化的基础便是“物联网”技术。不同于当前的人工事后录入数据机制,在物联网技术基础上,过去很多不被关注的数据都将被自动记录、保存下来。概言之,检察数据物联网的核心就在于推动法律人行为的在线化,推动办案过程全程留痕。
检察数据的物联网采集可从以下两个方面着手:(1)办案过程全面数据化。对全国检察机关统一业务应用系统进行改良,检察官直接在业务系统中办案,除了文书数据外,系统自动记录相关操作元数据,并对之进行汇总、统计及分析。(2)办公过程全面数据化。运用物联网技术,将检察官出勤时间、在线办公时间、文书审批流程等全面数据化,为数字化检察管理提供条件。
事实上,信息共享平台的搭建,除了检察系统自身外,还应积极引入外部数据,实现与外部数据的对接,如与公安系统和法院系统的信息共享衔接。公安机关处在刑事案件侦查的初始阶段,掌握着刑事案件的原始信息,加之公安机关日常承担大量社会治安综合治理工作,其所拥有的信息库是包罗万象的。法院处于刑事诉讼流程的末端,其对刑事案件的审判具有终局性,但囿于地域差异,法院对刑事案件的定罪量刑具有明显的时空性。对于处于刑事诉讼中段的检察机关而言,若能实现与公安机关、法院的横向信息共享,其监督的触角可实质性地延伸至刑事案件的立案和审判执行阶段。对于公安机关提请批准逮捕和移送审查起诉的刑事案件,通过提取法院对类似案件的判决、裁定,检察机关可以对刑事案件的未来走向作一个预测,便于在审查批准逮捕阶段对犯罪嫌疑人的社会危险性作全面客观的综合性分析,在审查起诉阶段对被告人可能判处的刑罚做到心中有底。特别是在当前认罪认罚从宽制度试点中,依托信息共享平台,便于在对轻刑案件作出快速处理时有比较客观公正的标准。
大数据时代,在改变思维理念和方式的前提下,可以将大数据方法引入检察机关的管理领域,各种数据任由调取,真正实现检察工作“运筹于帷幄之中,决胜于千里之外”,打造“智慧检察”,改变以往粗放型的管理模式,构筑精细化的检察管理运作模式。从现实出发,依托全国检察机关统一业务应用系统,全国四级检察机关可进行互联的网上办案,将案件的受理、审查、处理结果及案卷归档、移送、备案等工作流程全部纳入统一的办案系统,实现对各级检察机关办案工作的全面、动态和实时监控,确保每月上报至最高检的统计报表数据均从数据中心自动采集,及时生成,为实现检察机关办理案件的科学化分类、多元化检索和量化数据比对分析奠定基础,从而实现检察统计工作的统一化、自动化和精确化。具体而言,在拥有数据源的基础上,可以在以下领域开展检察大数据应用:
01
智能生成起诉书
根据起诉书的格式,可以从卷宗里面对应的书证、笔录及法律文本中抽取相应的元素;罪名对应的法律条文可以从法律文本库中抽取;犯罪事实部分,不同的案件有不同的叙述形式,在叙述案情部分一定要围绕法律法规所涉及的量刑要点去叙述。在此基础上,还应当由检察官对智能生成的文书进行审查及修改。
2
大数据量刑
表面上看,量刑情节是交错的、复杂的,深入分析量刑过程就会发现,量刑情节是一个有序叠加的过程。对于法律列举有量刑情形的罪名,按照相应的公式可以计算得到刑期。大数据量刑可依据以下步骤展开:第一步,应用大数据机器学习的方法建立每种罪名的量刑模型;第二步,运用文本分析法从卷宗中提取犯罪情节;第三步,将案件要素代入模型公式计算,对与犯罪情节相对应的刑期进行加减,并由刑法总则对之进行比例调整。这样就完成了对一个新案件的大数据量刑。
3
智能摘录证据
传统的证据查找依赖于纸质卷宗,效率低。有了数据化卷宗,可以根据语义分析技术应用查询功能,直接定位到有关证据内容的位置(如同百度搜索一样),在此基础上进行证据摘录,并通过机器学习方法,探索自动化、智能化证据摘录。
4
智能讯问
机器通过对证据摘录和证据分析行为的学习,将具备一定的证据分析鉴别能力和智能讯问能力。由人工智能汇总分析以往讯问笔录,找出规律和适用场景,在新案件的讯问中,可以根据需要使用相应语言和策略。
5
诉讼文书告知
北京市检察院全面整合了历年来的办案数据,把50万件案件数据打造成为“检察大数据”,为司法办案决策提供帮助,形成了全面、全程、全要素覆盖的“检立方”。这种信息化服务实践“检立方”的运用,为检察机关适应大数据时代的转型升级积累了宝贵的经验材料。可借鉴“检务云”的操作模式,将诉讼参与人在刑事、民事诉讼中享有的权利义务汇编成册,对刑事案件在检察环节的权利义务告知工作进行规范化运作,推行诉讼文书书面告知统一进出口,由检察机关的案管部门实行统一告知。与此同时,对于案件在检察环节需要向犯罪嫌疑人、被告人告知的,由案管部门统一开具诉讼文书并组织专门人员告知犯罪嫌疑人、被告人。通过同一案件管理系统,对延迟告知、未告知等各种不规范司法行为进行监督,对告知期限进行实时提醒,确保对犯罪嫌疑人、被告人权利义务、诉讼阶段告知等义务真正落到实处。
6
建立网络舆情研判与预警系统
检察机关通过系统内外的共享信息资源,可以对网络舆情进行实时监控、研判。对于可能出现舆情的重点阶段、重点环节、重点部门、重点群体的网络信息进行监控,系统根据指定词条指令,自动生成日通报、周研判、月分析和重大警情专题研判,强化网络舆情研判分析工作。对一些社会公众广泛关注,可能酿成社会公众事件或群体性事件的舆情信息,第一时间发布预警信号,必要时启动防控预案。
7
多维度推送
这里的多维度推送,包括类案推送、相关法规推送等。(1)利用人工智能识别出案件的难点,在历史卷宗中,找到类案进行推送,供办案人员参考。(2)补充知识体系。通过人工智能侦测到办案人员知识体系的不足,有目的地推送相关法律法规。(3)延伸思考。推送有利于提高办案人员阅读兴趣的教学模式,形成办案与教学培训相得益彰的效果。
综上,大数据时代释放出来的巨大价值使得我们选择大数据的理念和方法不再是一种权衡,而是通往未来之路的必然选择。检察机关应当适应大数据时代的思维模式,加快推进检察管理模式的创新升级,突破信息孤岛困境,实现全国检察机关跨部门、跨层级、跨业务、跨行业的多维度数据共享平台,变被动监督为日常化的主动监督,充分发挥法律监督者的职能,让大数据所蕴含的巨大能量转化为检察机关发展的前进动力,让科技真正服务于检察,助力于检察。
原文载于2017年《人民检察》第15期,有删节。
《人民检察》法治理论的前沿
检察实践的新知