查看原文
其他

大数据背景下人工智能 “嵌入” 公安执法办案的探索与展望

陈克强,孙宇翔 情报分析师 2022-09-26



情报分析师

全国警务人员和情报人员都在关注

关注

摘要: 总结各地探索,执法办案人工智能在实践中的价值主要表现在: 有利于 “管理对象” 向 “服务对象”转变,有利于 “事后监督”向 “智能审核”转变,有利于 “侦查为中心”向 “审判为中心”转变。但其进一步发展仍面临着若干亟待解决的难题 : “理念”问题———认识的偏差与固化 ; “燃料” 问题———数据的来源与结构 ; “引擎”问题———算法的歧视与黑箱 ; “人才”问题———专业教育与人才的缺乏。当前不是人工智能要不要介入的问题,而是如何介入、介入程度、融合程度的问题。应在总体定位、 主要功能、建构要素等多方面发力,全面推进大数据背景下人工智能 “嵌入”公安执法办案进程。



1. 探索应用

  1.1 实践探索

近年来,中央对人工智能高度重视,国家对此进行了战略支撑,各地对人工智能影响与介入公安执法办案领域进行了大胆探索,贵州省、上 海市、江苏省苏州市、浙江省等地政法公安机关 相继推出各种智能执法办案系统,成为这一领域 的先驱。 

1.1.1贵州 : “一尺办案”+ “数据铁笼”+ “共享平台” 

贵州省从 2014 年起开始进行政法领域人工智 能的研发,经过努力,形成了 “一尺办案” “数据 铁笼”“共享平台”为主的 “贵州经验”,在全国 首开法律人工智能的先河。( 1 ) “一尺办案”是在贵州省公安厅、省高检、省高院联合制定的 《刑 事案件基本证据要求》框架内,对历年因证据不 足不批准逮捕、退侦、存疑不起诉的盗窃、抢劫、 故意伤害、杀人、毒品、诈骗等六类案件,制定 统一的证据标准并转化为数据标准和数学模型, 嵌入大数据办案系统,实现对证据有无、是否完整的智能审查,一个环节有误,将无法继续下一环节,防止 “起步错、跟着错” [4] 。( 2 ) “数据铁笼”是针对物品扣押、讯问过程、物证管理、办案时限等重点领域和关键环节,在执法监督系统中开发了拥有数据监测点的管理模块,实现对违规讯询问行为的立即报警; 对超过法定讯 ( 询) 问时间的自动断电; 对物证、涉案物品、随身物品违规扣押、超期扣押、未按规定移交等行为的预警干预; 对刑事强制措施、办案时限的自动提醒,将执法办案权力关进数据的笼子[5]。( 3 ) “共享平台”是以贵阳为试点,建立政法大数据共享应用平台,公、检、法三家需要的共享数据、电子卷宗等,按照统一的数据规格和交换标准推送到 “政法共享数据池”,相关数据均可互相推送、读取、共享、应用,将三家的“条数据”变为政法系统 “块数据”,倒逼公安机关在证据规格、证据标准上把 “破案”与 “庭审”的要求结合起来, 真正形成 “以审判为中心”的办案标准。

1.1.2上海“206”系统

自 2017 年 2 月 6 日起,上海市组织了数百名 公、检、法、司业务专家和多家国内顶尖技术公 司人员,以 33 家公、检、法机关为试点,以 8 个 区级司法局和上海市律协为调研单位,从统一证据标准、制定证据规则、构建证据模型三方面入手,开展 “上海刑事案件智能辅助办案系统”研 发工作。目前,已完成故意杀人、电信诈骗、盗 窃、非法吸收公众存款等四类案件的证据模型构 建,初步实现智能识别、自动校验、全案证据综 合审查、证据链审查判断等功能,确保提请逮捕、 移送审查起诉的案件符合 “庭审”标准。2019 年 1 月 23 日,上海第二中级人民法院运用该系统公 开审理一起抢劫杀人案件,成为全国首起应用法 律人工智能技术进行判决实例。按照建设规划, “206”系统下一步还将具备社会危险性评估、非法言词证据排除等二十余项功能,代表了目前国内人工智能在证据分析领域的最高水平[7]。 

1.1.3苏州“桌子结构”

2011 年,苏州政法部门在中央、省、市支持下,经过 8 年努力,突破了政法部门间的网络壁垒、数据孤岛,建成跨越四部门业务协同办案平台,公、检、法、司各部门的自身平台系统是 “桌子”的四个支撑,政法共享平台是 “桌面”, 通过 “桌子结构”实现实时数据交换、即时业务协同、动态管理服务等功能。目前已完成了 9 大模 块 102 项功能的开发和整合,涵盖网上流转、网上阅卷、网上换押、远程提审、律师电子阅卷等业务协同流程,达到 “一次录入多次使用、一方录入多方利用”的建设效果[8]。 

1.1.4浙江 : “政法机关一体化办案系统”

浙江公安机关从 2017 年 2 月开始依托浙江省政法数字化协同工程一号示范项目,建设 “政法机关一体化办案系统”。2018 年 8 月,全省公安机关应用该系统,从受立案到侦查终结,用菜单组卷方式一键推送,公安网上电子组卷,检、法部门电子阅查,法院电子判决文书。在此基础上, 浙江公安学习借鉴上海、贵州等地作法,开展 “智能辅助办案系统”研发,将证据标准嵌入办案系统,逐步深化智能办案[9]。

1.2 运用价值

1.2.1有利于从 “管理对象”向 “服务对象” 转变 

近十年的执法规范化建设虽然取得明显成效, 但 “回头看”之后还有很多值得反思之处。通过 比较研究可以发现,各地的建设重点集中在执法 制度、执法管理、执法监督等层面,并且在绝大 多数的执法规范化理论研究中,言及 “执法质量 不高”,必提 “执法监督不严”。事实上,这种因 果关系是未经严格证明但却被普遍接受的一种 “假设”, ① 并且基于此种假设,很多地方的制度设 计往往把执法监督作为重中之重,执法质量考评、 执法责任追究被视为拉动质量提升的最重要的牵 引力,追求一种 “全流程、闭环式、可回溯、终 身制”的执法监督体系,成为各地最为普遍的做 法。在此理念下,执法主体俨然成为整个执法规 范化的 “管理对象”,而非 “服务对象”。其实, 在当前案多人少、办案警力又不可能大幅度增加 的前提下,首先应转变观念,让执法主体 “回归” 本位,对其办案承载能力给予应有的重视与关注; 其次,应考虑如何向科技要警力,人工智能在司 法领域的应用初衷即为 “辅助和服务”法官、检 察官,将一些烦琐、重复的工作交由机器处理, 提高办案的质与效。所以,从服务执法主体、提 升办案效能的角度,人工智能的介入应是深化执 法规范化建设的最大变量。 

1.2.2有利于从 “事后监督”向 “智能审核” 转变 

以近年来福建省公安机关执法监督为例,从 最初的日常考评与专项考评,到 2013 年实行派驻、 专职、兼职法制员制; 2016 年新增自动化考评, 对案件移送与接收、嫌疑人入所等办案程序实行 蓝、黄、红三色预警,并新增百名民警移送起诉数、因证件不足被检察院不起诉等案件实体的考评指标。总体上以考评为主线,推动从事后监督 向事中控制、从程序监督向程序与实体并重的一 个转变,并在很大程度上带动执法办案质量的提 升。但考评与监督还是较为传统的人工审查、书 面审查、案卷抽查等方式。在目前基层办案能力 参差不齐的前提下,基层更需要的是在办案 “过 程中”加强证据指引、程序审查和质量把关,而 并非事后考评监督再来校正案件。目前,贵州、 上海等地通过人工智能将证据标准与规则指引、 证据智能审查等功能嵌入执法办案系统,实现执 法办案过程中的程序与实体审查,不失为一种成 功的做法。

1.2.3有利于从 “侦查为中心”向 “审判为中 心”转变

以审判为中心的根本在于把证据的标准与规 格尽可能拉高到法庭审判标准,所以审前的证据 与程序审查显得尤为重要。目前,公、检、法均 使用各自内网办案系统,无法互联互通,案件审 查需经过提请逮捕、移送审查起诉等正规程序。从贵州 “政法大数据共享应用平台”、苏州 “桌子 结构”、浙江 “政法机关一体化办案系统”的功能 可以看出,其至少发挥了三个作用: 第一,倒逼 公安机关以符合法庭审判为标准,在证据规格和 标准上把 “破案”与 “庭审”的要求结合起来, 依法规范收集、固定、保存证据; 第二,使检察 机关有效发挥对案件侦查的引导,从应对法庭质 疑和辩护人挑战的角度,有针对性地引导侦查人 员搜集、提取、固定证据和完善证据链条; 第三, 使法院充分发挥审判对侦查、起诉环节的制约和 引导作用,防止事实不清、证据不足的案件进入审判程序,最大限度减少错捕错诉错判案件的 发生。


2.现实难题

尽管目前人工智能在执法办案领域进行了十分有意义的开发和探索,前期开发也耗费了大量 的时间和精力,但总体来讲,嵌入程度还较为有 限,也远未达到理想的效果。可以预见,法治化 与智能化的结合成为司法体制改革的一条主线, 未来这一趋势还会继续加强,这是深化执法规范 化建设的必然选择和关键选择。当前,它仍面临 着若干亟待解决的难题。 

2.1 “理念”问题———认识的偏差与固化

  1. 认识偏差

    如前所述,目前执法规范化的理论与实务仍 然局限在执法制度、管理、监督等层面,如何 “把智能化建设作为重要支撑”,在很多地方的执 法规范化改革设计中还缺乏或较少有这方面的认 识与考虑。

  2. 视野局限

    笔者在调研中发现,很多领导与民警对大数 据、云计算、人工智能等认识处于似懂非懂的状 态,大家关注的或能看到的主要是立体化治安防 控、大数据情报等科技应用。但对人工智能在司 法领域兴起或执法办案领域的探索则完全陌生, 甚至在很多人看来,执法记录仪、办案系统优化等 执法信息化建设已经是十分先进的技术了,有限的 视野遏制了人工智能在执法办案领域的探索步伐, 致使目前公安这方面的成果落后于法、检系统。

  3. 思维固化

    以往自然科学和社会科学遵循的是实验验证、 理论推导、科学计算三种基本认知范式。在大数据时代,以计算为中心的理念逐渐转变为以数据为中心的 “第四范式”,并对传统治安防控思维、 侦查思维等产生较大影响。比如,以往“警力跟着警情走”已经是很主动的治安应对,目前,江苏苏州等地通过汇总辖区发案数、人口、天气等参数,计算未来某些高发案区域并提前布置好警力,充分体现大数据 “预测”的核心功能。同样,现在的数据量也无法用传统的个十百千万来指称, 而是 GB、TB 等容量表示,许多案件涉及的数据量早已超越人工处理极限,必须依赖专业人员和机器分析才能解决。总体上,从抽样到全部、从因 果到相关等大数据思维的树立,这点我们明显都准备不足。

2.2“燃料”问题———数据的来源与结构

1.据来源不足

在内部数据来源上,以福建省为例,全省公安机关 2010 年之后的案件已形成电子卷宗,但 2010 年之前的卷宗材料,大多还未实现电子化, 很大程度制约了执法办案数据的完整性; 在外部 数据来源上,公、检、法都有各自的专网与数据 库,出于保密需要未能在各个司法机关之间随意 流转,客观上形成了数据资源壁垒和统计口径的 不协调。另外,很容易忽略的一块数据是我国科 研机构的司法数据库, ③ 这些知名科研机构的司法 数据在建设时间、数据规范、通用性等方面都具 备明显优势,若研发执法办案人工智能系统,这块数据应是重要组成。

2.数据客观性不足

( 1) 电子卷宗的不完整,会造成下一步的算 法难以充分、有效开展数据分析与建模; ( 2) 电子卷宗虽已涵盖人、案、物的基本要素与关联要素,但未涉及一些隐秘性、未有文字记录的侦查、 取证工作,执法办案的全流程信息还欠缺充分性; ( 3) 法律法规、司法解释始终在不断更新,在网 络结构中只要某一事项的重新定义出现过失,就 有可能成倍放大误差,引起自动化处理结果异 常[10]。总之,数据源的不充分必然影响到人工智 能提炼出的数据准确性、客观性。 

3. 数据结构化不足 

结构化数据是人工智能识别的重要前提,对 于机器而言,识别自然语言已是较大突破,但完 全识别法律专业术语还存在很大难度。目前,从 立案到起诉的一套文书对法律主体、案件事实、 法律适用等尚能规范书写,但笔录中还有大量的 暗语、黑话等等,比如在涉毒案件中,关于毒品 的种类和表述就五花八门。此种非结构化的数据, 在目前法律人工智能处理数据能力有限的情况下, 造成了很大的转化障碍,必须通过 “手工”对数 据进行筛选、清洗、分类和 “打标签”。“这种工 作量用 ‘浩如烟海’来形容一点也不为过,每一 点法律知识图谱的构建完成、每一步法律人工智 能的前进都需要付出难以想象的艰辛。”

2.3“引擎”问题———算法的歧视与黑箱

   1. 算法 “歧视” 

算法结果除受数据的有效性、准确性影响之 外,其设计、目的、成功标准、数据使用等,均 是设计者、开发者的主观选择,研发公司及人员 很可能会有意或无意地将自己的 “偏见”嵌入算 法系统,导致算法天生就带有某种 “偏见”。2016 年哈佛大学肯尼迪学院的分析报告指出,目前针 对犯罪倾向性预测的人工智能系统,无论技术人员怎么调整机器学习的策略和算法,“人种”和“肤色”都是无法抹去的高优先识别变量[12]。 

2. 算法 “黑箱” 

2013 年美国威斯康星州法院使用 COMPAS 智 能量刑系统对一名被告作出6 年刑期的判决,该案 件几经上诉后在美国引起激烈讨论,被告认为自 己受到了机器的歧视,要求公开算法。但州最高 法院和美国联邦最高法院认定,初审法院所依据 的 COMPAS 系统算法具有中立性和客观性,维持 原判的同时,也未要求公开算法细节。① 从中可以 看出,至少在美国,法院倾向于保护算法产品的 商业秘密。“之所以说人工智能算法进行深入学习 的过程是个黑盒子,主要原因除了它的保密性外, 更重要的是即使公开了,法官和律师也看不 懂。” [13]同样,国内的科技公司出于商业保密需要, 不会也不可能公开算法的运作方式。目前,很多 地方公安大数据系统建设实行技术外包,民警在 乎的只是系统好不好用、数据关联程度和实战效 能,至于平台的运行原理与背后的算法,一般不 会去了解。笔者认为,公安执法办案权力事关 “准确、及时地查明犯罪事实,正确应用法律”, 在引入人工智能时,应当提前 “提防”算法的 “非透明性”和 “不可解释性”。

3. 算法局限

算法在本质上属于互联网的编程技术,用计 算机来处理 “数值计算”问题时,原问题和数值 化后的问题不存在 “转义映射”,也就不存在所包 含的 “意义或信息”的流失。2016 年 3 月人工智 能 “AlphaGo”与世界冠军李世石的对决,最终以 3: 0 完胜,一方面,AlphaGo 能完胜很大程度上归 功于其拥有一个存储了十几万份公开的人类 6 至 9 段职业棋手对弈棋谱的数据库,囊括人类迄今为 止几乎所有质量上乘的棋谱,所以 AlphaGo 及后代 虐遍围棋、国际象棋、日本将棋的高手实属正常; 另一方面说明,算法在围棋、象棋等 “格式化” 的棋盘里通过模拟人类的 “深度神经网络”,评估 棋局的整体局面,每一步落子都是精挑细选出的比较有前途的棋步。而法律现象则完全不同,其 考虑的不仅是法律与个案的各类构成要素,更要 综合应用司法人员的司法经验、内心考量和内心 确信等诸多要素,这是人工智能目前无法达到的 人类思想、信念、情感、思维。算法可以将很多 事物结构化、格式化处理,但将法律 “算成”算 法时,固然能很大程度上排除自由裁量权方面的 主观任意性,却 “算不出”司法实践经验、证据 取舍、实质正义、内心确信等处理法律问题必定 触及的因素。“因为在案件事实曲折、人际关系复 杂、掺杂人性和感情因素的场合,如何根据法理、 常识以及对机微的洞察作出判断并拿捏分寸进行 妥善处理其实是一种微妙的艺术” 。

2.4“人才”问题———专业教育与人才的缺乏

丰富的 “燃料”、强劲的 “引擎”,离不开 “法律+人工智能”复合式人才的操作。但是,这 类人才在当前却属凤毛麟角,毕竟多数法律人都 未受过将法律推理用符号逻辑进行表述的专业训 练,“在符号主义的框架里面,我们无法教机器学 会我们自己都不会的东西。” [14]面对大数据、人工 智能对法律界的冲击,法学教育还未紧跟上步 伐。① 这种人才只有在具体岗位实践中,凭借自身 的专业、兴趣和刻苦钻研成长而成。而人工智能 介入公安执法办案,在全国范围内尚处探索、摸 索阶段,更遑论相应人才的培养。但大数据时代 已经到来,培养一批善于应用大数据技术的研究 者或实务工作先锋是个现实急需。如前所述的算 法歧视与黑箱问题,“如果是法律领域的专业人士 进行或指导计算机行业的专业人才完成上述工作 或许可以将偏差降至最低,但如果没有法律专业 人士参与其间,偏差可能将无法控制在一个可接 受的范围内。”[15]

3.远景展望

随着人工智能在证据审查、智能审判、文书智能生成等司法领域的兴起,一些学者和司法人员持保留意见或反对态度,认为人工智能的介入将不仅会改变审判模式,模糊司法责任,还会间 接培养司法人员惰性,甚至将来还会取代法官的 主体地位。但不管怎样,技术都是经济与社会变 革不可逆转的变量, ② 更何况大数据、人工智能俨 然已是下一次技术革命和社会变革的最核心的动 力。所以,首先必须明确,当前不是人工智能要 不要介入的问题,而是如何介入、介入程度、融 合程度的问题。以当前人工智能大趋势,既需要 我们跳出公安看公安,前瞻看待、主动拥抱人工 智能; 也需要我们立足当前谋未来,在目前 “有 多少人工就有多少智能”的技术水平基础上,综 合各方面的技术、人才等条件,集中优势资源和 力量,有层次、有步骤地开展研发探索,为深化 执法规范化建设注入强劲动力。

( 一) 总体定位 

以人工智能、公安大数据作为主要技术要素 的 “智慧公安”,本质是警务体系与警务能力的现代化,核心是 “人”的智能现代化。所以发展执 法办案人工智能,不是要以先进技术取代民警的 主体地位,替代办案民警独立思考与判断,也并 非以此取代线下侦查与诉讼活动,而是充分发挥 人工智能在文书校对、证据指引、证据审查、程 序预警、公检法数据共享等方面的作用,使警力 从大量的重复性劳动中解放出来,让民警集中精 力处理核心业务,所以,人工智能在执法办案领 域应当定位在 “辅助”办案的角色。 

( 二) 主要功能 

总体上,法律人工智能嵌入公检法办案系统 可以实现受立案繁简分流、智能笔录、类案推送、 证据指引、证据审查、量刑辅助、偏离预警、数 据共享与交换等功能。从目前一些地方的成功做 法,可以预见未来执法办案领域人工智能将有很大的发展空间。

1. 智能警情分流 

针对以往受立案环节不作为、慢作为、乱作 为等问题,2015 年公安部关于改革完善受案立案 制度的意见出台后,各地主要是通过健全规范、 明确时限、加强审核监督等做法加以解决。笔者 认为,这些 “系统外”的要求在基层还是存在 “可操作”的空间,可以在现有统一执法办案平台 基础上,建立以 “受立案管理中心”为中枢,打 通并整合警情处理、执法办案、执法监督等平台, 建立统一的智能受立案系统,将 “机上、点上、 端上、网上、纸上”各类报警全部纳入该系统, 由系统自动识别警情归属地的公安机关,同步短 信推送至值班领导和民警,所有警情处理网上留 痕,对有警不接、有案不立等情况系统自动预警 并派员监督。通过 “智能分案→系统推送→网上 留痕→预警监督”智能化、流程化工序,把好警 情处置的第一道关。

2. 智能笔录制作 

笔录在案件中占据着举足轻重的地位,有经 验的老民警在制作一些团伙案件、主要案犯的笔 录前都会有自己的审讯策略、讯问要点,在目前 基层整体办案力量不足、经验不足、办案质效不 高的情况下,可以通过技术来弥补短板。2017 年 7 月智能笔录云平台亮相全国司法体制改革推进会, 该软件已具备法定程序提醒、字块提取分析、联 网快速核查、笔录质量检验等功能。笔者认为, 可以在这些功能基础上进行深度开发,由系统根 据案件类型和历史同类案件的笔录数据,生成相 应的审讯策略、笔录模板,并开展全案、同案关 联分析。特别是涉黑、盗抢骗、涉众型经济犯罪 等团伙类案件,不仅需要加强全案统筹把握,而 且由系统提取同类关键字进行分析研判,挖掘笔 录隐含的案件信息,有助于提升侦审的实质效能。

3. 智能证据指引 

证据的极端重要性不言而喻,以审判为中心强调对证据合法性的审查并确立非法证据排除规则,意在切断非法取证行为与案件实体处理结果 之间的关联[16]。但目前基层很多办案人员对证据的收集和使用存在两大难点: 一是不知道收集哪 些证据才能达到证据确实充分的标准; 二是对收 集的证据如何满足证据 “三性”要求。可以针对 办案取证环节中易发、多发和常见问题,根据以 往证据收集与采信的经验、教训,结合法律及司 法解释的程序性、合法性规定和要求,将共适性 判断规则和证据标准嵌入人工智能的模块中,明 确不同诉讼阶段合法、规范的证据要求,指引办 案人员依法、全面收集证据,既防止证据遗漏, 也防止人为恣意[17]。 

4. 智能证据审查 

尽管当前人工智能水平只能在单一证据校验、 证据之间是否矛盾等层面发挥作用,即便如此, 也已经大幅缩减办案人员证据审查的时间。笔者 认为,可以按照证据合法性、客观性、关联性, 梯次、逐层对证据进行审查。第一步: 合法审查, 通过图文识别、机器学习等智能技术抓取、识别、 比对、判断每一份证据材料的时间、人员等证据 合法性的必备要素,对问题与瑕疵的证据,由系 统提示补正或做出解释; 第二步: 客观判断,由 系统按照犯罪构成要件要素将证据进行结构化组 合,通过对案件必备要件、非必备要件的数据检 索,自动判断证据缺失状态[18]; 第三步: 关联展 现,通过系统设计一个思维导图,将案件的重要 事实与关键环节加以标示,当侦查员对某个待证 的关键事实进行点击时,系统自动展现哪些证据 共同指向某一待证事实,且清晰标注证据所在的 卷宗位置,让侦查员对证据间的逻辑与相互印证 能够一目了然。 

5. 智能卷宗管理 

当前,案件纸质卷宗的制作、装订、移送、 归档、查阅等环节,耗费了大量的办案时间和精力,而且在卷宗形成过程中,由于缺乏有效的流 程指引和实时校验,时常出现返工、超期甚至卷 宗遗失等严重问题。在现有人工智能技术下,可 以研发卷宗智能管理功能。( 1) 电子化转换。在 立案立卷中,通过图像识别技术对各类纸质材料 进行高速批量扫描,转化为电子材料并自动分配 “身份”识别编码,实现纸质原件与电子卷宗的身 份关联。( 2) 实时化更新。由系统通过对电子材 料的智能识别、分析、匹配,按照立卷规范自动 分类和排序卷宗材料,生成配套组卷信息,并根 据卷内材料变化进行实时更新。( 3) 辅助化审批。在案件提交审批后,系统根据法制民警和分管领 导的需求,提供卷宗浏览、卷宗批注、法条索引、 关联案件查询、案例推送等辅助审批服务。( 4) 自动化流转。在案件侦查终结后,利用该功能通 过公检法数据共享平台,实现诉讼卷随案移送和 侦查工作卷自动归档,并可随时根据需要一键查询调用。 

6. 智能共享平台 

贵州、上海、浙江等地的公检法数据共享平 台主要分为公安、检察院、法院三个业务模块, 建立统一数据规格和交换标准,实现网上阅卷、 网上流转、网上换押等等。笔者设想,可以在数 据共享平台中添加 “涉案财物管理”模块,附随 建立 “公检法涉案财物共管中心”,当涉案财物需 要随案流转时,通过共享平台直接进行网上移交, 做到 “移单不移物”。同时,应用机器人仓储管 理、RFID 射频标签、二维码等技术,对每件入库

物品实行一物一码、一案一档,实现对涉案财物 的自动存取、动态跟踪、称重统计、台账记录等 等。所以,公检法智能共享平台应成为发展法律 人工智能的一个重要方向和选择,其将更充分地 发挥检、法部门对公安侦查、取证的制约与引导 作用,节约办案时间和成本,优化涉案财物管理, 为智能执法办案的构建提供重要基础。

( 三) 建构要素 

上海、贵州等地研发的智能辅助办案系统应 用的深度神经网络模型是法律人工智能走在前沿 的技术。为确保这一新生 “幼体”茁壮成长,前 期需要将大量人工分类、标注的精细化数据 “喂 养”和 “训练”幼体,待其成长后才具备自我学 习、关联学习和智能识别、分析、判断等强大能 力。可参照人类的感知与思维,建构一个如图 2 的 逻辑导图展示执法办案人工智能模型。

  1. 数据层面

小数据时代,受理念与技术的限制,不论公 安信息化还是司法信息化建设,均呈现明显的 “管理本位”,缺乏统一规划实施,造成数据资源 壁垒根深蒂固。大数据时代,任何人工智能 “机器”,都离不开数据这一 “燃料”,所以,我们期待新一轮的公安改革在大数据库建构方面能有更 大建树。具体到执法办案大数据的建立,可从以下三方面入手。( 1) 内部整合。公安大数据面广样多、载体不一,打通壁垒、整合应用,短期内 难度显而易见。但诉讼活动中的执法办案类数据不存在接口、标准等太多技术上的障碍,也不存 在太多的涉密问题,具备整合、汇聚这块数据的 可操作性。( 2) 外部打通。由于各部门都面临着 法院结案率和上诉率、检察机关起诉率、公安机 关破案率等行政化的司法政绩考评,因此在开放本部门数据时都忧心忡忡,在缺乏相关法律法规的直接规定的情况下,不约而同地都选择数据封 闭[19]。可见,要打通司法机关的数据壁垒,还得 自上而下、高位推动、明文规定各部门数据整合 与共享的义务。( 3) 统一标准。统一的元数据①标 准是在技术层面实现各部门信息共享的前提,司法大数据的元数据建设应包括题名、单一标识、 类别、描述、数据预览、修订历史、许可项、标 签、API 授权项、附属项等内容[20]。因此,应通 过制定统一的技术标准手册,对执法办案类的数 据起止时间、种类、内容、存储、信息交换与利 用等环节的技术操作进行详细规范,以此推动数据共享机制的建立。

   2. 算法层面

人工智能本质上是一种建立在大数据基础上 的学习、分析、判断的算法,司法的公平公正对法律人工智能算法提出了要更加精准和稳定可靠的要求。( 1) 训练数据的全面性。算法歧视的根 源之一在于用过去不准确或有偏见的数据去训练算法,其结果自然有偏见; 再以输出产生的 “问 题”数据回馈系统,使偏见得到巩固和加深,这就是 “自我实现的歧视性反馈循环” [12] 。所以, 应当尽可能用全面、真实的法律数据进行算法训 练; 同时,应用数据挖掘技术加以检测和矫正, 最大程度防止其 “污染”算法。( 2) 知识图谱的 精细化。法律知识的模型化、标准化是开发法律 人工智能的前提,特别是 “知识图谱+深度学习” 为主的算法,对数据、模型的颗粒化、精细化程 度越高,得出的答案越接近现实,预测的结果越加准确。所以,目前的人工智能存在 “有多少人 工,就有多少智能”的显著特点,需要法律专业 团队更加精准化、体系化地建构、重构和表述法 律知识。① ( 3) 法律算法的可解释性。深度学习算法的不可解释性就是机器仅提供一个决策结果, 不提供一个决策过程和决策解释,致使执法办案人员对机器直接给出的答案,无从判断它的参考价值有多大。但目前的技术发展程度不代表未来 也是如此,可以通过政策、法律或一些明确的需 求去影响技术的发展; 并考虑建立面向一定法律 人群体的适当开放审查和意见反馈的机制,促进 算法本身正确性的提高[21]。 

  

3. 应用层面 

人工智能嵌入执法办案的各个环节,在具体 应用上需要相应技术的支撑与拓展。

( 1) 图片识别 ( OCR) 技术。

图片识别 ( OCR) 技术是目前法律人工智能比较常用的技术,可以对各种卷宗 材料的印刷体文字、手写文字、签名、手印、签 章、表格、图片进行智能识别、定位和信息提取、 比对,实现对单一证据的校验。应用该技术可辨 识 “多胞胎” “早产儿” “分身术” “抱错孩” 等程序问题。这些办案中的常见错误,耗费大量精力审查,但又必须严谨细致,“小”的可能需要 提前补正或做出合理解释,“大”则可致证据链条断裂,最终被视为非法证据予以排除。 

( 2) 智能 语音 ( ASR) 技术。

智能语音 ( ASR) 技术是指 识别与转换能使机器 “听懂”和 “分辨”不同个 体口述的语言并实时转化为文字,这一功能在庭 审中已得到推广应用。同样,在办案领域引入该 技术,可以区分不同角色,将问答内容直接转写 成文本,让办案人员集中精力做好讯 ( 询) 问, 缩短笔录制作时间。 

( 3) 自然语言处理 ( NLP) 技术。

一直以来,符号机器语义实现是限制人工智能应用的一大瓶颈。目前,计算语言学基础理论在词法、句法、语义、篇章等层面取得了较大进展; 机器学习特别是深度学习使自然语言从离散表示发展到连续表示,提高了自然语言处理的准确率[22],使计算机能更丰富地理解自然语言文本的意义,并表达出给定的意图、思想。当然, 以目前技术完全处理法律专业术语及案卷资料中的复杂表述还是有较大难度。③ 总之,“人工智能研究关心的是如何操纵 ‘符号’,而不是如何形成意义” [23],而公安执法办案是在准确把握案件事实与证据基础上,综合运用侦审思维、逻辑规则、经验法则和正义理念,对每一起案件 “私人定制”的结果。办案民警与法律人工智能,就像医生与检验设备的关系,延续两千多年的 “望闻问切”仍然是行之有效的方法, 但依靠机器做出的病情化验与诊断更加细致入微, 最终的诊断结论、药物用量、手术方案与操作必须由医生亲自完成。同样,传统的侦查与办案手段不能丢,应对当前复杂的治安形势和更高的办案标准要求,还应当主动拥抱技术,借助技术不弃微末地办好每一起案件。


参考文献及英文摘要略


(本文转自:陈克强,孙宇翔.大数据背景下人工智能“嵌入”公安执法办案的探索与展望[J].中国人民公安大学学报(社会科学版),2019,35(02):101-110.


本期编辑:糖

本文转载,如有侵权,请联系管理员删除


普及情报思维 传播情报文化

长 按 关 注


投稿邮箱

550419913@qq.com




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存