人工智能这样帮你办故意杀人案,你会选择相信它么【斑斓 · AI】
作 者 | 李则立(上海高院司改办)
一起故意杀人案件,几百页卷宗。假如有这样一位“助理”,干完下面这些活,再把卷宗交到刑事法官手里,刑事法官们愿不愿意配一个?
证据指引,“助理”翻出多年来刑事条线专家经验总结,并提供以下办案思路参考:这起故意杀人案件属于“认罪供述得到印证型”,证据链应当包含人口失踪情况、查找被害人确认死者身份……而需要查证的事项包括作案时间、作案地点……具体的印证证据应该包括书证、鉴定意见……
单一证据校验,“助理”对每个证据均进行了反复审查,发现有2份由同一名侦查员在不同地点制作的笔录产生时间竟然一样,提示注意。可能错写了时间,也可能取证时程序有瑕疵。
证据链和全案证据审查判断,根据证据链发现有15处血迹,有1处没有相对应的DNA检测报告。发现一份证据证明被害人是被刀捅死的,而尸检报告说是钝器致死,存在矛盾,提示注意。
案卷“划重点”,在厚厚的卷宗当中已经清楚标注散落在各处的作案时间、作案地点、作案人员、作案手段和经过、加害程度和死因、财产损失情况等等……根据这个标签可以在证据间进行搜索,比如点击作案地点标签,会自动显示所有与之相关的证据。
当然,还有类案推送,等等
……
有这样的“助理”?还是机器?数据打通公、检、法,给侦查员、检察官、法官都配上“智能助理”?有人已经试图摇醒我了,醒醒吧!
这还真不是做梦。7月10日,全国司法体制改革推进会上,“上海刑事案件智能辅助办案系统”隆重登场,这项代号“206”的工程揭开神秘面纱。
倘若把时间拨到5年以后,回望这一刻,这可能是划时代的一步,人工智能与司法结合,实现了“从0到1”的突破。
虽然很多功能尚在持续改进中,还未全部实现,但已初具雏形,“1.0版本”问世。一个初生的“婴儿”,听到第一声啼哭。
当然,有人不信,吹吧,使劲吹!也有人兴奋,赶紧,指日可待!人工智能在司法领域的深度应用,我们的态度或许应该是“理性乐观”。
一、为什么乐观?人工智能的应用前景广阔
有人说,这不就是当年研究过的“法律自动售货机”吗?多少年前就被提出来,但是没做成啊,失败了。“人工智能”并不是我们通常理解的电脑程序。比如在a>b的情况下可以得出c,仅此而已,得不出其他结论,那只是一个写死的程序而已,没有什么“智能”。
第一,机器能“思考”会“成长”。人工智能是机器模拟人脑“认知”,这就是所谓的深度神经网络算法。人脑在认识事物的过程中,比如学习某方面知识,大脑中某块区域就会像“肌肉”一样生长,神经突触就会增加。
机器也是如此,人工智能可以对人的意识、思维的信息过程进行模拟。人工智能不是人的智能,但能够像人那样实现“认知”和“判断”。比如“阿尔法狗”,扔给它棋谱训练,它能在围棋比赛中算出在何处落子,至于它是怎么“思考”出来的?程序员也不知道。
人工智能就像个“黑箱”,输入数据,通过“黑箱”,跑出结果。除了自主“认知”和“判断”,人工智能还会不断成长,就如与柯洁下围棋时,经过更多棋谱的训练,“阿尔法狗”已经比与李世石下围棋时厉害得多,让柯洁感受到了深深的无力感,以致落泪。
机器可以通过学习实现“认知”和“判断”,还能经过训练不断“成长”。也就是说,机器可以在一定程度上像人类一样,具有“经验”。因此,面对人工智能,我们并不能简单以一句“法律的生命在于经验而非逻辑”来证明机器做不到。
第二,机器有了“眼睛”和“耳朵”。机器认知事物大体可以分为“感知”、“认知”和“判断”。就像人认识事物一样,首先是用视觉、听觉等接收到信息,然后再进行处理。随着图像识别技术(OCR)、语音识别技术等人工智能技术的发展,机器逐渐突破了“感知”这道关,可以向着认知和判断的方向不断挺进。
正如KK在《科技想要什么》里谈到的那样,“每一项发明都是承先启后的,没有传送电力的铜线,机器之间就无法沟通,不能采集铜或铀的矿脉、在河流上筑水坝或采集贵金属来制作太阳能面板,就无法生产电力。”
倘若把这些联系起来看,科技其实彼此关联,有其内在的发展逻辑,有了前项的发明,后面的发明“必然”出现。就像有了电,就一定会有“电灯”,发明电灯的人如果不是爱迪生,一定会有别人,人类历史上相同的发明在世界两端同时出现的事情不断重现。
人工智能的发展有赖于数据、算法、算力的发展。人工智能真正出现“智能”,有赖于“感知”的突破,当机器可以识别出讯问笔录、照片、录音录像之后,才能“认知”,进而“判断”。
反过来说,“感知”技术的突破,几乎“必然”导致机器要向着“认知”和“判断”的方向挺进、升级。这也可以解释,为什么现在看80年代关于量刑的电脑辅助系统开发设计,依然很有启发,但是那时候没有做成,因为那时的条件不够成熟。这也可以解释为什么法律人工智能的发展首先需要应用大量图文识别、语音识别、实体识别等技术。
第三,“专家+数据+算法”模式在各个领域实现突破。倘若说无人驾驶离司法太过遥远,那么在教育和医疗领域的应用就具有相似性了。比如英语四六级作文,机器通过学习英语老师批卷,总结英语专家经验,批改准确率已经超过90%,比人准。去年,机器批改高考作文的准确率也超过了人工。又比如在医疗领域,机器医学影像的读图已经超过了人工专家。
人工智能在这些领域的突破性进展,都验证了“专家+数据+算法”这套“打法”的有效性。由专家总结梳理“经验”和“规则”,“解读”人类社会知识,让机器学习,机器通过学习和不断迭代,获得“人工智能”。
机器早已不是我们曾经印象中的电脑,或者某个软件系统,人工智能渐成大势,前景可观。
二、为什么理性?人工智能“成长”需要时间
罗马城并非一天造就。人工智能发展不能一蹴而就,有人说“坑深路远”,一点不错。
第一,机器是人的“学生”。“专家+数据+算法”模式,为何要将行业专家纳入其中?我曾经也认为既然算法很厉害,只要有数据不就行了么?把数据放进去跑,不就能出结果嘛?其实不然,复杂的司法领域并非下围棋,机器根本不认识什么裁定书、判决书,一堆没有经过“解读”的数据扔进去对机器来说等于“看天书”。
首先得由专家教它。怎么教?批注,也就是“打标签”,把数据标注得让机器认识。比如作案时间,时间的表述相对比较容易识别,但是什么是作案时间?定位起来却不容易。
在一份讯问笔录当中,犯罪嫌疑人可能说早上6:00吃了早饭,6:30去了银行,7:00才到犯罪现场,8:00和被害人吵架,9:00杀死了被害人。这么多时间,哪个是作案时间?对人来说是常识性判断,而对于机器来说不是简单的定位了,这里没有哪个时间前面专门写了“作案时间”,它得去认知。
怎么认知呢?专家先标注出来,9:00是作案时间,标注500份,让机器学习。机器学习寻找规律以后,拿来验证对不对?可能准确率只有20%,跟瞎蒙没区别。然后专家还得继续告诉机器这个对了,那个错了。就是这样一个教练的过程。这就是所谓的“监督学习”。
随着数据样本的不断增加,机器的准确率可能提升到了80%,这个时候能用了,但是不准确,还不太能信赖,让机器继续学习。从监督学习,过度到半监督学习,再到无监督学习,准确率越来越高,比如达到90%以上,这个时候基本值得信赖,可以完全投入应用。机器是人教出来的,没有人工的大量投入,跑不出“智能”的机器。这个过程需要时间和耐心。
第二,人若“模糊”,机器就“瞎”。工程师告诉我,人都很难想明白的事,就别难为机器了。只有人能想明白,讲清楚的事情机器才能“懂”,机器“懂”了以后才能比人更“明白”。
比如讯飞的语音,开始的时候需要专家去分析各种声音的区别,作出模型,逐渐地通过机器的学习和分析,摸到了更多规律,发现更细致的声纹区分,语音识别才越来越精确,从普通话到方言,逐个突破。
首先得把“经验”变成“规则”,“模型”。这里除了专家要能够将经验总结出来,还有“标准化、规范化”问题。倘若某个法律适用问题,本来在司法实践当中就不统一,不明确,那就别指望机器能“懂”了。这个时候要做的是先统一法律意见,而不是去升级机器。
又比如在图文识别讯问笔录时,经常看到识别不了时间,为什么?机器把“7月10日”中的下划线当成了一个字符,倘若这个下划线长一些,则可以被识别出来。这个时候有两条路可以走,一条路,规范讯问笔录的格式,另一条路,让机器学习识别各种各样的笔录格式。哪个更省力呢?场景不同方式不一,大多数的时候可能需要双管齐下。所以,机器智能的问题背后是各种“标准化、规范化”问题。“专业化、职业化”的路可以靠机器加速,却不能靠机器跨越。
第三,数据是生产资料。《在线》的作者,阿里巴巴集团技术委员会主席王坚谈到,数据是“生产资料”。没有数据,人工智能就是“摆设”。必须打破“信息孤岛”,让数据流通。数据只有用起来,人工智能的“任督二脉”才可能被打通。
人工智能产品在真正投入应用的时候,在专家、算法、数据三个维度基础上还需要加上“用户”一维。数据能够真正帮助到“用户”,“用户”才能将数据积淀下来,并继续提供有价值的数据。系统和用户之间不断互动,才能真正形成数据收集、数据应用、系统升级的良性循环。
三、为什么要在人工智能与司法实践深度融合的道路上坚定地走下去?
人工智能的前景可观,实现起来却“坑深路远”,那这条道不走行不行?不行。不尽早向人工智能挺进可能“步步落后”。这也许是这个时代法律人的使命,也可能是中国司法“弯道超车”的绝好机会。
第一,人工智能是“专业化、职业化”的高速通道。路有险阻,却是正道。给机器“填坑”的过程实际是专业化、职业化的过程,填满一个又一个“坑”,其实是在给规范化、标准化“扫雷”。正如上海高院崔亚东院长所言,打造人工智能的过程将“倒逼办案人员实现从司法理念、办案思路到办案流程、办案行为的全面提升,减少司法任意性,有效防范冤假错案产生,推动以审判为中心的诉讼制度改革落地见效。”也可以反推,机器越“智能”,代表着“专业化”程度越高。
第二,人工智能是“经验传承”的崭新方式。人工智能,是人类智慧的结晶。传统的经验传承或知识管理,主要依靠“传、帮、带”,师傅多年的经验积累如果没有经过系统总结,就可能随着个体的退休、离职而湮灭。师傅传给徒弟,可能走样,功力给不到十成。知识管理的水平也可能不稳定,有时一个带头人离开岗位,一个业务的高峰期也就此终结。
而打造智能系统的过程本身是一个专家经验总结梳理的过程,专家的智慧通过系统得以保留和传播,专家的智慧成为众人的智慧。面对这样一套智能系统,如果你是初学者,可以从系统中得到规范的指引。如果是专家,则可以进一步优化升级系统。人工智能从一开始就学习顶尖专家的知识,能够达到一流专家的水平,而且保持稳定发挥,能实实在在降低管理成本。
第三,人工智能是减负增效的“智能辅助”。人工智能会不会代替法官,在可以预见的将来不会,机器只能在一个规则封闭的环境中运算,不能够自我创造来创新,只有人才会做综合的价值判断。
所谓“君子善假于物,增益其所不能”,人工智能替代的是规则清晰的大量司法重复性劳动,定位是智能辅助。但是,在未来,有没有这个“智能辅助”带来的差异可能是巨大的。有“智能辅助”的法官与没有“智能辅助”的法官之间无论是专业度、工作效率质量都可能是数量级的差异。有了“智能辅助”的法官,能把案卷“读薄”,专注于审判核心事务,才是“更像法官的法官”。
司法人工智能的“大航海之路”刚刚启航,前景可观,路有险阻,能否到达彼岸?有的人悲观,有的人乐观,如果选边,我愿做个理性乐观派。
感谢您阅读“法影斑斓”,希望它能兼顾新知与审美。如果您觉得图文有点儿意思,请点击右上角按钮,选择“查看公共号”,再点击关注即可。也可搜索微信号:funnylaw1978。如果想阅读过往文章,可点击“查看历史消息”。
何帆出品 扫码关注