张雅婷:《人工智能在泛司法方向应用的新实践及边界》 | 《人工智能与法学》第二讲
点击蓝字
关注我们
2022年11月16日星期三下午,浙江大学光华法学院《人工智能与法学》课程第二讲顺利完成。本次课程由阿里巴巴达摩院语言技术实验室高级算法专家/智能司法算法负责人张雅婷讲授,授课主题为《人工智能在泛司法方向应用的新实践及边界》。
课程由浙江大学数字法治研究院副院长高艳东老师主持,高老师简要介绍了张雅婷女士在达摩院主导的智能司法技术取得的一系列成果,鼓励大家思考法律人工智能的前沿进展。
教师简介
张雅婷
阿里巴巴达摩院语言技术实验室高级算法专家、智能司法算法负责人
美国卡耐基梅隆大学硕士,日本京都大学博士,曾在日本理化学研究所革新智能部门做博士后研究。研究成果发表在TKDE、TOIS、SIGIR、ACL、WWW等国际期刊及国际顶会上。2018年4月入职达摩院开始负责智能司法方向,从0到1搭建团队、打造创新性技术路线并成功实现业务落地,积极推动司法技术产品的商业化。四年间带领团队完成了智能司法方向中庭审辩论理解、审判逻辑解析、司法话术生成等重点技术的攻坚,发表司法AI相关顶会论文13篇,申请专利50余篇,负责/参与四项国家级科技部课题,并作为会议主席在国际A类大会SIGIR2020上承办第一届智能司法workshop(LegalAI2020),在国内多个人工智能大会上作为嘉宾进行汇报。
一、达摩院技术体系
张老师首先介绍了阿里巴巴达摩院的技术体系,包括机器智能、数据计算、机器人、金融科技和X实验室五大研究领域。这五大研究领域扎根当下,立足于真实生活场景,着眼于未来,致力于科技前沿,持续推动社会变革。张老师所在的自然语言处理团队属于机器智能实验室,下设语音实验室、视觉实验室、语言技术实验室、决策智能实验室和城市大脑实验室。
其后,张老师介绍了达摩院目前拥有的技术能力,涵盖语音、视觉、自然语言三大领域。达摩院的语音识别技术可以识别108种语言,语音合成技术可以自动模拟人声,这些技术能够应用在有声阅读、快递外呼通知及智能家居领域。在视觉领域,达摩院的光学字符识别技术可以帮助核酸检测站自动识别被采集者的身份证信息,也可以在司法场景下对纸质材料进行自动扫描与信息提取,有利于无纸化改革。在自然语言处理领域,达摩院实现了智能问答技术,淘宝用户可以就相关购物问题与智能客服进行沟通。在公共安全场景下,使用自然语言处理技术能够帮助警方通过地址解析快速定位,尤其在报警者仅通过明显地标而无法详尽描述其所在方位时,通过自然语言处理技术可以自动锁定GPS位置。
二、智能司法技术的应用场景
张老师指出,立法、司法、执法和守法是目前法律科技市场呈现出的四个发展方向。达摩院智能司法主要服务于政府端场景,包括公安、检察院、法院、司法局等。近年来更多为法院和检察院提供智能化服务,尤其聚焦于当下法官在办理案件中的一些问题。首先,浙江省案多人少的问题十分突出,每个法官平均每年要办理345个案件。但是这些案件符合“二八分布”的规律,20%是复杂案件,80%是简单案件,而法官花了大量时间在这些简单案件上。同时,就书记员而言,每天也有编目、归档等若干繁琐的工作。除此之外,对于当事人来说,法律的门槛其实是比较高的,如果缺乏律师的帮助,当事人在区分案件类型以及书写诉状上具有一定难度。而以上这些司法实际场景中的需求恰好就是AI可以赋能之处。
智能司法的解决方案致力于达成以下四个目标:司法普惠化、多渠道信息获取、重复劳动的替代和标准化案件的智能审判。在司法普惠化方面,能够通过AI产品为诉讼参与人提供相对标准化的服务。在多渠道信息获取方面,通过获取案件诉讼过程中的案件多元信息,最终实现办案办公的信息化和智能化。在重复劳动的替代方面,能够以AI替代诸如速记、电子编目归档等工作。在标准化案件智能审判方面,通过AI实现对标准化案件的智能审判,节省法官在80%简单案件上的耗时,进而为疑难复杂案件的办理留下充裕时间。
三、凤凰智审实例解析
在第三部分,张老师以凤凰智审为例讲解了人工智能技术在司法领域的具体应用。
首先,张老师带领我们回顾了机器借助数据通过算法学习知识的流程:
1. 海量数据:采集、汇集数据;
2. 数据治理:去除噪音数据、统一数据格式;
3. 专业标注:构建知识体系、数据命名;
4. 模型学习:算法构建、数据喂养。
其后,张老师介绍了智能审判技术的技术路线即“审判逻辑图谱+大数据算法”,其核心在于人机共融合。这主要体现在两个方面,一方面,智能审判需要注入法官绘制的逻辑图谱,即不仅依靠机器的数据学习,也融入了法官的经验;另一方面,法官可以就算法所推荐的内容进行反馈,模型将基于反馈调整算法,促进算法自我优化。
凤凰智审在技术上有所突破,也在审判流程进行了创新。在技术上,考虑到法律行业的复杂性和敏感性,凤凰智审创新了算法框架,尽可能提供可解释的算法,通过程序员和法官在系统上的沟通提升算法效果。在流程上,凤凰智审可以通过在审判结束时一键完成送达和归档,如此大幅提升结案效率。
随后,张老师分别介绍了凤凰智审的庭审速记、争议焦点自动生成、自动发问、法条实时推送、证据自动分类、证据链自动生成、证据三性认定、风险点预测功能。人工智能辅助的庭审速记可以在法院庭审中替代或者辅助书记员进行笔录速记,包括数据准备、语言模型、口语文本顺滑、实体修正、标点还原和文本标准化六个部分。争议焦点自动生成功能可以帮助法官快速抓住重点内容,包括提示案件庭审讨论的争议焦点和需要持续发问的审理要点。自动发问功能可以有效协助法官对当事人进行发问,与此同时系统会根据庭审流程和原被告提供的事实信息,利用文本生成技术和TTS技术生成对应的流程性及事实性发问的内容。法条实时推送功能指在庭审过程中实时推送案件相关法条,对所输入的对话信息进行实时分析并加以判断,当输入对话的语义满足推送条件时,系统将会推送相关法条。证据自动分类功能能够按照具体案由对所需证据的情况,结合文本识别、图像识别、自然语言技术对当事人提交的证据材料进行准确分类。证据链自动生成功能能够帮助法官按时序查看本案证据,有效厘清案件审理思路。证据三性认定功能主要结合NLP和图谱逻辑推理算法技术,就案件证据材料判断其真实性、合法性和关联性。风险点预测功能可以借助法律专家构建的审判知识图谱预测对审判结果有决定性作用且算法有一定错判风险的节点信息,允许法官对其予以矫正,进而辅助法官决策。
四、智能司法未来发展方向
对于智能司法未来的发展方向,张老师给出了自己的观点。当前公共法律服务的共性是通过互联网宣传引流、提供针对性的客群服务以及赋能供给端。但其不足在于智能化水平不高、缺乏主要面向C端群体的产品和对需求端的培育、引导。问卷调查显示,目前在公众寻求法律支持的途径中互联网占据64%,同时58%的受访者反映其他各种法律救济渠道耗时太长,这为智能司法发展面向C端群体的服务提供了契机。在未来,智能司法将用数据重构法律服务关系,对供、需、场三方数据进行交融再造,用以解决法治化中国建设过程中法律服务供需两侧信息不对称的问题。
具体而言,张老师给出了未来智能司法可能实现的目标:
1. 调用开放数据集完善后台知识库、律师画像、案件画像、企业画像;
2. 通过文本输入、语音输入技术,将用户通俗表述转化为法言法语的法律需求;
3. 调用数据库中匹配的资源,智能助手进行关联提示,引导用户提出法律需求;
4. 借助智能助手输出有关案例、法律规定和处理建议,并反馈给用户,仍无法解决的则转接律师开展人工咨询;
5. 根据用户需求快速精准地匹配与之相适应的法律服务;
6. 推荐相关法律条款、历史判决案例及法律文书供律师参考,提升办案效率;
7. 以所咨询问题反哺数据库,进而提供更加精准优质的法律服务;
8. 高频咨询问题反馈给政府端以提醒关注此类社会现象。
五、法律AI的边界
在授课末尾,张老师通过一段B站UP主采访达摩院研究员的视频,并结合网友的评论和同学们探讨了法律AI的边界问题。张老师认为,第一,法律AI应该做机器擅长的工作,即标准化的、可被学习的、数据量大的以及精细化运算的工作;第二,法律人工智能的构建应当是人类与机器相互辅助、相互促进的;第三,产品设计应当不仅以提高效率为目标,还需要注意模型的可解释性。
最后,张老师向同学提出了几点温馨建议:
1. 充分但是有选择地认识新世界;
2. 了解技术的发展趋势,明确自己的定位;
3. 利用智能化工具,同AI一起成长。
END
文稿整理:胡雪瑜
本文编辑:包雯蕊
本文审阅:郑斯元
(本文观点和内容与本公众号无关)
(如有侵权,请联系删除)
延伸阅读:
魏斌:《法律人工智能:科学内涵、演化逻辑与趋势前瞻》 | 《人工智能与法学》第一讲
主 编:王凯旋
副 主 编:王星雨
来稿请投:zjulaw@aliyun.com
转载须授权