【理论建设】域外法律人工智能的典型应用及其启示

From: 王禄生等智慧法院进行时 2019-12-14

2013年是全球范围内法律人工智能（Legal AI）的元年。此后，法律人工智能逐步发展并在2017年进入了一个关键的分水岭。根据斯坦福大学法学院法律科技指数显示，全球目前至少有超过790家知名公司专注于法律行业的技术支持。然而，这个数据应该显著低估了从事法律技术研发的公司规模。另据融资平台Angel的统计，仅美国参与融资的法律科技项目就达到了1819个。本报告将详细梳理域外法律人工智能的典型应用、简要分析基本趋势以及对我国法律人工智能研发的启示。

域外法律人工智能的典型应用

（一）法律智能问答机器人

1.ROSS Intelligence

ROSS Intelligence是由加拿大多伦多大学学生在2015年开启的法律人工智能项目。他们利用IBM Watson 的平台进行技术开发与升级，旨在研制能够识别用户自然语言问题（如：公司破产之后是否能够继续经营）并精准、快速回答的法律智能机器人。在研发的初期，ROSS只能回应涉及加拿大特定法律领域的有限问题。从2015年6月起，ROSS团队持续获得来自硅谷科技公司以及知名律师事务所的投资，包括世界知名的德同律师事务所（Dentons）。随着训练量的增加，ROSS的回答准确性不断提升，覆盖业务领域也由破产法扩展到知识产权和劳动法，由此该产品开始获得大客户的青睐。截止2016年4月，ROSS就获得了超过20个客户，包括贝克豪思和瑞生等全球知名律师事务所，并且开始向国际领域扩展。

ROSS有六大核心优势：（1）人性化交互：通过前沿的自然语言识别技术，ROSS可以与用户进行人性化的交互，用户的体验类似于与真正的律师对话；（2）精准识别：准确定位用户问题的法律知识点；（3）极速响应：在几秒时间内迅速回应问题；（4）准确提取：开发数百种算法精准从庞大的法律知识库（涵盖从公开、未公开判例到法律实体问题）中提取最为恰当的答案；（5）知识更新：ROSS可以跟进法律的发展轨迹，实时为用户更新法律；（6）智能辅助：通过信息抽取，针对用户的提问提供类案推荐与法律报告。

2.DoNotPay

DoNotPay由18岁斯坦福大学学生约书亚·布劳德（Joshua Browder）基于IBM Watson平台研发的法律咨询机器人，被称作“世界首款机器人律师”。DoNotPay最初只针对停车罚单这一领域——通过人工智能技术，为社会公众提供法律帮助，自动化地挑战不合理的停车罚单。据统计，DoNotPay累计挑战成功37.5万份罚单，涉及罚款90万美金。2017年更新上线后，DoNotPay的后台法律知识库整合了英国和美国（50个州）的消费者交易法律规范，可以回应用户通过自然语言提出的超过1000种有关消费者交易的法律咨询。与DoNotPay类似，加拿大的一家名为Legally Inc的公司也推出了法律咨询机器人Winston。

3.Lawbot

2016年，英国剑桥大学法学院研制了一款名为Lawbot（测试版）的法律咨询机器人。开发者将该款机器人称作“世界最先进的法律咨询机器人”。这款机器人主要针对刑事案件的被害人，为其分析基本案情并帮助受害人寻找法律依据。目前，这款机器人覆盖了英国（英格兰与威尔士）的26种主要刑事罪名，包括性侵犯犯罪、侵财犯罪、人身伤害犯罪等，并还在持续扩展案由范围。

（二）法律大数据分析与智能预测平台

1.LexMachina

Lex Machina是美国一家专注于法律大数据分析与人工智能应用的公司，其前身是斯坦福大学法学院与计算机系联合推出的项目，现已被国际顶级法律数据库公司LexisNexis收购。Lex Machina的技术路径大致分为三个环节：（1）数据获取：每24小时通过爬虫软件从联邦法院网站、州法院网站、美国国际贸易委员会网站、美国专利商标局网站爬取数据；（2）数据清洗：将爬取的数据清洗、编码和标记；（3）知识抽取：通过自然语言处理专利技术，从清洗后的数据中抽取出可供使用的知识。抽取的知识主要以法官/法院画像、律师/律所画像、当事人画像呈现，比如不同法官对特定法律动议的支持程度、不同律师对不同法律问题的法律意见、不同当事人在不同法院的胜败情况等。用户根据这些详细的画像可以做出更精准的诉讼策略和形成合力的诉讼预期。

最初，Lex Machina主要集中在知识产权法律问题领域。被收购后，其研发的范围逐步扩大，2016年6月进入安全法领域，11月进入反垄断法领域。现在业务已经覆盖专利、商标、版权、反托拉斯、证券、商业、就业、产品责任以及联邦法院的破产诉讼。公司的客户范围从律师事务所到eBay，微软和Shire制药等公司。

2.Premonition

Premonition是在2015年底创立的法律大数据智能分析平台。据报道其在种子期融资估值达到1亿美金。该平台主要从海量裁判文书中抽取关键信息，对诉讼环节中的法官、法院、律师、律师事务所、当事人（公司）等多方主体进行精准画像并可视化呈现。目前已经推出了（1）律师与律师事务所大数据分析/画像；（2）法官与法院大数据分析/画像；（3）当事人大数据分析/画像（仅有公司当事人）；（4）法律诉请大数据分析/画像；（5）专家证人与仲裁员大数据分析/画像。举例而言，在律师画像中，Premonition通过法律文书数据挖掘，详细可视化呈现每名律师的办理案件的总数、案由分布、诉讼标的区间、案件平均处理效率、案件胜诉率（分案由、法官、法院）；在公司当事人画像中则可视化呈现公司的诉讼历史、案件类型、案件胜诉率等；在法律诉请画像则可视化呈现不同的诉讼请求在不同法院、法官审理过程中被支持的比例；在专家证人与仲裁员画像中则可视化呈现不同专家证人出庭证言的采纳情况以及不同仲裁员的偏好等。可以说，该平台是典型的基于法律大数据挖掘/画像基础之上的人工智能应用。

3.Ravel Law

Ravel Law也是法律大数据分析与预测平台。该平台由斯坦福大学法学院、计算机系等相关院系于2012年成立，在推动过程中得到了哈佛大学法学院图书馆的支持，其思路也是从海量的文书中抽取相应的数据并分类可视化呈现（信息→知识）。从目前来看，Ravel Law推出了法院画像、法官画像、案件画像等功能模块。整个功能设置与Premonition类似。技术主要有自然语言处理、机器学习和数据工程等。实现从法律信息中提取知识。

4.Litigation Analytics

Litigation Analytics由全球商业、金融信息和财经资讯的领先提供商彭博公司（Bloomberg）推出。这款名为诉讼分析的产品可以为社会公众和法律职业者提供详尽的有关联邦法官的画像，包括案件平均审理的期限、法官对特定动议的支持情况、法官判决平均周期、法官推翻或者维持判决的可能性等。值得一提的是，在所有有关联邦法官的画像中，Litigation Analytics有着最大的数据库，它覆盖了所有联邦法官、所有联邦案由和从2007年起的所有联邦案件。除此之外，该平台还有整合了超过7000家律师事务所、70000家上市公司以及350万家私营企业的画像。

5.LexPredict

LexPredict是美国伊利诺理工大学法学院副教授丹尼尔•卡茨（Daniel Martin Katz）在2014年推出的法律大数据分析与智能预测平台，用以预测美国最高法院的判决。在1953至2013年的7700个判决中，该平台算法的预测准确率到达70%。

（三）诉讼材料辅助平台

1.LawGeex

LawGeex是一家成立于2014年的法律人工智能专业公司，其核心研发方向是借助人工智能实现合同内容审查与批准的自动化。LawGeek通过机器学习、文本分析和自然语言处理等技术实现对法律文书的理解，并在此基础上实现以下功能：（1）合同内容智能审查，自动提示问题点；（2）合同内容审查的个性化，即学习用户在特定问题的习惯，据此更有针对性地审查合同内容；（3）合同批准流程自动化；（4）合同撰写智能化引导。根据官方网站的介绍，合同审查的效率提升80%和节约90%的成本。包括豪登集团、希尔斯百货、法国外贸银行、ROSS智能等知名企业都是LawGeex的用户。

在2018年2月，LawGeek在一次有关标准商业合同内容审查的竞赛中打败了顶尖律师。这次比赛由斯坦福大学、杜克大学法学院和南加州大学法学院教授出题，20名顶尖律师与LawGeek同台竞技。最终，律师合同审查准确率为85%，而LawGeek达到94%；律师的审查平均耗时为92分钟，而LawGeek的审查平均耗时为26秒；律师审查的最高准确率为97%，而LawGeek的审查的最高准确率则达到100%。

2.Docubot

Docubot（原型系统）是由法律科技公司1LAW Legal Technologies基于IBM Watson平台开发诉讼材料自助生成机器人。它通过多轮人机对话完成法律文件的起草和诉讼材料的准备。目前，这一系统原型已经能够协助公众完成超过1000多种法律文书的起草工作。

（四）智能化在线纠纷解决平台

Modria是属于泰勒科技公司（Tyler Technologies）的智能化在线纠纷解决平台，被媒体称作“世界范围最为成功的在线纠纷解决系统”。其前身是电商平台eBay和PayPal的在线纠纷解决系统。（该系统处理了数亿争端，90%通过自动化处理）。Modria的在线纠纷解决大致覆盖房屋租赁、小额赔偿、一般债务和建筑工程纠纷，分为五个环节：（1）在线申请：允许当事人轻松地发起线上申请，并上传诸如合同、数字图像等证据；（2）智能诊断：平台基于大数据的智能分析，针对每个用户面临的纠纷进行诊断，告知该类情况平均的胜败可能以及花费的时间与成本。智能诊断可以让公众形成合力的诉讼预期，并分流部分案件；（3）在线协商：允许双方进行在线讨论，讨论内容全流程可追溯；（4）在线调解：让当事人邀请第三方中立(调解人、仲裁者或其他专家)到平台上帮助他们解决争端；（5）司法确认：当事人调解成功之后，由法院进行司法确认。目前，Modria平台已经被大量的电子商务网站使用，如荷兰的Rechtwijzer网站。除此之外，荷兰的法律援助委员会以及美国与加拿大的税务评估员也都采用这一平台在线解决纠纷。

Modria在线解纷系统有以下六个特点：（1）跨网系：互联网、移动互联网切换；（2）多方接入：当事人、调解员、仲裁员、法官实时接入；（3）功能完备：并非单纯是的在线调解平台，而是整合了智能审查、在线调解、网上示证等功能；（4）容易部署：使用Modria按钮获取一小段Javascript代码，便于使用；（5）隐私安全：根据角色和职责分配和限制对数据的访问，以确保隐私和创建清晰的边界；（6）司法支撑：与法院系统连接，由法院支持调解方案。

域外法律人工智能应用的趋势分析

（一）法律人工智能的技术呈现出加速发展的态势

从2013年开始，法律人工智能技术就呈现出显著的加速发展态势。概括起来，主要有以下五个方面：

第一，由依赖专家构建规则向自主构建规则转变。法律人工智能从最早的基于规则的（rule-based）的专家法律系统（将法律专家的法律知识、经验等以规则的形式转变成为计算机语言），到以深度学习、机器学习、大数据等为支撑的自主系统，人工智能对法律以及法律行业的更深更广的影响由此成为可能。

第二，深度学习技术降低样本依赖。在法律人工智能的初期，深度学习技术需要结合大量样本的培训，对于样本不足的场景则精确度显著下降。当前，法律场景深度学习技术有了明显的发展，人工智能对训练数据的需要大幅度下降，但部署和提取准确性却有所提升。

第三，机器学习技术突破定性数据。法律场景机器学习技术有了明显突破，由只能处理定量数据（quantitative data）到处理定性数据（qualitative data）发展——这被有些专家称作技术的“定性数据革命”（qualitative data revolution）。机器学习技术结合定量数据与定性数据，为法律人工智能的应用带来的全新可能。

第四，自然语言识别技术突破实体要素。法律场景自然语义识别技术从识别程序性要素开始向实体性要素发展，包括合同内容实质审查、裁判文书智能纠错、诉讼材料自动生成等技术瓶颈将有望突破。

第五，法律人工智能技术整合有了明显突破：随着AI技术的隔阂被逐步打破，技术之间的连接开始加强。当对人工智能技术进行有机整合与集成创新时，将发挥1+1＞2的功效。AI提供者之间的力量整合将为法律问题提供端到端的解决方案。

（二）法律人工智能的应用不断向“用户导向”转型

在法律人工智能研究的初期奉行显著的“研究导向”。科技公司与高等院校是研发的引领者从域外法律人工智能的开发路径来看，很好地体现了法学与计算机科学的深度融合。尤其值得关注的是，法学院成为法律人工智能开发不容忽视的力量。Lawbot有剑桥大学法学院主导了研发、Lex Machina和Ravel Law都是由斯坦福大学法学院与计算机系联合推出。LawGeex也有斯坦福大学、杜克大学和加州大学法学院的身影。LexPredict则是由法学院副教授丹尼尔•卡茨一手主导。与之形成鲜明对比的是，法律行业缺乏迫切意愿来支持自主的科技研究。有调查显示，美国商业一般投入3%的营收用以技术研发，而法律行业投入不到1%，一个可以对比的数据是通讯业投入13%，而生物工程投入更多。

新一代机器学习技术的发展，使得法律人工智能企业可以更灵活地根据用户习惯研制定制化的产品。对于定性数据的掌握将大大推动法律人工智能技术向着用户导向的方向发展。目前整体而言仍然是研究导向的。法律人工智能有望从大公司走向中小企业。前沿技术将更多地成为法律行业日常工作的一部分，而不再是大公司与顶尖律师事务所的专有。法律人工智能也将有望进入社会公众的事业中，为社会公众带来实质的帮助，而并非仅仅在尝鲜意义上。

（三）法律人工智能的成效日益受到法律行业认可

随着法律人工智能技术的进步，诸多法律人工智能应用开始在诸多公司、律师事务所落地应用。在应用中，法律行业发现人工智能技术确实有助于解决实际的问题，比如大幅度提升简单工作的自动化水平。由此，许多公司与律师事务所开始主动接触人工智能技术，其对于法律人工智能技术的态度也变得更加开放。法律行业对于开始将认真对待Ai技术，并将其视为潜在积极变化的来源。美国50个州中有至少28个州修订了《律师执业行为准则》，规定律师除了具有法律业务能力，还必须具备技术能力。美国律师协会“未来法律服务委员会”在2016年发布了专题报告《美国法律服务的未来》中明确提及“法律职业者要利用技术创新来满足社会公众的法律服务需求”。加拿大律师协会在2014年发布的《未来：加拿大法律服务提供方式的转型》中将技术视为法律职业转型的重要驱动之一，并认为大数据与人工智能等前沿技术会给法律职业带来重大转变。

域外法律人工智能应用的启示

和世界范围内法律人工智能的发展趋势类似，我国法律人工智能也大致兴起于2013年前后，这是最高人民法院着力推动司法公开所释放的“数据红利”。目前，我国法律人工智能已经处于关键时期。在下一阶段应从以下五个方面推动相关研究与应用。

（一）要着力推动法律人工智能的原创技术创新

技术是驱动法律人工智能应用的根本力量。从全球法律人工智能应用发展的趋势来看，技术的迭代与突破是扩大法律人工智能覆盖面、提升精准度的根本力量。首先，我们要推动法律人工智能原创技术创新。通过法律知识图谱自动化构建与更新技术、法律自然语言识别技术等原创技术的突破解决阻碍法律人工智能应用成效的瓶颈。

（二）要着力推动法律人工智能的技术应用创新

其次，我们要推动法律人工智能的应用创新，将其他领域成熟的技术引入法律场景，做专有的迭代升级，从而打破原有工作格局，提升工作质效。比如将身份识别与在线示证等技术引入网上调解领域，从而大大扩张网上调解系统的功能，提升调解质效；将VR技术引入庭审示证领域，从而大大提升庭审示证效果；将区块链技术引入电子送达领域，实现电子送达的防伪保真与全流程可追溯。

（三）要着力推动法律人工智能的技术集成创新

最后，我们要推动法律人工智能的集成创新。目前，人工智能应用还存在分散开发的问题，各研发主体之间的技术整合力度小。在下一步的法律人工智能开发过程中要着力进行集成创新，实现现有法律人工智能应用的无缝连接与高效协同，构建一体化的法律人工智能平台。

（四）要进一步提升法学院在法律人工智能研发中的角色

从域外法律人工智能开发的过程来看，知名高校法学院扮演着极为重要的角色，甚至在部分法律人工智能开发的项目中由法学院主导推动。可以说，法律人工智能的开发离不开法学与计算机科学的深度融合。目前，我国法律人工智能开发过程中以科技公司推动为主，各大院校法学院的参与程度有限，并且主要局限在理论研究方面。下一步，要更加鼓励法学院校在法律人工智能开发的基本理论、需求确定、思路规划与成效评估中扮演更加实质的角色。

（五）要全程贯彻法律人工智能研发的“用户导向”

从域外法律人工智能发展的过程来看，从2018年开始普遍强调由“研发导向”向“用户导向”的转型。我国法律人工智能开发也存在鲜明的“研发导向”。这具体表现在研发以企业的产品开发为主，（1）由于缺乏专门的训练，实务部门难以将业务痛点转化为技术语言；（2）即使转换为技术语言，在现有技术条件下也无法充分实现。这就导致了法律人工智能应用与实务的脱节。在下一步工作中要强调实务部门在法律人工智能开发中的角色，要贯穿“用户导向”，根据用户的不同需求进行个性化与定向化的法律人工智能开发。

本文作者：东南大学法学院王禄生阮晨欣

江苏省高级人民法院刘坤

来源：《世界司法信息化研究专刊》第四期

本期责编：文慎楠

往期回顾

【成果巡礼】足不出户，云端立案，上海高院“双升级”创新智能诉讼服务！

智慧法院一周新闻速览【6.10—6.16】

刘贵祥：扎实推进法院信息化廉政保密建设

【信息化会议】重庆高院举行全市法院网络安全和信息化工作会议

【成果巡礼】海南高院：智能量刑节省出一半时间！竟然比你还了解你的习惯！