本文作者
魏斌
浙江大学光华法学院百人计划研究员 博士生导师
本文载于《浙江大学学报(人文社会科学版)》
2022年第7期
摘要
法律人工智能面向法律大数据和法律知识,运用机器学习算法与符号逻辑,在遵循法律运行规律的前提下满足法律实践的需求,辅助法律人做出法律决策,提升法律任务的质效。法律人工智能科学内涵之厘清明确了其概念体系,由此确立其交叉学科地位。法律人工智能的理论和技术演化历程展示了法律人工智能的发展逻辑,法律推理与法律论证理论是法律人工智能的理论来源,知识引导和大数据驱动形成了符号主义与联结主义法律人工智能的技术分野。在理论方面,法律人工智能需要探索法律与人工智能深度融合的法学理论,回应伦理和法律关切,制定法律智能系统的运行或使用规则,规制算法偏见和不可解释性问题。在运行模式方面,法律人工智能需要重塑“以人为中心”的智能辅助模式。在技术方面,法律人工智能表现出符号主义与联结主义相融合的趋势,在智慧立法和智慧司法领域中有待深度拓展。关键词:法律人工智能 法律大数据 智慧司法 符号主义 联结主义
在新一代人工智能赋能“智慧司法”与“数字法治”建设,推动国家治理体系和治理能力现代化的趋势下,法律人工智能俨然已经成为学术界和实务界颇具共识的议题,由此形成了巨大的学术聚集效应。但是,什么是法律人工智能?这一基本问题至今都没有得到清晰的回答。数据法学、数字法学、区块链法学、人工智能法学、计算法学等新概念虽然已被广泛使用,但要追问其内涵,或者试图获得一个准确的定义,其回答往往不得要领。法律人工智能的学科基本问题尚不明确,导致了学科内涵和外延边界模糊,继而难以系统性地构建法律人工智能的理论和技术体系。概念模糊也极有可能使法律人工智能的应用迷失方向,脱离法律实践的内在规律,甚至出现人工智能的机械应用,难以满足法律实践的实际需求。
学理上,概念模糊甚至引发学术界质疑法律人工智能作为一个基本学术问题的正当性。人工智能法学研究甚至被批评概念附会现象严重,不少成果只是基于“Al+法律”的任意性组合,“泛人工智能化"研究正在产生大量学术泡沫,制造人工智能研究中的"假问题"或误将司法适用问题当作人工智能法学研究中的元问题,其理论创新方向值得怀疑。人工智能法学研究还存在领域名称不统一、领域内涵不清、学科归属不明等问题。自1987年首届国际法律人工智能会议(ICAIL)召开以来,法律人工智能的发展经历了有共识的35年,呈现出较为清晰的发展脉络。在新一代人工智能背景下,法律人工智能的研究亟须回应法律人工智能的“身份之问”,尤其需要支撑性基础理论的创新,这需要回答一系列基本问题∶(1)法律人工智能的科学内涵是什么?包括它与法律信息学、计算法学的关系是什么?法律人工智能的学科定位是什么?(2)法律人工智能的理论和技术演化呈现出什么样的特征?它们在发展中遗留了哪些问题?(3)新一代人工智能背景下法律人工智能的未来发展趋势是什么?
早在2003年,《人工智能》杂志就曾开设了一期法律人工智能专栏,里斯兰德(E.L.Rissland)等在编者导语中指出∶“法律人工智能就是人工智能研究的典型领域∶它给人工智能提出了困难但有趣的问题,其研究既能够在人工智能及其焦点领域发挥作用,也能够作用于法律本身……法律人工智能不仅仅是一个应用领域,它所关注的问题涉及人工智能的核心问题∶推理、表达和学习。"法律人工智能不仅仅研究人工智能应用于法律领域以辅助法律实践的问题,还关注逻辑推理、知识表示和机器学习等人工智能中非常核心的问题。
(一)法律人工智能的概念体系法律人工智能的发展史是整个人工智能发展史中的重要组成部分,它与人工智能的发展几乎同步,同样经历了三次波峰。第一次波峰是以法律推理刻画法律人的理性思维和逻辑推理,第二次波峰是以法律专家系统支持法律任务决策,第三次波峰是当前由法律大数据所驱动的人工智能的全面应用。法律人工智能的研究对象繁杂,但根据人工智能的技术发展规律,可以归结为符号主义(symbolism)法律人工智能和联结主义(connectionism)法律人工智能两条路径。符号主义法律人工智能认为法律人的思维是演绎式思维,是由证据和知识作为前提推出结论的过程,该路径研究法律推理、法律论证和法律对话的人工智能模型,服务于案件事实发现与认定等具体的司法任务。联结主义法律人工智能认为法律人的思维是归纳或类比式思维,是从经验或已有数据中检测、归纳共性规律和特征的思维,该路径研究机器学习和大数据挖掘技术在司法领域的应用,主要包括法律信息检索、法律信息抽取、法律文本分类、法律文本摘要、司法判决预测等。法律人工智能不同于一般的人工智能应用,它并非人工智能在法律领域的简单或机械应用,而是将人工智能的技术理性与法律实践的形式理性相结合,深度理解和遵循法律运行的规律,在诉讼规则框架之内,将人工智能的理论、技术和应用引入法律实践,辅助立法、审判和司法行政,以替代重复和低效的法律任务。法律人工智能的技术机理是由感知智能走向认知智能,再形成法律决策的过程。这个过程需要向机器投喂法律大数据和法律知识,为法律实践需求提供解决方案的理论、技术和方法,其核心是实现法律任务的数据化、法律决策的知识化、任务执行的智能化,而不是简单的信息化、流程化和平台化。法律人工智能在不同的法律情境中有不同的技术表现力,如“智慧法院”建设在立案、审判、执行和管理等不同实践场景对人工智能技术的应用提出了不同的要求。法律人工智能的概念是将法学概念和人工智能概念有机耦合的交叉性概念,它不是人工智能进入新阶段之后产生的新的权利和义务的概念,而是由人工智能的技术基因与法律实践的需求相碰撞而产生的新概念,这些概念大多数体现了人工智能和法律的双重属性。作为生产要素的概念包括法律本体、法律大数据、法律知识、法律知识图谱等。法律大数据既有大数据所普遍具有的海量性、高速性、多样性和价值性的“4V特征”,也具有适配性、正确性和易变性三种特有属性。作为受到法律任务启发的技术应用概念,"智慧法院"建设中的相关概念包括类案推送、法律检索、司法判决预测、量刑辅助、电子卷宗随案生成、文书智能纠错、智能合约等。这些概念都有其特定的内涵,是由相应的人工智能技术和法律实践内涵融合与凝练而成的。厘清法律人工智能概念还是定义智慧司法标准体系的前提条件,而标准体系的指标设计是基于概念体系来构建专业术语及其标准。为构建以信息化、智能化、无纸化为主要特征的“全流程智能庭审”模式,最高人民法院组织编制了《智能庭审应用技术要求》(FYB/T52038—2020),该行业标准就对智能庭审(intelligent trial)、智能法庭(intelligent of the court)等概念做了明确定义。"智慧法院”有较为完备的概念体系,形成了较为严格的标准体系,例如,刑事案件量刑规范化辅助是帮助法官自动识别并推送刑事案件量刑的参考信息,其考核指标明确包括∶各级人民法院自动提取刑事案件法定和酌情量刑情节、自动推送量刑规范化的法律和司法解释、基于大数据分析相似案件量刑幅度并提供量刑参考。
(二)法律人工智能与计算法学、法律信息学的关联法律人工智能的概念还需要与其他相似概念区分开来,法律人工智能与计算法学、法律信息学这两个概念呈现出紧密的关联。斯坦福大学CodeX法律信息研究中心明确界定计算法学是法律信息学的分支,主要研究法律分析的自动化和机械化。计算法学是针对基于计算的对象、方法及能力等方面的差异而产生的不同的法律问题以及与法律相关的技术问题,利用计算方法开展法律大数据分析,并结合计算技术研究法律科技的一门学科。计算法学的研究对象呈现多元化,从既有的域外研究成果来看,计算法学的研究方法渐趋成熟,研究视域不断拓宽,在数据驱动与算法驱动的多维推进下,其研究模式呈现出跨学科合作趋向。从概念的演进过程来看,计算法学的概念最初流行于美国,CodeX法律信息研究中心等机构进行了早期的探索。计算法学还包含人工智能技术之外的信息学技术,法律信息化并不能代表法律智能化。司法信息化不等于司法智能化,因为两者的技术目的、技术特征、发展确定性和应用场景有所不同。计算法学拓展了实证法学研究的范式,同样也深嵌于法学与社会科学的交叉范式中,如司法政治学、法社会学、犯罪学等。也就是说,计算法学是统计学、数学、计量学等数理方法与法学研究交叉所产生的新计算社会科学。法律人工智能与计算法学在推理、学习和决策领域有着共同的问题和研究对象。比较而言,法律人工智能与计算法学的区别在于∶(1)从概念内涵来看,计算法学指向“可计算的法学”,法律人工智能则偏向人工智能技术与法律实践融合以形成人工智能服务于法律实践的理论、技术和应用。(2)从两者采用的技术来看,法律人工智能采用的技术主要是人工智能,具有知识推理和大数据学习等智能化特征,而计算法学采用数学、统计学、计量科学等计算方法。(3)两者在技术路径和研究对象上有重合,但研究的出发点和侧重点有所不同。法律人工智能侧重从知识和大数据两条路径切入人工智能与法律的交叉融合,体现的是智能化属性;计算法学更侧重研究法律的可计算性,采用更广泛的信息技术来研究可计算的法学,体现法律的可量化、实证性和计算化属性。法律人工智能、计算法学都是法律信息学的子领域。法律信息学通常可追溯到美国法律逻辑学家洛文杰(L.Loevinger)于1949年提出的“法律计量学”,其目标是利用计算机对法律进行定量分析。法律人工智能是法律信息学的研究对象,关注的是信息技术在法律中的运用。有观点就指出,计算法学是法律信息学中研究法律推理自动化的分支学科。法律信息学以法律人工智能和计算法学为主体研究对象,还可以扩大到法律任务的程序化、可视化、系统化和平台化应用。因而,法律人工智能和计算法学都属于法律信息学的范畴,法律人工智能是法律信息学中更加注重以人工智能技术赋能法律的子领域,具有技术性更集中、表现力更强的特征。法律人工智能与法律信息学的关系如图1所示。图1 法律人工智能与法律信息学的关系
(三)法律人工智能的学科地位法律人工智能概念之厘清为其交叉学科地位的确立奠定了基石,它圈定了法律人工智能研究的内涵与外延,为判断何为法律人工智能提供了最基本的标准。无论是基于理论研究的需要还是法律实践的需求,法律人工智能获得相对独立的交叉学科地位都具有紧迫性。法律人工智能的学科交叉属性要满足两个基本条件∶第一个条件是法律人工智能必须是法学和人工智能这两个领域的研究对象,也就是说,法学家和人工智能科学家都认为法律人工智能在其学科研究范围之内。第二个条件是法律人工智能必须具备自身独有的学科属性,即法学与人工智能交叉之下诞生的新属性。同时,法律人工智能还应有明确的学科目标、相对独立的知识体系和问题领域。在人工智能科学家看来,法律人工智能显然属于人工智能在法律领域的应用,或者说,它是应用的人工智能。在法学家看来,法律人工智能属于法学理论甚至是法哲学研究范畴。法哲学家考夫曼(A.Kaufmann)就曾指出∶“法律信息学是在法律事务上的应用,且需要法律理论知识的一种技术,这些偏向形式的法律领域,今天绝大多数的看法,不再归属于原本意义的法律哲学,而较倾向于归属法学理论。”这种观点认为法律信息学这样的交叉学科就属于法理学或法哲学的研究范畴。法律信息学是研究信息学在法律领域的应用,因此涉及与法律相关的组织(如法律事务所、法院和法学院校)以及信息的使用者,还有这些组织所包含的信息技术。简单理解,法律信息学研究的是信息技术在法律领域的应用,被普遍认为是人工智能技术应用于法律领域的早期形态。法律人工智能归属于法学和人工智能两个领域,但更应当明确法律人工智能的交叉学科性质,或者说法律人工智能更应该获得相对独立的学科地位,像法律经济学、法律社会学、法律逻辑学等一样形成有规范体系和概念范畴的理论。因而,法律人工智能被定位为一门法学与人工智能交叉的新兴学科,这门交叉科学基于人工智能来求解法律领域的问题,帮助提升法律实践的质效,它有明确的问题意识和实现目标,又并非人工智能在法律领域的机械应用,而是与法律实践的规律有机融合。也就是说,法律人工智能既有法学与人工智能相交叉的学科基因,又始终保持相对的学科独立性。从法律人工智能的国际学术共同体来看,国际法律人工智能学界已经形成了稳定的学术研究群体,搭建起了国际性的学术交流平台。成立于1987年的国际法律人工智能协会(IAAIL)致力于推动该交叉学科的发展,该协会采用轮值主席制,协会理事由来自全球三十多个国家和地区的人工智能科学家和法学家组成。国际法律人工智能会议(ICAIL)和法律知识与信息系统国际会议(JURIX)是该领域的常规会议。国际法律人工智能会议还曾增设一些子会议,所涵盖的主题包括法律文本的自动演绎,法律人工智能研究的多语言交流,法律自动挖掘、抽取和分析,可解释和负责任的法律人工智能等。国际法律人工智能研究还有专门的学术刊物,即1992年在美国匹兹堡大学创刊、由斯普林格出版社出版的《人工智能与法律杂志》。法律人工智能行业也形成了有鲜明特征的职业群体。在法律人和人工智能科学家的群体中产生了一种新的职业————法律工程师,这类新兴职业群体不仅要懂得人工智能的技术,也要懂得法律实务的原理,还应当深谙人工智能与法律实务的融合机理。从专业化人才培养的角度看,培养合格的法律工程师是一项长期且系统的工程。在专业化赛事方面,由中国中文信息学会等机构联合发起的司法人工智能挑战赛(CAIL)就从罪名预测、法条推荐和刑期预测等方面展开竞赛。国际上,由IBM沃森(Waston)和法律区块链企业Integra等联合发起的全球法律科技黑客松(Legal Hackathon)吸引了来自全球数十个国家与地区的研究人员参与。法律人工智能无疑是国内外人工智能垂直应用的又一个热门领域。
法律人工智能应当具备扎实的基础理论,技术研究应在理论基础上实现应用的需求和目标。根据任务的难易和系统的实用性强弱程度,法律人工智能的研究主题可以分为基础研究、理论研究、实用性研究和精细化研究。其中,理论研究一是关注法律推理的法理学研究,二是关注不同类型的法律逻辑研究,三是关注法律知识变化的研究。人工智能与法律的融合不是一蹴而就的,两者的融合起源于法哲学和法理学对人工智能的启发,法律人工智能的法学理论充分吸收了法律推理理论、法律论证理论、法律商谈理论和法律对话理论等。法律人工智能的自适应问题也倒逼了其理论应答的完善。
(一)法律推理和法律论证的理论启发法律人工智能的理论研究是这一研究的顶层设计,它决定了技术如何使用、使用的范围和技术性能等一系列后续研究的方向。从法律人工智能的理论演化过程来看,最基本的问题还是对法律概念和法律知识的人工智能表达,这涉及如何形式化以及使用何种语言形式化法律知识的问题。不同语言的刻画精度和能力有所差异,因而寻找恰当的形式化语言是法律人工智能研究的重要工作,这形成了以法律逻辑为主导的法律人工智能的理论研究。进一步的研究还包括法律概念、法律规则、法律原则,甚至是法律价值的形式化,这种形式化研究必须充分考虑概念、规则、原则和价值的法律属性,尽可能地通过技术手段表达法律属性。在此基础上,法律人工智能研究如何从法律推理、法律论证、法律对话的法理学和法哲学理论中汲取理论养分,经典理论包括麦考密克(N.MacComick)的二级证成和后果主义论证、阿尔尼奥(A.Aarnio)的法律解释的证成理论、佩策尼克(A.Peczenik)的转化证成和深度证成理论等,其中又以阿列克西(R.Alexy)的法律论证理论最具代表性。阿列克西的法律论证理论为构建法律论证的人工智能模型提供了理论支持,受内部证成启发,如果要构建一个逻辑有效的论证,那么其逻辑形式可以表达为一个连锁式的充分条件假言推理,通常也表达为三段论的形式。在传统逻辑当中,论证的有效性满足前提为真,结论则必然为真,但在法律论证的真实情境中,并不是完全以真或假来解释或衡量命题。阿列克西的外部证成理论就是为了寻找一种真值之外的方法来评价大前提的合理性、正当性或可接受性,这启发人工智能研究突破有效性标准来评价法律论证理论。法律论证的人工智能研究受到阿列克西法律论证理论的影响,尤其是外部证成理论对传统形式化研究的颠覆。在新的形式化方法中,法律论证不再以有效性来评价其好坏,而是以一种可接受性来评价∶一个论证当且仅当它是可接受的,它才是好的论证。可接受性为逻辑形式之外的诸如道德、后果、价值以及利益等因素的考量留出了余地。人工智能评估法律论证的标准还可以表示为“被证成的”(justified),融贯论为“证成”概念提供了哲学辩护。融贯论认为,法是一个融贯的整体,或者说,一个法律判断之所以是合理的,就在于它能够与一种关于法的融贯理论相适恰。法律人工智能跳出了法哲学家关于何谓证成和法律证成的困局式讨论,从对话的视角提出了对法律证成的理解。法律证成既有作为结果的证成,也有作为过程的证成。以演绎逻辑为基础的简单模型只能处理作为结果的证成,而难以刻画法律证成的可废止性和法律的开放性,也无法规避明希豪森三重困境。受到阿尔尼奥、阿克西和佩策尼克等学者的启发,对话式模型可以避免简单模型的缺陷。对话式建模法律证成体现了论证的理性特质,既包含有逻辑视角的理性论辩,也包含有心理视角的对话式理性论辩,这就需要一种综合理性论辩和对话式理性论辩的研究进路。埃朗根学派定义了一种伦理规范程序,程序的共识是命题被证成与否是根据其他人的接受性来判定的,即如果命题被接受,那么它是被证成的 。法律人工智能刻画法律论证的可接受性有两个基本预设∶首先,在有反对意见质疑前提的情况下,如果存在关于它的辩护论证,那么它符合可接受性标准。其次,在没有反对意见质疑前提的情况下,即使不存在辩护论证,它也可以满足可接受性标准。这意味着被判定担负举证责任的一方总是有义务为不被接受的证据做出解释和辩护,即论辩双方需要不断地回应针对前提的反对意见或冲突证据,因而前提的可接受性评估必然是一个动态的过程。此外,法律论证的可接受性标准是相对于听众而言的,可接受的论证是能被听众理性接受的论证。在法庭辩论阶段,论辩双方的目的是说服作为听众的审判方接受其主张,包括其提出的证据以及由此组织的论证。同样,审判方的法律论证(释法说理)更应当取得听众的认同。法律论证理论的人工智能研究与阿列克西外部证成理论的诸多细节不谋而合,例如,阿列克西列出的规则∶“(J.8)各种不同形式的论证的分量,必须根据权衡轻重的规则来加以确定。"法律论证的人工智能研究就是通过论证所包含的规则的优先性来确定论证的优先顺序。人工智能作用于法律推理、法律论证和法律对话的机理在于通过精细、严格和准确的方法来刻画由法律命题(证据、经验、先例等)到法律结论的结果、程序和过程。法律推理是结果,人工智能借助非单调逻辑和人工智能逻辑来刻画基于规则的法律推理和基于案例的法律推理。法律论证是程序,人工智能发展了可计算论辩理论等新工具来识别、比较、分析和评价法律论证。法律对话是过程,人工智能应用对话逻辑来研究主体参与的对话的过程,评价对话参与方的会话行为,检验整个对话程序的合法性和有效性,甚至通过研究对话来判定案件事实状态的动态变化,评价其是否满足相应的证明标准,辅助法官做出司法判决。
(二)法律人工智能实践的理论应答法律人工智能在智慧司法和数字法治实践中也产生了很多问题,需要理论上的回应。首先面临的问题是,为什么人工智能辅助法律任务具备正当性?即法律与人工智能融合的正当性需要得到法理上的辩护。法学理论研究应当正视人工智能技术与现行法律体系之间的张力,构建与法律人工智能相匹配的法学理论。法律融合人工智能有其法理,它是法律融合科技之法理的新命题。法律人工智能的法理是“实践之法理”,是证成法律人工智能实践之正当性的理据,它反映了人工智能的技术理性与法律实践理性的融合,从而揭示了法律运行的规律和特征。法律知识的专业化、法律大数据的结构化、法律任务的多样化、法律对抗性的求真等特征使得法律融合人工智能具备最基本的可行性,法理研究应探寻人工智能与法律实践特征之间的融贯原理。法律人工智能的技术瓶颈同样会带来不可避免的后果,同样需要法学理论的回应。法律人工智能面临算法的过拟合与欠拟合问题、算法偏见与算法歧视等技术瓶颈,尤其是类案推送、量刑辅助、判决预测、裁判文书的自动化生成等智能化系统采用了深度学习算法,必然会产生黑箱算法或不可解释性问题。在人工智能技术瓶颈未取得突破之前,还需要构建与司法透明性、可解释性要求相协调的法学理论。传统的理论体系已不足以应对,这就催生了以“数字法学”为代表的新法学理论,它研究算法的法律规制与算法的透明度治理,探索以算法备案或审查制度等来消解算法困境所带来的负面后果,采用算法安全风险监测、算法安全评估、科技伦理审查等监管方法来化解算法的透明度难题。法律人工智能的理论研究还需要正视技术的限度。人工智能技术无法形成普遍适用和完全统一的应用形态,只能在有限的场域发挥作用。在审判场景下,尽管法律人工智能有助于解决案多人少的问题,减轻审判人员的工作量,提高司法机制的运行效率,但人工智能仍无法替代人类法官,人工智能的决策结果不能在未经法官校验的情况下作为司法判决的依据。因而,法律人工智能应当始终坚持以法官为中心,法官的地位不能因技术的影响而发生动摇,避免造成司法权或审判权的解构。法律人工智能的理论研究需要明确人工智能辅助的适用范围与使用规则,反思大数据分析、预测模型等技术的局限性,构建法律人工智能辅助的规范理论。
法律人工智能在知识引导和大数据驱动之下演化为符号主义与联结主义两种路径。
(一)符号主义法律人工智能符号主义法律人工智能采用知识引导的人工智能技术,它主要通过逻辑推理的方式来实现,具有透明性、可解释性和知识性等特点。这类技术及专家系统在20世纪70—80年代达到了技术发展的顶峰,其技术特点是高度依赖法律专家的知识。法律知识库包含了多样化的知识来源,包括立法、判例法、法律文本、专家知识和元知识等。知识引导的法律人工智能旨在模拟和刻画法律人的逻辑思维,如法官根据法律知识和经验做出司法裁决的过程体现了人类认知的基本思维规律,知识引导的法律人工智能研究法官、检察官和律师的推理和论证活动,关注如何构建从法律规则或先例得到裁决结论的法律推理,形成了基于规则和基于案例的两类可计算模型,为认定案件事实和适用法律法规提供了逻辑引擎。1981年,沃特曼(D.A.Waterman)等针对产品责任法研发出了一种基于规则的法律决策系统(LDS),该专家系统使用了一种面向规则的ROSIE语言,用于研究立法变化对案件判决结果的影响。1984年,IE软件公司推出了资料保护咨询的法律专家系统(DPA),作为资料保护法在立法、执行以及评估过程中的支持系统,该系统容纳了400条规则并且可以表达200个问题,能够根据使用者的回答以及程序中的规则,提出主张并得出相应结论。瑟格特(M.J.Sergot)等设计了一种用于判断国籍的法律专家系统,该系统使用逻辑程序语言将1981年的英国国籍法案翻译为形式逻辑语言,并且通过逻辑推理自动化得出结论。加德纳(A.Gardner)设计了一种基于Lisp逻辑程序的自动化推理系统,解决了合同法中关于给付和接受的问题,被用于辅助合同法教学和考试中的法律推理。基于案例的法律推理是通过当前案件与先例的类比,借鉴相似案例的法律推理来解决当前案件中的问题。最经典的应用是里斯兰德与阿什利(K.Ashley)于1987年设计的用于分析商业秘密侵犯案件的海波系统(HYPO),该系统是一个典型的基于案例的论辩系统。里斯兰德等还将基于规则和基于案例的法律推理相结合,构建了兼具两种推理模式优点的复合型模型——卡巴莱系统(CABARET),该系统交替使用两种模型,如果基于案例的推理无效,就替换成基于规则的推理,反之亦然。布兰廷(L.K.Branting)研究了一种基于案例解释的生成器GREBE,该系统通过分析先例的事实知识和法律推理以及应用基于规则和常识的推理,判定和证成新案件的法律后果,其特点在于通过语义网络来生成案件的解释并将其用于评估案件的相似性。基于规则和基于案例的法律推理多是静态式推理,而法律推理的研究正朝着动态式的方向发展,这使得法律推理被赋予动态性、主体性和可废止性等属性,法律论证的人工智能研究逐步兴起。法律论证的人工智能研究是利用形式化工具抽象法律论证,得到分析和评价法律论证的模型。帕肯(H.Prakken)研究法律论证的可废止建模——一种解决冲突论证的评价模型,后来又在此基础上发展出了一种可以表达论证结构的结构化论辩框架,并且将其应用于分析Popov诉Hayashi 案。戈登(T.F.Gordon)等受到古希腊哲学家卡尔尼德斯(Carneades)的启发,发展出了一种能够刻画不同类型证明标准和证明责任的卡尔尼德斯模型。在第三次人工智能变革的背景下,法律论证的研究开始呈现出与法律文本解析相融合的趋势,例如,IBM在认知计算机沃森基础上研发的法律机器人ROSS就是一个可以理解自然语言问答的智能法律助手,它将法律推理、法律论证、法律对话的技术与法律文本解析技术相融合,能够以自然语言问答的形式与律师进行专业交流。
(二)联结主义法律人工智能联结主义法律人工智能采用大数据驱动的法律人工智能技术,主要通过机器学习等算法来训练预测模型,其发展得益于机器学习与自然语言处理技术(NLP)在法律文本大数据挖掘中的应用。这类技术在深度学习应用于AlphaGo之后达到了顶峰,已经被广泛应用于语音识别与合成、图像识别和视频处理、自然语言处理等领域。联结主义的优点是改善知识引导的技术在知识工程建构时所面临的知识获取瓶颈的问题,弥补人为定义规则的不完备性,而且机器学习算法的学习结果突出,在预测等功能上有优越的表现力。联结主义法律人工智能使用机器学习算法来分析法律文本大数据,从而实现法律文本分类和摘要、类案检索、司法判决预测等功能。法律信息抽取研究法律文本中要素的抽取,包括个人姓名、法律概念、案例要素、合同要素的抽取等。2003年,《人工智能》杂志发表了法律案例信息抽取的相关研究,该研究利用信息检索和机器学习技术发现当前案例与先例文本的相关性,其实验结果获得了良好的召回率和准确率,识别了法律概念和法律关系等法律本体。随着NLP技术的不断发展,法律信息抽取的应用也愈加多元化,拉姆(G.Lame)就采用NLP技术分析了法国法典中的法律概念及其语义关系,从而在交互式查询和信息检索当中发挥作用。巴尔托利尼(R.Bartolini)等利用一种SALEM自然语言处理技术对意大利的立法文本进行语义标记和索引,用于识别义务、权限、禁止和惩罚等多种本体。除了对命名实体的抽取,法律信息抽取还可以实现对实体关系的抽取,有学者就通过迁移学习方法抽取法律命名实体关系,该方法在欧盟法律数据库的实验中获得了良好的实验结果。法律文本分类主要是基于不同类型的分类器实现对法律文本的分类,通常包含三个步骤∶一是选取合适和可行的数据库,这些数据库通常由判决文书构成;二是选择文本特征,使用恰当的方法描述数据的特征;三是选择算法分类器,常见分类器包括朴素贝叶斯、支持向量机、逻辑回归和神经网络算法等。法律文本分类可以实现对案件类型、罪名类型的分类。例如,分类器就被用于识别连环犯罪的犯罪记录。犯罪记录的语料库包含犯罪、犯罪者和受害者等相关信息,分类器可以对这些记录中的特定犯罪记录进行分类,连环犯罪分类主要识别犯罪特征与构成连环犯罪的要素之间的关系,使用机器学习算法来区分语料库中的相似记录,从而实现犯罪数据库中连环犯罪模式的聚类。法律文本分类还可以用于分案,有学者为应对美国专利诉讼的异常暴增,采用NLP启发式算法替代传统的词袋方法来抽取高阶语义信息,研究出一种能有效识别该类诉讼的分类器。法律文本摘要主要针对法律文本中关键信息的抽取。早期有默恩斯(M.Moens)等发展的SALOMON系统,实现了针对刑事案件的自动化摘要。目前的自动化摘要多采用监督学习的方法处理结构化的法律文本数据,算法覆盖了机器学习的常见类型,还包括最大熵序列模型、向前神经网络和递归神经网络等。有学者设计出一种被称为LetSum的法律文本自动摘要系统,该系统的语料库包含加拿大高等法院的3500份判决文书,设定识别和抽取法律判决文本中的简介、背景、司法分析和结论四个主题。在最新的研究中,有学者使用卷积神经网络算法对美国退伍军人创伤后应激障碍诉讼案例进行摘要,该方法提供了一种基于预测性句子迭代加密方法的自动化文本摘要技术,采用基于深度学习的提取式方法,从用于预测案件结果的句子中抽取摘要。还有学者设计出一种生成式多模型融合的自动摘要方法,在Seq2Seq模型的基础上,引入注意力机制,通过Bert 预训练和强化学习等方法对中文裁判文书进行自动化摘要。法律文本解析的技术逻辑是为了实现法律预测。法律预测通常运用于司法判决预测,也被认为是法律文本分类的特殊应用。法律预测包含对判决结果、适用法律法规和量刑的预测。有研究团队预测了欧洲人权法院的司法判决结果是否违背人权,语料库是从欧洲人权法院的判决文本中抽取出的结构化信息,分类器使用N-gram和主题聚类算法来表达文本的特征,研究显示,该方法的平均预测准确率达到79%。随后,有研究验证了该实验的可重复性,通过扩大语料库中的案例数量,采用类似的算法模型,其预测准确率仍可达到75%。另有研究团队研究了针对美国高等法院近两个世纪以来的判决的预测模型,语料库选择了美国高等法院在1816—2015年所做出的24000 份法官投票和28000个案件判决结果,特征工程在先例中的240个变量中选择了15个常见的类别变量,分类器选择的是时间演化的随机森林算法,研究结果显示,在法官投票方面达到了71.9%的成功率,在预测判决结果方面达到了70.2%的成功率。中国裁判文书网是全球最大的司法裁判数据库,为法律预测提供了高质量的文本大数据,产生了大量关于司法预测的研究成果,例如,采用注意力机制来实现子任务结果之间的拓扑依赖关系的法律预测方法,基于深度神经网络或因果关联的法律预测的可解释性研究等。比较而言,两种路径解决不同领域和需求的法律任务,其算法可解释性、结果的表现力各有差异。这两种技术路径的机理图表示如图2所示。
(三)法律人工智能在智慧司法中的应用法律人工智能有显著的应用属性,其应用形态可以是系统、软件、平台和装备,辅助实现法律任务的网络化、平台化和智能化。法律人工智能在我国“智慧司法”和“数字法治”建设中的应用最具有代表性,国务院印发的《新一代人工智能发展规划》就明确将“智慧法庭”列入规划,提出要建设集审判、人员、数据应用、司法公开和动态监控于一体的智慧法庭数据平台,促进人工智能在证据收集、案例分析、法律文件阅读与分析中的应用,实现法院审判体系和审判能力智能化。智慧法庭在审判阶段集中展示了法律人工智能的技术特点,其代表性应用包括∶(1)类案推送,根据当前案件检索来推送最相似的案件及其判决书;(2)法律判决预测,从裁判文书中抽取关键信息并进行分类,然后采用文本分类的方法来预测当前案件的结果,包括相关罪名、法条和刑期等;(3)法律文书自动生成,基于案件的审判数据和法律知识,构建案件的知识图谱,使用机器学习和自然语言生成技术,实现法律文书的自动化生成与校对。全国各级人民法院开展了卓有成效的智能化辅助系统研发,其中由浙江省高级人民法院牵头研发的全流程智能审判系统(FITS)“小智”实现了法律信息提取、证据分类、问题生成、对话摘要、判决预测和判决文书生成等任务。该系统首先从法律文本中提取要素,以协助法官有效识别案件要旨,接着通过验证所有证据的一致性来证明每个证据的有效性。为辅助法官在庭审中提问,该系统还设计了一个自动提问机器人,包括程序性发问和事实性发问。该系统还能在多任务学习框架下归纳法庭辩论中的争议焦点,并实时生成庭审的审判记录。为提升智能系统支持法官做出判决的可解释性,该系统还采用一阶逻辑来表达法律知识,并将其嵌入深度神经网络来预测判决结果。最后,该系统提出了一种基于注意力和反事实的自然语言生成方法来生成法院的裁判文书。全流程智审系统已经在金融借贷和民间借贷等简易案件审理中发挥了作用,形成了“凤凰金融智审”的新审判模式。
法律人工智能技术在律师行业同样也得到了成熟应用,其主要应用包括∶(1)法律咨询服务。结合计算语言学和语音识别等技术实现精准咨询的法律机器人ROSS,就是一个问答式法律智能机器人,其业务范围覆盖破产法、知识产权和劳动法案件。基于沃森研发的另一款DoNotPay法律咨询机器人则用于解决停车罚单纠纷,其业务范围已经扩展到航班延误的补偿诉讼。英国剑桥大学法学院开发的Lawbot法律咨询机器人为刑事案件的受害人寻找法律依据,案由覆盖了英国常见的26种主要刑事罪名。(2)法律文本审查和生成,能自动获取法律法规和合同文本数据中的关键信息,辅助法律文档审查,实现法律文本自动化生成。LawGeex公司的人工智能平台就曾在一次有关标准商业合同内容审查的竞赛中打败了20名有丰富经验的顶尖律师。(3)法律分析和预测,对法官的决策进行司法画像,进而预测法官的判决结果。法国一家名为“Predictice”的法律科技公司就向律师事务所、保险公司和各级法院提供预测服务。总体而言,法律人工智能应用于智慧司法有两种思路,第一种思路是按照业务需求去找技术,这种思路要求根据业务逻辑来定位何种人工智能技术是适用的。目前我国智慧法院的建设大体遵循这个思路,为实现全业务、全流程、全覆盖,试图通过技术化手段改变传统业务的处理方式,提高业务执行的效能。依照业务流程建立起来的体系在一定程度上提升了法院业务流转的效率,然而,这种思路的难点在于需要区分法院业务数据化、网络化、信息化与智能化之间的差异。第二种思路是基于人工智能技术去寻找适用的业务场景,即从人工智能技术本身的应用特点来看,它究竟能成熟地适用于哪些业务场景。在司法大数据满足模型训练要求的基本条件下,深度学习与语音识别、图像识别、自然语言处理、知识图谱等技术的结合在相关司法业务领域取得了较为理想的成绩。在这种思路下,能够比较清晰地看到成熟的人工智能技术可以与哪些法院业务相关联,例如,自然语言处理技术可以在类案检索、法律法规推送、判决预测等方面发挥重要作用。这种思路的特点在于从技术特点出发,充分论证哪些业务场景适用于法律人工智能技术,避免为了智能化而智能化。
法律人工智能的未来发展在理论、技术和实践层面都面临新的挑战。在理论层面,法律与人工智能的深度融合还需要在法理研究上继续探索,联结主义法律人工智能还面临算法歧视和不可解释性的伦理问题,因而,亟须研究隐私和个人信息保护的新方案,制定智能化系统的运行或使用规则。在运行模式方面,以人工智能替代法律人的模式将被颠覆,法律人工智能将回到“以人为中心”的新协同模式中。在技术与实践方面,法律人工智能的发展表现出符号主义与联结主义相融合的强劲趋势,在智慧立法和智慧司法领域中的应用将得到进一步深化。
(一)法律与人工智能深度融合的法理研究法律与人工智能的深度融合的法理研究首先应当回应本体论质疑。在本体论意义上,人工智能对传统法律制度与法律运行机制产生了极大的冲击,在线审判颠覆了传统的审判模式,智能审判撼动了法官的审判权。法律人工智能理论研究应当驳斥算法或代码法律化的假想,代码将规则编码为机器可理解的形式语言,但并非所有法律都是机器可读的,机器本身无法理解法律概念、法律规则和法律原则,法律的开放性和模糊性都是其代码化的障碍。如何在发挥科技的作用与限制科技的负面效应之间找寻平衡点,是未来法律人工智能理论研究所要回答的问题。理论研究应当清晰地回应人工智能是否会替代法律人这样的经典命题,明确人工智能与法律人的能与不能,以及人工智能的辅助范围与能力瓶颈。要避免对当事人公平受审权的威胁,避免信息技术对司法尊严和神圣性的侵蚀,避免对信息技术和智慧司法的过度迷信和依赖。从法律人工智能的理论演化逻辑来看,法律推理与法律论证理论启发了法律人工智能,从法律方法论视角深入研究法律人工智能是未来的理论研究趋势之一。法律解释与法律议论的理论研究将成为驱动法律人工智能发展的新方向,法律解释就是把明文规定的法律规范作为大前提,把法官认定的案件事实作为小前提,通过要件的对应关系把具体事实逐一涵摄到抽象规范之中并得出结论的三段论逻辑推演过程。将案件事实涵摄于法律规范,关键在于研究法律规范中概念所指称的基本构成要件与案件事实最终确定的要件是否相匹配,这要求案件事实认定中的要件与法律规范所规定的要件在立法意旨中的含义是相符合的,如此才能将包含所有要件的法律规范与确定的案件事实相关联。法律解释与法律议论的理论发展将为法律人工智能提供新的契机。尽管法律人工智能在理论层面已经取得了丰富的成果,但长期存在理论研究与应用实践相分离的问题,很多理论研究的成果尚未得到实践的检验。法律推理的理论研究应当从实践的视角出发,使理论研究的成果可视化,从而避免因自我封闭于象牙塔而产生对人工智能法律推理的错觉。法律人工智能的研究应当从理论研究走向应用,在实践中检验理论的价值。因此,如何将理论应用于实践,形成实践性的研究成果,是未来法律人工智能要突破的难点。法律实践涉及的具体问题众多,但涉及司法裁判的最核心的两个问题是案件事实的认定与法律法规的适用。法律人工智能研究应当始终着眼于这两个问题领域的理论研究,既要吸收传统法学理论关于案件事实和法律法规适用的理论,更要突破传统法律方法的瓶颈,充分发挥人工智能的技术优势,变革性地创新理论基础牢固且可操作的方法。
(二)法律人工智能的伦理和法律关切法律人工智能应用的难题之一是如何确保人工智能系统做出的决策符合人类认可的责任和道德标准。社会价值、法律以及伦理规则对法律人工智能建模有着重要的作用,它们使智能化系统决策更加契合法律人的道德价值观,符合社会的伦理和法律约束。从算法伦理的视角来看,法律人工智能应当保证算法的公平性,算法歧视会削弱司法的公信力。治理人工智能算法歧视需要实现反歧视法律数字化转型,以算法解释化解信息单向透明趋势,以算法审核抑制代码歧视风险,以非歧视准则规范人工智能的开发、利用行为。同时,机器学习的不可解释性使得智能化系统面临决策不可控制、不可预测的风险。可解释性是司法透明性的基本前提,“阿西洛马人工智能原则”就明确将司法透明性列入伦理和价值原则中。算法的可解释性需要解释从输入到输出的算法原理,包括算法的安全性、鲁棒性、公平性等。法律人工智能的可解释性研究要紧跟人工智能前沿,在技术瓶颈难以突破的情况下,从伦理、法律和行业规则的角度进行事前预防,设计合理的不可解释性防范机制。从数据伦理的视角来看,联结主义法律人工智能不可避免地存在数据安全的风险,因而需要设计保护法官、检察官和当事人个人信息和隐私的机制。隐私和个人信息的保护可以通过禁止对个人敏感信息进行自动化处理、引入隐私设计理论、更新通知同意机制、设置自动化处理禁区等方法来实现,技术上可以采用确定隐私设计原则、重视隐私增强技术和隐私影响评估制度等措施。我国《人民法院在线运行规则》第三十六条规定∶“各级人民法院应当加强司法公开工作中的个人信息保护,严格执行法律规定的公开范围,依法公开相关信息,运用信息化手段支持个人敏感信息屏蔽、司法公开质量管控。”数据安全的保护机制可以将隐私和个人信息保护的要求设计写入系统中,还可以明确智能化系统使用的边界,规范数据使用和系统运行的条件和程序,减轻数据不当使用造成的隐私和个人信息的损害。从保护主体权利的视角来看,使用者的知情同意权、算法拒绝权、机器决策后的事后救济权应当受到法律保护。尽管我国已有法律法规保障当事人参与在线诉讼的知情同意权,如最新修正的《中华人民共和国民事诉讼法》第十六条规定∶“经当事人同意,民事诉讼活动可以通过信息网络平台在线进行。”《人民法院在线诉讼规则》第二条也规定了合法自愿原则∶“尊重和保障当事人及其他诉讼参与人对诉讼方式的选择权,未经当事人及其他诉讼参与人同意,人民法院不得强制或者变相强制适用在线诉讼。”然而,目前还没有出台智能化系统运行的专门性规则。法官在使用智能化审判系统、量刑预测系统等智能化系统之前,有义务先行告知当事人并说明智能化系统运行的基本原理。同时,在当事人明确提出拒绝使用智能化系统时,不应当强制使用。构建第三方审查制度能够有效对智能化系统的性能进行检测,使用者有权请求有资质的第三方机构对智能化系统进行全方位评估。如果智能化系统辅助法官判决的结果出错,那么应当根据智能系统参与程度等情况来明确责任分配,但无论何种情况,都应当坚持法官是最终责任主体。
(三)重塑"以人为中心"的智能辅助模式法律人工智能的目的不是替代法律人,而是辅助法律人。当前,法律人工智能的应用试图在核心领域替代人的作用,忽视了人工智能技术的瓶颈,减弱了法律人的能动性。法律人工智能研究需要正视人工智能的技术瓶颈,重塑以法律人为中心的交互模式。智慧司法的应用正朝着“全业务、全流程、全时空”的方向扩大化发展,极可能引发盲目智能化的风险,然而,智慧司法的实践反馈已经说明人工智能无法替代法律人的作用,盲目借助人工智能技术来完成司法任务,违背了司法任务背后的司法规律,甚至削弱了司法工作者的司法权。法律人工智能的研究趋势将重塑"以人为中心”的智能辅助模式,这种模式的思路就是突出法律人在智能化系统中的决定性价值,以人工智能技术来辅助提升法律人决策的质效。“以人为中心”需要构建人机协同的新机制,该机制根据司法人员的职责和人工智能的能力来分配两者的权限和责任,即规定什么情况下由智能化辅助系统自动运行,什么情况下由法律人来主导决策,以及责任如何分配等。“以人为中心”的智能化辅助模式不是削弱人工智能的作用,而是将人工智能擅长的任务与法律人不可被替代的任务区分开来,在最大限度发挥人工智能作用的前提下,保证法律决策的最终主体是法律人。“以人为中心”的模式也可以最大限度地避免因数据质量不佳、机器学习的不可解释性、算法偏见等人工智能的技术瓶颈所引发的负面后果,法律人可以选择、放弃和修正人工智能的决策结果。“以人为中心”的模式就是要明确法律人的决定性作用,法律人在关键环节掌握最终决策权,可以质疑、拒绝智能化系统的决策和建议,也可以提出修改和完善意见,要求改进智能化系统。“以人为中心”的模式要求法律人工智能必须是可控的,保障法律人在决策时拥有充分的自主决策权,即有权选择是否接受智能化系统提供的服务,有权随时退出与智能化系统的交互,有权随时终止智能化系统的运行。在虚拟增强技术广泛应用的当下,回到“以人为中心”的协同模式尤为重要。元宇宙虚拟科技推动了新型科技法庭的建设,支持庭审、合议、庭前证据交换等多种应用场合。虚拟法庭给法官或当事人无缝接入、参与开庭提供了新的技术支持。虚拟现实技术通过建立一个虚拟的三维立体空间,让用户感受到非常真切的模拟效果,这是目前远程视频开庭的方式达不到的。在发展虚拟增强技术的同时,也要警惕“数字孪生”技术的滥用,扩大化使用虚拟AI法官,将使法律人工智能的司法应用滑向“司法元宇宙”。法律人工智能的研究需要重新审视法官在虚拟法庭中的角色和位置,在关键环节、关键任务中突出法官的决定性作用,以“以人为中心”的模式来避免司法“脱实向虚”,使审判权牢牢掌握在法官手上。
(四)符号主义法律人工智能与联结主义法律人工智能的融合符号主义法律人工智能与联结主义法律人工智能在技术的作用原理方面有所差异,两种路径各有优缺点,而两者的优点恰可以弥补对方的缺陷,这使得融合成为一种趋势。符号主义法律人工智能擅长研究人类的逻辑思维活动,其学习过程是从经验或规则出发,根据前提推出结论,采用从一般到特殊的演绎式推理,是一种"自上而下"的模式。法律推理能够支持法律知识的模块化存储和使用,也能够为结论提供清晰的解释,因而,法律推理的优点是推理过程透明并且可解释。然而,法律推理无法逃避知识获取瓶颈的问题,基于规则的法律推理依赖法学专家来获取法律知识,基于案例的推理不能创制案例知识之外的一般知识,因而受限于案例本身的知识范围。由于高度依赖专家来获取知识,法律推理也就缺乏自主学习和自动化更新的能力。而联结主义法律人工智能可以从数据中获取规则,替代行业专家的知识构建,达到自主更新和自主学习的目标,从而改善法律推理效率较低的问题,也在一定程度上突破了符号主义法律人工智能知识获取的瓶颈。联结主义法律人工智能的优势在于使用机器学习的算法对法律文本大数据进行挖掘,但法律信息抽取、法律文本分类、法律文本摘要和法律预测都难以实现文本内要素之间的逻辑关联,因而不可避免地产生了不可解释性问题,这也使得法律大数据挖掘的应用饱受争议。欧盟就通过宏观的人工智能战略与具体的刑事司法人工智能规制措施建立起严格的刑事司法人工智能监管体系。符号主义法律人工智能恰能弥补法律文本解析的不可解释性问题,法律推理反映了前提与结论之间的逻辑关联,通过符号来表达抽象的概念,并且赋予其明确的内涵和外延。法律文本解析技术的不可解释性问题在于机器学习算法的统计关联性难以解释输入和预测结果之间的关系,符号化方法的介入将统计关联转化为逻辑关联,从而增强因果关联的可解释性。逻辑中心的方法擅长法律文本的逻辑表达和知识推理,能够建模法律论证和证成的规则属性,但缺乏效率且法律文本的表达技术不成熟;而数据中心的方法擅长经验分析且能够实现预测等目的,但不能表达法律论证和证成的规则属性。法律任务的人工智能研究需要融合基于逻辑的方法和基于数据的方法,从而形成一种复合模型。符号主义法律人工智能与联结主义法律人工智能的融合凸显出两种趋势∶第一种融合路径是在联结主义方法中融入符号逻辑,即在机器学习中嵌入逻辑推理,使得输入和输出之间呈现出因果等逻辑关联的特征,从而提升可解释性。例如,法律文本解析符号化就是从法律文本数据中获取知识,法律知识图谱成为获取和组织法律知识的新方法。第二种融合路径是在法律文本数据中自动化地挖掘法律论证。法律论证挖掘需要识别法律论证的基本单元,并检测基本单元之间的逻辑关系,再通过机器学习算法分类器对不同结构的法律论证进行分类。法律论证挖掘在于教会机器理解和预测法律论证,通过检测法律文本数据中的论证基本单元以及单元之间的关系,提取不同的论证结构和论证图式,为法律推理的计算模型提供机器可处理的结构化数据。法律论证挖掘的前提和结论之间的逻辑关联提升了法律文本解析技术的可解释性。
(五)“智慧立法”的拓展应用智慧立法是法律人工智能实现“科学立法”与“精细化立法”的新路径。法律人工智能已经在国家和地方立法中发挥作用,如《人大常委会机关信息化建设规划》《国家信息化发展战略》等文件均提出了人工智能辅助立法的需求。康允德(T.Coendet)认为,法律人工智能“将作为法律专家研究诉讼策略、普通民众判断其法律立场、法律学者验证其假设在某一法律领域中的作用的陪练伙伴,并在未来发展为立法者检验其立法草案的逻辑性和术语一致性"。人工智能可以深度运用语义理解、实体/关系识别技术,动态增量更新技术,准确识别不同表述方法的法律实质意义,对所有的规范性文件进行实时审查、动态审查、追溯审查。例如,北大法宝的备案审查信息平台已初步实现了备案审查的智能化,通过标记敏感词来训练审查预测模型,当待审查文件中出现敏感词时,智能化系统自动提示此处存在违法的可能。为提升备案审查的智能化水平,未来的法律人工智能研究需要增强法律法规文本语义的理解和表示能力,研究基于立法知识图谱和法律逻辑规则的立法条文比对技术,从而构建合宪合法的评价体系。法律人工智能可以辅助立法评估。为提升立法前评估的可靠性,人工智能可以被应用于检验立法前评估程序,具体从逻辑层、论辨层、程序层和策略层四个层次来进行立法前评估∶在逻辑层面,检验立法论证的逻辑可靠性,如法律概念和命题是否准确,是否与已有法律法规重复或冲突,是否符合地方立法权限;在论辩层面,检验立项论证和审议论证是否经过充分的论辩,是否保证了公众的自由论辩权利,是否体现了立法的民主性;在程序层面,自动化检验起草、论证和审议等程序是否合乎立法程序规范,评估立法的必要性与合理性;在策略层面,检验立法技术的可操作性,包括立法结构技术和语言技术等。同样,法律人工智能可以被应用于立法后评估,评价指标主要包括成本与效益、被认知和执行情况、执法反馈、司法反馈以及社会、法律和经济效益等。在完成评价指标的设置和量化后,还需要有一套指标体系和计算模型来综合评估法律法规的实施效果。法律人工智能可以辅助精细化立法。法律人工智能辅助立法部门起草法律法规,并不是以机器替代立法工作者,而是以人工智能技术辅助立法工作者提高立法的精度。运用大数据推进精细化立法,增强法律法规的及时性、系统性、针对性、有效性。一方面,法律人工智能推动法规大数据与机器学习相结合,采用机器学习算法来训练获得立法预测模型,针对某个特定领域的立法提供预测建议,辅助立法工作者精细化起草立法。另一方面,以立法知识图谱和逻辑推理相结合,通过构建专门领域的立法知识图谱,辅助立法专家根据知识图谱来进行立法。立法知识图谱的语料库包含国家和地方现行的有关法律、法规、规章、政策,还包括立法理论研究、实践经验、专家学者对立法事项的意见和建议等。立法知识图谱需要包含能解释其立法意图的专门知识,因而立法知识图谱的构建需要结合其背后的立法意图来增强其图谱的可解释性。法律知识图谱可以为立法工作者提供直观的法律知识点的关联信息,为新的立法工作提供指引。
(六)“智慧司法”的深度应用第一,智慧司法关键技术体系研究。法律人工智能需要与智慧司法的业务逻辑和司法规律深度结合,构建人工智能融合司法的关键技术体系。关键技术体系全面汇聚了智慧司法建设中的技术,呈现司法业务与技术的融合逻辑,使之既能够对标智慧司法建设中的已有技术,又能够为未来智慧司法建设的技术拓展提供引擎。关键技术机理面向智慧审判、智慧管理、智慧服务等业务模块,搭建司法大数据平台、司法知识平台和通用管理平台等,通过法律人工智能引擎将大数据平台与知识平台相连接。关键技术体系将各大业务模块和平台所包含的技术都映射到人工智能引擎模块,通过技术的聚集展现智慧司法的技术机理。从司法大数据的视角看,智慧司法的法律人工智能引擎包含三大模块∶文本类信息、语音信息、图像视频类信息感知规则模型。从司法知识的视角看,司法知识认知技术由案件要素识别、当事人画像要素识别、法律知识识别、证据认知识别机器学习模型构成。根据知识和数据的决策方式不同,司法决策智能辅助模型包含基于规则定义的决策模型和基于机器学习的决策模型。第二,司法知识图谱库的构建。法律人工智能在智慧司法中的深度应用仍然将围绕审判场景展开。法律人工智能将从简易案件的知识图谱走向更多类型案件的知识图谱的构建,针对热点民生案件、生态环保案件、涉外民商事案件、金融犯罪案件等特定类型案件,研究案件的证据认定标准,建立全案由要素知识图谱。为构建满足不同目的需求的司法知识图谱,需要研究面向司法业务的描述性知识、规律性知识和领域知识来构建知识之间的关联融合技术∶(1)与司法业务相关的反映事物性质、内容、状态和事物发展变化的知识;(2)由法律法规、司法解释等法律规则构成的知识∶(3)反映司法实践规律的领域知识。在法律知识图谱的基础上,建立以案件为主体的信息知识库,完善司法知识体系和自动化的知识更新机制,为案件全生命周期的信息关联与融合、审判态势自动分析和动态预警奠定技术基础。第三,案件事实认定的自动化推理技术研究。法律人工智能在认定案件事实上与法官还存在较大的差异,法官根据其裁判经验和逻辑规则来认定案件事实,而人工智能主要是基于机器学习方法抽取关键案情要素,而后再进行案件事实的重组。然而,机器学习的方法与法官判定案件事实的逻辑不相符合,机器学习抽取的案件要素无法体现证据与结论的逻辑关联。法官认定案件事实需要分析和评估证据支持案件事实主张的法律论证,判定司法证明是否满足了相应的证明标准,这就需要明确证据支持案件事实主张的方式,分析证据论证的结构。受符号主义法律人工智能与联结主义法律人工智能的融合启发,案件事实认定需要利用机器学习来挖掘证据事实间的逻辑关系,形成证据知识图谱,再利用知识表示和知识推理整合证据知识,使其形成完整和闭合的证据链。为分析证据支持案件事实主张的结构,还需要借助可计算论辩模型等来分析证据论证的结构,基于主观概率理论等量化方法来评估证据的证明力,从而评价证据支持案件事实主张的力度,判定案件事实证明是否满足了相应的证明标准。
法律人工智能是一门新兴的交叉学科,它是人工智能的技术理性与法律形式理性的双向融合。法律人工智能的科学内涵之明确,夯实了整个法律人工智能研究之基石,使得理论构建、技术研发和应用实践都能够找到最基本的概念范畴体系。但同时也应当清醒地认识到,法律人工智能在发展历程中经历了多次起伏,要警惕学科发展的周期性变化给法律人工智能带来的冲击,正如阿什利所担忧的∶“现在许多公司正对一些新的法律应用提出了更多的要求(例如,法律文本分析应用就被给予了过高的期望),所以,我预计产业资金会再一次发生转移甚至枯竭。”我国法律人工智能研究要保持稳定和良好的发展态势,必须深刻理解法律人工智能的科学内涵,了解法律人工智能理论和技术的发展沿革,掌握其在历史发展中所取得的成绩和存在的不足,避免机械重复之前的道路。法律人工智能研究还应当遵循法学研究和人工智能研究的学术规律,充分认识人工智能的潜力与局限,遵循立法和司法的规律,探索人工智能深度赋能法律实践的新路径。更重要的是要激发法学与人工智能交叉的原动力,吸引更多的法学专家和人工智能专家合作共赢,共同推动法律人工智能在遵循交叉学科发展规律的道路上前行。