查看原文
其他

彭中礼 | 论案件事实的智能认定

论案件事实的智能认定

彭中礼

中南大学 法学院,湖南 长沙 410083



彭中礼:男,中南大学法学院副院长,教授,博士生导师,湖南省高级人民法院—中南大学司法人工智能研究中心主任,中南大学未来法治研究中心主任,法学博士。


摘  要:将案件事实与制度事实进行匹配是实现公正裁判的重要前提。案件事实的形成是各种证据综合证成的结果。基于人工智能的形式性、程序性特点,司法人工智能可以解决对案件事实的认定问题,并使得法律逻辑与人工智能的优势得以充分彰显。通过人工智能认定案件事实,需要将案件证据数据化、自然语言可计算化,并不断整合碎片化的证据数据,同时设计算法承认规则、算法排除规则和算法改进规则,制定以推理为主要形式的逻辑程序。当前,在对案件事实的智能认定方面还存在自由心证、因果联系等问题的困扰,这需要通过技术的不断提升来解决相关的法律问题。

关键词:案件事实;人工智能;司法裁判;自由心证


司法裁判作为分配权利和义务的制度机制,是解决社会纠纷的主要渠道。一直以来,司法裁判都是专业法官所承担的职责,而随着科技的不断进步,这一切都可能会因为人工智能(AI)的发展而产生巨大的变化。人工智能学科发展的首要目标之一是改进机器和系统,使它们能够实现推理、学习、自我收集信息、创造知识、自主交流等一系列功能,从而改变或者影响周围的环境。因此,有人认为,在不久的将来人工智能将增加或者取代某些职业。例如,人工智能将对法律界和律师行业产生巨大的影响,这一点正在逐渐变为现实。针对人工智能带来的重要影响,市场和技术已经做好了准备。从市场应变看,有关法律科技研发领域的投资数额急剧增加;从技术成果看,大量人工智能技术也被投入到了法律职业领域。可以说,市场感知和技术成果共同为新版本的法律职业铺就了道路。[1]随着大量资金的投入,有关司法人工智能的设想不断被提及,甚至还有人预测未来可能会出现“机器人法官”。“机器人法官”会因为其机械化的操作而提高案件的裁判效率,也会因为其较少受到感情因素的干扰而使得案件裁判结果更为公平和公正。甚至,“从长远来看,使用机器学习和深度学习技术的智能裁判体都可能取代律师、仲裁员、调解员,甚至可能取代法官”[1]。例如,上海法院系统正在创新的“206”系统,其初衷即是通过发展人工智能技术来创新司法裁判的方式。特别值得注意的是,当前全世界的在线纠纷解决系统正日渐盛行。互联网和信息技术的使用引发了多种纠纷,这些纠纷又往往涉及新技术本身,而新技术又为解决这些纠纷提供了可能。[2]人工智能技术使得司法裁判的理想变得更加清晰,而基于技术的司法公正正在被逐步实现。在传统的司法裁判过程中,法官裁判案件必须关注案件事实,并基于诉讼双方提交的证据进行事实查证,这是司法裁判的基础程序。人工智能如果能够进入司法领域,并实现智能裁判,首先应当实现对案件事实的智能认定。“在有关法律问题的科学、智能计算工作中,发现和描述事实的能力是人类解决问题的一个重要因素。计算机工作的探索已经开始,但仍有许多工作要做。”[3]案件事实是裁判的基础,是裁判结果呈现的直接原点。任何时候,任何类型的裁判都必须将认定案件事实作为司法的中心任务,进而实现公平、公正裁判案件的目的。为此,笔者基于案件事实形成的基本机理,探讨如何通过人工智能认定案件事实,从而为人工智能在司法领域的发展奠定坚实的事实基础。一、作为数据的证据:案件事实智能认定的逻辑起点虽然,每个人都有自己的行为方式和行动模式,但是法律所调整的事实只能是模式化、制度化的事实。所以,在司法过程中,法律人通常会将生活中的自然事实通过证据进行还原,形成案件事实,使之与制度事实相匹配,从而使自然事实具有可评价性。“事实问题是指事情的真实情况,强调事情的真实性……事实一般包括时间、地点、天气、光线、速度、颜色、人物身份、所说、所做、所闻以及推断的事实如行为人的意图、精神、心情等事项……事实问题所涉及的是某些通过感官、证据或据以进行推理而可认知的事物的存在、性质和状况等问题,是通过调查过去某时间、某人、某事的存在状态来认知的情况。”[4]可见,从自然事实还原到案件事实,是通过证据支撑并进行逻辑推理的结果。人工智能旨在理解人工系统中如何实现智能行为这一基本原理。这一研究领域的成果显示,人工智能具有四个方面的能力,即灵活应对环境变化的能力、证据推理和感知的能力、计划和执行目标的能力、学习能力。[1]实现司法裁判人工智能化,最重要的问题是能够合理地认定案件事实。“如果一个系统要展示其智能化,那么它必须与现实世界交互。为了做到这一点,它必须有一个可以用来表示外部现实的正规框架(如逻辑)。”[5](P.15)在人工智能系统中,要能够智能认定案件事实,就必须首先实现证据的数据化,即使司法人工智能系统能够识别诉讼双方提交的证据。“随着储存人类活动信息的各种资料实现电子化,大数据技术能够综合处理各种类型的数据,从而获得其数据背后的知识或隐藏的信息。”[6](P.3)证据数据是对原始证据的进一步“加工”。目前来说,人脑能够识别的证据和计算机系统能够识别的证据还存在一定的差别。人脑通过对证据的认知和感知基本可以识别证据的目的和用途,甚至还能够推断出证据所深蕴的含义。但对于计算机而言,其尚不能够像人类一样识别原始证据。这就需要将证据通过某种形式进行格式化、数据化,即变成计算机能够识别的“材料”——数据。证据数据化是将证据通过人工智能进行转换,变成可供智能系统识别和认定的数据符号。1976年,纽威尔和西蒙提出“物理符号系统假说”,这种假说后来成了人工智能的核心内容。这个假说指出“智能是符号系统的工作……物理符号系统对于一般的智能行为具有必要和充分的手段。”[1]“计算机作为公认的物理符号系统能够显示其智能化的功能,而人类作为智能生物,在一定意义上也可以将其视为物理符号系统。因此二者存在相似之处,都能够处理符号结构。”[1]通过技术处理,将各种形式的证据变成可供计算机识别的数据符号,使司法智能系统能够读懂和理解证据,从而根据已有的技术来实现原始证据数据化。首先,自然语言翻译是司法人工智能系统“读懂”案卷的前提和基础。“如果我们希望建立智能系统,就要求系统拥有方便人类理解的语言。”[5](P.15)人工智能专家认为,语言和语音的处理是人工智能中要求最高的领域之一。因为任何智能系统的开发都涉及对自然语言的识别和运用。在人工智能发展的早期,人们希望用机器来翻译语言,但是现在人们普遍倾向于使用符号来表示语言,如计算机中C语言就是一种符号语言。而语言为我们提供了更多进行详细交流的机会,同时也带来了产生误解的机会,因为语言有其精确性,但却很少有人可以精确地使用语言。[5](P.369)司法人工智能要对证据进行处理,就必须能够阅读证据、理解证据,这就需要通过某种程序实现对自然语言的处理。从精确度方面看,目前的机器语言处理模式只能实现对自然语言的近似处理,或者通过概率来实现语言模型的字符排列处理。为此,人们已经创造出了一些模型识别语言,如n元模型识别自然语言。“语言识别就是一项n元模型非常适合完成的任务,给定一段文本,确定它是用哪种自然语言书写的,这是一个相对来说比较简单的任务,即使是简短的文本,例如‘Hello,world’或者‘wie geht dir’,也很容易被其辨别出第一个是英语、第二个是德语。”[7](P.716)所以,要实现对自然语言的识别,首先要建立一个候选语言的三元模型,从而实现文本的语料集合。从理论上说,自然语言是有限的。而通过对自然语言的程序性输入,并形成有关句子的完整含义,人工智能即可以对自然语言进行处理。但人工智能可能面临的问题在于复杂的句子不仅有表层含义,还会有深层含义。例如,“含沙射影”“指桑骂槐”之类的复杂含义要在智能系统当中体现出来,还需要有更加强大的技术支撑和程序安排。然而,相比之下,诉讼证据中隐含深层含义的情形比较少见,一般来说其意义都比较明确,因而相对容易被识别。实现人工智能对证据的识别就要在语料库中进行信息抽取,从而让计算机能够读懂证据。信息抽取是从特定文本中寻找一组特定的关系词语,即是在大型的知识库或者语料库中抽取事实本体。虽然人工智能界认为传统的信息抽取只针对一部分关系,而系统地、并行地对所有关系进行处理是“机器阅读”[7](P.734),但对证据的识别和处理也应当被归纳为机器阅读的范围。在“阅读”的基础上,机器可以进行句法分析,即“按照语法规则分析单词串从而得到其短语结构”[7](P.743)其次,机器学习是司法人工智能系统“读懂”案卷的核心。对人类来说可能是难度较高的工作,如复杂的数学计算,对计算机来说却是容易的;但对人类来说很容易进行的活动,如情绪识别,对计算机来说却很困难。这些问题的存在促使研究人员开发了一种被称为“人工神经网络”(也称为连接主义)的系统,其目的是创建具有类似大脑特征的计算程序,使之能够深度学习。研究人员还创建了一个“常识知识问题”数据库,为计算机的内部运转提供部分答案。该数据库包含一个人所拥有的所有常识知识,并以一种可被检索的方式呈现出来。[1]因此,所谓机器学习即是让计算机具有像人一样的学习能力,并能够从堆积如山的数据中寻找到有用的知识。[8](P.2)机器学习对于任何需要解释并操作数据的领域都有所裨益。[9](P.3)从这个层面讲,以证据证成案件事实就必须有机器学习的参与,进而实现对数据的有效解释。机器学习可以类型化为监督学习、无监督学习和强化学习等类型。针对这些学习类型,机器学习负有回归、分类、异常检测、聚类以及降维等任务。其中降维与证据的数据化即存在密切的关系,原因在于它能在高维度数据中提取关键信息,并将其转换为易于计算的低维度问题进而求解。换言之,通过计算机对数据化的证据进行计算、建模,机器本身就能够“学习”到足够的技能,甚至可以实现深度的结构学习。为此,人类会在司法机器当中建立机器学习系统,使其能够利用过去和现在的各种信息,综合计算出一个合理的结论。可见,计算机系统要能够识别证据,并对证据进行深度认识,必须引入计算元素集合的概念。[10](P.10)通过机器学习,智能裁判系统能够基于此前的证据识别经验,不断总结、识别证据数据,从而不断得出接近客观真相的结论。从一定程度上讲,机器学习是智能裁判系统能够识别证据的核心技术。它由一系列指令和计算机的程序规则确定。当规则1要求做什么的条件不具备时,就可以启动规则2,当规则2启动的条件不具备时,可以启动规则3。这个规则过程即是人工智能的“学习”过程,它会不断重组已有的知识结构,不断改善、提升智能机器自身的性能。最后,智能识别是司法人工智能系统“读懂”案卷的关键性技术。将案卷转化为数据,目的就是为了让智能裁判系统能够识别案件。但是,不同形式的数据,需要有不同的“阅读”(识别)技术。换言之,“识别”过程就是机器理解案件证据的过程。例如,对语音证据、图像证据、气味证据、痕迹证据等的识别,不同的证据类型需要有不同的识别技术。目前常用的智能识别技术主要是卷积神经网络。卷积神经网络简称CNN网络,是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现,其主要功能是对输入数据进行特征的提取,并广泛应用在图像识别、目标检测等与图像相关的领域。2012年,ImageNet图像识别比赛中的冠军由一个名为AlexNet的卷积神经网络夺得,且其在各项关键指标中遥遥领先,至此卷积神经网络发展到一个全新的时代。理论上,通过传统算法可以解决的问题都可以通过深度学习得以解决,而网络的功能虽然很强大,但如果在神经网络比较复杂且数据不够完整的情况下,则很容易出现过拟合(所谓“过拟合”,是指为了得到一致的假设而使假设变得过度严格)的现象,从而达不到理想的效果。[11]随着卷积神经网络的发展,与此相关的智能识别技术的发展也十分迅速。通过卷积神经网络、红外图像识别等发展出来的人脸识别技术、语音识别技术、光学识别技术、生物识别技术等智能识别技术在很多领域都得到了广泛的应用。在对案件事实进行识别的过程中,有较多的证据会以图片的形式加以呈现。因而,图片识别技术在案件事实的认定过程中会起到举足轻重的作用。图片识别技术利用计算机对图片进行处理和分析,辨别图片的类别,就图片所呈现的法律问题作出明确而有意义的判断。当证据转化为图片数据之后,计算机会对其进行预处理,如对图片进行分割、重建、细化等,从而分析图片的基本特征,然后根据目的或需要进行特征匹配,从而得出判断结论。这是一个从图像到图像的过程,表现为从一幅图像转化为另一幅经过修改或完善的图像,并从中发现图像的特点,以获取更有价值信息的过程。[12]在图片识别过程中,可以结合深度学习技术、文本挖掘技术等,对案件证据进行有目的的深入分析。二、通过算法的运算:案件事实智能认定的基本机制案件证据数据化的目的是使证据成为智能裁判系统的审视对象,进而使事实认定能够顺利进行,最大可能地实现案件事实对自然事实的真实还原。在这个过程当中,算法是必须应用到的基本工具,算法是指对解题方案的准确而完整的描述,是一系列解决问题的清晰指令,算法代表着用系统的方法描述解决问题的策略机制。通过算法进行推理是智能系统实现对案件事实智能认定的基本方法。在当代以及未来,“算法决策者(已经)主宰了我们生活的各个方面。算法具有通过机器学习的较强的学习能力,这使它们能够自主作出决策”[13]。甚至还有学者认为:“我们多数人每天都使用算法,我们统治着算法,同时也被算法所统治。但我们大多数人对算法代码了解得并不多,而算法集合正是通过这些算法代码起作用的。”[14](P.18)这意味着作为系统描述问题解决方法的策略机制,算法已经成为智能系统的重要运算方法,并指引着案件事实智能认定基本路径的形成。在算法原理当中,算法主要有三个方面的功能。一是计算功能。当需要为某些技术或者某些标准提供足够充分的理由时,即需要通过算法进行计算。算法的计算功能主要体现在四个方面,即基本的算术运用(加减乘除等)、逻辑运算(或、且、非等)、关系运算(大于、小于等)以及数据运算(输入、输出、赋值等)。通过算法的计算功能可以解决一些复杂的数学问题,例如,人类基因工程已经取得了重大进展,其目标是识别人类DNA中的所有基因,确定构成人类DNA的30亿个化学基对的序列,在数据库中存储这类信息并为数据分析开发工具,这些工作就需要复杂的算法对其进行支持。[15](P.6)二是定义功能。人类可以通过算法将概念转化成计算机程序问题,并由计算机程序进行识别处理。例如,在计算机中设置证人证言的法律效力认定规则时,就可以让计算机通过识别年龄来定义证人证言的形式合法性。算法的定义功能可以将一些法律概念转化成计算机程序,并以多元规则的方式加以呈现。甚至可以用数据集合的方式来定义法律概念,从而解决概念的内涵和外延。三是时空蕴含功能。算法的时空蕴含功能可以充分体现司法裁判所需要的时间性和空间性,进而体现案件事实认定的精准性。算法的时空蕴含功能,源于算法中函数算子的时空蕴含功能。“功能性计算中的算子包含了更丰富的时空蕴含功能。在结构性计算中,算子本身是可以脱离于计算规则而存在的,也就是说,在同样的计算中,算子本身不会存在任何区别。因此,结构性计算中的算子只蕴含了空间意义,而没有时间意义。与之相对应的功能性计算中,算子的运动本身要参与计算,即算子同时蕴含了时间和空间意义。于是,算子本身就成为了在时间和空间的变化中体现出来的‘涨落’特征。”[16]对任何欲求解的对象,可先设定一个可供程序运行的输入和输出的系统,从输入开始,然后以正确的输出使程序自动终止,则该算法为正确的算法,算法的时空性即得到了彰显。这与证据的智能认定有较强的相关性。实现案件事实的智能认定,就是要在证据被输入以后,经过一些步骤的操作指令(计算机运算规则),将证据转化为基本清晰的案件事实,从而为智能裁判提供事实基础,使得证据转化达到最优,以充分体现证据的时空特性。从数据的角度看,智能裁判系统能够运行的依据是其可以将证据视为数据,从而将碎片化的数据纳入到大数据的系统当中,通过算法规则整合众多碎片化的“证据大数据”。依据上述算法的功能,在智能裁判系统中对案件事实进行认定,应当将算法运算作为智能认定事实的核心机制。换言之,我们通过在智能裁判系统中设定规则的方式来设定算法的运算方式。“我们生活中的规则来源于这样的假设,即人们能够认识到更重要的目标时就可以遵守或违反这些规则。”[17](P.107)显然,将这些算法规则转化成智能系统中对案件事实认定的规则,并固定在计算机运算程序中,有利于从宏观层面把握对案件事实的认定。虽然,算法设计本身是公权力的体现,但也要遵循科学性的原则。通过算法进行运算的主要设计方案包括三个方面的内容。第一,设定案件事实的主要算法承认规则。智能裁判系统中的算法承认规则是通过算法运算确定案件事实成立的前提和基础。通过算法承认规则确认案件事实成立,并能够阐述成立的理由,这将成为智能系统发挥作用的主要算法规则。承认规则设置的根本目的是认可在特定条件下案件事实成立的可能,即通过“if……then……”的逻辑形式,认可条件满足时特定结果的输出。例如,合同中有条款规定,在某年某月某日之前甲方没有付款,则甲方承担违约责任,事实上甲方在该日期到来之前没有付款,所以其违约事实成立。算法承认规则与法律规范的逻辑构成在某种意义上应当具有一致性,并通过这种一致性来体现司法裁判算法的规范性。第二,设定案件事实的主要算法排除规则。算法排除规则是算法承认规则中的重要形式,其基本目的不是为事实认定提供直接证明,而是从反面思考事实存在的可能。虽然算法排除规则也可以通过“if……then……”的逻辑形式予以表达,但是逻辑后果与算法承认规则稍有不同。例如,在案件事实认定中,案件的时间和空间至关重要。无论是民事案件还是刑事案件,时间或者空间首先固定了案件的性质、案件发生的地址、案件的时效等。假设在刑事案件中可以通过案件证据显示案件发生的时间、证据采集的时间,从而确定与此相关的问题或者排除某些嫌疑。如果在某确定的时间可以证明某人并没有在案发地出现,此时通过算法排除规则即可排除此人的嫌疑。换言之,在法律当中存在普遍和例外的规定,在算法规则当中就是通过承认规则和排除规则进行编排,以反映真实的法律文本,以满足人们对司法裁判的现实需求。第三,设定案件事实的主要算法改进规则。算法改进规则可以基于机器学习,通过决策树、神经网络或者贝叶斯分类器等技术,实现对更多证据碎片的分类化识别,从而不断提升智能裁判系统的案件事实认定能力。例如,在决策树[1]中,一棵决策树包含一个根结点、若干内部结点和若干个叶结点,叶结点对应于决策结果,其他每个结点则对应于一个属性测试,每个结点包含的样本集合根据属性测试的结果被划分到子结点中,根节点则包含样本全集。从根节点到每个叶结点的路径对应了一个判定测试序列。决策树流程遵循了分而治之的策略。决策树的生成是一个递归的过程。[18](PP.73~74)例如,美国的Heuristic Dendral项目就是启发式树状项目的一个重大实践。基于实验数据,该项目必须要区分“真实数据点”和“虚假数据点”,并从解决问题的角度出发,将错误数据和虚假数据从重要的事实中分离出来。在整个项目中,决策都是基于专家使用的决策规则而产生的。[3]从本质上讲,决策树是一种条件不断改进、优化的算法规则。而依据对证据数据的划分,不同的证据数据通过集合选择被划归为不同属性的集合,进而成为相同或者不同决策树上的结点,从而不断改进基于证据数据对案件事实认定的算法进程。简言之,智能裁判系统要在充分发挥算法作用的基础上,将证据划归为不同的集合,然后运用不同的算法规则,对证据要素的运用方法作出必要的修正、补充,从而输出必要的、具有可信度的结果。当然,以上三种类型的算法规则形式,只是对智能系统如何运用的一个简化归纳,在智能系统的实际运作过程中,远比此更为复杂。三、通过推理的逻辑:案件事实智能认定的过程设定无论是人类法官还是未来的“机器人法官”,对案件事实的认定都离不开推理的过程。推理是人类思维的基本运作方式,也是人工智能能够“像人一样思考”的工作原理。任何一种需要人工智能帮助的领域都可以被称为是知识库,知识库本身即是一种语句集合。这些语句可以是不需要推理而能够得到的语句,这是推理的起点,即所谓的“公理”。而绝大多数的语句是需要通过推导才能够被获得的。因此,必须存在将新语句添加到知识库以及能够查询目前所知内容的方法,这两个任务都可能涉及推理,即从原有语句中推理出新语句。[7](P.743)从自然事实到案件事实,本身就是基于证据而产生的逻辑推理过程,这与人工智能的推理逻辑相契合。因而,在智能裁判系统中,基于算法规则对数据证据进行推理整合,便成为智能裁判系统的根本逻辑形式。司法人工智能裁判系统不仅要解释法律推理,更要通过智能程序来设计法律推理,将推理嵌入智能程序当中,成为人工智能认定案件事实的重要方法。有学者指出,法理学争论的焦点是法律的性质、法律推理的过程、法律规则和制度的结构、逻辑与法律的关系以及成文法和判例法的解释。因此,任何试图解决法律问题以进行法律推理的计算机系统必然会做出一整套法理假设,它将对法律和法律推理的性质进行某种解释。[19]霍姆斯曾经指出,在法律发展过程中,唯一起作用的力量是逻辑。司法判决所用的语言主要是逻辑语言,律师(法官)所受到的训练也主要是逻辑训练。逻辑的方法和形式更能满足每个人心中对确定性和安宁的渴望。[20]虽然三段论逻辑在司法过程中的应用受到了广泛的质疑,但是整体而言,三段论逻辑并没有被人们所抛弃。“三段论的推理非常有力,又为人所熟知,因此,渴求自己的活动看上去尽量客观的律师和法官都花费了很大力气使法律推理看上去尽可能像是三段论。”[21](P.50)为此,我们需要从如下三个层面把握推理在人工智能系统中的作用。第一,推理是紧密联系证据之间逻辑关系的桥梁。在司法裁判当中,认定案件事实就要对证据之间的关系进行有效组织。不同的证据关系可能会对案件事实的认定带来不同的结果,证据之间要形成“证据链”,才能够对案件事实的认定产生足够的影响强度。这是因为证据本身就意味着某个基于事实的“陈述”存在。众多证据之间的关系成立,就意味着基于众多证据的事实“陈述”存在。正如逻辑学基本原理所表达的:“如果一个集合中的所有陈述都是真的,那么依据有效推理规则从陈述集合中推导出来的都是真的。”[22](P.207)因此,形成了“证据链”,才能使各证据之间具备有效的逻辑联系,从而足以经受必要的逻辑反思。司法人工智能裁判系统将推理视为联系证据之间关系的主要方法,进而通过程序设计固定推理在智能系统中的地位。比如,证据A和证据B之间的逻辑关系如何,能够通过这两个证据得出何种结论(案件事实),即需要依靠逻辑推理。假设证据A为凶器,而证据B为凶手留在凶器上的指纹,而证据C为某犯罪嫌疑人的指纹。如果证据B和证据C一致,则可以得出犯罪嫌疑人曾经使用过凶器的结论。证据法中要求形成所谓的“证据链”,应当是指众多证据之间彼此的相互联系,这种联系表现在人工智能系统当中必然要求符合推理形式,否则就难以形成稳定的、可预期的逻辑效果。第二,推理是实现论证事实因果关系的有效路径。美国逻辑学家斯蒂芬·雷曼曾说过:“让我们从技术意义上使用‘证明’一词来指称从符号论证的前提到结论的一系列推理步骤。”[22](P.207)显然,在司法裁判过程中,从证据到结论,即是系列推理的结果。特别是在案件事实的形成过程中,如何将日常生活的逻辑与推理结合起来,实现司法裁判的可接受性,就需要通过因果推理来实现对案件事实的合理建构。通过因果推理,人们可以将基于证据形成的、带有碎片性质的证明事实组合成为合理的、完整的案件事实。如前述的假设当中,证据A为凶器,证据B为凶手留在凶器上的指纹,证据C为某犯罪嫌疑人的指纹,证据D为犯罪嫌疑人留在现场的脚印。如果证据B和证据C一致,则可以得出犯罪嫌疑人曾经使用过凶器这一结论。然后,再根据证据D即可以进一步联系到犯罪嫌疑人曾到过犯罪现场,进而可以推断出犯罪嫌疑人在犯罪现场使用过凶器杀害了被害人这一结论。通过计算机程序来设计因果推理过程,不仅在理论界已经开始了探索,技术界也开始进行相关的技术设想。早在1985年,Iwasaki和Simon就提出了因果顺序理论,他们针对系统方程组与系统初值状态构成的平衡自容结构,不断求解最小完备子集及导出结构,直到最高阶导出结构中不再有自容的子集。此时,各方程中的变量按其分属不同阶的最小完备子集构成了因果依赖关系,进而构成了因果关系图。[23]我国学者提出的因果推理的计算机形式,将因果推理过程归纳为两个步骤。一是根据已有的各种关于系统的结构、行为和功能的知识构造出因果关系图;二是依据因果关系图及关于系统的原有知识,对变量行为进行传播,对系统的行为进行仿真,回顾仿真过程中的重要行为序列,便可对系统行为作出解释。[24]“论证理论”是人工智能领域的一个重要课题,其提供了如何描述证明结论的模型,这些模型严格遵循人类推理中的推理模式,从而使论证成为一种直观和通用的常识推理任务模型。[25]显然,计算机程序中对因果推理的正确运用也涉及算法承认规则、算法排除规则和算法改进规则。换言之,在事实的因果推理方面,智能系统已经有了可供运用的理论和实践技术,人类已经初步具备了通过智能系统实现因果推理的能力。第三,推理是基于证据深入理解事实的重要方法。每一个证据都是一种“陈述”,是对案件事实的无声阐释。但是,证据不能够自行表述案件事实,而需要法官根据自己的认知来理解证据。有时,可能单个的证据只能表现出某些案件事实的一个或几个方面的表面问题,而让人难以看到案件深层次的问题,但如果把众多的证据联系起来,形成完整的证据链,就能够表现出更为深刻的事实真相,而这就需要进一步发挥推理的作用。而如果法官对证据的理解不够深刻,对碎片化的案件事实不能够串联起来进行思考,就难以发现更多的案件真相。推理能够把体现在案件表层和案件深层的隐藏真相揭露出来,这是法官依照经验和学识推定的结果,也是对于人工智能而言较难突破的困境所在。毫无疑问,现有人工智能系统对揭示事物复杂内涵的工作已经有了足够的思考。例如,序列式决策问题就可以作为人工智能系统深入挖掘证据中可能隐藏的深层次含义的重要技术。针对完全可观察的环境,使用马尔可夫链转移模型[2]和累加回报的序列式决策问题被称为马尔可夫决策过程(简称为MDP)。一个MDP由4个组成部分来定义,包括状态集合、在每个状态的动作集合、转移模型以及回报函数。而通过马尔可夫链转移模型和累加回报的序列式决策的解是什么?计算机专家指出,所谓的“解”是指在任何状态下,Agent(即可以自主活动的计算机软件或者硬件,本文主要指人工智能体)应当采取什么样的行动来实现目的的策略。如果Agent有完备的策略,那么无论行动的结果如何,Agent总会知道下一步应当做什么。Agent是人工智能系统最核心的部分,虽然它未必能够完全具备人类一样的思维,但是通过采用各种算法规则,即可以做到“像人类一样进行思考”,从而促使“挖掘证据以及基于证据而形成的案件事实背后的真相”成为智能系统必须具备的能力,否则,智能裁判的初衷将难以实现。总而言之,所有的专家系统都应当包含一个关于法律的结构和个性化的理论、一个法律规范的理论、一个描述性的法律科学的理论、一个法律推理的理论、一个逻辑和法律的理论、一个语义理论,以及一个社会学和法律心理学的要素[26],它们的结合构成了法律智能专家系统的理论根基。从知识型决策的角度看,智能裁判系统也就是一个深入的、能够给人们带来决策参考性质的系统。在这个系统当中,如何描述和塑造推理,如何将推理用智能知识表达出来,都将会是在人类对人工智能研究过程中十分重要的主题。四、通过科技的整合:案件事实智能认定的法理反思通过智能裁判系统认定案件事实,其操作路径十分清晰。但从人类行为的特性以及技术本身的特性看,目前尚存在妨碍案件事实识别的因素,需要在不断创新技术的基础上逐步推进智能裁判能力的发展。任何新事物的发展既会有问题的挑战,也会有进步的机遇。而理论层面的反思是解决新问题、回应新机遇、策应新发展的重要路径。第一,案件证据类型多元化对智能科技的挑战。在证据法中,案件证据可以类型化为物证、书证、证人证言、被害人陈述、鉴定意见等形式。司法人工智能系统既要识别和理解物证的含义,也要识别和理解书证等证据的含义。这个过程可以通过扫描技术和智能识别技术来推进证据的数据化,从而让其演变为可被识别的形态。然而,在此过程当中,人们还可能会面临一些技术上的难题。面对识别案件证据性质等难题,人类天然有着识颜色、闻气味、听声音等多方面的能力,这些能力对于案件的裁判起到了十分重要的作用。例如,在案件侦办过程中经常遇到的“笔迹鉴定”工作,虽然其属于技术性的工作,但在本质上还是需要依靠鉴定专家利用自己的专业特长对证据进行识别。再如,在案件审理的过程中,法官能够依靠自身的学识和经验识别物证等证据。相比之下,司法人工智能系统可能难以直接对各类证据进行有效识别,为此我们必须开发出颜色识别技术、味觉识别技术等作为人工智能系统的辅助工具。例如,凶杀案件的作案工具(如手枪),它不仅仅是作案工具,办案机关还能够根据手枪上留下的指纹来发现可能的凶手,同时可以将手枪射击的子弹和死者所中的子弹进行技术性对此,并得出两者是否相符的结论。但智能系统尚不能主动完成这一系列的操作,而需要借助人类的预先规划,否则就难以实现人工智能系统与证据之间的相互关联。基于证据以探求案件背后的“真相”也存在一定的难题。如果说识别证据“显性”特征的问题可以通过不断进行技术创新解决的话,那么识别和理解证据背后隐含的深义,同时对其作出判断并加以利用则会给智能裁判带来更多的挑战。如基于经验认识而进行的推理则是难以通过逻辑判断而形成的,而在这种情况下,智能裁判系统就难以对相关问题作出判断。再如在事实判断过程中,有时需要基于日常生活规则来确信某件事情成立与否,此处的“日常生活”本身就难以用逻辑语言来表达。根本原因在于,日常生活规则所确定的事实都是具体的、个别的事实,难以通过一般的程序性规则设计出来。例如,在“王淑芳与本溪市成达房地产开发公司、本溪满族自治县粮库民间借贷纠纷案”中,原告提供了“还款计划”和“欠条”,但是被告主张“还款计划”和“欠条”无效,主要理由是这两份书面证据是李胜敌在受胁迫的情况下所写的,并提供了王淑芳书写“欠条”的草稿。为此,法官从被告陈述的“两次受胁迫的地点”以及“还款计划”的形式要件上推测其效力。[3]法官通过日常的生活经验推知,一个人不太可能在离开公司后,不仅携带有公章,而且还携带有工地专用稿纸。因此,既然一般人在出门时同时携带这两样东西的可能性很小,那么两件物品同时出现则可以说明当事人应当是自愿携带,而没有受到胁迫。这是通过证据寻找案件背后“可能真相”的典型案例,但无法“像人一样思考”的智能裁判机器尚难以达到这种境界,这说明智能裁判机器的知识获取途径还需要智能技术的不断进步来拓展和推进。第二,案件证据的认定带有法官的主观裁量因素,智能裁判系统难以对此进行数据化计算。例如,在对证据的认定方面,司法传统所坚持的“自由心证”主义即难以通过智能裁判系统体现出来。在证据法上,对证据是否有证明力及其证明力的大小,法律不预先作出规定,而由法官根据内心确信去自由判断证据,从而认定案件事实。所谓“自由”,是指法官根据“良心”“理性”判断证据,不受任何其他的限制和约束;而“心证”是指法官通过对证据的判断所形成的内心信念。确信是一种心理状态,法官通常会受这种状态的支配,并把这种状态作为裁判的根据。[27]从某种意义上说,“自由心证”一直都是法官采信证据的基本原则,其出现及发展是对司法活动复杂性和流动性的承认,也是对人类理性和认识能力的肯定。[28](P.125)这说明对证据的确信并非是完全客观的,发现证据能够直接说明的事实及其背后深层次的含义,是法官知识、能力及经验的综合体现。特别是基于证据形成的证据链是比较复杂的心理活动过程而产生的结果,因此,需要计算机专家和法律专家通过特定技术规则来共同完成。对于心理活动过程而言,虽然已经存在各种相关的学说,但尚未能够形成可以用逻辑语言表达的知识体系,而用程序化的规则表述心理过程还存在较大的难度,因此,需要法官运用主观的知识和经验来对证据加以认定。从技术层面看,智能裁判是对数据的计算,而司法裁判则是心理活动的重要结果。要使计算机能够识别心理活动,就需要能够将心理活动转化为数据的形式,然后根据特定算法规则进行设计,才能够完全实现对主观裁量因素的数据化计算。第三,对于因果联系的形成,需要有强大的判断力作依据,而智能裁判系统难以对此进行因果推理。“因果关系的认定是法律责任的基础。因果关系问题无疑是过失案件中最难解决的问题。因果关系存在于每一个过失案件当中,但只有将因果关系与案件中的其他问题对立起来,才能理解因果关系在特定案件中的特殊意义。”[29]不仅是过失案件,在其他需要确定因果关系的案件当中,如何确定因果关系都是不可避免的难题。对于司法裁判来讲,对因果关系的认定包含在对案件事实的认定当中。智能裁判系统中的“if……then……”的逻辑形式之所以能够成立,要么是基于法律的规范叙述,要么则是基于逻辑的推理阐述。然而,在因果推理过程中,以“if……then……”的逻辑形式来推论因果关系则未必能够成立。一是法律中并不存在明确的因果联系规范,二是这样的逻辑形式未必能够适用于因果推理。例如,因为被害人看清了犯罪嫌疑人的真实面貌,所以犯罪嫌疑人将被害人杀害,而这种因果关系的形成即与逻辑和法律无关。司法人工智能要在解决这些问题的基础之上不断提升对案件事实的认定能力,不断推进司法裁判系统的智能化,进而使得“智能裁判”成为可能。第四,智能裁判增添了司法过程中的权力因素。在传统的司法裁判过程中,法官依靠法律和智慧解决法律问题,即司法权在法官身上得以体现。然而,智能技术并没有完全被法官所掌握。虽然“数据保护的法律人应当与机器学习的专家之间保持密切的合作关系,这将是真正可行的。任何试图增加机器学习系统透明性或明确性的努力实际上都是为了更好地利用它们实现社会利益,而缺乏这种交叉合作的智能技术可能无法有效地发挥作用”[30],但同时应当看到,智能技术应用在司法裁判过程当中,无论是作为外部技术还是作为内部核心要素,都在无形中成为了司法权力的“分享者”。正如人们所说,公权力与算法权力正在多领域进行双向化的互动,拥有用户、数据、算法的平台企业不仅成为数字经济时代经济领域的先锋代表,而且正以颠覆者的姿态迈入政治和法律领域。[31]此时,智能裁判系统如何进行事实认定,不再依靠法官行使“司法权力”,而是依靠技术专家对算法所作的规定。从技术层面看,此时的司法权力体现的是“算法的规训”。而且在此过程中,司法智能系统面临的危险逐渐增多。如COMPAS 算法是从 2000 年初就在美国司法系统使用的预测被告未来再次犯罪率和危险程度的智能系统。非营利机构 ProPublica 曾对COMPAS 系统的评分数据进行统计分析,得出了“黑人被告有45%的可能会比白人被告得到的分数更高”[32]的结论。当然,这一切都需要人们有足够充分的心理准备,并放平心态去接受智能裁判系统,实现人与智能机器的充分融合,才可能真正迎来“机器人法官”的时代。


[参考文献][1]Ben-Ari,Daniel,et al..Artificial Intelligence in the Practice of Law:An Analysis and Proof of Concept Experiment[J].Richmond Journal of Law Technology,2017,(2).[2]Argounov,A.V.Will Artificial Intelligence Judge[J].Herald of Civil Procedure,2018,(5).[3]Bruce G.Buchanan,Thomas E.Headrick.Some Speculation about Artificial Intelligence and Legal Reasoning[J].Stanford Law Review,1970,(1).[4]杨建军.法律事实的概念[J].法律科学,2004,(6).[5]史蒂夫·卢奇,丹尼·科佩克.人工智能(第2版)[M].北京:中国工信出版集团,2018.[6]托马斯·埃尔,等.大数据导论[M].彭志勇,等,译.北京:机械工业出版社,2017.[7] Stuart J. Russell,Peter Norvig.人工智能:一种现代的方法(第3版)[M].殷建平,等,译.北京:清华大学出版社,2013.[8]杉山将.图解机器学习[M].许永伟,译.北京:中国工信出版集团,2018.[9]Peter Harrington.机器学习实战[M].李锐,等,译.北京:中国工信出版集团,2018.[10]尤舒亚·本吉奥.人工智能中的深度结构学习[M].俞凯,等,译.北京:机械工业出版社,2018.[11]韦虹宇.红外图像智能识别算法与硬件研究[D].成都:电子科技大学,2020.[12]彭雨明,等.基于数据挖掘技术的图片字符检测与识别[J].电子技术与软件工程,2016,(4).[13]Karni Chagal-Feferkorn.The Reasonable Algorithm[J].University of Illinois Journal of Law Technology & Policy,2018,(1).[14]Jonathan Roberge,Robert Seyfert.What are Algorithmic Culture?[A].Robert Seyfert,Jonathan Roberge.Algorithmic Cultures:Essays on Meaning,Performance & New Technologies[C].London: Routledge,2016.[15]Thomas H.Cormen,Charles E.Leiserson.算法导论[M].殷建平,等,译.北京:机械工业出版社,2003.[16]蒋柯.计算机模拟大脑与功能性计算策略[J].南京师大学报(社会科学版),2017,(1).[17]Jerry Kaplan.Artificial Intelligence:What Everyone Needs to Know[M].Oxford:Oxford University Press,2016.[18]周志华.机器学习[M].北京:清华大学出版社,2016.[19]Susskind,Richard E.An Artificial Intelligence Approach to Legal Reasoning[J].Yearbook of Law Computers and Technology,1989,(4).[20]Oliver Wendell Holmes.The Path of the Law[J].Boston University Law Review,1998,(3).[21]波斯纳.法理学问题[M].苏力,译.北京:中国政法大学出版社,2002.[22]斯蒂芬·雷.逻辑的力量[M].杨武金,译.北京:中国人民大学出版社,2010.[23]Iwasaki Y,Simon H A.Causality in Device Behavior[J].Artificial Intelligence,1986,(1).[24]王锵,石纯一.一种因果推理形式[J].软件学报,1997,(4).[25]Sjoerd T.Timmer,et al..A Two-phase Method for Extracting Explanatory Arguments from Bayesian Networks[J].Preprint Submitted to International Journal of Approximate Reasoning,2016,(5).[26]Richard E.Susskind.Expert Systems in Law:A Jurisprudential Approach to Artificial Intelligence and Legal Reasoning[J].Modern Law Review,1986,(2).[27]汪海燕,胡常龙.自由心证新理念探析——走出对自由心证传统认识的误区[J].法学研究,2001,(5).[28]张亚东.经验法则——自由心证的尺度[M].北京:北京大学出版社,2012.[29]Green,Leon.The Causal Relation Issue in Negligence Law[J].Michigan Law Review,1962,(5).[30]Lilian Edwards,Michael Veale.Slave to the Algorithm? Why a Right to an Explanation Is Probably Not the Remedy You Are Looking For[J].Duke Law & Technology Review,2018,(1).[31]张欣.数字经济时代公共话语格局变迁的新图景——平台驱动型参与的兴起、特征与机制[J].中国法律评论,2018,(2).[32]Compas-analysis[EB/OL].https://github.com/propublica/compas-analysis/blob/master/Compas%20Analysis.ipynb,2010-04-08/2018-06-15.
  • 基金项目:国家社科基金项目“司法裁判过程中的人工智能应用研究”(编号:18BFX008)

  • 本文载于《内蒙古社会科学》2021年第5期


继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存