查看原文
其他

杨继文:算法证据:作为证据的算法及其适用规则前瞻||《地方立法研究》

杨继文 地方立法研究编辑部 2023-10-09

算法证据:作为证据的算法及其适用规则前瞻


杨继文

华东政法大学刑事法学院讲师、华东政法大学中国环境犯罪治理研究中心研究人员)


本文来源于《地方立法研究》2022年第3期。因篇幅较长,本文注释已略,建议阅读全文。    

摘要 

在大数据时代,算法新兴技术逐步渗入证据法领域,形成了算法证据。算法证据是将海量的案件信息数据进行计算整合,形成结构化、信息化的案件场景自动解读与自动推理结果的材料。人机交互良好的算法决策机制及其算法证据在证据法领域中具有重要价值。算法证据是大数据证据的一种类型,本质上是电子数据,但又不完全是大数据证据。算法证据形成过程中存在技术权力异化,在适用过程中存在技术场景“欺骗”问题。算法证据的事实认定方式,是基于数据而生成的比对信息,通过模型的自动决策推理进行检验,进而实现对案件事实的还原和重现。为了克服算法证据的适用风险,需要促进法律价值、司法理性和技术理性的融合,通过构建算法证据的“主仆场景”适用规则、场景解释规则、对质参与规则、证明力规则、鉴定与推定规则来达成。

关键词 

算法   算法证据   技术理性   智能法学


目次 

一、问题的提出二、算法的证据法价值与本质三、算法证据的技术理性分析

四、算法证据的适用规则构建

结语




一、问题的提出


      在大数据时代,大数据、区块链、算法等新兴技术逐步“渗入”证据法领域,使得传统意义上的以物证、书证和人证为核心的证据体系,逐步发展到以电子证据为核心的新证据时代,形成了大数据证据、区块链证据乃至算法证据等新的证据类型。例如,在刑事司法实践中,大数据证据通过数据信息的海量比对和模型算法分析,被应用于弹劾被告辩解、补强言词证据和印证间接证据。再如,最近最高人民法院颁布实施了一系列涉及法院在线诉讼的司法解释,明确规定了区块链证据的效力、审查及证据补强规则等。又如,新近开发并广泛使用的疫情防控“健康码”,即是通过大数据技术和智能算法,预测、分析和研判新冠患者、疑似患者以及密切接触者,将这种算法形成的“健康码”“行程码”作为证明人们健康程度、出行以及复工复产的证据材料。


      这些法律规范与法律实践表明,大数据、人工智能技术的发展将进一步促使证据理论以及证据法体系的更新和重构。而算法,一般是通过计算机来处理信息,将被程序设定好的模型、次序或者步骤进行数据计算和自动推理。从简单意义上来看,输入信息通过算法就可以得到一个结果,即“结果=输入信息+算法”。算法证据,即体现为这种“结果”,通常体现为通过算法所形成的个性化推送、调度决策、检索过滤等某种证据材料。从证据法视角来看,算法证据是将海量的案件信息数据进行计算整合,形成结构化和信息化的案件场景自动解读与自动推理结果。因此,本文将对基于算法而形成的案件信息材料进行解读和推理研究,分析基于算法而成的算法证据及其事实认定机制的内在机理,进而通过借鉴技术理性的风险治理理论,对算法证据的法律规制和具体证据规则进行理论前瞻和制度构建。具体来看,通过梳理出算法证据适用的三重理性价值——法律价值、司法理性和技术治理,进而构建一种算法证据的理性融合进路,以期构建具有中国特色的大数据证据理论与标准体系,实现技术主义和司法理性、法律价值相互融会贯通的司法功能主义进路。


二、算法的证据法价值与本质


大数据、区块链、人工智能等新兴技术的发展,使得算法在人们日常生产生活中起到的作用越来越大,算法在证据法领域的应用也逐年增多。算法在证据法场域所体现出来的算法证据,是算法技术在证据法领域的“映射”,需要对算法证据进行“转译”和“解释”,辨别和理解它与相关证据的区别和联系,进而才能真正发挥它的价值。

(一)算法的证据法价值

算法的兴起,不仅对人们的信息权、隐私权提出了挑战,还对人们的公正保护和自由产生了极大的影响。算法是一种结构化、特定化的行为模式与模型工具,在很大程度上体现了算法制造者的意志,因而体现了算法的非中立性。在法律实践中,往往通过算法歧视的规制、信息数据的许可赋权、算法公开听证制度等克服其局限性,达成基于人机交互良好的算法决策机制。

算法技术的迭代发展,促使相关法律领域的传统观念和法律思维重构,通过算法技术转换为法律问题之后,进而形成独特法律领域中的法律解释问题。这种转换的过程,体现了技术科技的进步映射到法律场域的一种“镜像”。算法科技的进步,在证据法领域体现为算法证据的转译解释和属性定位。在司法实践中,算法搜索引擎的应用较为普遍。在美国搜索王诉谷歌案中,明确了“算法是言论”的法律适用解释,算法证据材料成为该案中的重要事实判定依据。在威斯康星州诉卢米斯案中,法庭明确了“算法是商业秘密”的法律适用解释,该案中的算法证据材料被视为商业秘密,从而获得了法律程序性的保障地位。算法技术在证据法领域的“转译”和“解释”,明确了算法证据的事实认定框架,使得算法技术成为证据法场域中和传统证据学框架下的审查判断问题之一。

      在证据法理论与实践中,算法的价值主要体现为案件的大数据分析,以及基于这种分析结果而生成的算法证据和它的事实认定结果。基于算法技术而生成的算法证据,有利于完善传统电子证据的矛盾和缺陷,尤其是解决了传统电子证据中的数据集中存储高风险问题,通过巨大的数据量所体现的规律性达到事实证明的作用和要求。算法技术的司法应用,也有利于解决证明资源有限性问题,通过海量数据和计算机算法实现对证据与事实关系的关联分析与可视化数据的再利用。例如,在网络平台犯罪治理过程中,犯罪嫌疑人主观方面的证明是一个热点和难点问题,而通过算法证据的大数据分析与计算推理,能够通过证明犯罪嫌疑人的行为模式和客观规律特点,进而最终推定其主观罪过。这是一种基于算法分析的可行的案件事实认定进路。算法的自动存证特性和推理技术操作,也有利于在瞬间克服电子数据的真实性问题,防止电子证据形成过程中的人为干预和被污染问题,促使事实认定者能够对算法证据材料所体现的结果有一个完整地判断。程序性和自动化的算法证据形成机制,将会在专家证据支撑下更好地提升电子数据的证明力及其被采信能力,促使技术自证体系更为成熟。

(二)算法证据的本质

在学界,关于算法证据的本质及其证据属性存在不同的观点,需要进行梳理和明晰。第一,大数据证据说。正如有的学者所提出的,“随着算法侵入证据本体,产生了不同的算法衍生数据产品,即大数据证据。证据证明的逻辑由价值分析转换为数理逻辑、证据论证的方式由逻辑转换为算法模型”。“根据算法作用方式的不同,大数据证据分为基于海量数据库比对生成的大数据证据和基于算法模型的大数据证据两种类型。”因此,基于算法模型所形成的证据材料应当属于大数据证据。第二,鉴定意见说。基于算法而形成的大数据证据,往往具有计算机科学的科学性和专业性,是通过计算机模型“算”出来的,与电子数据呈现出来的静态事实认定机制明显不同,应当将其纳入鉴定意见的范畴中。第三,电子数据+专家证据说。基于大数据和算法而形成的证据,本质上都蕴含着信息数据这一基本特点,因而体现为电子数据的表现形式。但与此同时,由于算法和机器学习对数据社会的介入,通过算法技术原理而呈现出以专家证据为证据内核的证据属性。此外,还存在证人证言说、独立证据说等几种观点。

笔者认为,如前所述,算法对证据领域已经产生了实然影响,学术上的跟进研究是十分有必要的。虽然在当前证据法学领域,对该问题的研究众说纷纭,总体上属于起步阶段,但是并不影响对算法进行较为合理地证据法定位,可以尝试将算法作为一种证据。当然,算法证据并不能简单被理解为利用大数据技术所生成的证据材料,算法是计算机科学术语,其本质上是一系列计算机技术和程序模型的数据推理组合。算法证据,本质是上通过大数据算法软件、编码或者程序等技术规则来证明案件事实的材料。通过算法这一特定化的行为工具,将一系列技术规则进行整合表达,进而证明隐含在特定算法中的行为人的特定目的和行为表现。这一技术以及通过这一特定技术取得的证据材料才是算法证据。

      这种算法证据是以海量电子数据凝练和算法自动计算所形成的分析结果或报告形式展现出来,是以计算化的规律性认识发挥证明作用,与电子数据的基本特征——数字化形式、计算机储存、数据信息介质等相互吻合。因而,算法证据是大数据证据的一种类型,本质上是电子数据。而大数据证据也是一种电子证据,但算法证据又不完全是大数据证据,这里面还有算法技术与人工智能的交织作用和交互机理。因此,对算法证据的本质属性应从两个层面进行理解。一方面,算法证据的前提和基础是海量数据。算法的海量数据基础,收集和整合了人们的行为信息与模式,形成了算法配置社会资源的大数据基础。因而算法证据是一种大数据证据,同时体现为电子数据的一些基本特点,如计算机化呈现、数据载体等。另一方面,算法证据又必须由计算机算法程序和模型推导出来。算法证据的这种技术运行与自动推理,其结果将直接影响人们的行为和决策,进而可能发展为一种新兴的司法技术权力,嵌入到社会运行和法律适用的电子数据应用中,实现传统社会数据信息的跨越性发展与算法技术权力的隔离性框架。因而体现为不同于一般静态大数据证据的特点,具体参见下图1所示。



三、算法证据的技术理性分析


(一)算法证据的技术场景问题


      随着智能时代的到来,人类的有限理性开始逐步让步于机器和算法,算法在信息掌握、运行速度、处理复杂问题的能力上,都表现出远超于人类的优势,也因此可以长驱直入,甚至深度介入公共决策。但是,当我们将传统治理、行政决策和司法证据裁判交由算法来完成时,引发的问题同样不少。算法权力化所带来的,不仅仅是公共管理效能的提高,同样隐藏了证据适用中的权力异化,甚至存在不断侵蚀个人权利的可能。而在技术理性的光环加持下,这些危险在特定场景中被悄然掩盖。例如,因为算法才可以做到区分有不同偏向的人群,把相同偏向的个体集中在“信息茧房”或 “回音壁”中,才可以让特定的人看到或看不到特定的内容,实现持续动态的“千人千面”的个性化信息推送,这事实上是通过算法和算法证据达到对目标人群的人为支配和控制。因此,我们需要重点关注算法证据的技术权力“异化”问题和技术场景“欺骗”问题,通过证据法原理进行分析与研判。对于前者,表现为通过算法权力“异化”,而使得算法证据材料的证据能力存在可疑之处,它的合法性和关联性需要进一步研判;而对于后者,由于算法技术场景“欺骗”,算法程序的正义性难以保证,算法歧视性、算法可责性、算法透明性等问题突出,进而直接导致算法证据的真实性存疑。

       一方面,算法证据形成过程中的技术权力异化问题。由于对算法技术缺乏有效规制,由算法权力所形成的算法证据,往往是一种独立的决策机制,会产生司法专断意义上的不公平性,在一定程度上严重挑战正当程序具体制度和权力专属原则。同时,算法权力的异化,实践中又突出体现为算法公开监督机制欠缺、算法技术滥用与知识产权侵犯,以及个体数据权利赋权与保障问题等。而算法权力的滥用,又表现为前述侵犯信息权利的算法歧视、揭露数据主体隐私信息的算法自动关联和压缩数据主体意思自治空间的算法自动决策。如果算法证据是由这些异化或者滥用的算法技术所形成的,可能会忽视算法的场景性,将会导致案件信息获取中的身份歧视,犯罪嫌疑人身份难以进行同一认定。


      另一方面,算法证据适用过程中的技术场景“欺骗”问题。算法技术的发展与算法技术场景密切相关,算法的自动推理和可视化信息为人们的生活提供了便利,但是算法计算过程的不公开性和非解释性可能会对特定场域的群体造成歧视,进而形成了所谓的“算法歧视”和“欺骗”问题。这种算法歧视是在特定场域中形成的,体现为偏见代理的算法歧视、特征选择的算法歧视和大数据杀熟三种基本形态。而基于算法歧视所形成的算法证据,可能会使司法人员对案件事实的认定存在偏差。最终,在算法歧视和算法偏差所形成的算法证据适用中,案件信息被瞬间杂糅自动推理所致的技术“理性”——场景所“欺骗”。算法决策和自动化行政的运行步骤,是将所有案件信息与内容杂糅进既定的算法之中得出相应结果,其结果也在系统内瞬间完成,此时已无法再分离出行为的程序、步骤和方法。因此,这就使传统的正当程序控制,在面对算法决策时显著失灵,进而会发生由于信任技术而产生的技术场景“欺骗”问题。


(二)算法证据的事实认定问题


1.算法证据的事实认定方式

      算法不是一个法律概念,而是一个计算机与数学相交叉的概念,是通过计算结构模型体现出来的一种步骤或者程序。在证据应用场景下,经算法分析输出的结构化数据,在刑事诉讼中被称为大数据证据,在有的国家被称为算法证据。在算法技术运用的场域中,一方面是由海量数据形成数据库,进而生成为证据法中的“大数据比对分析报告”;另一方面,在海量数据及其数据库构建的基础上,根据算法程序模型而生成了算法模型证据,也就是狭义上的算法证据。在算法证据的这一运作机理过程中,通过数据库的检索、比对形成算法证据的数据基础,再在这一基础上通过算法程序模型的推理和分析推导出算法证据的比对结论,进而形成对案件事实的同一认定。因此,算法证据的事实认定方式,是基于数据而生成的比对信息,通过模型的自动决策推理进行检验,进而实现对案件事实的还原和重现。

同时,如前所述,由于算法模型的人为设置和程序控制,再加上海量大数据收集的不完备性和可能的技术偏见,可能导致算法证据的形成及其事实认定结果的偏见。也就是说,由于海量数据的偏见和算法模型的主体歧视,将会导致算法证据的事实认定方式并不是完全客观的,恰恰可能是多主体之间博弈后预设的结果。海量的数据之所以能够呈现出“规律”,是因为在分析数据前人为地选定了分析数据的方法。作为可能“背景事件”的海量数据和模型算法,事实上也就决定了算法证据进行事实认定的准确性和真实性。由此可见,与机器学习算法所具有的自主性相比,证据应用场景下的算法更多地体现为一种自动化处理数据的工具。其尚不具备自主决策的属性,内部的规则依然按照设计者所设定的处理规则进行完善,需要在设计者的干预与纠正之下进行模型的优化与修正。

2.算法证据的事实认定主要问题

      除了前述算法证据的技术场景欺骗问题之外,算法证据的证据适用还存在事实认定问题。这体现为算法本身的技术理性偏失所导致的算法证据中的歧视问题和算法黑箱问题。前者所谓的算法证据歧视问题,在美国体现为作为裁判以及司法预测基础之一的算法技术具有歧视,进而导致作为算法结果的算法证据的歧视性。例如,刑事诉讼程序中的犯罪预测算法应用本身就具有很大的歧视性,算法证据结果体现为白人犯罪嫌疑人再犯的程度较低,而黑人的再犯可能性较大。而后者所谓的算法证据黑箱问题,则体现为算法技术理性的霸权惯性而产生的证据适用风险。算法本身不透明导致算法黑箱乃至算法霸权,数据本身又带有社会固有的不平等、排斥性和歧视痕迹,从而使算法权力得以形成。这种算法权力带来了证据适用的独断风险,证据信息数据的算法分析蕴含群体极化之虞,“算法共谋”的证据材料催生技术阶层的限制竞争与垄断风险。


(三)算法证据问题的理性分析

如前所述,算法证据的技术场景问题,往往体现为个体层面由内隐偏见驱动的无意识歧视和社会层面由结构性不平等驱动的系统性歧视,或影响人工智能的开发设计,或干预数据生成、采集和利用,在问题建构、数据理解、特征选择等环节将偏见和结构性不平等嵌入人工智能,诱导其输出歧视性结果。算法证据的司法适用仍面临困境,需要对其进行风险和理性分析。算法证据的证据风险产生,是与前述的技术运作机理和事实认定方式紧密相关。对于算法技术的司法应用和具体落实,需要强调从技术本身的“安全风险”到法律层面的“证据风险”的转换逻辑和话语分析。

司法机关在司法活动中对算法证据需要保持保守与警惕态度。其一,算法技术具有极强的专业性,司法工作人员对其原理掌握不够,产生认识偏差。其二,算法证据虽然在一定程度上补足了传统电子证据的真实性,但由于算法技术自身存在安全风险和技术局限性,其可靠性遭到质疑。其三,由于技术认知局限,司法裁判者对算法证据认证标准也尚未统一。因此,算法证据在司法适用中存在的技术理性与司法理性的双重挑战,一方面是来自裁判者对算法证据的审查顾虑,另一方面是技术自身风险也难以把控。而关于证据审查的顾虑,虽然这几年我国法院不断摸索出了大数据、区块链电子证据审查模式,即按照电子数据审查规则进行处理,实践中,法官也的确是按照这种方式进行精密处理和操作的,但在司法实践中过于严苛的审查要求以及审查规则,一定程度上会阻碍算法证据的适用,甚至降低事实认定的司法效率。对于算法自身存在的技术层面风险,亟待我国司法领域通过相关途径进行探索和完善。

“智能量刑算法的司法适用,既推动了我国传统司法的结构性转向,又开拓了‘同案同判’的技术化裁判路径。”随着算法证据在司法实践中不断的运用与发展,区块链等智能算法系统的信任机制和透明性、确定性判断问题也逐渐受到立法、司法层面的关注。为了充分发挥算法技术和比对推理的优势,应当促进算法技术与区块链技术的融合和共生发展。区块链算法存证平台的真实性保障并不是保证系统本身不受攻击,而是通过特殊的存储架构,建立各个独立的、分布的据点,如果算法中任一节点发生篡改则很容易被发现,链上结点数量越多,黑客攻击的难度就会加大,链上数据的真实性也更能得到保证。因此,算法证据在司法适用中仍面临的困境是自身的技术安全风险以及在法律层面上的证据风险。算法证据具有“关联主义”上的客观知识的可能性,还具有怀疑主义者所主张的认识论上的扭曲性,存在着算法证据技术偏见和提取“取证模式”的证据风险。总之,算法证据的理性应用,应当防止前述各种风险,促使“算法向善”,并促使算法证据适用规则的体系构建和制度完善。


四、算法证据的适用规则构建


聚焦于关键场景算法透明公平的“法律”、趋于共识的算法伦理“规范”和迈向算法可解释的“代码”,贯穿了长达半个世纪的算法治理进程。通过创新性的“算法可理解+数据可信+参数可解释”治理架构,结合算法识别、数据可信以及算法可理解等基础性规则,可以突破算法解释、平台责任等现有治理手段的局限,确保技术理性与社会发展的协调与相互促进。因此,算法证据的良好适用应当适应这种时代需求,通过构建算法证据适用规则体系来进行完善,具体请参见表1。



(一)规则构建的理性原则


大数据时代的这种算法证据,正在逐步影响整个法律体系的运作,通过技术的治理促使算法的掌控者(包括国家和商业机构),在司法场域与公民之间产生新的“权力-权利关系”,并创生出许多无须借助法律的社会控制方式。因此,在这种背景下,需要明确技术治理与法律价值和司法理性之间的关系问题。算法证据的适用,正是通过司法理性考量这一中间环节达成符合人们需求的法律价值。算法证据形成了一套以技术编码和自治伦理为主的技术治理方式,通过技术治理,有利于实现司法理性主导的良好秩序,为司法理性中的程序正义和纠纷解决提供外部技术保障;而在算法证据的适用过程中,又必须强调现行法律体系及其法律价值所秉持的宽容态度,为算法证据的发展提供法律保障。人们需要运用法律蕴含的价值和司法理性的独特手段,对算法证据的技术治理进行有效归化。算法证据本身的技术水平提升,又为司法解决纠纷的功能发挥和法律价值的调整提供动力。在上述关系维度的理论分析背景下,算法证据适用规则构建的理性原则,主要包括下述三个方面的内容,即突出法律价值贯彻的权利保障底线原则、强调司法理性考量的场景约束原则、进行技术治理审视的风险治理原则。


1.法律价值:贯彻权利保障底线原则

算法证据适用的规则构建,应当明确数据主体的权利保障原则。由于算法不可能与人类进行同频思考,所以从人性道义的角度来看,必须对算法证据的适用提出底线性的权利保障要求,防止人工智能算法无边际的自动推理与自动化决策,防止由算法“信息茧房”产生的算法证据适用“偏见”,构建算法证据适用的“数字人权”观。由于算法可以高效解析个人数据并生成相关决策,因此具有将虚拟世界和现实世界的个体相互联结,将个体的过去、现在和未来建立联结的技术能力。例如,在互联网平台中,客户获得的信息是由算法运算形成的,算法模型的设计与制作往往交织着程序开发者的主观信息和认识前见,进而生成了算法权力及其滥用的可能性。因此,对于算法证据规则的理性构建,尤其要重视法律层面的主体保障需求,需要在算法证据适用中明确权利保障的底线原则。防止算法设计者和受众的“信息茧房”效应,避免算法证据对于案件主体进行类型化推送和不利影响,进而使得权利主体在不断放大的“同温层”中不能自拔。同时,在权利保障的底线原则要求下,需要突破算法被认为“操纵的桎梏”,进而在司法场域和特定条件之下,算法证据的“偏见”会对案件处理乃至整个社会产生重大影响。因此,应当借鉴欧盟《一般数据保护条例》的规定,如果某种仅依自动化而作出的决策会对数据主体产生法律效力或对其造成重大影响,则数据主体有权不受上述决策的限制。也就是说,算法这种自动化决策所形成的证据材料,如果对案件主体的权利产生重大影响,自动化决策在原则上就要被禁止。欧盟之所以设置这种一般性禁止,是因为算法机器虽然有无以伦比的计算能力和深度学习能力,却仍旧无法与人类产生共情,因此在裁断有关他人生命自由等重大事项时,几乎不能期待其表达出人类的同情和善意,也不能期待其作出最符合人性道义的处理。


2.司法理性考量:场景约束原则

算法由于场景的变化而具有不同的属性,进而面临不同的价值冲突。基于此,算法规制也需要采取场景化的规制路径。而算法证据的应用需要考量被证明对象的个性与特殊性问题,在这一过程中,需要证据适用的场景化规则来进行治理。如前所述,算法证据的形成过程是一种“输入-输出”的流程,即案件要素的输入→算法模型→算法证据的输出,形成了对算法证据的司法场景约束。在输入阶段,是案件信息各种转换为计算机代码的过程,通过生活经验与信息的代码化实现生活理性转换为算法逻辑。而在算法模型构建与计算阶段,通过自动检索、自动比对、自动化决策形成对司法案件事实各要素的主体结构梳理和关系构建,形成对案件事实状态的全过程结构描绘。例如,在刑事司法场景中,算法证据的形成,需要在公平算法模型的构建过程,对违法犯罪行为各个要素的数据信息和数据关系进行提取,进而将这些数据信息和数据关系特征进行比对与组合,形成特定刑事案件中的自动推理整合,进而在司法理性逻辑下证明特定类型的违法犯罪构成要件。


3.技术治理审视:风险治理原则

在前述法律理性和司法理性的要求下,促使算法证据的精确性构建,而现实的情况是算法证据的技术场景化标准尚未建立。算法作为一种技术工具,必须无歧视和无偏见地运行,否则形成的算法证据可能无法突破前述“信息茧房”的约束。基于这样一种证据风险,一方面,需要进一步促进算法技术的成熟,将低密度的每一条数据信息通过算法转换为统一的定罪量刑标准。另一方面,需要克服算法权力偏见而导致的证据确定性风险。进一步还原算法的“技术中立”地位,实现算法模型运行的“价值无涉”,克服“以数学方式或者计算机代码表达意见”。此外,还需要强调算法技术的可靠性和稳定性,通过算法自主学习(机器学习),避免人类定义与设计的偏见,最终通过算法场景化标准和规则构建实现机器学习算法和人工设计算法的融贯融合和风险治理。


(二)算法证据适用规则的具体构建


司法算法决策的权力逻辑和算法证据规则构建,在发挥其效能方面必须维护司法权力起止的有限性、决策的集中性、裁判的公开性和运作目标的整体性特征;权力运行的过程,在于充分发挥算法系统嵌入司法系统的叠加性优势,合理地进行司法程序的算法设置和布局;权力运行的效果,体现出系统博弈中公平问题的复杂性,并以可解释性模型的构建勾连法律的平等权利和非歧视性规制。


1.算法证据的“主仆场景”适用规则

证据是准确认定事实的基石,在算法侵入证据本体,并对准确认定事实有实质危险时,对算法进行规制是应有之义。在法律理性的要求下,为了实现对算法中的权利进行保障的底线原则,需要明确单独专门讨论算法规制问题,这一考虑暗含的前提是算法与传统科技的不同。如前文所述,算法是一种人工智能工具和技术。这种人造技术特性使得算法天生地带有价值倾向,算法设计者可以依据不同的目的设计算法。在司法领域,要明确算法决策意义上的算法证据仅具有辅助性地位,不能替代人类法官进行判案,并需要设计出更为精细的算法透明制度。例如,外卖平台算法,其目的是外卖送达的效率。因此,外卖小哥可能会为了满足算法设定的时间标准而被“困在”算法中。同样的,在证据应用中,不同的目的会设计出不同的算法,证据信息显示的内容也就不同。因此,将算法本身作为证据法律规制的对象成了理论上的共识。此外,立足于证据法,对算法应用所产生的大数据证据建立证据排除规则,是反向规制算法的有效方案。算法本身并不是为自己而进行计算活动,这体现为“仆人”的服务性特征;算法证据需要在这种“主仆场景”中为了“主人”——算法设计者的利益从事智能活动。在“主仆场景”视域,对算法证据的合法性进行审查,需要构建基于取证主体和取证程序两个层面的非法证据排除规则。重点判断“主”的要素——算法设计者的取证主体资格,然后审查“仆”的要素——算法模型的程序合法性与规范性,在“主仆”融合的视角下达成对算法证据的合法性审查,形成算法证据的非法证据排除规则。最终明确基于算法歧视和算法偏见所形成的算法证据应当进行强制性排除,对符合中立性和资质性以及技术说明性的算法证据,可以适用补正性排除规则或者裁量性排除规则。


2.算法证据的场景解释规则

在司法理性的要求下,为了实现算法的场景约束原则,面对日益紧迫的算法治理需求,算法解释权被提出,对用户和相关个体的自治性加以尊重,为用户和相关个体的技术性正当程序权利奠定行使基础、避免算法危害成本外化和弥散。在算法证据的证据能力审查上,应能经受住相关性检验和科学可靠性检验,通过算法场景的标准,构建算法证据的解释规则。输入的数据(因)经过算法输出(果),算法是具有因果关系性质的机制。刑事司法中实体事实的证明遵循严格证明法则,在严格证明下,必然要打破算法黑箱,使法官了解算法的运行机理与基本逻辑结构。随着算法在证据领域的应用逐渐成熟,一定程度的算法标准可能成型。在算法证据的模型层面,需要明确具体使用了哪些假设或限制,使用了哪些模型和建模工具,以及输出结果的准确度基准,错误分析及补救措施等标准。如此,才能建立可理解、可解释、可靠可控的可信算法。目前,我国公安部经济犯罪侦查局已经在公安内部云中上传了经济犯罪的算法模型标准,亟待上升到规范层次。此外,算法证据适用中还需要强调构建算法共识与告知制度。例如,国家网信办等四部门公布的《互联网信息服务算法推荐管理规定》第16条,明确要求互联网服务提供者向用户“以显著方式告知”算法的存在,并“以适当方式公示”算法的基本原理和运行机制。总之,算法证据在司法适用过程中,不仅需要对算法的原理进行解释说明,还需要对算法进行公示和告知,使得包括计算机专家在内的社会公众能够进行理性选择,防止算法权力的强制和滥用。


3.算法证据的对质参与规则

在技术理性的要求下,为了实现算法的风险治理原则,需要构建与完善算法证据的对质参与原则以及后文论述的算法证据证明力规则和算法证据鉴定与推定规则。在司法实践中,对算法证据的审查判断需要建立算法生成证据的排除制度和对质参与规则。对基于海量数据的数据库算法比对,宜采取庭上展示和辩方质证的证据方法,对基于算法模型的大数据分析宜采取专家辅助人提供检验意见和出庭接受质证的方法。基于目前证据应用场景下的算法是由侦查机关与科技企业合作设计,算法必然隐含着侦查机关本身的价值判断。而为了防止侦查机关凭借算法技术成为诉讼关系的中心,应当赋予对方当事人对算法证据的对质权利和法官对算法生成证据的排除权力。此外,证据异议制度和证据排除制度仍然是规制取证行为最有效的制度之一,能够较为有效地保证侦查机关运用算法及其证据材料的可靠性。


4.算法证据的证明力规则

结合大数据应用的信息连接点选择、算法歧视可能性、逻辑架构合理性、算法结论稳健性等判断算法证据的关联性及其对待证事实的证明程度。算法证据的适用和证明力评价,需要考量海量数据信息的获得性、算法模型的可靠性等内容,还要考量因其技术自证和法律效力的融合问题,进而通过海量数据信息判断算法证据的关联性和证明程度。我国未来对算法证据适用规则的规定,应当包括算法证据的采纳标准和采信标准、证据调取、证明力标准等内容。同时,通过算法的人工智能技术和机器学习,有利于避免证明评价的主观性,实现基于算法证据的证明力评价模式更新。例如,杭州互联网法院利用区块链存证技术审理的第一案,对区块链算法证据的效力认定以及审查规则即是一种协调整合规则的综合适用。该案借用了区块链算法技术本身具有的分布式存储,通过不可篡改的特性和智能算法模型增强电子数据的证明力。法院在综合审查过程中,着重审查区块链等证据材料的真实性。一方面,审查判断区块链技术存证的电子证据是否真实;另一方面,整合审查区块链算法所形成的证据材料与待证事实的相关性。最终,运用区块链技术、算法证据对侵权行为结果事实进行具有可靠性的抓取,通过上链固证规范、算法技术审查、下链取证方式的合法等协调整合角度,来审查该证据材料的证据能力大小。此外,在对算法证据进行证据能力审查后,再考量其证明力大小的问题。算法证据的证明力规则构建,如同区块链证据一样,缘于哈希校验、时间锁定与节点印证等技术特点,在真实性方面极大增强的基础上,呈现出入链后数据真实性有保障、入链前数据真实性可优化两大定律。因此,需要充分体现算法证据的自动化优势、时间上的瞬时性和不可篡改性,提升它的证明力和数据信息的可靠性。在算法证据关联性审查时,可以集中于进入算法前的存证前置程序上,需要确保输入算法前的规范性,一旦将证据输入至计算机算法中,其关联性就基本上得到了保障。


5.算法证据的鉴定与推定规则

如前所述,算法技术权力的异化和场景欺骗,可能导致算法证据的不可靠性,因此可以通过算法鉴定的方式对算法证据形成过程进行全过程监督,通过算法“白盒”等功能评价方法对算法行为人的意志进行判断,从而对算法证据实现鉴真。不论是基于海量数据库比对证据还是基于算法模型证据,算法不可避免地要作出判断,包括什么信息(或哪类信息)应被纳入输出的结果,算法的输出结果本质上更接近对信息的重新汇聚和排列。可见,算法在证据应用场景下是一种方法论意义上的工具。算法证据是一种基于人造技术而形成的证据材料,算法是为了完成特定步骤的有限程序,这就决定了算法如何完成从输入到输出的任务,并由人类规定,算法证据的合理使用必须通过鉴定方式来实现。具体到作为大数据证据的算法证据,海量的电子数据所蕴含的信息无法直接显现,必须将其排列、组合之后,才能通过结构化的电子数据显示证据信息。因此,算法在其中体现为代替人类自动化处理电子数据的工具,所形成的算法证据需要对自动化计算机技术进行鉴定或者引进专家证人进行审查判断。在实践中可以尝试将完整性校验、可信时间戳、数字签名、区块链存证等信息技术应用于算法证据的电子数据鉴真。算法证据的鉴真,与区块链证据一样,存在载体与内容两分意义上的“双阶鉴真”。即对算法证据的载体鉴真,往往通过区块链技术的反篡改技术,对案件中电子证据的移送、计算、保管提供技术真实性担保,实现对算法证据“技术独特性”的证明;而对算法证据的内容鉴真,则主要涉及大数据信息内容的收集和提取,通过“保管链条”的鉴真方法进行实质性判定。


同时,在算法技术难以证明和鉴定的情况下,可以通过算法推定规则构建来弥补缺陷。算法推定则是依据算法所包含的时间、范围、主体、数据、事件等特定技术规则与行为人意志的伴生关系或常态联系而设立的司法证明规则。由于算法在人类设定的目标范围内,起到了替代人类的作用。在基于海量数据库比对证据中,利用同一认定原理建立比对特征模型,在很大程度上是由机器算法给出实质判断的,这在很大程度上取代了传统意义上的鉴定形式。在基于算法模型的大数据证据中,利用危害行为所映射的资金数据规律建立资金数据模型,进而实现推定的效果。例如,算法的技术规则具有以下情形时,可以推定网络平台对相应的具体犯罪行为是明知的:①针对某类非法数据进行技术规则回应,如通过设立不良信息过滤系统等进行管控;②针对某类非法数据进行过多次技术处置,如通过指令日志发现曾对非法数据进行专门分析。


结语


证据制度与科学技术的发展存在着同频同振的关系。从神示证据、法定证据、自由心证证据,再到智能法学时代的大数据证据,人类对事实的还原能力不断提高。随着不同场景下的部分决策与行为被让渡给算法,我们进入了“算法统治的时代”。技术的极速进步和法律的保守步伐的碰撞,使新的问题不可避免地出现。由于对算法技术缺乏有效规制,由算法权力所形成的算法证据,往往是一种独立的决策机制,会产生司法专断意义上的不公平性;同时,算法计算过程的不公开性和非解释性将可能会对特定场域的群体造成歧视,进而形成了所谓的“算法歧视”问题。技术不能脱离现实应用,科技的应用离不开法律的监管。算法在证据场景的应用可能会导致事实认定偏差的风险,可能会对诉讼程序的公平理念、程序正义等核心价值产生巨大的冲击。


算法并不具有预设的被信任度,只有将算法转译为证据法学的概念,在法律框架下对算法证据予以规制,算法生成的证据才会可靠地彰显证据功用和价值。算法证据是将海量的案件信息数据进行计算整合,并形成结构化、信息化的案件场景自动解读与自动推理结果的材料。算法证据是大数据证据的一种类型,本质上是电子数据,但它又不完全是大数据证据。在法律价值、司法理性与技术治理的交互融合背景下,需要明确算法证据规则适用的权利保障底线原则、场景约束原则和风险治理原则。最终,在算法证据适用规则的具体构建过程中,充分提升其技术治理整体性效能,通过算法自动化决策叠加性优势,合理设置证据审查和判断依据,促进“算法向善”、为司法所用。




   责任编辑:吕    万

------------------------------------

公众号学生编辑:陈传文

初审:陈尔博、郜文风

审核:吕   万

审核发布:黄   瑶




《地方立法研究》2022年第3期目录与摘要

郑飞:漂向何方:数字时代证据法的挑战与变革

熊晓彪:司法事实认定的数据化转型



《地方立法研究》投稿网站:

https://dflf.cbpt.cnki.net/                                                 


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存