杨继文:算法证据:作为证据的算法及其适用规则前瞻||《地方立法研究》
算法证据:作为证据的算法及其适用规则前瞻
杨继文
(华东政法大学刑事法学院讲师、华东政法大学中国环境犯罪治理研究中心研究人员)
摘要
在大数据时代,算法新兴技术逐步渗入证据法领域,形成了算法证据。算法证据是将海量的案件信息数据进行计算整合,形成结构化、信息化的案件场景自动解读与自动推理结果的材料。人机交互良好的算法决策机制及其算法证据在证据法领域中具有重要价值。算法证据是大数据证据的一种类型,本质上是电子数据,但又不完全是大数据证据。算法证据形成过程中存在技术权力异化,在适用过程中存在技术场景“欺骗”问题。算法证据的事实认定方式,是基于数据而生成的比对信息,通过模型的自动决策推理进行检验,进而实现对案件事实的还原和重现。为了克服算法证据的适用风险,需要促进法律价值、司法理性和技术理性的融合,通过构建算法证据的“主仆场景”适用规则、场景解释规则、对质参与规则、证明力规则、鉴定与推定规则来达成。关键词
算法 算法证据 技术理性 智能法学
目次
一、问题的提出二、算法的证据法价值与本质三、算法证据的技术理性分析四、算法证据的适用规则构建
结语
一、问题的提出
二、算法的证据法价值与本质
三、算法证据的技术理性分析
(一)算法证据的技术场景问题
(二)算法证据的事实认定问题
1.算法证据的事实认定方式
2.算法证据的事实认定主要问题
四、算法证据的适用规则构建
聚焦于关键场景算法透明公平的“法律”、趋于共识的算法伦理“规范”和迈向算法可解释的“代码”,贯穿了长达半个世纪的算法治理进程。通过创新性的“算法可理解+数据可信+参数可解释”治理架构,结合算法识别、数据可信以及算法可理解等基础性规则,可以突破算法解释、平台责任等现有治理手段的局限,确保技术理性与社会发展的协调与相互促进。因此,算法证据的良好适用应当适应这种时代需求,通过构建算法证据适用规则体系来进行完善,具体请参见表1。
(一)规则构建的理性原则
大数据时代的这种算法证据,正在逐步影响整个法律体系的运作,通过技术的治理促使算法的掌控者(包括国家和商业机构),在司法场域与公民之间产生新的“权力-权利关系”,并创生出许多无须借助法律的社会控制方式。因此,在这种背景下,需要明确技术治理与法律价值和司法理性之间的关系问题。算法证据的适用,正是通过司法理性考量这一中间环节达成符合人们需求的法律价值。算法证据形成了一套以技术编码和自治伦理为主的技术治理方式,通过技术治理,有利于实现司法理性主导的良好秩序,为司法理性中的程序正义和纠纷解决提供外部技术保障;而在算法证据的适用过程中,又必须强调现行法律体系及其法律价值所秉持的宽容态度,为算法证据的发展提供法律保障。人们需要运用法律蕴含的价值和司法理性的独特手段,对算法证据的技术治理进行有效归化。算法证据本身的技术水平提升,又为司法解决纠纷的功能发挥和法律价值的调整提供动力。在上述关系维度的理论分析背景下,算法证据适用规则构建的理性原则,主要包括下述三个方面的内容,即突出法律价值贯彻的权利保障底线原则、强调司法理性考量的场景约束原则、进行技术治理审视的风险治理原则。
1.法律价值:贯彻权利保障底线原则
算法证据适用的规则构建,应当明确数据主体的权利保障原则。由于算法不可能与人类进行同频思考,所以从人性道义的角度来看,必须对算法证据的适用提出底线性的权利保障要求,防止人工智能算法无边际的自动推理与自动化决策,防止由算法“信息茧房”产生的算法证据适用“偏见”,构建算法证据适用的“数字人权”观。由于算法可以高效解析个人数据并生成相关决策,因此具有将虚拟世界和现实世界的个体相互联结,将个体的过去、现在和未来建立联结的技术能力。例如,在互联网平台中,客户获得的信息是由算法运算形成的,算法模型的设计与制作往往交织着程序开发者的主观信息和认识前见,进而生成了算法权力及其滥用的可能性。因此,对于算法证据规则的理性构建,尤其要重视法律层面的主体保障需求,需要在算法证据适用中明确权利保障的底线原则。防止算法设计者和受众的“信息茧房”效应,避免算法证据对于案件主体进行类型化推送和不利影响,进而使得权利主体在不断放大的“同温层”中不能自拔。同时,在权利保障的底线原则要求下,需要突破算法被认为“操纵的桎梏”,进而在司法场域和特定条件之下,算法证据的“偏见”会对案件处理乃至整个社会产生重大影响。因此,应当借鉴欧盟《一般数据保护条例》的规定,如果某种仅依自动化而作出的决策会对数据主体产生法律效力或对其造成重大影响,则数据主体有权不受上述决策的限制。也就是说,算法这种自动化决策所形成的证据材料,如果对案件主体的权利产生重大影响,自动化决策在原则上就要被禁止。欧盟之所以设置这种一般性禁止,是因为算法机器虽然有无以伦比的计算能力和深度学习能力,却仍旧无法与人类产生共情,因此在裁断有关他人生命自由等重大事项时,几乎不能期待其表达出人类的同情和善意,也不能期待其作出最符合人性道义的处理。
2.司法理性考量:场景约束原则
算法由于场景的变化而具有不同的属性,进而面临不同的价值冲突。基于此,算法规制也需要采取场景化的规制路径。而算法证据的应用需要考量被证明对象的个性与特殊性问题,在这一过程中,需要证据适用的场景化规则来进行治理。如前所述,算法证据的形成过程是一种“输入-输出”的流程,即案件要素的输入→算法模型→算法证据的输出,形成了对算法证据的司法场景约束。在输入阶段,是案件信息各种转换为计算机代码的过程,通过生活经验与信息的代码化实现生活理性转换为算法逻辑。而在算法模型构建与计算阶段,通过自动检索、自动比对、自动化决策形成对司法案件事实各要素的主体结构梳理和关系构建,形成对案件事实状态的全过程结构描绘。例如,在刑事司法场景中,算法证据的形成,需要在公平算法模型的构建过程,对违法犯罪行为各个要素的数据信息和数据关系进行提取,进而将这些数据信息和数据关系特征进行比对与组合,形成特定刑事案件中的自动推理整合,进而在司法理性逻辑下证明特定类型的违法犯罪构成要件。
3.技术治理审视:风险治理原则
在前述法律理性和司法理性的要求下,促使算法证据的精确性构建,而现实的情况是算法证据的技术场景化标准尚未建立。算法作为一种技术工具,必须无歧视和无偏见地运行,否则形成的算法证据可能无法突破前述“信息茧房”的约束。基于这样一种证据风险,一方面,需要进一步促进算法技术的成熟,将低密度的每一条数据信息通过算法转换为统一的定罪量刑标准。另一方面,需要克服算法权力偏见而导致的证据确定性风险。进一步还原算法的“技术中立”地位,实现算法模型运行的“价值无涉”,克服“以数学方式或者计算机代码表达意见”。此外,还需要强调算法技术的可靠性和稳定性,通过算法自主学习(机器学习),避免人类定义与设计的偏见,最终通过算法场景化标准和规则构建实现机器学习算法和人工设计算法的融贯融合和风险治理。
(二)算法证据适用规则的具体构建
司法算法决策的权力逻辑和算法证据规则构建,在发挥其效能方面必须维护司法权力起止的有限性、决策的集中性、裁判的公开性和运作目标的整体性特征;权力运行的过程,在于充分发挥算法系统嵌入司法系统的叠加性优势,合理地进行司法程序的算法设置和布局;权力运行的效果,体现出系统博弈中公平问题的复杂性,并以可解释性模型的构建勾连法律的平等权利和非歧视性规制。
1.算法证据的“主仆场景”适用规则
证据是准确认定事实的基石,在算法侵入证据本体,并对准确认定事实有实质危险时,对算法进行规制是应有之义。在法律理性的要求下,为了实现对算法中的权利进行保障的底线原则,需要明确单独专门讨论算法规制问题,这一考虑暗含的前提是算法与传统科技的不同。如前文所述,算法是一种人工智能工具和技术。这种人造技术特性使得算法天生地带有价值倾向,算法设计者可以依据不同的目的设计算法。在司法领域,要明确算法决策意义上的算法证据仅具有辅助性地位,不能替代人类法官进行判案,并需要设计出更为精细的算法透明制度。例如,外卖平台算法,其目的是外卖送达的效率。因此,外卖小哥可能会为了满足算法设定的时间标准而被“困在”算法中。同样的,在证据应用中,不同的目的会设计出不同的算法,证据信息显示的内容也就不同。因此,将算法本身作为证据法律规制的对象成了理论上的共识。此外,立足于证据法,对算法应用所产生的大数据证据建立证据排除规则,是反向规制算法的有效方案。算法本身并不是为自己而进行计算活动,这体现为“仆人”的服务性特征;算法证据需要在这种“主仆场景”中为了“主人”——算法设计者的利益从事智能活动。在“主仆场景”视域,对算法证据的合法性进行审查,需要构建基于取证主体和取证程序两个层面的非法证据排除规则。重点判断“主”的要素——算法设计者的取证主体资格,然后审查“仆”的要素——算法模型的程序合法性与规范性,在“主仆”融合的视角下达成对算法证据的合法性审查,形成算法证据的非法证据排除规则。最终明确基于算法歧视和算法偏见所形成的算法证据应当进行强制性排除,对符合中立性和资质性以及技术说明性的算法证据,可以适用补正性排除规则或者裁量性排除规则。
2.算法证据的场景解释规则
在司法理性的要求下,为了实现算法的场景约束原则,面对日益紧迫的算法治理需求,算法解释权被提出,对用户和相关个体的自治性加以尊重,为用户和相关个体的技术性正当程序权利奠定行使基础、避免算法危害成本外化和弥散。在算法证据的证据能力审查上,应能经受住相关性检验和科学可靠性检验,通过算法场景的标准,构建算法证据的解释规则。输入的数据(因)经过算法输出(果),算法是具有因果关系性质的机制。刑事司法中实体事实的证明遵循严格证明法则,在严格证明下,必然要打破算法黑箱,使法官了解算法的运行机理与基本逻辑结构。随着算法在证据领域的应用逐渐成熟,一定程度的算法标准可能成型。在算法证据的模型层面,需要明确具体使用了哪些假设或限制,使用了哪些模型和建模工具,以及输出结果的准确度基准,错误分析及补救措施等标准。如此,才能建立可理解、可解释、可靠可控的可信算法。目前,我国公安部经济犯罪侦查局已经在公安内部云中上传了经济犯罪的算法模型标准,亟待上升到规范层次。此外,算法证据适用中还需要强调构建算法共识与告知制度。例如,国家网信办等四部门公布的《互联网信息服务算法推荐管理规定》第16条,明确要求互联网服务提供者向用户“以显著方式告知”算法的存在,并“以适当方式公示”算法的基本原理和运行机制。总之,算法证据在司法适用过程中,不仅需要对算法的原理进行解释说明,还需要对算法进行公示和告知,使得包括计算机专家在内的社会公众能够进行理性选择,防止算法权力的强制和滥用。
3.算法证据的对质参与规则
在技术理性的要求下,为了实现算法的风险治理原则,需要构建与完善算法证据的对质参与原则以及后文论述的算法证据证明力规则和算法证据鉴定与推定规则。在司法实践中,对算法证据的审查判断需要建立算法生成证据的排除制度和对质参与规则。对基于海量数据的数据库算法比对,宜采取庭上展示和辩方质证的证据方法,对基于算法模型的大数据分析宜采取专家辅助人提供检验意见和出庭接受质证的方法。基于目前证据应用场景下的算法是由侦查机关与科技企业合作设计,算法必然隐含着侦查机关本身的价值判断。而为了防止侦查机关凭借算法技术成为诉讼关系的中心,应当赋予对方当事人对算法证据的对质权利和法官对算法生成证据的排除权力。此外,证据异议制度和证据排除制度仍然是规制取证行为最有效的制度之一,能够较为有效地保证侦查机关运用算法及其证据材料的可靠性。
4.算法证据的证明力规则
结合大数据应用的信息连接点选择、算法歧视可能性、逻辑架构合理性、算法结论稳健性等判断算法证据的关联性及其对待证事实的证明程度。算法证据的适用和证明力评价,需要考量海量数据信息的获得性、算法模型的可靠性等内容,还要考量因其技术自证和法律效力的融合问题,进而通过海量数据信息判断算法证据的关联性和证明程度。我国未来对算法证据适用规则的规定,应当包括算法证据的采纳标准和采信标准、证据调取、证明力标准等内容。同时,通过算法的人工智能技术和机器学习,有利于避免证明评价的主观性,实现基于算法证据的证明力评价模式更新。例如,杭州互联网法院利用区块链存证技术审理的第一案,对区块链算法证据的效力认定以及审查规则即是一种协调整合规则的综合适用。该案借用了区块链算法技术本身具有的分布式存储,通过不可篡改的特性和智能算法模型增强电子数据的证明力。法院在综合审查过程中,着重审查区块链等证据材料的真实性。一方面,审查判断区块链技术存证的电子证据是否真实;另一方面,整合审查区块链算法所形成的证据材料与待证事实的相关性。最终,运用区块链技术、算法证据对侵权行为结果事实进行具有可靠性的抓取,通过上链固证规范、算法技术审查、下链取证方式的合法等协调整合角度,来审查该证据材料的证据能力大小。此外,在对算法证据进行证据能力审查后,再考量其证明力大小的问题。算法证据的证明力规则构建,如同区块链证据一样,缘于哈希校验、时间锁定与节点印证等技术特点,在真实性方面极大增强的基础上,呈现出入链后数据真实性有保障、入链前数据真实性可优化两大定律。因此,需要充分体现算法证据的自动化优势、时间上的瞬时性和不可篡改性,提升它的证明力和数据信息的可靠性。在算法证据关联性审查时,可以集中于进入算法前的存证前置程序上,需要确保输入算法前的规范性,一旦将证据输入至计算机算法中,其关联性就基本上得到了保障。
5.算法证据的鉴定与推定规则
如前所述,算法技术权力的异化和场景欺骗,可能导致算法证据的不可靠性,因此可以通过算法鉴定的方式对算法证据形成过程进行全过程监督,通过算法“白盒”等功能评价方法对算法行为人的意志进行判断,从而对算法证据实现鉴真。不论是基于海量数据库比对证据还是基于算法模型证据,算法不可避免地要作出判断,包括什么信息(或哪类信息)应被纳入输出的结果,算法的输出结果本质上更接近对信息的重新汇聚和排列。可见,算法在证据应用场景下是一种方法论意义上的工具。算法证据是一种基于人造技术而形成的证据材料,算法是为了完成特定步骤的有限程序,这就决定了算法如何完成从输入到输出的任务,并由人类规定,算法证据的合理使用必须通过鉴定方式来实现。具体到作为大数据证据的算法证据,海量的电子数据所蕴含的信息无法直接显现,必须将其排列、组合之后,才能通过结构化的电子数据显示证据信息。因此,算法在其中体现为代替人类自动化处理电子数据的工具,所形成的算法证据需要对自动化计算机技术进行鉴定或者引进专家证人进行审查判断。在实践中可以尝试将完整性校验、可信时间戳、数字签名、区块链存证等信息技术应用于算法证据的电子数据鉴真。算法证据的鉴真,与区块链证据一样,存在载体与内容两分意义上的“双阶鉴真”。即对算法证据的载体鉴真,往往通过区块链技术的反篡改技术,对案件中电子证据的移送、计算、保管提供技术真实性担保,实现对算法证据“技术独特性”的证明;而对算法证据的内容鉴真,则主要涉及大数据信息内容的收集和提取,通过“保管链条”的鉴真方法进行实质性判定。
同时,在算法技术难以证明和鉴定的情况下,可以通过算法推定规则构建来弥补缺陷。算法推定则是依据算法所包含的时间、范围、主体、数据、事件等特定技术规则与行为人意志的伴生关系或常态联系而设立的司法证明规则。由于算法在人类设定的目标范围内,起到了替代人类的作用。在基于海量数据库比对证据中,利用同一认定原理建立比对特征模型,在很大程度上是由机器算法给出实质判断的,这在很大程度上取代了传统意义上的鉴定形式。在基于算法模型的大数据证据中,利用危害行为所映射的资金数据规律建立资金数据模型,进而实现推定的效果。例如,算法的技术规则具有以下情形时,可以推定网络平台对相应的具体犯罪行为是明知的:①针对某类非法数据进行技术规则回应,如通过设立不良信息过滤系统等进行管控;②针对某类非法数据进行过多次技术处置,如通过指令日志发现曾对非法数据进行专门分析。
结语
证据制度与科学技术的发展存在着同频同振的关系。从神示证据、法定证据、自由心证证据,再到智能法学时代的大数据证据,人类对事实的还原能力不断提高。随着不同场景下的部分决策与行为被让渡给算法,我们进入了“算法统治的时代”。技术的极速进步和法律的保守步伐的碰撞,使新的问题不可避免地出现。由于对算法技术缺乏有效规制,由算法权力所形成的算法证据,往往是一种独立的决策机制,会产生司法专断意义上的不公平性;同时,算法计算过程的不公开性和非解释性将可能会对特定场域的群体造成歧视,进而形成了所谓的“算法歧视”问题。技术不能脱离现实应用,科技的应用离不开法律的监管。算法在证据场景的应用可能会导致事实认定偏差的风险,可能会对诉讼程序的公平理念、程序正义等核心价值产生巨大的冲击。
算法并不具有预设的被信任度,只有将算法转译为证据法学的概念,在法律框架下对算法证据予以规制,算法生成的证据才会可靠地彰显证据功用和价值。算法证据是将海量的案件信息数据进行计算整合,并形成结构化、信息化的案件场景自动解读与自动推理结果的材料。算法证据是大数据证据的一种类型,本质上是电子数据,但它又不完全是大数据证据。在法律价值、司法理性与技术治理的交互融合背景下,需要明确算法证据规则适用的权利保障底线原则、场景约束原则和风险治理原则。最终,在算法证据适用规则的具体构建过程中,充分提升其技术治理整体性效能,通过算法自动化决策叠加性优势,合理设置证据审查和判断依据,促进“算法向善”、为司法所用。
责任编辑:吕 万
------------------------------------
公众号学生编辑:陈传文
初审:陈尔博、郜文风
审核:吕 万
审核发布:黄 瑶
《地方立法研究》2022年第3期目录与摘要
郑飞:漂向何方:数字时代证据法的挑战与变革
熊晓彪:司法事实认定的数据化转型
《地方立法研究》投稿网站:
https://dflf.cbpt.cnki.net/