黄健:刑事司法证明中大数据相关关系的局限作用论
一、问题的提出
全本非样本、混杂性非精确性、相关关系非因果关系的三大思维,奠定了大数据的巨大变革潜力。“大数据几乎会改变我们对任何事情的观点与做法,包括法律实践的方式方法。”而在最具外显性的应用维度,依托大数据相关关系获取的知识增量,得以“帮助我们更好地了解这个世界”。“在大数据时代,我们能够从大量的数据中直接找到答案,即使不知道原因。”沃尔玛基于啤酒与尿不湿、飓风与蛋挞间的相关关系以增加销量的例证,表明大数据相关关系已被成功用于商业决策。回归到本文论题,刑事司法证明常面临证据的短缺,从而导致事实证成时的信息不足。既然大数据相关关系具有提供新规律、新见解的应用前景,那么,其能否应用于刑事司法证明、可否用以认定案件事实等问题,都亟待理论回应。
在“推动大数据、人工智能等科技创新成果同司法工作深度融合”、智慧司法探索深入事实认定的背景下,“大数据证据”“大数据证明”等超前于实践的语词革新与理论探讨已然存在。现有大数据证据论,将基于海量数据库的信息比对、涉案海量数据的算法分析视作大数据证据实践。然而,在此前信息化侦查中,同样存在借助系统实现嫌疑人自动比对的技术实践;从规模不断扩张的数据中获取信息亦是电子取证领域的永恒话题。也就是说,当前的大数据证据研究,仅关注了大数据从海量混杂数据中获取固有信息的工具价值,而少有涉及大数据的应用价值——基于相关关系获取增值信息,能否与证据实践结合的探索。已有大数据证明论,虽对大数据相关关系有所提及,但大多是将相关关系取代因果关系的论断,直接迁移至司法证明场域,并提出大数据时代刑事侦查因果逻辑正在向相关逻辑转变,“证据与待证事实间的逻辑联系不再是文字性论证的因果关系,而变成基于统计学、概率论的相关关系”等宏观主张。
由此可见,对于大数据所揭示出的相关关系,能否在刑事司法证明中发挥作用、如何发挥作用等具体问题,现有研究少有涉及。本文意对此展开初步探讨,考虑到实践样本的不足,为避免言之无物,本文将在现有研究呈现的“技术中心论”“技术乐观主义”基础上,兼采“技术现实主义”,即承认技术具有变革性,但反对把技术发展与社会进步间的关系简单化。同时,从现有刑事证据与证明理论及制度出发,分析大数据相关关系适用于刑事司法证明的可能样态,并着力回归已有规范及类似实践,对大数据相关关系可能发挥作用的空间加以理性审视与评估。
二、大数据相关关系适用于刑事司法证明的可能样态
若要对大数据相关关系在刑事司法证明中的作用进行探讨,首先应回答前者可能以何种样态介入后者的前提性问题。司法证明的展开除以证据为根基外,尚须凭借证据外元素——人类一般经验知识,以实现证据材料与待证事实的黏合。大数据相关关系的归纳逻辑本质及主观心理建构进路,似乎表明其可作为近似于一般经验知识的证据外元素介入司法证明;在更为具体且更具规范意义的维度上,大数据相关关系还可以在司法证明中呈现为意见证据样态。
(一)作为证据外元素介入刑事司法证明
以休谟(Hume)经验主义立场上的因果关系论为中介,对大数据相关关系展开进一步剖析,可以发现:大数据呈现的相关关系与作为司法证明证据外元素的一般经验知识存在一定相似之处。
1.司法证明中作为证据外元素的一般经验知识
刑事诉讼语境下,司法证明概念的界定常与诉讼构造、流程、证明责任、证明标准等元素相关联,故呈现多样性与复杂性。就其自然语义而言,就是指运用证据以明确、说明或表明案件事实的动态过程。但在大多数情况下,仅凭证据并不能证成案件事实。“任何证据只有在我们愿意相信某项普遍规则时才能证明某些事情。”也就是说,在证据及其所欲达致的事实命题间尚存在关键且易被忽视的证据外元素。域外证据分析论者将此种证据外元素称为“概括”抑或“概称陈述”(generalization),并将其比喻为粘合证据材料与待证事实的胶水。我国证据法学者亦对概称陈述予以关注及推介,另有学者从功能视角出发,将作为证据推理依据的概称陈述,本土化命名为“理据”。荷兰学者基于叙事理论及认知心理学,提出了司法事实认定的“锚定叙事理论”(anchored narratives)。案件故事版本,需要通过故事要素逐级分解形成的“锚链”,最终锚定在少有争议的普遍规则上。这些普遍规则通常是生活中的常识性事实,在该理论中被称为“锚点”。下文将使用“一般经验知识”指称前述极具个性化的语词表述,“经验知识”强调基于亲身的观察及感知,而非纯粹的理论思辨及推演;“一般”则强调此类知识的共识性,即在人的一般理性上得以产生共鸣。诚然,“一般经验知识”也并非通用概念,但至少可以抽象出司法证明证据外元素的些许特征。以最高人民检察院指导性案例42号齐某强奸、猥亵儿童案为例,在案直接证据仅为被害人陈述,且陈述间存在矛盾,被告人不认罪,无物证,被害人家长及同学等证言多为传来证据。最高人民法院在认定案件事实时,除前述证据外,还明确援用了一般经验知识,例如:被害人家长与被告人此前不存在矛盾,案发过程自然,可排除诬告可能;被害人年龄小,前后陈述存在细节差异和模糊属正常现象,也符合被害人记忆特征。
一般经验知识还表现为基于一定盖然性事实的归纳,并以裁判者心理习惯的形式发挥着难以准确评估的作用。首先,一般经验知识的形成,表现为从具有一定盖然性事件中找寻一般经验的归纳逻辑,由此奠定了其非必然性、可废止性。也就是说,即便某一经验知识在此前的案件事实认定中极为可靠,在未来的案件中也并非必然适用。例如,有学者在相关论著中提及了《圣经》中所罗门断案,国王之所以能智断“谁是孩子生母”的事实,是因为他援用了“虎毒不食子”的经验知识。然而,这一看似可靠的经验法则,却可能在“武则天女儿之死”的历史谜案中失灵。而后,司法证明中的一般经验知识选择,受裁判主体心理习惯支配,由此导致事实认定的非理性,并难以准确评估。仍以前述武则天谜案为例,如果裁判者仍然选择“虎毒不食子”的经验法则,则可认定武则天之女为王皇后所杀,高宗废后理所应当;而当裁判者选择“无毒不丈夫”的经验法则时,则可能得出武则天为设计陷害王皇后,而自己杀死亲生女儿的相反结论。
2.大数据相关关系与一般经验知识的部分契合
大数据相关关系是运用大数据技术,从海量混杂数据中获取的,若干因素间的或然性关系,通常以数理形式呈现。大数据相关关系的归纳逻辑本质及主观心理建构进路,与司法证明中“一般经验知识”的部分特征相契合,这为大数据相关关系作为证据外元素介入刑事司法证明提供了可能。刑事诉讼中,诸如美国基于智能电表数据,发掘异常用电模式与室内种植大麻的相关关系,以及我国基于交易数据,发掘资金流转模型同特定互联网金融犯罪间相关关系的例证,已被广为推介,但尚缺乏进一步剖析。大数据相关关系的探讨,难以逾越与传统因果关系的比较。相关关系与因果关系的对立,常被通俗地解读为追求“是什么”与“为什么”的程度差异,其哲学本质乃经验论与唯理论的不同主张。由此,在基于经验进路解读因果关系时,相关关系与因果关系的对立得以调和,甚至二者呈现可替代性。有观点极具启发性地指出:当基于休谟心理习惯论对因果关系进行解构时,大数据方法发现的相关关系得以替代因果关系。
以休谟的因果关系论为中介,则可对大数据相关关系的本质做进一步探讨。18世纪,英国哲学家休谟基于经验主义立场考察了因果关系问题,他认为,对经验关联现象的重复观察是因果概念的唯一来源。因果判断,乃至关于自然界的一切知识,都是基于人类对重复性关联现象的归纳,而这种归纳是基于有限经验的非必然性归纳,无论对两个事物前后重复观察多少次,也无法肯定未来它们是否还会前后伴生。同时,休谟主张因果推理不是理性的,而是心理习惯的。“休谟所理解的‘习惯’乃是一种非理性的心理作用,是一种本能的或自然的倾向。”因与果是两个知觉对象,如果只孤立观察这两个对象本身,并不能发现任一对象对另一对象的涵摄。只有当观察到两个知觉对象的恒常联合(constant conjunction),才会产生因果续起、伴生的心理习惯。诚然,休谟的因果关系论仅是西方哲学的代表观点之一,康德(Kant)等人亦对其提出了批判乃至改造意见。本文无意裹足于深奥的哲学思辨,仅是基于大数据相关关系与作为心理习惯的因果关系具有相似性的已有论断,进一步挖掘大数据相关关系依托归纳逻辑,并呈现为主观心理习惯的本质特征。
大数据相关关系的形成主要呈现为归纳推理逻辑。宏观而论,大数据以数据驱动的相关性认知取代理论驱动的传统研究范式,呈现技术推进的“新经验主义”,它再度突显了培根等人推崇的归纳推理的重要性,彻底贯彻依靠实证经验的归纳,而放弃任何演绎形式的理论思辨。更为具体地,大数据分析及其应用虽存在多种方式,但其机理仍是从大量数据样本中推断总体情况,以获知的关联关系推断对未知情况的适用,即归纳推理。所谓事物间关联关系的发现及其预测作用,就是基于统计方法,挖掘海量数据中符合特定支持度和置信度的关联规则,并推断该规则在未来时空“普适”,即由特殊到一般的归纳法。从对立面视之,大数据相关性分析结论无法达到演绎推理要求的前提必然支持结论的绝对确定性。“大数据分析的量化进路,使其丧失了原有的必然性。”大数据的多种算法,都是对不确定性的量化,具体到大数据分析中的统计相关,其以“概率因”呈现两事物间的引起关系。当A出现时B出现的概率大于A不出现时B出现的概率时,可说明A是B的概率因。以介于0-1之间的概率值表征两事物间的相关关系,自始不具有对必然性的追求。“大数据技术的逻辑是归纳,其结果不必然为真。”
大数据相关关系的形成,亦表现为基于经验的主观心理建构。相较于物质模型、理想模型、理论模型、数学模型的传统分类,大数据模型无物质形式、无抽象过程、无理论介入,亦非探寻所研问题与数学结构间的对应关系。因此,大数据的模型方法,与传统科学模型方法均不相同,是一种新型的模型方法,更多地体现为一种经验模型。同时,大数据相关性认知表现为基于前述经验模型的主观心理建构。大数据经验模型以量化、概率化的方式度量事物间的恒常联系,并且能够在在最大程度上把与某一事物相关的各种可能项予以罗列,由主体直接进行倾向性选择。由此,人们发掘并运用的大数据相关性规律,与其说是被认知的对象,不如说是主动建构的结果。
综上,大数据相关关系与一般经验知识在形成机制上存在部分相似性,这似乎可以支持前者能作为近似于后者的证据外元素介入刑事司法证明的论断。然而,尚需考虑的是,大数据相关关系的形成在很大程度上依赖于数据与算法,这与完全依靠人类理性的一般经验知识大为不同。后文将对此展开进一步论述,以更为全面地思考大数据相关关系究竟能否用作司法证明的证据外元素,并发挥相应的逻辑黏合作用。
(二)作为意见证据介入刑事司法证明
除可能被用作近似于一般经验知识的证据外元素外,大数据相关关系尚可以“意见证据”形式介入刑事司法证明,并发挥更为具体且更具规范意义的事实认定作用。
1.算法分析与人类知识交互的意见性结论
大数据相关关系的发掘,是算法分析与人类专门知识共同作用的结果,常以意见、见解、结论等形式展现。大数据在基础数据维度很难被直接用作证据,从取证、举证、质证等证据运用环节进行观察,大量数据的直接运用均难以实现证明效果。即使被直接运用,亦会出现“数据倾倒”危机,即优势方向对方倾倒海量数据,致使阅卷不能、质证不能,从而强化己方优势。大数据在其应用维度方可与证据实践相结合。“运用大数据分析手段对信息进行处理,得出的报告、结论、意见在办案中发挥着越来越大的证明作用。”由此,相关学者在探讨“大数据证据”时,将其限定为“基于海量电子数据形成的分析结果或报告”。而经由海量混杂数据分析获得的事物间相关关系的意见、结论,自然可被视作应用维度大数据证据的典型样态。虽有观点指出,大数据分析主要依靠机器算法展开,但这一观点人为割裂了大数据算法与人类专门知识间的交互。在计算模式的选择、数据挖掘前的打标签、挖掘结果的审查修正等数据分析环节,均有人类专门知识参与的空间。即便通过不断迭代,前述过程均可完全交由算法运行,但最终结果的可视化,除借助当前的人机交互技术、数据起源追溯技术以实现外,一个最为简易的方法,就是借助专门知识的解读。不仅如此,在数据收集与分析过程中,人们总是希望分析尽量多的相关因素以对案件全面了解,而当我们将大数据分析用作证据时,必须对纷繁复杂的相关关系进行简化以得到有用的见解。这一对机器分析结果精简的过程必须由人类专家承担,而无法被机器替代。
当然,根据证据法基础理论,人类应基于其亲身感知而作证,意见性推论一般不得作为证据,但基于专门知识形成的意见除外。由此,依托算法分析与人类专门知识发掘的大数据相关关系,可以“意见证据”形态,发挥证明案件事实的关键作用。
2.可进一步划归科学证据范畴
在英美证据理论及制度下,有关大数据相关关系的意见性结论,可进一步划归科学证据范畴。英美意见证据规则,进一步将专家证人(expert witness)的意见性证言区分为科学性的(scientific)、技能性的(technical),以及其他专门知识性的(other specialized knowledge)。若干大数据证据论均谈及了“道伯特”这一美国科学证据采纳标准的里程碑式案例及由其产生的道伯特规则。有学者更是直接主张大数据证据就是一种新兴的科学证据。究竟何谓科学证据,学界尚不能给出一致认可的规范表述。这是因为,英美法系并不纠结于对科学证据的概念界定,而是更为实用地关注科学证据所包含的具体类别。基于前述科学、技能与其他专门知识的三分法,科学知识强调通过专业教育与严格训练获得,而科学之外的技能及其他专门知识强调工作技艺乃至生活经验属性。用以发掘相关关系的大数据分析技术显属科学范畴。有专家指出,大数据在自身维度就是数据科学。基于统计学、机器学习、数据可视化等基础理论展开的大数据研究趋于融合,进而产生了一门革新性科学——数据科学。因此,一个更为严谨的论断是对海量数据进行分析的需求催生并依托于数据科学。数据科学至少应包括基础理论、数据加工、数据计算、数据管理、数据分析、数据产品开发等内容元素,具有明显的专业性。以数据分析这一核心元素为例,在实践操作层面,会将统计学常用的R语言与分布式系统基础架构Hadooop集成,发挥二者的优势以获得强大的深度分析能力。若要开展数据科学的理论研究与实践应用,则必须通过专业教育与训练,培养集理论、实践精神于一身的数据科学家。显然,数据科学属科学范畴,依托数据科学所发掘的大数据相关关系,自然可划归科学证据范畴。
3.在我国具备准鉴定意见地位
在我国,意见证据所对应的具体形式为鉴定意见,而有关大数据相关关系的结论性意见,并不属于全国统一管理的“四大类”鉴定范围,依据现有司法解释,其具有“准鉴定意见”的证据性质与地位。意见证据、科学证据等规则及理论源起于英美,在我国,依托专门知识所形成的意见性结论被称为鉴定意见。对于鉴定意见的审查认定主要关注其关联性、实质及形式上的合法性,以及检材的验真。依现行司法鉴定管理规定,法医类、物证类、声像资料类、环境损害类司法鉴定实行全国统一的审核登记管理制度。其中,前三大类司法鉴定具有较长的实践历史,所依据专门知识的科学可靠性也被广为认可;新增的环境损害类鉴定,因其经历了司法部商请最高人民法院、最高人民检察院以进入统一审核登记管理范围的程序,所以能对其背后专业知识的可靠性予以一定程度的背书。然而,除“四大类”鉴定外,诉讼实践中还存在其他各种各样需要依托专门知识予以解决的专门性问题。根据《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》(法释〔2021〕1号)第100条规定:“因无鉴定机构,或者根据法律、司法解释的规定,指派、聘请有专门知识的人就案件的专门性问题出具的报告,可以作为证据使用。对前款规定的报告的审查与认定,参照适用本节的有关规定。”由此,包括大数据相关关系结论性意见在内的“其他类鉴定”,具有了“准鉴定意见”的证据定位。
三、大数据相关关系适用于刑事司法证明的约束机制
从形式上看,大数据相关关系与一般经验知识存在部分相似;基于大数据相关关系的意见性结论又可归入科学证据、准鉴定意见范畴。由表及里,当进一步考虑大数据相关关系介入刑事司法证明的规范性问题时,从现有证据理论及制度出发,可以发现:若大数据相关关系被用作近似于一般经验知识的证据外元素,英美道德约束机制与我国释法说理公开机制,尚不能充分发挥控制作用;而当被用作意见证据时,大数据相关关系应受科学可靠性标准约束,现有以实证检验加同行评议的标准体系,在适用于大数据算法评估时,也难以得出确定性结论。
(一)用作证据外元素时的约束机制及其局限
大数据相关关系同一般经验知识在归纳逻辑、主观心理建构维度的契合,使其在作为证据外元素介入刑事司法证明时,同样会引发事实认定的盖然性与不确定性。英美在消解此种不确定性忧虑时,具有道德约束传统,我国则采用释法说理公开机制。然而,在应对基于算法分析形成的大数据相关关系时,道德约束与释法说理公开机制均具有明显的局限性。
1.英美道德约束机制
英美意图通过系列道德性要求,对证据外元素引发的事实认定盖然性与不确定性做出有效控制。随着对证据推理、司法证明内在机理的认识深入,由追求事实认定精确性到肯认其模糊性,是“后现代证据理念”的重要转变之一。然而,这并不意味着对“认真对待事实”的放弃,在意识到认识论不足以支撑司法事实认定时,英美证据法论者提出了道德准则补强的系列主张,即:“认识论(epistemology)罢手处,道德(morality)接手。”这里的“道德”一词具有多义性与模糊性,但在英美证据论著中具有经典的历史传承性。在司法证明标准维度,存在“道德确证性”(moral certainty)表述,其可被近似视为“最高程度的盖然性”(the highest degree of probability),显然,事实得以证成的盖然性越高,陪审团就会在道德上更心安。就其词源而言,可追溯至17世纪早期,对证据审查判断的关注被概括为“良心上的满意”(satisfied conscience)或“信念上的满意”(satisfied belief),以引起宣誓就职的陪审员在道德和宗教义务上的共鸣。后续论者将事实认定者的道德义务进一步具体化,即必须从被审判者的立场,重视尊重和关注的价值。经由证据推理、事实认定所形成的判决必须呈现足够的尊重与关注。具体实践中,事实认定是裁判者的深思熟虑,是严格控制下的心理活动。对事实认定道德标准的把控,可基于外部规则的约束与内在身份的驱动。外部规则的例证之一即美国证据可采性规则,此类规则基于道德因素考量,人为限制并约束了天然的逻辑相关性,例如:传闻证据规则出于对被告对质权的保障,人为阻断了其与待证事实间的逻辑相关;品格证据规则基于对被告人格、无罪推定、知情权、误导性、平等保护等道德指标的综合考量,刻意擦除了被告特有品格与当前犯罪具有相关性的逻辑思维。而内在身份约束则是事实认定者道德行为体(moral agent)的定位,也即事实认定者能够且应当对其决策独立承担责任。无论一个决定如何做出,它都是一个权力运行的政治道德行为,事实认定者需要承担责任。在并无错案追究制,且存在若干司法责任豁免的西方国家,无过错的事实认定错误虽不会令事实认定者承担法律责任,但至少会使其受到良心谴责。“意识到把无辜之人送进监狱对于陪审员来说是痛苦的,并且对于法官的职业生涯及声誉也是不利的。”
当大数据相关关系试图作为近似于一般经验知识的证据外元素介入刑事司法证明时,人们意图以道德控制事实认定可靠性的机制将呈现局限性。这是因为,人们难以对基于数据、算法形成的大数据相关关系施加道德控制;与此同时,数据、算法的介入亦会消解道德行为体的内在驱动力。
首先,人们难以对经由数据、算法产生的结果施加道德控制。基于知识鸿沟,事实认定者难以预测数据、算法产生的行为结果,对其决策逻辑更是不能理解。算法通过对海量数据的处理,基于数理相关性得出不确定的归纳知识。虽然人们期望在数据和归纳知识之间建立某种连接,使前者成为后者的可靠依据,但这种连接在很多情况下不仅是不透明的,甚至还是难以理解的。即便大数据相关关系最终依事实认定者心理认知而选择适用,但此类相关关系大多呈现超越已有知识的样态,且处于动态变化的进程之中,无法被准确地控制与认知,遑论对其进行更为复杂的道德审视。当然,早有相关伦理研究提出了“算法从善”的主张,即将道德准则嵌入算法设计之中,但当面对刑事司法的具体应用场景时,能否将普适的道德指标及规则有效转化为算法可用的变量与代码,是算法专家、伦理专家、法律专家等共同面对的难题。早在20世纪70年代,美国“新证据学派”的概率论者,在贝叶斯定理这一数学算法框架内,探讨基于特征证据实现人身同一认定的概率运算时,就曾指出:诸如无罪推定、内心确信、人性公正等道德准则,将会在数学算法运行中消失或牺牲。更令人沮丧的是,算法运行在难以有效兼容道德准则的同时,却常常受到偏见、歧视等非道德裹挟。域外刑事司法实践,业已呈现因算法引发的种族歧视、性别歧视等隐忧。
而后,算法的介入大大削弱了“道德行为体”身份的内在约束作用。“数据主义司法观”的一个潜在结果是导致司法决策由“以法官为中心”转向“以数据算法为中心”,“司法智识”不再为法官所独享。这种数据、算法对于司法权威的威胁,还可以在另一维度视作对裁判者道德责任的分担。当引入基于大数据分析产生的相关关系后,裁判者即便形成错判,也可能会以“产生错误的并非我,而是算法”为托辞,从而消解道德责任体的内在驱动力。不仅如此,算法还具有成为极佳“替罪羊”的特质。从算法本身来看,通过机器学习、深度学习,算法得以自主调整,从而进一步增加其变动性,使算法溯因变得困难,由此形成“责任鸿沟”(responsibility gap)。而对大众心理而言,根据实验心理学研究,相较于人类错误,人们对算法错误的道德愤怒程度更低。造成“算法的愤怒不足”(algorithmic outrage deficit)的一个潜在原因,即算法被认为是缺乏思维的,并且与人类相比,其更不容易受到偏见的驱使。当行为体是一种算法时,人们对不公正的防御可能会降低,这使得算法错误更容易被忽视、并更少被反对。
2.我国释法说理公开机制
释法说理公开具有控制一般经验知识选择与适用的制度功能。相较于英美法系国家以抽象道德要求约束事实认定的机制,大陆法系多采更具操作性的心证公开,即裁判者将其认定事实、适用法律等逻辑思维公之于众。这一公开在消除司法专断的同时,又保障了裁判者的深思熟虑,进而对事实认定可靠性、准确性予以背书。在我国,裁判文书的释法说理加之依法上网,是“心证公开”的具体制度。在刑事诉讼场域,这一制度组合能够将裁判者心证曝光在检察官、辩护人、上级法院等职业群体面前,以及社会公众的视野中,以借助人类理性共识,对裁判者心证过程予以约束及监督。裁判文书网上公布是心证公开形式要件,而完善释法说理才是实质性要求。最高人民法院印发的《关于加强和规范裁判文书释法说理的指导意见》(法发〔2018〕10号,以下简称“《意见》”)第3条规定:“要围绕证据审查判断、事实认定、法律适用进行说理,反映推理过程,做到层次分明。”《意见》第4条进一步规定:“裁判文书中对证据的认定,应当……根据证据规则,运用逻辑推理和经验法则……”;第13条又规定,法官可以运用公理、情理、经验法则等论证裁判理由,以提高裁判结论的正当性和可接受性。可见,就本文所论作为司法证明证据外元素的一般经验知识,应当是裁判文书释法说理的重要元素。不仅如此,相较于证据合法性审查、实体法演绎适用等专业化说理,一般经验知识的选取与适用,是法官职业法律意识同社会群众法律意识的最好接口。由此,一般经验知识的运用能够被最为广泛的同等人理性所约束,从而消解其不确定性,并提升其可靠性。从统计学上讲,合格的认同者人数越多,盖然性越大,结果的可信度也越高。然而,我国刑事裁判文书存在证据分析、事实认定说理薄弱的普遍问题,遑论更为微观的一般经验知识了。从功能机制上讲,这恰恰表明释法说理公开能够对裁判者主观心理活动造成有效约束。只是由于我国检察机关的强势监督、舆论的非理性监督、当事人闹访缠讼、司法责任制的政策性扭曲等原因,造成法官防御性的“含糊其辞”。裁判文书释法说理公开功能的充分发挥,是兼顾司法责任制改革、司法独立与司法民主等要素的系统性工程,当然这并非本文重点。
当援用大数据相关关系作为证据外元素以发挥逻辑黏合作用时,即便在形式上满足了公开要件,但也仅能发挥消解事实认定不确定性的局限作用。诚如上文所述,裁判者在依托经由大数据算法形成的相关关系展开证据推理时,能够将其所承受的道德负担转嫁于算法,加之算法溯因困难所形成的“责任鸿沟”,以及社会公众之于算法的“愤怒不足”,裁判者得以将其适用的大数据相关关系公之于众,但同时可能并不会像仅由其个人决策时那么深思熟虑。更为重要的是,社会公众在面对公开的大数据相关关系时,并不具备同等人理性的基础,从而使心证公开的制度功能无法发挥作用。裁判者公开其选择适用的一般经验知识,之所以能够被广泛监督,甚至被过度干预,是因为社会公众与裁判者,在一般生活经验维度存在同等人理性基础,也即社会公众对于裁判者选择适用的一般经验知识,并不存在认识与评价的鸿沟。然而,当以大数据相关关系作为近似于一般经验知识的证据外元素时,前述同等人理性消失殆尽。大数据相关性认知的产生基础在于算法与大量结构化、半结构化、乃至非结构化的混杂数据,与人类一般经验知识的基础素材及形成路径大相径庭,从而导致难以逾越的认识论鸿沟。未来,裁判者虽可能凭借大数据相关关系展开司法证明,但就事实认定的裁判说理势必会沦为公众无法理解的“黑箱”。基于事实认定的司法裁判亦可能成为孤立的彼岸世界。
(二)用作意见性证据时的约束机制及其局限
大数据相关关系用作意见性证据时,属科学证据范畴,作为其产生基础的大数据算法分析应接受科学可靠性标准约束。在我国,基于大数据相关关系产生的意见证据,具有“准鉴定意见”的性质与地位。我国虽未言明对鉴定所依技术方法科学可靠性进行审查,但是“准鉴定意见”大多是对新兴诉讼专门问题的鉴定,且由于不受国家统一管理、地方立法及行业协会管理不足,由此,更应对“准鉴定意见”形成的科学可靠性加以约束。
1.道伯特科学可靠性标准体系
我国若干大数据证据论者,均对美国科学证据采纳标准的道伯特规则予以借鉴。美国学者同样主张,法院应受道伯特规则或其他类似科学调查方法约束,以审查在侦查和起诉过程中运用大数据工具的有效性。根据道伯特案判决,当法官面对专家提出的科学性证言时,应该判断的一个关键问题为该科学理论或技术是否可被验证;另一个相关的考虑即该理论或技术是否曾接受同行评议并且发表。此外,法庭通常会考虑该技术或理论已知的或是潜在的错误率。最后,还需要考虑相关科学群体就该理论或技术明确表示的可接受程度。前述标准体系中,可被验证性加之错误率就是要开展实证检验,且实证检验是最为重要的因素,其他判断因素是实证因素的补充。对道伯特规则的进一步分析可发现,该标准体系在设立之初,就承受着持续的质疑与挑战。有学者主张:道伯特规则并没有提升刑事诉讼中科学性法庭证据的运用,这一制度失灵可归咎于道伯特无法要求并合理评估实证检验这一基础研究。实践中,一些实证检验存在设计缺陷,一个最为极端的检验方法即“封闭集合设计”(closed-set design),也就是说任一争议样本均可在集合中找到正确来源,这一设计使得假阳性率和不确定率被低估了100倍以上。除实证检验要素外,其他判断要素呈解释性,意在实现对道伯特规则的定性补充。真正的同行评审就是科学进步本身的运作结构。以更广阔的视角视之,科学期刊上的发表文献,是将现代科学主张传播给全球科学家受众最为鲜明和盛行的媒介。然而,有学者指出,同行评议用作质量控制机制具有自身的缺陷,其作用的发挥不仅要求主张者、作者保持正直、诚实,同样也对评议者有着相同的要求。与此同时,科学共同体也具有社会性、政治性,即使面对最主要竞争对手的主张、作品,评议同行也大都会高抬贵手;另外,诸如作者的政治力量因素,可对其主张的可接受性产生重要影响。由此,基于个人利益的偏向、评判不一致,甚至是阻碍科学革新,已成为对同行评议等机制的常态质疑。
尽管如此,在尚无更为完善的科学证据标准出现前,对于意见证据中科学方法可靠性的判断说理,均不能绕过道伯特规则。也正是如此,下文意图借鉴道伯特规则建立的标准体系,对大数据算法分析的科学可靠性做初步探讨。
2.借鉴道伯特标准的有限考察
当意在考察大数据算法分析的科学可靠性时,道伯特标准体系并不能充分发挥作用。大数据算法分析结果能否被实证检验是首要问题。大数据算法的运行就是高速处理、分析数据,并以相关度的方式呈现规律及新知识。然而,这些大量数据处理、分析是超越人类计算能力甚至是传统机器处理能力的,因此,大数据算法是否遍历了全部数据并完整获取了所需数据是无法人为检验的,只得依赖算法的多次运行,或是不同算法的交叉验证,但均不能起到严格实证检验的效果。不仅如此,大数据相关关系常呈现出人类所不熟悉的样态,其正确与否也不能获得直观判断。即便是人脸识别、车辆比对等能够直观判断正确与否的算法应用,其也多为在算法研发阶段运用训练数据的实证检验,当其面对未知世界纷繁复杂的真实情况时,其结果不得而知。这种实验室内的实证检验自然会不自觉地落入上述“封闭集合设计”的方法缺陷之中。至于同行评议、发表、接受程度等补充标准而言,毋庸置疑,大数据算法研究已成为绝对热点,相关文献也如雨后春笋般涌现,大数据算法也获得了普遍的接受。然而,出于算法的专利属性、财产属性,研发者自然不会对其核心内容进行披露,由此引发前述大量发表、广泛接受究竟出自业界何种审视程度的疑问。现有同行评议大都基于介绍性内容做出,并不涉及算法实质原理。
由此可见,以实证检验为核心,加之同行评议的道伯特标准体系,并不能有效适用于大数据算法分析,因而也不能得出大数据算法分析是否具备科学可靠性的明确结论。一些有关算法偏见的轶事证据,引发了对大数据算法分析科学可靠性的质疑,这是因为,算法偏见的结局之一就是对特定群体产生不准确的判断。美国国家标准与技术研究所的一项研究发现,面部识别算法适用于黑人群体时产生更高的假阳性率,有时是白人群体的100倍。也有学者研究指出,COMPAS这一自动评估个人危险性以作出刑事司法决策的算法,存在着系统性的性别偏见,将女性过高划归于高风险组。在我国,算法偏见最广为人知的实例即“大数据杀熟”,《电子商务法》第18条甚至专门对此做出立法规制。至于我国司法实践领域,虽算法偏见问题常被提及,但鲜见具体实例的呈现。但这并不意味我国未来司法实践能免受算法偏见影响。基于“偏见进、偏见出”的原理,当用以训练大数据算法的基础数据存在错误或偏见时,其所形成之算法自然呈现相应缺陷。未来,可被用作训练数据的司法裁判文书存在大量问题,如类案数量统计错误、分类错误、涉案金额数字书写错误、法律条款援引错误、法律关系定性错误等;不仅如此,户籍歧视、地域歧视、年龄歧视、性别歧视、前科劣迹歧视以及公职身份优待等不公行为存在于量刑裁量过程。
综上,借助道伯特标准,并不能对大数据算法分析的科学可靠性加以明确判断。不仅如此,算法偏见的常态共识,使人们在面对大数据算法基础上的意见证据时,产生质疑其可靠性的倾向。
四、大数据相关关系适用于刑事司法证明的局限作用
尽管大数据相关关系具有产生新见解、新知识的技术应用前景,但当其意图作为近似于一般经验知识的证据外元素,发挥为司法证明提供逻辑黏合的作用时,则难以在规范论视角下被有效约束;即便存在依托技术手段增强自身可控性并降低偏见的“技术自治”主张,但仍面临技术瓶颈与伦理隐忧。而将大数据相关关系用作意见证据,则实属新兴技术驱动下的证据革新问题。既往类似实践表明,面对新兴技术驱动的证据,刑事司法实践通常会循序适用,并不会采“全有或全无”的绝对态度。
(一)难以发挥证据外元素的作用
前文已述,当意图将大数据相关关系用作一般经验知识,以发挥司法证明逻辑黏合作用时,现有关于一般经验知识选择与适用的约束机制存在局限。然而,有观点主张,可通过“技术自治”提高大数据相关关系形成及适用的可控性,并有效降低主观偏见。下文将对此观点展开探讨,并主张“技术自治”的进路仍具有较大局限性。有观点指出,大数据算法分析能够保障其结果形成的可控性并有效降低主观偏见。首先,“概率性的话题建模”(topic modeling)算法,能够同时评估整个数据集,并在不要求任何事前标准的情况下发现主题信息。这种算法运行“无目的”(aimless)工作,分析人员只需简单地明确所欲建模的话题数量,算法也只是输出对应数量的词语列表(word list)。这种算法分析首先体现出可控性,只要分析对象是同一数据库,不论分析者是谁,所形成的词语列表均具有可复制性。也就是说,语词列表上的任何分型或者话题结构,是基于文本整体的,而与他们的实际含义无关。在通过人类感官的非算法方法分析数据时,这种与含义无涉的分类法极有可能被牺牲,从而转为依托人类之于词语的主观理解进行分类。而后,话题建模能够通过扩张数据分析规模从而降低主观偏见,随着数据规模的增加,客观图景将更易出现。最后,除话题建模外,多项式逆回归实现了对能够产生稳定和有效结果的非常高元数据的逻辑回归分析,该方法已经被运用到市场影响、经济学和政治学当中。也有学者在法律领域运用多项式逆回归做了相关分析,在理论上,多项式逆回归可以分析法律文本,以实现将法律意见文本中的每一个语词均作为一个变量,考察各个变量之于司法结果的影响,从而有效地防止“忽视变量偏见”(omitted variable bias)。而对于一个法律判断是如何形成的,人工分析一般只考虑若干变量,诸如常用的法律用语,或者自己偏好的语词,这样就很有可能忽视重要的变量。
即便“技术自治”确实能够提高大数据相关关系形成的可靠性与可控性,但当考虑将大数据相关关系用作刑事司法证明的证据外元素,以发挥逻辑黏合作用的实践问题时,仍然面临难以逾越的技术障碍与伦理隐忧。首先,就大数据相关关系用作证据外元素并发挥逻辑黏合作用的可能性而言,在技术本身与司法证明传统上均存在阻力。一般经验知识的提炼及选择需要依靠人类极为复杂多元的“知识库”,而现有可被算法运用分析的数据,无论在数量还是种类维度均无法与人类知识库同日而语。当前,有关实体法适用、辅助量刑等相对程式化工作的智能算法探索仍面临技术难题,当面对更“无章可循”的证据推理、司法证明难题时,现有数据、算法可发挥的功用可能更显得捉襟见肘。与此同时,作为传统司法技艺的事实认定势必会与技术革新保持一定的独立性。即便假设大数据相关关系能够发挥与人类一般经验知识相同的证明作用,但仍应进一步探讨大数据相关关系应否被用作证据外元素的价值判断、伦理考量问题。当以大数据相关关系作为司法证明的逻辑起点或关键衔接时,案件事实认定将在很大程度上被数据、算法左右,裁判者不再位于事实认定舞台的中央。当然,诚如上述“技术自治”论主张,数据、算法介入后的事实认定虽然具备降低裁判者主观偏见的可能性,但是,即便大数据相关关系揭示规律的客观准确率高达99%,社会公众也很难接受“大数据算法会造成1%案件事实认定错误”的赤裸表述。
(二)仅能在特定目的下发挥意见证据作用
当以意见证据形态介入刑事司法证明时,大数据相关关系具备以知识增量补强证据短缺的应用前景,但同时,作为相关关系产生基础的大数据算法分析并不具备确定的科学可靠性。由此,面对以意见证据形式呈现的大数据相关关系时,司法实践既不应盲目接受,也不能武断拒绝。可借鉴英美证据的有限可采性规则及我国既往类似实践,探讨特定目的下大数据相关关系的有限适用问题。
1.英美证据的有限可采性与我国类似实践
英美证据可采性规则肇始于17世纪,早期呈现严格的全有或全无规则。及至19世纪,在认可完全排除证据合理性与倾向为事实认定者提供最大信息量的理念平衡下,有限可采性规则(limited admissibility)得以产生。美国《联邦证据规则》第105条规定:“如果法院认为证据针对某一方或某一目的可采,但对另一方或另一目的不可采,法院基于及时的申请,必须将证据限制在其适当范围内,并相应地指示陪审团。”可见,有限可采性规则是以目的为导向,人为联通或切断证据与某一实质问题间的关联性,其规则运行极为普遍,也反映出英美之于完全排除证据的慎重,只有当法官对某一证据实在不喜欢时,才会完全排除其可采性。我国并无有限可采性的典型证据规则,但确存在与之相类似的司法证明实践。例如,同步讯问录音录像只得被采用作为证明是否存在违法取供的证据,而不能被用作证明被告人供述内容的证据。又如,根据最高人民法院、最高人民检察院、公安部、国家安全部、司法部出台的《关于规范量刑程序若干问题的意见》(法发〔2020〕38号)第18条、《未成年人刑事检察工作指引(试行)》(高检发未检字〔2017〕1号)第28条等规定,未成年人社会调查报告在审前决策、量刑程序中可被采用,而能否在审判环节使用并无明确规定,考虑到其类似品格证据而易产生误导性,未成年人社会调查报告不应在审判程序及定罪过程中采用。再如,根据最高人民检察院批复,测谎鉴定结论可被采纳为辅助证据,即用来审查其他证据真实性,而不能被直接用作认定案件事实的证据。
英美证据有限可采性及我国类似实践,均反映出当立法者及司法者面对特定证据材料时,在全盘肯定与全部否定间的平衡考量。
2.大数据相关关系用作意见证据的有限可采性
在既往刑事证据实践中,有限可采性的证据制度框架,被用以规范科学可靠性尚未被证成的新兴证据的适用问题。国外学者曾以有限可采性框架分析科学技术推动下的强奸创伤综合征专家证言的可采性问题,有关应对极端压力产生应激反应创伤的专家证言,可被用于证明性行为发生是否存在“同意”情节的问题,但不能直接用于证明被告实施了强奸。我国学者也在测谎结论新兴且在其采用颇有争议时,尝试运用有限可采性理论予以分析,并主张对测谎结论的“简单排贬或完全推崇都是草率的”。已有学者主张以有限可采性规则限制大数据证据采用,其立论依据为大数据证据之于品格证据的相似性。下文将基于我国现有理论及制度,进一步探讨大数据相关关系用作意见证据时的有限可采性问题,也即基于海量数据算法分析产生的知识增量,可出于何种目的使用,以及证明哪些案件事实的问题。
(1)用以决策特定侦查活动
大数据相关关系能够揭示事物、行为之间的伴生性与续起性,可被用作某些侦查活动的决策依据,但应被限制作为证明特定犯罪情节的证据。即便是大数据之父舍恩伯格,其最先谈及的大数据司法应用场景,也是侦查过程中“合理原因”标准的表述及判断。这是因为,大数据相关关系的核心应用模式,在于依托相关性模型展开预测,并辅助决策。刑事侦查过程中专门活动的决策,具有明显的预测性。例如,《刑事诉讼法》第82条规定的可先行拘留的情形中,正在预备犯罪、犯罪后企图逃跑、可能毁灭、伪造证据等,明显属于面向未来时空的预测。又如,《刑事诉讼法》第136条规定的搜查适用情形中,“可能隐藏罪犯或者犯罪证据”的表述,也显属基于一定迹象的分析预测。更为明显的,《刑事诉讼法》第81条规定的五种符合逮捕社会危险性条件的具体情形,均需依据一定材料进行预判。尽管面向未来行为可能性的预测与案件事实的回溯证明完全不同,但前者仍需遵循证据裁判原则。对于尚未发生的事件,运用证据直接证明实属不易,应主要依据推论方式展开间接证明,即通过已经发生或现实存在的事实推断某一事实未来发生的可能性。《关于逮捕社会危险性条件若干问题的规定(试行)》(高检会〔2015〕9号)第5至9条明确展现了基于若干基础事实推断嫌疑人社会危险性的基本原理。该基本原理表现为基础事实与推断事实之间的盖然性关系,这与运用大数据分析获取不同事物间的相关关系具有相似性。依据大数据分析发掘的事物间的相关关系,对特定行为发生的可能性进行判断,以决策应否启动特定侦查活动。
此外,决策侦查专门活动的证明标准应低于确定有罪的证明标准,由此形成的高容错率可包容大数据证据科学可靠性的不明晰。虽然现有规则并未对启动拘留、逮捕、搜查等侦查专门活动的证明标准进行规定,但基于理论推演,前述证明标准应低于认定有罪的证明标准。具体而言,有学者主张,从证据法层面将逮捕同后续羁押相分离,以降低现行逮捕证明标准。而至于拘留,其证明标准更应低于逮捕。同理,在明确启动搜查的证明标准时,这一标准划定也不宜过高。进一步拆分,逮捕的社会危险性要件与犯罪事实要件性质不同且更难以证明,所以有学者主张应设计逮捕的双层次证明标准,其中有关社会危险性的证明标准应比存在犯罪事实的证明标准更低。相对较低的证明标准在另一个角度意味着对产生更多错误的心理预期,这使得诸如大数据证据科学可靠性不明晰的问题得以被包容。产生此种包容的制度自信,源于后续审查起诉、乃至审判阶段能够对前段错误的矫正,这也符合审判中心诉讼制度改革的功能预期。
(2)用以证明犯罪主观心态
一个更为典型的大数据相关关系有限可采性规则,即其可被用来证明犯罪主观心态,而不得证明客观行为。犯罪主观心态首先表现为故意或过失,此外,还包括特定目的、动机、明知等更为具体的要素。以大数据实践常涉及的集资诈骗罪与组织、领导传销活动罪为例,二罪主观要件均为直接故意,且前者以非法占有为目的;后者则以非法牟利为目的。犯罪主观心态证成是司法证明面对的永恒难题。实践中,通过口供直接证明是认定犯罪主观心态最为常见的方式。除此之外,通过客观行为间接反映也被公认为破解主观心态证明难题的有效方法。威格莫尔(John Henry Wigmore)在其1913年的著作《司法证明的原理》一书中就对意图(intent)的认定作了专门的论述。他指出:“意图,作为故意的要素,以及对疏忽或意外的否定,当然可以通过间接情况和行为予以证明,就像其他心理状态一样。”通过客观行为间接证明主观心态的基本原理同样是推断,即挖掘特定行为模式与特定主观心态间的高度伴生关系。相类似地,运用大数据证据证明犯罪主观心态,同样是依托特定数据模型与特定主观心态间的相关关系。
之所以可以采用科学可靠性不明晰的大数据相关关系证明犯罪主观心态,是因为传统实践中,犯罪目的、动机等要素的认定常常呈现“证据真空”样态,即犯罪最终虽被证成,但并不提及主观心态要素如何证明的问题。更糟糕的是,这种缺乏明确依据的主观心态证明,常常引发罪与非罪、此罪与彼罪的争议及认定乱象。因此,即便大数据相关关系的科学可靠性尚不明晰,但其具有为认定犯罪目的、动机提供信息及知识的潜力。采用大数据相关关系证明犯罪主观心态,自然胜过毫无根据的主观猜测,甚至是对犯罪主观心态要素证明的人为忽视。其实,前文谈及的英美学者主张有关强奸创伤综合征专家证言可用于证明“同意”情节,但不得直接认定被告有罪的有限可采性规则,也可从这一角度进行理解。在强奸罪事实认定中,性行为发生是基于同意还是强迫最为重要。然而,该情节在一些案件中只存在一对一的言词证据,即便创伤综合征专家证言属于新兴证据表现形式,且其科学可靠性基础尚不充分,但此类意见性证言的采用得以破解证据短缺难题。
由于本文所论及的大数据相关关系在刑事司法证明中的运用问题缺乏实践基础,所以上述大数据相关关系有限可采性规则的设计,仅是在学理层面的初步探讨。当然,尚可设计出“大数据相关关系可用作辅助、弹劾证据,但不得直接证明案件事实”“大数据相关关系可用作量刑证明,而不得用于定罪证明”等有限可采性规则,但均须留待实践验证。
五、结语
既然大数据相关关系能够揭示新规律、引发新认知,以为人类更好地认识世界提供新思维,那么,刑事司法证明作为认识并论证案件事实的专门活动,自然可以主动拥抱大数据相关关系带来的历史机遇,这是面对新兴技术——社会问题时的“向前看”思维。与这一方针性思维相对应的是“技术决定论”研究范式,其以新兴技术势必引发刑事司法实践的彻底变革为基本立场,也即传统的刑事司法技艺需要以新兴技术为中心实现迎合式变革。然而,大数据相关关系与刑事司法证明相结合的理论研究刚刚起步,证明实践更是鲜见大数据相关关系的具体应用。在这一现实背景下,“技术决定论”范式下的司法证明革新观点,大都属纯粹的理论推演。此时,反其道而行之的“向后看”思维,能够更为全面地审视所研问题。通常,向前看的现实驱动力阻止了我们向后看,而向后看却能明确我们未来的方向。所谓“向后看”,就是将技术引发的变革问题,回归到已有的理论、制度及类似实践中去,以更好地预测变革的未来走向。与之相对应研究范式可概括为“规范中心论”,即以现有的规范框架为中心,预先圈定新兴技术引发的革新方向。试举两例,当前大数据背景下的数据激增可在此前的历史实践中找到相似印记。1820-1840年间,欧洲印刷数字的“雪崩”引发了概率的革命,纵使彼时的印刷数字与当前的混杂数据差异很大,但也同样引发了认识论变革。不仅如此,19世纪初期的第一波“大数据”浪潮同样追求标准化、客观化,通过反馈进行控制、列举以及知识的发现与生产,同时也经历了数据劳动分工、方法变化和理论替代。以上各角度的集成,完美地构成了当前大数据研究的整体图景。又如,数字革命背景下,电子证据的产生与普及同样会产生证据理论及制度应如何改变的思考。然而,令人惊讶的是,产生于20世纪60年代的美国联邦证据规则,却能为数十年后产生的电子证据,提供一个在基础层面上相当不错的可采性规则框架。
聚焦到本文所谈论的大数据相关关系在刑事司法证明中的应用问题,在司法证明理论规范框架内,大数据相关关系既可能被用作近似于一般经验知识的证据外元素,又可能以更为具体且更具规范意义的意见证据形式出现。然而,当进一步以制度规范去审视大数据相关关系的两种可能应用样态时,可以发现:无论是英美道德约束机制抑或我国释法说理公开制度,均难以对被用作证据外元素的大数据相关关系进行有效控制,从而使刑事司法证明成为无法被人类一般理性感知的“彼岸世界”。而当大数据相关关系以意见证据呈现时,其科学可靠性尚不明确。因此,大数据相关关系尚不能以近似于一般经验知识的样态介入刑事司法证明,也不能发挥黏合证据材料与待证事实的关键作用;从既往类似实践上看,对于科学可靠性尚未完全证成的有关大数据相关关系的意见性结论,可参考英美有限可采性规则及我国类似实践,探讨特定证明目的下的有限适用,也就是说作为意见证据样态的大数据相关关系,也仅能在特定目的下发挥局限作用。这一初步研究结论,是在现有“技术中心论”“技术乐观主义”的主流范式下,对“规范中心论”“技术现实主义”的兼顾,以期能对大数据相关关系介入刑事司法证明展开多维度观察,从而更为准确地锚定技术驱动下传统司法技艺的可持续发展方向。