查看原文
其他

刘静 | 风险与应对:论大数据司法鉴定的平台构建

The following article is from 法学杂志 Author 刘静

(感谢太原理工大学文法学院教师郭恒博士为司法兰亭会六周年题篆)


【作者】刘静,中国人民公安大学法学院讲师。

【来源】《法学杂志》2021年第9期“青年法苑”

【基金项目】中国人民公安大学2021年度基本科研业务费新任教师项目“大数据司法鉴定的体系定位与风险应对”;重庆市新型犯罪研究中心2021年度项目“刑事合规的中国路径”的阶段成果。


当前的司法鉴定活动在委托环节存在信息鸿沟、暗箱操作等弊端,在实施环节存在鉴定方法普遍落后、职业素养参差不齐等问题,在质证环节存在鉴定人出庭率偏低、有效质证偏少等困境。

运用大数据方法与理念,构建包括委托受理平台、实施活动平台、质证辅助平台在内的大数据司法鉴定平台,能够很好地解决当前司法鉴定活动中存在的问题。

然而,大数据司法鉴定平台构建的具体过程中,存在担责主体模糊、数据算法黑箱效应影响、鉴定数据缺乏等潜在风险。

对于这些风险的未来应对,可相应地从司法鉴定归责主体的明确、算法审查机制的构建与司法鉴定数据库的配置等方面展开。同时,围绕大数据司法鉴定结论的证据种类、证据能力和证明力展开对其证据制度体系定位的具体阐述。

关键词:大数据;司法鉴定;算法自动决策;透明性


《中国共产党第十九届中央委员会第五次全体会议公报》提出,要建设网络强国、数字中国,加快数字化发展。数字中国并不仅限于经济领域,日常生活、社会治理及司法诉讼也都将数字化,数字时代的到来不可避免。从业界所称的“大数据元年”即2013年至今,各行各业积极进行大数据方面的探索与研究,力求将大数据与自身行业的前景相结合,以求实现更大的发展。

当前,“大数据”俨然成为法学界乃至社会科学领域的显学,但司法鉴定领域基于自身的公平公正性、严肃严谨性以及对专业知识经验的高度依赖性,一直对前沿理论与实践保持着小心谨慎的态度。

无论是学界的研究还是业界的实践,司法鉴定领域的大数据应用都处于萌芽阶段,零星散布于某些具体的鉴定类别中,在整体上缺乏系统性研究。

如何将大数据完美契合进入司法鉴定领域,成为摆在广大司法鉴定专家学者们面前的首要问题。


一、大数据司法鉴定平台构建的必要性

2016年最高人民法院、司法部联合发布的《关于建立司法鉴定管理与使用衔接机制的意见》对鉴定委托与受理、鉴定人出庭进行了强调,但未涉及司法鉴定的运行与使用过程,忽视了法院、鉴定机构与当事人相关失范行为的肇因要素,从而掩盖了我国司法鉴定实践中已有问题的复杂结构;[1]因此通过运用大数据方法与理念,明确法院、司法鉴定机构和司法行政机关在委托、鉴定、质证环节各自所应担负的责任,构建动态化、体系化的大数据司法鉴定平台具有必要性。

(一)司法鉴定活动现状的问题检视

分析我国当前司法鉴定活动的现状可知,司法鉴定活动在委托环节、实施环节及质证环节存在诸多困境。作为司法鉴定活动重要起点的委托环节,主要存在信息鸿沟、暗箱操作等弊端。

其一,不同鉴定机构的鉴定能力、鉴定水平有差别,但当事人难以按照案件的鉴定需要选取匹配度高的鉴定机构,电脑摇号、抽签的方式也仅仅能够保证法庭委托鉴定的客观公正性,难以确保选取的鉴定机构出具的鉴定意见的可靠性。这既是对优质鉴定机构的不公,也易造成重新鉴定或补充鉴定,使得本就稀缺的鉴定资源被消耗浪费。

其二,在具体案件中,有些地方法院并非是以“资质好坏”而是以“好处多少”作为选取鉴定机构的标准,此般暗箱操作会极大打击鉴定机构的公信力。[2]

作为司法鉴定活动中心枢纽的实施环节,存在鉴定方法落后、职业素养参差不齐等问题。

其一,当前我国司法鉴定行业发展不平衡,规模较小的鉴定机构占据市场绝大比例,其所拥有的仪器设备较为落后,所采用的技术手段和方法也较为落伍。落后的、误差大的鉴定方法不但明显削弱鉴定意见的可靠性,更有可能干扰案件的侦查与审判。

其二,针对同一鉴定,特别是对经验依赖度极强的鉴定类型(如笔迹鉴定),初出茅庐的鉴定人员的鉴定意见,往往会迥异于具有多年从业经验的高水平鉴定人员的鉴定意见。相差甚大的鉴定意见使得委托人对鉴定意见的可靠性持有怀疑态度,降低了鉴定活动的可信度。

作为司法鉴定活动关键节点的质证环节,存在鉴定人出庭率偏低、有效质证偏少等困境。

其一,在具体案件中,基于诉讼成本、审判时效等因素的考虑,法官往往宣称鉴定人出庭质证并无必要,从而拒绝相应的申请。[3]有的案件承办法官则是说服当事人采取鉴定人书面解释的替代方式,[4]但该种替代方式与现行法律规定相悖,也只能解决鉴定意见存在的细微瑕疵问题。还需注意的是,法官因鉴定人不出庭而否定鉴定意见的情况极为少见,[5]这也成为鉴定人出庭率偏低的潜在原因。

其二,鉴定意见的专业性使得诉讼双方和裁判者难以深入了解鉴定意见的构成,对鉴定意见进行质证时,诉讼双方往往只能对鉴定环节的程序性内容进行质证,提出一些浮于表面的问题(如鉴定机构是否有资质、鉴定人是否取得相应的资格等)。这种“隔靴搔痒”式的提问,根本无法触及鉴定意见的形成原理、采用的科学技术方法、操作流程等实质内容,难以对鉴定意见提出有效的质疑。

(二)大数据司法鉴定平台的功能价值

作为一种新型司法鉴定模式,大数据司法鉴定平台的构建依靠海量数据,采用数据挖掘、处理、分析等技术手段,及时收集、更新、共享鉴定的程序、方法等相关信息,并对鉴定材料的特征进行全面获取、深度分析、自动比对,从而实现鉴定委托、实施与质证环节的科学化与数据化。

相比于传统模式,大数据司法鉴定平台的构建将在鉴定效率提升、鉴定便利性提高与鉴定意见可靠性增强等方面发挥巨大作用。

1.提高司法鉴定的效率。大数据司法鉴定以海量数据为支撑,依靠计算机完成绝大部分程序性和基础性的检验工作,如判断检材样本是否具有鉴定的条件、依据检材样本的特性提供更为科学可靠的鉴定方法、比对检材与样本的明显特征等。

在此一过程中,鉴定人只需完成计算机难以完成或是不能完成的工作,而对于计算机能够成功完成的工作,鉴定人只需起到审核修正的作用。这不仅能够减轻鉴定人的压力,也能帮助鉴定人将更多的时间精力集中在更为疑难复杂、对个人专业知识经验依赖度更高、争议更大的案件上,将极大提高司法鉴定的效率。

2.增强鉴定意见可靠性。避免检材与样本出现问题、选取科学可靠的鉴定方法、最大限度保证鉴定的中立性是提高鉴定意见准确可靠性的关键。大数据司法鉴定平台具有不同类别的数据库。操作指南数据库可以及时为鉴定人提供采集检材与样本的操作规范与流程,帮助指导鉴定人的取证采样过程。技术数据库会及时更新鉴定方法,淘汰过时落后的鉴定技术,并按照鉴定类别有针对性地提供最为合适的鉴定方法。“与应用技术密切联系的是,对技术性专家的依赖性也在增加。”[6]

伴随着鉴定人参与鉴定环节的增多,鉴定结果也不可避免受到鉴定人专业技术水平、知识经验和主观因素的影响。大数据司法鉴定平台利用先进的技术方法,以大量的数据为支撑,最大程度限制鉴定人主观因素对鉴定的影响,以增强鉴定意见的可靠性。

3.提高司法鉴定的便利性。随着鉴定机构和鉴定人员数量不断增加,巨大的信息量对当前的司法鉴定管理模式提出了更高的要求。

大数据司法鉴定平台具有完备的数据处理技术,可以将鉴定机构和鉴定人的信息按照算法模型要求进行分类储存和信息汇总,涉及从资格准入到退出各个阶段全部信息的储存。此外,大数据司法鉴定平台还可以将不具有鉴定资格的鉴定机构和鉴定人排除在鉴定活动外,形成对鉴定机构和鉴定人规范化、统一化管理。

同时,大数据司法鉴定平台强调诉讼参与人选择鉴定机构的自主性和智能性。平台具有关于鉴定机构和鉴定人员信息的数据库,双方当事人可以通过输入地区、专业、资质、业务范围、鉴定案件数量和投诉数量等信息,由计算机推选出最适宜的鉴定机构和鉴定人的列表,再由双方当事人根据自身需求筛选出符合条件的鉴定机构和鉴定人,最后基于双方合意确定最终的鉴定机构和鉴定人选。


二、大数据司法鉴定平台构建的具体实现

大数据司法鉴定平台包括委托平台、实施平台及质证辅助平台,与司法鉴定中委托与材料补充、鉴定实施以及鉴定意见质证环节相对应,从而实现司法鉴定大数据的全流程衔接。

随着大数据司法鉴定平台的发展,鉴定结论的出具将由单纯依靠人工逐步过渡到机器辅助,并最终实现机器自主。这不仅可以使鉴定人专注于疑难复杂鉴定委托的解决,而且可以有效缓解当前鉴定人员不足与鉴定业务暴增之间的矛盾。

(一)司法鉴定委托受理平台的构建

笔者设想的大数据司法鉴定委托受理平台,能够根据案件的具体鉴定需求,帮助法院和当事人查询、匹配、选取最适宜具体个案的鉴定机构及鉴定人,并在线进行鉴定事项的委托及受理。同时,法院可以通过平台及时查询鉴定进度,了解相关情况,并及时进行问题反馈和投诉等。大数据司法鉴定委托受理流程包括以下八个部分。

第一部分,司法鉴定委托受理的初审阶段。初审阶段的审查为形式审查,审查者为各市的司法局及未下放司法鉴定机构及人员管理权的省司法厅,其负责审查本区域鉴定机构的登记信息及相关手续是否准确、完整,比对本市司法局关于司法鉴定机构及鉴定人员的管理名册。

第二部分,司法鉴定委托受理的终审环节。终审环节的主要审查者为省级司法厅,司法厅将受理平台内登记的鉴定机构和鉴定人信息再次与司法厅内部的管理名单进行比对,对登记不准确的地方予以标注,系统将自动标黄此部分信息及该鉴定机构,并及时将信息反馈于鉴定机构的邮箱及官方账号。

第三部分,鉴定委托受理的变更处理环节。对于鉴定机构已修改变更的信息,系统会自动标红显示,在未得到省司法厅的审核前,鉴定机构将暂停接受委托。对于鉴定资质到期的机构,系统会自动提示相关鉴定机构在规定的时间内上传更新鉴定许可证。如不能在资质到期前及时更新上传,系统将自动标红,该鉴定机构不得再接受委托,直至信息更新完整,并由省厅审核无误后方可解除限制。

第四部分,鉴定委托受理的审核记录环节。在鉴定机构对相关基础信息作出修改时,系统会自动给省司法厅的账号发送信息。省司法厅在接收到变更处理信息后,需在一至两个工作日内及时审查核实变更信息,核对无误方可消除该鉴定机构的红底色,解除其暂停接受鉴定委托的限制。

第五部分,鉴定委托受理的查询维护环节。法官可以依据各鉴定机构承办委托鉴定及法院采信各鉴定机构鉴定意见的数量、鉴定机构超期鉴定与收到的投诉量等因素,对列表中的鉴定机构进行排序。当事人依照自身需求向法官提出申请,并在双方合意的基础上共同选取鉴定机构。每个案件均需要选取两家鉴定机构,一家作为首选委托的鉴定方,另外一家作为备选委托的鉴定方,以防出现首选鉴定机构难以接受委托或中立性存疑等情形。

第六部分,司法鉴定委托受理的摇号阶段。“大数据司法鉴定委托受理平台”依据采信率、鉴定量、信用及综合排序等方式,提供符合当事人需求的鉴定机构列表供其筛选,若案件双方当事人就选取何家鉴定机构无法达成一致,则当事人可以按需选取三家鉴定机构进入摇号系统,最终通过摇号确定首选鉴定机构及备选鉴定机构。

第七部分,鉴定委托受理的在线鉴定阶段。法官在“在线鉴定”平台上发起鉴定委托,严格把控具体节点的管理。鉴定机构接到鉴定材料后,需在平台上予以确认,方能开启鉴定。在鉴定过程中,若鉴定人认为鉴定材料不完备、不充分,可依据鉴定的具体需要自主取样,也可通过远程协助系统请求委托单位取样。

第八部分,鉴定委托受理的综合评价阶段。在案件审理结束后,法官需要在线对此次鉴定委托的具体情况作出评价,即在鉴定意见是否被采信、鉴定活动是否超期、鉴定过程是否收到投诉等方面展开评价。

(二)司法鉴定活动实施平台的构建

笔者认为,我们应以海量的数据作为支撑基础,以数据的挖掘处理、统计分析手段作为技术依靠,充分运用大数据之理念与思维,构建科学化、客观化与数据化的大数据司法鉴定活动实施平台,以全面获取、深度分析、自动比对鉴定材料的各项特征信息。大数据司法鉴定实施平台的构建流程包括四个阶段。

第一阶段,构建司法鉴定数据库。该数据库的构建主要包括两个方面:一是文献资料与规范标准的收集,这部分数据是鉴定人员在司法鉴定中必须依靠的鉴定工具,收集的主要目的是在一定程度上减少相关鉴定人员的前期准备时长,从而减少其工作量;二是电子数据与案例资料的收集,目的在于最大限度提高鉴定效率,因为其可作为鉴定活动的参照物,在日后进行类似鉴定时可便捷省时地确定应采用何种鉴定技术。

第二阶段,提供司法鉴定最适方法。第一阶段的数据库更多的是为鉴定人员提供方法或是标准的查询,缺少智能呈现鉴定方法的功能。第二阶段更为侧重对实践行为的指导,无论是经由委托受理平台传递的鉴定意见书还是鉴定机构自主上传的鉴定意见书及鉴定报告,均需要隐匿委托人、被检验人等相关事项,呈现具体的设备情况、鉴定的依据、过程、方法与意见等,目的在于让相关鉴定人员在同类别的司法鉴定过程中选取最适宜的鉴定方法。

第三阶段,辅助鉴定的同一认定。针对不同的鉴定种类,需要单独设计符合各自鉴定需求的数据模型,以辅助鉴定人进行同一认定。本阶段大数据技术更多地应用于鉴定意见的生成过程,针对不同种类的鉴定事项,经过相应数据模型的推算,平台给出最终认定同一的比例。这个比例仅供鉴定人参考,鉴定人仍需要按照操作实践作出具体的鉴定意见。在此过程中,鉴定人可以通过比对自己与平台所作鉴定意见的差别,来不断修改完善数据算法模型。

第四阶段,鉴定意见的自动生成。前三个阶段的大数据技术更多是为了辅助鉴定人进行鉴定,第四个阶段则是由大数据模型取代人工,占据司法鉴定的主导地位。传统司法鉴定活动呈现人工主导的特点,因而针对同一鉴定事项,不同的鉴定人有时会得出完全不同的鉴定意见。大数据模型采用新的比对方法,排除人工的干预,将相关事项科学地予以量化,能够实现对不同鉴定对象的定性、定量鉴定,极大地增强鉴定过程的科学性。

(三)司法鉴定质证辅助平台的构建

大数据司法鉴定质证辅助平台能够帮助当事人及时了解鉴定意见,提供细致、明确的质证方案,以解决当前司法鉴定质证环节的相关问题。大数据司法鉴定质证辅助平台的构建流程包括三个阶段。

第一,实现司法鉴定平台对接。质证平台需要与受理平台、实施平台相对接,共同构成大数据司法鉴定平台。通过质证平台与受理平台的数据信息对接,依托数据模型及算法分析,平台可以自动比对出具鉴定意见的鉴定机构及鉴定人的资质。实施平台里不同鉴定类别的鉴定标准等相关信息也须对接到质证平台中,自动提供具体鉴定的最适方法排行,帮助当事人比对鉴定意见中鉴定方法的科学性与可靠性。

第二,辅助鉴定意见开示制度。鉴定人出具鉴定意见后,须上传鉴定意见于受理平台发送给委托法院。通过平台间的数据对接,上传的鉴定意见会存储于质证平台。当事人或法官可以根据案件编号查找获取鉴定意见,通过质证平台的自动比对功能,及时确认鉴定机构或鉴定人是否具有相应的鉴定资质、鉴定意见书中采用的技术方法是否与系统提供的一致等,从而为当事人提供鉴定意见质证的初步方案。在当事人对鉴定意见有异议并提出申请鉴定人出庭时,法官可以通过质证平台获取鉴定意见的相关信息,从合理性、必要性的角度审核当事人的申请。

第三,帮助提高鉴定人出庭率。质证平台拥有在线联系、交流功能,法院可以及时与鉴定人在线沟通,确保鉴定人第一时间得知出庭质证的消息及开庭的准确时间。质证平台也会及时给鉴定机构的账号和邮箱发送出庭质证的消息,若鉴定机构或鉴定人未在2天内回复确认,法院则采取其他通知方式确保鉴定人收到出庭质证的消息。为提高鉴定人出庭质证率,对于需要出庭但事务繁忙难以出庭的鉴定人,可以采取远程视频通话等方式使其接受当事人或专家辅助人的质证。


三、大数据司法鉴定平台构建的潜在风险

大数据时代的到来不仅带来了便利快捷,也带来了风险挑战。大数据司法鉴定平台构建的潜在风险主要有:

(一)鉴定失误担责主体模糊

大数据技术并非建立在因果关系的基础上,其更多预测的是事物之间的相关关系,因此大数据司法鉴定的结果并不必然是准确可靠的。那么,当大数据司法鉴定工作出现错误时,应该由谁承担相应的责任?

目前,关于大数据司法鉴定过程中失职渎职的责任承担,实践中存在极大分歧。在司法鉴定实践中,错鉴类型具体可分为责任错鉴与技术错鉴两类。二者的区分点在于责任错鉴是由鉴定人员主观过错导致的,而技术错鉴是由鉴定人员专业技能不足引起的。[7]

大数据司法鉴定能够在一定程度上解决上述问题——一方面数据算法模型的客观性可以防止当前司法鉴定人在鉴定过程中主观错误或违规行为的出现,另一方面海量数据信息的录入与科学鉴定方法的成功筛选能够避免机器因选取错误的参考资料或鉴定标准等引起的错鉴情况发生。

随着大数据司法鉴定平台的构建与运行,大数据深入司法鉴定领域的程度亦将日益加深,越来越多的鉴定意见将由机器作出,鉴定人更多起到的是辅助性作用。

如果算法或运行环节出错等不可控因素导致错鉴情形发生,此时该由谁承担错鉴的主体责任?投诉人该针对谁的行为进行投诉?司法行政机关是否能够接受此类投诉?

这些都是值得深思的问题与必须正视的风险,因为责任主体不明不仅会造成主体间相互推卸责任,最终使得相应的过错责任无人承担,也会对维护落实良好的司法鉴定秩序产生极大的负面影响。

(二)数据算法黑箱效应造成影响

数据与算法是大数据持续发展的前提与基础,构建有关数据与算法的相应治理体系机制则是大数据时代保证数据真实性、可靠性的首要命题。[8]完整的算法活动大体可以分为三个步骤:

首先,硬件终端通过深入数据挖掘,获取被服务者及同类群体的原始数据;

其次,算法程序在云端将处理整齐的数据输出为更整齐的概率、排名、风险、倾向、估值等评价和分值;

最后,应用终端生成具有明确指向性的决策或预测报告。[9]从外观上来看,算法的运算分析过程完全处于秘密、不透明的状态,也就是所谓的“黑箱效应”。

黑箱效应是指对于一个系统只知道输入和输出结果,并不了解其内部运作机制,整个过程不透明。美国加州大学信息学院的詹娜·布瑞尔教授提出算法有“固有的不透明”“技术的不透明”与“故意的不透明”三种不同样态的不透明。

[10]可以认为,算法自身的先进性或复杂性,导致无法确认大数据司法鉴定的研发与运行流程,属于技术上“固有的不透明”。同时,面对激烈的市场竞争,技术研发公司或电脑编程工程师为了保护核心算法的秘密性和商业价值,并不会将核心算法的具体程式展示给社会公众,这就造成了“故意的不透明”。

[11]司法机关、司法行政机关以及司法鉴定机构的工作人员均缺乏计算机编程、智能软件开发等专业技术知识,难以从专业角度仔细审查大数据司法鉴定的算法是否存在问题,也无意学习与研究平台算法的计算方法与运行模式,也会导致“技术的不透明”。如前所述的种种现实因素造成现有算法通常处于一种不为人所知的隐秘状态。

在算法出现问题或错误时,司法机关、司法行政机关以及司法鉴定机构的工作人员难以对算法起到有效的审查与监督的作用,这严重违背了当前司法公开的原则。黑箱效应造成了算法的隐蔽性与司法公开原则之间巨大的、不可调和的矛盾。

(三)司法鉴定数据库源缺乏

要想实现司法鉴定与大数据之间的高度融合,并将前述在线传递、在线委托及鉴定意见质证等落到实处,优质海量的数据库构建是必要前提。然而,当前司法实践中鉴定的数据现状难以满足大数据司法鉴定的具体要求。

第一,我国当前司法鉴定数据的规模与范围难以满足大数据司法鉴定的需求。我国的司法鉴定数据库大都以各鉴定机构独立创建为主,分别隶属于不同的鉴定机构,收集数据的规模、范围十分有限,难以形成数量庞大的数据库。

这严重限制了大数据司法鉴定的分析计算能力,实质性地影响了大数据司法鉴定更深程度的发展。此外,虽然目前部分鉴定机构、法院、司法行政机关等开始着手建设并对外公开自己的鉴定信息全数据库,但这些数据库时日尚短,并未囊括所有的鉴定数据。

第二,司法鉴定数据的质量与大数据司法鉴定的要求并不相符。在某种程度上而言,鉴定数据“量”的多并不代表司法鉴定数据“质”的好,[12]大量低水平、低质量的司法鉴定数据反而影响大数据司法鉴定的准确性。正确、全面的数据库虽未必就意味着可以得出正确的结论,但错误、疏漏的数据库必将导致得出错误的结论。司法实践历史已经警示,错误的关联往往源于存在瑕疵、质量低下的数据。[13]

另外,从我国当前司法鉴定数据的现状来看,我国司法鉴定人员在撰写鉴定意见书时,有时就相同的事项呈现出多样化的表达方式,专业术语未得到统一。囿于当前时期大数据发展的水平,此种非结构化的信息表述存在无法被大数据系统准确识别的可能,从而实质性地限制了系统的深入计算分析,造成了大数据系统的分析障碍。


四、大数据司法鉴定平台构建的风险应对

在大数据司法鉴定的运行过程中,势必会出现传统司法鉴定所不具备的风险。对于大数据司法鉴定平台构建过程中的潜在风险,可从司法鉴定归责主体的明确、算法审查机制的构建、司法鉴定数据库的配置等方面进行应对。

(一)司法鉴定归责主体的明确

相较于其他普通民事行为而言,司法鉴定具有公益性,司法鉴定机构事实上是一类特殊的公益性法人机构。[14]司法鉴定活动并不单纯为某个特定个体服务,而是面向全社会、为不特定的全社会成员服务。

因此,大数据司法鉴定工作失误的责任承担需要以保护公共利益为出发点。我们可以将大数据司法鉴定作为一项“产品”,在技术研发人员、软件技术开发公司、鉴定人、鉴定机构中间,按照过错推定的原则,应当首选使用大数据司法鉴定平台系统的鉴定人承担主体责任,其次为鉴定机构。

一方面,虽然大数据司法鉴定平台与技术研发人员、软件技术开发公司、鉴定人和鉴定机构均具有密切的关系,但鉴定机构与鉴定人是与公众权益联系最为密切的主体。大数据司法鉴定平台核心算法的数据操作、控制结构、执行程序等具体标准要求由司法鉴定机构提供,并由其向外进行招标。鉴定人作为平台的直接使用者,如果逃避过错、不愿承担工作失误责任,那么公众权益便会受到损害。

原因在于,无论是最初的鉴定人主导、机器为辅的模式,还是后期的机器主导、鉴定人为辅的模式,鉴定人无一例外需要履行监督、审核的职责与义务。一旦大数据司法鉴定平台得出的鉴定结果存在错误,鉴定人需要及时准确地发现问题并改正,且需要认真贯彻落实前文所述的相应平台系统的检查机制,查询错误出现的缘由,以防止由于平台系统出错而导致公众权益受到更大的损害。

另一方面,过错推定原则保障了司法鉴定的正常运行,防止大数据司法鉴定工作的相关主体之间推诿责任。该原则的实施使得司法鉴定人不得不第一时间查找大数据司法鉴定平台出现错误的原因,并证明平台工作失误是由于技术研究人员或科技开发公司造成的,否则便需要先对所造成的损害结果承担责任;在承担责任后,如果其拥有证据证明大数据司法鉴定工作的失误是由算法失灵等原因导致的,则可以根据实际情况向技术研究人员或科技开发公司追偿。

然而,在大数据司法鉴定平台验收时,若具有相应技术水平的鉴定人能够发现平台运行过程中存在明显瑕疵,但鉴定机构依然验收合格并投入使用,那么即使平台将来再次因技术问题出现错误,实际承担责任的主体也应为鉴定机构。此种情形下,为保证委托人和科技研发公司的利益及维护社会的公平和正义,鉴定机构需要独自承担具体责任,不能再向科技开发公司追偿。

(二)算法审查公开机制的建设

为全面规范算法模型、保证大数据司法鉴定算法的编辑与运行过程的准确性,应当建立算法审查公开机制,从而保证大数据司法鉴定的顺利、准确开展。具体而言,算法的审查与公开机制的建立可从以下几方面进行。

首先,设立数据记录制度。在大数据决策机制中,一旦出现问题,可以根据数据溯源技术[15]及时查找数据流转、运用的记录来定位错误的根源。然而,在很多大数据系统的设计中,并未有对数据生成、流转及运用过程的记录。有的是由于设计者本身技术欠缺,有的则是因为技术设计者故意遗漏数据记录与保存系统的设置,以规避日后出现纠纷时的审查、追责。[16]司法机关工作人员或鉴定人员一旦发现数据分析结果存在问题,便可以根据数据记录的相关信息“层层摸排”,最终锁定错误的源头。

其次,成立由多领域专家构成的、具有较高独立性的算法审查委员会。算法本身极易受到技术设计者主观因素的干扰,加之平台的使用者欠缺编程相关的专业技术知识,难以判明算法的编辑和运行机制,更遑论厘清算法的依据是否符合法律规定。当前在大数据司法鉴定领域,我国可以借鉴国外的相关做法,集结法官、司法行政人员、司法鉴定人员、人工智能、大数据等相关学科领域的专家,成立一个独立性相对较高的算法审查委员会。

在相应平台投入运行使用前,算法审查委员会对所涉算法进行必要的法律审查,将不合法、不合规的系统扼杀在摇篮中,以期尽可能保证算法的合法性。[17]此外,在相应的法律规则发生变化时,算法审查委员会需要对重新投入使用的大数据司法鉴定平台的算法进行法律审查。

最后,建立算法公开机制。算法具有隐蔽性与秘密性,极易掩饰自身存在的偏差与错误,这与当前的司法公开原则相违背。一方面,技术开发公司应当履行说明义务,即应按合同的约定条款向委托机构说明算法的具体编辑与工作原理;另一方面,除涉密的情形外,委托机构也应向社会公众公开算法的相关内容,接受公众监督。

此外,算法的公开机制还需要从算法的基础数据抓起,避免算法的歧视性,因为“基于先前有偏见数据的未经仔细思量的算法系统,在运算过程中可能重新创造甚至加剧过去决策中出现的歧视”。[18]因此,相关机构在审查算法的过程中,需要重点关注算法中可能存在的偏见、错误及其潜在的危害。

(三)司法鉴定数据库的配置

统一的司法鉴定数据库构建之所以如此重要,是因为其建设完善不仅能与大数据司法鉴定平台的构建需要相匹配,也能使社会公众、科研人员等关于鉴定运行现状的了解需求得到满足,从而有利于各地区各层级的司法行政机关、司法机关、科研单位准确全面、及时有效了解掌握相关信息及问题所在,并因时制宜、因地制宜地进行决策,进一步推进我国司法鉴定现代化建设的进程。构建统一的司法鉴定数据库的工作,重点包括以下方面:

第一,加强司法机关和司法行政机关各自内部的数据共享。大数据共享机制需要打破级别的限制,实现不同级别司法机关、司法行政机关的数据互通。具体而言,司法机关可以建立一个统管全国的司法鉴定的委托平台,由于委托司法鉴定的数据来源主要是法院,该平台可以由最高人民法院负责,统筹管理全国的司法鉴定委托数据。

各省的高院也分别设置省级的数据中心,由省级高院主管本省法院内部的司法鉴定委托数据;各地区的中院也可以单独设置地级的数据中心,由各地中院分别汇集本地区的司法鉴定委托数据;原则上不再单设基层法院的数据中心,中院的数据中心为最低层级。

第二,完善司法机关和司法行政机关外部的数据共享机制。在构建大数据司法鉴定平台的过程中,司法机关和司法行政机关存有的关于司法鉴定有关的数据,可以集中上传于前述相对应的大数据平台中,通过统一数据标准、去除技术障碍来保证数据间的互通性、减少共享障碍,推进司法鉴定领域内的数据共享建设。

与此同时,司法机关、司法行政机关可以建立与社会鉴定机构司法鉴定数据库的共享机制,适度开展与社会鉴定机构的数据信息合作。在严格遵守国家相关禁止性规定的基础上,除涉密的数据外,司法机关与司法行政机关可以将鉴定数据与社会机构共享。


五、大数据平台司法鉴定结论的体系定位

随着大数据时代的到来,大数据势必会给鉴定领域带来新的技术方法,这是一次重大突破,并将在一定程度上缓解或解决当前存在的问题。当前不是大数据是否需要介入司法鉴定领域的问题,而是大数据介入司法鉴定领域后对当前的证据制度造成何种冲击、冲击后又该如何重建以达到应有效果的问题。

(一)大数据司法鉴定结论的证据种类

我国当前证据种类的划分是基于合理的认识逻辑和制度背景的,源于独特的诉讼模式。与两大法系国家相比较,我国《刑事诉讼法》关于证据的种类采取了封闭式的、穷尽列举的立法模式。然而,随着社会的进步、技术的更迭和司法实践的发展,越来越多的新型证据种类将会出现。

当前,大数据浪潮已然席卷司法领域,依靠大数据司法鉴定平台系统自动得出鉴定结论的目标早已提上日程。然而,机器作出的鉴定结论必然对当前的证据分类造成一定的困扰,其究竟是何种证据类别、此鉴定结论是否是彼鉴定意见、应该将其纳入现有的证据种类的范围内还是应该创造出新的证据类别,这是我们不得不考虑的难题。

鉴定意见具有专门知识性和意见性的双重属性。大数据司法鉴定结论依旧是基于鉴定人员的专业知识和经验得出的,只是依赖的形式有所不同。其以海量数据为支撑,依赖包含诸多鉴定人经验和知识结晶的平台算法的多重分析,得出对案件专门性问题的判断意见。传统鉴定意见是鉴定人直接、亲自鉴定得出,而大数据司法鉴定结论是鉴定人将自身的经验知识融入算法当中,交由算法分析判断得出的。

大数据司法鉴定平台作为鉴定人进行鉴定的工具,即一种高科技的技术手段,鉴定的主体依旧是鉴定人。大数据司法鉴定结合诸多优秀鉴定人的宝贵经验和专业知识,它的出现能够将鉴定人主观错误的因素降低到最小。通过机器量化、计算分析的方式帮助保证鉴定结论的准确性和可靠性,改变了当前“同一鉴定事项不同的鉴定人可能得出不同的鉴定意见”的现象。

当然,这并不意味着大数据司法鉴定结论不具有意见属性,它依然是机器根据鉴定人的专业知识和经验得出的,只是鉴定结论的意见属性由依赖单一的某个鉴定人过渡到了依赖多数鉴定人。

质言之,大数据聚焦精确性、量化性的研究,大数据司法鉴定的核心是将司法鉴定问题转变为可以量化的数据问题,并寻找科学的解决方式。大数据司法鉴定相较于传统鉴定而言,将鉴定人主观性的经验变为可以量化的客观数据,通过定量、计算等方式极大程度提升司法鉴定的准确性,最大限度减少司法鉴定人员主观因素的影响,所得到的鉴定结论依然是鉴定人知识与经验的结晶,其稳定性与可靠性都得到了一定程度的增强。

因此,只要大数据技术手段科学可靠,操作得当,那便可以将其视为一种鉴定的高科技方法,并不必然影响所得出的鉴定结论的证据种类,即此鉴定结论依旧为鉴定意见。

(二)大数据司法鉴定意见的证据能力

一般而言,对于证据能力的审查,涉及到证据“三性”——客观性、关联性与合法性。然而,对于鉴定意见的审查有着特殊之处,虽然在采纳阶段也有合法性与关联性的审查,但更重要的是对其真实性的审查。[19]鉴定意见的真实性,也可称之为科学可靠性,指的是鉴定意见所依据的原理、方法、技术是否科学可靠。

因此,相比于一般证据而言,以可靠性代替客观性更能反映鉴定意见的本质,而且鉴定意见的可靠程度直接反映了其证据价值。[20]因此,关于大数据司法鉴定意见证据能力的讨论,将从可靠性、关联性与合法性这三个方面展开。

其一,对于鉴定意见可靠性的判断标准,有学者提出包括可再生性、因果关系、不确定性、错误率四个方面。[21]也有学者认为包括鉴定人的自身情况、鉴定机构的管理情况、鉴定活动的原理方法、鉴定文书的论证逻辑等诸多方面。[22]

笔者认为,大数据司法鉴定可靠性认定需要审查大数据分析方法是否科学可靠,这实际上涉及大数据分析是否具有科学性的问题。大数据既不具备传统科学的层级式论证模型,也不强调因果关系,更不具备类比推理思维。其更像是一种工具,将缺乏规律的个别现象予以整合后提供关于这个世界的全面理解与把握。[23]

基于大数据对传统科学研究的冲击,其自身已经凝练成为了一种全新的科学范式。美国学者Jim Gray总结了人类科学研究的四种范式:1.实验科学范式;2.理论科学范式;3.计算科学范式;4.数据密集型科学范式。[24]其中,数据密集型科学是大数据科学的另一种称谓,[25]其摒弃了传统意义上数据是佐证理论与实验的工具的思维,认为可以直接从数据出发,通过大数据挖掘模型而获得未知的理论。

因此,已有学者将大数据科学称之为科学研究的第四范式。[26]“大数据科学”概念的出现以及大数据科学作为科学研究的第四范式为科学研究者所接受,都充分说明了大数据分析技术的科学可靠性,使得法院可以充分地认定大数据司法鉴定意见的证据能力的可靠性。

其二,证据的关联性并非哲学意义上的普遍联系,而是逻辑上的特殊联系,即证据与证明对象或待证事实之间必须具有一定的逻辑关系。[27]鉴定意见的关联性审查可以分为两个维度:一是形式上的维度,主要审查鉴定意见据以鉴定的鉴定材料是否来源于案件事实,以及鉴定意见与待证事实之间是否有形式上的联系;二是实质上的维度,主要审查鉴定意见是否足以证明案件中需要证明的事实。[28]

大数据司法鉴定意见的形式关联性主要表现在两个方面。

一方面,大数据司法鉴定平台的检材以及鉴定资料必须来源于案件本身。鉴定的检材以及鉴定材料是鉴定活动最基础的支撑,因为其是事实发生过的痕迹,“保留着某一事实发生或存在的形态、结构、属性和含义”。[29]大数据分析更多被视为一种鉴定的高科技方法,只要技术手段科学可靠、操作得当,并不必然影响鉴定意见与案件事实的关联性。

另一方面,大数据司法鉴定应该有助于实际解决案件中的专门性问题。所谓的专门性问题,是裁判者缺少相关专门知识而无法解决的问题,应该是法官穷尽文义解释、逻辑推理与经验法则后仍然不能认定的部分。[30]鉴于大数据在司法认知中的重要作用,可以将相关事实背景作为需要借助大数据技术进行认知的内容而诉诸大数据司法鉴定。

大数据司法鉴定意见的实质关联性审查可以借鉴美国的《联邦证据规则》第401条。美国波斯纳教授用贝叶斯定理对该条规则进行了表达——当证据的似然率不为1时,证据就具有关联性;当似然率恰好为1时,证据则不具有关联性。[31]“无论是从证据与事实关联度的角度而言,还是从回答假设问题的角度出发,似然率都可以帮助专家证人对替代假设改变时证明力的变化情况做以解释。”[32]大数据的出现对贝叶斯定理有所修正,其对全量数据进行分析的方式避免了贝叶斯定理在最初始对于主观概率的赋值问题,使得最后对于事件的客观描述更加贴近于真实状态。[33]

同时,大数据司法鉴定平台所涉的巨量信息增加了案件事实的信息来源,得以修正司法主体在此之前所获得的经验性信念,[34]从而增加了概率评估的韧性强度并提高了大数据鉴定意见的可信程度。[35]

其三,证据合法性的标准主要由三个方面构成:证据的主体合法、证据的形式合法与证据的收集合法;大数据司法鉴定意见的合法性问题主要集中于鉴定主体的合法性和鉴定意见形式的合法性。其中,鉴定意见形式合法性问题归根结底也是鉴定主体合法性问题的显示。

毫无疑问,大数据司法鉴定主要依靠机器,这与《全国人民代表大会常务委员会关于司法鉴定管理问题的决定》第4条规定的鉴定人资格明显相违背,那是否可以赋予机器鉴定人资格?

依据马克思主义理论,人的主体性原则包括能动性、受动性、自主性、自为性和交互性等基本内容。大数据司法鉴定具备一定程度的能动性和自为性,根据数据库内存储的数据信息,可以自主比对检材与样本,并作出鉴定意见。但在作出鉴定意见的过程中,其难以突破技术开发人员和鉴定人员设置的技术枷锁,依然处于受限制的地位,符合受动性的表现。

大数据司法鉴定依靠数据网络实现平台之间数据的交互与共享,可以说在交互性方面已远超人类。然而,大数据司法鉴定虽然具备分析解决具体鉴定问题的能力,却没有自主学习的能力,只能依照技术人员编写好的程序代码进行计算,无法自我学习、自我改善。

因此,大数据司法鉴定并不具备法律上的人格,也不具备鉴定的主体资格。从这个层面来说,大数据司法鉴定的鉴定主体依旧是鉴定人,最终在鉴定意见书上签名的应是启动大数据司法鉴定平台的鉴定人,其需要对鉴定结果负责。

(三)大数据司法鉴定意见的证明力

相较于证据能力是一种对相关案件材料能否作为证据使用的初步审查,证明力是一种侧重于某一证据对于证明某一案件事实程度大小的深入审查。庭审活动中认定的案件事实是一种盖然性事实,而非确实性事实。

在英国数据科学家舍恩伯格看来,大数据时代只需要知道“是什么”,而不需要知道“为什么”,我们不必知道现象背后的因果关系,因为相关关系就可以帮助我们更好地了解这个世界。[36]需要注意的是,大数据所主张的相关关系并不是要将认识论中的因果关系取而代之,而是为人们提供了一种新的知识归纳与生产方式。[37]

在大数据时代,人们不再单纯关注既有结果的因果关系把握,而是根据因果关系及相关关系对潜在结果进行创构,从而实现对于因果关系的全时态把握。在哲学层面,对于因素进入相互作用前的相关关系进行分析固然重要,但在相关关系的基础上对因果关系加以深究,在人类认识世界的进程中仍然具有着重要地位。

因此,在大数据时代,因果关系反而不会退居其次,其作为相关关系的基础,反而在更大程度上体现了大数据深层次的哲学内涵。[38]可以看到,由于大数据所体现的相关关系并不是对因果关系的否定而只是因果关系的派生关系,因此大数据司法鉴定意见并不会在因果层面削弱其证明力。

但同时我们也应当注意,对于因果关系的证明还需要结合其他证据进行深入挖掘,大数据司法鉴定意见只是作为因果关系证明的辅助手段而非替代措施。


六、结语

纵观法律发展史,法律对于社会关系的调整既有回应性的,也有前瞻性的。人类已经从电子证据时代逐步过渡到大数据时代,与过去多年来科技发展给法律领域带来的种种规范挑战一样,与大数据相关的法律议题不应只是被当作一时的热门研究话题来看待。我们应该认真探讨大数据时代可能带来的法律变迁问题,也更应该以严肃的态度去思考法律人在这一时代中所要扮演的角色。

具体就司法鉴定领域而言,是否应该为大数据司法鉴定“量身定做”一套特别法或新的规范架构,以及如何避免“算法鉴定”演变为“黑箱社会”等命题,我们仍需进一步探讨。

毫无疑问的是,面对作为一种新生事物的大数据司法鉴定,学界的态度自然会在激进派与保守派之间摆荡。在这种摆荡之间,证据法学对刑事司法实践的贡献应是正视、整合、解决大数据时代司法鉴定所存在的难题,而不应否认或逃避这个难题。


中国人民大学法学院教授、博士生导师陈卫东点评:

当前司法鉴定领域的大数据技术应用只是零星散布于具体鉴定类别,无论是在学理上还是实践中,都缺乏对大数据司法鉴定的系统性研究。

论文从当前司法鉴定活动存在的信息鸿沟、鉴定方法普遍落后与有效质证偏少等实践问题出发,通过系统梳理司法鉴定活动的全流程,运用大数据方法和理念,创新性地构建全面覆盖司法鉴定委托受理环节、实施环节和质证环节的大数据司法鉴定平台,有助于解决现有问题,并提高司法鉴定的效率、增强鉴定意见的可靠性。

伴随源自新型科技领域发展的风险,大数据司法鉴定平台构建后可能存在担责主体模糊、数据算法黑箱效应造成影响以及鉴定数据缺乏等潜在问题,文章有针对性地提出明确归责主体、构建算法审查机制和配置司法鉴定数据库等举措。

因为大数据司法鉴定结论突破了传统鉴定意见的范畴,该文从证据种类、证据能力和证明力等证据学理论的视角回应并厘清了大数据平台司法鉴定结论的体系定位。

总体而言,论文选题前沿,结构严谨,具有较高的理论价值与实践意义。既有宏观实践中的平台构建与落地,也有微观理论上的证据学思考与阐述,并针对可能出现的风险点提出了与之相匹配并具可操作性的应对措施。


分享本文:

点击界面右上角按钮,在弹出框中选择“发送给朋友”或者“分享到朋友圈”

本刊微信号:faxuezazhi

本刊微信二维码:


以下点击可读:

王燃:大数据证明的机理及可靠性探究

新媒首发 | 王燃:大数据时代侦查模式的变革及其法律问题研究

程雷:大数据侦查的法律控制(完整版)

林喜芬:大数据证据在刑事司法中的运用

李训虎:刑事证明标准“中体西用”立法模式审思——兼评大数据、人工智能参与证明标准构建

李奋飞、朱梦妮:司法责任制改革的大数据方略

李奋飞、朱梦妮:大数据时代的智慧辩护

郑曦:大数据时代的刑事领域被遗忘权

北京市丰台区律协成功举办电子证据与大数据证据审查与质证互动式培训

黄云、杨子琛:虚拟货币犯罪的大数据分析与界定

黄云、李佳恩:网络犯罪案件大数据分析报告

预告 | 南开证据法课程 | 周跃:大数据证据运用的技术规则构建

大数据报告 | 文化程度与缓刑适用之大数据报告 ——基于故意伤害罪的实证分析(下)

大数据报告 | 文化程度与缓刑适用——基于故意伤害罪的实证分析(上)

宋雷昌 刘笛 | 大数据企业常涉的“三宗罪”——企业家刑事风险防控研究(三)

强烈推荐 | 游走于犯罪圈内外:大数据企业收集公民静态、动态信息进行核验的合法性分析

陈溢:警钟敲响,暗流涌动的大数据行业亟需刑事合规

瀛和下午茶 | 朱桐辉、刘欣、蔡璇:如何让大数据证据为我所用?

张烜墚:辩护中如何发掘被遗漏的客观事实?

全媒首发 | 田永伟:非法采矿案的解析、罪轻辩护及效果

新媒首发 | 何永军、谢蒙:连坐、连带责任的现代价值及其限度


编辑 | 南开大学法学院研究生  王鑫

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存