中心成果 | 程雷:大数据侦查的法律控制
程雷
中国人民大学司法数据量化研究中心执行主任;
中国人民大学法学院教授、博士生导师
大数据侦查的法律控制
【摘要】
大数据技术的迅猛发展已经成为影响世界发展格局的大趋势。大数据侦查是在大数据技术广泛应用于中外警务实践过程中出现的一类新型侦查措施,其兴起体现了用隐私换安全、用信息换权利的刑事司法发展趋势。大数据侦查突显了传统法律规范框架的滞后与失灵,表现为大数据侦查的法律属性存疑、区分数据内容与元数据的作法存在明显局限性、形成侦查初期侦查权规制的真空地带。大数据侦查本身是双刃剑,为防范其可能带来的弊端,从干预公民基本权利的深度与广度视角观之,应当对大数据侦查施加必要的法律控制。建议实行“侦查规范+数据规范”双重规制路径,有选择性地引入合法性原则与比例原则的传统规范框架,同时辅之以个人信息、数据保护方面的部分法律原则与机制。
【关键词】
大数据;大数据侦查;数据挖掘;个人信息;技术侦查措施
【文章来源】
《中国社会科学》2018年第11期。因篇幅较长,已略去原文注释。
当前,大数据技术已成为影响世界发展格局的大趋势,在自然科学、商业领域、政府管理等社会各个领域产生了直接且深远的影响。2015年10月,党的十八届五中全会明确提出实施国家大数据战略,这一技术趋势成为中国社会发展的重要驱动力。社会发展形态的变迁直接决定着作为社会控制机制重要组成部分的犯罪侦查与预防工作,大数据技术在中外警务界的侦查活动中得到愈发广泛的应用。然而,在大数据侦查蓬勃发展的背景下,包括中国在内的全球多数国家的刑事司法规范与体系均表现出滞后性,面对陌生的新型技术手段,法律规制滞后于技术发展、法学理论落后于司法实践的现象愈发突出。何为大数据侦查,如何从法律上评价大数据侦查,如何对大数据侦查进行法律控制,这些现实问题亟待在梳理、提炼实践的基础上作出理论回应。
一、大数据侦查的实践类型
大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、储存和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据技术包括对海量数据的采集、储存、清洗、分析、使用过程,其中最核心的技术为数据挖掘。数据挖掘(data mining),是指通过特定的计算机算法对大量的数据进行自动分析,从而揭示数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。数据挖掘技术在大数据趋势成熟之前就有所应用,随着人类社会拥有和可使用数据量的激增,数据挖掘技术的应用广度与深度持续拓展,在大数据时代,数据挖掘技术的作用得到了最佳的展示机会,侦查实践亦成为其深度应用的场域之一。
(一)大数据侦查的行为样态
在刑事侦查中根据使用目的的不同,数据挖掘可分为三大类:一是目标驱动型数据挖掘(target-driven data mining),也称适用对象型数据挖掘(subject-based data mining),是指针对特定明确目标进行的搜索其所有记录以获取相关信息的过程;二是比对驱动型数据挖掘(match-driven data mining),此种模式的数据挖掘用于确认某人是否已经被作为“值得关注的人”,即用于确认某人是否为已知的犯罪嫌疑人;三是事件驱动型数据挖掘(event-driven data mining),也称为模式型监控,此种数据挖掘方法并非起始于具体明确的犯罪嫌疑人,而是用于发现过去或者未来事件的违法行为人。事件驱动或者模式驱动型数据挖掘用于搜寻反常的或者事先确定的行为模式或关系模式。在各国的刑事侦查实践中,前两类数据挖掘方法早已有之并在侦查实践中得到了广泛的应用,比如查询已知犯罪嫌疑人的全部信息,通过现场遗留的指纹比对出谁是犯罪嫌疑人等,而大数据时代,数据查询与比对方法的革新之处只不过是可供查询或比对的信息库容量发生了巨幅增加,但查询与比对的方式、方法并未发生根本改变。事件驱动型的数据挖掘对于犯罪预防与实时打击意义重大,大数据技术通过对过去一定时期内的犯罪数据进行挖掘后对犯罪热点地区、犯罪人群、犯罪手法等犯罪趋势提出的科学预测,将犯罪预防与防控建立在大数据预测的犯罪规律基础之上,从而能够更为精确、科学地调动警力并实现对犯罪的精确打击。
(二)大数据侦查的应用类型
大数据技术在我国侦查实践中的应用方向,既有针对已经发生的刑事案件的回溯性侦查,用以锁定犯罪嫌疑人或查明案件事实,也有防患于未然式的对未来犯罪的预测与预警。在犯罪预测方面,北京市公安局“犯罪数据分析和趋势预测系统”是大数据技术应用的典型例证:2014年5月北京市公安局怀柔分局的上述犯罪预警系统预测提示,近期泉河派出所辖区北斜街发生盗窃案的可能性较高。怀柔公安情报信息中心根据提示,指导泉河派出所对该区域加大巡逻防控,5月7日1时许,泉河派出所巡逻至北斜街南口时,当场抓获一名盗窃汽车内财物的犯罪嫌疑人,经讯问,犯罪嫌疑人李某交代了伙同他人流窜至怀柔区,撬机动车锁并盗窃车内财物作案3起的犯罪事实。
在针对已然犯罪的刑事侦查过程中,大数据侦查在司法实践中的作用逐渐显现。通过对中国裁判文书网2016年度刑事案件法院裁判文书的检索、查阅,可以得出部分定量分析结论。在检索到的570件明确表明适用过技术侦查措施的刑事案件中,使用大数据技术锁定犯罪嫌疑人的案件为113件,涵盖的罪名根据出现频率的高低排序依次为盗窃(79件)、抢劫(13件)、抢夺(6件)、交通肇事(5件)、故意杀人(4件)以及故意伤害、绑架、非法制造买卖枪支弹药爆炸物、信用卡诈骗、诈骗、强奸案各1件。
总结上述113件个案中大数据技术的应用情况,可以发现如下应用趋势。
首先,大数据侦查的应用对象主要为作案工具或作案对象为摩托车、电动车或汽车等车辆或手机的侵财类案件及相关刑事案件,这些案件中的犯罪嫌疑人在作案中通常会产生公共场所的视频监控与手机移动轨迹的数据,两类以上的数据库信息为数据比对提供了条件。大数据技术适用的案件范围是基于适用案件的客观情状经由侦查人员自发选择加以适用的,并未受到案件严重与否、罪名范围等条件的限制,恰恰相反,样本案件显示多数案件都是轻微犯罪,适用大数据侦查主要是基于侦查便利考量。
其次,大数据侦查的主要目的是发现并锁定犯罪嫌疑人,在上述113件样本案件中绝大多数案件都是陌生人之间发生的偶发性流动犯罪,基本上无法通过犯罪现场提取有效的痕迹物证,受害人基本上无从指认出相应的犯罪嫌疑人,因此锁定犯罪嫌疑人就成为了上述案件中侦破犯罪的基本前提,也是最为关键的侦查步骤。数据来源主要集中于公共场所的视频监控与手机通讯的基站数据这两类数据库,数据比对与挖掘的内容与对象较为单一。
最后,大数据技术尽管在锁定犯罪嫌疑人这一过程中发挥了重大作用,但在完成侦查工作的第二项重要任务即收集证据材料方面作用十分有限。在570件适用技术侦查措施的裁判文书中,虽然有52例案件中技术侦查措施用作了诉讼证据,但上述113件适用大数据技术的案件均未涵括在内。换言之,大数据技术锁定犯罪嫌疑人过程中的相关材料与信息在诉讼过程中基本上无从发挥证明作用。大数据技术的应用结果在案件材料与诉讼过程中至多作为“抓获经过”、“到案经过”、“破获经过”等辅助性说明材料出现。由于这些说明性材料在内容上的模糊与缩略,一方面对于锁定犯罪嫌疑人的方式并未进行详尽、如实的说明,导致大数据技术的应用过程被极大地忽略;另一方面,也导致这些情况说明材料不属于法定的证据种类,不是证据,只能作为加强法官内心确信的辅助材料使用。
(三)大数据侦查的实践特征
首先,大数据侦查具有权利干预的普遍性与深刻性。大数据侦查通过大数据技术对海量存储信息加以充分挖掘利用,对公民个人信息乃至隐私权的干预都具有史无先例的广泛性与深刻性,公民对于大数据侦查中侦查机关收集与使用公民个人信息的过程,既不知情亦无法抗拒。
其次,大数据侦查的出现改变了侦查权的权力分布格局,侦查权逐步社会化与弥散化。大数据侦查改变了传统的侦查参与主体结构,由于大数据主要是掌握在社会机构、商业机构手中,在大数据侦查过程中,侦查机关对社会机构、商业企业机构收集的公民个人信息进行数据比对与挖掘,形成了国家—社会—个人三方参与的新型侦查主体分布模式,社会力量而非侦查机关在侦查权行使过程中的作用愈发重要。
再次,大数据侦查在应用时间节点上呈现出前瞻性与主动性。此类侦查行为主要发生在立案之前发现犯罪嫌疑的早期阶段,具有典型的“无中生有”的特点,这与传统侦查行为系针对具体的犯罪嫌疑进行的回应性侦查模式明显不同。
最后,大数据侦查的实现过程具有智能化、低风险性和常规化趋势。大数据侦查主要依赖于大数据挖掘与比对技术通过计算机自动进行,机器学习、人工智能的应用使得发现犯罪线索的工作过程逐步实现了由机器替代人工,极大提高了识别特定目标与特定事项的效率,降低了侦查过程中侦查人员人身安全的风险,正逐步成为逢案必用的常规化侦查手段。
二、大数据侦查法律控制的必要性
大数据侦查是侦查机关顺应信息社会发展潮流的明智选择,其深度应用既有助于提高犯罪预防的精确性,提升警力配置效率,也有助于增强侦查取证的科学性,提高破案效率与破案能力,带来用信息换安全的社会效果。从权利保障的角度看,大数据技术的应用将无所不在的记录与数据经过分析、挖掘得出更为客观、精确的证明犯罪过程的材料,客观上有助于改变长期以来侦查机关对口供的严重依赖,可以降低对严重干预公民隐私权的技术侦查的依赖,带来用信息换权利的法律效果。对于大数据侦查带来的侦查效能提升与侦查模式转型的积极效果,应当充分肯定。
然而,大数据侦查尚处于初始应用阶段,其双刃剑效应亦同时凸显,执法司法实践中已然暴露出一些问题,对一些基本权利和法律价值形成挑战,及时对其进行法律控制具有必要性。
首先,大数据侦查的推广适用标志着隐私逐渐受到限制,甚至有消亡的危险。边沁在1787年设计的圆形监狱概念(panopticon),在大数据时代应验成真。在大数据时代,公民个人的所有活动实现了全部数据化存储,生活、学习、人际交往间的所有活动均留存下各种类型的数据记录,当这些记录藉由大数据技术进行自动化的分析、比对之后,所有公民的一举一动甚至所思所想都被纳入系统的、广泛的监控当中,从而形成了边沁所言的每个人随时可能受到监视,但每个人却不知道何时受到监视的类似圆形监狱的效果。信息社会的特点决定了只要公民个人需要参与正常的生产、生活,就必须选择交出个人隐私,留存下各类个人信息。从这个角度来看,公民个人隐私的消亡是不可阻挡的历史发展趋势,渺小的个人在信息社会发展的大潮面前显得如此弱小与无力。当隐私消亡时,不仅仅是个人尊严、人格自治等固有的人类价值会受到威胁,从社会发展的整体角度观之,隐私权保护缺失的国度必然导致民主制度受损,也必然会威胁到公民个体创造力的发挥进而导致整个社会缺乏创造力与发展活力,国家的发展动能与样态令人堪忧。
大数据侦查植根于公民为参与信息社会生活而不得不交出并汇集的海量信息,必然带来大规模监控(mass surveillance)的效果,即全体公民的各种信息都成为了其分析对象,这是一种不以犯罪嫌疑为前提的广泛监控,全体国民甚至全球民众都可成为潜在的侦查对象,大量无罪公民的个人信息在大数据侦查的过程中被储存、比对、挖掘。
大数据侦查的广泛应用促使侦查权干预权利的类型发生转换与升级,侦查行为的对象由传统上的人身权、财产权转向平等权、隐私权、人格尊严、精神自由等基本权利和自由,权利干预的类型更加无形化、抽象化,在权利体系中的地位更接近权利构造的顶端。权利本身的无形性、抽象性令干预权利的侦查行为更难识别与感知进而导致权利的救济困难;权利位阶具备更强的政治性,则意味着与国家权力的冲突会更为剧烈。在这个意义上,对大数据侦查进行法律控制是维系国家治理体系正当性的必然要求。如果任其发展,此类侦查方法将会加剧社会不平等的裂痕,抑制社会的活力与创造力。
同时,大数据也可能犯错,错误原因主要源于两个方面:一方面大数据技术通过机器学习与人工智能,根据侦查人员设计的各种模型对数据进行挖掘,而各种算法与分析模型的来源只能是侦查经验的人为积累。人类侦查经验的局限性会照搬给机器算法,大数据的预测功能同样会产生错误。在模型建构过程中,侦查人员的自由裁量权乃至偏见会融入大数据侦查当中,形成选择性执法、执法偏见与歧视。比如,基于过于某类手法的诈骗犯罪具有较强的地域性,侦查人员会将该地区的户籍所在地设为模型要素,将其作为重点监控对象,这显然属于违反法律面前人人平等原则的选择性执法与执法歧视。类似问题在大数据应用程度较强的美国普遍存在,大数据侦查过程中,对于社会底层人群特别是有色人种的执法歧视被进一步放大,比如在大麻毒品犯罪打击过程中,尽管白人与黑人具有相同的吸食比例,但黑人犯罪嫌疑人的犯罪数据更多地被收集并存入数据库,其结果是更多的黑人犯罪嫌疑人被警察抓捕。
另一方面,大数据的挖掘或预测结果取决于数据的质量,作为源头的数据质量瑕疵将直接导致误导性甚至根本性错误。与商业领域不同,刑事司法领域的容错率相当有限,毕竟刑事司法事关公民的生命与自由。数据质量上的瑕疵将导致公民权利受到错误干预,大数据侦查的基础是正确、客观的数据库,而基于未经核实的甚至是错误的数据开展的大数据侦查将直接得出错误的推理结论,并误导着侦查机关错误干预公民权利甚至错误剥夺公民自由。无论是警方自建的各类数据库,还是利用社会第三方机构的数据库,司法实践已经反复证明,数据瑕疵与质量低下的数据经常导致错误的关联,甚至对公民自由带来直接损害。数据质量瑕疵导致无辜公民被错误抓捕的事例在国内近年来的执法实践中也屡次出现,多名无辜公民由于身份证被冒用或重名、重号等原因而被警方错误羁押。由于侦查机关相关数据库对公民信息的错录以及对数据质量管控的失责、失察,还会导致无辜公民的声誉、出行自由、参军招考、经济交往等基本权利受到侵犯。
三、传统法律规范框架的问题
人类社会迈入信息社会的发展态势与大数据侦查广泛应用的司法实践,超越了传统法律规范与法学理论所提供的规范框架。国际范围内形成于二战后的刑事诉讼法传统规范工具表现出滞后性,法律控制机制的阙如形成法律的真空或者稀薄状态,与大数据侦查的勃兴及其挑战形成鲜明对比。这一判断放在中国法的语境下依然适用。2012年刑事诉讼法修改对技术侦查措施设置了全新的规范程序,大数据侦查对刑事程序权利的干预深度与广度超过了技术侦查措施,但却处于无法可依的状态。基于比例原则的精神,干预公民基本权利的剧烈程度应当与其法律控制程序的正当性成比例,当前各国大数据侦查的法律控制强度均低于技术侦查的已有法律程序,法律控制体系严重失衡。
(一)大数据侦查的法律属性模糊
美国和德国作为两大法系的代表性国家,其各自规范大数据侦查的进路颇具代表性。美国联邦宪法第四修正案关于搜查及隐私权保障的判例法一直以来都被奉为规范政府各类获取信息行为的圭臬。1967年美国联邦最高法院裁决的Katz案是美国隐私权保障的标杆性判决,在该案中,美国联邦最高法院将联邦宪法第四修正案中搜查的界定标准由物理侵入说改为隐私保护说,隐私权保护的标准被确定为对隐私的合理期待。大数据侦查涉及对各类公民数字记录的应用,能否被视为搜查从而被纳入宪法规范视野,取决于大数据侦查是否构成干预公民对隐私的合理期待。根据美国联邦最高法院1976年Miller案和1979年Smith案确立的自愿交与第三方规则,即公民对自愿交给第三方机构保存的各类信息记录无隐私的合理期待,使用这些信息的政府行为当然不被视为搜查行为,联邦宪法第四修正案无从适用。即使经过几十年的时代变迁,面对大数据时代的来临,第三方理论仍然主导着美国的隐私权保护规则。虽然在2012年的United States v. Jones案中,美国联邦最高法院在协同意见中提出,在现代电子化时代第三方理论应加以反思,但该案并未推翻Miller案与Smith案的基本结论。总体上看,美国联邦宪法第四修正案关注的焦点在于政府执法机构未经个人同意而获取信息的搜查行为,只关心数据的获取过程,对于获取数据后的使用过程并非第四修正案的规范旨趣。数据挖掘与数据比对等大数据技术是对已经留存于社会各领域的海量数据进行后续深度应用的过程,只规范收集不规范使用的第四修正案及搜查法规范,导致在美国数据挖掘式的侦查行为基本上不受规范。
德国基本法及联邦宪法法院规范政府干预公民个人信息的工具主要是人格尊严与信息自决权,并将其视为一种积极性权利,在宪法位阶之下的德国刑事诉讼法典也详尽规定了干预公民个人信息自决权的各类侦查行为。《德国刑事诉讼法典》第98条a、b和第98条c分别规定了计算机排查侦缉和数据比对,计算机排查侦缉与英语中的数据筛查(data screening)语义相同,是指通过计算机的数据模型对数字化的信息进行挖掘、比对以确定犯罪嫌疑人或者排除犯罪嫌疑人。从工作原理上看,德国法中的计算机排查侦缉与美国法中的数据挖掘是相同的信息技术应用过程。德国法典中规定的数据比对,是指刑事诉讼中获取的个人数据与政府已经掌握的执法司法数据库进行机器比对,以查明犯罪事实或者定位被侦缉人员所在地。德国法典对计算机排查侦缉或者数据挖掘规定了严格的法定程序,而数据比对的规范密度要低得多,主要原因在于前者实施过程中可以对刑事追诉机关之外的其他部门保存的数据进行海量数据挖掘,而后者比对的数据库仅为刑事司法部门管理的数据库,二者涉及的公民个人信息自决权的干涉范围不同。对于计算机排查侦缉,《德国刑事诉讼法典》第98条a、b设置了与电话监听相当的严格程序,须遵循一系列干预公民权利的传统法律原则,比如法官令状原则、重罪原则、比例原则与最后手段原则等,同时还应遵循个人信息保护的基本法律原理,比如数据的有限使用原则、及时删除原则以及接受数据保护部门的监督。
美德两国之间对于大数据侦查法律属性的差异化处理,根源于对此类侦查措施干预权利类型的不同认识与判断。德国法认为,大数据侦查是对公民个人信息自决权与人格尊严的干预,进而应遵循干预基本权利的基本要求,在刑事诉讼法典设置严格而详尽的法定程序;美国法坚持在联邦宪法第四修正案关于搜查与隐私权保障的框架内审视数据比对与数据挖掘,其结果是无法对大数据侦查施加有效控制。两国的共同之处是,从权利干预的角度出发来界定大数据侦查的法律属性。从规制思路的社会背景看,美国法仅关注个人信息保护中的核心区域,即隐私权保护,对其他大量个人信息保护问题持放任态度,这与美国信息产业蓬勃发展并维系其信息世界领导地位的社会发展需要直接相关;而欧洲大陆国家基于二战后形成的重视人格尊严、个人自治的法治传统,对公民个人信息保护强调严格的法律控制政策,当然这也在一定程度上限制了欧洲信息产业的发展。
对中国而言,隐私权与个人信息权两种规范路径的选择各有利弊,兼顾二者并适度调试两种规范路径在未来制度体系中的权重是更妥当的选择。整体上看,中国刑事司法中对隐私权的保护有待完善,同时也面临信息社会信息使用与保护的需求,这种迭代发展的现实状况要求在刑事司法制度的设计安排上应当通盘考量两种权利路径的兼容。当然,两大法系国家的出发点都是基于权利保障的视角对待大数据侦查,这一基本出发点尤其值得我们认真对待。
在中国的制度语境中,《刑事诉讼法》第二编第二章“侦查”共规定八种法定的侦查措施;“证据”章第48条在规定证据种类时,间接确认了辨认这种侦查行为。《刑事诉讼法》第113条还概括性授权侦查机关对已经立案的刑事案件,应当进行侦查并收集、调取相关证据材料。《刑事诉讼法》第52条规定公安机关有权向有关单位和个人收集、调取证据,有关单位和个人应当如实提供证据。公安部《公安机关办理刑事案件程序规定》第59条将《刑事诉讼法》第52条规定的调取证据视为一类侦查行为,并规定相应的调取程序与法律文书。
在上述法定侦查行为中,有三项侦查行为可与大数据侦查产生关联,即搜查、调取与技术侦查。但笔者认为,上述三种侦查行为都难以作为大数据侦查的规范依据。换言之,大数据侦查的法律属性既不是搜查,也不是调取,亦不能被视为技术侦查。
首先,我国《刑事诉讼法》第134—138条规定的搜查与美国法中的搜查存在重大差异,前者仅指在被搜查人与见证人在场的情形下,对人的身体、物品、住处和其他地方等有形物或地点进行的搜索过程。大数据侦查的对象是数字化的信息,且获取、使用相关数字信息时信息主体并不知情。将大数据侦查比照为搜查进行规范,不符合我国刑事诉讼法的既有规范框架。
其次,调取并非刑事诉讼法明文规定的侦查行为,刑事诉讼法只是在“证据”章第52条第1款规定,公安机关有权向有关单位和个人收集、调取证据,有关单位和个人应当如实提供证据。根据《公安机关办理刑事案件程序规定》第57—59条以及《公安机关执法细则(第三版)》(以下简称《执法细则》)的相关规范,侦查实践中,当侦查机关发现有关单位或者个人持有与案件有关的证据时,即可予以调取,调取行为的对象是作为证据使用的实物证据,主要是物证、书证、视听资料。调取首先要表明调取的对象是与证明案件事实相关的证据材料,其次应当制作清单详细写明物品或文件的名称、编号、数量、特征等,被调取的单位和个人应签字确认调取的内容。通过上述规范内容可知,调取行为根本无法作为大数据时代对海量记录进行比对与挖掘的规范依据,大数据侦查获取的全数据样本中必然包含大量与案件无关的信息,更谈不上满足“与犯罪事实有关的证据”这一调取行为的前提条件,如果让侦查机关逐一告知海量数据的持有人,则调取行为根本不具有可行性。调取行为的本质是小数据时代针对已有一定根据表明具体的持有人持有与案件事实证明有关的证据材料,进而要求其提供的一种非强制性侦查行为,在大数据时代,调取行为的本质功能如不进行拓展,根本无法作为获取海量数据的正当化手段。
最后,大数据侦查与技术侦查措施之间也存在本质的不同。2012年刑事诉讼法修改过程中新增技术侦查措施一节以及后续公安部制定《公安机关办理刑事案件程序规定》过程中,对于技术侦查措施的内涵与外延都采取了回避态度,导致技术侦查措施包括哪些具体的措施与手段十分模糊。《公安机关办理刑事案件程序规定》第255条将技术侦查措施的范围概括为记录监控、行踪监控、通信监控、场所监控等措施,在侦查机关看来,技术侦查措施的本质是监控,上条规定中的“记录监控”虽未进一步明确,但从名称上看与大数据对海量数据、记录的比对、挖掘的过程最为相关。对这一问题的讨论,应当回归技术侦查措施的本质问题。笔者主张技术侦查措施的各类监控手段不仅应具有秘密性与技术性的特征,还应兼具同步即时性的本质要求。从立法者对已有技术侦查手段的部分列举中可以归纳出同步即时性的特征,技术侦查措施通常包括的电子侦听、电话监听、电子监控、秘密拍照或者秘密录像、秘密获取某些物证、邮件检查等专门技术手段,毫无例外均属在违法犯罪行为实施过程中同步展开的侦查行为。这与调取通讯记录或话单、查询财产等针对已储存信息的各类侦查行为在刑事诉讼法规范上存在明显区别。
正是由于现行刑事诉讼法及法律解释中侦查行为的分类无法容纳大数据侦查这一新兴侦查措施,公安部在《执法细则》中将“查询、检索、比对数据”单列为了一种侦查措施,规定进行下列侦查活动时,应当利用有关信息数据库查询、检索、比对有关数据:(1)核查犯罪嫌疑人身份的;(2)核查犯罪嫌疑人前科信息的;(3)查找无名尸体、失踪人员的;(4)查找犯罪、犯罪嫌疑人线索的;(5)查找被盗抢的机动车、枪支、违禁品以及其他物品的;(6)分析案情和犯罪规律,串并案件,确定下步侦查方向的。这一规定凸显出数据比对、挖掘等大数据侦查技术的独立性,侦查部门也认识到此类侦查措施与刑事诉讼法已经规定的传统侦查行为之间的差异以及单独予以规范的必要性。当然,由于《执法细则》本身属于内部规范,仅限公安机关内部适用,不得在法律文书中引用,不向外部单位、个人公开,这些特点导致《执法细则》欠缺法律文件的基本属性,相应的大数据侦查依然处于无法可依的状态。
迄今为止,人类社会经历了从农业社会到工业社会、再到信息社会的演进,刑事诉讼法对权利的保护重点也相应经历着由关注人身自由权到财产权、再到公民个人信息隐私权的变迁。大数据侦查在为侦查机关提供更高效的犯罪控制工具的同时,对公民个人信息隐私的干预程度超出传统侦查措施。信息社会发展至今,超过98%的信息都已转化为数字化记录,大数据技术得以对全数据进行分析、挖掘与应用。在迅速扩散的信息技术面前,规范隐私权的工具不能适应大数据时代的发展需要,因为社会与个人都需要依赖于海量个人信息的共享获得发展动力。传统法律规范缺失与滞后的主要原因在于其仅仅关注信息搜集过程,而对大数据背景下的如下核心问题完全忽略:当公民基于适应现代信息社会的必然要求而留存在社会各个机构的数字记录,侦查机关将这些记录改变最初留存目的用于侦查工作时,法律应当如何评价侦查机关的行为以及设定何种法定程序。我国刑事诉讼法的相关规定比较抽象,且法律解释工作相对滞后,对大数据侦查的本质和法律属性的认识与处理落后于大数据时代的发展步伐,司法实践中对大数据法律属性的认识盲区导致多层级的侦查部门大数据侦查技术的应用处于无序的发展状态,同时囿于法律授权的阙如,侦查机关的数据共享与合理利用也面临瓶颈。
由于数字化时代对隐私权的干预方式主要是通过收集电子通讯的形式要素,再通过大数据的挖掘、分析技术深描出个人的完整信息,在传统观点下,这些通讯形式方面的信息与通讯内容不同,不是隐私权保障的对象。大多数国家对通讯形式的法律保护力度远低于通讯内容,在我国刑事诉讼中亦是如此,虽然法律文本上并未区分通讯内容与通讯形式,但司法实践中调取通话记录的适用频率远远高于对通讯内容的监控。这一传统观点在大数据时代的局限性愈发明显,因为大数据的本质就是对多样化的海量记录进行集成、碰撞以产生预见性的知识,从某种意义上讲,通讯的形式包括位置信息、通话时长、通话对象等比通讯内容更有价值。2014年联合国人权事务委员会在其提交给联合国大会的专题报告中呼吁各成员国与时俱进地摒弃上述传统思维,在新信息技术背景下树立全新的信息保护理念,区分通讯形式与内容从保护隐私权的角度来看是不具有说服力的,因为信息的合成,通常称之为元数据(metadata),能够显示个人行为、社会关系、私人嗜好、身份等方方面面的信息,甚至比通讯内容更能全面地揭示一个人。
在英美法系的代表国家美国,法律规范警察执法权的起点是警察权对公民自由的干预,始于警察对公民的截停,自此刻起联邦宪法第四修正案为警察权启动设置的事实要件为合理怀疑(probable suspicion)。对于警察针对某人截停前的发现、判断犯罪嫌疑的过程,美国联邦宪法基本上不予评价,委诸警察根据自己的经验以及具体案件、对象的个案情况进行自由裁量。大数据技术在侦查初期的应用增强了警察发现犯罪嫌疑人信息的能力,凸显出合理怀疑标准的固有漏洞,也暴露出该标准的脆弱性。大数据对潜在犯罪嫌疑人的强大识别功能,令原本设置在警察权启动之初的门槛性条件流于形式。
为防止侦查权的恣意启动、任意干预公民权利,我国刑事诉讼法将立案程序设置为刑事诉讼的起始程序,规定只有在立案之后侦查机关方可行使侦查权。“认为有犯罪事实需要追究刑事责任”是立案的事实证据要求,为发现犯罪线索或者确认是否达到启动侦查的事实门槛,相关法律解释进一步规定了立案前的初查程序,允许侦查机关采取不限制被调查对象人身权与财产权的各类措施。但上述法律规范严重滞后于大数据侦查技术的应用实际,侦查机关对海量数据记录的查询、比对、碰撞正在成为锁定犯罪嫌疑人的重要方法,由于其应用时段多在立案前的初查阶段,甚至在并无具体犯罪嫌疑的前嫌疑阶段使用以达到“无中生有”的预测犯罪或者抓获现行犯的重要作用,其深度应用的同时也逐渐侵蚀甚至架空了立案程序的立法目的。
总体上看,大数据技术在侦查初期的广泛应用在各个法系国家都导致基于限制警察权而设置的侦查启动门槛流于形式,已然犯罪与现行犯、即将发生的未然犯之间的界限愈发模糊。大数据技术令警察权突破了传统法律框架在起点环节上的约束,形成了初期侦查权规制的法律真空。
四、通过侦查规范的法律控制
五、通过数据规范的法律控制
之所以强调适度应用,主要是基于两个方面的考量:一方面大数据侦查的兴起是侦查方式顺应信息社会蓬勃发展的社会发展规律的产物,信息是信息社会最为重要的发展资源,也必将作为社会治理方式的核心要素,从这个角度来看,积极利用海量数据发展大数据侦查是社会发展的必然要求。个人信息的范围大于个人隐私,个人信息权的权能较之隐私权更为积极主动,个人信息保护机制的内涵与制度设计也与隐私权的保障原则、理念存在诸多不同。刑事司法承载的国家安全、社会安全等一系列社会价值与公民个人信息的保护之间应当进行相应的权衡,引入个人信息保护机制只能是适度进行,国家为履行在信息社会条件下保护国民安全的使命可以干预公民的个人信息权,但应当遵循最低限度的个人信息保护规则。另一方面,也应当认识到个人信息保护的不少法律机制与侦查的既定目的和侦查规律不无冲突。比如个人信息公平保护实践要求对个人信息的使用应当坚持自愿同意原则、公开透明原则,然而,防范反侦查的执法目的以及侦查效率的要求使得侦查机关无法在利用海量个人信息前征得各个信息主体的知情同意,大数据侦查模型中的算法设计过程也因为涉及侦查经验、犯罪规律等侦查秘密,基本无从做到公开算法。因此对于信息公平实践中的知情同意、算法公开透明等原则,在大数据侦查的规范体系中只能适度应用。
在我国个人信息保护法出台前,对大数据侦查的规制,建议引入如下个人信息保护方面的法律原则和机制。
(二)信息主体的知悉权与更正权
侦查过程中,根据比例原则的要求,对于公民信息应当实行分级管理,对于公民个人敏感信息,在刑事司法与侦查活动中应当重点保护,设置更高的审批权限与启动事实条件。公民个人敏感信息是指那些一旦遭到泄露或修改,会对标识的个人信息主体造成不良影响的个人信息。刑事司法中的个人信息至少包括行踪轨迹信息、通信内容、征信信息、财产信息以及住宿信息、通信记录、健康生理信息、交易信息等。
数据质量控制机制是大数据侦查正确展开、防止侦查错误的基础性制度,数据收集主体包括商业机构、社会机构与侦查机关均应当根据《网络安全法》等相关法律的规定建立确保数据真实性的相关机制,侦查机关在开展大数据侦查过程中应当通过数据清洗、多库交叉检验等方式验证数据的真实性。禁止包括侦查机关在内的数据使用者、管理者共享、传输无法验证真实性、过时的相关数据,同时数据使用者与管理者也负有及时修正虚假、过时信息的相应义务。
结语
大数据侦查这一方兴未艾的新型侦查行为,也为刑事诉讼法学传统理论提出许多新的研究课题,客观上推动着刑事诉讼法学研究范式的转型。首先,大数据侦查凸显出无罪推定这一现代刑事诉讼基本原则存在适用空间上的边界,其无法向前延伸至犯罪嫌疑产生之前的前嫌疑阶段。恰恰是在前嫌疑阶段,大数据侦查应用空间广泛,其重要价值是在刑事司法程序开始前发现启动刑事司法程序的信息与线索,而无罪推定原则无论是作为狭义的证据规则还是作为广义上的权利保障原则,都无法在被追诉人产生之前的前嫌疑阶段予以适用。现代刑事诉讼法的绝大多数原则与规则都是建立在无罪推定原则基础上的,其在大数据侦查中的适用真空附带导致多数诉讼规则与制度的空转。现代刑事诉讼法学理论必须继续探索发展其理论范畴填补这一空白。其次,以尊重和保障人权为重要使命的刑事诉讼法传统上关注的权利类型主要是人身权、财产权与隐私权,大数据侦查的出现使得权利干预类型进一步无形化,传统权利干预形态逐渐为大数据侦查所替代,监控社会的到来也就意味着绝大多数犯罪过程会被如实记录,追诉犯罪的过程越来越不需要依赖干预传统权利的各类侦查行为,但同时监控社会的加速形成会引发人们对言论自由、思想自由的忧虑,算法歧视会带来平等权保护的迫切需要,刑事诉讼法学的研究需要关注这些课题,才能在更为宏大的视角之下合理规范大数据侦查。
从大数据未来发展方向的角度观之,有三大趋势值得持续关注。第一,大数据侦查的深度应用将升级犯罪的类型,导致犯罪打击的难度逐步上升,在侦查与反侦查的多轮较量中,街头犯罪、暴力犯罪将会因为大数据侦查的有效打击而逐步退出历史舞台,相应的犯罪人群将进一步转向更为隐形化的经济犯罪,同时为规避大数据记录的搜集,犯罪的地点将更为全球化,基于境外实施的各类犯罪类型将进一步多发。侦查机关应用大数据的过程中需要不断培养专业分析人才、研发新型算法模型以适应愈发隐蔽、变化的新型犯罪手法,同时还应当开始探索数据全球化共享的规则与机制,建立数据司法协助的相应制度安排。
第二,伴随着我国刑事司法制度中以审判为中心的改革逐步推进,证明标准、证据规则的严格适用对侦查机关取证的规范性提出了越来越高的要求。伴随着大数据侦查在案件侦破中发挥的作用愈发突出,法庭对其证明作用的需求也就会日益凸显。实现大数据侦查由“幕后”走向“台前”,需要对大数据证据问题展开进一步研究。现有证据法的理论与规则提供的解决方案极为有限,比如大数据侦查的分析结论归于何种证据种类、适用何种证据规则;如何进行人脸识别、声音视频、生物信息识别上的同一认定;如何在庭审上对大数据证据进行质证、如何在保障质证权与保守侦查方法秘密之间寻求有效平衡;等等。诸多证据法问题都需要未雨绸缪展开研究,迎接大数据侦查的常态应用所引发的刑事审判方式变革。
第三,大数据侦查的发展将改变政府与商业机构在刑事司法中的关系格局,刑事司法界应当开始关注如何在法律上评判二者之间的相关关系这一全新课题。大数据侦查的数据来源除了政府各部门基于政府管理需要而收集、储存的数据之外,多数的海量信息来源于商业机构为公民提供日常生活服务、经济交往当中储存的各类信息。大数据侦查越来越多地需要与商业机构的数据库互通共享,而传统刑事司法的规范原理是规制公权、保障私权。如何跨越这一规范鸿沟,需要法学界与法律界进一步思索。
图文编辑:姚敏、吴苗
校对:刘中原