大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、储存和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。大数据技术包括对海量数据的采集、储存、清洗、分析、使用过程,其中最核心的技术为数据挖掘。数据挖掘(data mining),是指通过特定的计算机算法对大量的数据进行自动分析,从而揭示数据之间隐藏的关系、模式和趋势,为决策者提供新的知识。数据挖掘技术在大数据趋势成熟之前就有所应用,随着人类社会拥有和可使用数据量的激增,数据挖掘技术的应用广度与深度持续拓展,在大数据时代,数据挖掘技术的作用得到了最佳的展示机会,侦查实践亦成为其深度应用的场域之一。(一)大数据侦查的行为样态大数据侦查,是指通过计算机技术对存储于网络与计算机系统中的海量数据进行收集、共享、清洗、比对和挖掘,从而发现犯罪线索、证据信息或者犯罪嫌疑人的侦查措施与方法。其中数据查询、数据比对与数据挖掘是大数据侦查的三种具体行为样态。刑事侦查工作的核心任务是发现犯罪嫌疑人、收集相关证据,以查明案件事实,其中最为基础性与源头性的工作是锁定犯罪嫌疑人,否则以被追诉人为对象的刑事司法程序根本无从展开。锁定犯罪嫌疑人必然依赖于能够识别犯罪人的个别化信息,而这一任务恰恰是大数据技术的优势所在。大数据技术具备从海量数据中比对、挖掘、识别个人信息的强大功能,这能为侦查机关履行传统侦查职能提供高效、简便的智能辅助支持。另一方面,伴随着现代社会的加速发展与剧烈转型,犯罪愈发隐形化、智能化,加之恐怖主义犯罪在全球的泛滥,犯罪的严重后果令犯罪预防越来越优先于案发后的侦查与打击,将犯罪消灭在萌芽状态或者在犯罪现场即时破获案件成为了侦查隐形犯罪与恐怖主义犯罪的当务之急。因此大数据预测未来的功能在犯罪预防领域也变得愈发重要。在刑事侦查中根据使用目的的不同,数据挖掘可分为三大类:一是目标驱动型数据挖掘(target-driven data mining),也称适用对象型数据挖掘(subject-based data mining),是指针对特定明确目标进行的搜索其所有记录以获取相关信息的过程;二是比对驱动型数据挖掘(match-driven data mining),此种模式的数据挖掘用于确认某人是否已经被作为“值得关注的人”,即用于确认某人是否为已知的犯罪嫌疑人;三是事件驱动型数据挖掘(event-driven data mining),也称为模式型监控,此种数据挖掘方法并非起始于具体明确的犯罪嫌疑人,而是用于发现过去或者未来事件的违法行为人。事件驱动或者模式驱动型数据挖掘用于搜寻反常的或者事先确定的行为模式或关系模式。在各国的刑事侦查实践中,前两类数据挖掘方法早已有之并在侦查实践中得到了广泛的应用,比如查询已知犯罪嫌疑人的全部信息,通过现场遗留的指纹比对出谁是犯罪嫌疑人等,而大数据时代,数据查询与比对方法的革新之处只不过是可供查询或比对的信息库容量发生了巨幅增加,但查询与比对的方式、方法并未发生根本改变。事件驱动型的数据挖掘对于犯罪预防与实时打击意义重大,大数据技术通过对过去一定时期内的犯罪数据进行挖掘后对犯罪热点地区、犯罪人群、犯罪手法等犯罪趋势提出的科学预测,将犯罪预防与防控建立在大数据预测的犯罪规律基础之上,从而能够更为精确、科学地调动警力并实现对犯罪的精确打击。(二)大数据侦查的应用类型大数据技术在刑事侦查中的应用前提是收集海量数据并形成各类数据库,这是数据查询、比对与挖掘技术应用的基础。从我国公安机关使用数据库查询、比对、分析各种记录的发展状况来看,自1998年公安部启动“金盾工程”开始,各类数据库建设与应用就逐步成为重要的侦查手段,2008年起公安部进一步开始了公安大情报系统的建设,当前公安机关内网联网运行的各类信息系统已达7000多个,已建成以全国人口信息库为代表的八大全国公安基础信息库(全国重大案件、在逃人员、出所人员、违法人员、盗抢汽车、未名尸体、失踪人员、杀人案件),存储了数百亿条基础数据。此外公安机关还积极运用各类社会管理中建设的数据库,利用各类信息资源开展侦查,包括互联网信息资源、视频监控信息资源、通讯信息资源、银行卡信息资源、各类社会服务中的信息,如保险、民航、工商、税务、邮政、社保、劳务、房产、公路、出租车、二手车交易、物流、出版印刷、房屋交易等。上述各类数据库中的海量记录涵盖了信息社会中人们生活、工作、社交等方方面面的信息,对这些大数据进行比对、分析已经成为当前侦查实践中提升破案率的主要驱动力。大数据技术在我国侦查实践中的应用方向,既有针对已经发生的刑事案件的回溯性侦查,用以锁定犯罪嫌疑人或查明案件事实,也有防患于未然式的对未来犯罪的预测与预警。在犯罪预测方面,北京市公安局“犯罪数据分析和趋势预测系统”是大数据技术应用的典型例证:2014年5月北京市公安局怀柔分局的上述犯罪预警系统预测提示,近期泉河派出所辖区北斜街发生盗窃案的可能性较高。怀柔公安情报信息中心根据提示,指导泉河派出所对该区域加大巡逻防控,5月7日1时许,泉河派出所巡逻至北斜街南口时,当场抓获一名盗窃汽车内财物的犯罪嫌疑人,经讯问,犯罪嫌疑人李某交代了伙同他人流窜至怀柔区,撬机动车锁并盗窃车内财物作案3起的犯罪事实。在针对已然犯罪的刑事侦查过程中,大数据侦查在司法实践中的作用逐渐显现。通过对中国裁判文书网2016年度刑事案件法院裁判文书的检索、查阅,可以得出部分定量分析结论。在检索到的570件明确表明适用过技术侦查措施的刑事案件中,使用大数据技术锁定犯罪嫌疑人的案件为113件,涵盖的罪名根据出现频率的高低排序依次为盗窃(79件)、抢劫(13件)、抢夺(6件)、交通肇事(5件)、故意杀人(4件)以及故意伤害、绑架、非法制造买卖枪支弹药爆炸物、信用卡诈骗、诈骗、强奸案各1件。总结上述113件个案中大数据技术的应用情况,可以发现如下应用趋势。首先,大数据侦查的应用对象主要为作案工具或作案对象为摩托车、电动车或汽车等车辆或手机的侵财类案件及相关刑事案件,这些案件中的犯罪嫌疑人在作案中通常会产生公共场所的视频监控与手机移动轨迹的数据,两类以上的数据库信息为数据比对提供了条件。大数据技术适用的案件范围是基于适用案件的客观情状经由侦查人员自发选择加以适用的,并未受到案件严重与否、罪名范围等条件的限制,恰恰相反,样本案件显示多数案件都是轻微犯罪,适用大数据侦查主要是基于侦查便利考量。其次,大数据侦查的主要目的是发现并锁定犯罪嫌疑人,在上述113件样本案件中绝大多数案件都是陌生人之间发生的偶发性流动犯罪,基本上无法通过犯罪现场提取有效的痕迹物证,受害人基本上无从指认出相应的犯罪嫌疑人,因此锁定犯罪嫌疑人就成为了上述案件中侦破犯罪的基本前提,也是最为关键的侦查步骤。数据来源主要集中于公共场所的视频监控与手机通讯的基站数据这两类数据库,数据比对与挖掘的内容与对象较为单一。最后,大数据技术尽管在锁定犯罪嫌疑人这一过程中发挥了重大作用,但在完成侦查工作的第二项重要任务即收集证据材料方面作用十分有限。在570件适用技术侦查措施的裁判文书中,虽然有52例案件中技术侦查措施用作了诉讼证据,但上述113件适用大数据技术的案件均未涵括在内。换言之,大数据技术锁定犯罪嫌疑人过程中的相关材料与信息在诉讼过程中基本上无从发挥证明作用。大数据技术的应用结果在案件材料与诉讼过程中至多作为“抓获经过”、“到案经过”、“破获经过”等辅助性说明材料出现。由于这些说明性材料在内容上的模糊与缩略,一方面对于锁定犯罪嫌疑人的方式并未进行详尽、如实的说明,导致大数据技术的应用过程被极大地忽略;另一方面,也导致这些情况说明材料不属于法定的证据种类,不是证据,只能作为加强法官内心确信的辅助材料使用。(三)大数据侦查的实践特征与传统侦查行为相比,大数据侦查在实践运行中呈现出以下四项特征,恰恰是这些独特属性显示出对其进行法律规制的极大必要性,也从根本上影响着相应的规范工具与立场。首先,大数据侦查具有权利干预的普遍性与深刻性。大数据侦查通过大数据技术对海量存储信息加以充分挖掘利用,对公民个人信息乃至隐私权的干预都具有史无先例的广泛性与深刻性,公民对于大数据侦查中侦查机关收集与使用公民个人信息的过程,既不知情亦无法抗拒。其次,大数据侦查的出现改变了侦查权的权力分布格局,侦查权逐步社会化与弥散化。大数据侦查改变了传统的侦查参与主体结构,由于大数据主要是掌握在社会机构、商业机构手中,在大数据侦查过程中,侦查机关对社会机构、商业企业机构收集的公民个人信息进行数据比对与挖掘,形成了国家—社会—个人三方参与的新型侦查主体分布模式,社会力量而非侦查机关在侦查权行使过程中的作用愈发重要。再次,大数据侦查在应用时间节点上呈现出前瞻性与主动性。此类侦查行为主要发生在立案之前发现犯罪嫌疑的早期阶段,具有典型的“无中生有”的特点,这与传统侦查行为系针对具体的犯罪嫌疑进行的回应性侦查模式明显不同。最后,大数据侦查的实现过程具有智能化、低风险性和常规化趋势。大数据侦查主要依赖于大数据挖掘与比对技术通过计算机自动进行,机器学习、人工智能的应用使得发现犯罪线索的工作过程逐步实现了由机器替代人工,极大提高了识别特定目标与特定事项的效率,降低了侦查过程中侦查人员人身安全的风险,正逐步成为逢案必用的常规化侦查手段。
人类社会迈入信息社会的发展态势与大数据侦查广泛应用的司法实践,超越了传统法律规范与法学理论所提供的规范框架。国际范围内形成于二战后的刑事诉讼法传统规范工具表现出滞后性,法律控制机制的阙如形成法律的真空或者稀薄状态,与大数据侦查的勃兴及其挑战形成鲜明对比。这一判断放在中国法的语境下依然适用。2012年刑事诉讼法修改对技术侦查措施设置了全新的规范程序,大数据侦查对刑事程序权利的干预深度与广度超过了技术侦查措施,但却处于无法可依的状态。基于比例原则的精神,干预公民基本权利的剧烈程度应当与其法律控制程序的正当性成比例,当前各国大数据侦查的法律控制强度均低于技术侦查的已有法律程序,法律控制体系严重失衡。(一)大数据侦查的法律属性模糊对一项全新科学技术在刑事侦查中的应用进行法律规范首先应当明晰其法律属性,大数据侦查属于何种侦查措施是对其进行规范的前置性问题。对于这一问题,有两种不同的解决方案:如果能够将大数据侦查归为传统侦查行为当中,就可以依照既有的法律规范遵照实施;如果传统的法律框架无法容纳下这一新技术,则需要修改法律创设全新的法律规范框架。面对这一新技术浪潮,不同法治传统的国家基于各自不同国情在上述两种解决方案上选择各不相同。美国和德国作为两大法系的代表性国家,其各自规范大数据侦查的进路颇具代表性。美国联邦宪法第四修正案关于搜查及隐私权保障的判例法一直以来都被奉为规范政府各类获取信息行为的圭臬。1967年美国联邦最高法院裁决的Katz案是美国隐私权保障的标杆性判决,在该案中,美国联邦最高法院将联邦宪法第四修正案中搜查的界定标准由物理侵入说改为隐私保护说,隐私权保护的标准被确定为对隐私的合理期待。大数据侦查涉及对各类公民数字记录的应用,能否被视为搜查从而被纳入宪法规范视野,取决于大数据侦查是否构成干预公民对隐私的合理期待。根据美国联邦最高法院1976年Miller案和1979年Smith案确立的自愿交与第三方规则,即公民对自愿交给第三方机构保存的各类信息记录无隐私的合理期待,使用这些信息的政府行为当然不被视为搜查行为,联邦宪法第四修正案无从适用。即使经过几十年的时代变迁,面对大数据时代的来临,第三方理论仍然主导着美国的隐私权保护规则。虽然在2012年的United States v. Jones案中,美国联邦最高法院在协同意见中提出,在现代电子化时代第三方理论应加以反思,但该案并未推翻Miller案与Smith案的基本结论。总体上看,美国联邦宪法第四修正案关注的焦点在于政府执法机构未经个人同意而获取信息的搜查行为,只关心数据的获取过程,对于获取数据后的使用过程并非第四修正案的规范旨趣。数据挖掘与数据比对等大数据技术是对已经留存于社会各领域的海量数据进行后续深度应用的过程,只规范收集不规范使用的第四修正案及搜查法规范,导致在美国数据挖掘式的侦查行为基本上不受规范。德国基本法及联邦宪法法院规范政府干预公民个人信息的工具主要是人格尊严与信息自决权,并将其视为一种积极性权利,在宪法位阶之下的德国刑事诉讼法典也详尽规定了干预公民个人信息自决权的各类侦查行为。《德国刑事诉讼法典》第98条a、b和第98条c分别规定了计算机排查侦缉和数据比对,计算机排查侦缉与英语中的数据筛查(data screening)语义相同,是指通过计算机的数据模型对数字化的信息进行挖掘、比对以确定犯罪嫌疑人或者排除犯罪嫌疑人。从工作原理上看,德国法中的计算机排查侦缉与美国法中的数据挖掘是相同的信息技术应用过程。德国法典中规定的数据比对,是指刑事诉讼中获取的个人数据与政府已经掌握的执法司法数据库进行机器比对,以查明犯罪事实或者定位被侦缉人员所在地。德国法典对计算机排查侦缉或者数据挖掘规定了严格的法定程序,而数据比对的规范密度要低得多,主要原因在于前者实施过程中可以对刑事追诉机关之外的其他部门保存的数据进行海量数据挖掘,而后者比对的数据库仅为刑事司法部门管理的数据库,二者涉及的公民个人信息自决权的干涉范围不同。对于计算机排查侦缉,《德国刑事诉讼法典》第98条a、b设置了与电话监听相当的严格程序,须遵循一系列干预公民权利的传统法律原则,比如法官令状原则、重罪原则、比例原则与最后手段原则等,同时还应遵循个人信息保护的基本法律原理,比如数据的有限使用原则、及时删除原则以及接受数据保护部门的监督。美德两国之间对于大数据侦查法律属性的差异化处理,根源于对此类侦查措施干预权利类型的不同认识与判断。德国法认为,大数据侦查是对公民个人信息自决权与人格尊严的干预,进而应遵循干预基本权利的基本要求,在刑事诉讼法典设置严格而详尽的法定程序;美国法坚持在联邦宪法第四修正案关于搜查与隐私权保障的框架内审视数据比对与数据挖掘,其结果是无法对大数据侦查施加有效控制。两国的共同之处是,从权利干预的角度出发来界定大数据侦查的法律属性。从规制思路的社会背景看,美国法仅关注个人信息保护中的核心区域,即隐私权保护,对其他大量个人信息保护问题持放任态度,这与美国信息产业蓬勃发展并维系其信息世界领导地位的社会发展需要直接相关;而欧洲大陆国家基于二战后形成的重视人格尊严、个人自治的法治传统,对公民个人信息保护强调严格的法律控制政策,当然这也在一定程度上限制了欧洲信息产业的发展。对中国而言,隐私权与个人信息权两种规范路径的选择各有利弊,兼顾二者并适度调试两种规范路径在未来制度体系中的权重是更妥当的选择。整体上看,中国刑事司法中对隐私权的保护有待完善,同时也面临信息社会信息使用与保护的需求,这种迭代发展的现实状况要求在刑事司法制度的设计安排上应当通盘考量两种权利路径的兼容。当然,两大法系国家的出发点都是基于权利保障的视角对待大数据侦查,这一基本出发点尤其值得我们认真对待。在中国的制度语境中,《刑事诉讼法》第二编第二章“侦查”共规定八种法定的侦查措施;“证据”章第48条在规定证据种类时,间接确认了辨认这种侦查行为。《刑事诉讼法》第113条还概括性授权侦查机关对已经立案的刑事案件,应当进行侦查并收集、调取相关证据材料。《刑事诉讼法》第52条规定公安机关有权向有关单位和个人收集、调取证据,有关单位和个人应当如实提供证据。公安部《公安机关办理刑事案件程序规定》第59条将《刑事诉讼法》第52条规定的调取证据视为一类侦查行为,并规定相应的调取程序与法律文书。在上述法定侦查行为中,有三项侦查行为可与大数据侦查产生关联,即搜查、调取与技术侦查。但笔者认为,上述三种侦查行为都难以作为大数据侦查的规范依据。换言之,大数据侦查的法律属性既不是搜查,也不是调取,亦不能被视为技术侦查。首先,我国《刑事诉讼法》第134—138条规定的搜查与美国法中的搜查存在重大差异,前者仅指在被搜查人与见证人在场的情形下,对人的身体、物品、住处和其他地方等有形物或地点进行的搜索过程。大数据侦查的对象是数字化的信息,且获取、使用相关数字信息时信息主体并不知情。将大数据侦查比照为搜查进行规范,不符合我国刑事诉讼法的既有规范框架。其次,调取并非刑事诉讼法明文规定的侦查行为,刑事诉讼法只是在“证据”章第52条第1款规定,公安机关有权向有关单位和个人收集、调取证据,有关单位和个人应当如实提供证据。根据《公安机关办理刑事案件程序规定》第57—59条以及《公安机关执法细则(第三版)》(以下简称《执法细则》)的相关规范,侦查实践中,当侦查机关发现有关单位或者个人持有与案件有关的证据时,即可予以调取,调取行为的对象是作为证据使用的实物证据,主要是物证、书证、视听资料。调取首先要表明调取的对象是与证明案件事实相关的证据材料,其次应当制作清单详细写明物品或文件的名称、编号、数量、特征等,被调取的单位和个人应签字确认调取的内容。通过上述规范内容可知,调取行为根本无法作为大数据时代对海量记录进行比对与挖掘的规范依据,大数据侦查获取的全数据样本中必然包含大量与案件无关的信息,更谈不上满足“与犯罪事实有关的证据”这一调取行为的前提条件,如果让侦查机关逐一告知海量数据的持有人,则调取行为根本不具有可行性。调取行为的本质是小数据时代针对已有一定根据表明具体的持有人持有与案件事实证明有关的证据材料,进而要求其提供的一种非强制性侦查行为,在大数据时代,调取行为的本质功能如不进行拓展,根本无法作为获取海量数据的正当化手段。最后,大数据侦查与技术侦查措施之间也存在本质的不同。2012年刑事诉讼法修改过程中新增技术侦查措施一节以及后续公安部制定《公安机关办理刑事案件程序规定》过程中,对于技术侦查措施的内涵与外延都采取了回避态度,导致技术侦查措施包括哪些具体的措施与手段十分模糊。《公安机关办理刑事案件程序规定》第255条将技术侦查措施的范围概括为记录监控、行踪监控、通信监控、场所监控等措施,在侦查机关看来,技术侦查措施的本质是监控,上条规定中的“记录监控”虽未进一步明确,但从名称上看与大数据对海量数据、记录的比对、挖掘的过程最为相关。对这一问题的讨论,应当回归技术侦查措施的本质问题。笔者主张技术侦查措施的各类监控手段不仅应具有秘密性与技术性的特征,还应兼具同步即时性的本质要求。从立法者对已有技术侦查手段的部分列举中可以归纳出同步即时性的特征,技术侦查措施通常包括的电子侦听、电话监听、电子监控、秘密拍照或者秘密录像、秘密获取某些物证、邮件检查等专门技术手段,毫无例外均属在违法犯罪行为实施过程中同步展开的侦查行为。这与调取通讯记录或话单、查询财产等针对已储存信息的各类侦查行为在刑事诉讼法规范上存在明显区别。正是由于现行刑事诉讼法及法律解释中侦查行为的分类无法容纳大数据侦查这一新兴侦查措施,公安部在《执法细则》中将“查询、检索、比对数据”单列为了一种侦查措施,规定进行下列侦查活动时,应当利用有关信息数据库查询、检索、比对有关数据:(1)核查犯罪嫌疑人身份的;(2)核查犯罪嫌疑人前科信息的;(3)查找无名尸体、失踪人员的;(4)查找犯罪、犯罪嫌疑人线索的;(5)查找被盗抢的机动车、枪支、违禁品以及其他物品的;(6)分析案情和犯罪规律,串并案件,确定下步侦查方向的。这一规定凸显出数据比对、挖掘等大数据侦查技术的独立性,侦查部门也认识到此类侦查措施与刑事诉讼法已经规定的传统侦查行为之间的差异以及单独予以规范的必要性。当然,由于《执法细则》本身属于内部规范,仅限公安机关内部适用,不得在法律文书中引用,不向外部单位、个人公开,这些特点导致《执法细则》欠缺法律文件的基本属性,相应的大数据侦查依然处于无法可依的状态。迄今为止,人类社会经历了从农业社会到工业社会、再到信息社会的演进,刑事诉讼法对权利的保护重点也相应经历着由关注人身自由权到财产权、再到公民个人信息隐私权的变迁。大数据侦查在为侦查机关提供更高效的犯罪控制工具的同时,对公民个人信息隐私的干预程度超出传统侦查措施。信息社会发展至今,超过98%的信息都已转化为数字化记录,大数据技术得以对全数据进行分析、挖掘与应用。在迅速扩散的信息技术面前,规范隐私权的工具不能适应大数据时代的发展需要,因为社会与个人都需要依赖于海量个人信息的共享获得发展动力。传统法律规范缺失与滞后的主要原因在于其仅仅关注信息搜集过程,而对大数据背景下的如下核心问题完全忽略:当公民基于适应现代信息社会的必然要求而留存在社会各个机构的数字记录,侦查机关将这些记录改变最初留存目的用于侦查工作时,法律应当如何评价侦查机关的行为以及设定何种法定程序。我国刑事诉讼法的相关规定比较抽象,且法律解释工作相对滞后,对大数据侦查的本质和法律属性的认识与处理落后于大数据时代的发展步伐,司法实践中对大数据法律属性的认识盲区导致多层级的侦查部门大数据侦查技术的应用处于无序的发展状态,同时囿于法律授权的阙如,侦查机关的数据共享与合理利用也面临瓶颈。(二)数据内容与元数据区别化处理的局限性传统侦查过程对信息内容的重视程度远超过信息的形式,因为信息的内容可以直接作为证明犯罪的证据使用,而信息的形式主要是辅助证明信息的来源,其重要性不如信息的内容。数据信息的形式,即元数据是关于数据的数据或关于信息的信息,其表示的是数据的存在形式与产生过程,只要人们使用任何一种电子产品或者电子服务,都会产生元数据,以电子通讯为例,其主要包括通讯的时间、地点、时长、通讯双方的地址或号码,使用的电子设备及其唯一识别码。由于数字化时代对隐私权的干预方式主要是通过收集电子通讯的形式要素,再通过大数据的挖掘、分析技术深描出个人的完整信息,在传统观点下,这些通讯形式方面的信息与通讯内容不同,不是隐私权保障的对象。大多数国家对通讯形式的法律保护力度远低于通讯内容,在我国刑事诉讼中亦是如此,虽然法律文本上并未区分通讯内容与通讯形式,但司法实践中调取通话记录的适用频率远远高于对通讯内容的监控。这一传统观点在大数据时代的局限性愈发明显,因为大数据的本质就是对多样化的海量记录进行集成、碰撞以产生预见性的知识,从某种意义上讲,通讯的形式包括位置信息、通话时长、通话对象等比通讯内容更有价值。2014年联合国人权事务委员会在其提交给联合国大会的专题报告中呼吁各成员国与时俱进地摒弃上述传统思维,在新信息技术背景下树立全新的信息保护理念,区分通讯形式与内容从保护隐私权的角度来看是不具有说服力的,因为信息的合成,通常称之为元数据(metadata),能够显示个人行为、社会关系、私人嗜好、身份等方方面面的信息,甚至比通讯内容更能全面地揭示一个人。(三)侦查启动门槛虚置、已然犯罪与未然犯罪界限模糊为防范警察权的滥用,两大法系国家都通过设置警察权启动的事实条件为刑事程序启动设置了限制条件。大陆法系国家的传统理论在对警察权控制机制上坚持区分犯罪预防与犯罪打击两个领域,二者的界限在于只有出现具体的犯罪嫌疑或者犯罪将要发生的即刻危险时,警察才能干预公民权利,此种警察的行动方式被界定为回应型警务模式(reactive policing)。这种警察职权启动模式可将警察权严格限制在不得以方可使用的必要范围内,有助于防止警察权的滥用。这种古典自由主义思想下的警察权控制模式在20世纪60年代起逐渐发生变化,警察不再仅仅被视为“执行工具”,而应成为智能化、主动型的犯罪抗制机构。基于这种理念变化,警察的调查方法发生了很大变化,一些“预防性犯罪控制手段”的侦查方法开始在侦查实践中推广,包括计算机数据库检索、拉网缉捕、电子监控等。通过这些大数据技术新型侦查手段的运用,警察可以发现用以确定初步怀疑的各种信息,从而正式启动侦查程序,如此一来,警察所承担的预防犯罪与打击犯罪两大截然不同的功能开始混合。在英美法系的代表国家美国,法律规范警察执法权的起点是警察权对公民自由的干预,始于警察对公民的截停,自此刻起联邦宪法第四修正案为警察权启动设置的事实要件为合理怀疑(probable suspicion)。对于警察针对某人截停前的发现、判断犯罪嫌疑的过程,美国联邦宪法基本上不予评价,委诸警察根据自己的经验以及具体案件、对象的个案情况进行自由裁量。大数据技术在侦查初期的应用增强了警察发现犯罪嫌疑人信息的能力,凸显出合理怀疑标准的固有漏洞,也暴露出该标准的脆弱性。大数据对潜在犯罪嫌疑人的强大识别功能,令原本设置在警察权启动之初的门槛性条件流于形式。为防止侦查权的恣意启动、任意干预公民权利,我国刑事诉讼法将立案程序设置为刑事诉讼的起始程序,规定只有在立案之后侦查机关方可行使侦查权。“认为有犯罪事实需要追究刑事责任”是立案的事实证据要求,为发现犯罪线索或者确认是否达到启动侦查的事实门槛,相关法律解释进一步规定了立案前的初查程序,允许侦查机关采取不限制被调查对象人身权与财产权的各类措施。但上述法律规范严重滞后于大数据侦查技术的应用实际,侦查机关对海量数据记录的查询、比对、碰撞正在成为锁定犯罪嫌疑人的重要方法,由于其应用时段多在立案前的初查阶段,甚至在并无具体犯罪嫌疑的前嫌疑阶段使用以达到“无中生有”的预测犯罪或者抓获现行犯的重要作用,其深度应用的同时也逐渐侵蚀甚至架空了立案程序的立法目的。总体上看,大数据技术在侦查初期的广泛应用在各个法系国家都导致基于限制警察权而设置的侦查启动门槛流于形式,已然犯罪与现行犯、即将发生的未然犯之间的界限愈发模糊。大数据技术令警察权突破了传统法律框架在起点环节上的约束,形成了初期侦查权规制的法律真空。
大数据侦查在中国的发展既存在着特有的必要性,也面临着独特风险。一方面,作为国家治理体系重要组成部分的刑事司法系统必须拥抱大数据,唯有如此才能有效化解深刻转型社会所带来的犯罪率持续攀升、新型犯罪层出不穷的社会治理难题,有效治理口供过度依赖的传统刑事司法弊端,严格落实无罪推定原则,防范冤假错案。大数据侦查是顺应信息社会背景下侦查规律的必然选择,符合社会控制机制演进的基本趋势。中国是一个数据大国,且具有“集中力量办大事”的制度优势,大数据侦查的发展具备更多有利条件。比如,基于全球数量最多的互联网使用用户、移动手机用户、公共视频监控视频,以及移动支付平台、共享经济平台、互联网金融平台,大数据侦查拥有极为丰富的数据资源,数据比对与数据挖掘具备绝佳的开展条件。另一方面,应当认识到,正当的法律程序与个人信息保护制度对于大数据侦查的良性、可持续性发展同样至关重要,发展大数据侦查的各项优势缺少法律控制机制的制衡极易演化为巨大的风险。比如数据量大并不代表数据质量高,瑕疵数据、错误数据的大量存在反而更易误导侦查工作走上歧途,甚至导致公民权利被错误干预甚至剥夺,在这方面个人信息法律制度的引入对于大数据侦查的健康发展至关重要。大数据侦查这一方兴未艾的新型侦查行为,也为刑事诉讼法学传统理论提出许多新的研究课题,客观上推动着刑事诉讼法学研究范式的转型。首先,大数据侦查凸显出无罪推定这一现代刑事诉讼基本原则存在适用空间上的边界,其无法向前延伸至犯罪嫌疑产生之前的前嫌疑阶段。恰恰是在前嫌疑阶段,大数据侦查应用空间广泛,其重要价值是在刑事司法程序开始前发现启动刑事司法程序的信息与线索,而无罪推定原则无论是作为狭义的证据规则还是作为广义上的权利保障原则,都无法在被追诉人产生之前的前嫌疑阶段予以适用。现代刑事诉讼法的绝大多数原则与规则都是建立在无罪推定原则基础上的,其在大数据侦查中的适用真空附带导致多数诉讼规则与制度的空转。现代刑事诉讼法学理论必须继续探索发展其理论范畴填补这一空白。其次,以尊重和保障人权为重要使命的刑事诉讼法传统上关注的权利类型主要是人身权、财产权与隐私权,大数据侦查的出现使得权利干预类型进一步无形化,传统权利干预形态逐渐为大数据侦查所替代,监控社会的到来也就意味着绝大多数犯罪过程会被如实记录,追诉犯罪的过程越来越不需要依赖干预传统权利的各类侦查行为,但同时监控社会的加速形成会引发人们对言论自由、思想自由的忧虑,算法歧视会带来平等权保护的迫切需要,刑事诉讼法学的研究需要关注这些课题,才能在更为宏大的视角之下合理规范大数据侦查。从大数据未来发展方向的角度观之,有三大趋势值得持续关注。第一,大数据侦查的深度应用将升级犯罪的类型,导致犯罪打击的难度逐步上升,在侦查与反侦查的多轮较量中,街头犯罪、暴力犯罪将会因为大数据侦查的有效打击而逐步退出历史舞台,相应的犯罪人群将进一步转向更为隐形化的经济犯罪,同时为规避大数据记录的搜集,犯罪的地点将更为全球化,基于境外实施的各类犯罪类型将进一步多发。侦查机关应用大数据的过程中需要不断培养专业分析人才、研发新型算法模型以适应愈发隐蔽、变化的新型犯罪手法,同时还应当开始探索数据全球化共享的规则与机制,建立数据司法协助的相应制度安排。第二,伴随着我国刑事司法制度中以审判为中心的改革逐步推进,证明标准、证据规则的严格适用对侦查机关取证的规范性提出了越来越高的要求。伴随着大数据侦查在案件侦破中发挥的作用愈发突出,法庭对其证明作用的需求也就会日益凸显。实现大数据侦查由“幕后”走向“台前”,需要对大数据证据问题展开进一步研究。现有证据法的理论与规则提供的解决方案极为有限,比如大数据侦查的分析结论归于何种证据种类、适用何种证据规则;如何进行人脸识别、声音视频、生物信息识别上的同一认定;如何在庭审上对大数据证据进行质证、如何在保障质证权与保守侦查方法秘密之间寻求有效平衡;等等。诸多证据法问题都需要未雨绸缪展开研究,迎接大数据侦查的常态应用所引发的刑事审判方式变革。第三,大数据侦查的发展将改变政府与商业机构在刑事司法中的关系格局,刑事司法界应当开始关注如何在法律上评判二者之间的相关关系这一全新课题。大数据侦查的数据来源除了政府各部门基于政府管理需要而收集、储存的数据之外,多数的海量信息来源于商业机构为公民提供日常生活服务、经济交往当中储存的各类信息。大数据侦查越来越多地需要与商业机构的数据库互通共享,而传统刑事司法的规范原理是规制公权、保障私权。如何跨越这一规范鸿沟,需要法学界与法律界进一步思索。 参考文献及注释:1.《中国共产党第十八届中央委员会第五次全体会议公报》,《中国共产党第十八届中央委员会第五次全体会议文件汇编》,北京:人民出版社,2015年,第7页。 2.为行文方便,笔者将大数据技术在侦查中的各类技术应用方式统称为“大数据侦查”,用以概况通过计算机技术对数据库进行数据收集、共享、清洗、比对与挖掘从而发现侦查信息的侦查措施与方法。国内较早使用“大数据侦查”用语的研究,参见王燃:《大数据侦查》,北京:清华出版社,2017年,第12页。3.国务院《促进大数据发展行动纲要》(国发[2015]50号,2015年8月31日)。4.涂子沛:《大数据》,桂林:广西师范大学出版社,2013年,第98页。5.《刑事诉讼法》第113条规定了侦查的任务,即公安机关对于已经立案的刑事案件,应当进行侦查,收集、调取犯罪嫌疑人有罪或者无罪,罪轻或者罪重的证据材料。对现行犯或者重大嫌疑分子可以依法先行拘留,对符合逮捕条件的犯罪嫌疑人,应当依法逮捕。6.隐形犯罪(invisible offences)最早由美国学者Mark Moore提出,用来指代那些犯罪消息知悉困难、发现犯罪消息渠道不畅的犯罪类型,比如毒品、非法武器交易、贿赂犯罪等,参见Mark H. Moore, “Invisible Offenses: A Challenge to Minimally Instrusive Law Enforcement,” in Geral M. Caplan eds, ABSCAM Ethics: Moral Issues and Deception in Law Enforcement, Cambridge, 1983, p. 21;程雷:《秘密侦查比较研究》,北京:中国人民公安大学出版社,2008年,第65-75页。 7.Christopher Slobogin,”Government Data Mining and the Fourth Amendment,” The University of Chicago Law Review, vol. 317, 2008, p.322-323.8.Fred H. Cate, “Government Data Mining: The Need for Legal Framework,”Harvard Civil Rights-Civil Liberties Law Review, Summer 2008, p.438-439.9.Fred H. Cate, “Government Data Mining: The Need for Legal Framework,”Harvard Civil Rights-Civil Liberties Law Review, Summer 2008, p.438-439.10.参见艾明:《新型监控侦查措施法律规制研究》,北京:法律出版社,2013年,第169-170页。11.艾明:《新型监控侦查措施法律规制研究》,第171-172页。12.记录查询与数据库侦查对于破案率的贡献并无官方统计数据,艾明在G省开展的针对93例个案的小样本实证研究显示,超过三分之二的案件中侦查机关使用了记录监控类的侦查手段进而破获了相应的案件(参见艾明:《新型监控侦查措施法律规制研究》,第175-179页)。也有学者认为,近年来犯罪形势逐年恶化、诱发犯罪的社会条件逐步加强的背景下,杀人、抢劫等重大恶性案件反而逐年下降,背后的原因恰恰就是公安机关充分利用信息平台开展数据库侦查。(参见江涌:《数据库扫描侦查及其制度建构》,《中国人民公安大学学报》2013年第2期)13.金江军、郭英楼:《智慧城市:大数据、互联网时代的城市治理》,北京:电子工业出版社,2016年,第112页。14.检索对象为中国裁判文书网(wenshu.court.gov.cn),访问与检索时间为2017年5月5日。检索范围为选择“刑事案件”,检索之日共有刑事案件的裁判文书1461530件,检索关键词为“技术侦查”,年份选择“2016”。15.司法实践中此类关于犯罪嫌疑人、被告人如何到案或者如何被抓捕归案的过程描述性材料几乎存在于所有的刑事案卷当中,但关于其证据属性与证明作用有无,理论界与实务界长期聚讼不一,相关讨论可参见陈为明:《〈案发经过〉不应当作为证据使用》,《中国刑事法杂志》2004年第4期;李继华:《浅谈“抓获经过”》,《公安研究》2000年第1期。16.江必新主编:《〈最高人民法院关于适用<中华人民共和国刑事诉讼法>的解释〉理解与适用》,北京:中国法制出版社,2013年,第124页。17.吉隆·奥哈拉、奈杰尔·沙德博尔特:《咖啡机中的间谍:个人隐私的终结》,毕小青译,北京:三联书店,2011年,第192-193页。18.Andrew Guithrie Ferguson, Big Data and Predictive Reasonable Suspicion, p.40219.关于大数据侦查在美国司法实践中暴露出来的弊端及部分实际危害,参见Andrew Guthrie Ferguson, “Big Data and Predictive Reasonable Suspicion,” 163 U.Pa.L.Rev, 327, 2014-2015, pp.398-403.20.Andrew Guithrie Ferguson, “Big Data and Predictive Reasonable Suspicion,” University of Pennsylvania Law Review, vol.163, no.2, 2015, p399. 类似事例的报道可参见朱忠保:《网上通缉一再出错,通缉程序必须要改》,2010年8月6日,http://news.ifeng.com/opinion/detail_2010_08/06/1898793_0.shtml,2017年8月11日;杨涛:《错误拘留频现亟待建立有效防范机制》,《北京青年报》2013年12月11日,http://news.ifeng.com/opinion/society/detail_2013_12/11/32021463_0.shtml,2017年8月11日。21.林崇寿、洪双敏:《错录公民违法犯罪身份信息引发问题的思考》,《河北公安警察职业学院学报》2017年第2期。22.Katz v. United States, 389 U.S.387(1967).23.Miller v. United States, 425 US 435(1976); Smith v. Maryland, 442 US 735 (1979).24.United States v. Jones, 132 S. Ct.at 957 (2012)(Sotomayor, J., concurring). Russell D.Covey, Pervasive Surveillance and the Future of the Fourth Amendment, 80 MISS. L.J.1289, 1294-95(2011).25.Elizabeth E. Joh, Policing by Numbers: Big Data and The Fourth Amendment, 89 Wash. L. Rev.35 ,2014,p63.26.Paul M. Schwartz, “Regulating Governmental Data Mining in the United States and Germany: Constitutional Courts, the State, and New Technology,” William and Mary Law Review, 354, November 2011; Technology and Privacy Advisory Committee, Safeguarding Privacy In The Fight Against Terrorism (2004), at viii-x.27.Paul M. Schwartz, “Regulating Governmental Data Mining in the United States and Germany: Constitutional Courts, the State, and New Technology,” William and Mary Law Review, 354, November 2011.28.参见《德国刑事诉讼法典》第98条。本文引用的《德国刑事诉讼法典》中译本均为宗玉琨译注:《德国刑事诉讼法典》,北京:知识产权出版社,2013年。29.Paul M. Schwartz, “Regulating Governmental Data Mining in the United States and Germany: Constitutional Courts, the State, and New Technology,” William and Mary Law Review, 354, November 2011.30.参见《德国刑事诉讼法典》第98条c.31.参见宗玉琨译注:《德国刑事诉讼法典》,第54页。 32.详见《德国刑事诉讼法典》第98条a、b。33.《调取证据通知书》是公安机关进行调取证据时的制式法律文书,关于其内容、制作要求及样式参见孙茂利主编:《公安机关刑事法律文书(2012版)制作与范例》,北京:中国公安大学出版社,2013年,第297-302页。 34.参见《刑事诉讼法》第134条。35.参见孙茂利主编:《公安机关执法细则(第三版)释义》,北京:中国民主法制出版社,2016年,第295-296页。36.参见《公安机关执法细则(第三版)》第21-01条。37.程雷:《检察机关技术侦查措施相关问题研究》,《中国刑事法杂志》2012年第10期。38.郎胜主编:《〈中华人民共和国刑事诉讼法〉修改与适用》,北京:新华出版社,2012年,第277页。39.《公安机关执法细则(第三版)》第29-02条。40.《公安机关执法细则(第三版)》第1-02条。 41.Bryce Clayton Newell, “The Massive Metadata Machine: Liberty, Power and Mass Surveillance in the U.S and Europe,” A Journal of Law and Policy For The Information Society, 2014-2015, pp.487-488.42.这一结论通过对中国裁判文书网上的刑事裁判文书的关键词检索能够得到充分印证,以笔者2017年7月1日的检索结果为例,以“通话记录”为关键词可以检索到105385件刑事案件的裁判文书,而以“通话内容”为关键词检索,只能检索到693个裁判文书样本,二者之间的差异巨大。43.The right to privacy in the digital age, Report of The Office of the United Nations High Commissioner for Human Rights, 30 June 2014, p.3. http://www.ohchr.org/EN/HRBodies/HRC/RegularSessions/Session27/Documents/A.HRC.27.37_en.pdf, 2017年4月6日.44.Funk, A. Polizei and Rechatsstaat, 转引自Fijnaut, C. and Marx G.T. eds, Undercover: Police Surveillance in Comparative Perspective, the Hague: Kluwer 1995, p.58. 45.Funk, A. Polizei and Rechatsstaat, 转引自Fijnaut, C. and Marx G.T. eds, Undercover: Police Surveillance in Comparative Perspective, the Hague: Kluwer 1995, pp.57-58.46.Terry v. Ohio, 392 U.S.1, 27(1968); Andrew Guthrie Ferguson, “Big Data and Predictive Reasonable Suspicion,” 163 U.Pa.L.Rev, 327, 2014-2015, p.329.46.Elizabeth E. Joh, “The New Surveillance Discretion: Automated Supicion, Big Data, and Policing,” 10 Harv.L.& Pol’y Rev.15 2016, p.33.47.Andrew Guthrie Ferguson, “Big Data and Predictive Reasonable Suspicion,” 163 U.Pa.L.Rev, 327, 2014-2015, pp.387-388.48. 参见《刑事诉讼法》第110、113条。 49. 参见《刑事诉讼法》第110条。50.《公安机关办理刑事案件程序规定》第171条规定在立案审查环节中,“对于在审查中发现案件事实或者线索不明的,必要时,经办案部门负责人批准,可以进行初查。初查过程中,公安机关可以依照有关法律和规定采取询问、查询、勘验、鉴定和调取证据材料等不限制被调查对象人身、财产权利的措施”。另外《人民检察院刑事诉讼规则》第173条也规定了类似的初查程序与权限。51.比如《中华人民共和国国家安全法》第53条规定,开展情报信息工作,应当充分运用现代科学技术手段,加强对情报信息的鉴别、筛选、综合和研判分析;《中华人民共和国反恐怖主义法》第18条规定,电信业务经营者、互联网服务提供者应当为公安机关、国家安全机关依法进行防范、调查恐怖活动提供技术接口和解密等技术支持和协助;《中华人民共和国网络安全法》第28条规定,网络运营者应当为公安机关、国家安全机关依法维护国家安全和侦查犯罪的活动提供技术支持和协助。上述法律中的相关条款对于情报收集、犯罪预防中的大数据侦查进行了初步性、概括性的授权,但法律的明确、具体程度距离合法性原则的要求还有不小差距,比例性原则在上述法律中更是处于空白状态,囿于本文篇幅所限,笔者无法对情报收集与犯罪预防领域的大数据侦查展开研究,只能留待另行撰文专门加以探讨。52.现有的“技术侦查措施”的节名原本即属于搭车式的表述方式,2012年法律修改时为回避“秘密侦查”一词,将本节的节名表述为更为中性的“技术侦查措施”。但就该节的规范内容看,除技术侦查措施外,第151条规定了另外两类秘密侦查措施,即隐匿身份的侦查和控制下交付。大数据侦查本质上也是秘密侦查,尽管相关数据多为公开留存于各个数据库的信息,但对数据的分析、碰撞过程属于典型的秘密侦查过程。53.参见《刑事诉讼法》第150条关于技术侦查措施目的正当原则的规定。54.The right to privacy in the digital age, Report of The Office of the United Nations High Commissioner for Human Rights, 30 June 2014, Para38.55.参见程雷:《秘密侦查立法宏观问题研究》,《政法论坛》2011年第5期。56.周汉华:《中华人民共和国个人信息保护法(专家建议稿)及立法研究报告》,北京:法律出版社,2006年,第48页。57.王利明:《论个人信息权的法律保护——以个人信息权和隐私权的界分为中心》,《现代法学》2013年7月。58.周汉华:《中华人民共和国个人信息保护法(专家建议稿)及立法研究报告》,第58-59页。59.张新宝:《从隐私到个人信息:利益再衡量的理论与制度安排》,《中国法学》2015年第3期。60.2016年4月27日,欧洲议会与欧洲委员会在通过旨在全面保护公民个人信息权的《通用数据保护条例》(General Data Protection Regulation)的同时,通过了《以犯罪预防、调查、侦查、起诉或者刑罚执行为目的的自然人个人数据保护指令》,将个人数据保护的法律原则与机制部分引入刑事司法领域。61.近年来,我国立法机关通过分散立法方式,在《刑法修正案(七)》和《刑法修正案(九)》中加强了个人信息的刑法保护;在《民法总则》第111条规定了个人信息的保护规则;在《网络安全法》第41-42条规定了网络个人信息保护的条款。从总体上看,仍缺乏一部专门的个人信息保护法,以统筹公民个人信息保护的各个方面。62.参见我国2013开始实施的《信息安全技术公共及商用服务信息系统个人信息保护指南》第3.7条的规定。63.参见2017年5月最高人民法院、最高人民检察院发布的《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》第5条。 (编辑、拍照:朱桐辉)