分享

赵印 ​| 大数据侦查的底层逻辑与规制路径

 雪狼绵羊 2023-12-09 发布于山东
【作者简介】

赵印(1989—),男,中国人民公安大学侦查学院2021级博士研究生

【摘    要】

大数据侦查具有非封闭的概念属性和解释逻辑,既包括了传统侦查活动中对大数据的一般应用,也包括基于强调数据相关关系和不特定筛选结果所呈现出的数据化侦查和预测型侦查。厘清大数据侦查的底层逻辑是解决大数据侦查规制的基本前提。对于使用大数据的传统侦查活动,仅需要现行的侦查规范予以限制,而在数据化侦查、预测型侦查等场合,大数据侦查对公民权利的影响是间接且隐含的,其规制路径更应当重视“前端”数据搜集的合法性与合理性。大数据侦查的规制应当从侦查的规范性以及大数据的技术规则两个角度进行建构,在既有的法律约束规则之外,技术合规性、数据来源正当性和数据清洁度,是大数据侦查规制路径的建构原则。

【关 键 词】

大数据侦查;数据化侦查;预测型侦查;规范;技术

图片

前言

“大数据侦查”似乎已经成为一个“陈旧”的学术概念,至少在法学界如火如荼地讨论了将近十年之后,其所承载的学术价值看似已被挖掘殆尽,在当下对其展开研讨也不再时髦。在实践层面,大数据侦查也已渗透到侦查活动的方方面面,在当前的侦查工作中占据了极为重要的地位,特别是在犯罪网络化逐渐扩张的背景之下,大数据侦查已经在绝大多数场合取代了传统侦查措施,从“技术引领”演变为“技术常态”,成为理所应当的选择。然而,即便在学术研究和实务应用几近于“泛滥”的当下,对“大数据侦查”的解释维度仍旧主要集中于技术领域,以“大数据技术”和“侦查”的简单组合作为解释这一新兴概念的基本手段,忽略了大数据侦查是科学技术进步与侦查实践活动共同推动而产生的新生事物。在这一研究背景下,对于大数据侦查的讨论仍旧停留在现象解释和技术运用的层面,对于大数据侦查的剖析尚未触及其基底的“元叙事”。大数据侦查不是大数据与传统侦查的叠加和适配,也非侦查活动在大数据背景下的具体应用,大数据与侦查在互动的过程中相互促进并相互作用,既革新了侦查思维,也丰富了侦查措施。不仅如此,大数据甚至改变了“侦查”的内涵与外延,扩张了侦查的传统定义。从这一角度来看,大数据侦查具有其内在且独特的底层逻辑,并且在此基础上存在着自发自为的运行规律。梳理大数据侦查基底的内涵并厘清其运行规则,无论对扩充学术研究的深度还是完善实务应用,都具有重大意义。

图片
一、大数据侦查的基本意涵
将大数据侦查简单地界定为“大数据”和“侦查”的集合体,是学术界惯常的做法。这一直白的解释路径透露出较为明显的“应对性”逻辑,意即在技术进步的背景下,大数据已经“成为形塑社会的重要力量,横贯公共管理、商业服务等各个领域并凸显出变革性功能”,而这一现象“在警务活动领域表现尤为显著”。简言之,并非侦查主动选择了大数据技术,而是技术革新为侦查活动中新模式或手段的出现奠定了条件,面对“绝大多数犯罪转变为触网犯罪”的现实状况,侦查工作不得不随之转型,以大数据作为侦破日益网络化犯罪案件的主要手段。正因为如此,在当前的学术话语中,大多以“大数据的定义”作为“侦查”的定语,将大数据侦查概括为“通过计算机技术对存储于网络与计算机系统中的海量数据进行收集、共享、清洗、比对和挖掘,从而发现犯罪线索、证据信息或犯罪嫌疑人的侦查措施与方法”。在这一逻辑之下,“侦查”的内涵和外延并没有发生任何变化,其仍旧是由侦查机关主导的用于“查明犯罪事实、打击犯罪”的法定行为,“大数据”则只是改造侦查工作外观的技术手段,其作用于侦查活动的意义在于其工具性价值。换句话说,大数据侦查是以大数据技术为核心的侦查行为,或者以大数据作为侦查工作在外观上升级的技术手段。以传统的“侦查”定义加诸于“大数据”作为工具,使得“侦查”本身并未得到实质意义的关注,从技术对传统法律规则带来的变革作为定义要素,能够“指出其信息挖掘与整合的优势显著提升了案件侦办效率”,同时也能够去发现“大数据侦查给法治体系带来的新的挑战”。但客观来说,学术界的大多数研究实则忽略了“大数据侦查”的本质内涵,将外观上的技术手段升级作为侦查变革的依据,并未关注侦查活动本身在技术更新下潜在的变动,也未把握侦查在对技术顺应和适配的过程中可能存在的主动性。大数据侦查并未完全等同于利用大数据展开的侦查活动,而至少应当是在大数据条件下侦查的数据化演变以及数据影响侦查的总和。从这一角度来看,目前的研究并未触及大数据侦查最为基底的逻辑,或者说对于在大数据条件下所引起的对侦查活动的“再形塑”缺乏应有的关切。
图片

(一)大数据侦查和侦查数据化

大数据是一种技术形态,其外延极为广泛,在学术研究中几乎没有统一的概念界定。按照国务院《促进大数据发展行动纲要》的定义,大数据“是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、储存和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”。大数据引入侦查活动并非大数据单方的技术革新,而是在侦查活动数据化的背景下双向互动的结果。侦查是针对犯罪的应激活动,面对复杂的犯罪形态,侦查需要专业的技术参与,同时基于犯罪行为边界难以穷尽的特点,侦查活动也应当是发散的;但是侦查同时也是法定的措施,需要在外延上具有合规性,以此来保障其在法律框架下运行,从而保障公民的合法权益和侦查的法治化,因此侦查又应当是收敛的。在法治的规范与专业的发散二重属性的限定之下,侦查活动体现出极为复杂而又矛盾的现象,犯罪形态难以穷尽意味着为了破案需要侦查尽可能多元化,而法律规范的限制则约束了侦查活动的外溢,在保障人权与打击犯罪之间寻求尽可能合理的平衡点。

大数据的萌生和发展极大地扩张了侦查手段,使得侦查活动的实施有了更多的方式和空间,这对于需要由法律规则来予以约束的侦查活动能够发挥更大的作用,这是将大数据侦查解释为“大数据技术参与下的侦查”的重要原因。有学者认为,从大数据侦查产生的社会背景来看,“大数据侦查”这一概念并不具有规范性,没有任何规范性文件将“大数据侦查”作为侦查手段或工作方法予以规定。事实上,“大数据侦查”是“在大数据背景下反思侦查工作或将大数据作为技术方法运用于侦查实践”而提出的概念。在概念结构上,大数据侦查中的“侦查”仍旧与传统的侦查保持了相当程度的一致,但大数据的介入使得侦查活动得以扩展,侦查机关掌握了在以往的手段和方法之下难以获得的犯罪线索或证据材料。在这一过程中,法律未能积极参与新技术条件下的规制,因此在一定程度上侦查活动得以突破既有规则的限制,获取更多的在以往的技术条件下难以获得的成效。现有的研究大多发现了大数据条件下的侦查手段有失范可能的现象,因此才着重去讨论大数据侦查的规制手段与限制措施。

但是当下的研究似乎有意无意地忽略了这样一个现实,即大数据技术本身并非是侦查领域的产物,其产生有技术手段进步的推动,同时也有社会观念的配合。在当前“万物互联”的观念逐渐演变为客观实在的前提下,侦查这一犯罪的应激响应事实上也必须向数据化的方式转化。换句话说,整个世界的发展就是网络化与信息化的,将信息进行搜集并予以数据化展示的技术,本身就是社会观念和客观实在的一部分。在网络时代,数据成为具有本体性地位的实体,其生成和运行都是与物质世界相辅相成的,数据不再是某些孤立的个体产生的观念影射,而是实在的具有独立价值的集合。在这一时代背景下,侦查学或者法学学者提出的诸多命题,诸如“网络时代的犯罪治理”或“犯罪网络化”,事实上都有刻舟求剑之嫌———网络时代的犯罪与犯罪网络化这样的称谓,都是将犯罪”作为被“网络化”的客体来对待的。犹如“大数据侦查”的解释逻辑,将“侦查”或者“犯罪”固化为一个类型化概念,以时代特征或者外观更新作为其变化依据,意即侦查还是传统意义上的侦查,变化的是侦查的手段和方法,既然侦查的手段方法产生了之前未有的变化,那么既有的约束可能就会失效,讨论大数据介入下的侦查规制就是顺理成章的话题。这一逻辑并未注意到,我们几乎没有“农耕时代的犯罪治理”或者“工业时代的犯罪治理”类似的命题,因为作为研究的话题是社会观念的产物,当社会形态产生变化之时,犯罪作为社会形态的组成部分必然会产生相应的变化———在以货币或者物品等实物作为财产凭证的社会形态之下,盗窃必然只能是“线下”物理的行为,而在以数据作为财产凭证的网络社会,盗窃就可以演化为“线上”的虚拟行为,而且随着财产凭证虚拟化的潮流,后一种“虚拟的盗窃”将会变得极为普遍。这就意味着,针对这一类财产的侵害行为是完全数据化或者信息化的,行为人通过数据凭证的冒用、篡改或者转移存储等形式就完成了“盗窃”行为,完全脱离了实体的物理动作,那么针对这一犯罪行为的侦查活动也必然数据化。侦查机关既没有必要也没有可能将这一虚拟空间完成的犯罪行为通过某种形式来物理重述或者实体建构,相反,应当只根据网络上遗留的数据流动、数据归属和数据印证来开展侦查活动。网络犯罪呈现出新的发展趋势,主要为:案件数量逐年增加,传统犯罪趋于网络化;犯罪主体多元化,犯罪门槛逐渐降低;犯罪产业链渐现,上下游黑灰产业增多;犯罪行为集体化,单位犯罪逐渐增多;跨域性趋势明显,犯罪结果危害大。可见,网络等技术推动的结果,不仅仅是萌生了大数据技术以及据此对侦查活动提供了手段或方法上的便利,而是整个社会生活也在网络化或虚拟化转型,包括犯罪在内的越轨行为也一样在转型的范围内。在这一过程中,侦查本身也在顺应犯罪形态的变化而形成数据化或者信息化的变革,这是侦查主动契合社会形态变化产生的进化历程,而不仅仅是大数据技术参与到侦查当中而对侦查外观产生的影响。
图片

(二)大数据背景下的侦查异化

正是基于侦查数据化的形态转化,使得“侦查”活动的内涵也会随之产生颠覆性的扩张。传统的侦查建立在刑事案件已发的前提之下,需要符合“认为有犯罪事实需要追究刑事责任的时候”的触发条件,这就决定了侦查程序启动只能建立在犯罪发生乃至于刑事案件激活的背景之下,侦查活动是被动应对犯罪的、“亡羊补牢”似的刑事司法活动。而大数据技术的参与则规避了“被动型”侦查的固有缺陷,侦查机关利用大数据所搜集的海量信息,通过科学设计算法、数据挖掘筛选和深度碰撞等方式,就可以“从匿名化、模糊化的数据中挖掘出用户的真实身份”,从而实现锁定或排除犯罪嫌疑人的目标,而且这一过程可以是高度自动化或智能化的,几乎不需要人为干预,从而尽可能排除“人在回路中”对结果判断所产生的消极影响。而且,随着大数据的深度应用,侦查机关可以通过大数据挖掘和筛选形成的规律,进而判断犯罪发生的态势,例如某类案件的发案概率、发案时间或发生场域,从而有针对性地布置警力或者采取特定的措施,预防或干预犯罪的发生,实现“预测型侦查”的目的。例如,有学者发现,2011年在美国加利福尼亚州圣克鲁斯郡开展的执法项目中,警方从规模庞大的犯罪数据中抽取特定的“数据点位”,找出更容易发生侵入车辆或住宅实施盗窃的场所和时间,并针对性地展开警备。2012年,美国纽约警察局与微软公司合作创设“场景感知系统”(Domain Awareness System),将3000多个联网监控摄像头以及200辆以上的汽车车牌自动读取装置和911报警电话中的信息进行实时搜集处理,并同时比对以往犯罪记录中收集到的数据,警方可以在极短时间内判断犯罪嫌疑人的动向或者相对准确地预测车辆的行驶目的地。在我国,大数据对于犯罪的预测也已获得了实践成果,北京市公安局建设了“犯罪数据分析和趋势预测系统”,2014年5月怀柔分局根据该系统预测提示,某派出所辖区某处发生盗窃案可能性较高,据此怀柔公安分局情报信息中心指导该派出所对提示区域加大巡防力度,5月7日凌晨1时许,派出所民警巡逻至该处南口时,当场抓获一名盗窃汽车内财物的犯罪嫌疑人,经讯问犯罪嫌疑人李某交代了伙同他人流窜至怀柔盗窃机动车作案3起的犯罪事实。近年来,北京、上海等地公安机关主动公开了部分城区的治安地图、反扒地图、盗窃密度地图,为市民提供信息查询等功能,有效地减少了街面盗窃案件的发案率。
可见,大数据的介入在丰富侦查手段、提高侦查效能并改变侦查模式乃至于侦查观念的同时,也使得侦查从内涵到外延都产生了“异化”。大数据对于海量信息极快的处理速度以及处理结果的极高精度,都促使着侦查活动摆脱传统“被动型”或“事后型”侦查,突破了传统侦查只能在案件发生后甚至在被侦查机关发现之后才能启动侦查的滞后性,对案件及时破获提供了可靠的基础。而且利用大数据不断优选算法和相关性迫近等特征,侦查活动还可以逐步主动介入,通过对发案规律的精确分析,能够针对性分配警力或开展犯罪阻滞行动,从而有效避免犯罪的发生。但是,从逻辑上看,此时的“侦查”已经不属于法定意义上的侦查概念,而是将所有的应用于犯罪治理的“大数据活动”笼统地称之为侦查,并且以此为前提去思考如何建构“大数据侦查”的规制模式。其逻辑在于,侦查活动的内敛和规范性在加入了大数据的挖掘与分析模式之后,将会对“侦查”产生负面影响,导致侦查活动溢出规范的范畴,产生越轨现象,因此对大数据侦查进行规制就成为顺理成章的事务。
然而,在这样一个逻辑结构下,即便秉承“先有新现象、新事实,后有新概念”的逻辑,将“大数据侦查”中的“侦查”概念进行扩张解释,也难以将大数据介入犯罪治理后所实施的数据挖掘、数据筛选、算法优化等手段都归于侦查的范畴。这些远远脱嵌于既有的侦查概念范畴之外的做法,根本无法用现有的侦查程序或者规则去约束,这将导致当前的研究面临考问———既然“大数据侦查”词义之下所囊括的范畴已经远远超出了“侦查”所划定的界限,或者说在法律制度限定下的“侦查”已经不能完全等同于“大数据侦查”中的侦查概念,此时是否还需要以当下的法律规范去约束或者限制“大数据侦查”?有学者认为,大数据在侦查领域的发展有“重技术、轻法律”的现象,因此大数据技术的发展对传统司法原则以及诉讼程序产生了影响,也带来一系列新型法律问题。然而,事实上,大数据下的“侦查”已然不能等同于当前的侦查,大数据参与下的“犯罪治理”活动对于“侦查”的影响不仅仅是方法论上的,其改变的不只是侦查活动的方式与手段,在这之外,大数据全面颠覆了侦查活动的理念和运作方式。事实上大数据不仅仅在打击犯罪的层面产生了积极影响,更是将传统的事后治理转变为事前预防,这一侦查的异化现象是普遍存在的。在认同这一现象的前提下,大数据侦查的内涵就不应当以侦查作为重心去解释和展开,而应当关切“大数据参与”下传统法律规范下的侦查所产生的异化以及与侦查相关的犯罪治理革新。从这个角度来看,大数据侦查的内涵是极为丰富的,其至少包括了三个层次:其一是大数据参与下法定的侦查活动的变迁;其二是大数据融入侦查导致的侦查数据化变革;其三是大数据应用产生的侦查异化,犯罪治理的理念与手段大规模地扩张了“大数据侦查”的外延。

图片

二、大数据侦查的建构模式

基于上述对“大数据侦查”底层逻辑的讨论,我们可以有限地反思当前围绕大数据侦查所展开的讨论中可能存有瑕疵的观念。如前所述,在当前的学术研究中,无论是法学领域的学者,还是侦查学领域的学者,虽然在研究的重心上有所差别,但大多以规范意义上的“侦查”作为审视“大数据”的场域,以此来构思大数据侦查在建构中的种种思路并围绕着大数据侦查可能蕴含的规范违反问题进行反思。这一思维显然存在着一定的瑕疵,事实上即便在当前采用较多的“大数据应用于传统侦查”的场景中,大数据的应用也并不是通过广泛的“无差别”信息搜集和毫无目的的权利侵夺来实现的。大数据侦查有其符合技术特征的建构模式,同时也受到规范和技术的双重约束。

图片

(一)大数据侦查对规范性侦查的革新

从规范的角度来看,侦查具有法律上的明确概念,因此在这一层面,大数据的参与体现为工具性价值,其为打击犯罪的“事后追溯”服务,但大数据技术对侦查活动的展开方式提供新的模式,或者为侦查活动提供新的视角。在这一层面,大数据的介入是有限的,其发生作用仍旧在规范的框架之下,诸多学者将这一层次的大数据侦查归结为“侦查模式”的科学化或者“侦查理念”的革新,其理由就在于,在传统侦查框架下的大数据侦查,事实上并不影响侦查这一法定的规范性概念的基本框架,其运行机制是对现有侦查工作的方法扩充或理念革新,并不涉及侦查外延的溢出。例如有学者认为,大数据侦查可以促进案件侦查模式从“由供到证”到“由证到供”的转化以及工作模式由“人员密集型”向“技术密集型”转化。这两种转化都是从侦查取证的手段和方法的角度来描述大数据侦查的,认为“大数据技术在侦查程序中的引入降低了办案人员对口供的单一依赖,使其能将一定的精力投入到客观证据中,进而推动侦查手段的创新与证据比重的调整”,或者“公安机关可以将有限的警力资源向专技岗位、大数据情报岗位倾斜,从而实现人员高效利用与资源合理配置”。

这一模式下大数据参与侦查活动,更多的是作为侦查手段或方法“形而下”的模式来展开的。侦查活动已经推进到抓获犯罪嫌疑人,需要通过大数据手段去固定客观证据,以此作为讯问的手段或者略过讯问嫌疑人的程序。在这一过程中,大数据的使用本来就可能导致办案机关的“技术化转向”,也就是从事传统的排查、现场勘验等侦查工作的人员逐步向技术型人员转化,实现“让数据多跑路,民警少跑路”的组织结构升级。由于大数据技术的参与,在传统的侦查程序和模式无需改变的状况下,侦查的手段和效率也可以得到极大的提高,以技术为载体的大数据通过海量数据的搜集和交互,就能够实现既有的侦查手段难以达到的效用。值得注意的是,在传统侦查模式下的大数据技术引入,并没有突破侦查规范,而是沿着侦查规则和程序所进行的技术创新。

在当前被归于大数据侦查的这一大类侦查活动,事实仅属于这一层次,但即便在这一层次之下展开的侦查活动,其样例仍呈现出多元化的特征。例如,侦查机关已经获取了嫌疑人的相关信息,但涉案的证据需要通过大数据进行筛选,而这些数据可能是个人生物信息、轨迹信息,且是通过公共区域的图像采集或者嫌疑人在使用手机APP时为了方便使用而交换的人脸识别信息或者行程轨迹信息,这些信息需要侦查机关向互联网企业调取。在这一过程中,如果定向地调取嫌疑人的相关信息,那么就与传统的侦查毫无区别,只不过在证据的外在形式上,可能由物证或书证转化成了电子数据而已。这一利用单一的或较小的样本数据记录和监控技术促成的侦查,甚至都不能称之为大数据侦查。而在侦查机关尚未掌握嫌疑人相关信息的前提下,可能需要通过公共的大数据平台来进行筛选或者查验,例如,在个案中侦查机关与数个互联网公司进行合作,综合其所占有的用户数据进行大规模调查,并从中分析研判,查清犯罪嫌疑人或犯罪行为的相关信息。这一形态的侦查某种程度上突破了规范意义上的侦查,此时是否属于规范上的侦查并是否需要有限制规则,在学术探讨上仍不明朗。对这一类可以归于“初查”的利用大数据所展开的调查工作,学术研究上的态度是暧昧的。一部分学者认为这一类工作当然属于侦查活动,甚至认为正是基于这些数据被侦查机关之外的主体所掌握的现象,由侦查机关依托第三方社会信息展开的调查工作,是侦查权力的多元化转化,侦查权体现出了扩散化与社会化的特征;但另一些学者则认为应当分清侦查权和基于侦查权的发动展开的大数据分析对侦查产生的助益,后者并不属于侦查,第三方公共数据平台也没有完成“公权力—个体”的侦查结构转化,侦查的权力体系并没有转变为公权力机关、个人的多元融入与互动的状态。从根本上看,在传统的侦查活动中也会引入社会主体协查等形式的辅助侦查活动,但我们一向不认为这是侦查权分化的现象。无论学术研究选择何种解释路径,至少可以肯定的是,大数据技术的开放性特征对作为规范概念的侦查存在极大的影响,虽然“大数据侦查本身的系统性决定了其法律地位的跨层次性,使其难以归入单一的法律范畴”,但客观来看,大数据的介入使得侦查活动手段更加丰富,侦查破案的方法更加有效,这是大数据对侦查工作带来的直观裨益。

图片

(二)大数据侦查对数据化侦查的助益

作为大数据的基本观念,相关关系较之于因果关系得到了更为强烈的关切。大数据的三大特性是“规模、精准、相关”,其内涵在于“不是随机样本,而是全体数据;不是精确性,而是混杂性;不是因果关系,而是相关关系”。在传统的侦查观念中,只注重因果关系的查明,传统的侦查是在物理时空中开展的活动,而侦查对象与侦查目标之间要通过因果关系的确认,才能作为认定犯罪嫌疑人或者确证犯罪行为的基本依据。但在大数据时代,一切可资衡量的物理现象都可以归纳为数据,数据化的线索、数据显示的事实以及通过数据得到的结论,可以通过相关关系的积累程度作为侦查目标。大数据是通过各种不同的现象所对应的数据建立起来的,在这些数据之间存在着普遍的联系,一个数据的变化可能引发其他数据的互动,而这些微小的互动关系在经过数个数据的不断筛选和印证之后,就能够大致判断事物之间的关系,而且这种关系可以通过数据值计算精确的概率,数据规模越大,则概率值就越准确。由于数据与数据之间引起的变化程度是不一样的,如果一个数据发生变化而另一个数据也发生变化,就意味着两个数据之间相关性强,反之,则意味着数据之间的相关性弱。在大数据的这一特性下,侦查在数据化转型的过程中,通过相关性判断在一定程度上取代既往的因果判断,或者二者共同作用,来达成侦查目的。也就是说,尽管相关性的判断并不能完全取代因果判断,但可以通过将大数据相关关系的分析与因果律结合起来,以相关关系作为线索来挖掘事物内部潜在的因果规律。与传统侦查重视在客观的物理世界去寻求因果关系的目的不同,大数据侦查可以依靠数据本身来筛选和标定侦查的目标。由于计算机所设定的算法与程序可以最大限度地避免人为干预,从而保证结论的准确性。与传统的“用尽可能少的事实来发现尽可能多的结论”不同,大数据侦查通过“海量数据———关联信息———犯罪线索”的路径对传统侦查进行了再造,从而将侦查活动以数据关系予以呈现,不仅突破了传统侦查中的时空限制,也能够更加精准地判断侦查结论。

有学者认为,犯罪的“隐形化”促进了大数据侦查的应用,并且根据使用目的的不同,将侦查中的数据使用分为“目标驱动型”“比对驱动型”和“事件驱动型”三类,其中的“目标驱动型”即是前述的大数据参与的传统侦查,是针对特定明确目标开展的搜索并获取相关信息的过程;“比对驱动型”则是通过数据的对比和筛选,从而确定某人是否可能是犯罪嫌疑人;而“事件驱动型”的数据挖掘,则并非起始于具体明确的犯罪嫌疑人,而是用于发现过去或未来事件的违法行为人。在这几种大数据的应用场景中,前两者是典型的传统侦查数据化以及典型的大数据筛选,而最后一种“事件驱动型”,是通过“对一定时期内的犯罪数据进行挖掘后所进行的科学预测”,这是大数据侦查能够更为精确、科学地调动警力并实现犯罪精确打击的前提。在这一过程中,只有将侦查进行数据化改造,把通过大数据技术搜集到的信息都予以数字化,才可能穿透数据背后的零散现象,最终基于相关性的关联形成预测。因此,对于当前的侦查活动来说,数据化的转型既是客观技术发展的自然结果,也有在侦查目的驱动下的主观推动。所以也有学者认为,应当从“观察”“搜查”“预防”这三个视角来把握大数据的使用,且按照先后顺序进行分类,即观察正在进行中的犯罪行为、调查(搜查)过去的犯罪行为以及预测将来的犯罪行为。无论“观察”“搜查”还是“预测”,都是“形成人力无法达成的准确信息以及发现借助人力无法预测的犯罪现象”,而这一过程都需要以数据的形式来留存和分析。

图片

(三)大数据侦查对预测型侦查的推动

大数据通过算法优化和相关性预测,能够打破“前信息化”时代侦查的固有模式。传统的侦查都是以“案件”作为连接侦查活动与犯罪嫌疑人之间的关联要素的,侦查活动无论是“由案到人”还是“由人到案”,都需要“案件”作为中介,而案件又需要时间、地点、情节等物理空间的要素作为基本条件,而且这些“案件”都具有实体要素和程序要素———案件需要由侦查人员按照实体法的规定将其判断为涉嫌犯罪,才能启动侦查程序;而案件则至少应当通过程序设定的形式审查,才能进入侦查范畴,使其成为刑事司法程序的作用对象。有学者正是基于此将“案件”或“案件结构”作为侦查学基础理论,这意味着,案件已然成型且具有事实要素,是开展侦查的前提条件,“案件事实包括的范围很广,例如刑事案件,在公安、检察、法院的每一个阶段都有它确定的特定的案件事实内容”,不仅如此,“案件是经验的存在,与过去的时空浑然一体,不可分割”。因此,侦查活动是纯粹回溯、还原或建构案件事实的过程。侦查的开端始于案件的发现与认定,侦查的过程是将案件归类并查明足以认定案件事实的历程,而侦查的终局则是对案件中蕴含的犯罪事实的确证。

然而,大数据技术打破了“由案到侦”的逻辑流程,大数据技术通过数据挖掘和算法的不断优化,就可以发现当前借助人力或传统的侦查手段无法预测的现象和行为,预防那些难以被察觉的犯罪,检控那些在传统侦查手段之下无法检控的犯罪人。在这一流程中,“案件”这个概念趋于消亡,大数据本身并不专门用于发现和跟踪案件,而是社会生活普遍的网络化,使得几乎所有的社会交往都可以通过数据来呈现,而只需要通过特定的算法,这些海量的数据集合就可以表达出某种趋势,结合社会治理的目标,就可以为侦查活动提供助益。有学者提出的“事—机—人”或者“人—机—事”的侦查模式,就将“案件”从侦查活动中予以排除,将电子设备、账号等关联数据的物理或虚拟节点,作为连接事实和犯罪嫌疑人之间的依据。伴随着大数据技术的不断进步以及在犯罪治理领域的不断深化,特别是在万物互联的“物的数据化”的状态之下,预测的可能性和精确性将会变得接近于客观现实。在传统的侦查模式之下,单一的数据或信息只能反映案件的某一部分,还需要通过关联性分析和更多的数据来印证,因此很难对犯罪的规律和潜在的犯罪事实展开分析。但是客观来看,犯罪形态本身是有规律可言的,犯罪活动在空间上往往呈现出一种聚集现象,这就是所谓的“犯罪热点”,但是这种热点的分析在不同的地域、时间和社区结构中差异极大,侦查人员依靠传统的信息搜集很难发现影响热点的诸多因素。而在大数据时代,由于数据搜集和分析的自动化、智能化,使得这些呈现出分散化以及碎片化的数据能够整合起来,通过各种信息的集合,例如账单、水电、社保、车辆、房产等诸多信息的重叠,就可以预测出高危的行为人,从而对未来可能发生的犯罪进行规律性的把握。在这一层面,大数据通过算法的优化和数据点的大规模重合,就可以得出超越“案件”的预测结论,进而颠覆传统的侦查概念和侦查理论。


图片

三、大数据侦查的规范路径

通过梳理大数据侦查的概念范畴与应用场景,不难发现,当前对大数据侦查的研究和讨论有两个明显的误区:其一是将几乎所有的数据参与下的侦查活动都笼统地称为“大数据侦查”,忽略了大数据技术介入侦查的形式极为复杂。在这些不同外观的“大数据侦查”中,有的只是形式上的变化,而有的则是根本性的颠覆,所以真正符合“大数据”定义和应用条件的侦查只占到其中一部分;其二是基于对大数据侦查的概括性理解,研究者认为需要设置限定规则的大数据侦查也存在泛化的现象,将所有的大数据参与下的侦查活动都视为“革命性”的变更,以此作为讨论其法律规则的基础,因此有可能对常态的或者已经有明确规范的侦查活动产生影响。对大数据侦查进行必要的规制是出于侦查工作法定化的应有之义,但这一逻辑的展开应当建立在对大数据侦查科学理解和合理解释的基础之上。

可以看出,在大数据侦查于规则层面的讨论,因为缺乏对大数据侦查基本内涵的挖掘而存在着瑕疵,学术界过于纠结侦查活动中引发的权利侵害,并且寄希望于通过设置数据权限或增设监督来实现对侦查的规制,却忽视了大数据侦查相关优于因果、预测先于确证的运行规律,对数据来源的正当性和合理性缺乏必要的关注。如果将大数据侦查带来的变革进行分类,在传统的侦查模式创新这个层次,大数据带来的风险与既有的侦查方法所包含的风险并没有本质上的差别。而在预测型侦查的领域,大数据也并不能用规范意义上的侦查去进行规范或限制,在这个场域大数据发挥的作用并不是规范意义上的“侦查”活动。也就是说,目前绝大多数业已存在的争议,事实上是建立在概念难以统一的背景之下的。例如,有学者认为,大数据侦查的内在矛盾体现在“大数据的核心作用是预测,而侦查机关立案侦查的条件要求是必须具有犯罪事实、需要追究刑事责任,这表明了侦查活动的事后性”,因此“大数据与侦查的中心工作具有偏差”;不仅如此,“大数据预测的是概率,而侦查对案件的信息要求必须精准”,因此“大数据预测的概率性与侦查'这一刑事诉讼法定程序’所要求的精准性之间存在冲突”。事实上这样的观点就没有区分大数据在侦查中的不同样态,在传统侦查与大数据扩充之后的“侦查”概念之间反复跳转,难以形成逻辑上的闭环。事实上,在大数据寻求概率的预测场合,侦查活动还不足以也没有必要达成精确的结果,甚至要求“精确”的侦查工作尚未展开。这种“白马非马”似的逻辑起点偏移,导致了目前的讨论无法形成有力的观点,对于大数据侦查实践也缺乏助益。

图片

(一)数据化侦查的规范性规制

数据化侦查的广泛应用会带来侦查权的“类型转化与升级”,也就是前述的“异化”现象———传统侦查行为对人身权、财产权的物理限制或者客观侵扰,会转化为对隐私权、尊严权以及精神自由等基本权利的潜在损害。而这些权利的无形性和大数据难以溯源和责任碎片化的特性,使得这些权利损害之后的救济更加困难。大数据被掌握在具有权力的机关手中,其发动难以监督,过程难以跟踪,使得国家与国民的矛盾冲突会更加剧烈。而且,大数据侦查所利用的数据是分散化的,只有警察或具有相当功能的机构可以对其进行整合和筛选,而警察基于破案等实际需要,很可能“希望有一种持久的、洞察一切的、无所不在的监视手段,使得所有的事物都变得昭然若揭”。因此,大数据侦查需要受到规制,但并非其在词语结构中含有“侦查”的必然结果,我们需要明确一个基本概念,即大数据本身需要技术与法律规制以及侦查活动的制度规范,这可以是并行不悖的二元结构,这二者共同组成了大数据侦查的规制体系。

但是,大数据参与侦查的初级层次,是以大数据作为手段,调查或比对已经掌握的信息,这一手段与传统侦查并无本质区别,只不过在这一过程中,侦查活动的载体以数据的形式予以体现。这个层次的大数据侦查,已经在侦查实践中得到了广泛运用,例如通过数据库查询犯罪嫌疑人信息或者通过数据集合筛选犯罪嫌疑人的轨迹,这些做法与传统的侦查手段没有本质上的区别,无非是数据容量产生了变化,巨量的数据能够扩展可比对或可筛选的“点位”,提升侦查效率;同时数据化的侦查使得智能化设备介入数据处理流程,得以节约有限的人力资源。这一层次的大数据侦查活动,从比例上看,在当前的实务领域并未占据主流部分,事实上其并不需要建立特别的规制措施。

显然,这个层次的数据应用并未超脱传统侦查的范畴,在已经锁定犯罪嫌疑人或者有明确的线索之后,通过大数据手段来查询轨迹、确定位置或搜集证据,无非是侦查活动手段的形式扩张。对其进行的规制,应当等同于对侦查活动的规制,这一规制的原则和方法是规范意义上的,不能因为有了大数据的参与而有所区别。有论证认为,大数据基础设施的建设就已经预示了侦查权的扩张,类似于金盾工程、天网工程和雪亮工程等“涉及公民个人信息的社会治理基础设施建设……体现出当下风险社会的治理逻辑———充分运用现代科技手段构建数据基础设施,提高治安管理水平”,同时大数据的技术专业性“让第三方主体顺势进入侦查主体建设中,这是技术红利转化为司法红利过程中不可避免的侦查权力外溢现象”。这一论断显然存在瑕疵,公安机关建设的大数据基础设施,是否本身就是为侦查提供数据的,有待商榷。以社会治安防控作为目的而实施的普遍监控或信息搜集,可能会引发侵害公民权利的风险,但是在平衡个人权利与社会治理秩序的价值判断上,设置搜集数据的渠道和手段本身并不涉嫌违法,我们更多的需要考虑数据搜集与数据应用之间的关联度———例如火车票的实名制是为了解决买票难的问题而设计的,但实名制这一措施将公民个人的身份信息与轨迹信息进行了全方位的搜集,那么我们需要追问的是,基于解决买票难和倒卖火车票的现象,是否值得去落实实名制?公安机关的数据基础设施大多有其正当的具有普遍性价值的用途,但的确可以用来作为侦查的手段,此时对于侦查活动的法律控制足以限定这些数据的使用场景、适用规模以及“透彻”程度。因为大数据的搜集与处理本质上不是“原罪”,不是一经发动就可能侵犯公民权利,相反它可能在迅速破获案件、追赃挽损等方面能够对公民权益有更大或者更广泛的保护。此外,数据是否存在“溢出”以及基于第三方数据而导致侦查权旁落的现象,也应当具体分析。数据是当前社会生活的主要表现形式,与公安机关的行政化数据系统建设不同,第三方的数据来源基于服务或使用而形成,其目的并非用于社会治理或侦查活动,这些数据搜集行为本身是合规的。质疑或隐忧主要源自数据用于侦查时可能存在的风险,诸如个人信息外泄,或者第三方介入侦查的合法性是否符合侦查权属性,等等。但问题在于,首先,这些数据中客观上就蕴含着“非涉案人员”的信息,即便在传统侦查的范围内,摸底排队、现场勘验或者检索单一的视频信息,也可能会涉及案件之外的人员信息。关键的问题是,侦查活动是否在法律框架下展开,是否符合了“附带最小化”的手段设计,是否通过制度来控制相关信息的溢出程度。其次,第三方数据应用于传统侦查,与既有的侦查活动中调查非公安机关设置的监控或录音设备本质上是一致的,问题的关键在于第三方本身的采集、存储或处理行为是否合规以及公安机关的调取活动是否符合相关规范所设定的条件。在满足这些条件后所展开的利用第三方数据的侦查活动,就可以符合大数据侦查的规制原则与运行逻辑。

图片

(二)预测型侦查的技术性规制

相对于前述的侦查类型,预测型侦查的规制手段与路径显然是更为棘手的层次。当然,这一层次的大数据侦查仍旧需要厘清其基本的外延,仅仅是利用大数据信息得出的某种犯罪趋势,从而展开警力部署等防范措施,在这一过程中只要数据来源和准入符合规范要求,同时数据处理中尽可能通过技术手段予以匿名化和隐匿化运行,那么也不涉及颠覆性的规制措施。目前学术界比较热衷于探讨的话题和设计的场景,是侦查机关通过技术手段挖掘附带有公民隐私等信息的敏感数据,并且以此为基础去发现潜在犯罪人,在这一过程中可能会侵犯公民隐私权等基本权利。这一场景显然是存在的,但是否需要通过法律规则去限制,值得考虑。当前域外的立法,诸如美国的《通信电子存储法案》、日本的《通信监听法》等立法,大多是通过限制数据采集手段、存储方式以及对侦查活动设立授权权限的形式来约束大数据应用的。从这个逻辑来看,其并未限制“侦查权的扩张”,相反,还通过数据前端的采集和筛选规则以及授权开展侦查的方式,赋予了大数据侦查以合法性。从这个角度来说,因为数据化侦查和预测型侦查的出现,对于这一新生的数据处理方式进行必要的规则制定,本来是很自然的应对策略。而且值得注意的是,这些立法大多通过设定技术性规则来对“大数据”进行限制和约束,提高数据准入的门槛和数据的识别或消灭规则,而对“侦查”来说,则主要是明确了可采用的场景和措施,以此来规范侦查适用的场景。从这个角度来看,并未涉及国内一些学者所担心的大数据侦查失范的问题。可见,域外的专门立法即便是值得借鉴的,我们也应当清晰地看到其内在的逻辑,意即主要依靠法律对技术进行规范,限定技术手段和应用场景,同时配合对侦查的程序性控制,尽可能不新设具体规制。而反思当前国内学者的研究思路,似乎并未对预测型侦查涉及的问题进行界分,从而以公民权利可能受到侵害为由,考察这一类型的侦查是否属于技术侦查并是否应当纳入强制侦查,认为“侦查技术与技术侦查的界限难以区分”,将大数据侦查增列为一种全新的侦查行为加以规范,以大数据侦查的强制性程度来区分其是否属于强制侦查权;或者着手考察对该类侦查的监督措施,认为“大数据侦查外部监督缺乏,处于几乎封闭的状态,即便在制度上引入检察机关、审判机关、见证人等外部监督主体,这些监督主体是否存在相应技术能力以保证监督实效,仍属未知”。

客观来看,无论从技术侧面还是规范侧面考察,大数据中蕴含的“权力”或“准确性”风险可能是伪命题。有论者认为,大数据侦查权的运用极易侵犯公民的隐私权和个人信息权,因为“人性中的非理性因素”以及“数据解析结果的不确定性”,可能会对大数据侦查的权力运用产生影响。具体来说,“受破案率等压力型指标的考核以及出于职务升迁等个人因素的考虑,办案人员在工作中容易对计算模型的'科学性’关注不足,导致出现误导性结论”,或者“作为大数据解析前提的数据不正确,或者数据虽然正确但解析结果以'假阳性’的形式导出了不正确的结果”。但客观来看,这些可能出现的现象都不是大数据本身所蕴含的风险,或者并不是大数据所独占的风险。例如,日本某县警方由于工作出现失误,将原告的汽车作为被盗的监管车辆登记在内部系统中,以至于在登记错误当天,原告就接受了四次盘问。对此,东京地方裁判所认定,警方在最初的例行盘问后的近9个小时内未接触错误信息登记,属于过失不法,最终判决警方赔偿原告精神损失费10万日元。在这样的数据错误导致公民权利受损的案件中,显然不属于大数据本身的问题,登记错误造成的数据对应的事实错误,反而是“人”作为主体产生的,这种现象即便在大数据时代之前也会存在,并且只要是有“人类”作为主体参与数据的搜集或认证工作,这样的错误就难以避免。

可见,即便用于预测等远超出传统侦查范畴的犯罪控制场合,在绝大多数情形下大数据侦查也并非以定向数据搜集的形式将公民个人或者其他社会组织的信息予以“挖掘”或者让他们予以“曝光”,从而对这些信息的权利人产生影响。大数据的作用更多的是将公开的不敏感数据予以结合、筛选或碰撞之后得出的倾向性信息,在从数据到信息的过程中,相关性或因果关系的不确定性是大数据侦查的基本特征,大数据所蕴含的风险在传统的侦查活动中也广泛存在,而事实上在大数据的条件下,这些所谓的“风险”克服起来的难度反而因为技术中立性参与在逐步降低。譬如有学者提出,大数据侦查可能陷入“犯罪控制低效能和侦查程序合规性责难的双重困境”———在大数据技术快速发展的背景下,可溯源且防篡改的区块链技术不仅可以实现数据的真实性保障,而且也能够提升对侦查行为的法律监督质效。

图片

结论

大数据对侦查工作带来的助益是显而易见的,而大数据的搜集和应用会带来权利风险,也是客观存在的事实。但规制风险的路径,应当基于大数据应用于侦查活动的场合与程度,并根据不同类型采用不同的策略。大数据对“侦查”的概念冲击极为明显,以规范意义上的侦查去定义大数据之下的犯罪控制、防范或治理活动,只具有语词惯用性上的意义,不具有定义大数据侦查的内涵和明确其界限的功能。对于大数据参与传统侦查的应用层次,大数据的作用是工具性的,无需特别的规制手段;而在大数据对侦查活动数据化改造和对犯罪展开预测的层次,规制对策主要应当建立在“技术+规范”的基础上,技术规则用于控制大数据的搜集、存储和应用场景,确保数据清洁度和数据纳入门槛,而规范则主要用于保障侦查程序的合法性与合理性。总体来看,大数据侦查需要规制,但不应当建立在以传统的侦查概念来侵入大数据底层逻辑的背景之上,大数据侦查的规制应当符合大数据和侦查二者的共通指向,以“最大公约数”的形式来保障大数据的合规化和侦查的合法性。


—  图片  —

编辑 | 韦   州

审核 | 史全增

签发 | 包   涵


 
图片

李施霆 | 论毒品犯罪供述获取的法律障碍及破解路径

曾粤兴 孙道镭 | 跨境赌博犯罪多元治理路径研究

● 马明亮 |基于区块链的大数据侦查:价值、场景与协同规制
● 李辉 | 公安学“大问题”研究:还原、解构与建构
● 包涵 | 毒品分级管制的理论意义与制度建构
● 李小波 | 公安学范畴体系论纲
● 邹湘江 隋玉龙 卢雪澜 | 治安学科何以成为治安科学——科学方法论与知识增长的关系反思
● 李捷 | COVID-19疫情与暴力极端主义框架建构研究
● 马振超 | 新中国成立以来中国共产党政治安全话语:内涵、发展及逻辑
● 苏宇 | 警察权属性的考辨与反思
● 包涵 | 类似物管制的立法诉求和司法功能:美国《管制类似物执法法案》的评价与反思
● 姬艳涛 | 无人机警务应用的制度逻辑与优化路径
● 张梦星 | 论情态证据的刑事证据资格
● 翟化胜 周明 | 欧美国家“外籍战士”的数量差异:分析框架与案例研究
● 彭知辉 | 开放情报学论略:关于中国情报学建设的探讨
● 周延东 | 中国共产党调查研究优良传统与“枫桥经验”的生成延续
● 毕惜茜 梁嘉龙 | 英国侦查访谈技术探析及借鉴思考
● 郭晶 徐灿 | 论刑事“冷案”侦查模式的法治化嬗变
● 王龙 | 公安高等教育发展历史回顾与新时代展望
● 汪海燕 | 大数据侦查的哲学思考
● 李辉 丁姿 贾鼎 | “中核西制” ——论公安管理学科的生成与生长逻辑
● 李小波 | 理论纲领确认与学科建制化:全面建设21世纪的公安学

● 汪勇 周延东 | 情感治理:枫桥经验的传统起源与现代应用

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多