【情报研究】解码分析纽约城市监控
点击下方小卡片关注情报分析师
在这个由三部分组成的系列中,本文将重点介绍成功的众包项目解码监控纽约市背后的关键要素,包括数据收集的设计,分析以及在线构建社区的意义。
本文讨论了在项目上线的头几周进行的数据科学和3D建模,并告知了2021年6月的新闻稿“监控城市:纽约警局可以使用超过15,000台摄像头在曼哈顿,布朗克斯和布鲁克林使用面部识别来跟踪人们”。具体来说,有三个目标:
质量检查和汇总:我们可以在多大程度上信任数据,它告诉我们什么?
可视化:我们如何呈现这些数据,使其对尽可能多的受众清晰可见?
情境化:我们如何通过让自己扎根于街道和相机镜头的物理现实来回答这些数据提出的新问题?
在这篇文章中,参考了2021年5月19日发布的数据快照,该快照发表在6月的新闻稿中,其中包括曼哈顿,布鲁克林和布朗克斯:几乎占纽约市(NYC)所有十字路口的一半。
建设性分歧
设计了这项研究以便每个交叉点将由三名志愿者进行分析。这种冗余允许进行质量检查。在实验室条件下,指令会很清楚,谷歌街景图像毫不含糊,每个解码器都有一个大的高对比度45英寸电脑屏幕和相同的视力。然后可以梦想在每个十字路口的所有三个解码器之间达成完美的协议。当然,这样的场景是不真实的,这就是统计数据存在的原因。
如果解码器不确定,教程视频和帮助指南指示他们谨慎行事,并说:“如果有疑问,请不要标记!从统计学上讲,这有利于以可能增加的II型误差(假阴性)为代价最小化I型误差(假阳性)或者用机器学习的术语来说,这有利于精确度而不是召回率。还鼓励志愿者在论坛中标记要讨论的任务,但为了确保独立答案,只能在提交任务后才能这样做。
三个解码器在交叉点进行相同观察的频率是多少?从到目前为止调查的公共摄像头总数(18,641个)来看,在图表1中,对曼哈顿,布鲁克林和布朗克斯约75%的十字路口的志愿者完全同意:所有三个解码器都给出了相同的一个观察结果。然而,在另外25%的时间里,三个解码器给出了两个甚至很少的三个不同的计数。
图表1:多久在所有十字路口的三个解码器之间就公共摄像头达成一致?三个不同的观测值意味着每个解码器给出了不同的计数。两个不同的观察结果意味着两个解码器同意,第三个解码器不同意。一个单一的观察意味着所有三个解码器都同意。
这种分歧告诉我们,解码器通常一致同意。然而,要信任数据,需要了解他们何时以及为什么不同意。在回答任何问题之前,需要决定如何聚合每个三重解码器的答案。
以中间的那个为例
在 6 月份的新闻稿中,使用了每个十字路口三个解码器摄像头数量的中位数。非正式地说,中位数是三个值中的“中间值”。众所周知,它对异常值和单个误差比平均更可靠:在任何交叉点上,如果三个解码器中的两个正确计算相机,但一个错误标记太多或太少,中位数不会受到该极端的影响。它还在完全不同意的情况下提供了一个有意义的决胜局,利用了众所周知的“人群的智慧”。
能够继续进行更细粒度的检查,按中位数对交叉点进行分组:所有交叉点的中位数为无摄像头,中位数为一个摄像头,中位数为两个摄像头,依此类推。虽然不是一个完美的分组(分组取决于一个指标,而这个指标本身取决于分歧),但它足以进行早期分析。
对于每个这样的群体,调查了解码器不同意的频率和数量。图表 2 显示了在三个解码器(最左边的柱)或两对一(中间条形)或三个解码器之间达成完全一致的频率,每个解码器给出不同的计数(最右边的柱)。图 3 显示了三个计数中最大和最小的距离。
两者都讲述了同样的故事:摄像机数量越高,志愿者同意的就越少,即误差幅度会随着摄像机数量的增加而增加。这是有道理的:相机越多,错过相机的机会就越大。具有最少一致性的交叉点组也是最稀有的:发现很少有交叉点具有五个或更多摄像机(请参见 Y 轴)。
最重要的是,这些图表表明,不仅总体而言,而且在所有重要的交叉点组中,解码器的同意程度远远超过他们的分歧。这是令人放心的,证实了尽管解码监控纽约市是解码器历史上最复杂的任务之一,但志愿者解码器继续提供一致的数据。
然而,彻底性要求我们更深入地挖掘确实存在的分歧。
图表2:解码器在交叉路口的公共摄像机数量之间的协议分布相对于其公共摄像机的中位数而分裂。
图表3:公共摄像机数量在相同中位数公共摄像机计数的交叉点之间的分布。
数据点的背后:什么样的分歧?
在发布之前,该团队检查了数据中位数保留或放大误差的情况,进行了定性审查,并且正在进行定量审查。
首先,定性审查包括盯着分歧来理解它们的类型。对100个交叉点进行了抽样,这些交叉点严重偏向于分歧,以涵盖广泛的极端情况。团队成员和地理学家索菲亚·卡费里(Sofia Caferri)随后回顾了这些交叉点,寻找系统性偏差。
对于与标记相机的交叉点,使用了图像马赛克(请参阅下面的示例)。对于没有标记摄像头的十字路口,检查了谷歌街景。
图像马赛克允许研究人员手动审查志愿者标记的内容和分歧。
下面列出了发现的一些常见分歧:
解码器有时只标记NYPD Argus盒子上的两个摄像头中的一个,就像上面马赛克中的一个解码器一样。志愿者偶尔会完全错过纽约警察局的盒子。这可能导致公共摄像头计数不足。
在路边电线杆上,解码器有时会标记非摄像头对象,例如其他传感器、路灯和手机信号塔。这更常见于附着在路边电线杆上的物体。如果一个十字路口的所有三个解码器都犯了同样的错误,这可能会导致过度计算公共摄像头,但似乎很少发生这种情况 - 中位数减轻了所有其他情况。
志愿者经常对十字路口的边界提出异议,一些志愿者在街上看得更远。
分辨率低、距离远且可能被缩放功能放大的对象更有可能被错误识别。
这种对分歧的定性见解证实了三个假设:
1.数据从来都不是完美的:总会有错误!
2.有些分歧错误地指向计数不足,有些则指向过度计数,而没有明显的系统性偏见跳到审稿人身上。
3.在每个交叉点使用三个解码器可以很好地缓解其中一些单独的错误。
基于这一定性综述,得出结论,认为过度计数和计数不足可能在第一次分析中充分平衡并非不合理。
第二,正在进行定量审查。它旨在量化解码器标签偏离“真相”的频率和程度,质量指标如遗漏概率(“1 - 召回”),错误检测(“1 - 精度”)等。
为了代替已安装摄像机的物理地面事实,使用来自三位专家的计数,他们每个人都标记了一组共同的100个交叉点。选择这些交叉点来表示解码器计数的多个级别,使用“重要性采样”来过度表示最坏的情况。然后,元专家(苏菲·戴尔)来比较和统一三位专家的标签。目前正在处理本次定量审查的结果。
隐藏步骤
例如,大多数用于经典可靠性分析的现成统计包都假定所有解码器都查看了所有交叉点。相反,由于每个交集只能由三个解码器看到,因此解码器/交集矩阵的稀疏度为99.9%。虽然在统计上是有效的,但这需要定制的实现,统计团队拒绝在这里记录。
比较不同规模的社区
不仅要比较交叉点,还要比较纽约的区域,例如邻里制表区域(NTA)。
根据最新的人口普查数据,布鲁克林的东纽约地区黑人占54.4%,西班牙裔占30%,白人占8.4%,被发现是所有三个行政区中最受监视的社区,在十字路口发现了令人震惊的577个摄像头。
然而,NTA的尺寸不同:较大的NTA有更多的交叉点,因此,从机械上讲,有更多的机会拥有更多的相机,而不一定受到更多的“监视”。为了解释这一点(归一化),我们必须查看相机的密度,即每个交叉点的相机数量:我们将相机总数(通过中位数求和获得)除以每个NTA中的交叉点数。这考虑了不同的 NTA 大小,并且在 NTA 中具有可比性。
演示视野
为了证明数据可能对现实世界产生的影响,估计了NYPD相机以与面部识别软件兼容的分辨率捕获某人的脸部的最大距离。为此与建筑设计师和调查员Martyna Marciniak合作,创建了纽约警局阿格斯相机的3D现场模型。
在没有纽约警局阿格斯相机的技术规格的情况下,研究了商用PTZ(平移、倾斜、变焦)相机,查看了数据表和演示,例如此视频和此广告。
宇视 4K 超高清网络红外 PTZ 半球摄像机数据表。
对历史 Google 街景图像的分析,想要建模的摄像头(Argus_3)是在 2017 年 11 月至 2018 年 6 月之间安装的。有了这些知识,模型基于2017年上市的PTZ摄像机。商用相机具有高达134-148mm焦距的变焦镜头,相当于22×光学变焦和4K分辨率。其传感器尺寸约为1/1.8''。
显示公有摄像头的研究电子表格,在网站模型所覆盖区域的 Google 街景视图中可见。
发现目前市售人脸识别系统所需的最低分辨率可以低至约24像素/人脸宽度。
然后,在现场的3D模型中模拟了相机的参数。仅用于说明,生成的渲染显示了在不同距离捕获的人脸的可能分辨率。
重要的是要注意,由于不知道NYPD相机的规格,因此相机参数的看似微小的变化可能会导致面部识别所需的视场发生重大变化。
下表说明了这一点,所选摄像机型号中的 4K 分辨率已被高清分辨率所取代,从而将 24 px 分辨率从 200 米减少到仅约 100 米所需的最大距离。
基于具有1/1.7“ 12 MP传感器的相机模型,根据整体分辨率和所需像素/面部宽度比的差异,比较了执行面部识别的最大距离。
2017年至2021年间,商用相机型号的质量也存在显着差异。例如,这款“SCW The Spotlight 2.0”2021型号中的“超大尺寸图像传感器”的分辨率是2017年型号的200米的三倍,如下图所示,这意味着较新的相机具有更大的面部识别能力。
当距离为200 m且相机焦距为148 mm时,所选商用相机型号的比较。
为了确保对摄像机视场的估计尽可能逼真,选择对包含障碍物(如建筑物、树木和街道设施)的真实位置进行建模。在唐人街边界附近的下东区选择了一个地点,靠近2019年发生的“黑人的命也是命”抗议活动的已知地点。
格兰街和埃尔德里奇街交叉口的场地模型。
场地模型,表示在格兰德街和埃尔德里奇街交叉口的可能摄像机的视野。
平面图被用来显示,一名抗议者在距离纽约市警局摄像机几个街区的地方走到一个抗议地点时,仍然冒着被捕获脸部的风险,因此在不知不觉中暴露在面部识别中。
下东区有三台纽约警察局阿格斯摄像机监视的可能区域,靠近黑人生命问题活动的地点。还确定了纽约市交通部(DOT)拥有的四个交通摄像头,以及该地区的100多个私人摄像头。
纽约警局阿格斯相机的可能视野高达200米的发现被应用于证据实验室同事David Blood创建的热图。目的是允许人们探索初步数据,但限制其分辨率和分解,同时继续评估其准确性和可靠性。
四. 今后的步骤
与专家的定量比较正在进行中。调查了可靠性指标的使用,例如克里彭多夫最近发表的“阿尔法四部曲”(2021年)。然而,为了确保与常见的直觉点进行比较,我们现在专注于更广泛的指标,例如前面提到的关于相机存在/不存在的“精度和召回率”。
计算它们的最简单方法是引导,但它在三个解码器的中位数下效果不太好。统计上的改进可能是无止境的。因此,必须在正确的平衡点上进行削减:可以信任的数字,但要使用标准且简单到易于复制的方法。
识别下方二维码加入情报学院知识星球社群,内有3000+情报专业资料可供下载,成就您的专属情报资料库。
往期推荐