伦敦地铁通过Wi-Fi追踪乘客轨迹 引发隐私争议
伦敦交通监管部门在去年一个试点项目中,持续四周时间通过收集匿名数据的方式,采集Wi-Fi 热点和智能手机MAC地址,追踪伦敦全市地铁系统的乘客轨迹。
伦敦交通局曾表示,他们收集的数据“将自动去除具体的用户信息”,在一份公告中还进一步解释说,这些数据无法用以识别任何一个人的身份。
伦敦交通局称,它希望利用这种数据更好地理解拥堵状况及“集体出行模式”,以便“我们可以改善客户服务质量,提供更好的信息。”
然而, 随后有媒体报道称 ,伦敦交通局可能希望利用乘客数据来获取额外的市场营销收入——按照伦敦交通局发言人的说法,此举是为了帮助其进一步理解地铁站内营销资产的状况,比如数字海报和广告牌,而不是向第三方销售数据,以便在移动设备上投放精准数字广告。
在对伦敦交通局 Wi-Fi 数据追踪实验的报道中,媒体一般将他们搜集的数据称为是“ 泛 匿名 数据。”
那些在伦敦交通局项目测试期间不想被追踪的伦敦人,只能将移动设备上的 Wi-Fi 关闭。否则的话,一旦他们使用伦敦地铁网络,他们的出行数据就会被自动追踪——即便他们当时没有登录或使用地铁站的 Wi-Fi 网络。
伦敦地铁网络每天最多要处理 500 万乘客的出行数据——其中绝大多数人至少携带一台配备 Wi-Fi 接入功能的设备,这使得他们的活动轨迹易于被追踪。伦敦交通局的 Wi-Fi 实验对伦敦地铁网络中五分之一站点的乘客出行轨迹进行了追踪,总共持续了一个月时间。
英国帝国理工学院数据科学研究所的专家伊夫-亚历山大·德蒙鸠耶(Yves-Alexandre de Montjoye)说:“在现阶段,我们看到了大量有关数据集被出售、被重新识别,或是被分享、被重新识别的例子,所以对于大规模数据项目来说,匿名的说法就值得怀疑——或者说至少需要展开非常仔细的研究。”
他表示:“数据本身并不是匿名的,如果原始数据将要公开,那么身份被重新识别就不是不可能的事情了——人们极有可能可以识别这个数据集中的个人身份。老实说,即便是伦敦交通局,他们用 Oyster 卡(即伦敦公交卡)的数据来比对这种数据,并不是什么太难的事情。”
在之前一项有关信用卡元数据的 研究 中,德蒙鸠耶发现只要通过四组随机信息,就足以将 90%的购物者重新确认为特定的个体。德蒙鸠耶还携手其他研究人员,实施过一项名为“ 人群的特定性:人类移动的隐私界限 ”的研究。他们在研究报告中写道:“在一个数据集中,如果个人地理位置每小时都明确一次,而且空间分辨率等同于运营商天线提供的数据,那么四个时空点就能够用来唯一确定 95%的个人身份。”
大规模地理位置追踪行动不仅要适当地对个人数据进行加密,而且还要执行设计良好的安全机制,用以控制数据收集和访问的方法,但考虑到几乎每周都要曝出一次大规模数据外泄的新闻,伦敦交通局的这种观点很难站住脚。 Equifax 就是用户数据外泄的最新例证,而诸如此类的事件 不胜枚举 。
相关阅读: