数据这件事,是科技公司和用户没谈好的「买卖」
The following article is from 极客公园 Author biu
禁止科技公司收集数据,真的能解决隐私问题吗?
「经典的说法是:『如果你没有花钱买产品,那你就是被卖的产品。』」
这句话出自最近热播的 Netflix 纪录片《监视资本主义:智能陷阱》。片方邀请了多位互联网大公司的前高管,以反省的姿态劝告人们要和社交媒体保持距离。
社交网络的负面影响并不是一个新鲜的话题,但是除了耗费精力、耽误时间以外,在使用社交网络的过程中我们还需要注意什么呢?
这将问题导向了另一个重要的议题:隐私。当我们越来越多地在互联网上投入精力,我们在互联网上也便拥有了一个「数字分身」。数据不断叠加,你爱看什么视频,喜欢怎样的穿搭,在约会软件里右滑的照片们有怎样的特点,甚至,在分手后你每天会翻看几次前任的朋友圈。有意无意的举动,都会被事无巨细地记录。
《监视资本主义:智能陷阱》虚构了 AI 监视用户的场景|Netflix
而当你被记录的数据越多,你也便拥有了更高的商业价值。只不过,能够将这些价值变现的不是你,而是在产品背后,急于获得更多资本倾慕的公司们。
这就是监视资本主义。
科技公司如何使用数据
我们在一个 app 上成功注册之前,最先看到的交互弹窗一般会是「你是否同意软件服务协议」,鲜少有人会点开冗长的协议。如果你不点同意,就没法使用,但一旦确认,你就完成了一次「一揽子同意」的授权。
之后,这些 app 会抓取你个人的姓名、性别、手机号、住址、头像等静态信息,这些属于基础数据。对于这些 app 来说,更有价值的是你的动态数据,比如你打开什么了网站,停留的时间,点击过什么广告,完成消费决策的时长,理财的习惯等等。
这些行为数据可以被它们拆解会无数个用户标签,比如喜欢电子游戏、甜食、不理财等等。Google 同样也会收集你的行为数据,但它选择在前台展示机器给你贴上的标签。你可以在「广告个性化」(https://adssettings.google.com/authenticated)中,看看机器是怎么「分解」你的。
机器收集的行为数据很多,但不会真正对应到某个具体的用户|socialcooling.com
为了确保你产生的数据是可靠的,平台还设计了「权重」,比如你点击一次「任天堂」可能只是误操作,但如果你点击了好几次就会被记录,点击次数越多,这个标签的权重就越高。有了足够多的数据点,平台就可以构建模型,建立用户画像。
比如,你不爱运动,不好社交,喜欢游戏……这个你存活于数字世界的替身,会和其他同类的画像一起被聚合,形成这个平台主流用户的总体特点,比如 B 站用户喜欢「二次元」和游戏。然后,广告主就会根据自己的产品,选择合适的平台投放广告。
在广告主这一边,他们还可以在平台上自由组合消费水平、教育水平、内容兴趣、消费行为在内的上千个定价标签,最后选定广告位和广告时间,按曝光量出价,完成一次精准投放。
当你浏览网页,或打开 app 首页的时候,在你即将看到广告位的瞬间,广告平台发起竞价请求,最终价高的广告就会出现在你的眼前。
但需要注意的,应用和平台在抓取数据、生成标签、勾勒画像的过程中,并不会显示你叫什么,或你长什么样,因为法律要求这些平台「使用个人信息时应避免精确定位到特定的个人」。在这个「镣铐」的约束下,科技公司为了提升识别的准确性,会一遍遍训练机器算法,一遍遍找到和你类似的人,打包归类,再拿这些数据变现。
在经过去标示和匿名化的处理后,科技公司能获取的,其实只是一个间接的、群体的画像。经过这层「脱敏」的数据共享是门合理且合法的生意。毕竟,我们也不否认在互联网上,数据的充分利用的确带来了不少便利。
监管下的「数据自由」
你所产生的行为数据,是和设备的 ID 绑定在一起的。比如在 iPhone 上,用户数据会和手机的 IDFA(广告标识符)绑定,即便你不注册、不登录,也一样会被开发者采集数据,广告也可以根据 IDFA 在其他平台给你投放广告,比如你在刷抖音的时候也能看到淘宝的广告。
不过,在 iOS 14 上,用户可以关闭 IDFA。一旦关闭,开发者就只能获取到一串无效字符,每个 app 就将无法检测到广告投放所获得的下载或购买转化次数。
不难看出,这些平台的盈利模式是收集并挖掘数据,喂给算法,最终通过宣扬广告精准发放,用买家竞价的模式将这些数据售出。
我们之所以对隐私泄露如此恐慌,一方面是确实有不良应用窃取你的数据进行非法变卖,另一方面是公众和科技公司并没有在隐私问题真正达成「共识」。而这是因为在合理合法的数据流通过程中,用户并不清楚地知道自己的数据在哪个环节被利用和共享,而科技公司也没有很直观、透明地披露这个流程。
这时候,法律的介入就成了必要。2016 年,欧盟制定了目前对个人信息保护最严格的法律《通用数据保护条例》(GDPR)。在 GDPR 中,界定个人信息的关键词是「识别」,只要这些信息可以用来识别到具体个人,那需要获得个人的明确同意。
具体来说,掌握了个人信息的公司需要让消费者能够访问这些数据。客户有权知道公司都掌握了他们的哪些信息。如果信息不准确,他们有权更改这些信息。他们有权在各种情况下删除它。如果他们愿意,他们有权将信息转移给其他提供商。
欧盟 GDPR 于 2018 年 5 月生效|Snel
GDPR 一施行,就对科技世界产生了广泛的影响。科技公司需要确立一个明确的业务流程来管理这些新的用户权利。否则,它们就只能以低效率并且不完整的方式来追踪客户数据,这对于把数据视作资本的科技公司来说,是致命的。
颇让人意外的是,如果从科技巨头的视角来看,它们普遍渴望有明确、清晰的监管要求,这样它们就可以照章办事。微软总裁兼首席法务官 Brad Smith 表示,「尽管我们也发现 GDPR 的部分内容令人困惑或者更糟,但我们认为,科技行业长期成功的关键之一是维持公众对隐私保护问题的信任。这种理念同样源于我们在 20 世纪 90 年代所经历的反垄断诉讼,以及我们为此付出的极高的声誉代价。」
对这些体量越大的科技公司来说,舆情同样也是必须要考量的因素。为了长远和健康的发展,它们积极地在自由和管制之间寻求平衡。
并且,也没有哪家科技公司能够霸占数据。一直以来,都有人把数据当作是石油,但这个比喻未必恰当,数据和石油最大不同在于,它是最容易复制和再生的资源,我们随时且人人都可以产生数据。而且数据的价值不是永恒的,它是时刻在变化的。
这意味着,有了监管的参与后,我们只有自愿给数据,科技公司才能进一步使用。也就是说,科技公司得让我们知道,他们使用了哪些数据,以及怎么用。例如,滴滴出行将采集到的数据变形处理后,交给市政平台,这样就有更多市民了解道路堵车情况,公共交通也得以形成更准确的调车决策。
和解的窗口
《监视资本主义:智能陷阱》热播后,Facebook 发布公告回应,称这部纪录片太「煽情」了,「它没有给出对技术的细致观察,污名化了社交媒体平台的运作方式,只是给棘手、复杂的社会问题找了一只替罪羊」。
纪录片认为由于社交媒体的这种「卖用户」盈利方式,平台不得不持续让用户上瘾,而留住用户的其中一个方式就是分析用户,只推送他想看的内容,久而久之,他就听不到,或者不想听其他别的声音,他被困在了「信息茧房」里。与此同时,社交媒体的「流量」属性,也催生了更极端的声音,极端激进和极端保守的言论更吸引眼球,温和派的发声只会被淹没。
但现实更加复杂。纪录片没提到的是,高度私密、端对端加密的消息服务 WhatsApp 同样滋生假新闻和阴谋论。The Verge 记者 Adi Robertson 表示,近年来许多最臭名昭著的极右翼攻击者,也在 4chan 和 Gab 等小平台上活跃,这些平台别提没收集用户数据,它们连盈利动机都没有。
在信息时代,互联网数据与现实世界高度交叉融合|视觉中国
事实上,人们的生活也因为那些互联网产品被极大地改变了。纪录片在结尾让一众受采访者提醒屏幕前的观众,保护自己的隐私,远离社交网络,然而这多少有些负隅抵抗的意味。
如果没有社交网络,今天人们的日常生活又该如何继续?
不仅是社交网络,包括智能手机在内的各种设备给生活带来了更大的便利,就像人们不会因为汽车污染环境就回去骑马,而是会不断探索新的技术新的能源,用更先进的方式改变现状。
话说回来,《监视资本主义》的作用不可否认。它开启了通往「共识」的第一步,那就是看到分歧和问题。
【重磅发布】《迈向万亿市场的直播电商》报告:价值驱动,迈进“万亿时代”
深交所投教|一图速览《国务院关于进一步提高上市公司质量的意见》
埃森哲发布“数字经济年度指数”,勾勒企业数字转型新态(附下载链接)