大数据应用 | MIT教授Acemogulu:有人泄露了你的数据,还让数据市场价格低廉且低效
导言
我们在微博上发情侣自拍照时,不仅共享了自己的肖像,也泄露了伴侣的肖像(有时候还会@一下对方,这使得这种肖像泄露的指向性更为明确);
我们在去朋友家聚会时,发了一条微信朋友圈的同时可能也附带泄露了朋友家的定位地址。
01
我们不重视数据隐私吗?
目前有一种共识是,数据能够带来更好的资源分配和更多更高质量的创新行为,而市场机制产生的数据共享行为太少(Varian[2009]、Jones and Tonetti [2018]、Veldkampetal [2019] 和 veldkamp[2019]);
当然,经济学家也已经认识到消费者的数据共享涉及隐私问题(如Stigler[1980]、Posner[1981]和Varian[2009])
但也有观点提出,数据市场可以适当地平衡隐私问题和其带来的社会效益之间的关系(如Laudon[1996]和Posnerandweyl[2018])。
当一个人共享自己的数据时,不仅损害了自己的隐私,而且还损害了与其自愿共享的数据相关的其他个人的隐私;
这种负外部性往往会引致过多的数据共享行为;
此外,当过多的数据共享行为发生时,每个人都会忽略自身信息中的隐私问题,因为其他人的数据共享行为已经揭示了他的很多情况。
”
02
为什么我们不重视数据隐私?
随机变量服从零均值和相关系数ρ的联合正态分布;
该平台可以获取或购买用户的数据,以便更好地估计其偏好或行为;
平台的目标是最小化他们对用户类型的估计的均方误差MSE(估计值与真值之间的差异,若只有一组数据,即样本方差),或最大化有关用户的泄漏信息量;
平台对用户泄漏信息的估值(以货币计)为1,而第1个用户对隐私的估值(以及有关她的泄漏信息的估值)为1/2,第2个用户则认为其估值是一个不确定的值v>0;
该平台向用户提供“要么接受要么放弃”的产品来购买用户数据。
例如你必须提供定位信息来获取打车、导航等服务;必须提供相册的访问权利来发送个人动态。
在这种情况下,平台基于将从用户1的数据中了解到用户2的一切信息,这削弱了用户2保护其数据的意愿。
实际上,由于用户1几乎公开了有关自己的所有信息,因此他愿意以非常低的价格出售自己的数据(在ρ≈1的情况下大约为0)。
但是,一旦用户2出售了她的数据,这其中也显示着用户1的数据,因此用户1只能为其数据收取非常低的价格。
当v≤1时,即用户2对隐私信息的估值较低时,均衡是有效的,因为在这种情况下数据对社会有利(即使数据的外部性改变了平台和用户之间经济剩余的分布);
当v>1且很高时,均衡就会在很多情况下无效,这是因为第一个用户通过出售其数据正在给第二个用户造成负面的外部性。
03
如何纠正数据分享的外部性?
可以对数据交易征收特定于个人的税款(庇古税);
关闭数据市场(例如对所有数据交易征收高额统一税)也将改善福利。
推荐阅读丨2019年中国经济学研究热点分析
统计计量丨干货!你不可不知的七大统计模型
软件应用丨收藏!盘点最实用的数据科学Python库
数据Seminar
这里是大数据、分析技术与学术研究的三叉路口
作者:Daron Acemogulu翻译整理:谈佳辉、陈姗姗编辑:Rye
欢迎扫描👇二维码添加关注