查看原文
其他

隔机有耳,谨防围猎

AI财经社作者 AI财经社 2019-04-05

撰文 /   孙静

编辑 /   赵艳秋








01

你被App监听了吗?


 

手机“监听”在当下仍是一场罗生门。


一些人笃定地说,这已是“公开的秘密”,一些业内专家分析说,技术上已完全可行。但迄今为止,没有一家受质疑的应用承认,也没有业内安全实验室对外公布任何信息。

 

创业者袁晓没想到,3月19日上午,她跟办公室同事吐槽,刚网购的一件米黄色衬衣,“看起来就像一个200斤胖子穿的出租车司机工装”。下午两点,当她随手点开一个电商App,推荐热词中赫然出现了“200斤 外套”。蹊跷的是,袁晓从未在上面搜索或者购物,也没有200斤,仅是出于好奇在不久前下载了这款App。


“巧合还是被偷听?”她掏出新买的手机,却百思不得其解,最后只能在朋友圈里吐个槽。

 

国外的互联网用户同样深陷困扰。在YouTobe上,数年前就有用户质疑谷歌窥探隐私,理由是他刚当着笔记本的面谈论狗粮,谷歌随机就奉上了新鲜的推送。

 

此前回应外界质疑时,今日头条、美团、饿了么等App在强调不会监听的同时,都提到当下技术根本达不到。那么,技术上真的不可行吗?

 

“当然可行了”,在被AI财经社咨询这一问题时,一位从业20年的资深语音专家淡然到如同正在谈论最基本常识。


而另一名语音专家也马上举例证明:“滴滴新增的功能不就是嘛!上车之后它会提醒你,全程会被录音。”按照滴滴的协议,司机手机上的滴滴App会对整个行程进行录音,并加密上传,7天后无投诉会被删除。



在专家眼里,“偷听”这一整套技术流程并不复杂。只要我们在安装某个App时授权了“麦克风”权限,当监测到有人说话时,App就可以做到被唤醒、录音和分析。


不过有个问题,调用麦克风录音时,正规的App会有提示,就像滴滴那样,或者让用户做个动作,如按下某个按钮。但不正规的做法是直接就开始录音了。一些软件未经提示的操作,之前曾被意外发现。


比如,去年vivo推出了一款可升降摄像头的手机vivo NEX,用户发现,有时当QQ 浏览器打开携程网页时,手机摄像头就会弹出个头,再迅速降下。由于没有任何系统提示,摄像头就被启动,此举被怀疑为“想要偷拍”。后来QQ回应确认了有调起摄像头的动作,但否认这一动作会开启摄像头拍摄或记录,称是在读取摄像头参数,以供后续使用(如扫描二维码)。


即便有谨慎用户关闭了App中的“麦克风”授权,但一些非常规操作,也能实现不经授权就进行监听的可能性。


虽然技术上难度不大,但科大讯飞的技术专家从成本角度,认为手机监听行为不现实。目前语音转文字有两种方式:本地直接转换或者云端转换。前者会耗电,你的手机要比正常情况下更快没电;后者如果是大规模监听,需要企业搭建或者租赁高集群服务器、部署接入带宽,不仅费用不菲,正规技术提供商也不能这么做。“以讯飞输入法为例,为了保障用户语音转文字时的输入体验,每年投入的运营成本就达数亿元。”


一位语音专家告诉AI财经社:“如果是纯语音,不压缩,1分钟是1MB到2MB;但语音可以被压缩到1/20,也就是1分钟100K左右。”


就此,有云计算人士给AI财经社算了一笔账,以10亿人每人录音100分钟的高额度计算,所需的存储硬盘零售成本大约300亿元,费用确实高昂。“但实际上你并不需要存储,提取关键词就够了。”该云计算人士补充说。


这得到部分语音专家的认同。“300亿有点夸张了,不用所有信息都存储。“


一位语音专家对AI财经社补充分析说,语音识别占用的资源非常高,要上传到云端来做。手机可以检测用户是否在Wi-Fi的环境下。如果是,就可以把语音上传,而用户根本感受不到流量被占用。


在云端,语音先被转换为文字,再就文字进行分析。“你如果使用商用的语音分析技术,那就贵了。但如果你自己有模型,那只要有服务器就够了。”


这位人士继续算账:一般受欢迎的头部App,用户量大多几个亿,高频用户可能就剩1/10了。商家针对语音分析后,只要存储给用户打的标签就好了,比如想买什么电子产品或者衣服,或者存储语音的文本,没有必要存储语音。这样,App商家现有的服务器资源完全够用。”




那么还有一个问题,App是24小时监听吗?语音专家给出了一个检测的方式。“如果你怀疑某个App可能做了这件事,可以先关掉手机上其他的App,就留下这个应用,然后在网上打开一个名为Sniffer的监控器,监测这个App什么时间往哪个地方传输了东西。我们可以把这个数据拦截下来,它可能是加密的,也可能是明文的。如果是明文,你就能知道传输了什么;但如果加了密,我们就不知道它发的到底是什么了。”


很可惜,这个本应由专业的安全实验室来检测并公布的事情,至今“无人问津”。用户的猜测和质疑则一直停留于传闻中。


不过,也有人士认为,信誉危机是任何一家大企业都不愿面对的风险。Facebook被曝出超5000万用户信息在用户不知情的情况下,被“剑桥分析”获取并利用后,其市值一天蒸发367亿美元,创始人扎克伯格则在美国国会参议院被质询了10小时后,还专门赴欧洲议会道歉。言下之意,大企业没有必要这么做。


 “我个人反而更担心智能音箱的数据隐私。”一名云计算专家说,相较于手机,一直插电、连Wi-Fi的智能音箱更有条件上传用户数据隐私。

 

去年8月,一名亚马逊商城的德国用户爆料,自己在向亚马逊讨要个人活动语音数据时,对方竟然发来100MB 压缩文件,里面有Echo收集的1700 份陌生人对话录音,还有主人在家沐浴的声音。另有一对美国用户,夫妻谈论硬木地板的对话,被Echo以短信形式转发到一名朋友的手机上。


一位国内音箱从业者对AI财经社透露,音箱确实因为技术待完善等因素,出现了打包用户对话数据上传云端的事情。泰尔实验室曾对音箱进行测试时,使用了一些技术可以让音箱实现开启、下单购物等动作。这位从业者建议用户在不使用的时候拔掉音箱电源。

 

虽然偶发事件并不能一概而论,但用户担心被App偷听,看上去并非大数据时代的杯弓蛇影。

  



02

狮群和羚羊

 


蹊跷的事件仍在不断上演。

 

360安全专家、黑客研究院院长杨卿,曾在微信上跟朋友聊到要买芬迪(FENDI)包。等他打开某些电商,相关商品推荐就静静地躺在首页,等着他放入购物车。“当时我都不知道后台是哪个App监测到的。”

 

前媒体人胡戈最近因为两次巧合删掉了抖音。第一次,他跟安卓机朋友在微信中聊到某家牛肉面馆。几分钟后,该朋友截屏给他,抖音首页推荐了这家牛肉面的探店视频。没两天,他又和这位朋友聊起某个在玩抖音的同行以及她的用户名。几分钟后,这位可怜的朋友又截了个屏——抖音推荐了刚被提起的同行所发的一段小视频,而两人并未有过直接交集。

 


深圳工作的王佳音,在线上寄出快递后,打开某短视频平台,跳出眼帘的第一条推荐内容相当贴心:专家拆解快递纠纷如何维权。

 

AI财经社获知,在这些“巧合”的背后,是一个分工明确的个人数据捕获、分享进而营销的生态。

 

实际上,多年以来,超级大平台、App和网站一直在合力追踪和解读个人数据。也许在市场竞争上,这些企业之间是亦敌亦友的关系,但在收集个人数据这件事上,他们之间展开了不分敌我的精诚合作。有人比喻这就好比围剿猎物的狮群,而用户不过是在非洲大草原上奔跑的羚羊。


大数据从业者赵鹏为AI财经社记者梳理了该生态追踪和解读个人数据的过程。


至少有几个层面可以获取手机用户数据:运营商层面,可以通过IP地址,获取用户的物理位置(MAC地址),但要提取具体内容难度很大;通过调用GPS定位,App也可以获取用户的地理位置数据。在操作系统方面如安卓,可获取用户App安装列表及在某个App的停留时长,而App内的具体浏览只有App自己掌握,“就好比安卓知道你在京东停留了5分钟,但你把哪件商品放入购物车,则是京东才知道的细节。”还有一类是搜索引擎数据。


在开放的安卓生态内,App可以通过一个SDK(软件开发工具包),能很容易获取到用户在手机上各App的浏览行为、打开频次、停留时长等数据。赵鹏相信,很少有人仔细看,部分App使用条款里索要“App安装列表”、“停留时长”的权限。“你真注意一下的话,可能有的App压根你就不敢装。”


个人数据收集之后,就到了“分食”环节。AI财经社记者注意到,在App厂商的用户隐私协议中都会表明,用户信息将共享给提供服务的第三方或者合作伙伴。

 

这就是说,App收集的个人数据既会用于自身,也会分享给其他盟友,包括超级大平台、其他独立App、数字营销平台、移动广告分析公司等。而食物链顶端的几家超级大平台,由于已经搭建了规模空前的个人信息数据库,他们会挑选自己愿意分享的合作伙伴。


“用户授权给App,App间接授权我们。”一名大数据营销公司负责人对AI财经社记者坦言,通过众多App间的交叉授权,他们可以获取多维度用户数据。这你就不难理解,你在百度中搜了某样东西,随后在今日头条看到推送时,很可能并不是两大平台直接打通数据,而是多个平台、App和营销平台的分享合作。




现在,这个狮群已经能精准定位羚羊的位置、出没的习性,也能一打一个准。也许你在某个电商App中搜索了“瑜伽垫”,超级大平台和App就能迅速合力调齐你的家庭住址、上班的写字楼、收入水平、消费偏好和健康情况。然后,你就能在超级大平台、App和网站上看到“投你所好”的推送——家附近的瑜伽馆、合适价位的健身卡、符合要求的营养品。

 

当然,理论上这种数据并不涉及个人隐私数据。“收集上来的数据会做匿名脱敏处理。用户的详细个人信息,比如性别、年龄段都是数据使用方不知道的,而身份证、手机号和姓名等更不可能出现在大数据中。”一家云计算企业旗下数据交易平台的业务负责人对AI财经社分析说。


很多用户方反感这种精准推送。“但这就好比有人买了在这条路上发卖房小广告的权利,而你正在这条路上开车,车窗敞着,他当然会往车里塞小广告。这时你有两个选择,换条路开,或者关上车窗。当然很大概率,其他路上同样有发小广告的。对于修路者来说,他要盈利,不向用户收费,那怎么办?只有卖广告。“


毕竟广告是互联网生态的命脉之一。




03

你说这些有意义吗?

 


“你们说这些有什么意义?在国内难道还有隐私?”在与AI财经社交流数据权限话题时,一名杭州App开发者上来就如此反问。

 

无论是从业者还是用户,都知道这是一场不对等的游戏。起码从新近测评结果来看,指望App厂商不越界,似乎不如期待自己买彩票中了特等奖——


今年1月,上海消费者权益保护委员会评测了39款App,结果25款应用过度索取用户个人信息权限,“越界”率占到64%。

 

饿了么先是被发现在用户不知情下,向邀请对象发送电子邮件,读取日历,后在整改中又上线了“读取通话记录”权限,官方回应是在“不知情”的情况下上线。神州租车App的“胃口”更大,可拨打电话、录音以及监控外拨电话,还可以重新设置外拨电话的路径,甚至修改或删除SD卡中的存储内容。百度糯米对手机照片、通讯录等都存在“安装即获取”的隐形协议,格瓦拉则是索取短信、通讯录、麦克风三个权限,但并未找到对应功能……


很多App是霸道的,不同意授权就不让你用。最近一些餐馆流行扫码点餐,在提高餐厅效率上这是件好事,但这些应用或要求微信、支付宝登录,或索取你的手机号和位置信息,你若不照办就点不了餐。




难怪有用户在一篇评测App隐私政策的文章下吐槽:“尊敬的用户你好,我是你祖宗。使用本产品前,请先同意服务协议。”


在法律不健全和使用常识参差不齐的情况下,用户并不知道相关权限是否该授权,并且一些权限被授权后,到底干什么,App也没有清晰的解释。比如,App把你的个人数据共享给第三方,到底是哪些第三方?App读取了你的通讯录和通话记录后,去干了什么?有些灰产利用这种信息差,就轻易进行了变现。


一位用户还向AI财经社提到,两年前她尝试下载职场社交软件脉脉,但看到要读取自己手机通讯录一条,且为必选项,吓得她赶紧停止安装。后来她换了新手机卡,再去尝试安装该App,被告知“你的通讯录联系人太少,无法安装”。


这涉及到更深层的问题。“我通讯录上的人有权知道他们被这样‘出卖’了吗?”她反问AI财经社。此前,Facebook数据泄露事件就是Facebook把点击了同意按钮的用户信息给了第三方机构,其中包括这些用户的朋友圈好友,但好友们并不知情。Facebook已经修改了针对此的隐私条款,脉脉也将手机通讯录改为可选项。


今年,一名法学博士生凌先生以个体身份,起诉抖音、多闪侵犯隐私权。他在手机通讯录除其本人之外没有任何联系人的情况下,使用该手机号注册登录“抖音”账号,并发现“抖音”App推荐的“可能认识的人”,大部分都是他的微信好友,但他从未使用微信账号登录过“抖音”。这件事的发生很可能是他好友的通信录被授权。


腾讯社会研究中心与DCCI互联网数据中心联合发布的一份《网络隐私安全及网络欺诈行为研究分析报告》中指出,手机App越界获取个人信息也是网络诈骗的主要源头。


为此,有专家建议,用户不宜在一个App上久留,就如同羚羊不要在草原上某处长时间立足一样。


部分有潜在越权可能性的软件还会偷偷更新,获取个人数据。杨卿表示,安全公司未来花大力气做的一项工作可能就为App每个版本都留存快照,这样既可以"保留现场",也通过App行为的安全自动化分析能力,去回溯并追查曾经有问题的历史版本并进行取证。


这还不仅仅是App的问题,用户隐私和保护涉及到整个围猎个人数据的食物链。




“杨卿所在的团队,曾对多批白牌硬件产品进行监测,发现不论是硬件本身,还是手机App端,或是IoT云端,安全指数与抗攻击入侵能力低到令人发指。这些产品多数是通过购买一次性软件方案,快速OEM的产品,即便出现安全漏洞,"白牌"产品企业也不具备研发软件补丁的能力,漏洞也就无法及时得到修补。这种情况相对普遍,所以他们从碎片化的抽查变成了向有关部门建言献策。”

 

在操作系统层面,安卓被提及次数远大于苹果。上述网络隐私安全的报告指出,高达96.6%的安卓应用会获取用户手机隐私权,苹果iOS系统应用的这一比例也接近70%。“大公司给员工配手机都是选苹果。”据赵鹏所知,这主要是出于信息安全的顾虑,“安卓机你不知道哪个App一更新,它在后台就打开了麦克风。”

 

一位深圳手机厂商负责人对AI财经社称,他们销往海外的每一部手机,所搭载的安卓系统都要经过谷歌的兼容性认证,其中安全性测试是很重要的一项。但由于特殊原因,国内安卓机没有这道程序。


在这种情况下,“是否滥用个人信息,基本取决于厂家和App的自律。”该负责人说,他所在品牌要求做到从硬件上“锁死”权限,不会全都打包对App厂商开放,理由是国内年销量只有几百万台,对大数据没想法,也“不想惹麻烦”。

 

从营收角度,广告收入占总营收9成的谷歌,其安卓系统从一开始就选择与App厂商一起来围猎个人数据,与苹果对权限管理、对用户隐私的态度迥然不同。2012年,谷歌曾向Safari浏览器支付2250万美元罚金。原因是谷歌通过修改代码,绕过了苹果Safari的默认隐私设置,得以对Safari的用户继续追踪。

 

原生安卓系统从6.0开始才提高权限。谷歌近期发布的安卓Q版作出进一步改进:对敏感信息的访问权限、摄像头及麦克风后台访问控制等权限,增加了“仅在试用期间”授权选项。此前,安卓用户只有拒绝和永久授权两个选项。

 

不过有媒体发现,即便同样是安卓版本,也会有国内外待遇不同的情况。亚马逊在 Google play 上申请22个权限,国内版则申请了42个权限。腾讯《绝地求生》国际版申请17个权限,国内则申请33个,多出的权限中还包括GPS定位。


这侧面印证了在《网络安全法》之外,国内还亟需专项法律细则来明确个人信息保护权限。


接受AI财经社采访时,很多从业者都推崇欧盟通用数据保护条例(GDPR)。2018年正式实施的GDPR,在欧盟的法律效力仅次于宪法。其明确个人数据是任何一个自然人的信息,包括姓名、身份证号码、定位数据、在线身份识别等数据,数据主体享有数据可携带权,被遗忘权,限制数据处理的权利以及反对数字画像和数据自动处理的权利。


GDPR还大大增加了数据保护的强制性和责任性,对违规的处罚金额提高到2000万欧元或企业全球年营业额的4%(二者取较高值)。今年1月,法国相关监管机构就依据GDPR,向谷歌开出了5000万欧元巨额罚单,理由是谷歌在向用户定向发送广告时缺乏透明度、信息不足,且未获得用户有效许可。


但中国的《个人信息保护法》刚刚纳入本届立法规划,可以说还在路上。


“每个人既是大数据隐私的受害者,也是受益者。”每日互动创始人方毅此前在接受AI财经社采访时表示,作为服务商,在数据获取时应该必要性原则、最小获取原则、用户知情权原则,同时,坚决杜绝用这数据进行买卖,尤其是电话号码、电信诈骗、推销骚扰,对大家的伤害非常大。


赵鹏还是期待从立法的根本环节上改变现状。“这就像雾霾天,是该呼吁大家关好门框、呆在家里,还是出拳治理雾霾更有效?”


云知声董事长兼CTO梁家恩对AI财经社说,技术和隐私是一对矛盾体,法规健全很重要。“假如你被抓到以后,后果是不是很严重?如果这些没有建立起来,光靠技术来解决是不行的。”


今年1月25日,中央网信办、工信部、公安部和市场监管总局四部门联合发布了《关于开展App违法违规收集使用个人信息专项治理的公告》,并成立App违法违规收集使用个人信息专项治理工作组,面向老百姓开通了“App个人信息举报”微信公众号、专用邮箱的举报渠道,还成立了个人信息保护专家组,由专家组对评估结果和有争议问题进行裁定。


这被视为在个人信息保护上又向前迈进了一步。


很多人说,没有必要做大数据的恐慌者。但英剧《黑镜》为未来的不设防做了一个讽刺性预言:通过对过世用户生前在社交媒体上的语言风格、兴趣喜好等数据分析,科技公司可以用AI技术再造一个相貌、性格、说话方式完全相同的“人”。


如果权限和隐私没有边界,谁能确保未来不会有可怕的事情发生?


(注:应受访者要求,袁晓、赵鹏、王佳音均为化名,唐煜对本文亦有贡献)









© 往期回顾








© THE END


本文由AI财经社原创出品,未经许可,请勿转载。 


部分图片素材源自视觉中国


商务合作请加微信:milk-519


本账号系网易新闻·网易号“各有态度”签约账号

/


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存