查看原文
其他

【大数据专栏】广告业与技术:通过数据来了解你

2014-10-14 科技杂谈
科技杂谈keji_zatan

新谈友,请点击题目下蓝字关注我

中国通信行业影响力最大的自媒体


本文来源于经济学人


  在被搬上好莱坞荧屏的系列小说---《分歧者》中,有这样的描述:在后启示录时代的芝加哥,人类依据其各自的能力和价值,被划分为五大派系。而且,所有年满16岁的青少年需要进行一项决定其派系归属的测试。在网络广告的世界中,或许没有这么精细的区分,但是,收集大量的网络用户信息并进行销售已发展成为一项规模不小的生意。对于产值高达1200亿美元的网络广告经济而言,数据信息无疑是极其重要的。


  奥马尔·塔瓦科尔(OmarTawakol),是以跟踪客户网络行为并将获取的相关信息卖给其他公司为业务的数据代理公司Bluekai的老板,其表示:“这是一场信息战争。所有工作的核心就是尽可能多的收集客户信息,并通过销售该类信息获得更多的收益。”互联网的存在大大减轻了信息收集工作的工作量,因为无论用户浏览何种网站,其都会留下浏览痕迹。脸书(Facebook)及推特(Twitter)收集了大量本网站注册用户以及浏览其网页的用户的信息,包括年龄、好友群以及他们的兴趣。其中的不少信息,在用户毫无意识的情况下就完成了收集。富国证券公司(WellsFargoSecurities)的网络分析师彼得·斯塔普勒(PeterStabler)就表示:“比如说,添加在其他网站的脸书‘赞’或者是推特‘发推文’按钮,其含有特定编码,借助该编码,即便用户并未点击该两个按钮,这两家社交媒体公司亦可跟踪用户的动态。”


  广告行业主要通过两种方式获取用户数据信息。“第一方”信息由与用户产生直接关系的公司获得。广告商及出版商可通过要求用户进行网上注册而获取用户信息。这可以帮助企业通过各种操作终端进一步加深对消费者的认知,了解他们浏览了本公司网站上何种信息和购买了何种物品。


  “第三方”信息则是由互联网上成千上万的专业公司收集获得。“像这样人们并不熟知的专业公司,其数量正急速增长”,身为该类专业公司一员的移动广告公司欧朋(Opera)的老板---迈得·席尔瓦(MahideSilva)如此说道。为了收集足够的信息从而发布适当的广告内容,许多公司网站为具备监测浏览网页用户并为用户建立数据文件能力的专业公司提供网络空间,供其使用。例如,Bluekai公司在全球收集了多达1亿份的潜在消费者档案,每一档案的资料信息平均有50条之多。


  用户在浏览不同网页时,第三方公司常常通过使用信息记录程序(cookies)、网站信标标签等网络技术及其他网络工具,以达到正确识别用户的目的。广泛应用于台式电脑的cookies(网络或互联网使用者发给中央服务器信息的计算机文件)是用于同客户服务端进行信息交换的代码片段。根据TRUSTe公司提供的数据,访问量前100名的网站,受到超过1300家专业公司的监测,其中,有些公司会将该类信息与非本行业者分享,供其使用,俗称“借道”.


  因而,上述技术及工具使得公司能够收集足够的客户信息,诸如他们浏览了什么网页,购买了什么物品、所在社区的邮编等一系列信息。通过这些信息,公司能够推断出用户的收入、他们家的房屋面积以及他们的房子到底是租来的还是自己所有的。通常来讲,网络用户在浏览特定网页时,会被网站赋予特定的标签,但是,各家公司获取用户信息的手段可远不仅如此。广告技术公司RadiumOne即是如此,当网络用户点击其朋友发来的网络链接时,RadiumOne公司就会在用户通常不知情的情况下,在用户端生成cookies.移动设备上的信息收集则会更加精准。帮助出版商进行实时广告空间销售的PubMatic公司,能够提供台式电脑用户的50-70个数据点,而关于手机用户,该数字为100个数据点,包括手机设备所在的精准方位数据。手机用户90%的时间都是通过不支持cookies的手机应用(又称“apps”)浏览网页内容,因此,广告商、应用开发商及中介公司会利用用户设备ID等工具来识别用户。


  各家公司重申他们并不知道用户的姓名。但是,他们通过编号来确认用户的身份,且由于他们为每个编号的用户建立了详细的数据档案,有人担忧借助这么详细的数据信息可能会直接找到具体的个人。这让广告公司处于两难的境地。他们当然想炫耀自己强大的追踪能力和数据信息提供能力,但是,又不想因为知道的太多而让用户感到恐惧和担心。握有用户姓名及其他个人信息的脸书公司表示,其向广告商出售用户信息的行为是建立在尊重用户隐私基础上进行的。


  分门别类


  收集并处理大量的用户信息并非易事。数据代理公司帮助广告商以及出版商管理他们的第一手用户信息,同时,也向他们出售更多的用户信息,借此实现盈利。数据代理公司按照用户的所在位置、使用设备、婚姻状态、收入状况、工作类别、消费习惯、旅行计划及其他标准将用户信息进行分类,并将该信息分类即时提供给广告位购买人,供其购买。该信息分类能够非常具体。例如,数据代理公司eXelate出售“深处危机的男人”分类,该分类下的男人被认为恋爱关系出现了问题,因为他们正在网上购买巧克力和鲜花。另外一家数据代理公司IXI则在销售名为“深陷债务:小镇单身族”的信息分类。


  绝大多数消费者对专门以收集其信息维生的公司知之甚少,但是,他们确实了解一些以此为副业的公司。出版公司福布斯(Forbes)公司销售浏览其网站的读者的信息。竞选组织则将其广告分发对象名单租赁给其他公司使用,从而实现一定的盈利。婚恋网站OkCupid曾销售关于其用户的酒类消费以及用药数量等信息,但该网站表示,现在他们已不再销售该类信息了。


  包括维萨卡公司、万事达卡公司以及美国运通卡公司在内的信用卡公司都向广告公司销售其持卡人的匿名数据。广告位竞标人可在万事达卡公司购买到大量的消费者分类信息,例如,哪些用户需要特定的通信服务,而哪些用户又偏爱哪家连锁酒店等信息。曾在美国运通卡公司工作的业内人士表示,该公司在这方面是具有优势的,因为它能够直接发行信用卡(而维萨卡公司及万事达卡公司只是同银行合作,并无直接发卡权力),这就使得美国运通卡公司可以在信用卡用户登录查看其账单时在用户端生成cookies并查看用户其他的网上动态。


  拍卖会亦是巨大的信息来源。不少公司都会经常去广告交易所,以获取用户及出版商的信息。以买卖广告为营业并被称为“网络广告商”的广告代理公司通过网络收集大量的信息。例如,之前,媒体采购公司分享传媒(Mediashare)打算为其客户---纸巾制造商舒洁(Kleenex)选择最佳的广告宣传区域并进行宣传,然后,其参加了搜索竞价以了解当时那些地区的消费者正在搜索与流感、感冒药品有关的信息。在了解了相关信息后,其在拍卖过程中故意报出低价并成功在拍卖会中脱身。随后,分享传媒公司将关于舒洁公司的市场营销工作主要集中在了这些有人可能感冒的区域。各家公司总是尽全力去了解他们的消费者。直销商常常借助出生证明、婚姻证明及房契等公共档案信息了解消费者的信息,而目邮购公司则会将其客户信息列表出卖给竞争对手。但互联网的存在,大大扩大了数据采集的范围和规模。有些情况下,用户明确表示同意网络服务方可以追踪他们的信息,但更多时候,第三方服务方是不会征询他们的意见的,而且第三方服务方在收集完信息以后以消费者以及政府监管机构所不知晓的方式对上述信息进行利用。


  各家公司总是尽可能多的去了解用户的个人信息。有一种办法就是了解用户正在使用的终端设备。而要求用户进行登录才能进行操作的脸书、谷歌及推特公司就拥有了优势,因为他们可以识别通过不同终端登录网站的用户。登录到相同的无线网络亦有类似的功能。


  同时,各家公司亦积极的将线上及线下世界产生联系。以脸书为例,其已与得利捷(Datalogix)公司达成合作关系,以实现线上及线下消费的联系。作为最大的具备线下信息处理技术的数据代理有限公司之一的Acxiom公司,近期耗资3亿美元将Liveramp收至麾下,后者精于将消费者的线下消费信息与线上信息进行匹配。


  这可不是什么新鲜事了。早在十五年之前,网络广告公司--后期被谷歌兼并--双击公司(DoubleClick)就收购了以收集客户线下消费信息而知名的Abacus公司。但因为提倡保护隐私权者的异议和反对,双击公司不得已放弃了该项目并在2006年将Abacus转出。现在,不会再有这样的反对声音了。之前曾在双击公司工作、现在在广告分析公司IntegralAdScience担任总裁的斯科特·诺尔(ScottKnoll)表示:“科技已经有了明显的进步,所以,对相关信息进行匿名化处理并非难事,目前,不少公司已着手开始相关的工作,社会、管理机构对此还并不了解。”


  数据公司表示,他们十分重视保护用户的个人信息,也正因如此,有时他们很难追踪用户的信息。重视个人隐私的用户会定期删除cookies.广告商亦指出,他们对用户的敏感信息并不感兴趣。一家数字广告公司的经理就说道:“我们并不关心你是否有偷税漏税或者是否对你的配偶有不忠的行为,我们并非搜寻你的个人信息,我们只是想确定一下你是不是我们的高端客户,是否有购车的意向。”


  “我们能够处理的更具技术性一些,而非单纯在社会舆论允许的范围内肆意为之”


  有时候,广告商并不愿意使用手中的信息,因为他们并不想看起来像是在监视消费者。数字广告公司DigitasLBi的托尼·韦斯曼(TonyWeisman)表示:“我们能够处理的更具技术性一些,而非单纯在社会舆论允许的范围内肆意为之。”对于针对购买了特定物品的消费者的目标确认工作,许多广告商通常会等一段时间再进行,因为他们不想泄露他们所知道的信息。数字音乐公司Pandora的首席市场官西蒙·弗莱明·伍德(SimonFleming-Wood)表示:“我们在寻找收集用户信息行为的界限,但同时,我们的使用方式会尽量保守。”


  看管好你的浏览器


  作为网络广告基础的信息数据收集系统引起了大家的几个疑问。其中就包括消费者的隐私。广告公司宣称他们不会将敏感的个人信息或健康信息用于广告目的,但在《广告时代》杂志社负责数据产业报道的凯特·凯耶(KateKaye),在就一则新闻故事进行了关于性传播疾病的调研之后不久,就收到了向艾滋病患者提供帮助的针对性广告。


  另一个担忧就是如何预防数据信息的泄露。很多公司在授权第三方连接其数据库时都十分谨慎,以避免出现安全问题或者将信息泄露给其他竞争对手。六月份,路透社的网站受到了叙利亚电子军的攻击,后者正是通过该网站上的一个名为Taboola的第三方在线广告实施的攻击行为。同时,人们亦对一款可以将信息公司收集的大量经过加密匿名的信息进行解密处理的流氓程序所可能导致的信息泄露灾难表示担忧。IntegralAdScience公司的诺尔先生不禁疑问:“到底由谁负责监督管理?所谓的权力制衡到底还存在吗?”


  普林斯顿大学计算机科学专业教授埃德·菲尔顿(EdFelten)指出,随着cookies及终端设备所包含的信息越来越多,识别用户身份将变得更加简单。菲尔顿先生及其他教授已证明,如果拥有足够的信息,已匿名加密的信息是可以破解的。一份研究发现,只需两个数据点即可识别超过一半的用户身份。斯坦福桥大学计算机科学研究员乔纳森·梅耶尔(JonathanMayer)就表示:“在计算机科学领域,如果有人提出个人可识别信息无法识别,那真的是天大的笑话。”


  另外,不同国家对于何种数据构成个人信息的标准亦有不同。在德国,未经当事人同意,不得向特定民族或持有特定政治立场的用户进行任何形式的营销,但在美国就不存在这种情况。进一步来讲,在欧洲地区,一封电子邮件或者一个IP地址都会被视为个人信息,在美国则不会。当地的数据收集及数字营销很大程度上都有效躲避了职能部门的监控,但在金融业除外。


  世界各国的职能管理部门都逐渐意识到,当前的科学技术已把他们甩出好远,他们正努力尝试进行追赶。在欧洲,一项正在编纂且极有可能在2016年正式公布生效的新隐私条例,将会引入严格(有人说是令人窒息的)制约数据收集行为的规则,该规则将适用于欧盟区的全部国家。许多网站已发出通告,告知用户第三方公司的cookies正在追踪他们的网上数据信息。在中国,习近平主席要求总理对该国的数据安全及个人隐私问题开展调查研究工作。


  在美国,一项旨在限制用户信息网上追踪行为的政府提案无疾而终。相反,根据数字广告行业自律系统之规定,用户可以在上网的时候选择拒绝接受目标广告(但没表明可以拒绝接受网上追踪)。在由签署自律计划的公司所发出的广告中,会含有一个“广告选择”图标,用户可以点击该图标从而拒绝上述行为。但根据TRUSTe公司克里斯·巴贝尔(ChrisBabel)的信息,在观察到该图标存在的用户中,只有0.00015%的用户选择点击进行拒绝。同时,那些删除cookies的用户会被自动重新纳入追踪范围之内,且这一程序将会无限循环。


  美国广告业的许多经理认为,监管的加强是大势所趋,特别是对于第三方及数据代理公司,更是如此。英国欧华律师事务所(DLAPiper)全球数据安全业务的负责人之一,吉姆·哈尔伯特(JimHalpert)表示:“其实监管工作并非针对广告行为本身,而是很多公司在当事人完全不知情的情况下就将关于他们的大量个人信息进行销售。”对于个人信息的使用方式及销售流向的监管几乎为零。哈尔伯特先生指出:每年对第三方数据收集公司进行审计工作应有助于确保个人信息得到正当使用。目前,对于该不当竞争行为表示担忧的只是学者、科技怪人及少数具有正义精神的消费者,尚未引起整个社会的注意,但之所以出现这种情况,应该是因为绝大部分人甚至还没意识到自己已被追踪了。


  欢迎大家加入科技杂谈菁英汇,交流思想、分享信息。仅限行业商端人士参与。参与方式:点击左下方“阅读原文”填写您的加入信息,科技杂谈通过审核后,会添加入群。


本文仅代表作者观点,科技杂谈授权刊登。

转载必须注明作者与科技杂谈,侵权必究。

科技杂谈文章,均同步发布于犀牛财经网。

已入驻搜狐新闻客户端,网易阅读客户端。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存