查看原文
其他

你的网络隐私可能全被它偷走了


从短信轰炸到诈骗电话,当消费者开始意识到问题的严重性时,个人隐私可能早已被偷走卖掉了。


刚更新了签证信息,团购看机票,就收到各种旅游的营销短信、骚扰电话。从事网络信息安全十余年的北京消费者付先生,想到了三个泄露途径:

  • 管理部门不可能泄露;

  • 航空公司有泄露的可能,但有一定的风险和制约;

  • 网络爬虫却没有这些负担,而且从技术上说可以从容实施。


01

显而易见

最可能“出卖”消费者信息的

就是这只“虫子”


网络爬虫,其实就是一种“自动化浏览网络”的程序,按照一定的规则,自动抓取互联网信息,比如网页、各类文档、图片、音频、视频等,通过索引技术组织这些信息,根据需要快速地提供搜索结果等,是网络搜索引擎收集网上信息的主要手段,也被称为网页蜘蛛或网络机器人。


▲林海燕制图


如同你走路会留下脚印,消费者在浏览网页和点击应用时,自然会在网络上留下痕迹。网络爬虫软件程序,正是模拟了这一行为,只不过速度更快,跳转的节点更全面,所以被形象地称为网络爬虫或网络蜘蛛。


网络爬虫的出发点自然是好的

但慢慢被一些人给用歪了


02

不良数据公司

33页精确个人信息仅售3.8元

提供爬虫技术服务的人士直言

任何一个消费者

只要消费信息被上传到网络上

均可以毫不费劲地被爬出来


去年底,网络曝出南方都市报记者通过随机检索,在一家名为探知数据的科技公司仅花了3.8元就买到了事关个人隐私、长达33页的详细通讯信息报告。包括个人基本身份信息、近半年的通话记录详情、账单消费、出行信息和人脉关系等,并有详细的量化评分,信息精确度非常之高,出行信息准确定位到经纬度、门牌号的居住地址等。
   

除此之外,该公司可提供的服务产品还包括电商、社保、公积金、央行和学信网,查询结果五花八门,而且价格低得惊人:花费1元钱即可抓取的淘宝数据量最多为25页订单数据、京东近3年的消费数据……



而仍在为部分数据公司提供爬虫技术服务的北京某信息公司负责人郭先生并不隐瞒:


“抓取这些数据并不难,一是部分网站安全意识不够,或者防范能力不足,二是部分网站睁只眼闭只眼,有意无意地放任不良数据公司去抓取。”


“任何一个消费者,只要消费信息被上传到网络上,或者在网上消费,从衣食住行到生活社交各个层面,均可以毫不费劲地被爬出来,根据需要,进行多维度分析。”


03

购物、比价返利平台的“爬虫”秘密

数量令人震惊

消费者根本无从知晓

个人信息的泄露渠道

无法追查


以电商网络流行的“货比三家”为例:很多电商平台都有自动调价功能,其实正是通过爬虫程序扫描同类网站商品的价格,针对性地展开相应的调整,从而取得价格优势,为销量提供保证。



从事电商网络平台和软件开发多年的北京某网络技术公司负责人吴先生直言不讳地告诉记者:


“目前各家网络平台都有自己的技术在用,十多年前就有了该自动比价模式,底层技术就是爬虫。”


据吴先生介绍,其实,在电子商务行业,使用爬虫玩“猫捉老鼠”的游戏,是一个公开的秘密。每个电商平台一方面希望阻止竞争对手抓取自己的网站,另一方面又想渗透对手的网站。尽管各大电商平台都拥有各类技术防范,但网络爬虫数量还是令人震惊。除了竞争对手外,更多来自越来越多涌现的数据公司,目的就是获取消费者信息,形成产品进行销售。
   

“很多消费者可能接触过一些类似的比价平台、聚合电商或返利平台等等,大体原理都是一样的,消费者搜索一个商品或服务,平台就会自动把各大电商的商品放在一起供消费者选择,其实就是爬虫技术的应用。


网络爬虫在为消费提供货比三家等便利的同时,不知不觉就收集了消费者浏览记录、消费记录、家庭位置等等信息,形成数据报告用于销售,方便商家进行有针对性的广告投放等等,而且,消费者根本无从知晓个人信息的泄露渠道,无法追查。”


你怎么看网络爬虫

欢迎留言


阅读推荐


中国消费者报新媒体编辑部出品


来源/中国消费者报·中国消费网

记者/胡军

编辑/裴莹

监制/何永鹏 田珍祥




来潜个水,有料
文章已于修改

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存