查看原文
其他

滴滴与扫黄

起点财经 2021-07-13

The following article is from 慕云朝伟 Author Danlores

原创:Danlores

来源:慕云朝伟(ID:tt2gg99)

文章已获授权



网信部一纸檄文,将滴滴推上了风口浪尖。


我有个朋友从事银行数据科学工作,对大数据隐私比较敏感。


银行辅助进行黄赌毒排查工作。


以黄为例,聊聊大数据如何用最基本的信息和最简单的手段,找出LSP和不法分子。


每个银行都有一张最基本的用户收支明细表,记录每个用户的每一笔收支记录。


如【时间】2021年7月5日8点15分,【持卡人】Jack在【商家】永和豆浆早餐店花【金额】5.5元买了一杯豆浆、一根油条和一个荷包蛋。


这份数据可以用来解读非常多的信息。


如何扫黄?


第一步,找出那些晚上11点至凌晨3点仍有活跃交易的账户;


第二步,如果这些金额也符合金额特征如"398元"、"498元"等,那就把这笔交易标记为可能涉黄;


这里需要特别指出的是为什么不用商家名称,因为有些搞黄色的按摩会所非常狡猾,很少有使用直接商户名的(如"红浪漫按摩养生会所"的收款名称可能摇身一变成了"永久便利店");


第三步,假设一个商家1个月有1万笔交易,且70%的交易都符合上述特征。那么大概率这个商家就是涉黄的。


银行会把这批名单输送到公安,至于公安下一步怎么做那就不知道了。


一个特别搞笑的事情是4月份月度排查的时候,名单里居然出现了一家"榆林市解放路空气净化器"的商家,我们觉得不可思议,是不是数据搞错了。


再次核实后确认,这个商家4月份共有989笔交易,有304笔交易是398元,483笔交易是698元,而且交易发生的时间都是在凌晨。


后来同事们笑称,这哪里是空气净化器,明明是前列腺净化器。


回到滴滴,滴滴掌握的是用户出行数据。


何为用户出行数据?从数据库的角度,至少可以拆解成三张表。


1.用户出行记录表,Linda早上8:00从科苑路打车到科技园;


2.底层LBS表。精确到经纬度的位置映射,如北京动物园,116.344765,39.941026;


3.地理名词标签表。如科技园西南门-高档写字楼;红浪漫KTV-休闲娱乐;凑凑火锅(大悦城店)-餐饮火锅。


这三张表可以用来干什么坏事儿?我脑补如下:


1.用户隐私角度。


还是搞黄色,拿搞黄色的为例,近半年内去过5次以上休闲娱乐场所的标记为可能搞黄色;


当然了,滴滴不拿搞黄色盈利,推送贷款才是主要用途。


这里从风控角度可以衍生非常多的标签;如经常往返机场,说明你是有一定消费能力的差旅人士;半年前就注册了但是一直没用,最近开始使用打车软件并且去了好几趟趟家居城。


那么你极有可能被推送贷款。


因为你还得起且有贷款需求。


2.国家安全角度。


2.1暗杀大人物。


北京大院住了很多大人物,当然这些住所很隐蔽,就算你是FBI,也不能挨个排查。因为工作量大。


如果有了滴滴大数据,就可以用排除法了。


首先这些大人物大院子不可能有人经常坐滴滴,人员活动受到限制。搞清楚打车热力图就可以极大减少排除工作量。然后展开暗杀行动。


2.2策反小人物。

从差旅人士里面找策反对象。


比如禄口机场-南京核工业集团、中川国际机场-兰州核工业基地。


有人会问了,这么级别的人物还需要打车?派奔驰接送不就完了么?


有一类群体是管理咨询顾问。他们经常出入各个国企,自己打车…十四五战略规划项目接触到保密材料绰绰有余。


大数据时代,每个人都在裸奔。


怎么把裤子穿好?几个tips送给大家


1.笛卡尔集支付。3张银行卡、3种支付方式(微信 支付宝 银联),比如今天用微信建行卡吃饭,明天用支付宝招行卡网购。


当然,现金最安全。


2.不使用真实地址。如想打车去红浪漫ktv,那最好是定位终点为附近100米的鸡公煲或者肯德基。


3.不作恶。人在做,天在看,数在记。


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存