其他

大数据告诉你:公交车上谁是小偷!

2016-09-28 以墨茄data 捷软风控专刊

在旧金山举行的KDD2016学术会议上,罗格斯大学的熊辉等学者向大家报告了他们的研究论文“Catch Me If You Can:Detecting Pickpocket Suspects from Large-Scale Transit Records”。

论文报道在2014年的前9个月就有350个扒手在地铁交通系统上被抓,490个扒手在公交车上被抓。因此,他们对北京智能公交一卡通数据的分析研究,根据异常交通记录分析来抓小偷。共使用了北京市2014年4-6月三个月间600万乘客的约16亿智能公交一卡通数据记录。


如下图所示,熊辉等将北京划分为多个小的局部的功能区块,并分析了896条地铁线经过的44524个公交车站和18条地铁线经过的320个地铁站的数据。首先,从每个人的日常出现记录中提取特征;然后,进行无监督的异常行人检测和有监督的模式分类,从而挖掘出异常的出行轨迹。

挖掘结果分析


在谈到“根据异常交通记录分析抓小偷”方法的基本原理时,熊辉进一步解释,通过数据分析,可以看出很多人从热点区域A,到热点区域B的交通轨迹,对这些轨迹观察后,可以看到绝大多数的行人会选择最优的交通方式,比如,最短时间、距离,或者最少的换乘。


但是,一个行人(嫌疑人)选择的交通路线为A->C->D->B。

熊辉认为,“A->C->D->B”这是一种异常的交通方式,对上述异常行为需要进一步地仔细分析,如果该人的异常行为足够多,那么他很可能是一名扒手。


熊辉公布了他们的研究结果,如下表所示,利用TS-SVM算法,可以达到92.7%的召回率(即能够正确地识别出92.7%的小偷),但是遗憾的是他们的精确度有点低(也就是说算法的虚警率较高)。


另外,论文还给出了工作日早上8:00-11:00的四种出行模型,如下图所示。


(a)正常的出行者,可以看出他们主要在居住地、工作地、途经区域活动。

(b)旅游者,可以看出他们频繁地访问圆明园、天安门、南锣鼓巷等景点区域。

(c)购物者,可以看出他们主要访问王府井、西单等购物区域。

(d)扒手,他们是一种流浪的模式,没有清晰的目的地,他们频繁地换乘,随机的停留,经常进行短途的出行。他们还(一段时间内)频繁地访问多种功能区:交通枢纽(例如西直门)、购物区(例如王府井)、景点(例如鼓楼)【哈哈,终于知道小偷喜欢去哪里了!!】。对于正常人而言,他们短时间内只访问一个/一种功能区。

论文原文(英文版):http://www.kdd.org/kdd2016/papers/files/adf0629-duA.pdf

【温馨提示】平时怎么防小偷?

首先是站台上的初步判断。虽然说站台上的乘客具有一定的流动性,但小偷一般都集中在几个固定的站台作案。

小偷在站台上“蹲点”的时候有些规律可循。三五个人分散在站台上,眼睛一直盯着其他人的背包,而不是像其他人那样看着车开来的方向。在车上乘客少的情况下,跟着从站台挤到车门但不会直接上车。


小偷偷东西必须要近距离地接触失窃者,所以如果市民在车上发现有人突然推挤过来,就应该及时提高警惕,很可能是小偷在制造偷盗机会。


市民在车上发现失窃一定要在第一时间里报警。在报警的同时要关上所有的车窗户和车门,在警察赶到之前要提醒车里的人相互监督,小偷为了迅速转移赃物,经常栽赃他人。


不管是自己被偷,还是看见他人被偷都要及时报警,有时候警察抓到一些小偷,他们交代了偷窃事实,但因为找不到失窃者造成取证困难。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存