数据之王:Dataminr如何利用数十亿条公共推文监控整个世界
利用独特的数据科学方法,Dataminr正在推动行业转型并协助政府机构。
E安全3月7日讯 如果信息就是力量,那么Dataminr无疑拥有着至高无上的力量。通过实时访问每一条公开发布的推文,这家总部位于美国的企业能够在真正紧急的情况之下为客户提供实时突发性新闻警报——从恐怖袭击到校园枪击再到金融崩溃无所不包。
Dataminr公司首席战略官(简称CSO)彼得·贝利在接受国外媒体采访时表示,“在考量社交媒体的出现及其对于整个世界的意义时,答案无疑是其彻底改变了人们之间沟通以及发布消息的方式。”通常在纽约工作的彼得·贝利此次前往英国伦敦是为了参加3月1日召开的IBTimes/Newsweek AI与数据科学大会。而在大会之外,彼得·贝利亦分享了该公司对于数据科学方法以及未来发展的见解。
他在主题演讲之后的说明中表示,“我们身处实时信息业务领域之内。这一行业的核心在于探讨如何表达并检测这些信息,并将其进行转换以交付给专家、运营商以及其他能够借此实现关键性功能的各方。”
为了更为明确地解释该公司的运营覆盖范围,他表示Dataminr每天需要提取5亿到10亿条公众推文。其与该社交媒体平台拥有密切联系(Twitter持有Dataminr公司约5%的股权),而彼得·贝利表示正是这一点令该公司得以脱颖而出——至少就目前而言是如此。
他解释称,“我们使用大量不同的数据集,但Twitter在其中扮演着不可或缺的角色,因为我们的核心用例之一正是以Twitter为基础告知世界我们观察到的状况。”
“在着眼于全球社交媒体用户这一庞大社区时,信息确实可能首先出现在Facebook或者YouTube乃至其它平台之上。但只要信息内容确实能够引发关注,那么其几乎将即时出现在Twitter当中。”
“Twitter真的可算作是庞大的真实世界的直接代表。”
Dataminr成立于2009年,总部位于纽约,为政府部门和金融行业提供信息.
彼得·贝利解释称,该公司的客户主要分为四大类:金融、政府、大型企业以及媒体。Dataminr公司负责为这些客户打开Twitter世界的厦门并提供紧急警报以帮助其抢在新闻发布之前作出行动。
他表示,“我们所做的大部分工作在于告知专业投资人士以及交易者关于可能对市场状况产生影响的各类事件的发生。”他同时补充称,这可能意味着“任何意想不到但却会给行业、市场或者证券产生影响的因素。”
他进一步指出,“我们还在向那些在全球范围内拥有业务的企业提供服务。大家可以设想一家大型能源或者零售企业,其拥有一整套极为复杂的供应链、数千家商店、基础设施以及业务通道,这一切不同类型的对象都需要加以监控。”
“而我们同时亦面向新闻媒体。我们拥有超过1万2千名记者客户使用我们的产品,这是一项令人非常兴奋的成就。我们警报功能的出色之处,在于其能够真正解读一条推文背后的意义。我们会实时发现某位学生发出的‘我的天,有个带枪的人闯进来了’这类推文,因此记者在收到通知后会很快意识到‘发生了校园枪击事件’。”
作为一家建立于2009年的企业,Dataminr公司在纽约市、华盛顿特区、伦敦、西雅图以及蒙大拿设有办事处。与众多数据挖掘公司一样,据报道Dataminr也曾经得到过中央情报局(简称CIA)旗下投资机构In-Q-Tel的资助。
彼得·贝利指出,“在金融业务之外,我们还与包括政府机构在内的各公共部门开展合作。他们正在学习如何快速发现紧急事件并赶赴现场,从而努力管理并缓解由此引发的后果。因此,当人们的生命财产面临威胁时,响应人员越早开展行动,所起到的保护效果也就越好。”
去年10月,一家名为Geofeedia的公司激起了人们对于数据挖掘业务的关注——由于共涉嫌利用社交媒体数据支持政府监控行为,Twitter公司根据内部政策而决定取消其对数据的访问能力。但Bailey强调称,Dataminr公司的作法并非如此。
他解释称,“我们对于同政府以及安全客户间的合作关系抱有热情。我们赞赏Twitter公司所采取的对用户加以保护的方式,我认为社交网络确实应当始终将用户利益放在第一位。”
“这与我们的作法非常相似,而且我们已经与Twitter方面保持了很长时间的合作关系。”
“Twitter方面很了解我们在做些什么,我们不会对用户进行监视,而只是在发布各类警告性主题。因此,如果您需要了解‘自然灾害’方面的内容,则可选择‘自然灾害’选项,我们即会发送与此主题相关的信息——但客户并不能利用我们的产品实施任何监控。”
数据挖掘无疑是个迷人的行业,也是个必然存在大量竞争甚至是爆炸式对抗的行业,因为各从业企业都拥有着自己的独特潜力。不过彼得·贝利认为,他所在的公司完全有能力继续在该领域扮演领导者。
他指出,“我们一直在引入全部推文消息,是的,包括所有公开发布的推文,并以实时方式将其交付至我们的后端。多年以来,我们一直在处理这些数据。我们已经建立起一种非常独特的数据科学体系。”
“随着时间的推移以及资源的积累乃至数据访问推进,其它企业也将能够实现同样的能力。然而截至目前还没有其它厂商做到这一点,所以我们在数据挖掘能力方面仍具备优势。我们面临的最大压力在于如何将这种优势转化为产品并成为行业中的领导者。”
彼得·贝利在接受国外媒体采访时表示,Twitter是一类理想的信息来源。
而随着物联网技术正逐渐以势不可挡的姿态快速渗透整个世界,彼得·贝利表示这一技术很可能将在公司的未来发展中扮演关键性角色。
他解释称,“如果大家将社交媒体的出现及其无比强大的能力视为一种信号,而我们的客户则迫切需要利用这种信号,则可以肯定的是社交媒体正作为其它各类数据的前门存在——这些看似互无关联的数据将能够通过社交媒体联系起来。”
他进一步补充称,“这里我以化工厂爆炸作为例子。一旦发生爆炸,那么天空中即会产生浓重的烟雾。人们目睹这样的状况,将其发送在推文当中,而我们则快速意识到这一事故。”
“如果我们将这第一手消息递交给负责管理并应对此类状况的工作人员处,则对方的第一反应很可能是‘到底有哪些物质散发到了大气当中?’社交媒体无法回答这个问题,但其它大数据集则能够回答——具体包括天气数据、卫星数据、物联网数据乃至其它同样庞大且呈指数级增长的各类数据集。”
从这个角度来看,我们的未来将以数据为基础。
E安全注:本文系E安全独家编译报道,转载请联系授权,并保留出处与链接,不得删减内容。联系方式:① 微信号zhu-geliang ②邮箱eapp@easyaq.com
@E安全,最专业的前沿网络安全媒体和产业服务平台,每日提供优质全球网络安全资讯与深度思考,欢迎关注微信公众号「E安全」(EAQapp),或登E安全门户网站www.easyaq.com , 查看更多精彩内容。