【发现】地震了先发朋友圈?你可能为探测地震时空应急信息作了贡献!
昨日(11月26日)07时57分,台湾海峡(北纬23.28度,东经118.60度)发生6.2级地震,震源深度20千米。随后8点15分发生了第二次地震。
据中国地震台消息,该次地震造成福建全省有感,其中厦门、漳州等地震感强烈。广东和浙江等地亦有震感报告。
从微博评论来看,不少网友称“朋友圈震感最强”,不少人在发生地震后第一时间发朋友圈,或是通过朋友圈确认地震消息。
地震后先发朋友圈是什么心理?先别急着吐槽,近日有学者研究指出,社交媒体可能正迅速成为传播地理信息的新途径。
研究者以“4.25 尼泊尔地震”为例收集相关数据并分析,将 Twitter 看作一种能识别地震影响区域的传感器系统,探究地震发生后,从 Twitter 中快速提取地震事件时空应急信息的方法。让我们来看一下这项研究吧!
来源:地理空间信息
作者:王艳东、阮诗斯(测绘遥感信息工程国家重点实验室、地球空间信息技术协同创新中心)
标题:利用社交媒体探测地震时空应急信息
*GIS圈在原文基础上有删减
引言
随着 Web2.0 以及相应技术的推进,社交媒体已成为人们生活中必不可少的一部分,改变了传统的信息传播模式,使得信息能在短时间内迅速扩散。
带有地理坐标的社交媒体数据可被认为是自发性地理信息(VGI),具有时效性强、数据量大等特点,已成为越来越多的有关地震灾害管理研究的数据来源。
以开放式移动信息发布平台 Twitter 为例,带有GPS的 Twitter 数据包含了丰富的位置和语义信息,是近年来探测地震灾害信息领域的研究热点。
本文以从Twitter上获取的数据为例,旨在探讨地震事件发生后,如何快速从社交媒体数据中探测急信息。
首先利用描述性统计法分析了数据的时序特征;然后从空间分析的角度对数据进行不同维度的可视化,探究数据的时空分布模式,从中分析地震影响范围;最后与美国地质调查局的官方数据进行对比,以评估Twitter 探测灾害事件时空应急信息的能力。
1 Twitter数据的采集与处理
从Twitter中可方便获取单一来源信息,且具有传感价值。若将每条带有发文时间和经纬度坐标位置信息的推文视为一个带有位置信息的传感值,事件检测就可简化为基于传感器读数的位置检测。
由于智能手机将越来越密集化,且聚集在特定事件中最感兴趣的地方,因此 Twitter 的传感价值将越来越高。地震发生后,将带有 GPS 的推文视为传感器读数,从其空间属性出发,探索其中包含的时空应急信息,能为应急决策提供依据。
为了提高平台的影响力和吸纳更多的用户,Twitter对平台以及用户以外的第三方开放了数据访问接口(https://dev.twitter.com/overview/api/tweets)。
使用 API 采集的数据分为两种:一种是以一组关键字为话题,搜集与突发事件相关的推文;另一种是以事发地为中心,指定搜索半径,搜集事发地周围的推文。
本文以“4 . 25尼泊尔地震”为例,通过Twitter开放平台 API 实时采集了距离地震中心(28.2E,84.7N)1609.3 km范围内,北京时间2015年4月25日14时到2015年4月29日10时的包含“earthquake”关键字的18131条JSON格式的 Twitter 数据,其有4903条带有GPS位置信息。
2 数据时空分析与信息探测
2.1 数据时序特征
本节对数据量随时间变化的发展过程进行描述性统计分析,了解采集数据的情况。
图 1 展示了搜集与地震相关 Twitter 数据的统计结果,可以发现,图中推文峰值出现的时间与表1中统计的该次地震发生后一系列余震发生的时间有良好的对应。
表1中4月25日14时、20时以及26日7时、11时和15时尼泊尔发生地震时,图1中对应的时间点 A、B、C、D、E 正好是推文数量的峰值。
北京时间4月27日0 时发生的地震,在图1中对应F点,微博趋势线延迟1h达到最高点,F点延迟的原因在于该次地震发生在尼泊尔当地时间4月26日23时,此时Twitter 总体参与人数不多或人们反应时间较慢。整体结果可以说明,在地震发生后,推文数据流的特点能反映地震所处的不同阶段。
2.2 数据空间分布特征
将这些点状数据进行可视化能了解相关推文在空间上的热点分布区域和规律,从而有利于对灾害事件的时空信息进行探测。
图2为采集到的4903条带有GPS信息的地震推文在地图上的直观显示,可以发现,除了尼泊尔上方区域(中国地区,Twitter未开放)外,推文以震中为中心,向外呈发散状;
且推文在震中(84°43' E,28°14' N)、尼泊尔首都加德满都(85°19'E,27°42'N)以及距震中约 730 km 的印度首都新德里(77°13' E,28°37' N)处较为密集,热点位置主要分布在震中、加德满都、新德里以及印度其他的一些大型城市。
2.3 数据时空分布模式探索
地震发生后短时间内的推文相当于是反应地震信息的一条传感值,其中包含着有用的时空信息,因此本文对地震发生后600s内的237条带有 GPS 的地震推文进行时空分析,探索其中的应急信息。
图3中每个点代表一条推文,颜色从蓝到红代表距离震中由近到远。X 轴为经度,Y 轴为纬度,Z轴为反应时间,即指推文发布时间与震中发震时间之差,是体现推文对该事件反应的一个指标。
每条推文分别映射到相应的X-Y、Y-Z、X-Z三个投影面上,颜色保持不变。在推文映射的X-Y投影面上可以观察到,映射点由震中向外呈扩散状;
分析X-Z 和 Y-Z 两个投影面可以发现,推文的时空分布存在明显的聚集,在经度为 76°~78°之间和纬度为 28°~29°之间的位置,以及经度为 88°~90°之间和纬度为 22°~23°之间的位置一直有连续不断的推文产生。
产生该现象的原因是印度首都新德里和印度三大城市之一的加尔各答分布在此,二者均为人口密度聚集区,也是 Twitter 使用密度较高的区域。
相比之下,同样是人口密集分布且推文分布多的尼泊尔首都加德满就没有出现类似推文连续分布的状况,这是由于加德满都受该次地震影响十分严重,短时间内该区域的人们更多地关注实际地震情况,而不是在社交媒体上发布数据。同时,从图中也能发现反应较快的推文都分布在震中附近。
为了更加直观地了解这些数据对该次地震反应出的空间格局,图 4 展示了推文对该地震事件的距离—时间反应模式,横轴表示推文发文地点与震中的距离,纵轴表示推文的反应时间,每个点代表相应的推文,可以发现,距震中约 950 km 的红线标志阈值区域,左边推文聚集,右边推文分散。
阈值区域左右推文数据流的时空模式显然不同。小于该距离时(红线左侧),推文在空间和时间有很高的聚集性,而大于该距离时(红线右侧),只有零星的推文参考数据;
且在距离达到阈值前,每个距离发布最快的推文的反应时间几乎随距离的增大而呈线性增长,这种变化趋势与地震影响强度随距离增大而变弱一致,距离超过阈值后,这一趋势结束,甚至发生相反情况。
本文估计距震中950 km 的阈值可能与受该次地震影响的区域范围有关,该范围将与美国地质调查局(USGS)数据进行对比。
3 Twitter探测灾害事件应急信息能力评估
本文利用从 USGS 网站获取的官方数据对 Twitter 数据的可靠性以及探测到的地震影响区域阈值进行评估。
USGS 不仅提供了专业的“地震速报图”,即重大地震灾害发生后提供震动烈度可视化分布图,而且提供了以众包方式收集的官方调查数据,用以修正地震烈度图,相当于来自世界各地的传感器数据。
图 5 展示了 Twitter 数据和官方数据对比情况。图 5a展示了Twitter数据核密度分布状况以及探测到的影响范围阈值(蓝色圈),图5b展示了USGS网站上的官方数据。
图 5b 中红色矩形区域内为官方数据提供的该次地震烈度可视化分布图,显示了 4 级以上的烈度分布范围(加德满都周围约 400 km),正对应图 5a 矩形区域中Twitter数据分布最密集的地方。
同时,图 5 b中官方调查数据的热点分布位置也正是Twitter 热点分布位置(红色圆圈区域),二者均集中分布在人口密度较大的城市,如新德里、勒克瑙、加尔各答等;且图 5a 中的阈值范围,与图5b中的官方调查数据探测到的最低震级边缘较为吻合。
综上所述,在地震发生后,通过分析Twitter数据时空分布模式能够探测到地震时空应急信息,以提高对周遭环境的敏感性以及认识与应对灾害事件的能力。
4 结 语
社交媒体正迅速成为传播地理信息的新途径,灾害发生后,社交媒体能提供及时的信息来补充数据来源,以提高人们对环境的敏感性以及认识与应对灾害事件的能力。
本文主要通过对从Twitter上采集的有关“4.25 尼泊尔地震”的带有GPS信息的数据进行可视化和时空分析,探索了其中包含的时空应急信息;并利用官方数据评估了获取信息的质量。
结果表明,能够从Twitter信息中提取时空应急信息,从而快速识别地震影响区域,提高人们的感知能力。今后需进一步关注社交媒体数据的质量,对数据的来源、质量和价值进行人工评估。