东边日出西边雨:极端天气网络中的长程关联与超指数分布
2月份的Nature主刊上的一篇论文,着眼于气象科学与复杂网络结合擦出的火花。这篇小文将带你以看侦探小说的视角,批判性地解读这篇论文,让你明白这篇文章在材料的呈现上有哪些值得借鉴之处。在文末,作者将结合该文,谈谈接下来可能的研究方向。
论文题目:
Complex networks reveal global pattern of extreme-rainfall teleconnections
论文地址:
https://www.nature.com/articles/s41586-018-0872-x
复杂网络的应用,这些年间越来越广泛,但总有一些共通的规律,最典型的就是不同尺度下网络呈现相同性质的幂律法则。不过,凡事总有例外,这篇Nature论文的研究成果能够打破幂律法则的现象,必然是颠覆式的发现。
论文摘要
可上下滑动查看论文摘要
优质的摘要,第一句应该是背景介绍,目的是让读者知道这篇文章讲述的是哪个领域的发现。既然是背景,就要和日常生活有所联系,让读者能联想到最近的新闻报道。
本文的第一句指出气候现象,尤其是极端情况,例如高温,暴雨等在长距离上存在关联。近期美国的寒潮,跨越数个州,这还只算是区域性的气候关联,而欧洲、亚洲与美洲同时出现的极端寒冷,就属于文中提到的“长程关联(teleconnection)”了。
说完了背景,要论述该现象的意义。假设弄清楚了气候中的长程关联,能解决什么现实问题?能带来哪些新的问题了?即如何扩展人类的认知边界。这是论述研究意义时要回答的模板问题。
摘要第二句指出,对于极端天气的预测,如果能结合长程关联,那会更加精确。而极端气候现象的频繁发生,很大的原因是人类活动的影响,如果对极端气候现象的长程关联没有精准的描述,也就无从谈起人类的影响会不会带来改变。电影”后天“中描述的极端寒冷,在19年初出现在了新闻报道中,这说明极端气候离我们的生活并不遥远。
电影《后天》剧照
核心解读
接下来概要总结文章的核心发现。一般是先介绍一个通用的结论,再详细的说一个经过详细研究的案例,最后再次用更具体的例子,指出研究的意义。但在此之前,需要先将研究的问题细化。
研究对象选择
本文从极端气候中选择了暴雨。我猜想,相比于酷暑或者极端严寒,除了数据收集更容易,更准确客观,暴雨的评判标准在不同的时间更具有一致性,不会受到全球变暖与城市热岛效应的影响。因此不需要根据时间进行校正。
暴雨是一个仁者见仁的描述,科学上要研究,需要划一条线,来定义清楚何为暴雨。而在不同的区域,不同的年份,人们对暴雨的认知也有所不同。该研究中的设定是在一个地区所有下雨的日子中,如果这一天的降雨量超过了95%,那么这一天就算做是暴雨。
你也许会问这里95这个数字是怎么来的?我猜这篇论文的审稿人也问了这个问题,而为了应对审稿人的”刁难“,这篇论文的补充材料中将95%这个数字换成了90%-99.9%之间的一组数字,论证了不管你怎么定义暴雨这个事件,文章中的发现都差不多,这说明了该现象的鲁棒性。
研究数据与成果鲁棒性
接下来要看研究用到的数据,降雨量的评估如果是基于地面气象站的数据,这些手工记录的数据,不同的国家,不同的时段,需要规整,还会带着不可避免的缺失和误差,例如有些不靠谱地方出来的数据,也难以精准的记录降雨量。而该研究用的是高分辨率气象卫星TRMM( Tropical Rainfall Measurement Mission)提供的全球(北纬50度到南维50度之间)1998-2016年间的降雨量数据。
下图展示了在不同地方6-8月间,从57.6万次降雨数据中统计出的超过95%的降雨天对应的降雨量(图A),以及在这段时间里出现暴雨的天数(图B)。
可以看出处在雨季的南亚次大陆及东南亚,暴雨的天数高达40-60天,而在非洲中部的草原,这段时间也处在雨季。
除了使用来自TRMM的数据,该研究还使用了Global Precipitation Climatology Project的低精度卫星数据(每一个经度和一个纬度算一个格子,而不是0.25个经度和纬度算一个格子),重现了其发现的规律,从而证明了该发现的鲁棒性。
验证普适性
而为了说明该发现具有普适性,需要看看在不同的季节,不同的区域之间,研究发现的规律是否都成立,而本文也做了这方面的研究。
同时在方法学上,由于存在这么多的暴雨事件,而要确定两次暴雨之间是否有同步,需要逐个两两比较,这其中就可能将一些由于随机巧合错当成相关性同步。存在多重检验时,需要进行统计学上的校正,而不止是降低统计显著的P值,这是一个通用的注意点,所有涉及到P值的研究,都要看是否需要对多重检验进行校正。而在本文中,也针对该问题提出了相应的校正方法。
超幂律分布
接下来展示这篇文章中最重要的一张图,该图说明了极端气候的长程关联不符合幂律分布。
图中将暴雨在不同地区的时间序列的数据两两比较后,按P值小于0.001为显著,统计在不同的距离之间,暴雨发生有关系的的概率,图中的纵轴是概率分布函数。在100公里到2500公里之间,在经过了log处理的坐标轴上,概率分布于距离几乎完美的对应到了一条斜率接近-1的直线上(图中左边的虚线),按照这个规律,距离越远,暴雨事件同步发生的概率越低。
但超过2500公里之后,幂律法则不起作用了,极端气候的相关性的概率随距离增加变高了,直到一万公里,暴雨的同步效应才再次随着时间降低。
下图是南北半球,冬季和夏季,热带与亚热带分开统计的同步概率与距离的趋势,可以看到超幂律分布都出现了.
2500公里是什么概念,北京到深圳的直线距离是1950公里,也就意味着深圳的暴雨出现的先后和沈阳的同步程度不如深圳和漠河的暴雨,这个发现是不是像蝴蝶效应一样,有足够的有颠覆性?
气象领域的”Dragon-Kings“
在过去的研究中,这类现象被称为”Dragon-Kings“,是黑天鹅现象的一种,用来说明为何预测会失败。
该词来自于Didier Sornette在09年的论文,文中指出了小处的规律不适用于大处,例如在城市,金融市场,地震等,而背后的机制和沙堆临界原理及混沌现象中的相变有关,而该研究展示了在气象领域的”Dragon-Kings“。
论文地址:
https://arxiv.org/abs/0907.4290
按照Dragon-Kings的理论,可以使用Kernel density预测长程关联出现的概率,而这正是上图右边(超过2500公里后)的实心线,而这与真实数据拟合的也很不错。虽然无法直接用混沌理论解释为何在气候中会出现超幂律分布(需要结合具体场景,例如全球大气的气流循环),但能够和之前的研究有所关联,能够支持并扩展前人的概率,也是好的论文写作必须的。
案例分析:印度中部的暴雨分布
接下来要对一个案例进行系统性的分析,文中选取了印度中部(南亚及中亚),下图展示了该点的暴雨和全球其他位置的暴雨同步关系的强弱,线越明显,同步的概率越大(图A),在图B,阴影区的深浅标识了这些区域与印度中部的同步概率超过了几个标准差。可以看出其中有很多条超过了2500公里的关联,而且这些关联很多是显著的(超过3-4个标准差,随机出现的概率只有不到0.1%)
那长程关联之间有没有因果关系了,如果总是一个地方先出现大暴雨,接着是一下个地方,那可以说是两者之间有因果性。
下图展示的是印度中部和欧洲降雨的相关性,黑线代表是欧洲的暴雨是否会引领印度出现暴雨,在正的4-5天上,曲线有一个峰,而在负的8-9天上,也有一个峰,这说明相关性在这个案例上是双向的,不存在单边的因果关系。毕竟地球是一个球。
最后再看看该如何解释这一现象,下图bc展示了第0天和第3天欧洲和南亚及中亚(SCA)的降雨情况,可以看到先是欧洲暴雨,3天后到了SCA地区,而d和e图展示了风向,将两张图结合起来,就可以看出是由于风吹起来了,才导致了先后的降雨。
思考延伸
总结来看,该文创新性的将复杂网络引入了气象领域,发现了超远程的关联在极端气候中持续存在。我读完后思考,除了暴雨,酷暑,严寒,以及旱灾等,都可以用该文的范式去研究,我猜测长程关联在气候中不止限于暴雨这一个案例。而如何在气象预报中,应用长程关联,也是值得关注的。
如果说蝴蝶效应让人们开始关注到了远距离的天气现象之间存在相关性,那么这项研究则量化的指出在预测模型中,对多远的现象,根据两者之间同步的概率,应该给予多少相应的关注。
而如果在不同的年份,例如在90年代和进十年间,极端气候间同步的规律有显著的不同,那最可能的解释是人类的活动造成的干扰,而在太阳(黑子)的”11年“周期,厄尔尼诺现象对极端气候的影响,都是值得探索的方向。
注:
厄尔尼诺现象主要指太平洋东部和中部的热带海洋的海水温度异常地持续变暖,使整个世界气候模式发生变化,造成一些地区干旱而另一些地区又降雨量过多的现象。
集智俱乐部提醒您:
网络千万种,幂律第一种。
小处有规律,大处未必同。
作者:郭瑞东
审校:任晓龙、李周园
编辑:王怡蔺
推荐阅读
集智俱乐部QQ群|877391004
商务合作及投稿转载|swarma@swarma.org
◆ ◆ ◆
搜索公众号:集智俱乐部
加入“没有围墙的研究所”
让苹果砸得更猛烈些吧!