1929~2023 年 GSOD 日度气象站点数据:气温、压强、降水量、能见度、风速 ......
在之前的推文 使用 R 语言爬取 1929~2023 年 GSOD 气象站点数据 我给大家介绍了如何使用 R 语言爬取 GSOD 气象站点数据的方法。
GSOD 气象站点数据的网站结构非常简单,首页的链接是:https://www.ncei.noaa.gov/data/global-summary-of-the-day/access/ 点进去就可以看到 1929~2023 年历年的链接了:
选择某个年份点击进去就是各个文件的下载链接了:
有些小伙伴表示自己还不会 R 语言,所以我还是把这份数据整理好分享给大家。
完整年份的数据包含超过 1 亿条观测值,因此我把这份数据拆分成了逐年的 csv 文件,需要注意的是 csv 文件不能直接使用 Excel 打开,否则会出现中文乱码(csv 文件是 UTF-8 编码的)以及观测值数量不足(Excel 最多只能显示 100 万多点的观测值)。大家可以使用 R 语言的 readr::read_csv() 读取或者使用 Stata 的 import delimited 读取。其他编程软件也有相应的读取方法。
例如 2022 年的数据内容如下:
将近 400 万条观测值,包含的变量如下:
气象站代码(STATION) 日期(DATE) 纬度(LATITUDE) 经度(LONGITUDE) 气象站高程(ELEVATION):单位 m 气象站名称(NAME) 平均气温(TEMP):单位 ˚C 平均气温属性(TEMP_ATTRIBUTES) 平均露点(DEWP):单位 ˚C 平均露点属性(DEWP_ATTRIBUTES) 平均海平面压强(SLP):单位 hPa 平均海平面压强属性(SLP_ATTRIBUTES) 平均观测站压强(STP):单位 hPa 平均观测站压强属性(STP_ATTRIBUTES) 平均能见度(VISIB):单位 km 平均能见度属性(VISIB_ATTRIBUTES) 平均风速(WDSP):单位 m/s 平均风速属性(WDSP_ATTRIBUTES) 最大持续风速(MXSPD):单位 m/s 最大持续风速属性(GUST):单位 m/s 最高气温(MAX):单位 ˚C 最高气温属性(MAX_ATTRIBUTES) 最低气温(MIN):单位 ˚C 最低气温属性(MIN_ATTRIBUTES) 降水量(PRCP):单位 mm 降水量属性(PRCP_ATTRIBUTES) 积雪深度(SNDP):单位 mm 指示器(FRSHTT)
相关指标的含义可以参考徐老师的这篇推文:GSOD全球逐日气象站点数据介绍与下载,部分指标的单位为了方便我的使用进行了转换,注解如上。
下图展示了数据中包含的气象站点分布:
中国及周边的站点分布:
获取数据
是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~
之前更新的课程和数据资料可点击阅读原文进入 RStata 学院查看(从首页的会员卡专区即可查看和购买会员卡)。
更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询:
附件下载(点击文末的阅读原文即可跳转):
https://rstata.duanshu.com/#/brief/course/600b4aece2f241b3a6f1ddf8fefc6186