查看原文
其他

1929~2023 年 GSOD 日度气象站点数据:气温、压强、降水量、能见度、风速 ......

RStata RStata 2023-10-24

在之前的推文 使用 R 语言爬取 1929~2023 年 GSOD 气象站点数据 我给大家介绍了如何使用 R 语言爬取 GSOD 气象站点数据的方法。

GSOD 气象站点数据的网站结构非常简单,首页的链接是:https://www.ncei.noaa.gov/data/global-summary-of-the-day/access/ 点进去就可以看到 1929~2023 年历年的链接了:

选择某个年份点击进去就是各个文件的下载链接了:

有些小伙伴表示自己还不会 R 语言,所以我还是把这份数据整理好分享给大家。

完整年份的数据包含超过 1 亿条观测值,因此我把这份数据拆分成了逐年的 csv 文件,需要注意的是 csv 文件不能直接使用 Excel 打开,否则会出现中文乱码(csv 文件是 UTF-8 编码的)以及观测值数量不足(Excel 最多只能显示 100 万多点的观测值)。大家可以使用 R 语言的 readr::read_csv() 读取或者使用 Stata 的 import delimited 读取。其他编程软件也有相应的读取方法。

例如 2022 年的数据内容如下:

将近 400 万条观测值,包含的变量如下:

  • 气象站代码(STATION)
  • 日期(DATE)
  • 纬度(LATITUDE)
  • 经度(LONGITUDE)
  • 气象站高程(ELEVATION):单位 m
  • 气象站名称(NAME)
  • 平均气温(TEMP):单位 ˚C
  • 平均气温属性(TEMP_ATTRIBUTES)
  • 平均露点(DEWP):单位 ˚C
  • 平均露点属性(DEWP_ATTRIBUTES)
  • 平均海平面压强(SLP):单位 hPa
  • 平均海平面压强属性(SLP_ATTRIBUTES)
  • 平均观测站压强(STP):单位 hPa
  • 平均观测站压强属性(STP_ATTRIBUTES)
  • 平均能见度(VISIB):单位 km
  • 平均能见度属性(VISIB_ATTRIBUTES)
  • 平均风速(WDSP):单位 m/s
  • 平均风速属性(WDSP_ATTRIBUTES)
  • 最大持续风速(MXSPD):单位 m/s
  • 最大持续风速属性(GUST):单位 m/s
  • 最高气温(MAX):单位 ˚C
  • 最高气温属性(MAX_ATTRIBUTES)
  • 最低气温(MIN):单位 ˚C
  • 最低气温属性(MIN_ATTRIBUTES)
  • 降水量(PRCP):单位 mm
  • 降水量属性(PRCP_ATTRIBUTES)
  • 积雪深度(SNDP):单位 mm
  • 指示器(FRSHTT)

相关指标的含义可以参考徐老师的这篇推文:GSOD全球逐日气象站点数据介绍与下载,部分指标的单位为了方便我的使用进行了转换,注解如上。

下图展示了数据中包含的气象站点分布:

中国及周边的站点分布:

获取数据

是不是感觉很硬核!欢迎报名 RStata 培训班获取全部课程和以会员价获取数据资料(10元/份)详情可阅读这篇推文:数据处理、图表绘制、效率分析与计量经济学如何学习~

之前更新的课程和数据资料可点击阅读原文进入 RStata 学院查看(从首页的会员卡专区即可查看和购买会员卡)。

更多关于 RStata 培训班的信息可添加微信号 r_stata 咨询:

附件下载(点击文末的阅读原文即可跳转):
https://rstata.duanshu.com/#/brief/course/600b4aece2f241b3a6f1ddf8fefc6186


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存