查看原文
其他

文献阅读 | 模拟值V.S观测值:气候对美国农业产出的影响

LEEEP 能源环境经济与政策研究 2022-04-25

题目

Simulated vs. empirical weather responsiveness of crop yields: US evidence and implication for the agricultural impacts of climate change

作者

Malcolm N Mistry, Ian Sue Wing, Enrica De Cian

期刊

Environmental Research Letters

时间

2017年

一作单位

(a) Department of Economics, Università Ca’ Foscari, Venice, Italy

(b) Department of Earth and Environment, Boston University, Boston, MA, United States of America

链接

https://iopscience.iop.org/article/10.1088/1748-9326/aa788c



研究背景

农业部门特别是作物生产非常容易受到气象条件变化的影响,很多研究都曾证明气候变化下的极端天气对作物产出具有相当程度的负面影响。这些研究大致可以分为两类:(1)运用大量不同时空分布的历史观测和统计数据,建立农业产量、种植面积、温度、湿度和降水之间的统计关系,以此量化气候变化对农业产出的影响。(2)另一种则是利用作物生长模型。这类模型从作物生长的生物机理出发,对气象、土壤、农药等地理环境要素进行细致的模拟,或结合大气模型输入气象数据,以此获得气候变化对农业作物产出的影响。前者的不足在于数据可得性往往支撑不起跨国多时空的研究,难以在更大更细的尺度上找寻农作物产量变化的影响因素及其规律。但以GGCM(Global gridded crop models)为代表的大型农作物生长模型则可以模拟全球多时空细尺度作物产量。不过GGCM所模拟的多时空结果受其内在大量参数取值的影响,这些参数取值在不同的地理环境,不同国家地区恐存在很大不同,其真实取值待定且需要校准,故模型的结果存在较大的不确定性。

基于此,本文整理过往研究发现,并没有太多研究针对气候影响下的农作物模型结果与现实观测数据和基于观测数据而不断训练的实证计量结果进行对比。在结合这些过往研究的基础上,作者罗列了本文亟待解决的几个研究问题:

(1)基于GGCM模型所做的追算(hindcasting)模拟结果与历史数据的吻合程度有多高?

(2)GGCM能够模拟产出和极端天气之间的负相关吗?模拟优度如何?

(3)GGCM结果与基于现实观测的统计结果之间的差异是否源于气象条件的差异(比如模型中以ESM模拟的气象变量与真实气象变化之间的差异)?还是源于模型对于作物生长机理的刻画与现实机理的偏差?

(4)对于GGCM模型存在的模拟偏差,究竟还有哪些更合理的归因和解释?



研究方法

本文的研究数据数量和类别有很多,主要可以分类为:模型模拟结果数据和观测或统计数据。数据涵盖:农作物产出、气象数据。模型主要由GGCM农业生长模型组(内含六种模型)和地球系统模型ESM(用于导出气象结果)组成,以下简称为GGCM-ESM。观测和统计数据主要来自于美国农业局USDA,从1981年直至2004年的县级农产品产量数据,以及相同历史年份的气象数据,如区间气温,降水等来自于PRISM(Parameter-elevation Regression on Independent Slopes Model),以下简称为USDA-PRISM


图1. 本文所用的模型和观测数据1981-2004年样本数量,未带标记的是原始样本数,括号内是区县数量,方框内是经网格处理后的样本数量。更多关于该文数据的细节处理可见:https://cfn-live-content-bucket-iop-org.s3.amazonaws.com/journals/1748-9326/12/7/075007/2/ERL_12_7_075007_suppdata.pdf?AWSAccessKeyId=AKIAYDKQL6LTV7YY2HIK&Expires=1616401926&Signature=GfdWrntJzwyVsr%2Ba%2BjJ10Ka3yd4%3D


随后,本文建立了一个关乎农业产量与气候变量的半参数非线性双log计量回归方程,如下:

y为年产量,μi为个体固定效应,f(t)为时间变化函数,用以捕捉无法被观察到的随时间变化的量,实为时间固定效应函数。ξT为温度变量,ξP为降水变量。对于GGCM-ESM和USDA-PRIMS,本文各做了(1)的回归计算。不过这里却有一个明显的问题:分别以此两类数据库做回归之后得出的预测产量结果并不具有可比性,因为两个模型中所输入的自变量,即气候变量数据本身就具有不同的分布。基于原文中提供的(1)计量方程式,(2)式表达了方程式中气候变量对产量的总影响:

紧接着,本文将这个总影响划分为两个方面:一方面是不同的气候数据造成的(ΔψClimate),另一方面是对气候变量的不同反应造成的(ΔψResponse)。从式子(3)→(4)可以清楚地看到这一分解过程:

下一步,本文同样准备以实证计量的方法解释“模型的哪些方面影响着其模拟结果和现实的差异?”,首先,GGCM模型系统中有六大类机理参数各不相同的模型,作者从中领出几项不同的模型机理作为虚拟自变量Z,如化肥使用是否内生,播种时间是否内生,是否使用真实数据进行过模型校准等。并用不同的GGCM模型结果以之前式子(1)跑出的计量方程式中的气温和降水变量的回归系数β,并将这些回归系数都与USDA-PRIMS下的β作差,将这个差值Δξ作为因变量,如下:

方程式(5)中所估计出的衡量了GGCM模型中哪些机理对模型结果和观测数据之间的差异贡献较大。再后,本文拟计算未来气候对未来产量的影响。为此,本文运用了一个偏差纠正后的HadGEM2-ES气候模型,不仅回跑了过去时段的气候数据,也拟合出了RCP8.5情景下未来100年的气候结果。但为了避免不确定性,本文采取了这样的方法:将过去年份拟合出的气温和降水做一个时间上的平均,再用未来年的情景数据减去这个平均值,将这一差值作为自变量代入方程式(1)的右边进行估计,为Ψi,m



研究发现

GGCM模型对1981-2004历史数据的拟合能力

本文用前文提到的计量方程式(1)并结合GGCM-ESM模型系统估计出1981-2004年每一年的三种作物产量,并把这一估计出的历年产量与观测数据(1981-2004年三种作物产量的均值) 作百分比差值,这样就得到了三种作物、六个模型、24年每一年的跨县产量差值分布函数,并画出其概率密度函数,请见图 2。由此可以总结出几个结果:

(1)约50%数量的样本县,其模型估计值和实际值差异在±30%之间。而很大数量的样本所展示出来的差异更大。

(2)对于大豆,其差异值比玉米和小麦更大。

(3)就细线所展示的每一年的分布曲线来看,正差别值和负差别值都有,意味着每一年,既有很多数量的样本县其模型值小于实际值,也有很多数量的样本县模型值大于实际值,无法基于此概括模型和现实值之间的系统性差异。

(4)总的来看,并没有一个GGCM的模型显示出其与现实三种作物产量高度吻合的优势。矮子里面拔高个儿,GAEZ-IMAGE稍好一些(第二行,绿色曲线)。
图2. GGCM-观测值差异的概率分布函数(横坐标表示模型结果和现实结果的百分比差异,纵坐标表示样本县的数量,图形上方横亘的四分线箱线图表示位于25%和75%分位的样本的对应百分比差值。图中每一条细线表示某一年的样本分布,粗线表示所有年份的样本分布。不同颜色代表GGCM内不同模型)

产量与极端天气的关系:模拟V.S现实

一种更细致的考察方法是,计算模型结果中产量和极端天气主要是高温与干旱的相关性指标,并将此相关性与现实数据计算出的相关性进行对比。本文以图3来说明结果:

(1)大部分模型(除了GAEZ-IMAGE)拟合出的相关关系都与实际数据相仿。县级农作物产量和高温及干旱的相关系数普遍都在-50%至-75%之间

(2)GGCM模型中玉米和大豆拟合得相对更和统计观测数据接近,其中PEGASUS,LPJmL等模型拟合结果相对地好些。

(3)在对小麦的模拟结果上,各个模型的分歧很大,且都与统计结果相差不小。作者认为这和GGCM中是内生地选择种植什么品种的小麦,而现实中美国大面积单一种植春小麦-硬粒小麦有关。

图3.  极端高温与干旱和不同农作物产量的相关关系图(横坐标表示产量与极端高温的相关系数,纵坐标表示产量与极端干旱的相关系数,虚线表示全样本的线性拟合曲线,从上至下的前六行为GGCM不同模型的结果,第七行是USDA统计数据展示出的结果;横亘在图形上方的是图2中提过的箱线图,纵贯在图形右边的也是箱线图,他们分别表示了25%和75%分位的样本,其两种相关性分别是多少;此外,类等高线或许反映的是样本点分布,颜色越重,样本分布越多。关于酷似等高线的分布曲线的解释源自编者的个人猜测,因为本文并没有清晰说明,欢迎读者朋友们不吝赐教)


气候变量对产量的影响

公式(1)基本阐明了本文对于气候变化和产量之间关系的基本假设。本节估算了等式右边两种气候变量值分别乘以回归系数,即log(农作物产量)的受气候变量影响的值。回归结果显示模型的拟合优度在75%左右,而气候变量的解释力度在0%到60%之间(可见文章的补充附录)。本节选取的气温变量是22.5℃-25℃之间的温度值,以及日降水量10-15mm的降水值(正常气候)。具体结果可以看图 4。从结果看来,GGCM模型对 非极端天气对农作物产量的影响 拟合得较好,与实际数据非常接近,尤其是降水的影响。当然,不同模型之间的差异也较大,比如pDSSAT模型结果就不尽如人意。此外,USDA-PRISM数据显示,大于30℃的高温对玉米和大豆的年产量有偏离正常值-1.5%的影响,但对小麦产量的负面影响却能达到-9%。而GGCM模型模拟显示对玉米的影响在-0.2%至-3%之间,对大豆的影响在-0.5%至3.6%之间,对小麦的影响在-0.1%至6.5%之间。总而言之,模拟值和实际值的差异主要体现在极端天气对产量的影响上。


图4. 产量受气温和降水的影响值(横轴分别是日均温和日平均降水量,纵轴是产量的log值。实线是不同横坐标下的产量值连成的趋势线,阴影部分是用稳健标准差计算出的95%置信区间。颜色代表模型,而每一个分面的第二行,颜色更浅的灰线是实际观测值,颜色更深的灰线是GGCM多元模型的总值)


气候变量对产量的影响:分解

式子(4)提出了将气候变量所造成的总影响差异(图4刻画的由GGCM计算出的总影响减去USDA计算出的总影响)分解成:一方面是不同的气候数据造成的(ΔψClimate),另一方面是对气候变量的不同反应造成的(ΔψResponse)。本节的结果直接体现在图 5中。

图5. 气候变量的影响分解(横坐标是按照 ΨGGCMUSDA的值从低到高排列的样本点,纵坐标是 ΨGGCMUSDA的值,黑线是全样本的差异值分布曲线,颜色较深的柱子代表不同数据的影响,颜色较浅的柱子代表不同响应的影响。这里,玉米有730个样本点,大豆有670个,小麦有88个)


图中结果展示得很清晰,模拟影响值和实际影响值的差异主要来源于对气候变量的内生响应,因不同的数据所造成的差异贡献比较小。虽然各个模型在实际差异值和贡献值的计算结果上差别很大,但贡献结构和总体结论是一致的。

模型中不同机制对回归系数的影响

方程式(5)中所估计出的衡量了GGCM模型中哪些机理对模型结果和观测数据之间的差异贡献较大。本节展示了(5)的回归结果,为节省篇幅,作者在正文中展示了玉米的结果,其他结果在附录中(Table S7),有兴趣的读者可以自行查看。图 6引用自文章中的Table1,展示了模型中不同机制对回归系数差异值的影响。从结果可以清晰地看到,是否包含热浪压力和内生播种和化肥选择对结果影响较大,其中包含了热浪压力和内生播种时间的模型结果与实际结果更相似,而内生的化肥机制却对两者差异有着负面作用。

图 6. 模型中的不同机制对回归系数差异值的计量影响



研究结论

本文的工作量不小,通过层层实证计量和检验观察模型模拟值和现实值之间的差异。从中可以得出几个基本结论:

(1)当前的GGCM模型很难复制1981-2004年玉米,大豆和小麦的年产量趋势。但却基本可以拟合出气候变量对三种农作物产量的影响趋势。当然,GGCM系统中不同的模型结果是不太一样的

(2)模型中的产量对非极端的气温变量更敏感,但对极端气温的敏感程度有时高于实际值,有时低于实际值,这取决于不同模型是否存在对热浪压力(heat stress)和化肥内生使用(cultivar adaptation)的机制刻画,热浪压力机制使得模型结果对极端高温反应不那么敏感,化肥内生使用使得模型对极端高温更敏感。

(3)基于此,本文还根据公式(1)给出的回归方程式,结合RCP8.5下的气温和降水预测,计算出了未来100年美国雨养土地上的农作物产量与过去历史平均值的差值,即公式(6)。具体结果可见

图 7. RCP8.5下的美国雨养土地玉米、大豆和小麦产量预测值与历史均值的差异


编辑:郭超艺

排版:郭超艺 江琴

相关阅读

1 文献阅读 | 中国碳排放交易体系下的空气质量和健康协同效应

2 文献阅读 | 中国建筑部门能效提升和碳减排潜力的情景分析

3 IMED研究 | 电动汽车政策对京津冀地区环境与健康的影响

4 文献阅读 | COVID-19对全球当前和未来造成的气候影响

5 文献阅读 | 来自废弃农田的全球生物能源潜力的土-能-水关系

6 招聘 | 北京大学-IIASA联合培养博士后申请公告


点击“阅读原文”浏览小组主页


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存