GSIS编委周启鸣教授:使用遥感数据和机器学习精确估算作物产量
引言
及时、可靠地估计区域作物产量是粮食安全评估的一个重要组成部分,特别是在发展中国家及地区。传统的作物预测方法需要大量的时间和人力来收集和处理田间数据,卫星遥感数据被认为是在像素级预测作物产量的一种经济有效和准确的方法。
GSIS编委,香港浸会大学周启鸣教授团队估算了巴基斯坦旁遮普省的小麦和水稻产量,比较了5种不同模型的预测精度,并对该地区农作物产量及其空间分布进行了早期预测。文章题名为“Integration of maximum crop response with machine learning regression model to timely estimate crop yield”,发表在国际SCI期刊Geo-Spatial Information Science(地球空间信息科学学报,GSIS)上。
本文方法能够在收获前7-8周估算小麦产量,在收获前6-7周估算水稻产量,进一步采用精细空间分辨率遥感数据集并结合本研究得到的EVImax发生的空间信息进行研究,将提高产量估算结果的精确度。有助于制定有效的农业政策,促进社会、环境和经济的可持续发展。
引用本文
Qiming Zhou & Ali Ismaeel (2021)
Integration of maximum crop response with machine learning regression model to timely estimate crop yield, Geo-spatial Information Science, DOI: 10.1080/10095020.2021.195772
文章内容
1. 本研究建立了一种利用遥感数据和机器学习回归模型估算大作物产区小麦和水稻产量的方法,通过比较不同回归模型的性能,确定了最适合每种作物产量预测的回归模型。
2. 本研究将作物生长季节的最大增强植被指数与机器学习回归模型相结合,估算巴基斯坦旁遮普省的小麦和水稻产量,并采用五倍交叉验证方法比较了5种模型的预测精度。
3. 本研究分析了研究区域内作物产量的空间变异,并对所提出的产量预测模型进行评价,有助于管理者制定有效的农业政策,以提高低效益地区的作物产量,造福社会。
前沿观点
1
发展中国家的作物产量监测主要基于两类抽样调查。早期的作物产量预测是基于主观调查,比如听取种植者的意见,或根据田间工作人员的视觉判断估算。后期的作物产量估计是通过客观调查来完成的,例如将样本地里的丰收/未成熟作物收割后进行测量(Craig and Atkinson 2013)。
Crop yield monitoring in developing countries is mainly based on two types of sampling surveys. The early crop yield prediction is based on subjective surveys, like taking opinions from growers and the field officers’ visual judgment. The later crop yield estimation is done using objective surveys such as a whole plot harvest or crop cut measurement from sample fields (Craig and Atkinson 2013).
2
由于缺乏空间数据来捕捉地表的异质性,使得作物生长模型在局部尺度上的应用具有误导性。
The lack of spatial data to capture the heterogeneity of land surface also makes the CGM application misleading at the local scale.
3
以前的产量估计研究大多使用线性回归模型,以表明与单个或多个变量之间的线性或指数关系(Hou et al. 2019;Gaso, Berger, and Ciganda 2019)。斜率和截距是描述因变量和自变量之间线性关系的两个参数。
The linear regression models have been used in many previous yield estimation studies to indicate a linear or exponential relationship to single or multiple variables (Hou et al. 2019; Gaso, Berger, and Ciganda 2019). The slope and intercept are the two parameters that describe the linear relationship between the dependent and independent variables.
4
在处理预测变量的非线性方面,其他机器学习方法比简单的线性回归模型更有效(Chlingaryan, Sukkarieh, and Whelan 2018)。
The other machine learning methods are more efficient in handling predictor variables’ nonlinearity than simple LR models (Chlingaryan, Sukkarieh, and Whelan 2018).
5
在机器学习方法中,支持向量机(SVM)是一种基于训练的判别模型,在使用超平面处理复杂多维数据时提供了各种不同的边缘(Schölkopf和Smola 2001)。
In ML methods, a Support Vector Machine (SVM) is a training-based discriminative model that offers various distinctive edges in handling complex multidimensional data using hyperplane (Schölkopf and Smola 2001).
6
SVM除了可以作为一种分类方法,还可以作为一种回归模型,但有一些细微的差异。支持向量回归模型保留了区分算法的所有主要元素,即最大边界。不同的核函数,如线性和径向基函数(RBF)使得支持向量机能够在更高的维度上运行。
Apart from being used as a classification method, SVM can also be used as a regression model with a few minor differences. The support vector regression model maintains all the main elements that distinguish the algorithm, i.e. maximal margin. Different kernel functions such as linear and Radial Basis Function (RBF) enable the SVR to operate in higher dimensions.
7
Boosting算法是一种迭代方法,它根据最后的预测改变观测值的权重。
Boosting is an iterative method that alters the weight of an observation based on the last prediction.
8
大多数研究指出,作物高峰季节前后的VI和生物物理参数与各种作物的最终产量呈正相关(Dempewolf et al. 2014; Bolton and Friedl 2013; Sakamoto, Gitelson, and Arkebauer 2013; Ren et al. 2008)。
Most studies pointed out that the VIs and biophysical parameters around the crop’s peak season are positively correlated with final yields for various crops (Dempewolf et al. 2014; Bolton and Friedl 2013; Sakamoto, Gitelson, and Arkebauer 2013; Ren et al. 2008).
9
本研究采用作物掩膜来选择特定区域的VI值,利用季节最大EVI补偿了作物播种时间的变化,并简化了用于回归的适当作物物候信息的应用。
In this study, a crop mask was used to select VI values of a specific area. The use of the season’s maximum EVI compensated for the variation in the crop’s sowing timing and simplified the use of suitable crop phenology information for regression purposes.
10
EVImax分析表示,本文方法能够在收获前7-8周估算小麦产量,在收获前6-7周估算水稻产量,进一步采用精细空间分辨率遥感数据集并结合本研究得到的EVImax发生的空间信息进行研究,将提高产量估算结果的精确度。
The analysis of EVImax revealed that the proposed method is capable of estimating wheat yield 7–8 weeks and rice yield 6–7 weeks before the harvest. Further studies using fine spatial resolution remote sensing datasets and incorporating the spatial information of EVImax occurrence derived from this study will enhance yield results.
作者简介
周启鸣 Qiming Zhou
香港浸会大学地理学教授、社会科学(研究)学院副院长、地理计算研究中心创始主任。研究兴趣涉及广泛的地理空间信息科学领域,特别是地理计算和遥感应用,积极从事数字地形分析、气候变化及其对区域和全球生态系统的影响、土地利用和土地覆盖变化检测、GIS和遥感在城市、环境和自然资源管理中的应用等研究。
Qiming Zhou is a Professor of Geography, Associate Dean of Faculty of Social Sciences (Research) and Founding Director of Centre for Geo-Computation Studies at Hong Kong Baptist University. His research interests cover a broad area of geo-spatial information science, particularly in geo-computation and remote sensing applications. He has been actively engaged in research such as digital terrain analysis, climate change and its impacts on regional and global ecosystems, landuse and land cover change detection, and GIS and remote sensing applications to urban, environment and natural resource management.
Ali Ismaeel
博士。主要研究方向为土地利用/土地覆盖制图、植被趋势分析、水文建模和农田生态系统建模。
Ali Ismaeel has a PhD in geography and master’s degree in remote sensing and GIS with bachelor’s degree of agricultural engineering. His research broadly covers ecological modeling using remote sensing and GIS approaches with prime focus on landuse/landcover mapping, vegetation trend analysis, hydrological modeling and cropland ecosystem modeling.
文章图表
图1. 2003年以来小麦和水稻种植面积的区级变化(%)
图2. 本研究所采用的算法流程图
图3. 利用GPR模型对水稻和小麦报告产量和模拟产量的区级散点图比较
图4. 利用GPR模型模拟研究期内小麦平均产量的像元级和区域级空间变异
图5. 利用GPR模型模拟2003-2018年水稻平均产量的空间变化
图6. 研究期间两种作物EVImax发生日的中位数及其空间变异
表1. 利用EVImax值对5种MLR模型预测小麦和水稻产量的评价统计
引用本文
Qiming Zhou & Ali Ismaeel (2021)
Integration of maximum crop response with machine learning regression model to timely estimate crop yield, Geo-spatial Information Science, DOI: 10.1080/10095020.2021.195772
数据可用性说明
本研究使用的输入数据可以从网上免费获取。采用的遥感数据可以通过NASA的各种门户网站下载,例如https://earthdata.nasa.gov/;地区一级报告的作物产量数据可在旁遮普的作物报告服务(CRS)网站(http://crs.agripunjab.gov.pk/reports)获得;所有的导出数据都包含在原稿中。利用MATLAB的regression Learner应用程序对机器学习回归模型进行了训练和测试。EVImax的估计像素级作物产量和DOY的MATLAB脚本可以根据通讯作者的要求提供。
翻译:杨佳琪| 排版:王 威
编辑:王晓醉 | 审核:张淑娟
Call for papers
点击标题,获取更多专刊信息
# 02
点击标题,获取更多专刊信息
# 03
点击标题,获取更多专刊信息
期刊简介
Geo-spatial Information Science(GSIS)是由武汉大学主办的测绘遥感专业英文期刊,主编为中国科学院院士、中国工程院院士李德仁教授。2020年9月被SCIE收录,IF2020:4.288;CiteScore2020 7.4。
GSIS 采用开放(OA)获取形式,文章一经发表,可马上被全球读者免费全文下载,这种模式可以让你的文章有更多的曝光度。如果您有需要抢首发权的高质量文章,可与我们联系gsis@whu.edu.cn,主编/国际副主编亲自为您处理,编辑部提供随时随地的疑问解答与状态跟踪。
期刊官网:
https://www.tandfonline.com/tgsi
投稿网址:
https://mc.manuscriptcentral.com/tgsi