学术前沿 | 什么是农业4.0?这篇文章告诉你(节选)
英文标题:Opportunities and Challenges for Big Data in Agricultural and Environmental Analysis
中文标题:大数据在农业与环境分析中的机遇与挑战
作者:Alfons Weersink, Evan Fraser, David Pannell, Emily Duncan, Sarah Rotz
原文链接:https://www.annualreviews.org/doi/abs/10.1146/annurev-resource-100516-053654
翻译说明:(1)本(系列)论文翻译稿由启研学社实习生完成,旨在帮助本科生或低年级研究生交流经验研究的方法;(2)本翻译稿仅用于学习交流,请勿用于商业目的。
启研学社由知名学者担任学术顾问,由高校师生与企研数据科学团队联合组建的,是以大数据资源及相关技术助力中国学术、智库与行业研究为宗旨的研究组织。团队当前的主要目标是挖掘行政、经济与社会大数据资源在经济学学术、智库与相关行业研究领域中的应用价值,以学术研究为标准开展大数据治理研究,努力探索大数据分析技术融入中国经济社会研究的可行进路。
什么是农业4.0?这篇文章告诉你(节选)
Part1引言
传统上,农民和其它农业生产从业者收集农场方面的数据,如化肥使用率(投入方面)、产量(产出方面)。同样,政府机构通常收集有关生产对环境影响的数据,以监测生态健康。数据一直是做出管理决策的基础,在过去十年中,通过产量监测器、便携式设备、无人机和智能手机等传感器收集的农场数据量显著增加。不仅数据的数量有了增加,数据的形式也发生了变化,从附加变量(例如产量、水质)的简单数值过渡到包括更多的定性措施(例如,实践类型、气味)。这两种变量的收集更精确,具有高度局部化的规模。
即将到来的数字农业革命在降低农业部门对环境影响的同时提高生产力,还增加了跨国公司对农业数据管理的投资——这些公司通常涉足其他农业生产领域。例如,孟山都在2012年收购了软、硬件公司Precision Planting,随后与次年收购了气候数据和建模技术公司 The Climate Corporation(Carolan ,2017)。此外,杜邦与约翰迪尔合作提供无线数据传输系统,然后与 DTN 公司合作来提供市场和天气信息。为了增加其农场设备的机器学习能力,约翰迪尔随后购买了来自孟山都的 Precision Planting,最近又收购了Blue River Technology(Lev-Ram 2017)。从广义上讲,2015年,收集农业数据的设备预计有3000万台,这一数字预计到2020年将超过7500万(Chi等,2017)。其他创业公司也跟随了这一轮对农业数字服务的投资。尽管有巨大的利润,这场备受瞩目的技术革命在实际改变农业实践方面进展缓慢(Brown 2017)。例如,虽然对农业食品的风险资本投资几乎在过去两年中每年翻一番,人们以及把注意力转移到农业数据上(Pitchbook,2017)。大数据的潜在好处仍然存在,尤其是将应用领域扩大到包括基因学和可追溯性,而不仅仅是精准农业。也就是说,改变投资表明需要评估并考虑政策在这一领域的潜在作用。
本文旨在回顾由大数据对农业部门带来的机遇与挑战以及农产品数字化对自然环境带来的影响。本文主要关注大数据发展带来的政策问题,并通过分析来帮助解决此类问题。我们首先定义什么是大数据,以及它在基因学、精准农业、可追溯性方面在发达国家农业的潜在应用。
Part2大数据与农业4.0
农业中数据的新兴使用预示着一场新的数字化农业革命,这一革命是由许多创新驱动的,数十年来对这些创新对制造业产生了非常广泛的影响(Deichman等,2016)。首先,机器人技术的进步使自动化程度大大提高(Faulkner & Cebul 2014,Wolfert et al.2017)。其次,传感器技术成本的下降使农民能够监控诸如动物活动、土壤健康以及土壤湿度的实时状态。第三,如今人们已经掌握分析这些数据的编程能力,从而可以发明决策支持工具,例如拖拉机仪表盘和移动应用程序(例如投入应用程序),帮助农民更精确地管理农业实践(Antle等,2017;Krintz等,2016;Rose等,2016)。新兴大数据分析平台(如云计算和机器学习算法)的出现,驱动人工智能的发展,这使得上述内容都是可能的(Ali等,2016;Chen等,2014;Krintz等,2016;Wolfert等,2017)。
这些技术一起使农业中生成的数据的数量、速度、多样性和准确性呈指数级增长(De Mauro等,2016;;Sonka,2014;;Wolfert等,2017)。反过来,农业数据不仅成为产出和食物链创新的主要驱动力,而且也迅速成为环境管理的主要驱动力(Caron等,2014)。通常,在精准农业的概念下,农业4.0技术是指能够部署机器人、传感器和大数据分析的生产系统,其可以使农民能够更小、更精确地管理农场(Lesser,2014 ;Wolfert等,2017)。尽管精密农业技术已经使用了大约十年,并且通常以产量监控器的形式出现在农作物种植系统和机器人挤奶厂中,但是随着传感器和机器人成本的下降,该领域的创新步伐有所加快。
与大数据相关的技术创新预示着农业潜在的深刻变化,这在过去50年来一直由绿色革命技术主导。绿色的革命的基础是引入杂交种子、灌溉、机械化和低成本化肥和杀虫剂(Tilman,1998)。这些技术的作用是扩大农业规模,本质上是通过标准化大面积土地的管理实践,为农民提供能够提高产量的工具(Duffy,2009;Matson等,1997)同样的形式也发生在畜牧业中。动物饲养作业、浓缩饲料、提高产量的遗传学和机械化导致了规模经济,从而产生了以基本相同方式管理的畜群或羊群数量的显著增加(Weis,2013)。
如上所述,农业4.0的工具(例如机器人技术,传感器和大数据分析平台)在完全实现后,将使农民能够更加精确地应用投入物。因此,在许多方面,农业4.0代表了一种不同于绿色革命的基本农业方式。特别是人工智能、决策支持系统、传感器,机器人技术使农民有机会在更精细的规模上进行管理调整。最终,这些技术甚至可能使农民能够实时管理农场中个别动物或植物的需求。例如,智能拖拉机知道它们在田间的什么位置,在正确的位置种植正确的种子,并为其提供正确数量的肥料(Gebbers & Adamchuk,2010;Ramundo等,2016;Wolfert等,2017)。同样,智能的牲畜饲养场会在每只动物接近饲料站时对其进行识别,并提供量身定制的定量饲料,以满足该动物的遗传、健康和生命阶段的需求(Busse等,2015)。本质上,农业4.0的工具提供了与个性化医学相当的功能,但这适用于农作物和牲畜。
这些技术发展的第三个组成部分——大数据分析平台是农业4.0的基础,因此大数据分析平台与本文回顾的目的最相关。尤其是,除非能够以转化为对农民有用的决策支持工具的方式整理这些数据,否则目前由正在使用的机器人挤奶机和产量监控器在农场上生成的大量数据是无用的(Janssen等,2017;Lindblom等,2017)。因此,大数据分析平台需要充当新的农业革命的骨干力量,并且对于校准、解释数据以及创建决策支持工具,以支持整个农业食品行业的参与者来说,是必不可少的。
Part3大数据在农业和环境中的机遇
农业4.0的支持者认为,大数据在许多关键方面为农业食品系统的深远发展提供了潜力。首先,我们预计这些技术将加速并减少改进农作物和牲畜基因遗传的成本,这不仅可以通过使植物和动物更繁殖精确,但也可以通过基因编辑等新技术来实现。改进农作物和牲畜的基因遗传会带来许多好处,例如发展适应当地条件变化的基因类型。其次,这些技术可能会有助于农民在更少的土地和对环境的影响较小的情况下,生产更多的食物,这通常被称为可持续集约化(Garnett等,2013)。最后,这些技术为在复杂的全球食品供应链中创造更大的透明度和可追溯性提供了潜力(Opara,2003)。下面我们将详细讨论这些机遇。
1基因遗传学
尽管从大约一万年前农业开始发展以来,农民就一直在培育动植物,但日新月异的基因技术,尤其是我们新发现的基因编辑技术,为我们提供了对基因类型的指数程度的控制,农民可以利用这些基因类型,而不会像转基因生物那样引起道德和环境方面的广泛关注。特别是,最先进的基因编辑技术可以培育植物和动物,一旦确定了具有特定性状的植物或动物,就可以确定哪些等位基因负责该特征。随后,人们通过打开或关闭相关的基因,可以确保该特定性状在未来一代是否存在。这个过程大大加快了特定性状的动植物育种的进度,例如抗虫性或饲料效率,不再需要将新的遗传物质引入植物或动物的基因型(Ballenger等,2016;Goddard,2012)。本质上,基因编辑可以使传统植物育种以更快的速度和在更少的监管、消费者健康、环境担忧下进行。从理论上讲,该技术的部署成本比更传统的生物技术方法(例如转基因或基因改造(GM))更小,它可以为服务于小型市场的本地生物技术公司提供发展机会,量身定制适合当地环境的农作物和牲畜。
此外,基因编辑技术可以通过减少培育新的植物和牲畜变体所需的时间,使农作物和牲畜能够更快适地应变化环境条件(Edwards,2016)。在未来,使作物迅速适应当地条件的机会可能变得极为重要,我们希望现有的农田能够“经受”更加极端的天气条件,以及温度和降水的变化。基因改良所带来的其他环境利益包括可以将基因编码的固氮酶直接进入谷物作物,从而使这些植物能够固定空气中的氮气(Beatty等,2011)。随之而来的肥料使用量的减少,以及潜在地减少向水体或大气排放养分物质,可以通过理解基因型如何与环境条件相互作用来影响性状以及对氮气排放的影响来实现。(Ng等,2016)。
2精准农业
精确农业的总体目标是通过制定种植、施肥、灌溉和农药施用方法到每个农场存在的时空微气候,以提高农业管理效率。这与最近的农场历史大相径庭,几乎所有的农业系统在过去都是劳动密集型的,农民根据自己的评估,不同地管理他们小型农场的独特特征。但是,自20世纪40年代以来,机械化的发展以及其他绿色革命性技术对的发展(例如杂交种子以及相对廉价的肥料和杀虫剂),驱使许多农民通过用资本替代劳动力来扩大农场规模。其中的一个结果这是单个农场的管理演变成整个农场的管理,其被视为具有相对统一管理实践的单个单位(Sonka,2016)。这也创造出极其具同质性的农业景观,并减少了北美农村地区的生物、作物和社会多样性。
精准农业允许进行更小规模管理,这可能会在理论上改变上述这种情况。一方面,精准农业应促使人们回归到更加密集的农业生态系统,这可以通过使农民有能力在单个动物层面或在田间变化范围内进行管理,使农场空间和时间的异质性增加。这种方式有可能会增加生物多样性和作物多样性。另一方面,精度农业技术往往需要大量资本,这可能会导致持续的农业生产整合和社会经济同质性(Wolfert等,2017)。
尽管数字农业革命对单个农民的好处可能会在未来才能体现,但是使用这些技术对我们食品系统的环境管理的改善是真实的。例如,在畜牧业中,任何给定畜群中的动物获得的饲料量通常多于其能有效代谢的数量,因此导致养分会通过肥料流失到环境中。同样,据估计,北美的大型农作物系统所获得的肥料比植物所能吸收的多50%。这些来自农作物和畜牧业的多余营养素最终都可以成为水污染的来源或者是造成全球变暖放入温室气体(GHG)(Tilman等,2002)。因此,大规模统一管理及其带来的过度投入的后果之一是农业成为造成全球水污染的最大因素,并且占全球温室气体排放量的30%以上(IPCC,2014)。精准农业应当至少能够解决其中的一些问题。例如,Balafoutis等(2017)对精密农业技术进行了回顾,认为全球定位系统(GPS)的引导系统与可变速率养分施用的结合,可以帮助限制拖拉机在田间行驶的次数,这能够减少温室气体排放。
尽管精准农业有这些明显的好处,但必须指出的是,精确农业提供的附加信息相对于其成本,是阻碍其广泛采用的另一个可能障碍。尤其是过去农民使用诸如产量监测仪和肥料施用变动率等技术的历史表明,这些技术的收益函数相对平坦,因此在很多情况下,农民没有真正的经济诱因去投资这些技术。因此,现有证据表明使用的情况千差万别。就牲畜而言,精确的农业技术包括了机器人挤奶器和移动跟踪器,可以用来识别发情周期,这在乳制品经营中正变得司空见惯。关于农作物的生产,来自欧洲[1]、美国中西部(Erickson等,2015)、堪萨斯州(Griffin等,2017)和加拿大安大略省(Mitchell等,2018)等地区的研究已经发现,GPS的广泛采用能够使转向系统、产量监控器和网格土壤采样自动化。相反,一些研究发现,一些可变比率技术,可以将不同比率的投入(例如种子或肥料)应用于农场不同管理区域,但是尚未被采用到同一水平。
由于GPS不需要其他技能即可获取其价值,因此GPS被称为具体化知识技术。而此类技术依赖于知识农民已经掌握的、有关如何操作机器的知识(Griffin等,2017)。这些技术要么能够简化工作(例如自动转向系统),要么被动地收集数据(例如产量监视器)。相反,信息密集型技术(例如可变利率技术)使用从农场收集的数据,将其输入至决策支持系统,该系统能够能对投入的可变应用提供“处方”,以获得收益(Griffin等,2017)。
如今,产量监视器作为大多数联合收割机的标准设备,其所捕获的空间细节在过去的二十年中已大大增加。基于前几年产量的田间区域,这些空间图表明了现在的生产力区域(因此,区域可能会因不同年份微观条件的不同而有所不同)。确定高或者低生产率的管理区是有用的,并且这能够帮助农民将长期生产不足的田地变成固定资产,同时最密集地耕种那些最优质的田地。但是,要达到这种潜力,就需要一个决策模型以及其他土壤和天气数据,来确定对高或低产区施用比目前统一的更多还是更少的肥料。相反,对于诸如GPS系统之类的精密农业技术(该技术可通过减少重叠来提高输入应用程序的准确性)而言,我们不需要这样的决策支持系统。这些GPS技术的采用率表明,除了通过仅在必要时施加输入(不重叠)来减少投入的使用,或者确保对所有位置或动物进行充分处理(无重叠)这两种价值外,操作更容易的益处要远大于采用这些技术的成本(Schimmelpfennig,2016)。
通过一系列研究得出的两个结论,说明了从精密技术中获取大量信息价值的困难,这些结论研究了为什么农民倾向于使用超过建议用量的肥料(Pannell,2006;Rajsi等,2008)。首先,在给定年份内,氮对产量的影响在最佳状态附近持平,而在使利润最大化的比率附近,在较大范围的投入水平下,产量的下降幅度很小。因此,尽管不同的空间单位可以接收到显著不同的投入率,但相对于采用统一的投入率,利润的差异却很小。其次,响应函数根据年份而变化。在给定氮速率的情况下,产量的时间变化大于空间变化;因此,逐年调整速率比调整一片田地甚至田地之间的速率更为重要。
大数据对农民的价值可能主要通过确定给定地点的问题区域,或通过开发从许多生产地点集成的数据,从中改进分析(Bennett,2015)。来自单个生产者的信息数据可以与其他农民的数据融合在一起,通过研发仪表盘、应用程序和其他软件应用程序等决策模型来提高这些数据的价值。由于农业的生产周期往往比较长,因此单个农场的重复观测值不足以为该农场生成预测模型。然而,与单个农场相比,在更广泛的空间和时间尺度上的操作中包含的变量,例如土壤质量、天气条件和管理实践,可以对决定产量的因素进行更稳健的分析(Sonka,2016)。但是,要实现这样的整合,要求众多农民使用一系列不同类型的设备才能汇总他们的数据。当前,我们缺乏这种集成方法,这说明了为什么精准农业技术具有的潜在环境效益迄今为止都尚未完全实现。
将来,任何此类决策模型的核心都必须从从多个生产者收集的数据中得出,并将是把产出和投入以及非常具体的地理条件相关联的生产函数。大多数农业和资源经济学家精通于投入与产出之间这种技术关系的重要性;决策模型将根据生产者的具体目标,使用估计的生产函数来建议施用量。经济学家还意识到,生产函数不是确定性的,在本质上是随机的。外生变量,例如土壤湿度在最初收集数据时的正确时间可能无法准确无误地被预测,或者当农民做出投入量的决策时这些外生变量并不知道已经做出了决策;反过来说,我们必须做出预测。即使变量可以是观察或准确确定的,这些变量对生产的影响通常取决于许多未观察到的变量。这种不确定性会影响决策模型的准确性以及精准农业信息的相应价值。
在具有高信息价值的农业中推导出决策规则的能力,对于具有以下特征的部门将是最高的:(a)有价值的产出(单一动物或单株植物),(b)周期短(每日与年度)(c)生产中的不确定性很小,(d)田间或动物之间高度的异质性以及(e)准确可靠地衡量该异质性的技术。例如,精准农业中饲料占养猪成本的70%,在养猪生产中使用饲料的价值可能高于在大田玉米生产中使用氮肥的价值;因此,养猪户将比玉米生产者更快地采用精确农业技术。在农作物生产中,与大田作物生产相比,基于温室密集系统的精准农业,其在营养决策方面净收益可能更高。
总体而言,精准农业的希望是在更少的土地和更少的投入上生产更多的粮食。因此,精准农业是农民用来持续地集约化粮食系统的一种工具(Garnett等,2013)。这可以回溯到大约10年前围绕农业和自然景观的辩论,学者们争论它是否更好地影响了野生自然。此后,人们把土地从农场中节约出来,或者采用将生态系统服务和粮食生产融合在一起的管理实践【也称为土地共享策略(Green等,2005;Luskin等,2018)】。虽然这种节约还是分享的争论没有具体的解决方案,但大多数学者都在撰写有关可持续集约化的文章,表明与精准农业相关的新兴农业技术将有助于我们在减少投入的同时加强粮食生产(Benton等,2011;Phalan等,2016)。
3可追溯性
新兴农业技术的另一个好处是确保全球食品供应链的透明度更高。出于多种原因,粮食系统透明度正在成为一个主要问题(Badia-Melis等,2015)。首先,在过去十年中,人们越来越担心食品欺诈等问题,即劣质食品被故意贴错标签(Aung & Chang,2014;Van Rijswijk & Frewer,2012)。在2013年,欧盟发现马肉被混入碎牛肉,这时食品欺诈问题进入了公众的视野(Walker等,2013),自此有关食品欺诈的问题有规律地发生。例如,一项加拿大的研究表明,有25%销售的海产品被错误地贴上了商业价值更高的标签(Van Rijswijk & Frewer,2012;Wong & Hanner,2008)。同样,亚洲越来越挑剔的中产阶级消费者要求保证他们食物的身份和供应。最后,北美的研究表明,消费者越来越需要知道他们的食物来自哪里,以及媒体在消费者的认知中发挥着重要作用(McCluskey等,2015)。
因此,基于基因组的技术,例如DNA条形码,越来越多地用于核实全球供应链的食物来源(Pizzuti & Mirabelli,2015)。同样,自愿记录系统是一种向消费者提供关于食品身份的保证系统,其正变得越来越普遍。在日益分化和竞争日益激烈的全球市场中,农民将此类系统视为向消费者保证食物特性和成分的一种方式。越来越多的行业参与者开始关注IBM的区块链[2]等技术,这是一种簿记系统,该系统将计算机分类账中的条目“链接起来”,以便他们不能被篡改。因此,利益相关者可以使用它们来核查从产品从生产商到加工商再到发货商最后到零售商的真实性。由于区块链账本存储在一系列云计算服务器上,并且在多个位置存有副本,因此区块链不存在单点故障或漏洞,这一特性也导致率人们先使用区块链来跟踪加密货币(例如比特币)交易。农业食品部门现在正在考虑如何使用区块链来保证食品透明度;沃尔玛率先将区块链应用到食品中,作为追踪猪排的一种方式(Popper & Lohr,2017)。
农业的数字革命还能够扩大可追溯性的概念,包括与食品生产过程相关的特征(Lusk,2017;Marvin等,2017)。利基市场因为一些特征而出现,这些特征往往与围绕食品的形容词,如有机、本地和自由范围有关。经济增长使消费者能够在确保食物低成本生产的基础上,还能担忧食品的生产方式(Campbell,2009;Caracciolo等,2016)。Currid-Halkett(2017)将隐性消费描述为精英阶层通过购买牧场饲养的鸡蛋和藜麦饼干等利基产品的活动,来表明自己与其他人的区别。信息技术不仅促进了对替代食品(以及潜在的错误信息)认识的传播,而且还使生产者能够向消费者核实该产品是否包含所需的属性。在许多情况下,食品的属性与具有相对较小的环境影响的生产实践有关。
友情链接
CEMA欧洲农业机械: http://www.cema-agri.org/page/farming-40-future-agriculture
[2]IBM的区块链: https://www.ibm.com/blockchain/
加入三农大数据·交流学习群,获取更多三农相关新鲜资讯
END
点亮特关小星星
搜索你感兴趣的文章吧
往期推荐
━━━━━━━━━━━━━━━━━━━━
译 | 陈泽
审阅 | 杨奇明
━━━━━━━━━━━━━━━━━━━━