【种业论坛】区块链技术在种业大数据中的应用
作者:刘海洋 曹永生 方 沩 陈彦清
单位:中国农业科学院作物科学研究所
我国种业自《种子法》实施以来进入了快速发展的阶段,育种水平不断提高,种子质量明显增强。但是由于种业的准入门槛低、利润空间巨大、市场监管有难度等问题,使得种子从研发到市场流通销售各环节都存在缺陷。在育种研发环节,各育种单位研究内容重复、分散、分工不清,导致育成的品种多、突破性品种少;在品种登记及品种权交易环节,由于知识产权保护环境较差,使得品种权有效保护不足,导致实际销售品种与包装声明的审定品种并不一致;在制种繁种及销售环节,由于众多的种子分销商多、小、散、乱,知识产权意识不足,种子溯源繁琐,导致市场出售的种子同物异名,经常出现套牌、假冒、侵权等现象;在市场监督环节,由于维权成本高、种子溯源困难,所以种子市场流通难以进行有效的监管。
随着互联网技术和大数据技术的发展,利用行业数据对行业进行监督管理是各行业的发展趋势。在种业领域中,种子从研发到市场流通各环节产生的数据构成了种业大数据,提供数据的各个参与方包括农业农村部职能机构、育种单位、种子公司、种子经销商、种子购买者。将种业各环节产生的数据进行有效地利用可以更好地促进种业领域向标准化、规范化方向发展。种业领域天然存在着育种范围广、种子用户多、销售地区偏远的特点,在精准农业和“互联网+农业”时代,采用完全中心化的数据管理手段难以实现种业大数据领域中大规模用户参与及交互的管理。种子知识产权及商标权是由分散于全国各地的种子局进行监管,但是由于育种环节信息沟通不畅、种子售卖渠道难以追溯,造成种子维权难、确权难的问题。
区块链技术采用分布式数据管理方式,不仅可以解决育种科研中假数据、错数据的问题,还可以建立一套完整的、可追溯的种子交易体系,将科研育种、品种审定、品种出售以及种子商标等各环节的数据有机地结合,对记入数据库中的数据以及参与种子交易中的每一笔资金的结算进行监管。采用区块链技术可以通过低成本的数据存储技术保障在种业各环节用户的交易合法、安全及数据的真实可信。本文从区块链技术的原理出发,提出一种区块链技术在种业大数据领域的应用设想,并从数据层、网络层、共识层、扩展层以及应用层对区块链技术的应用方式进行分析。最后,针对区块链技术及种业大数据领域目前的发展现状,给出目前区块链的应用局限分析。
1 区块链技术概述
区块链是将数据按照时间顺序进行保存,并借助密码学方式对数据进行加密的类似于链表的一种数据结构。区块链可以分为区块头、区块体以及链式结构3个部分,通过3个部分的结合可以实现数据易追溯、难篡改的特点。区块头中存储的是表征该区块的身份信息,包括上一区块的散列值、时间戳、Merkle根,通过这3个基本的数据就可以完全表示出这个区块在链中的位置。区块体中包含了实际需要保存的数据,这些数据通过加密算法加密之后以Merkle树的形式组织在一起。在每一个区块头(除创世区块)中都包含父区块的散列值,通过这种方式可以形成一条从创世区块到当前区块的区块链。同时,由于每一个区块头中都包含着该区块形成时的时间戳,所以形成的区块链还具有时序性。随着时间的积累,区块链中的数据会越来越多,在形成20个区块之后,某一个节点伪造区块数据的概率接近于零。
狭义的区块链技术是指区块链这种按照时间顺序存储数据的数据结构;广义的区块链技术指的是应用区块链进行数据存储的配套技术及其算法,即区块链技术体系。区块链技术体系是指应用区块链技术进行实际应用开发时的数据存储结构、核心机制以及智能合约的综合体系,其中包含区块链的分布式账本存储、组网方式、广播机制、共识机制、激励机制等。基于区块链数据存储的组网方式是P2P(Peer to Peer)网络,采用P2P组网方式可以实现区块链网络的去中心化及节点平等化。如果要实现区块链网络中的节点完全平等,还需要广播机制、共识机制等核心算法的支撑。
区块链数据结构、P2P组网方式、广播机制是构成区块链技术体系的三大核心要素,由这3部分要素可以实现区块链网络的去中心化、节点平等化以及数据可追溯、难篡改的特点。共识机制、激励机制的应用可以促进公有链的维护以及发展,但随着私有链、联盟链的出现以及区块链3.0时代的到来,智能合约以及更多类型的共识机制、激励机制在迭代更新,区块链技术体系随着新的应用场景不断地出现并随之扩大。
2 种业大数据领域中的区块链技术
2.1 种业大数据领域应用需求分析 种业大数据是指在种业领域各环节产生数据的集合,其中包括的基础数据有品种审定、保护、登记、推广数据及种子生产经营许可、生产经营备案、进出口、质量检测、监督检查数据,种子从研发到市场流通过程中所产生的科研育种、种子商标、植物新品种权、种子流通渠道、种子售后及保险等数据都是种业大数据的组成部分。随着我国种业市场的规范化发展,种业领域产生的数据越来越多,产生数据的参与方也随之增多,合理有效地应用种业大数据可以对种业领域进行有效监督。国内种业领域由于育种范围广、品种审定周期长、销售地区偏远等特点造成了种子销售渠道难以溯源,种子在进入市场销售之后出现套牌、假冒、侵权等行为以及植物新品种确权难、维权难的问题。各种业公司和科研单位在育种时不能及时有效沟通,造成了前期科研育种中资源的浪费。采用区块链技术体系构建的多方参与的、去中心化的数据存储共享方案恰好可以解决目前种业领域中的问题,将种业大数据应用区块链这种数据结构进行保存,保证了数据的安全;利用P2P组网方式可以提高数据的共享与前期科研育种时的沟通效率,利用区块链存储数据具有易追溯、难篡改的特点,可以解决种子销售渠道溯源难、种子维权、确权难的问题。
针对种业大数据中前期科研育种数据沟通不畅、作物品种审定周期长以及后期确权难的问题,可以利用区块链这种低成本且具有数据难篡改、易追溯优点的数据存储方案。将科研育种环节中的育种数据存储到区块链中,建立育种及植物品种信息追溯系统,可以根据时间顺序在后期种子确权和维权中提供可靠的数据依据。基于区块链技术体系,建立种业领域育种及种子所有权归属私有链,将育种单位的育种信息及品种所有权进行分布式存储,区块链网络中的所有网络节点(各育种单位)共同维护育种信息及品种信息,使得保存于区块链中的数据公开透明,为前期科研育种信息沟通不畅以及后期维权难、确权难提供可靠的数据保障。
针对种业大数据销售环节中产生套牌、假冒、侵权的问题,基于区块链技术体系建立种子交易溯源系统可以监管种子在市场流通中的每一笔资金。将种子交易中各级经销商的种子售卖途径及售卖渠道的数据记录到区块链进行存储,可以方便快捷地进行种子销售环节的溯源,这样可以保证每一批种子都能找到源头。采用区块链技术体系中的广播机制、P2P网络,再加上适合种子交易溯源系统的激励机制,促使全网各节点共同维护种子交易数据,保证数据的真实可信,为打击种子销售环节中的套牌、假冒、侵权现象提供透明化的数据。
将种业各环节中产生的数据通过区块链技术体系进行存储以及安全验证,会促进种业大数据向标准规范发展,从而形成种子市场交易数据、种子所有权及植物新品种权数据的共同维护型区块链“生态”,形成一个良性的数据循环,促进种业领域向更加标准规范的方向发展。
2.2 层级架构分析 应用区块链技术体系构建育种及植物品种数据存储系统和种子交易溯源系统可以将育种到销售各个环节产生的数据记录到区块链存储系统中,从而解决种业大数据的存储与验证问题,为之后种子维权难、确权难提供可依赖的数据。基于区块链技术体系的种业大数据应用层级架构如下图所示。
育种及植物品种数据存储系统数据层中存储的是各育种单位的育种信息、品种经过审定之后的审定信息、种子商标及包装的信息,种子交易溯源系统中存储的是种子在经过各级经销商销售之后的交易信息。数据层中应用区块链进行数据的保存,将每一个育种单位的育种信息经过Hash运算之后以Merkle树的形式组织在一起,将形成的Merkle根保存在区块头中,区块头包含着时间戳、当前区块的Hash值、上一区块的Hash值。这样将前期科研育种及品种审定信息存储,如果在后期发生种子确权难的问题时,可以提供区块链网络中各节点都达成共识的数据,从而解决品种权确权难的问题。基于区块链技术体系的种子交易溯源系统数据层中存储的是品种经过审定后在市场中的流通信息,将各级种子经销商的种子交易信息以区块链形式存储于数据库当中,可以防止市场中假种子、套牌种子的出现,为种子维权提供可靠的数据。
网络层的组网方式是P2P网络,由于育种及植物品种数据存储系统和种子交易溯源系统的应用场景不同,所以P2P网络中的节点也不同。育种及植物品种数据存储系统中的网络节点是各育种单位,种子交易溯源系统中的网络节点是各级种子经销商。在科研育种阶段,育种及品种数据存储系统中的某一网络节点可以通过广播机制进行全网的育种信息的广播,全网50%以上节点验证之后可以存储到数据层中,育种信息广播及验证机制可以避免育种环节的重复区,也可以在后期的种子确权过程中通过时间顺序确定种子归属权。种子交易溯源系统中网络节点代表着种子的各级经销商,根据种子市场实际的应用场景,网络上各节点发布种子交易数据,得到种子交易双方与第三方公正机构的认可即可将数据存储到区块链当中。利用P2P组网方式可以让种子生产销售各环节的参与方共同贡献数据、维护数据,保证数据的安全性与可信度。
扩展层包括基于区块链技术体系的共识层、激励层、合约层。育种及品种数据存储系统的共识层不同于一般公有链的共识机制——需要通过工作量证明机制来取得区块的记账权。由于我国品种审定和植物品种权是由农业部门承担,所以育种及品种数据存储系统的共识层证明机制采用单机构证明机制,这也符合联盟链的构成条件,只要联盟中具有认证资质的节点通过该审定品种的信息,就可以将该品种信息记录到区块链当中。种子交易溯源系统与育种及品种数据存储系统应用场景不一样,种子交易溯源系统中的数据记录需要各级经销商以及销售点来共同维护,不具有联盟链的特点,所以需要共识机制与激励层的激励机制协调进行区块链数据的维护。在种子交易溯源系统中设置一个相对简单的工作量证明机制,然后通过激励层激励机制的配合,可以使得种子交易溯源系统的每一个网络节点都参与到区块链数据的维护当中,这样可保证种子交易溯源系统的数据真实可靠且具有公信力。
基于区块链技术的种业应用合约层利用非对称加密技术,赋予每一个网络节点公钥与私钥,这样在记录每一条关于品种信息及种子交易信息时,都能唯一确定交易双方及品种权所有者。合约层还可以利用目前比较成熟的智能合约技术,将品种审定信息及品种所有权以数字签名的形式进行保存,并将品种审定及种子所有权授予流程编写智能合约程序建立在种业区块链数据层和网络层之上,这样通过智能合约可以控制种子所有权及品种审定的流程,促使保存于区块链中的数据更加规范合理。基于区块链技术体系的种业大数据应用将数据层、网络层、扩展层的核心机制与算法部署到网站、APP、第三方应用等,用户通过应用层可以进行数据的查询以及交互,实现种业数据的互联互通。
2.3 共识机制与激励机制 种业大数据的各参与方是区块链网络的节点,育种及植物新品种信息数据存储系统和种子交易溯源系统的参与方包括农业农村部、育种单位、种子公司、种子经销商、种子购买者及售后保险公司。
育种及植物新品种信息数据存储系统中的品种审定、保护、登记、推广以及科研育种等信息构成了该区块链体系的总账本,即区块链中实际存储的数据。该系统中网络节点达成共识的机制可以采用弱中心化的共识机制,由于我国品种审定及植物新品种权的保护都是由农业农村部职能机构进行维护,所以在进行品种审定及植物新品种权的记账时,可以由农业农村部、育种单位、种子公司三方进行记账。政府、种子企业、育种单位三方进行记账之后,通过广播机制进行全网广播,在达到全网50%以上节点同意之后可以将品种审定数据和植物新品种权数据记入到区块链当中。这样“弱中心化”的共识机制不仅可以通过政府、种子企业、育种单位三方的公信力进行背书,而且有全网50%以上的参与节点的同意也可以保证节点参与数据的维护,通过这种方式将品种审定及植物新品种权数据记入到区块链当中,所有的数据可追溯、难篡改。
种子交易溯源系统中的制种繁种、各级经销商经销渠道、种子流通等数据构成了该区块链系统的总账本。该系统的参与方包括农业农村部职能机构、各种子公司、各级种子经销商、种子购买者。该系统记录的是种子从制种繁种到购买使用的流通信息,所以在达成共识的时候不能确保所有的最终购买者都能参与到购买信息的提供与记账当中,所以该区块链系统的共识机制采用“分级共识”。大型种子公司到中高级经销商的种子销售渠道数据在上游经销商和下游购买者两方达成共识之后,通知农业农村部职能机构进行审核,三方通过之后可以将种子上游售卖信息存储到区块链当中。考虑到众多的小经销商以及购买者只有在种子出现假冒现象时才会进行数据追溯,所以小经销商和种子购买者的共识机制可以在维权过程中通过种子购买者、小经销商及农业农村部职能机构的共识之后进行数据的追溯和保存。通过这样的“分级共识”,可以做到种子交易溯源系统中的上游经销数据和下游经销数据根据不同的需求进行不同方式的共识,使记入区块链当中的数据真实可靠。
育种及植物新品种信息数据存储系统与种子交易溯源系统的激励机制可以采用“积分式”对参与数据贡献的节点进行激励。育种及植物新品种信息链中的信息提供方是各育种单位及种业公司,在政府、种子公司、育种单位三方达成共识记入区块链中的品种审定及新品种信息之后,可以给予育成品种的单位一定的积分激励,该积分的使用规则可以由政府、种子公司、育种单位共同制定。种子交易溯源系统的信息链可以给予中高级经销商一定的激励,通过激励鼓励各级经销商将种子的销售渠道信息进行记账。
2.4 智能合约与密钥机制 智能合约作为区块链技术体系中的创新机制,可以通过将代码部署到区块链上的形式进行日常带有条款事务的强制执行。育种及植物新品种信息链中可以根据品种审定、植物新品种赋权的法律程序编写代码部署到区块链当中,通过程序化的脚本进行品种审定与植物新品种权的触发。利用智能合约在进行品种权的确定及转移过程中,通过智能合约可以确定品种权的权限、品种权的交易周期及失效条件等具体的程序。对于种业领域中多方参与、信任度不高的品种赋权及审定程序,应用智能合约可以降低管理成本,还可以在品种维权时避免不必要的争议。种子交易溯源系统中的智能合约应用范围会更加广泛,由于种子交易溯源信息链中存储的是种子流通信息,可以通过智能合约进行交易双方账号、金额、品种权等信息的维护。将智能合约部署到种子交易溯源信息链,只有在种子买卖双方共同确认的条件下才会触发种子交易流通信息进行全网节点的广播及农业农村部职能机构的审核达成三方共识,将数据存储到区块链当中。本文提出的育种及植物新品种信息链和种子交易溯源信息链都是“弱中心化”的私有链,共识机制采用的是政府、种子企业、育种单位三方达成的共识,所以还是有权限相对较高的节点存在。如果将智能合约这种程序化的脚本部署到育种及新品种信息链和种子交易溯源链当中,可以为全网节点提供更好的去信任条件,所有的记账行为都是在合约条件下执行,可以保证在大量终端参与情况下达到更高级别的信任。
区块链技术体系的最终目的是要达到去中心化的效果,全网所有的节点拥有相同的数据操作权限。但是由于种业大数据中的品种审定、植物新品种赋权等法律行为必须有政府部门进行监管,所以本文将育种及新品种信息链和种子交易溯源信息链最终采用“弱中心化”的共识机制,政府、企业、育种单位三方达成共识的情况下即可记入区块链的记账行为。借鉴区块链应用的典型密钥管理机制,种业大数据中的区块链应用采用公钥、私钥相互配合的机制进行区块链世界中的身份识别、数字签名等行为。育种及植物品种信息链和种子交易溯源信息链的每一个网络节点都拥有一个公钥和私钥,公钥用于区块链网络中的身份识别以及信息的上传,私钥用于记账及共识达成后的数字签名。通过私钥可以计算得出公钥,但是通过公钥不能反推私钥,这样的密钥管理可以结合共识机制和智能合约进行区块链的记账,保证每一个区块的信息都可以确定是哪个节点进行记录及交易的。这样的非对称密钥机制可以完全保证种业大数据中需要保密数据的安全及信息链的真实可信。
3 局限性分析
根据种业大数据中实际产生的数据以及区块链技术体系运行机制,本文将基于区块链技术体系的种业大数据应用分解为数据层、网络层、扩展层(包括共识层、激励层)、应用层4层模型。但是由于种业大数据包含数据项多、数据范围广,基于区块链技术搭建的应用还存在以下3点局限:一是由于区块链技术体系是假设P2P网络中的所有节点都能独立完成区块链信息的记录、支付、路由的功能,但是在种业领域中要求所有的节点都具备该功能是不现实的,尤其在种子交易溯源系统中,多数的经销商可能并不具备区块链体系要求的所有功能,无法完成区块链上的完整交易。这种情况下只能依靠高级经销商进行区块链的记录及支付功能,低级的经销商采用验证机制完成数据的准确性;二是由于育种及销售范围广,销售地区较偏远的限制,不能保证育种信息、品种审定信息及交易信息快速安全处理,需要设置更好的共识机制来完善品种信息溯源系统及种子在交易系统的共识层;三是区块链技术体系构建应用中存在的资源浪费问题,品种数据存储系统及种子交易追溯采用联盟链的方式可以避免网络节点“挖矿”造成的算力浪费,但是全网各节点需要同时参与共识的达成,造成了各节点的网络资源浪费及共识结果延迟,所以需要设计更加符合种业应用场景的工作量证明机制和激励机制,使得区块链网络节点的网络需求降低、共识过程更快。
4 总结与展望
区块链技术作为去中心化、去信任化的技术体系以及分布式数据存储解决方案,使得金融领域的传统管理方式发生了创新与本质的改变,区块链3.0时代的到来要求将区块链技术体系应用到社会的各个领域中。本文提出了基于区块链技术体系在种业大数据中的应用设想,并对其局限性进行分析。通过区块链技术,种业领域的监管者(农业部门)可以更好地将种业领域各环节产生的数据进行存储,然后基于这些数据进行种子市场的监管,无需中心化的网络即可发挥监管职能,并可以通过分布式网络系统容纳种业领域的各个育种单位及种子企业进行数据的共同监管和维护,解决目前农作物品种确权难、维权难的问题,在精准农业和“互联网+农业”的时代更好地支撑未来种业行业的发展。(参考文献略)
《中国种业》
中国种业行业导刊。由农业部主管,中国农业科学院作物科学研究所和中国种子协会共同主办的全国性、专业性、权威性种业科技期刊。
官微:中国种业
QQ群:115872093
招商:010-82105795
地址:北京市海淀区中关村南大街12号