流浪地球之前,“自然资源大数据”决定着人类的未来 | 专栏
专栏作者 李振宇 | 撰文
Tryul | 责编
大数据应用在喧嚣中蓬勃发展,在商业、金融和消费服务等领域相对成熟,而在泛自然资源领域,大数据应用仍处于萌芽阶段,相关概念、方法和目标均处于模糊状态和探索阶段。
01
“大数据”一词的泛滥使用,模糊了大数据的实质
早在1980年,著名未来学家托夫勒在其所著的《第三次浪潮》中就热情地将“大数据”称颂为 “第三次浪潮的华彩乐章”。《自然》杂志在2008年9月推出了名为“大数据”的封面专栏。从2009年开始“大数据”才成为互联网技术行业中的热门词汇。2015年,国务院印发了《促进大数据发展行动纲要》,大数据迅速成为红极一时的产业概念。
向来以高科技示人的空间信息产业,自然也不甘寂寞,“空间大数据”升级为“时空大数据”并在业界、学界和媒体界迅速传播,若干项目冠以“大数据”以示高端,若干从事传统业务的企业华丽转身成为“大数据服务商”;但对于空间信息产业和泛自然资源领域,“大数据”一词到底意味着什么、解决什么问题、应该如何构建,不仅鲜有成功范例,在概念上也是模糊不清,大有泛滥使用之嫌。
2017年,以“时空大数据的崛起”为主题的WGDC大会上,知卓资本的陶闯博士发言称:今天大会上真懂大数据的人,nice一点说不超过10%,严格来说不超过2%,大数据不是数据大的问题,而是真正颠覆思维的问题。
陶博士的言论振聋发聩,笔者认同这个论断,时至今日,广泛而清晰的理解“时空大数据”仍任重道远,将三调数据采集和常规信息系统建设划归大数据范畴是明显误读,虽然适当的边界模糊有助于激励人心,但相对清晰的概念才有利于产业发展。
2018年10月,自然资源部发布《自然资源科技创新发展规划纲要》,在“六项任务”中,有三项涉及“大数据”。如果继续模糊下去,宏伟蓝图恐难落地,空间信息产业的转型也将异常艰辛。
02
自然资源大数据的价值观
所谓大数据的价值观,简单说就是大数据方法的价值所在,解决什么问题,达到什么结果,才是真正的大数据应用。既然将大数据提升到如此高度,如果不能清晰认识大数据的应用场景,也就无法挖掘其巨大价值。
举例说明:
随着移动定位能力的普及,我们可以实时获得每个移动目标的位置,实时展示数亿移动目标的动态位置,根本与大数据无关也看不到应用价值;通过实时位置信息,推算出道路的当前拥堵情况并预测通行时间、推荐行车路线,才是大数据应用。在小数据时代,实时交通的推演,还要部分依赖于交管部门提供的线圈和浮动车数据,当智能手机普及后,每台终端都成为了数据源,实时交通的计算更加精准和及时,互联网企业开始反过来向交管部门提供数据支撑,这就是大数据时代的颠覆式转变。
回归到自然资源领域,在多规合一的场景下,将多种规划数据整合到一起,建立起规划审批系统,判断某项用地是否符合规划,仍然是事务性办公系统;而综合自然资源、社会经济、人类活动等多维数据,洞察当前规划的合理性,预测未来社会经济发展的时空趋势,从而为制定多时空尺度的国土空间统一规划提供决策支持,才是大数据方法的价值。
在地质灾害中,管理多项调查成果和监测数据,实现快速查询展示,或者在三维场景下模拟灾害发生过程,不是大数据应用;而综合利用历史发生的灾害事件,收集相关地质构造、土壤、坡度、降雨、人类活动等多维数据,通过数据分析发现地质灾害多维关联模型,从而为隐患排查、预测预警、应急指挥提供决策依据,才是大数据应用。
从多维度,多角度,多层次的繁复数据中形成对现势的洞察,通过分析得出预测性结论,并最终利用它来实现某种职能、产生某种作用,才是大数据方法的价值所在。对于自然资源领域,大数据方法在践行使命和履行职能的过程中不可或缺且无法替代。
讨论并清晰大数据的应用场景,并非否定传统方法的价值,与传统的数据采集、信息化建设相比,两者并非替代关系而是相互依存,但将其一股脑全部划归到大数据的旗帜下,造成的概念混淆对战略目标完成不利。
03
自然资源大数据方法论
Teradata首席分析专家Bill Franks在《驾驭大数据》中表达:没有一种数据叫做“大数据”,“大”和“数据”都不重要,使用数据的方法才重要。
自然资源领域的数据,具有较强的时空特征,是从不同业务维度对地理空间的认知和记录;用地图来表达,用GIS来管理,并支撑各项业务进行,多源异构、时空密集是其典型特征。
由于数据特殊性和业务特殊性,自然资源大数据在技术上无法套用和照搬相对成熟的商业领域的成功实践,但在思路和架构上可以借鉴。
阿里巴巴的大数据应用,强调“大中台,小前台”战略,将搜索事业部、共享业务平台、数据技术及产品部划分到“数据中台”部门。“数据后台”就是指阿里系各个业务系统(如淘宝、支付宝等);数据中台把各个业务产生的数据进行一致化处理后,形成“大数据资产层”;“数据前台”是指数据分析形成的产品,例如服务商家和小二的生意参谋和阿里指数。
大数据专家傅一平博士的论述很精彩:所谓数据中台,即实现数据分层与水平解耦、沉淀公共数据的能力,可分为三层,数据模型、数据服务与数据开发,通过数据建模实现跨域数据整合和知识沉淀,通过数据服务实现对于数据的封装和开放,通过数据开发工具满足个性化数据和应用的需要。
自然资源的大数据应用框架,可将独立运行的国土、海洋、林业、地矿等各个业务系统看作“数据后台”,将规划、预测、评估等决策类应用看作“前台产品”,关键要构建一个强大的“数据中台”。
数据中台的核心是 “数据模型”,只有统一的数据模型,才能整合多源数据形成“数据资产”,并通过多维数据分析形成“数据产品”。
在互联网商业体系中,数据模型围绕“消费者和商品”两类对象来构建;而自然资源大数据体系中,核心业务对象是时空;面向时空构建统一数据模型,才是“时空大数据”的基础和核心。
与电商场景的消费者和商品不同,时间和空间天然是连续的、不可分割的整体,借助时空网格将时空离散化和结构化,才能形成统一数据模型。网格不是一个新概念,其涵义丰富且应用广泛,且会引起很多混淆。行政区划、城市网格化管理、河长制、标准图幅都是地理网格,问题是各种网格互不兼容,必须定义统一的、与应用无关的基础网格体系,才能实现在共同基础上的多维数据汇聚和交融。自然资源部科技发展司苗前军副司长近期表示:地理网格是自然资源大数据最不可或缺的核心支撑,有关部门正在制定相关标准,将于近期出台。
自然资源大数据应用体系,由于数据特殊性,既无法直接采用商业大数据的经典范式和现成工具,也不可能在传统GIS架构上通过改良实现,必须从“统一数据模型”设计为起点,构建强大的数据中台,并逐渐发展出一套全新的技术体系。
时空大数据技术和方法在自然资源部的战略发展中,具有不可替代的核心作用,在大数据战略的规划和实施过程中,既要参考互联网领域的成熟经验和技术架构,又要立足自然资源体系的数据特殊性和业务特殊性;只有厘清大数据的意义和内涵,着力发展相关技术体系,才能在国土空间统一规划、开发利用、生态修复等业务场景中,做到“数据会说话,好的数据会唱歌”。
深入阅读|点击图片或标题
⊙国家发改委下文:鼓励外商投资地理信息、商业航天、自动驾驶等领域
⊙专栏 | 徐颖谈《流浪地球》:科幻是在科学逻辑下的合理想象