油田数据理论研究:从信息技术向数据技术思维转换
油田数据学是一门新兴的关于油田数据的科学,也是研究数据科学与大数据技术的一门学问。“油田数据”本来是指用以地质研究通过测试获得的科学数据,而随着数字油田的建设,IT 技术中广义的数据使得油田数据的概念出现了混淆。为此,我们有责任予以澄清。
▲油田数据学体系(高志亮和高倩,2015)
研究数据理论是研究指导思想。我们在建设数字油田以来,油田数据建设一直沿用信息技术(Information Technology,IT)思想作指导,导致油田数据越建问题越多。今天,我们需要转换一下,研究数据思想,即数据技术(Data Technology,DT)思维。
油田数据的理论研究
数据,有没有理论?截至目前还不能说有,也不能说没有。说有,实在说不出数据的理论是什么。
回顾历史,早在20 世纪初就出现了信息理论。我们所知道的是“信息论之父”香农提出“信源—信道—信宿”,由此奠定了信息论的基本原理与基础,从而使信息技术与科学大发展。
那么,油田数据的理论应该是什么?
在数字油田建设以来,如长庆油田,人们大胆地将数字油田的理念引入到油田原有的监测监控技术之中,形成油田数字化管理体系;然后提出“让数字说话,听数字指挥”,形成油田数字化建设体系,如“三端五系统,三个辅助”等。这就是在数字油田理念指导下形成“让数字说话,听数字指挥”的油田数字化建设思想与方法,由此解决了人们在数字油田建设中的问题,更解决了油田企业生产管理的问题。所以,这个“让数字说话,听数字指挥”就形成了油田数字化管理建设的基本理论观点与方法。当然,也需要进一步研究和探讨它。
目前,我们作数据研究需要数据的理论,需要研究和总结油田数据的方法。我们在研究数据时需要相应的思想作指导,并获得相关的数据理论,以指导数据建设与实践。在美国有一位经济学家,他的爱好就是每天琢磨数据,他可以从大量的数据中提取出隐藏在数据背后的信息。例如,他提出了通过数据研究波尔多(bordeaux)葡萄酒的品质的方案。他以为“酒是一种农产品,每年都会受到气候条件的强烈影响”,于是,采集了法国波尔多地区的气候数据来分析研究。他发现如果收割季节干旱少雨,整个夏季的平均气温较高,该年份就容易出上品葡萄酒,同时当葡萄熟透、汁液高度浓缩时,波尔多葡萄酒是最好的。这样,就形成了葡萄酒的质量思想,于是,就构建了葡萄酒的品质公式:
葡萄酒的品质
=12.145+0.00117×冬天降水量
+0.0614×葡萄生长期平均气温
-0.00386×采收期降水量
如此简单的一个算式,形成了葡萄酒理论;如此简单的一个数字模式,形成了葡萄酒质量计算模型;如此简单的数据发现了一个质量标准。人们只要把任何一个年份的气候数据代入这个算式,就能预测出任意一种葡萄酒的平均品质。所以,法国人能把他们的葡萄酒庄园排成著名的1855 个等级。
在油田也有案例,如确定抽油机井合格率,要考虑抽油机井的平衡度。一般来,抽油机井稳定运行过程中,下冲程时的最大电流与上冲程时最大电流有一个比值,这个比值在80%~100%为合理值,如果小于80%则为欠平衡,大于100%则为超平衡。由此,学者们创造了一个算式:
平衡度=(I 下降峰值 /I 上升峰值)× 100%
当油井采液用电量单耗=W/Q 时(式中,采液用电量单耗为油井采出每吨井液的用电量,单位kW·h/t;W 为油井日耗电,单位kW;Q 为油井日产液量,单位t³/d),就可以根据电流数据计算出抽油机井的平衡度。
从这些算例看,似乎是利用业务需求,解决了一个业务问题,不像是个数据问题,也构不成一个数据的理论。其实,业务从来都离不开数据,数据永远都是业务的灵魂。
今天,我们创建油田数据学,需要寻找油田数据学的基本理论。由于人们现在还存在着对油田数据的偏见,没有将油田数据作为一门科学来对待。我们必须通过油田数据学的建立,让更多的人学习、认识、理解、研究、应用后获得油田数据学的相关理论与方法。如果要说我们对数据的认识与观点,那就是所发现的油田数据的“三大规律”。不过,这些还需进一步研究,就是我们的希望和目的——寻找到油田数据的基本理论与方法。
油田数据技术研究
数据技术,有没有?也需要研究。
对于数据技术,人们经常会用“DT”来表示,DT 估计是源于“IT”的思想。对于IT,百度百科中解释为:管理和处理信息所采用各种技术的总称。更多的解释包括:IT主要是应用计算机科学和通信技术来设计、开发、安装和实施信息系统及应用软件。它也常被称为信息和通信技术(Information and Communications Technology,ICT),主要包括传感技术、计算机与网络技术、通信技术和控制技术等。
由此可以看出,信息技术其实是电子、信息、通信等技术的总和。在现实中,主要是指PC。只要将计算机引入到业务中,就认为是信息技术,只要有PC 参与,很多的配套(如通信、互联网、数据中心等)技术就全都包含进去了。
而数据技术是什么?
当然在这部专著中,数据技术不是主要研究任务,只是我们在此提出问题,更多的是给大家提出思考并希望共同来研究这一问题。数据技术包含哪些技术,数据技术是如何来处理数据,同数据有关的问题与技术有哪些,等等。
不过,我们经常听到“大数据技术”一说,对于大数据是5V,还是6V 等,这只是用来界定什么是大数据,也就是说够不够格称为大数据。但还没有人界定大数据技术包含什么。其实,简单地说,大数据技术就是个人计算机(Personal Computer,PC)+算法+软件工具的技术。
但是,油田大数据研究正在兴起,人们利用油田大数据解决油田科研、生产中遇到的问题,这些正在成为多种课题,如气田生产中遇到的一个难题——柱塞气举问题。柱塞气举是利用地层本身积聚的天然气的能量,将油管内的柱塞及其上面的液段一同向上举升,柱塞在举升气体和被举升液体之间形成一种固体界面,使气体的窜流滑脱和液体回落大大减少。柱塞气举依靠井口控制器指挥薄膜阀实现固定时间开、关井,达到柱塞循环往复举液,是效率较高的排水工艺,而现行的柱塞气举系统存在单一的定时开关井模式,需要人工进行井口调参等问题,这在油气田中气田面积大、积液井数多的现状下,给气井生产管理带来了很大难度。因此,目前油田企业急需一种智能预警调参模式,实现柱塞气举系统的故障预警、自动调参和最优运行,进而提升气井生产管理效率。这一问题利用传统的技术已经无法解决,需要一种先进的技术来解决,而传统的IT也不是最好的办法,这时数据技术该发挥作用了。
因此,数据技术是一种大数据+业务需求+智慧的技术,这些技术组合成为油田数据的DT,即作用在数据上的所有综合技术,就是DT。
当然,我们完全可以肯定的是,未来一定会由DT 来替代IT,或者说在IT 的基础上,实现DT。如果说IT 是使人们在业务中提高工作效率,解决人们大量的人工计算问题的计算机技术的话,DT 就是让数据工作,使业务效率倍增,让职工更幸福的智慧计算。
数据原理研究
数据原理,是数据技术的转化过程。
数据一直在转化过程中生存,如数据从物质或事物中检测或测试中获得时是一种暗数据,即是一种存储在磁盘等介质中的各种信号。人们将信号转化为数字,然后再将数字转化为数据,将数据做各种组合、关联之后,利用计算机技术等,再转化为信息。信息大都来源于各种统计、分析的成果,如地质图件等。
数据的这种,最终的结果是利用数据决策。
数据决策,在我们地质研究中经常提到,如油气藏决策。数据决策是指利用油田数据的科学分析与综合研究,给出一种研究成果,用以帮助科学家决策,从而可以形成一种强大的决策力。
无论是社会还是企业,数据发展终将是一个必须要直面的问题。在不同时期,发展的原动力各不相同。正如现代庞杂的信息化时代中数据的演变过程一样,随着信息技术的高速发展和数据的大发展,预计全球的数据资料存储量到2020 年将达到40ZB,新兴市场的数据份额将提升至62%,物联网嵌入式系统占中国数据总量也将由3%向10%逼近,全球的数据量正以每年58%的速度快速增长。在油田,数据的增长量也在按照一定的比例增长,特别是油田生产运行过程的数据增长的更快。所以,未来数据决策力将主导一切。
可见,从数据到数据的决策力是持续强化数据与数据决策力的过程,而数据决策力可释放数据的能量,从而持续兑现数据的价值,这就是数据的一个基本原理。
在油田企业,油气藏决策是最大、最难的问题,以至于在数字化时代还没有办法解决好这种人工(领导者)决策问题。本书没有设计专门论述油田数据决策力问题的探讨和研究章节,但是,这种思想和技术在很多章节中渗透,更希望学习者能够开展这一研究,这也是我们创新建立油田数据学的一个期盼。
需要说明与强调的是,在数据原理中存在一个重要问题,我们称之为“数据纠缠”。数据“纠缠”,犹如量子力学中的态叠加原理一样,就是数据、业务、部门之间,经常是你中有我,我中有你,始终处于叠态状。我们知道,量子力学的叠加原理,就是在没有测量观察的时候,原子核是处于已经衰变和没有衰变的叠加状态,就是它既可能衰变了又可能没有衰变,它是两种状态的叠加,如同薛定谔的猫。
▲薛定谔的猫(资料来自网络)
上图表达了猫处于死与活的叠加状态。这个问题一提出来,“物理学家们一个个都惊呆了”,原来以为只有微观世界才有这种态叠加,即状态不确定,既处于这个状态,又不处于这个状态。
现在在数据原理中困扰我们的就是油田数据的这种“纠缠”态,即业务、数据与应用系统软件的“纠缠”,就是业务变、部门变、数据变,系统不能变的困境。我们认为,在当前条件下,解决这一问题的唯一办法就是采用云模式。所谓“云模式”,就是将数据“独立”,不要与业务、部门关联太紧密,而是将油田数据全部放在云端。对于应用,也是将专业软件放在云端,这样与专业、部门、数据的关系联系更加宽松,使得数据与部门、业务之间脱去“纠缠”。数据作为独立体,做好数据服务,这估计是最好的办法。由此我们说,数据的原理是由IT 转向DT 的过程,数据原理必须要消除“数据纠缠”的问题,这是数据建设与发展中一个非常重要的问题。
本文摘编自《数字油田在中国:油田数据学》(高志亮等著. 责任编辑:韦沁. 北京:科学出版社,2017.6)一书“第一章 绪论”,标题为编者所加。
(数字油田在中国丛书)
ISBN 978-7-03-053463-7
《数字油田在中国:油田数据学》系统地论述了油田数据学的基本理论与方法,以油田企业科学研究中的油田数据作为研究对象;以油田企业主营业务和油田数字化建设中数据为主线,讨论了各项业务中的数据从哪来,到哪去的问题。目的是教会人们知道油田数据是怎样生产的,数据在各个阶段的状态,并学会用油田数据做事,是大数据时代油田企业工程技术人员重要的参考文献。
关键词 | 气候变化白皮书(2015年) | 第三次气候变化国家评估报告 | 流域水循环 | 中国经济社会 | 水资源 | 冰川 | 极端天气气候事件 | 生物多样性 | 气候变化影响与风险 | 自然地理 | 历史自然地理 | 古地理 | 地貌 | 海洋地理 | 概率时间地理学 | 植物区系与植被地理 | 制度经济地理学 | 经济地理学 | 地貌图集 | 地球生物学 | 地震预测 | 历史水文地理 | 水科学 | 孢粉学 | 板块构造与大陆动力学 | 环境科学Ⅰ、Ⅱ | 地理环境 | 创新集群 | 城市化 | 城市群新论 | GIS | 中国生态环境十年演变与评估 | 气候变化影响与风险 | 塔里木克拉通 | 南黄海盆地 | 洋中脊多金属硫化物成矿 | 可燃冰(中国工程院报告) | 天然气水合物研究进展 | 北京沙尘暴 | 天然气水合物试的环境效应 | 新疆西准噶尔金铜钼成矿作用 | 作物理化参数遥感定量反演 | 海洋科学 | 古脊椎动物学 | 土壤入渗测量 | 华北地貌新论 | 土工袋技术 | 深空行星形貌测绘 | 全球中、新生代大地构造图 | 创新地理学 | 钻冰取火记 | 微体古生物学 | 中国及邻区盆地火成岩油气地质图 | 青海柴达木盆地盐湖 | 黄河近年水沙锐减 | 阶梯式发展论 | 覆盖型岩溶地区岩溶岩土工程 | 地震预报 | 地理设计 | 作物病虫害遥感监测 | 水沙数学模型 | 瞬变电磁法 | 滑坡遥感 | 全球变化遥感产品 | 沉积岩野外工作指南 | 可可西里世界自然遗产 | 三叶虫 | 大陆层控构造学 | 三维连片处理技术 | 道路边坡成土特性 | 陆表定量遥感 | 山地遥感 | 全球生态环境遥感监测 | …
(本文编辑:刘四旦)
地球为你而转!
欢迎关注:赛杰奥(sci_geo)
科学出版社地球科学订阅号