查看原文
其他

教计算机识别地下断裂?比教娃学习难多了!

周油列国工作室 周油列国工作室 2022-06-14
人工智能(AI),近年大火。有人说:
“在工业革命时代,人们通过思考制造机器。在AI时代,人们制造会思考的机器。”

图片来源:网络

机器会思考,世界会变成怎样?或许《黑客帝国》《终结者》《人工智能》这些经典电影的畅想还很遥远,但我们的现实生活已开始被人工智能影响。比如,各类APP会根据你浏览记录的喜好来发推送;比如,Siri、小爱同学、小度小度的“智商”越来越高;再比如,你刚买房子,各类装修的信息已经扑面而来……
在油气领域,已有很多油公司尝试利用人工智能技术来提高勘探开发效率。中国石化西北油田的科研人员也探索利用人工智能技术来识别地下断裂。他们感慨:
 “这事儿太烧脑了,比教娃学习难多了!”
图片来源:格十三


 1.  教计算机识别断裂,就像教小朋友识别动物,要分三步走


中国石化提出打造技术先导型公司。西北油田于2019年底设立首个人工智能项目“顺北1号断裂带南段断溶体地震智能识别及规模断溶体空间描述技术研究(2019)”,联合中国地质大学、石油物探技术研究院开展一体化攻关。
今年初,这个项目通过了西北油田专家组验收,获得一致好评。
西北油田研究人员交流人工智能技术。张 洋 摄
项目组负责人刘军介绍,目前最成熟的人工智能应用,是计算机深度学习下的自然语言处理和图像识别。人工智能项目的关键,是要破解制作标签样本训练样本生产实践应用三道难题。这就像教小朋友识别动物,要经过“制作一套适用的识图卡片、训练小朋友识别动物、小朋友在大自然中能认识动物”三个步骤。
看着简单,做起来真难。
 
2.  制作样本标签,画出所有“动物”的各种形态

从地震剖面中识别出断裂、溶洞或储集体,就像在一幅大森林图片里寻找大象、狐狸、兔子等动物。人工智能技术需要通过学习“识图卡片”,准确记住每种“动物”的样子。
研究人员将这种“画有动物模样的学习卡片”称为样本标签。他们利用各种数据开展地震地质建模和地震物理模拟,然后用模拟结果不断修改完善断裂和溶洞模型数据体,再利用褶积模型和偏移成像方法对人工合成的断裂模型数据体成像,最后将成像结果转化为训练样本,准确“画”出不同地质结构在地震剖面上的样子。
深度学习识别过程
在项目攻关中,研究人员累计“画”出2.7万组实际数据样本集,覆盖了各种地质结构类型。
地质结构类型通常不是以一种形态存在,就像家里养的宠物狗,有时跑、有时跳、有时蹲着,有时只看到一条摇动的尾巴,如何能快速准确判断哪只狗才是自己想找的宠物?
训练数据成为人工智能识别个体的核心。研究人员用地震物理模拟合成的断裂和生产解释过的断层作为训练样本,先生成水平反射层,再做褶积、加入噪声等随机变形。就像对“狗”进行三维动态全景拍照,然后用各种参数和算法,得到“狗”不同角度、不同部位的照片,形成海量的多样性样本,覆盖所有形态和部位特征。识别时,人工智能只需要把记忆中的样子与实体或部分实体进行对比,就能够快速判断“狗”的身份。
目前,在西北油田样本标签数据库中,研究人员已累计合成张扭、压隆型等断裂训练样本25万个,其他样本标签的种类和数量也在不断丰富中。
   
3.  训练识图,让“她”记住每一种“动物”的样子
 
有了足够多的样本标签,如何让人工智能做个“乖宝宝”,深度学习这些内容呢?
所谓深度学习,就是通过组合低层特征,形成更加抽象的高一层表示属性的类别或特征。这类似“盲人摸象”,人工智能根据海量的样本标签,分别识别“大象”的身体、牙、腿、尾巴后,系统自动组合这些特征,判断出识别的主体是“大象”,而不是墙、棍子、柱子或绳子。
研究人员想到了一个“类别”学习的方法。他们发现,断裂、断溶体和断层、溶洞在地震剖面的分布是有规律可循的,就像森林里的野兽基本都有一个脑袋、四条腿、一条尾巴。他们先把不同地质构造类型中的相同值或相似的特征值提炼出来,形成共性知识供人工智能学习,训练他们区别“动物”“植物”“岩石”等实体
研究人员将第一个层面的训练结果传递应用到下一个层面,训练人工智能识别各个类别中每一个体的特征值,进行个体细节区分训练。
根据这一思路,研究人员经过6个月的努力,构建了断裂深度残差网络、断裂U-Net识别、断溶体轮廓识别、溶洞体识别等方法及模型。深度学习网络架构搭建完成后,他们又多次优化相关参数,根据不同内容建立了快节奏学习、慢节奏学习、预习后学习等不同模式,有针对性地增强人工智能的学习效果。

随着样本标签增加,深度学习的识别能力与精准度也同步提升,误差会逐步减小。
那么,样本标签越多越好吗?并不尽然。计算机资源是有限的,深度学习样本标签需要耗费大量的计算机资源,因此要找到样本数量与学习深度之间的最佳平衡点
研究人员利用迁移学习的方法有效解决了这一问题。例如,人工智能在识别水果时,经常会把苹果的样本标签识别成梨。他们就从苹果、梨的特征相似性出发,利用迁移学习的特点,将旧领域学习过的模型应用到新领域,在认识苹果的同时,也认识了梨,而不用单纯教“她”学习梨的样子。这一方法在减少目标网络数据和标签数量的同时,提升了识别的精度和可靠性。
2020年9月,在西北油田首个人工智能项目中,人工智能系统终于学有所成。
   
4.  学以致用,“大动物”识别较好,“小动物”识别有待提升
   
西北油田在顺北1号断裂带南段工区划出200平方千米区域作为项目研究目标靶区,应用人工智能技术进行地震资料识别,目前已在三个方面取得进展。
深度学习溶洞识别模型在顺北1工区识别效果
第一,人工智能提高了识别效率。完成一块200平方千米三维地震资料的断溶体识别与描述,用传统方法要花1~2个月。而运用人工智能技术,只需1周就能完成断溶体的识别和预测,研究人员再用1周就能完成断溶体描述。
第二,人工智能识别精度初见成效。因不受地震数据同相轴能量强弱的影响,人工智能技术能够很好地发现隐藏的实体间的联系,发现肉眼和以往经验不能识别的内容。从实际应用情况看,针对较大断裂和断溶体的识别已初见成效,较大断溶体边界刻画清晰,与实际地震资料吻合度较高,但针对小断裂和小缝洞体需要进一步提高识别精度。也就是说,经过大量训练,“大动物”识别较好,“小动物”识别还有待提升
第三,人工智能训练的模型可保存,可在相似新断裂及断溶体的识别中重复利用,修改相应参数即可深度学习。
断溶体外部形态及内部结构描述结果对比
在顺北1号断裂带南段,研究人员将人工智能识别结果和多口井进行资料比对,发现放空漏失、井漏、油气显示等特征吻合较好。
研究人员说,虽然人工智能在油气领域应用已取得一些成果,但还有很多方法、算法尚未深入研究应用。比如,反向传播、卷积神经网络方法等只是初步应用,还有一些新算法值得探索。人工智能的新方法有利于打破旧模式,新算法也有利于消除旧算法的劣势,应用更多新方法、新算法,必可实现油气勘探开发质量效益跨跃式提升。

文字:王福全 王超

编辑:程强



更多精彩内容 请关注每周一出版的

中国石化报油气周刊

左右滑动查看更多内容



(如需转载、合作,请在后台留言,我们会与您取得联系)

最西边陲站:在帕米尔高原上迎“油”客

中国石化年度科幻大剧——《逮捕二氧化碳》

最美“东方第一站”:和第一缕阳光一起迎客来

旅“油”驿站美女站长:我在青海湖畔等你来

●五龙闹油气

●网红油站“发电” 不用柴油,碳中和一波操作看过来


您可能也对以下帖子感兴趣

熊杰 张晓彤|生成式人工智能的数据风险及其合规治理——以ChatGPT为样例
全球首个亿级地震波大模型正式发布
汪虹宇 黄宣植|“无人机+AI”模式对环境执法监测的影响——以秸秆禁烧领域的应用为例
图灵奖得主杰弗里·辛顿获诺贝尔物理学奖,人工智能将要超越人类了吗?
亿级参数量,“谛听”来了

文章有问题?点此查看未经处理的缓存