查看原文
其他

数字化转型:工业企业的应用实践

技术琐话 2022-07-13

The following article is from DevOps社区Meetup Author 姚炳雄



本文内容选自2021中国DevOps社区峰会 · 大连站,姚炳雄老师分享的《数据驱动的模型工厂在工业企业的应用实践》文字实录。




以下是演讲文字实录:

今天来到这个会上很感慨,也非常感谢DevOps社区给我这个机会,我是做DevOps出身的,现在很多年没讲过DevOps了。

我们现在是在一个船舶企业,主要服务于航运,这个相对来讲不知道大家的制造业都是什么行业,前面两位都是讲汽车,汽车是相对比较高端的,船是傻大笨粗的。

来之前说讲制造业,我想了想,因为我现在服务于船舶制造、航运,同时,还有一部分钢铁、烟草客户。这些企业负责人,无论IT负责人,还是企业的CEO,都问我这样的问题,什么是信息化,什么是数字化?二者有啥区别?业界关于此的大咖论坛也很多。不知道在座嘉宾你们的CEO、CTO问过你们这个问题没有。我个人理解,信息化是通过IT的手段为管理流程服务。提到信息化的时候,通常是先把业务流程梳理清楚,业务流程需要用什么应用系统去支撑它,这些应用系统该如何规划,哪些数据是要持久化,任何构建主数据……,同时,国家也在谈数字化,什么是数字化呢?感觉上它也是用二进制的数据手段啊,那数字化转型是什么概念呢?我的理解是,以前信息化是用信息的手段在支撑业务管理流程,业务管理流程持续沉淀了这么多年,信息化已经帮我采集沉淀了大量的数据,而这些数据已经变成了企业,尤其是制造企业的宝贵财富,但是其实我们在叫数据为财富之前,要打个引号,当它的存在不被利用,其实是一个埋有金银的大垃圾堆,真正能挖掘转换,创造出价值来,才会变成我们所叫的数据资产。但是如何把它挖掘出来,如何在原来应用系统的基础上去做数据的挖掘转换,让这些数据能够思考,并且能够驱动业务,形成新的增长点,这个我认为是一个数字化转型的过程。

我们说数字化转型和原来的信息化,其实是两个阶段不同的维度和方向,所以我今天的题目,我们公司现在做的尝试就是数据驱动的模型工厂在工业企业的实践,我们瞄准了这个方向,希望在沉淀了大量的数据的基础上去做数字化转型。怎么做,我们做了一个探索,基于这个基础,我来跟大家做一些分享。


工业企业面临压力和挑战



今天虽说是制造业专场,在这里其实大部分应该是更大范畴的工业企业,先来说说工业企业的挑战,一句话,现在工业都很难,为什么呢?第一是中美对抗的影响。以前大家听到的一个词叫全球化,后来发现全球化好像变了,以美国为首的制造业在回归,是不是不搞全球化了,不是,其实全球化的大趋势并没有改,但现在是去中国之后的全球化。单独把中国划出去后,再搞全球化,希望借此把中国打压下去。另外,中国作为制造业大国,一直不是制造强国,中国的制造业从大量低端制造出发,包括了汽车和大飞机,感觉挺高大上的,但核心部件都依赖国外供应商。因此,制造业结构化供给侧改革,其实涉及到一个由大变强,如何逐渐摸到更高端的那些段位去的过程。一句话,制造业真的很难,也很穷,包括我们做一些应用系统,规模不小,金额确都很小,也许船舶这块就是特别穷一点。


通过CPS,基于数据,发现新的价值空间



另外制造业其实又很实在,它跟金融、证券、保险比较起来,制造业每一个应用,都必须要回答,是降本还是增效,降多少,增多少,必须要说清楚,我也非常喜欢这种实在的。

我从业更多时间是在金融等务虚的领域做信息化,到制造业最大的感受是大家都很务实,投资一分钱,能收回多少回报,这是必须回答的入门问题,否则进不来门。而做数字化转型,需要先介绍它背后依赖的理论:CPS。最近有个特别热的概念叫数字孪生,就是在虚拟世界中,构建一个或多个和物理世界对应的孪生体模型,来模拟物理世界,而把物理世界和虚拟世界联通起来,通过虚拟世界的计算,指导物理世界,通过物理世界的实际运行产生的数据,提供给虚拟世界继续学习,并获得精进,这样形成一个体系,我们就把它叫做CPS,这是我们背后的理论。

我们说CPS有一个阶段性演进过程,从工控开始,然后是DCS采集设备工况数据,建立MES,再将MES和ERP连接起来,最后进入到物理空间赛博空间的连接互通,并相互作用,持续演进。这是制造业基于数字化转型的新架构。


关键技术



在这里关键的技术,第一是物联网感知,因为物联网感知涉及数据的采集,我们说物联网感知采集的是大数据,我们多年的MIS系统也沉淀下来数据,那是小数据,大数据、小数据结合起来。

大数据底层用云平台支撑,再上面是数据分析和认知技术,在这个里面很有意思,我们逐渐的探索到,已经在这个体系里已经从软件工程走到了数据工程和数据科学,我们今天来讲DevOps,DevOps是软件工程,最开始的从瀑布式的软件开发到迭代,到敏捷,然后到今天用DevOps把开发运维统一起来,这个其实一直讲的是软件工程如何高效的交付软件,接下来走向新的时代,是要把软件工程加上数据工程,数据工程里所涉及到领域、过程和软件工程完全不一样,虽然中间有很多地方是可参考的,但是差别非常大,所以在这里更多的去讲到的可能是跟数据工程相关的。

传统软件工程中,对大数据领域的应用,通常是BI和ETL,ETL做数据转换,BI做呈现。现在这两块已经独立演进了,叫数据工程,数据工程里其实含两块,一块是数据科学,一块是数据工程。围绕着数据工程,包括数据源、数据存储、数据管道,数据的集成平台,数据平台,数据的存储以及ETL流程,数据的安全,数据的隐私保护,以及数据了治理和合规,等等。所有的这些领域其实都是数据工程相关的一些领域要去解决的问题,软件工程的一些实践可以加速数据工程的成熟,但毕竟是两回事。


以数据为核心的数据系统建设的核心要素



在国内提数据工程比较少,在清华、北大等几个领先的高校里开了数据工程和数据科学这样的课程,但是在国外高校其实数据工程已经非常普及了,相对也成熟些,包括IBM、AWS、微软,几个大的巨头,都在往这个方向引领整个数据工程的发展。

整个数据工程的核心,从这个示意图里可以看到,首先底层的是基于硬件网络存储,在这个上面有数据工具平台,包括客户、员工、合作伙伴,所有的工具平台,数据工程涉及到从数据源到数据结果,整个采集转换过程,包括数据采集、处理、存储、安全,大量的ETL工具体系,编程语言,再上面是数据科学,数据科学主要在大数据算法上面,这里结合业务和底下的数据,来去做数理建模,机理建模,通过算法建立产品。数据产品经理其实跟传统的产品经理很类似,我们也可以看到,数据类的产品和纯软件交付的产品,其实也是有一些差异的,最上面是终端用户,这是它整个大的框,右边是一些数据治理相关的维度。


航运业工业大数据案例



接下来想跟大家分享一下在航运企业里做的一个案例,这是我公司的一个产品。船舶和航运和所有的大工业企业一样,大而不强。从最近十年来看,中国的船舶制造业总吨位量已经超过了韩国、日本、美国,我们下饺子似的制造了很多船,但是这里面有一个特别可惜的地方,我们虽然造的船多,造的吨位大,船舶制造是离散型制造,所有的零部件都是买来的,组装的,而这里面核心设备,大部分却都是国外的,比如说发动机。另外还有高端船型,例如LNG船要高压、制冷、恒温、恒湿,我们能造,但量少,价格没竞争力。航运市场是完全国际化的竞争,例如,从澳洲运矿砂到中国,中国船可以运,美国的船也可以,谁报价低就是谁。因为竞争激烈,加上技术和管理跟不上,所以中国的船企往往竞争不过国外船东。为了改变这个状况,我们就买些好的、贵的发动机,买特别贵的高强度的螺旋桨,通过这些提升船舶性能,但最终的经济效益并没有那么好。

买船的目的是为了用船,航运和其他交通运输一样,只要你把货品从发货点送到目的地,跟你用多高端的发动机没关系,慢慢的,中国造船企业也从买好船走向了用好船,不一味地追求高端设备,而是去做好航运服务,从交付一个装备,到交付一个运输能力,从给你一个产品,到产品加服务的方式,来帮你更多的节油,更精准高效的把货物运达,这是瞄准的细分市场。

对于航运企业来讲,看重的是什么?一条大吨位的海船,例如30万吨的VLCC,其航运成本70%都是油耗,一天的油耗在40吨左右。于是我们把关注点放到油耗上。推出了SOMS船舶能效管理系统,可以帮船东节约5%的燃油,带来每年约450万元以上的成本。

原理是什么呢?首先在船上我们要有很多传感器。把所有的数据采集上来,通过海事卫星上到云上,再转到私有云,在私有云开始做运算,运算完了以后,再反过来把计算结果形成指令返回给这些船,让船长按照计算出来的要求去驾驶,以达到节油的效果,这是整个流程。这个原理有一点像我们老司机开车和新司机开车,老司机开车能省油,为什么呢?因为老司机能根据路况,灵活调整速度,以节油,船可以利用天气,海况中的风、浪、涌、流对船的影响很大,利用这些天气状况以及船自己的满载、空载,以及我需要到达的日期,可以精准的给船舶设定一个螺旋桨的转数,让它的按照自己最节油的方式去运行。这里包括机理模型,还有数理模型。


岸海联动的数据采集



天气的数据来自于天气公司。船的数据采集过来后,入数据仓库,存在ODS层,清洗后装载进DW层,分析后入DM层,这些都属于数据中台,包括数据标准,原数据的标准,整个弄完以后归到数据资产里,整体是完全依赖于数据中台做的。

整个数据链路,从整个船的设计建造、交船,到营运,动态和静态很多,这个船本身的流线型的设计,也会影响到这个船本身。所以基于这些数据来一个一个的采集到,有些是静态的,是船出生带来的,有些是运营过程中带来的,有些是天气、海况以及航线,这些所有的综合因素加到一起,这是整个对于数据链路的梳理,建立实体关系图。

接下来是对它构建整个数据工程,数据工程是对整个数据的处理过程,首先从整个数据采集到,多数据源采集过来,然后同步到指定地方去校验,然后开始通过数据算法来使用它。从数据的源捕获,到最后整理归纳放到可被分析算法调用的库中,是我们说的数据工程的过程。

接下来有了这个数据以后,如何做分析,这个上面其实就涉及到一个建模,这个建模有两个类型,一个建模是在维度的建模,传统的数据仓库的建模,那是对数据分析和整理的其中一步,在ETL过程中通过转换,把它装载到已有的维度的,已经规划的维度的表里面去,接下来在上层的话,要建一些机理模型了数理模型,这是第二层建模,要结合业务,然后找到我用什么样的算法,然后同时来对这个算法做机器学习的训练,训练完了以后应用。

每条船会有自己的油耗模型,完成模型训练后开始服务,模型都需要版本化,包括版本、质量,如何部署。当训练完模型,实时数据上来,模型开始自动工作,这样形成完整的模型工厂。基于这个模型工厂,结合刚才的数据工程,就能把数据工程加数据科学完整的结合在一起,提供数字化转型的平台。

大家可以看到,前面分析的数据,是一个全域的数据,不仅仅服务于这一个应用,整个后面的模型工厂,这个模型工厂里面,在很多个应用上都可以复用这些数据,所以会发现当数据不断的入湖,不断的整理归纳,不断用数据工程的过程来整理,同时模型工厂不断的基于业务需求分解,来去做各种各样的应用,这就是我们所说的数字化转型和信息化过程的差异,慢慢的会逐渐的走入了数字化的时代,走入到数字化新的领域了,新的领域里不存在孤岛,通过数据工程整理以后,模型的应用对底下数据的应用其实是全域的,然后在这里,可以做到非常小的一个功能点,比如说就是船舶的调度,非常大的功能,例如航程经济性分析,一个航程的经济性分析,都可以基于现有的数据,现有的维度,在上面的算法来去做。当你把这两个底打下来以后,剩下的是往上的叠加,这个叠加有明确的指向性,要么降本,要么增效。数字化转型都是业务部门牵头的,信息化是IT部门牵头,到这里可以看到,沉淀了很多数据以后,全是业务部门很着急,我这有一堆数据,你帮理一下,把这个数据挖掘一下有什么新的价值,这个是未来的数字化时代的大的变革,真正的要让数据说话,要让数据产生价值,产生新的动能,新的基建和新的动能在这里。

通过这种船岸联动的模式,能构建整个大的服务体系,在服务体系的闭环中,我们有一直专业的数据服务团队,7*24小时在服务这些船队。

节省燃油本身又带来了一个碳排放的降低,所以其实未来可以挣两笔钱,当我们最终双碳经济真正启动的时候可以挣两笔钱,第一笔是省的油,第二笔是碳交易。

这是在船端的展示,航行所有的船的技术参数以及将来要求它如何驾驶这条船,也是非常简单的信息,就是告诉你,从现在开始到明天什么时候用什么样的航速去走,特别直观的告诉他如何去动,但是背后的非常复杂的计算和经济油耗的节省,留给了IT人员和数据分析人员,他们分析报告,最后拿出一个总的报告出来。

当数据采回来以后,可以延伸出做很多管理,例如船舶健康管理、AI智能航行等。

目前和我们合作的已经有了非常多的船东、船级社,有将近20种船型。

今天的分享就到这里,接下来是提问环节。


Q&A环节



提问1:我先回应一个问题,刚才提到造船并不只有造船是傻大黑粗,降本增效费用是多少,都是很清楚的。最大的感受,我们数字化转型其实是需要价值发现的过程,您也提到了智能化其实是应该有智能的信息创造新的价值,我想再跟您请教一下价值发现,刚才提到了一种途径是业务部门切实的需求,比如燃油费用这块,在项目磨合过程中,IT人员发现的价值和业务人员直接提出的价值是不完全匹配的,因为业务人员提出的只是比较浅表的需求,需要发现数据化机会,这里有什么实践的经验。

姚炳雄:我觉得就是靠经验。其实很多业务部门的人,其实是知道的,他知道有这个诉求,他能把诉求说明白,但是如何达成他是不知道的。因为做燃油优化,我们在单船单航次,固定的航行周期里面,我们给他做了最优,然后他其实接下来提了更深度的问题,他说我这个最优的能不能有一个标杆,我要求用这个标杆适用到所有的船里面去,这里船型不一样,走的航路不一样,天气不一样,这里面涉及到我节省的每一点,我要对比一个标杆值要做修正,要修正到一个标准值里面,能够应用到另外一个场景去,这就是数学模型加机理模型,业务人员他知道,他有这个诉求,但是他完全没办法做到,完全靠数据来做,并且要懂这个机理和数理,三级的风和五级风如何去比,能修正到静风静水吗?从IT视角找问题,是很基础的,可以用数理统计和传统的统计分析方法都可以解决的,提不出来更深的问题,更深的问题还是要依赖业务人员。船舶是个古老的行业,在这个行业里,沉淀的这些业务知识,他的痛其实也痛了几个世纪,他提出来的这些硬骨头,真的要用新的数据的手段去解决,这是我的一点感受。

大数据分析有几个层次,第一个是描述性分析,数据是什么样,我就呈现出什么样,我用各种统计方式描述的是数据的原始的。第二个阶段是做预测性分析,从你的历史,预测出未来。第三个阶段去做认知,去做AI,IT人员通常很简单很容易把描述性分析挖出来,但是做预测,做AI这一块,需求一定是来源于业务,因为IT人员其实并不能那么深度的参与到业务里面去,知道预测出一个什么东西是有多高的业务价值,这个其实不是瞎猜出来的,因为数据是海量的,分析的方法模式也是海量的,汪洋大海,找不到一个灯塔的,所以一定要有这样的灯塔来牵引往那个目标走。

提问2:我个人在船舶行业也待过,节油算主机是吧?

姚炳雄:我们是调了转数,结合从A到B,我们叫固定的航程,必须要某个时间点比较要到那,一旦延迟了这个时间,罚款更狠,背后有经济模型在里面,我调了转数,然后结合海况,找到最精确的油耗的转数。

提问3:所有这些船舶模型都适用吗?

姚炳雄:每一个船都是不一样的,前6个月是要去学习的,需要精准的校准能效模型。因为每一个船的船龄不一样,整个发动机的型号不一样,出厂的参数并不完全可信,所以我要精准的校正这个,满载、空载、近风近水和几级风、几级浪,把所有的这些都跑到就可以校出来。

提问4:我是在制造业里边做经营生产的,既不是研发相关的,也不属于业务部门,而且我们的工作大多是帮助企业做一些改善,减少一些浪费。现在我在做了几年以后也会感觉到传统的做改善,也是很疲惫的,可以说比较LOL,空间不是很大,今天听完你讲的数字化,给我感触比较多,我也想咨询一下,像我们这种做经营改善的部门,既不是业务部门,可以把这些问题提出来,我们也不是研发部门,能去做软件开发,但是我们应该是中间的衔接角色,可以把价值发现和数字化做一个连接,我也是想从个人角度来说,再了解一下跟数字化相关的内容,也在找切入点。

姚炳雄:用数字化帮助你做工艺的改进,我理解要分析所有的工艺过程,工艺环节,提出改进的建议。

提问4:是这样的,我们不是最了解业务的人,我们要跟他们一起做一些改善,我们其实对数字化这块的内容是比较缺乏的。

姚炳雄:我们之前也在一个工厂里做过,但是我理解这部分更多的是信息化的工作。原来也搞过铝加工,全球最大的铝制品加工企业,我们去给他做数字工厂,那个时候做的完全是信息化,把他所有的环节梳理出来,工序流程,划出来卡位多少人,多少时间,耗多少电,耗多少水,把这些采集下来,梳理完了以后,你的过程改进,很大程度上以前是拍脑袋和经验,我知道这个地方有浪费,我就在这个地方加设备改造,但是后续有这样的计划,在它整个的铝加工的环节,有八个环节,设置了50多个点去采集、采样,基于这个数据在哪个地方进行改进,要联合IT和业务部门一起做,那个时候是他们的总工牵头,总工就是做技改的总工牵头,联合业务部门,业务部门肯定是说这个月要多少产量,肯定有这样的指标背在他身上,管设备,管其他的技术的,只负责自己那一摊,所以总工负责牵头,这里面特别需要的是有一个宏观的,在工厂级别来看全局的视图,把整个全厂端到端的业务描绘出来,有了这个咨询,再加上信息化去卡点卡位采集数据,然后才会有后面的。可以看到我刚才讲到的,数据工程是基于信息化工程基础上的,如果卡位卡的不多不够的话,就要去加装,包括船也是,可以把船理解成一个大工厂,远洋船出去以后,那么多人在上面生活娱乐,首先基于你的诉求,你需要哪些数据分解下来以后,卡位不够到那里加传感器也好,补齐IT系统,补完以后再采集完数据再做分析,这个时候就有理有据,告诉他这个地方要改造了。

提问5:刚才说的是价值流分析,我们之前也有做过,从整个工程的角度,把所有这些流程划出来,包括制品,这些节拍什么的都做,做完了之后也发现了很多问题,我在想我们用那个数据,应该算是信息化,基于工厂现有的数据,把这些数据抓出来,对于数字化的话,这个信息还不足以再做下一步的分析,所以要再增加一些传感器,诸如此类的,这部分已经算是数字化的转型了吗?

姚炳雄:不是,要加传感器,继续把信息化过程补齐,这都是属于信息化的,然后接下来把数据拿过来以后,让这个数据去思考,就变成了数字化。我的信息化是为了帮助我去管理整个的流程工艺,把它管好,每个节点,安全也好,包括排班也好,数字化工厂里面,至少要有DCS,有ERP连起来,把整个工序连起来,这是小数据。我的每一个设备,振动、温控,单台设备的耗电量等等,以及制品在这里停留的时间,这个要采集要加很多东西,这个数据的采集属于大数据的采集,大数据加上小数据,有了这个数据了,才会有数字化转型,没有数据的话是转不过去的,只是在小数据上做一些分析,当然它之间没有一个说今天我就是数字化了,明天是信息化,没有这个特别严格的,它逐步过渡的。

我们一直是企业做数字化转型,数字化转型和传统的信息化差异在哪里?其实一个是用手段工具让管理更精细,再精密生产,一种是数据本身采集来了以后,数据会说话,数据会思考。

提问6:让这个数据以什么样的形式实现,我们又实现不了,这个时候需要IT的人员,把诉求告诉他,他帮我们做。

姚炳雄:这块有故障预测,在生产领域里是值得做的,可以在这两个点挖掘一下,我们有成熟的产品。

提问7:刚才吴老师在给汽车制造业哭穷的时候,到底造船更穷还是造车更穷,还是应该造船更穷,造车还可以PPT造车,融资相对容易。

姚炳雄:造车上汽自己可以做主造什么车,然后就批量的,因为大工业时代,批量一定可以降低成本的,船没有,船必须是每条船都是根据某个船东的需求定制的,从零开始设计、绘图,一步一步的,哪怕是姊妹船,一系列买十条这样的船,但是造船也是一条一条的造,一条条设计的,造船的时候是把船切成好几块,每一块去组装,所以做一个小组件,再做大组件,再焊接,配合船坞排期,还要配合工艺过程和已有的资源,因为船坞是非常昂贵的资源,船是有三次设计,一定是正向研发,它是完全依赖于概念设计,生产设计,每一个设计都不一样,一定是从设计到实现的。

主持人:很难通过批量化生产。

姚炳雄:真正的批量生产,生产的船没人要,船的投入太大了,不可能自己掏钱把这个东西生产出来卖,都是某船东有需求再生产。

提问9:刚才听的数据模型工厂,您提到数据的训练,训练之后测试,您是怎么做验证的,怎么能验证您的模型是有效的?

姚炳雄:就是在实船上验证,真的是船在跑,而且在模型训练过程中,其实一直在采集,用它的数据来训练它,牵引学习的过程,原始模型是有的,我们都知道,对于一个数据模型来讲,模型不关键,模型的参变量,调节因子是最关键的,在实船跑的过程中在调。

主持人:您部署的时候,每一条船都不一样。

姚炳雄:每一个船都有一个数字孪生体。

主持人:刚才描述船的数字化包括整个流程和框架,我感觉已经非常牛了,可以把这个船的控制,缩短到非常精细的范围内,甚至可以做到每四小时预测,用传感器收集数据,还有其他任何运营的数据,只要收上来就可以用模型进行预测,来帮它优化,在我看来,这已经到头了,从您的角度来说,数据化船舶(英文)。

姚炳雄:对船来讲这个维度是经济、高效、绿色、环保,这几个维度,现在整个船舶的发展正在往智能船方向演进。智能船一个是少人化,远程控制化和无人化,正在往这个方向发展,有点类似于无人车,但是船和车比较,船更难,因为船是六维的,车是在路上,前后左右,船还有上下。船是在水里,浪来了,更难。而且船没有强制动,车要停就停在这了,船停了以后,船还会随着水动的,所以两条大船在航路上,为什么刚才展示有一个辅助避碰,整个错船的时候,尤其越大的船,越复杂,它要控制无人的话是非常难的。

另外我们说数字化转型的时候,它有了这个数据平台和底座以后,也可以理解现在只是把做菜的砧板、锅碗瓢盆建了,每一个需求下来,对应的要采集额外的数据,对应的要建新的模型,相当于有了平台以后要往上叠加新的应用,这个应用是传统应用任何一个应用拿过来用数据的方式都可以重来一遍,无论是调度的,经营管理的,社会维护的,都可以用数据的思维重来一遍,这是数字化转型魅力所在,巨大的商机,无限的商机。




往期推荐




关注技术锁话,持续提升自己

以分布式设计、架构、体系思想为基础,兼论研发相关的点点滴滴,不限于代码、质量体系和研发管理。本号由坐馆老司机技术团队维护。



您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存