如何快速搞懂数字孪生的本质? by 傅一平
在信息领域,一个概念有多种解释已是司空见惯的事情。不过大多概念虽然在开始出现时含义模糊,定义不明,但经过一段时间讨论和沉淀之后,会逐渐形成一致的看法,比如云计算。而数字孪生(DT)很有意思,它一开始的时候,含义还比较明确,但随着研究的深入,定义和内涵却越来越模糊。
另外,很多概念,虽然有多种不同的定义和解释,但大致的区别都在于要么看问题的角度和侧重点不同,要么解释的详细程度不同,要么文字表述方式不同,而概念本身所指向的事物主体却是确定的。像数字孪生(DT)这样,不同的定义指向不同的主体,却不多见。
今天再来谈谈数字孪生,希望把它通俗化的解释清楚,一定要看完。
百度这么定义数字孪生:
数字孪生是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。数字孪生是一种超越现实的概念,可以被视为一个或多个重要的、彼此依赖的装备系统的数字映射系统。
这个定义把数字孪生当成了仿真过程。
工信部标准化院这么定义数字孪生:
数字孪生是以数字化方式创建物理实体的虚拟实体,借助历史数据、实时数据、以及算法模型等,模拟、验证、预测、控制物理实体全生命周期过程的技术手段。
这个定义把数字孪生看成是虚拟实体,并讲了这个虚拟实体能干点什么。
从今年开始接触数字孪生这个概念直到写这篇文章之前,我已经被数字孪生这个概念搞凌乱了,如果你是一个较真的人,那估计跟我的感觉也差不多,而要搞清楚一个概念的本质,还是要回到原点,看看它是怎么出现和发展的。
DT一词,业界一般认为,是由密西根大学MichaelGrieves教授于2002年针对产品全生命周期管理(PLM)提出的一个概念,当初并不叫Digital Twin,而是叫镜像空间模型 (Mirrored Space Model, MSM),后来NASA的John Vickers将其命名为Digital Twin。其模型的属性是很清楚的,尽管当时没有引起太多关注,却也没有什么歧义。
DT就是一个数字化的模型。
但随着NASA将其引入《NASA空间技术路线图》,DT的含义发生了重要的变化。NASA给出的解释是这样的:DT是充分利用物理模型、传感器更新、运行历史等数据,集成多学科、多物理量、多尺度、多概率的仿真过程,在虚拟空间中完成映射,从而反映相对应的实体装备的全生命周期过程。
DT的主体变成了仿真。
还是这个报告,又很明确地指出,NASA的Digital Twin就是“基于仿真的系统工程”(Simulation-Based Systems Engineering)。
DT的主体又变成了系统工程。
为了方便理解,下图示意了跟数字孪生相关的各个部分及其关系:
DT译为数字孪生,也就意味着,默认了DT是指模型这一事实,并且不包含物理系统。因为孪生指的是双胞胎中的一个,显然不包含所对应的物理系统本身。
仿真是模型的应用,是动作,显然跟物理对象无法形成孪生的对等概念,因此,比较严谨的DT的定义应该就是指模型。
我比较喜欢北京航空航天大学张霖教授的定义:
数字孪生是物理对象的数字模型,该模型可以通过接收来自物理对象的数据而实时演化,从而与物理对象在全生命周期保持一致。基于数字孪生可进行分析、预测、诊断、训练等(即仿真),并将仿真结果反馈给物理对象,从而帮助对物理对象进行优化和决策。
物理对象、数字孪生以及基于数字孪生的仿真及反馈一起构成一个信息物理系统 (cyberphysical systems)。面向数字孪生全生命周期(构建、演化、评估、管理、使用)的技术称为数字孪生技术(DigitalTwin Technology)。
但有了准确的定义并不代表你就理解它,人们对概念的困惑往往源于“见树木不见森林”,每个词都明白,放在一起就糊涂了。人们会问:没有数字孪生也可以做模型,它有什么特殊性?没有数字孪生也可以做预测(即仿真)啊?为什么数字孪生要提全生命周期?
还有个更严重的问题是:对学术界来说,原理清楚就清楚了;但对企业界来说,则需要把创造价值的逻辑讲清楚。讲不清楚价值,讲不清楚场景和案例,就是没有道理,因为企业界是需要真金白银投入进去的。
首先,数字孪生跟仿真有什么区别?
仿真是将包含了确定性规律和完整机理的模型转化成软件的方式来模拟物理世界的一种技术。只要模型正确,并拥有了完整的输入信息和环境数据,就基本能够正确地反映物理世界的特性和参数。如果说建模是将我们对物理世界或问题理解的模型化,那么仿真就是验证和确认理解的正确性。
仿真的基础是模型,既然数字孪生等于模型,那数字孪生就是仿真的前提,你只有通过模型(即数字孪生)精确的刻画出物理实体,也即对物理实体的准确抽象,仿真才能逼真的模拟物理世界,下图是一个仿真示意,但这个仿真的基础全是数据模型。
制造业的模型大多是指物理建模或几何建模,其仿真跟建模一般是两个独立的过程,仿真是验证你的模型跟某个物理对象的运作机理是否符合,我们所在的信息技术行业一般只提建模,不提仿真,但其实我们也有仿真,只是我们把它叫作模型验证,比如你会输入各种数据和条件,然后验证模型输出是否合理。
只是制造业在仿真出现不合理的结果时,更多怀疑的是输入数据的问题,模型设置的问题等等,很少去怀疑模型本身的准确性,我想大概的原因是因为物理模型、几何模型大多时候是正确的吧,至少比纯粹的相关关系来得靠谱。
比如你发射卫星依据的是牛顿的三大定律,你在做仿真的时候如果出现了问题,首先怀疑的应该是发射的各种输入参数是否出现了问题,仿真的环境是否不符合模型的约束等等,而不是怀疑牛顿三大定律出现了问题,因为物理模型是有因果律保证的。
而信息行业的建模验证一旦发现不符合预期的结果,首先怀疑的往往是模型本身,因为行为建模更多依赖的是运行数据和选择的算法,而这些数据和算法出现问题的可能性很大,比如出现过拟合、欠拟合等问题。
其次,数字孪生跟传统的建模有什么区别?
关于这个问题我以前非常纠结,觉得数字孪生就是忽悠的代名词,因为对于我所处的信息行业来讲,基于数据来进行机器学习建模是太平常的事情。
但信息行业的机器学习建模理念限制了自己对其他行业传统建模的理解,其实传统行业如制造业的建模,大多不是什么数据驱动,也少有提相关关系的。
那么,什么是建模?
建模是为了理解事物而对事物做出的一种抽象,是对事物的一种无歧义的书面描述。建立系统模型的过程,又称模型化。建模是研究系统的重要手段和前提。凡是用模型描述系统的因果关系或相互关系的过程都属于建模。
建模其实可以分为四种类型,分别是几何建模、物理建模、行为建模和规则建模。
传统制造业的建模侧重于几何和物理模型的构建,更多的依赖物理机理和因果关系,几何建模、物理建模对于信息行业的IT来讲是陌生的,因此大家不免会产生很多困惑,画个3D图形也叫建模?这不是可视化吗?
但它难道不是一种对事物的抽象吗?
信息技术行业的数据从业者,分析对象往往以人为核心,传统行业比如制造业,其研究的对象更多的是物,而对人建模和对物建模是有很多不同的。
为了逼真制造某个物体,我们需要先建个3D模型,这需要几何建模;为了让物体产生某个动作,我们需要研究运动机理,这需要物理建模;基于这些物体运动产生的各种数据,我们能发现一些规律,这些规律可以指导去优化物体本身,这叫物体的行为建模。
比如研究飞机发动机的运维数据从而给出优化建议,注意,这就是在制造领域被拿来当作数字孪生的经典案例,本质其实不过如此。
对人建模就完全不同了,人不是机器,建个人的3D模型在物理上没价值,更不可能对人进行物理建模,因为太难了,也许只有等把基因搞清楚了后,人就可以像物体那样被研究和驱动了吧。
研究人现在属于社会科学的范畴,互联网公司对人建模的目的主要是为了商业利益,其主要基于人的行为数据进行建模,用以发现人活动的规律,从而优化商业策略。
人和物不同,导致两者采用的建模类型大相径庭。
大数据时代到来后,基于动态实时的数据进行建模在信息技术这个行业发展很快,数据业务化、业务数据化是这个行业喊出的口号,但对于那些更传统的行业,比如制造业,这还是很新鲜的事情吧。
究其根本,业务的不同,技术发展阶段的不同,造成了这种认知差异,从这个角度来讲,我们这些专搞数据的对数字孪生嗤之以鼻倒是可以理解。
但是,信息行业数据建模所采用的数据管理手段、机器建模方法和相关基础设施,一旦与传统制造业相结合,将具有广阔的应用前景,现在产业互联网喧嚣至上,数字孪生成为热点不是巧合。
有了前面的背景,再让我们回到数字孪生的定义本身,你会发现数字孪生更多的是相对于以前工业制造业的建模来说的,两者之间还是有很大的区别的,虽然这些区别在信息技术行业来讲已经不是新鲜事了:
1、全生命周期的数据:一般的的模型是为了特定目的而建立的。这意味着,模型往往并不包含与特定目标无关的属性。但人们建立数字孪生的目的往往有很多个,甚至可能包含不确定、开放性的目标。数字孪生中的数据,往往是把生命周期过程中产生的数据全部收集起来,这样,人们需要这些数据的时候,用起来就方便了。
你会觉得,这种无目的性的数据搜集不就是数据仓库干的事情吗?的确是这样,当然由于数字孪生分析的对象始终是某个物理对象,因此相对于数据仓库的跨越数据整合,其更强调针对这个物理对象全生命周期的数据采集,横跨这个物理对象的需求、设计、开发、安装、调试、投运、运维等各个阶段,重点是跨越时间段。
2、动态实时的数据:以前工业建模更多是几何建模,物理建模,一般采集离线静态的数据就可以了,数字孪生会有更多的基于行为的建模,数字孪生模型具有高保真、高可靠、高精度的特征,进而能真实刻画物理世界,就必需具备动态实时的数据采集能力,从而与物理对象在全生命周期保持一致,这就好比飞机发动机的数字孪生,如果不能实时的采集飞行状态的数据,就无法实时给出优化建议,这样数字孪生的价值就大打折扣了。
3、模型的实时演化:有别于传统模型,数字孪生模型还强调虚实之间的交互,即数字孪生模型能生成一定的策略,对物理对象进行控制,并对物理世界的作用结果以数据的形式反馈回来,从而进一步优化模型,实现模型的实时更新与动态演化,也就是持续改进。
要达成以上数字孪生的目标,工业制造就需要引入更先进的传感器技术,从而能全面而实时的采集所需的数据;需要搭建更先进的物联网,从而为孪生数据的实时、可靠、高效传输提供帮助;需要打造更先进的数据管理体系,从而能高效的汇聚和整合数据;还需要引入更先进的机器学习和AI算法,从而提升模型的智能化水平,不要仅限于传统的物理、几何或规则建模。
我发现,以前的制造业的建模由于研究对象更多是物理实体的原因,具有极为鲜明的行业特点,无论是物理、几何建模还是仿真,围绕这些特征形成了自身独特的技术体系。
比如在建模领域,更多指VR/AR/3D/CAD软件,在仿真领域,更多指CAE/BIM等软件,并由此涌现出了一大批国内外厂商。
而信息技术行业以大数据为核心的建模方法论代表了未来的趋势,在数字化这个时代,你会发现两者最终还是殊途同归,数字孪生是集中的一个爆发点。
再次,既然数字孪生就是模型,为什么要热炒这个概念?
就好比数据中台在国内被热炒一样,乱花渐欲迷人眼,数字孪生在国内似乎也碰到了同样的问题,入局者大都从自身的利益角度出发,来诠释对数字孪生的理解,除了本文提到的模型的角度,还有其他各类维度。
(1)数据维度:有一种观点认为数字孪生是数据/大数据,这些认识侧重了数字孪生在产品全生命周期数据管理、数据分析与挖掘、数据集成与融合等方面的价值。数据是数字孪生的核心驱动力,数字孪生数据不仅包括贯穿产品全生命周期的全要素/全流程/全业务的相关数据,还强调数据的融合,如信息物理虚实融合、多源异构融合等。此外,数字孪生在数据维度还应具备实时动态更新、实时交互、及时响应等特征。
(2)连接维度 :一类观点认为数字孪生是物联网平台或工业互联网平台,这些观点侧重从物理世界到虚拟世界的感知接入、可靠传输、智能服务。从满足信息物理全面连接映射与实时交互的角度和需求出发,理想的数字孪生不仅要支持跨接口、跨协议、跨平台的互联互通,还强调数字孪生不同维度(物理实体、虚拟实体、孪生数据、服务/应用)间的双向连接、双向交互、双向驱动,且强调实时性,从而形成信息物理闭环系统。
(3)服务/功能维度 :一类观点认为数字孪生是仿真,是虚拟验证,或是可视化,这类认识主要是从功能需求的角度,对数字孪生可支持的部分功能/服务进行了解读。目前,数字孪生已在不同行业不同领域得到应用,基于模型和数据双驱动,数字孪生不仅在仿真、虚拟验证和可视化等方面体现其应用价值,还可针对不同的对象和需求,在产品设计、运行监测、能耗优化、智能管控、故障预测与诊断、设备健康管理、循环与再利用等方面提供相应的功能与服务。由此可见,数字孪生的服务/功能呈现多元化。
(4)物理维度 :一类观点认为物理实体对象是数字孪生的重要组成部分,数字孪生的模型、数据、功能/服务与物理实体对象是密不可分的。数字孪生模型因物理实体对象而异、数据因物理实体特征而异、功能/服务因物理实体需求而异。此外,信息物理交互是数字孪生区别于其他概念的重要特征之一,若数字孪生概念范畴不包括物理实体,则交互缺乏对象。
很多人也意识到,也许不需要去纠结数字孪生这个定义本身,因为无论是定义成模型,仿真,连接还是数据,都无法单独创造价值,站在企业应用的角度看,理解数字孪生的生态更为重要,《数字孪生体白皮书2019》就自定义了数字孪生体这个概念,指出数字孪生跟物理实体、虚拟模型、数据、连接、服务都密切相关,如下图所示:
在《数字孪生应用白皮书2020》中,也指出数字孪生生态系统由基础支撑层、数据互动层、模型构建与仿真分析层、共性应用层和行业应用层组成,从这张图你也许看不出数字孪生到底是什么,只知道围绕数字孪生要干很多很多事情。
但无论概念诠释的如何高大上,架构图画得多么完美,在数字孪生领域领先的美国,却很少去炒作这个DT概念。
作为数字孪生中最核心的技术建模和仿真,在六十年前就诞生在了美国,也在美国的发展中发挥出了巨大的价值,比如曼哈顿计划中复现核链式反应过程的仿真。
当前制造领域的建模和仿真软件,也基本为国外所垄断,下图展示了数字孪生的产业图谱:
这让我想起20年前在大学做数字信号处理的时候采用的电子设计仿真软件Cadence,有次听导师说起,Cadence软件太贵了,只买了部分,不知道现在局面有没有改观。
的确,在云计算和大数据等领域,我们现在的很多大型互联网公司实现了进步并且有所超越,这也是这些公司在数字孪生领域跃跃欲试的原因吧,但数字孪生的第一代,即制造业传统的物理建模、几何建模、规则建模及相关仿真技术,我们落后的不止是一点半点,伴随着数字孪生热度的提升,真正热卖的也许还是老外企业的那些产品吧。
即使是在信息技术这个行业,建模最有价值的部分,其实还是数据采集和处理的能力、跟业务强相关的规则建模这种看似传统的东西,而不是现在高大上的机器学习和人工智能,相信在数字孪生领域也一样。
想到这里,我心一紧,以前还以为数字孪生是个全新的东西,没想到刚起步,就落后别人半截,靠数据驱动的概念能弯道超车?
最后,我找了两个看得懂的,讲人话的数字孪生的应用案例,方便你进一步理解,也可以思考下实现这些数字孪生的难度,从而对制造业的建模和仿真保持敬畏之心。
第一个是关于数字孪生用于产品研发的:
搭载两名宇航员的SpaceX猎鹰九号(Falcon 9)运载火箭成功升空,并在海上回收一级火箭。SpaceX快速崛起的背后,也必须从数字样机说起。三维模型最重要的是机械结构,包括静力、动力、强度、疲劳等性能,以前这些性能是要靠实验来检测的,现在利用三维数字化模型进行虚拟实验。
猎鹰九号成功的核心就是用三维数字化建模的方法注入材料数据,然后通过大量的仿真分析软件,用计算、仿真、分析或者叫虚拟实验的方法来指导、简化、减少甚至取消物理实验,这就是智能制造的高层次的问题。
火箭发射出去后扔掉的捆绑火箭,靠爆炸螺栓和主火箭连接,到一定高度后引爆螺栓爆炸释放卫星。贵重的金属结构爆炸不能回收使用。马斯克想用机械结构的强力弹簧弹射分离,回收火箭。历史上美、苏都做过大量相关实验,但受限于早期计算机能力、软件、材料,都没有成功,但产生了大量的实验数据。
马斯克弹射分离实验用了NASA大量的公开数据,在计算机上做建模仿真分析强力弹簧的弹射、弹射螺栓,没有做一次物理实验,最后弹射螺栓分离成功,火箭外壳的回收大幅度降低了发射的价格。
第二个是关于数字孪生用于设备运维的:
GE 的数字孪生将航空发动机实时传感器数据(如温度、振动、碰撞、载荷等)与性能模型结合,随运行环境变化和物理发动机性能的衰减,构建出自适应模型,精准监测航空发动机的部件和整机性能,并结合历史数据和性能模型,进行故障诊断和性能预测,以便在预定停机时间内更换磨损部件,避免意外停机。
潮水退去,才知道谁在裸泳。
更多的数字孪生应用案例可以参考中国电子技术标准化研究院的《数字孪生应用白皮书2020版》,自己也下载了几篇数字孪生的论文来读,关注本公众号并回复“DT2020”可获得下载地址。
希望我的解读于你有所帮助。
参考文献:
[1] 中国电子技术标准化研究院 《数字孪生应用白皮书2020版》
[2] 安世亚太科技股份有限公司《数字孪生体白皮书2019》
[3] 系统仿真学报 关于数字孪生的冷思考及其背后的建模和仿真技术 (clii.com.cn)
[4] 北京航空航天大学 数字孪生十问:分析与思考_人工智能学家-CSDN博客
点击左下角“阅读原文”查看更多精彩文章,公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号置顶!