边缘计算或许是一把双刃剑
今天想说的是,边缘计算弄不好也会有风险。
昨天看到一篇文章,说的是某科技公司在某电网公司做了一项科技改进,通过边缘计算和通信技术,在电网输电线路状态检测的前端实现了一些智能,极大的提高了线路巡检的效率。
2019年我们接触了一家专门做声纹技术检测的公司,想把他们成熟的声纹技术扩展到振动声纹,然后用在电力设备的故障检测上,在交流中发现,他们通过在声学传感器前端镶嵌边缘计算的模式,提取声音或者振动的关键声纹特征,并把这些关键声纹特征回传到系统后台,做进一步的分析和判断。
对于30多年前就学习了地球物理勘探中各种测量和检测技术、对时间序列信号极感兴趣的我们来说,简单初步的理解这东西并不困难。
一、传感器端边缘计算的核心价值是什么?
我粗浅的理解,传感器端的边缘计算的核心价值不仅在于通信管道和各种协议、也不仅在于用什么样的嵌入式CPU,而更多的在于对业务的深刻理解,以及从这些深刻理解中总结出来的业务模型,并把业务模型转换成算法,再把算法进行合理的拆分,有些模型算法可以嵌入到传感器前端,形成江湖上所讲的边缘计算。
举一个例子,龙员外最近几年做的基础设施安全监控,也有一些边缘计算,关于桥梁各种安全要素监控比较高深、相当专业的业务模型来自于国内著名的专业设计院,模型的算法转换由专业院和龙员外技术团队共同完成,算法的前端嵌入设计和硬件体系由龙员外的技术团队提供,基于这一成熟的技术架构已经用于国内多座跨江大桥的安全监控,并取得了实质性的验证效果。
(网络借图,感谢摄影者)
如果把龙员外的这套方案做一些改进,就可以用来做输电线路和杆塔(倾斜、沉降和形变)的安全监控,尤其是共通道、共线、转角的那些塔杆,以及抽水蓄能电站坝体和边坡的安全监控。
二、传感器端边缘计算的优势
边缘计算的概念和应用这几年很火,说明有它存在的价值,初步理解,基于前面的叙述,那些模型算法被合理拆分、适用于比较简单、可靠的业务前端判断、以及虽然前端业务逻辑比较复杂,但模型以及由模型转换出来的算法能比较有效的反应客观实际的这些场合,其优势是可以缓解海量数据向后端传输的信道压力,并有效、快速的反应业务问题。另外,由于特征值的提取大大的稀疏了海量的时间域序列信号,使得很多业务,有可能不再需要大型的实时数据库作为数据存储了,这种数据存储在江湖上被称为数据中台。
三、传感器端边缘计算的劣势
我们站在公正的立场看,任何技术其优势和劣势都是辩证的、客观存在的,犹如一把双刃剑,用好了事半功倍,用不好事非所愿,核能是这样、转基因是这样、5G是这样、边缘计算也是如此。就传感器端的边缘计算而言,它的最大劣势,可能就是丢失了埋藏在客观事物所产生的时间序列信号中更多的信息价值了,尤其是当前端边缘计算中的模型和算法存在问题,不能有效反应客观实际时,这个问题也许就更加的严重。
拿我们地球物理领域的地震勘探来说,上世纪80年代就完成了地震仪由模拟仪器向数字化仪器的转型,但是作为接收弹性波振动的传感器(检波器,水面地震勘探叫水听器)依然是模拟信号的,检波器负责将感受到的弹性波振动,由非常精密的压电传感器(或者电磁线圈)转换成波动的时间序列的电信号,一个探勘排列有多道检波器(通常是2的N次方,如24道、48道、96道等),随可控震源车(早期是打孔放炮)同向移动,完成一条测线的探勘任务。多条测线则组成一个工区。
可控震源(连续激发弹性波)、一个排列的逐步移动等形成海量的地震勘探时间域信号,这些信号从检波器传输到地震仪汽车后,先经过模拟放大器、模拟滤波器进行预处理,然后由A/D转换成补码的浮点数据,再把阶码和尾数,按照四个检波器为一组,混编成2个字节的2次幂阶码和8个字节的尾数,实时存储在9轨、1/2英寸的数据磁带上(美国地球物理学会的SEG-D格式标准),这些成堆的数据磁带所承载的海量地震数据,被运输到地矿部位于帝都学院路31号的数据处理中心进行数字化处理,最终形成一幅幅地层刨面,再由地球物理学家和地质学家在上面寻找可能存在的煤层、油气等矿产地质构造。
在80年代中后期,有两个不要命的家伙,非要在PC上实现那个时代至少是DEC PDP VAX750+阵列机或者IBM大型机才能完成的地震勘探数据处理任务,经过四年日日夜夜的努力,终于把这件事干成了,还获得了地矿部的大奖,我就是那两个不要命的家伙中的一个,这个项目的负责人,那年月是C语言和Fortran77左右开弓、日夜兼程,后来一鼓作气,还完成了弯线地震资料的预处理软件。
说,检波器昨天、今天和明天,都不大可能做成今天江湖上所讲的前端边缘计算模式,因为地震勘探所获得的时间域信号里,包含了非常丰富的地学弹性波的信息,来自检波器的所有时间域信号,除了必要的地震仪器前置模拟滤波和信号放大外,必须忠实的、全量的记录下来,再拿到室内做更完善的数据处理,就连来自地下密度界面非反射波(面波、折射波、绕射波)都有其价值,尤其是绕射波对于复原和追溯地下断层和不与地面平行的密度界面具有非常重要的价值。外界的干扰、例如50周交流电、路边行人和车辆振动以及背景振动白噪声等等,都要在计算中心进行一维、二维数据的再处理。
如果按照边缘计算的方式,在检波器内设置计算模块,提取特征值后就会丢失大量有价值的信息,何况地震勘探的弹性波理论的数理模型极其复杂,也不大可能做到这一点。
四、电网公司的设备监控适合用边缘计算吗?
在传感器前端加装边缘计算,目前是江湖上很时髦的做法,但我坚持认为,对于一些故障模型比较简单的设备、能有效、可靠的提取特征值的,当然可以积极尝试。但是有几个问题需要考虑:
1. 故障模型复杂的电网设备:电网设备电气复杂度越来越高,其故障表现随不同气候条件、运行寿命、不同的负荷状况、不同的制造厂家(制造工艺和元器件选择)、不同的网架结构都会有所不同,设备的本质安全和外界环境影响共同构成了设备故障的主要因素,如果仅仅基于某一个地区、某一类厂家、某一类设备所总结出来的前端模型和算法,是否具有广泛的适应性,恐怕还需要做更多的研究和试验。
2.边缘计算是一个时期内人们对客观事物的认识:前面提到的是空间遍历的问题,现在说的是时间遍历的问题,随着时间的推移,人们有可能对某一类设备故障机理和外在表现的认识不断的深入,这种情况下,早期的边缘计算就不能适应新形势、新需求情况下的深化应用,因为,这将会带来整个设备故障模型和检测方法的更新,如果传感器内置的边缘计算装置不能被远程自动的更新以适应新的需求,那么这就意味着上一次的投资被浪费掉了。今天看到国网下发的提质增效八项重点任务的解读文件,里面明确提出国网要有“过紧日子”的思想准备了,地主家也没有余粮了,麻麻事儿都要精打细算了,在关于边缘计算的问题上,我想也要认真思考了,而不能冲动和盲目的去追求所谓的新技术。
3. 复杂的电网设备状态监控最关键的是什么?我粗浅的理解,最关键的应该是基于对复杂设备故障机理的研究,总结出设备故障的模型、故障的外在表现与故障机理的关系,这貌似又是一个先有鸡还是先有蛋的老话题,因为电气设备的电气复杂度越来越高,其故障机理越来越难搞,再加上前面提到的很多边界条件的影响,以至于过去传统意义的浴盆曲线,对某一类设备,可能就没有实际意义的指导作用,就连制造厂家也无法给出有参考价值的设备故障模型,没有故障模型,泛在(状态监控)怎么有效的实施?解决不了这个问题,泛在(设备监控)的故障预判提前期就不大可能有效的延长,故障和缺陷关口也不能有效前移,这就很难从务实的角度解决故障检修甚至是抢修的问题。
所以,差不多在五年前,我们就已经认识到,复杂电力设备的故障模型要靠大量的实时监测数据(包括气候环境数据、网架结构以及负荷特性数据)用统计的方法搞出来,这是一个需要长时间积累、不断优化、不断提升的苦差事,只争朝夕是办不到的。去年,我们看到一些单位花了很大的力气在整理存量资产的项目成本和设备故障数据,就暗自捏了一把汗。
五、故障监控是在博弈极小概率
有件事,我想大家印象都比较深刻,北方的夏天,气象局预报晴天的准确率要比预报雨天的准确率更高,这是为什么?主要是因为夏季,晴天多、雨天少,事情本来就这么简单,但想明白这件事,我却曾经花了好几年的时间,头发都想白了。
在夏季,夏天多,数据就多,积累的经验就越多,天气预报的模型就更能表达客观实际,所以,在夏季预报晴天相对比较靠谱。电网设备可靠性管理和故障监测,也存在类似的问题,电网设备的可靠性越来越高,发生故障的概率越来越小,我的老东家合纵科技码在河北沧州路边的那些柜子,十多年很少出故障,皮实的很,那还是海边有盐雾的地方。
在设备可靠性本来就比较高的电力设备上加装故障状态监测装置是不是有必要,这本身就是一个可以有争议、可以讨论的大问题,但是为了保证电网运行的安全,在关键节点、关键位置、关键场合和关键设备上,还是要加装监测装置的,这就变成了想在夏季预报雨天那样,监测装置是在博弈小概率甚至极小概率事件,这意味着什么呢?这意味着,监测装置的可靠性要比电力设备还要高、寿命还要更长,这似乎是一件极具挑战、很难完成的工作。所以,泛在这一坨事儿所代表的电网设备运行状态监控,是一个非常重要的、绝非儿戏的大事儿。
六、设备故障模型在时间与空间上的互换性
电网设备可靠性高,故障率小,我们实际监测到故障的机会就少,积累的数据、经验也很少,故障机理的把握和模型确定就越发的不容易,但是天无绝人之路,概率论告诉我们,难以用时间遍历的麻烦事儿,可以用空间遍历的方式来解决嘛,这就是国网去年大张旗鼓要搞泛在的一个坚实理由所在,国网覆盖了超过三分之二的国土面积,数以百万计的各种电网设备分布在不同的海拔、不同的气候带。还具有工业区、城区、乡村等多种负荷类型以及各种电压等级。有海量运行的设备、就有海量的运行及可靠性数据,这些数据的空间遍历的统计和研究,就可以解决一个供电局难以用时间遍历来解决的问题,就可以得出某一类设备、在某地区、某一种负荷类型、某一种网架结构、每一个寿命阶段的故障机理、故障外在表现以及发现故障最经济、最有效的方式方法。
老常更多的文章....