明略人·黄代恒:让轨道交通零延误从“预先感知故障、人机交互洞察”开始
--黄代恒
《明略人》已经推出两期啦,从明略人· 孔誉乾 : 情报研判遇上行业人工智能,神探已来!到明略人·杨昀:效率提升3000倍,可信任的AI让金融风险更可控,每一期都有着行业洞见与实践的完美结合。今天是周末,让我们从轨道交通开始聊聊工业。
在大城市上班的你,早晨最害怕的一件事莫过于地铁延误。无论是困在地铁里,还是在相邻的换乘线上,甚至开车经过周边拥堵的道路,都有可能耽误大量的时间。
全国的轨道上每天跑着20多万辆的列车,每辆列车上都有着上万种传感器数据,当这些数据时刻在传输,怎么通过技术预先感知故障,让专家协同洞察风险,提升轨道交通效率、节约成本?
明略数据工业行业人工智能,利用大数据和人工智能技术创新,实现设备数据和业务数据实时状态监控,进行设备故障诊断预测,全生命周期分析,为工业企业降低运营成本、提升整体效益,也为《中国制造2025》蓄势添力。
黄代恒,明略数据副总裁,企业级IT产品服务研发管理专家。具备管理复杂行业项目和大型研发团队的坚实理论基础和广泛实践经验。2015年初加盟明略,主要负责项目实施团队的管理和部分重点领域的售前工作。
https://v.qq.com/txp/iframe/player.html?vid=e05126bran7&width=500&height=375&auto=0
以下为内容文字整理版。
大家好,我叫黄代恒,是明略数据的技术副总裁。我主要负责项目管理、售前和行业解决方案几个方面的工作。明略是一家大数据技术和行业人工智能为专业聚焦的这么一个公司,我们将数据分析技术,主要应用于工业、金融以及公共安全等几个重要的领域。今天想跟大家交流的是在轨道交通领域大数据技术的一些应用,以及我们作为明略人对行业人工智能的一些想法。
大家知道随着城市化进程的高速的发展,整个轨道交通与我们大家的日常生活变的越来越息息相关。以北京为例,北京是一个路面交通有时候会差到让人难以接受的一个城市。记得以前发生过一次,我中午12点从中关村去CBD开会,当时因为觉得中午不会堵车,就打了车过去,但实际上到三元桥堵到不行,最后我跟司机师傅说:师傅抱歉,您把我放到最近的一个地铁站,我赶地铁过去,这样紧赶慢赶到最后了,大概迟到了15-20分钟左右的时间。如果一直选择路面交通的话,按照那天的实际路况,我可能需要下午四五点钟才能赶到客户那里。
下面我想通过一组数据再给大家对轨道交通今天的规模做一个大致的了解。以2015年的统计数据为例,我国现在在运行的轨道交通车辆,一共达到了21万辆之多,其中有1600辆是最为复杂的和谐号动车或者重载机车,其他包括城轨或者地铁。具体某一列地铁,根据型号的不同,一列地铁车辆它的造价在5-800万不等,一辆10列编成的一组车,造价很容易突破5千万、6千万,本身就比较贵。但是根据统计,在整个车辆的生命周期来看的话,它的初始购置成本与维护成本的比例达到了1:9。整个轨道交通的运行维护是一个非常非常复杂的系统工程,而且这个工程对于安全性、可靠性要求非常非常之高。
大家想象一下,在高峰期的北京和上海,如果一旦地铁出现了长时间的延误会对我们的生活造成多大的一个影响。那么大数据技术在什么地方可以帮助到轨道交通行业呢?我今天想从感知和洞察这两个方面来谈一谈我们自己的一些体会。
所谓感知指的是对已知事情的一些收集,它实际上是通过大数据的并行接入、处理、计算技术,把海量的传感器数据收集起来进行加工分析,感知一些小的隐患风险进而发出预警,使车辆的运行能够安全运行,避免大的风险,这些是对已知事情的一个处理和分析;洞察是更进一步由已知推未知的一个过程。收集整个设备全生命周期的一些状态数据,把原来只能依靠人工手工做,并且是抽样做的比如说像故障原因的分析以及设备状态、生命周期的预测,由一个局部的、人工的状态向全量的、智能化的状态进行演进,这样的话实际上形成一个促进轨道交通提高效率,产生帮助的效果。
举一个实际的例子,大家可能不知道,上海地铁现在的行车里程已经是全球第一名,每天服务的客户数达到千万人次以上。其中,地铁运维车辆中有一个重要的KPI就是故障数,其中有一类故障叫做5分钟延迟,车辆只要发生5分钟以上的非外界原因的延迟,就记一次,一年所有的线加起来只允许40多次。
我们在某一个实际项目,采访了一条线路,它去年一共是有2起这样的五分钟以上的延迟。其中一起的经过是这样的,这个车辆发出之后,它的制动系统里有一个气缸,这个气缸在制动动作的时候正常的情况下应该输出一定的压力,比如说1200,但是这个气缸在2、3站之后,它的输出值就渐渐降低,只能输出800、700了,这个时候它还没坏,又开了4、5站之后彻底不行了,完成不了正确的制动,这个时候才赶紧把车停下来,呼叫维护,导致了一起5分钟以上的延迟。
像这种事情,我们大数据技术其实没法做到立刻给你换一个好的,这个不可能。但我们能做到的是什么呢?我们能做到提前感知,比如说当你到第三站的时候,我们就感知了阈值的渐渐底下,我们就给运维人员发出一个报警信号,人工确认之后,他可以让这个车做清客处理。所谓清客处理就是把这辆列车现在上面的乘客都请下去,大家知道制动系统在空载情况下的运行负载时远远低于重载的,这个车就能够开回道维修站,整个当天受到延误的就不再是这条线上所有的乘客,而仅仅是发生问题的这一辆车,这个是特别重要的一个感知领域的实际运用。
大家可能认为从技术上感知没什么难的。但实际上在我们这个技术圈里有一句话叫做“数据量小的时候什么都不是问题,数据量大了什么都是问题”。实际上在海量数据涌入的情况下,实现设备协议的规则解析还是非常复杂的一个问题。大家可以试算一下,在一个大的城市,在轨运行的车辆可能有一千多辆,每辆列车上都可以采集上万种传感器数据,它会不断地报上来,并且采样频率会以一个500毫秒,就是每秒钟采样2次,甚至更高的频率来进行,为了捕获到异常的信号,整个的过程中,如果不采用并行计算的处理技术,收下来再批处理转化的话可能就会错过很多像刚才说的那样完全能够发出预警的时机,甚至还有丢失数据包的这种可能性。
另外一个问题,我们还要注意到设备本身也是纷繁复杂的,我们协议一定要做成可配置的并且实施高并发的这样设备处理架构。轨道交通领域整体来说,它按照易损程度来排名一共有5类部件,这些部件是相对来说是出现问题比较多的。第一个是走行部,就是底下的转向架以及轮对;第二个是上面的受电弓和挡板;第三个是车门,车门实际上它受到挤压情况非常多,也是偶尔会出现一些问题,尤其是一旦出现车门不能关闭的情况下,整个必须停下来进行及时的处理;第四个是刚才介绍的制动系统;第五个是继电器,这些设备实际上指的都是车辆上的设备,车辆以外还有通讯信号系统、供电系统,这些系统也都有各自的经典问题和多发问题,需要通过数据技术进行及时地处理和分析。
我们前面介绍过除了对这些故障问题的感知之外,还有一个重要的领域叫做洞察,实际上主要在不同的客户场景下,有三种技术来实现这种轨道交通的数据洞察:第一种叫做专家规则;第二种叫做特征分析;第三种叫做深度学习。专家规则指的是专家会像医生看人一样去看设备,把几个图表放到一起来分析,比如说某一个波动图正常情况下应该是完整地、有节奏地在一个数据区间波动,但是如果连续有两次小的波动,一次大的波动,他就认为这可能有问题,再结合另外的指标,发现它出的底值比标准值低20% 以上,那么它可能是某种故障,这个叫做专家规则。特征分析是指导致一个故障它可能跟周边三五十个维度都有关系,我们去一个一个地排查分析,我们逐一地进行排查,哪些维度才是反映问题的重要指标,再把它组合起来进行分析。深度学习也是一种模式的辨识,但是它更分层次,比如说我们辨识一个人脸,我们从若干的小的像素开始,它是一个圆形的,那么它可能是一个眼睛,这些像素构成了一个三角形的排布,它可能是鼻子,再往上一层的,两只眼睛一个鼻子,这个模式可能符合我们对于一个人脸的预期,这样把它辨识出来。
实际上,从技术的先进性来讲,后两种基于机器学习的都比专家规则要先进,但是机器学习有个重要的问题,就是对样本数量有很大依赖,这里面我通过人类学习知识的例子,来说明为什么这种知识的积累需要样本。我的同事有个2岁的小女孩,非常可爱,家里人都很喜欢她。她养成一个习惯,她很喜欢吃红色的东西,因为家里给她的豆沙包、樱桃都是红色的,但是某一次的家宴上,她就发现了一个叫辣椒的东西,当时家里人也没有注意,她就吃了一个。当她吸收了这样一个样本之后,她当时的反应是非常非常不爽的。这个东西很辣、刺激性非常强,她就在自己的规则库里加了一条:红色的不一定是好吃的,还有可能是辣椒。那么进一步她可能会分析这个食物的形状和出现的位置,结合上它的颜色才能判断食物好吃,这样的话她的知识就在不断地演进了。
机器学习跟人类学习,虽然从运行到机理、技术手段上还有很大的差距,但是样本的不断积累会助推、不断提高计算的精确度,这个道理是完全一样的。
所以说我们设备领域在不同的阶段,也是采取不同的手段来进行分析。比如说某个极为复杂的牵引系统的故障预测中,我们有过一个成功的案例。原来它是通过这个行业使用的传统方法——专家标注。一些强电领域的专家分析,某几个维度反应出什么样的特征。他们有好几十类的大故障,每个大故障里面可能有十几种不同的小原因,他们会不断地去分析,但是这种分析的效率还是比较低的,因为数据本身就不在一起,人的精力也有限。我们实际统计了他们在两年之内大概积累了3000个左右样本,我们基于大数据技术把它汇总在一起并且通过刚才说的特征分析和机器学习的手段,给它自动地做标注,从而推测出比如说某个故障有70%的可能性是第一个原因,20%的可能性是另外一个原因。那么专家就可以比较方便快捷地对这种机器学习的结果进行确认。不光专家的压力得到了减轻,整个数据积累的速率也获得了提升,对于我们将来进一步采取更先进的分析手段也打下了非常重要的基础。
除了故障原因自动分类之外,在轨道交通领域还有一个概念叫做状态修,状态修是针对计划修来说的,计划修是指这个车每天有日检、每月有月检,还有5年10年的大修,这些实际上都是一种妥协,因为我们无法预测到这个设备的状态到底是已经快坏了还是实际上没有问题。实际上,我们刚才解释过在数据特征上都能够反映的这些规律,比如说车门除了简单的开合数之外,我们看它一次停站开合数。一次停站的开合数多,说明它当时可能遇到了拥挤,或者遇到了什么特殊情况。再结合上车门受到的内外压力,说明可能有人在挤它,说明这种情况下车门容易坏。像走行部分也是这样的,甚至是一些厂商的型号、生产批次的数据都可以建立在整个模型中,我们可以为每一个设备建立一个数据画像,来提示我们的维修人员——这个设备已经处在一个高危的情况,你应该及时地对它进行维修。
在数据技术服务轨道交通的过程中还要特别强调两个结合。一个是叫做软硬结合,一个叫做人机结合。软硬结合指的是硬件的传感器层、传输层和软件的数据层必须互相结合、互相促进才能完整地解决这个问题。那么,人机结合是指要通过行业的专家规则,以及我们机器学习发现的新特征这两种技术手段相结合。我刚才提到过样本的依赖,为了解决冷启动的问题,开始没有样本的时候,我们只能依赖行业专家的经验来去积累样本。
其实我们认为人工智能本身对人不是一个简单的替代关系,它并不是来抢夺我们的工作的,它是辅助我们的工作的。我们为行业专家提供了各种各样的分析挖掘工具来帮助他们高效的完成这种分析工作。在更广的角度去考虑,实际上这里面还有一个问题就是通用人工智能与行业人工智能的关系,大家纵观现在的AlphaGo也好,几年前的深蓝也好,它实际上都是在特定规则领域下、有特定明确结果的情况下,人工智能战胜了人的智能的一个案例。但是实际上,即使是这样AlphaGo的训练,整个演算的集群也会非常非常庞大,远远不是一般企业能够承担起的。
所以我们认为在近未来,我们通过聚焦在某一个行业,通过行业知识和数据挖掘技术的结合,形成行业人工智能来辅助这个行业。这是一个更为可行、在近未来可以实现的路径。
以明略为例,明略实际上在三个领域都有这样行业人工智能的重要的探索。工业领域,刚才介绍过了,这个其实不只限于轨道交通,在其他的重型设备制造生产里也会用到,包括故障、设备生命周期状态的预测。在金融领域,我们会标示出哪些行为是内外串联的诈骗行为,哪些行为是电信欺诈,它都有一定的数据特征,我们也是可以把他挖掘出来的。在公安领域,公安领域在情报分析的时候会将人、事、地、物、组织这六大要素关联起来。我们也可以分析出哪些团伙是可疑的,哪些人与人之间有非正常的关系。那么所有这三者的一个共性都在于什么呢?我们要把这些坏的、有问题的交易、事情摘出来,而且是一个比较低的成本摘出来,这样就使我们整个运营成本得到下降。
那么进一步,不管是工业中用更低的成本来确保大家的安全,还是金融领域能够降低交易成本来实现真正的普惠金融,还是公安领域能实现的关系到整个国家民生的关系,都能产生一个巨大的促进作用。我们纵观整个历史长河中科技发展、科技进步的过程,实际上它都不是一个替代人的过程。我认为它不是个简单的替代过程,比如说,最开始把大家的机械劳动释放出来,用机器、用设备来辅助生产,那么这样的时候人可以怎么做呢?人可以去集中精力去做更多的科技创新、文化艺术方面的创新,这样不断地循环迭代,使我们整个工作效率得到更大的提升。
进化到现在这个阶段,实际上我们认为在每个领域它的行业专家的知识和各种各样的规则才是最宝贵大一个资源。明略人在各个领域工作的一个愿景就是通过数据技术形成行业人工智能,从而真正达到机器辅助人类、赋能于人,提高业务效率。
我是黄代恒,我是明略人,我们用科技延伸人类智慧。
新一轮人工智能的革命已经到来。明略人作为“行业人工智能”的推动者,秉承着“极客追求·极致服务”的精神,正在凭借着自身强大的数据处理能力、学习能力,整合资源,结合各行业知识,深入大数据智能挖掘,在各领域形成行业人工智能应用雏形。2017年,我们将与客户比肩同行,加速实现传统行业的智能化升级,让人类在专业领域更高效。
未来是人机共存的时代
未来,明略人用科技延伸人类智慧
6月12日,我们会带来第四集《与客户并肩,让每一条数据说话》
敬请期待!
实战分享四
魏明:与客户并肩,让每一条数据说话
关注明略数据官方微信,回复“明略人”,或点击下方明略人菜单栏,随时关注《明略人》更新。