查看原文
其他

深度长文讲透“可靠性系统工程”三部曲

信息与知识服务商 工业互联网研习社 2023-03-28


510+全国社友,构建工业互联网认知框架

打通资讯→信息→知识→认知→见识的通路


工业互联网研习社风向观察

质量与可靠性,是一对形影不离的双胞胎,而且伴随着工业化过程过去一百年的历程。 透过国外工业化发展的历史和中外三个阶段的对比——生产过程、研制过程和全系统全寿命的管理,可以看出可靠性系统工程的诞生背景。实际上,这些完全对应了钱老提出来的“可靠性是设计出来的、生产出来的、管理出来的”。中国制造要从大国走向强国之路,企业必须狠抓质量和可靠性。而系统工程抓可靠性管理是唯一的可行之路。早在1991年,北航可靠性与系统工程学院的创始人杨为民教授提出可靠性系统工程的概念,是从如何推进可靠性工作的角度提出的,最重要的是研究产品“故障的发生、发展及其预防和维修保障的规律”。欢迎关注「工业互联网研习社视频号」,点击文末图片一键关注!

组织方:电子工业出版社、北京机械工业自动化研究所有限公司

来源:制造业转型升级


早在1985年的时候,中国航空工业界为了搞歼十飞机研制,在当时大部分人都不知道可靠性是什么的历史背景下,航空工业仍然开始全面引入可靠性工程。这是值得回味的一段传奇。


1

中国制造业由大变强与可靠性



2

浴盆曲线


在可靠性领域的几个关键概念内涵,最为重要的概念就是浴盆曲线,任何一本可靠性教科书都会出现这个曲线,纵坐标是产品的故障率,横坐标是产品的使用时间。这是从统计上反映出来的产品故障发生的规律。 


图1 可靠性工程的浴盆曲线


第一个规律就是曲线的第一段,在早期使用的时候,故障率非常高,要经过不断的维修、适应性的改进甚至修改设计、工艺,把故障率降下来;


曲线的第二段,就是使用阶段故障率应该是很低的水平,而且还不应该发生剧烈的波动,最好保持常数,长时间保持低的水平;


曲线的第三段,是表达低水平故障率保持到多长的规律。一般而言,保持到预期的使用寿命,过了使用寿命故障率又急剧增高。这是统计规律表现出来的。


但是当产品从统计数据上看到了浴盆曲线第一个阶段的时候,即在用户的运维的过程中发现这个阶段的时候,说明企业没有对产品实现可靠性管理,或者说当出现了浴盆曲线早期故障期,说明可靠性工程实践是失败的。


第二个阶段,如果在使用的过程中长期的故障率稳定不下来,并且浴盆底的高度还很高,也说明可靠性工程失败了。


第三个阶段,如果使用时间没多长就坏掉、不能再用、老化、疲劳、断裂或腐蚀等,这些问题说明你的产品寿命也不符合要求,可靠性工程还是失败了。


浴盆曲线可以折射出中国制造业的很多问题。


目前中国制造业的特征在这三个点上都反映了,第一产品投入使用初期故障率很高,第二久久不能把故障率稳定下来,第三寿命还很短,所以这些问题交织在一起反映了企业的可靠性工程的实践出了问题。浴盆曲线就是这么一个有关故障发生概率和统计规律的曲线。


3

故障六性


跟故障相关的产品的设计特性,主要包含六个方面:可靠性、维修性、测试性、保障性、环境适应性和安全性。 


图2 故障六性


这些特性都不是中国学术界发明的,当北京航空航天大学在1985年成立可靠性研究所、工程系统工程系的时候,国外这些专业词汇在学术界、工业界已经产生了几十年。


早在1991年,北航可靠性与系统工程学院的创始人杨为民教授提出可靠性系统工程的概念,是从如何推进可靠性工作的角度提出的,最重要的是研究产品“故障的发生、发展及其预防和维修保障的规律”。


可靠性系统工程的理念在航空航天兵器舰船等军工行业的实践中不断的在扩展推动。现在武器装备行业把这“六性”叫通用质量特性,这是笔者在2006年的一份战略咨询报告中提出来的一个概念,把这些与故障直接或间接相关的设计特性给了一个概括性的说法。那么,可靠性系统工程就是围绕产品保障规律组织管理通用质量特性工作的方法论。 


图3 可靠性系统工程内涵


图3从方法论上进一步解释了可靠性系统工程,就是在研发阶段要进行与故障相关特性的设计、分析、试验评价工作,同时还要做与故障相关的系统设计、分析、评价工作。


与故障相关的系统,则是指面向产品的使用维护和运维阶段,以前叫售后服务系统。没有经历过正向研发过程的时候,我们的解决方案当然是出了故障就要修好,这就是被动的维修服务,归到售后服务系统里,即使是售后服务系统也需要主动去设计。


后来的维修保障系统、BIT、ATE、中央维护系统、远程维护系统、PHM故障预测与健康管理系统等,都属于与故障相关的系统,随着技术的发展,现在技术热点就是PHM系统。图3才是完整的针对故障的研发和设计,这个就是可靠性系统工程最基本的理念。


4

可靠性发展历史与工业史


质量与可靠性,是一对形影不离的双胞胎,而且伴随着工业化过程过去一百年的历程。 


图4 过程质量检验的发展史


第一个阶段就是在大批量制造业出现的过程中。首先产生的产品质量检验。


说起质量检验的概念可以查到中国古代,一把剑铸造的好不好,也取决于设计、制造、检验,但那是手工业时代,所有这些事情可能都是一个人做。但是工业化以后批量生产就不一样了,福特汽车在大批量生产时代,做的最有里程碑意义的事情,就是把质量检验从产业工人里面分出来,专门有一批人看着制造线上的产品,生产出来之后是合格的还是不合格的。这是真正的专业化质量检验,是基于专业化分工的流水线上的质量检验,质量专业因此而诞生了。


质量检验又分为两个阶段,当批量比较少的时候是全数检验;后来,批量上来了,一年几百万辆车,零件上千万个,无法全数检验,统计的方法出现了——也就是抽样检验。这两个检验都可以叫做过程质量检验。过程质量检验的出现是质量可靠性发展历史上的第一个里程碑事件。


第二个阶段可以称为过程质量控制。当工业化发展到一定程度后,又出现新的问题,质量检验是产品生产出来之后才能对它进行合格不合格的判定,会产生废品,造成质量损失。所以,这个问题就驱动人们思考:能不能在制造过程中进行质量控制,预防不合格品的发生,降低不合格率,这个就是过程质量控制。统计过程控制SPC和六西格玛概念方法就是这个阶段产生的。 


图5 质量检测和质量控制的发展史


第三个阶段是跟安全性有关。工业品出来之后,会发生很多事故。 


图6 安全性的发展史


20世纪工业化进程很精彩,人类产生很多伟大的发明,如蒸汽机、汽车、火车、飞机等,有人总结每一次技术的发明都为人类创造了一种新的死亡方式。这就是安全性问题。没有汽车的时候,人类死亡方式最多就是被马踢死了;有了汽车,就有了新的死亡模式,被车撞死了;发明了飞机,就有飞机事故。所以,安全性是伴随着工业化要面临的又一个问题,就是产品一定要安全。所以安全性在当时也成为一个新概念。但人们很容易接受,很多时候大家都能想到安全,电气产品如何安全,机械产品如何安全。这都需要有一套设计准则,有一套严格的验证规范,政府也要监督。


但是,像民用飞机这一类政府监管的适航取证,则是只管安全性,不管可靠性。可靠性对飞机安全有影响,但是安全性又有自己的技术范畴,安全的不一定可靠,可靠的不一定安全,这是两个很有意思的概念。 


图7 可靠性的发展史


第四个阶段就是可靠性问题。第二次世界大战德国人用火箭打英国的过程中,通过作战运筹产生的可靠度的概念,就有了可靠性的意识。到了50年代,美国正式诞生了可靠性工程专业。但是质量这块的发展也一直在往外推进,从质量过程的事后检验到事前的过程质量控制,到了60、70年代发现光抓生产过程不行,还要抓全面质量管理,这就是非常经典的“人机料法环”。 


图8 可靠性与质量伴随着整个工业化进程


可以这样总结,过程质量检验、过程质量控制是经典的传统的方法,70、80年代是全面质量管理。在这个过程中,可靠性逐渐发展了维修性、测试性、保障性等概念。维修性指的是要好修;测试性指的是维修的过程中要能快速进行故障定位、诊断;保障性指的是在维修诊断的过程中,要能够提供足够多的资源、备件、维修人员、维修设备、维修设施等。


伴随着这些新概念的发展,国外尤其是美国,在可靠性概念出来10年之后,也就是1960s在研发过程中提出新的管理的技术叫工程专业综合,后来发展成系统工程,到了90年代发展成并行工程,现在就是基于模型的系统工程,这些解决什么呢?解决可靠性这些概念融入到设计研发流程以及整个寿命周期流程的问题。


所有的这些特性都是要设计的。从上面的历史可以看出,可靠性与质量伴随了整个工业发展的全过程,是工业化的主旋律。


5

中外工业发展史对比


在过去一百年整个国外工业化的过程,西方先进国家的制造业平均十年左右遇到一类问题,然后去解决,就是这么按部就班发展起来的。中国的工业则呈现了不太一致的局面。


中国的工业化进程,可以说过去一百年,在1949年之前中国几乎没有像样的工业。新中国才有了工业化,大概又分成两个阶段,一个是改革开放前与改革开放后,所谓前30年和后30年。 


图9 中外工业第一阶段对比


在50年代,航空航天等领域的工业化过程有一个非常高大上的名称:“测绘仿制”,非军工行业可能就叫做拷贝模仿,或者干脆就叫“山寨”。这是一个发展中国家走向工业化的必由之路,而且是一个国家工业化快速发展的保障。德国当年模仿英国也是这样走过来的。没有测绘、模仿或所谓的“侵权”,德国、日本和中国制造都走不到今天。


测绘仿制过程中没有正向研发,只有生产过程的质量管理。中国工业化的前三十年还没有批量生产,因为中国彼时还不是消费型社会。消费能力不够的情况导致批量也很少,所以在前30年,改革开放之前的研发上,基本是测绘仿制,制造上是小批量,满足不了人民生活和社会发展的需求。这是中国制造当时的实际情况。这个背景下对于质量可靠性的需求都很弱,这是第一个阶段。 


图10 中外工业第二个对比


第二个对比是,国外二战期间和之后,制造过程的质量控制、质量检验做的很充分,在上个世纪50年代随着新的可靠性这些概念的出现,开始有了正向研发。美国军工行业在50年代开始建立采办程序,就是研发程序。中国以军品为代表的研发也是改革开放之后1982年才开始,有了武器装备研制程序。这个是一个非常有意义的历程。而非军工行业又比军工行业晚发展20年左右。  


图11 中外工业化对比全景图


第三个对比是在80年代的时候。当时国外的可靠性、维修性工程实践了20多年,概念、方法全都有,但是效果不好,武器装备的可靠性也很差。因此,在80年代美国国防部狠抓可靠性、维修性管理,制定很多政策文件。而此时,在1985年中国北航成立可靠性系统工程专业是,就是在发现美国人如此重视可靠性,而中国要搞新型歼击机(歼十)的时候,对可靠性工程几乎一无所知。在这个背景下,老一辈专家开始搞这个专业,在50岁左右的时候开始创业,建立了一个全新专业。正是这个高屋建瓴的远见才造就了今天的可靠性工程的枝繁叶茂。1991年军工口开始提出可靠性系统工程,抓与故障相关的特性设计。通过近40年的发展,基本在管理的方法论方面赶上国外,而且有一定的特色。


6

小记


透过国外工业化发展的历史和中外三个阶段的对比——生产过程、研制过程和全系统全寿命的管理,可以看出可靠性系统工程的诞生背景。实际上,这些完全对应了钱老提出来的“可靠性是设计出来的、生产出来的、管理出来的”。中国制造要从大国走向强国之路,企业必须狠抓质量和可靠性。而系统工程抓可靠性管理是唯一的可行之路。


中国质量这么搞



企业搞可靠性的切入点是什么?


成本倒逼!


在许多企业,运行维护费用能占到利润的1/4,企业家有足够的动力推动研发部门去搞可靠性。国内非军工企业,要做可靠性的起点都是基于这样的倒逼机制。


那么,如何实施可靠性系统工程。大致可以归纳为八个要素,即指标体系、组织形式、专业队伍、工作流程、规范指南、过程控制、数据信息、技术集成。


八个实施要素

7

全面需求


第一个要素就是全面的需求,也就是指标需求。共有七个方面,长寿命、高可靠、快诊断、能预测、易维修、好保障、要安全。这七个方面的要求在可靠性系统工程的技术体系里都有对应的定量指标,因此,可靠性并不是简单的MTBF(平均故障间隔时间)。只有这七个指标都满足了,中国制造业才能真正是从大到强。


全面需求


这么多要求,企业如何做?首先要思考的是,所有的对策本质上是故障和应对应故障的对策权衡,是研发阶段放任不管,到运维阶段再考虑?还是在研发阶段多投入,从而节省运维费用?这个节点的选择,是需要权衡决策。


8

组织形式


第二个要素:组织形式。首先必须要认识到,可靠性是一个独立的专业。只有这样,它才能得到重视。目前看上去国内一些企业已经先动起来了。例如,国内风电领头羊金风科技,就是把可靠性当做一个专业来建设,一个简单的标志就是这个企业有可靠性专业毕业的学生。


徐工也非常重视。徐工最早希望笔者把全厂技术人员都集中起来,上三天课以便使得工程师可以理解可靠性,并推动企业装备的可靠性。笔者跟他们强调,学校里的学生,从本科、硕士到博士学了七年,面对具体的产品仍然无法独立处理可靠性的问题,企业“运动式搞可靠性”基本是不可能的。一无可靠性组织,二无可靠性工程师,企业是不可能搞好可靠性的。幸运的是,徐工领导非常认真地接受了这个想法,目前已经进入系统性建设的起步阶段。徐工车间里挂了一幅标语,“技术领先用不毁”,这意味着既要技术先进性,也要功能可靠性。这正是中国制造业转型升级的目标,从这一点而言,徐工抓可靠性抓的好,走在正确的强国制造的道路上。


企业的可靠性要有专业的组织,这个专业的组织建在哪里?


航空航天大概是三个结构。第一个结构放在质量部门,质量部门下面有可靠性专业室,专业的技术室和设计室。但这种结构,发展到一定阶段就不顺当了。因为,可靠性毕竟要从根上设计,而不能仅仅作为管理工作放在质量部门,因为它质量部门是管理责任,无法承担设计责任。这个时候,一定有冲突。


质量主导下的可靠性组织


第二个结构是项目制,或事业部制。每个事业部下面都有可靠性的团队,可靠性的研究室。这样做好处是,每个事业部各自对可靠性负责;但坏处就是可靠性资源分散了,各个事业部之间往往无法交流。一个企业的两个项目组,相互之间甚至都可能要保密,这是事业部制带来的弊端。


第三种结构是矩阵的组织,这是一种理想的状态。企业里应该有专门的可靠性研究室,而每个项目里还都有可靠性工程师。在具体实施项目过程中,专业部门和项目组的可靠性工程师联合组成团队。


矩阵式的可靠性组织


可靠性工作系统是航空行业建立起来的,因此相对完善。从上到下,分别有飞机总设计师,和各种各样的专业副总设计师,其中就有可靠性副总师。


复杂的武器装备甚至设置两个副总设计师。这就构成一个矩阵的组织结构,非军工口目前做的最好的企业是华为,华为的可靠性工作从可靠性试验起步,现在遍布了整个集团公司,近两百名可靠性工程师。以前大学生毕业,主要在军工行业内就业,而最近十几年都是在华为这样的可靠性非军工口的先行企业就业。


9

专业人员


第三个实施要素:专业人员。中国的可靠性工程师并不多,华为这样的企业还比较少,可靠性工程师头衔和岗位集中在军工行业,华为、长虹、联想、中车等都有。


可靠性是一个专业


可靠性跟可维修性、安全性一样,也是一个专业。现在产品的创新需要年轻人,越年轻的活力越强,但是质量可靠性专业的人需要老人,越老越有经验。国外大概都是这样的。有国外的机构做统计发现,国外的可靠性工程师年薪比其它产品设计师的高。


中国质量协会,有一个项目叫注册可靠性工程师考试,推广了好几年,不温不火。但这种考试一定要坚持,一定会迎来大发展的那一天。美国、日本类似的培训,各类企业派人踊跃参加、场面火爆,中国企业一定会发展到那一天。


10

流程实施


第四个实施要素就是流程。可靠性系统工程里要做的工程活动很多,需要进行的每个活动之间是有逻辑关系的,要串起来。都是要靠前因后果的逻辑关系和信息传递的,而且一定要嵌入到研发流程。很多企业研发流程不完整,不符合系统工程研发的过程,可靠性做了一点点(如失效分析FMEA),但不知道塞到哪个部门,往往是孤零零的部门;过两天别的部门会重新做一个障诊断的设计,但其诊断故障模式和前面做的FMEA毫无关系。


再比如售后服务系统,一般的售后部门数据的统计,只用来算钱。尽管财务上售后服务算的非常准,但技术上的数据就不统计了。企业的设计工程师在特别混乱的售后数据中,来统计浴盆曲线,找主要故障原因排列,会非常困难。而实际上,这本来就是售后部门的事情。


综合流程


制造业如果重视自主创新的研发,流程要有两个:一个是围绕着功能,一个是围绕着故障。两条线并行。中国的境况是,第一条设计制造的线条,刚刚从测绘仿制转到自主创新,还在建立的过程中;而第二条线围绕故障的维修保障的线条,基本还没有也不全。两条线索叠加在一起,给中国制造业做强,带来了很大的困难。


11

过程监控


第五个要素叫过程监控。过程监控首先是监控工作项目之间的内在的逻辑关系是否是有效的传递?


什么叫内在的逻辑关系?平均故障间隔时间叫MTBF是可靠性指标、平均修复时间叫MTTR是维修性指标,还有一个指标叫可用度,或者叫停机时间。这三个指标有约束关系,知道两个就知道第三个。但很多企业在制定这些目标的时候,定了三个指标,但却不符合自我约束关系。这样情况下,是不可能做出可用度设计、可靠性设计和维修性设计,因为目标本身就矛盾。过程监控,就要查看这些工作逻辑是否正常。


第二个纵向监控,就是监控整个供应链的要求。当真正做可靠性的时候发现供货方零部件不可靠,这说明企业的质量控制体系里面没有可靠性的控制。


当然,这种监控的主体之一是政府对企业的监管,但是政府只管安全和环境,不管可靠性;而企业对供应商的监控,用户对产品的或业主对系统的监控,都必须包含这一点。定量跟踪,就要前面定的七个方面的定量指标,要在整个寿命周期里进行监控。


12

规范体系


第六个要素叫规范体系。每一个可靠性系统工程的活动都要有自己的规范,要有属于企业自己的规范和标准,不要完全指望国标和国军标。当企业自己创新设计时,只能依靠自己的标准。这个没有捷径,只能通过实践过程中产生的规范、形成自己的标准,这才是一个制造强国的企业应具有的水平。


以前在测绘仿制,是按照国外的标准干,而且不敢改,改了之后也小心翼翼的。这都是摸索的阶段。现在要自主创新了,必须学会从无到有。每一个可靠性系统工程实践活动,先找一个产品或者设备试点,做可靠性工程中的某一件事,试点之后把它形成规范指南,用规范指南指导做第二个、第三个,之后马上变成企业的标准。然后持续做下去。企业真正有核心技术,是不会把它弄成行业标准和国家标准。一些企业的可靠性试验体系,对外基本都不开放。


郑州的宇通客车的可靠性实验室,就形成了自己的规范。大客车做30天试验等效于在路上跑一百万公里,要求整个过程无故障,整个车架子上面每个坐位有配重,相当乘客的重量,然后运行和计算。通过自己采集各种各样的试验载荷,用一百万公里的实践证明过的结果,来指导所有新开发的客车。这就叫规范体系。


规范体系有三类:一个是要求类,如何定指标的,指导对故障相关的特性和故障相关的系统定指标要求;第二个指导类,就是怎么干各种活动,这一版都是保密的;第三类是验证类,对提出来的各项要求,确认是否已经得到实现,属于验证类规范。


13

技术集成与大数据

第七个要素叫技术集成。这张图分成了好多技术,每一类技术,可以再展开下一级的各种各样的技术方法。当然这些技术不一定都用得到,重要的是企业要学会去选择合适产品和技术。


各种相关技术


第八个要素是大数据。对于采集上来的大数据信息,能不能画出一条正确的运维数据曲线?这也是需要下功夫的地方。很多企业通过售后服务、运维数据得到的故障统计数据,基本都是错的。这样的数据,不可能指导设计改进和工艺改进。所以,要全面地收集各种数据、正确地分析各种数据,需要管理上下大力气。


大数据来源

14

小结


可靠性工程的实施,不是一个短期运动式就能解决的。它需要对组织、对流程进行系统的规划,并且按照非常规范的方式循序渐进,才可能真正实施成功。


可靠性应用模式与能力等级评价



实施可靠性系统工程的八个要素、五个应用模式,共同构成了企业的可靠性系统工程能力。八个要素,即指标需求、组织形式、专业队伍、工作流程、规范指南、过程控制、数据信息、技术集成。五个应用模式,即故障归零模式、试验把关模式、定量设计模式、故障补偿模式、综合集成模式。 


可靠性系统工程能力

15

故障归零模式


所谓故障归零模式,就是企业在运行维护过程中,收集产生的数据,进而进行故障信息的统计。下面以某汽车制造厂某型离合器故障为例进行说明,这是很早期的汽车数据。从离合器按里程故障统计和主要失效模式统计中,可以得到这一部件发生各种故障多少的视图。图2统计了各个时间段发生的故障数,图3是按照这一部件的故障模式发生数据进行统计,包括有哪些故障模式,每个故障模式占的百分比。 


某汽车制造厂某型离合器按里程故障统计


某汽车制造厂某型离合器主要失效模式统计


有了这些数据之后,就知道哪些零部件、哪些故障模式要进行改进。在需要对某些零部件进行改进的时候。首先,要对它进行故障机理分析,针对机理进行设计或者是工艺技术的改进,改进之后还要进行有效性的验证,通过FRACAS(Failure Report Analysis and Corrective Action System,故障报告分析与纠正措施系统)循环来提高可靠性。


故障报告分析与纠正措施系统


目前,大部分企业采用的是故障归零模式,但是做的并不好。做不好的原因主要有两个,一是信息缺失,二是没有管理好FRACAS循环。做好可靠性,三分靠技术、七分靠管理。


16

试验把关模式


第二种模式是试验把关模式。当企业创新程度越来越高的时候,越来越不确定产品投放到市场上是好是坏的时候,就要进行考核试验。这个时候要把关,在投入批产之前、在交付用户之前,要设计可靠性的试验项目。


例如,长虹公司2007年开始导入可靠性,当时售后数据显示维修费用占到利润的近30%。电视机的利润本来就薄,要想保住利润就要高可靠性。因为家电行业售后数据统计的非常清晰,返修率都能算出来,那么直接导入的就是试验考核。所有电视机在出厂之前都要进行可靠性试验考核,设计一个试验考核方案,不通过的不能投产上市。这个途径当时遭到了设计师的抵制。公司解决这个问题的方法就是先由各个项目组自愿选择,愿意走可靠性技术路线的就按照试验考核流程走,不愿意的项目组继续按老程序办。家电行业的售后数据反馈非常快,半年后数据收集回来了,通过考核的型号,返修率就降下来了,没有经过考核的,没走这套流程的,依然是高的返修率。这时候领导一声令下都按照这个试验考核流程执行了,可靠性试验考核的标准也定下来了,流程也固化了。之后5年的返修率均值降下来了,波动也小了。


可靠性试验的类别有很多种,例如:


1、可靠性摸底试验:对模拟产品实际使用的环境应力和工作应力进行试验,在规定时间无故障通过,定性考核。 


可靠性试验中产品发生故障时间与总试验时间1998-2008数据统计图


2、可靠性强化试验:逐步增大产品环境应力和工作应力进行破坏试验,故障分析与纠正后再次试验通过,定性考核。


强化试验是要掌握产品的破坏极限,把产品做坏,做到失效,这是强化试验的一个原理。 


可靠性强化试验原理


3、可靠性鉴定试验:模拟产品实际使用中的环境应力和工作应力条件下进行的统计试验,可以给出定量的可靠性指标。足够多的样本和足够长的试验时间。定量考核。


鉴定试验给出定量的考核性指标,但是要提高准确度,就要投入大样本。寿命试验也是统计的方法,可以按照1.5倍的寿命进行试验。如果产品寿命指标很长,就需要加速试验,另外设计试验方案。总之,不同的情况要有不同的解决方案。


4、可靠性验收试验:按规定的批量大小和抽样原则,从各生产批次中抽取产品,在与可靠性鉴定试验相同的试验条件下进行的统计试验,可以给出定量的可靠性指标。定量考核。 


可靠性鉴定与验收试验原理


针对不同的场景,不同的场合,摸底试验和强化试验是针对研发阶段,暴露设计工艺缺陷的,鉴定试验是对研发阶段的定量考核,验收试验是批产阶段,保证可靠性水平不波动。


17

定量设计模式


第三种模式是定量设计模式,分两方面,一方面称为健壮性设计,就是三次设计方法,是日本一个教授发明的,60年代开始在日本的企业应用,70年代、80年代开始普及,日本企业把这个做的非常精致。


这个方法分三步。第一次设计为系统设计,是功能创新。第二次设计为参数设计,要把运行参数、性能参数调整到非线性的饱和区域。这个区域波动小,性能参数就稳定。第三次设计为容差设计,目标是质量损失最小。例如,螺母和螺杆是配套的零件,在一大批的零件里随机拿一个螺母和一个螺杆拧到一起,有一定的概率是拧不上的,这就是失效,这个概率允许有多少?一个复杂的产品有很多零件容差是累计到一起的,失效概率是多少呢?容差设计就是解决这个问题的。


通过三个步骤之后,实现功能创新、性能稳定、质量损失最小,可靠性自然就高了。 

稳定性设计:三次设计方法


第二个方面是,把性能稳定做好之后,还有高可靠长寿命目标。面对着长时间的使用需求,产品使用就要退化,不使用也退化,退化再加上可能遇到的各种各样的异常的条件,可能就要突发失效,图9给出的是一个高可靠长寿命设计技术体系图,是经过航空行业广泛应用过的。 


高可靠长寿命设计


18

故障补偿模式


第四种模式是故障补偿模式,也可以称之为健康管理模式。系统发生故障后对其进行维修的方式为反应式维修,是被动式维修。执行计划内预防性活动来检测系统异常,修理故障部件/系统的方式,为预防性维修。当前最新的是预计性维修,载体就是故障预测与健康管理。 


三种维修方式的比较


故障诊断、故障预测,健康管理形成一体化,根据诊断和预测的信息判别系统健康状态,是治未病,未病先防,所有叫健康管理。预测和健康管理是关键的转变。从事后的维修到事前的预判,是观念的转变。随着技术的发展,从自动化的维修也转变到智能化的维修。 


基于开放体系结构的事前维修系统框架


19

综合集成模式


把上述这些应用模式全都使用起来,将售后运维的数据统计做好,做好定量设计、试验考核、维修保障系统,这些加起来就是综合集成的模式。可靠性完整的结构就是这样的,全都做到了的话,可靠性系统工程也就成功实现了。 


综合集成模式


20

能力等级


可靠性系统工程能力等级,是根据可靠性系统工程能力的不同水平进行划分的,每一等级都代表了组织改进过程中经历的一个阶段。通过可靠性系统工程能力成熟度评价,可以判断企业可靠性做的好或不好。每一级都有详细的定义,企业要一步一步走,循序渐进。 


可靠性系统工程的能力等级


21

能力成熟度


第一级是已执行级。开始RMS(可靠性Reliability、维修性Maintenance、安全性Safety)各项工作,但工作项目不完善,各项工作处于混乱状态,没有良好的计划和跟踪监控,RMS工作不能和产品的设计、试验和生产过程相融合。RMS工作的效果,取决于执行工作的人员素质。


第二级是已管理级。RMS工作有专人负责,成为专业,并且与设计、试验和生产过程相融合,产品的RMS专业特性得到保证。一个项目中RMS工作的成功经验,可以在组织中的其他项目中复现。


第三级是已定义级。建立了组织的RMS标准规范,各项目实施中RMS工作均按照标准规范执行,产品RMS指标得到很大程度的提高,RMS工作结果可以被跟踪和控制的。


第四级是定量管理级。RMS工作的执行可用量化指标来度量,组织的RMS工程能力可以量化评测。通过量化的手段可以预测产品RMS指标的改进趋势、工作进度、成本需求。当超过不可接受的范围时,可以采取相应的手段加以纠正,从而实现对产品RMS工作的控制和管理。


第五级是优化级。组织能对RMS工作进行整合及优化。组织有能力识别出RMS工作的潜在缺陷并进行有针对性的过程改进。组织能主动吸取新技术或者完善已有的技术,组织可靠性系统工程能力会得到不断的改进和完善。


22

能力评价要点


在评判模型中,分成了10个评价项目,24个评价要点,103个打分点。好的企业从导入可靠性开始,快的话,可以用5年左右的时间,达到5级,但也有的企业长时间停在2级水平。 


能力评判模型

23

评价效果


航空企业中已经有20多个单位完成了能力评价,目前来讲他们达到了第三级,开始形成自己的标准。航空企业做的很好,也不过是在第二、三级水平,华为应该是在第五级的阶段。从可靠性角度来看,真的是很不一样。这个评价模型也可以用来企业自评。 


不同能力级别的评价效果


24

打造中国制造业可靠性系统工程生态圈


工业界、学术界、生产性服务业,共同构成了可靠性系统工程生态圈。


制造业企业是牵引可靠性工作的动力,可靠性需求会带来新的发展,更高的质量要求,更强的社会责任,最具有中国特色的中国产品的使用场景,这非常重要。例如,地铁出入口的闸机最初是采用西门子公司的产品,我们国产的产品不是没有,但是总出故障,影响使用,特别是高峰期,闸机出故障影响不好。鉴于西门子产品的可靠性很好,于是就安装了,一开始还都挺好,但是当地铁载客量越来越多时,西门子产品的故障率也高了起来。西门子公司也很奇怪,伴随着一百多年地铁历史而发展的公司,闸机怎么到中国就不好用了。西门子派人服务跟踪,他们先看我们的使用场景,然后发现中国人太多了,一个一个过闸机的频度是全世界最高的,频度不一样,他们的软件、硬件不适应这个频度,就出现故障了,所以使用场景不一样,也是影响可靠性的。 


可靠性系统工程生态圈


第二个就是学术圈。可靠性在大学里是一个成长中的新学科,可靠性正从工程走向科学,要培养大量的专业人才,做可靠性的更多的基础研究、技术研究。国外的一位可靠性教授说很羡慕我们,我说是羡慕我们有钱吗?国内现在科研投入增长很快,可靠性拿研究项目相对容易。他说你太LOW了,羡慕的不是这个,羡慕的是中国制造业的发展历程和使用场景跟国外不一样,质量可靠性的新问题在中国,近水楼台,会遇到学科发展的新问题,研究的东西是国外专家接触不到的,这样未来十年二十年后中国的可靠性学科就会走到世界领先地位了。这个思考的角度让我很受教育,也非常有信心。


第三个圈是生产性服务业,十九大报告里叫现代服务业,这是创业者的乐园。伴随着从制造大国向制造强国的转型,可靠性咨询服务作为现代服务业也要有跨越式发展了。


可靠性系统工程生态圈的发展,预示着我们正在交互打造中国可靠性的生态链,这是未来的发展方向和目标。




作者介绍

康锐,男, 1966年生。教育部长江学者,北航教授。分别于 1987年、 1990年获得北京航空航天大学电气工程专业学士、硕士学位。1990年在北航自动控制系毕业后到北航可靠性工程研究所和工程系统工程系任教,现任北京航空航天大学可靠性与系统工程学院总工程师、学术委员会主席、学位分委会主任、教授、博士生导师。兼任总装备部科技委委员、可靠性技术专业组组长、大型军用运输机质量可靠性及适航专家组组长、国防 973项目技术首席,可靠性与环境工程技术国防科技重点实验室学术委员会主任委员,《可靠性工程》主编、《航空学报》编委。

康锐教授主要研究方向为可靠性系统工程理论与技术、高可靠长寿命产品可靠性设计与试验理论与方法、装备综合保障理论与技术以及信息物理系统的可靠性建模与评价技术。出版专著 7部、译著 2部、北京市精品教材 2部,主持制定国家军用标准 1部,发表学术论文 240余篇, SCI检索 30余篇。获得国家科技进步二等奖 1项,省部级科技进步奖 7项,授权发明专利 18项。

推荐关注工业互联网研习社「视频号」👇👇👇


工业互联网研习社

新思想 | 新观念


   长按关注




首席知识官

有态度 | 有深度


  长按关注


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存