查看原文
其他

视频 | 龙源电力集团运行数据分析及优化中心李韶武:风人风语话数据

2016-10-20 李韶武 数据猿
<数据猿导读>

在本次《G20能效引领计划下的能源大数据》活动中,龙源电力集团运行数据分析及优化中心李韶武以《风人风语话数据》为主题发表了精彩演讲,李韶武表示:风电虽是清洁能源的主力军,跟火电及其他传统能源相比还具有一定差距,待到2020年,整个风电行业将实现大的突破




10月18日,由数据猿联合中关村大数据联盟、青域基金、中国工业节能与清洁生产协会余热利用专业委员会、百分点集团共同主办的《G20能效引领计划下的能源大数据》活动在北京成功举办。


活动现场主持人:数据猿创始人牟蕾


与会分享嘉宾有:


中国大数据产业联盟常务秘书长 张涛

中国国电龙源电力集团(北京)风电工程技术有限公司运行数据分析及优化中心主管工程师 李韶武

能源基金会工业节能项目主任、中国工业节能与清洁生产协会余热利用专业委员会 指导委员会主任 何平

青域基金 合伙人 牟颖

百分点集团能源行业架构师 董继军

通用电气中国数字创新坊 能源行业战略活动总监 秦川

北京思诺环能科技有限公司 创始人 杨超

沈阳昊宸科技有限公司 总经理 王昱涵

云智环能科技(北京)有限公司 总经理 张隽永




视频版 

https://v.qq.com/txp/iframe/player.html?vid=r0338loujhb&width=500&height=375&auto=0


文字版 

以下内容为“龙源电力集团运行数据分析及优化中心李韶武”分享,并由数据猿编辑整理发布:


李韶武:首先为大家介绍我们集团的示意图,每一个中心都代表了风电场,在我们的印象中,所有的风电场都是处在比较偏僻的地方。至于风电场是什么样的呢?


我们龙源在戈壁拥有一个风电场,不仅可以看到很多风机、黄羊,还可以挖锁阳,锁阳号称是戈壁滩的人参。除此之外,我们在呼伦贝尔大草原、西藏等多地都拥有自己的风电场,同时西藏风电场也是中国首个藏区风电场,附近的景色十分迷人。


其次是风电场实时的示意图,一个风电场一般情况下是5万的容量,33台风机,这些风机分布在整个风电场里面,我们可以明显感觉到,风电场和其他发电企业存在很大差异。


“风机”跟“飞机”只有一字之差,事实上其构造也跟飞机非常相似,都需要有像机翼一样的叶片,这个叶片旋转吸收风能,风能转化成机械能,再由机械能转化成电能,把电能输入给电网,这就是风机对能源的转化过程。


从外观看,风机的构成并不复杂,仅仅是由三只叶片、一根机舱以及一个塔架组成的,但其实里面是非常复杂的系统。每一个风机都是自成系统,因此需要采集到时时刻刻的数据,并把这些数据收集下来。


下面先给大家展示三个小的案例:


案例一


风电行业采集数据的频率是1秒钟采集一次,实时数据展示都是每秒的数据,每10分钟把这些数据处理完之后,存到数据库里面。在小风速的时候,比如在2米每秒以下的情况下,风机没有发电;而风速比较高的时候,同样也没有发电。这是因为我们风机里面存在切入风速和切出风速,只有在切入和切出之间,风机才是正常的运转状态。此外,当风速已经超过3之后,它还有很多点是处在没有发电的状态,这个我们称之为停机状态。


以前在我们风电领域,有一个指标叫可利用率,就是说正常的运行时间比上总的时间,这称之为可利用率,可以帮助我们一目了然地发现风机是否在运转。可是运营商更多关注的是整个性能和它停机的存储电量。


案例二


再给大家举一个例子,这里有一个1.5兆瓦的风机,1.5兆瓦,换一个说法就是1500千瓦。比如说现在风速是10米,刮一小时就可以得到1500度电。在6米每秒的时候,它的功率只有大概300度每小时,7米的时候可能是400度。


我们现在一个风电场就拥有多台风机,像汽车一样,同一个型号的汽车,或者说同一个型号的风机,它的性能是不是一样的呢?这就需要从数据中来寻找答案,我们这里展示了三个风机的性能,每一个颜色表示一个风机。


不同颜色,可以看出来性能有很大的差异,我们把发电性能分为两部分:即风机之间发电性能的一致性和它的稳定性,对于运营商来说是非常重要的。当我们发现它的一致性出现问题的时候,就想知道它背后是什么原因导致它发生了这些问题?


风电领域,除了刚才跟大家说到的风速和功率之外,我们还收集了很多其他传感器的数据。风电领域里面有非常重要的两个参数,一个是叶片的旋转速度一个是叶片的角度


旋转速度其实跟飞机的角度是相类似的,飞机在上升和下降的时候,它的机翼和风的速度是有差异的,这个角度被称为桨区角,风机发电性能不一样,跟它控制策略的参数的差异是一样的。


案例三


除了看风机之间的差异之外,一个风机本身发电性能出现了,但一些点在正常的发电性能之外,这个时候就应该对这些点单独进行分析,要看看它是什么原因,导致发生了这些问题。当一些点都集中在区域的上方时,这个参数我们称之为齿内箱油温,由于齿内箱油温高,导致风机发电性能受到限制。像这样会损失很多电量,也是运营商极力避免的事情。


我们对数据的分析,除了刚才利用可视化的方式之外,还尝试从其他的角度着手。我们会看这些发电性能数据随时间的变化情况,同时我们还会从3D效果的展示上,看是不是能够快速的发现一些问题。


上面给大家简单介绍了风电场的基本情况,和风机的情况。下面进入主题:《风人风语话数据》。


我们龙源是目前国内最早从事风电运营的发电企业,拥有超过11000台机组,分布在200个风电场,全国24个省份都有风电场。在中国每6台风机中,其中就有一台是属于龙源的,风电发出的电里面,每4度里面,有1度属于龙源。我们现在也是国内和世界上最大的风电运营商。


刚才也提到了,运营商非常关注性能损失和停机的损失。我们刚才也通过一台一台手动的形式,用可视化的方法,把这些问题查找出来。当我们面对整个集团一万多台风机的时候,采用这种方式肯定不行。于是就想能不能找到一个更加方便的解决方案,帮助我们自动实现这个问题。


怎么去解决呢?我们一般会考虑到整个风机,它感受到多少风,应该发多少电量出来。如果没有能够正常发出电量,就称之为损失电量,这些损失电量又分为性能问题损失的和停机损失的。


风机的数据是非常异常的,它不像我们想的那么干净和整洁,因此我们在去年做了一个事情,把整个集团的一万多台风机的发电性能的模式做了一个聚类和分析,可以看到一共有8种模式,这8种模式下,每一个不在正常状态的都表示了电量的损失,以及效益上的损失。因此我们非常想知道,哪些因素导致它发生了改变?什么时候发生改变?


因此就有了数据分析的两个重点:我们要先找到发生问题的时间,再找到发生问题的原因。为了找到发生问题的时间,我们用了一个方法,叫变点分析法,该方法目前在金融领域等被广泛应用。这个方法是把风机比较重要的参数,跟性能有关系的,比如说时间、风速、功率,做时间排列,然后自动识别出这些性能在什么时候发生的改变。


我们是2014年把它做出来的,2015年投入运用。2014年在我们集团发生了一件非常有意思的事情。当年在江苏省有一个风电场,买的国内最有名的风机制造厂商的风机,买了之后,前一个星期它的发电性能非常非常好,但是三个月之后,它的性能反复出现问题,有时候特别好,有时候特别差,包括我们的领导,也包括风机厂家都不知道原因是什么。


领导说你们要不然分析一下,我们就把这个数据拿过来,用变点分析法分析了一下,之后发现9个点发生了改变,后来我们又把这些数据跟天气数据进行比对,发现所有的点都跟下雨天对应,什么意思?当下完雨之后,风机的性能马上上升,只要不下雨,性能马上下降。


我们发现这个问题之后,跟厂家一块去现场进行勘察,发现叶片设计的不是很合理,叶片对污染物的敏感性特别高,只要是积累了脏东西之后,性能马上下降,因此我们后来做了一些别的尝试,在2015年把这个方法投入了实际运行。


我们前面也提到了,机组之间的一致性有时候会出现差异。为了分析整个集团的数据,我们做了功率属性异常机组问题挖掘。它是基于系统本身的问题和我们主要关注的一些重要的参数,我们在这里面做了数据之间的分析,并建立了数据分析的模型。


还有机组本身的差异,像这样的发电性能的图,当我脱离正常点之外,它背后一定有一些参数出现了差异。发展这些方法,主要是为了告诉我们,我们能够在什么时间点发现这些性能发生了改变,它背后的原因是什么。


我们刚才说的都是跟性能分析有关系的,我们还有很多停机的问题,今天由于时间原因,就不多做介绍了。这些分析的方法也好,案例也好,都是离散的。我们为了整个集团运用,开发了一个系统,叫效能分析系统。


后面有很多数据,包括我们整个风电行业几乎所有的数据源,一共有8个,同时这个系统提供性能分析和故障分析,能够帮助集团公司,帮助省公司,帮助风电场,发现集团公司内应该关注哪些异常的省份,应该关注哪些异常的风电场,风电场内可以找到异常的风机,并且找到异常原因。


一个运行分析数据部门,每天做这么多分析,并且分析出那么多问题,其实并没有用,因为没有创造出价值。我的发电量还是那样没有提升,这个怎么办?我们想能不能从数据分析中,找到优化的方向,找到优化方向之后,做完了优化,还要评估一下,它是不是真的提升了,这些都是跟数据分析有关系的。


我们在2013、2014年做了很多分析,积累了大量的数据和样本的结果,我们把23个风电场的性能问题进行了分析,并统计了其占全厂的比例。说到性能不佳的原因,其中最应该关注的只有4类,这4类占到所有的75%:第一个是方向标的,第二个组建高温,第三个是控制参数,最后是叶片安装角度。通过这些,发现了我们应该优化的方向是哪里。


前面说了很多数据模型,这些数据模型需要强大的计算能力,尤其是在我们面对很多数据量的时候,我们每一个风电场,每年大概可以产生3T到30个T的数据,整个集团每年的数据量大概是100T到上千个T左右,除了计算能力之外,我们还需要把结果进行统计,通过这些统计发现我们优化的方向,指导我们进行生产和运行。这个就是根据我们前面所发现的那些跟性能有关的问题,所找到的优化的方向。   


说完了性能问题,下面就是刚才没有说的停机的问题了,当机器发生故障,就停机了。一般说停机这一块,是针对现场故障问题。我停机时间比较长,停机时机不对,什么叫时机不对?比如说小风电的时候,希望它停,不希望它大风电停。针对这些,我们从大数据的角度做了一些分析。比如说像停机时间长的,我们开发了三个系统:远程基础设施系、智能诊断系统和备件定额存储系统。


说到故障诊断系统,我们收取的都是知识库的数据,也就是一些不能够直接处理的非结构化数据。我们收集了整个集团的所有机型的所有故障数据,把它形成了一个统一的故障数的形式,帮助现场人员快速定位,并快速进行反馈。因为现在每个厂家在这一块的故障数不一样,做完统计数之后,就可以让所有集团用统一的语言进行交流。

我们每一个风电场还制订了备件的消耗需求,可以帮助风电场科学地制定备件消耗的存储计划。


我们在故障运行这一块用了很多大数据的技术,风机什么时候坏,做一个运行就知道了。现在在风电领域有一个更重要的问题是大部件的预警。像叶片、齿轮箱、发电机、便电器,这些都是大部件,因为它本身的更换成本非常高,价值也非常高,所以对大部件的预警是非常关键的。在2014、2015年,我们集团发生了比较多起的大部件组坏事件,其中叶片和齿轮箱占80%以上。


多年前在山东某一个风电场,当时这个风电场不是建立在非常偏僻的地方,而是在公路边上。叶片损坏之后,就直接掉下来了,旁边就是一个公路,差一点砸到过往的行人和汽车,由于这个事情,整个风电场停运了小半年。一个风电场停运小半年,我们损失了3000到5000万的电量,就是1500万到2500万,所以说,像这样的事情在整个风电领域是时有发生的,对这个需求也是非常大的。


于是我们就想能够把大部件预警的技术做出来,我们一开始尝试了很传统的数据分析方式,尝试了三个月,整个集团很多人都在做这个事情,但是没有出来。后来就跟我们合作方一起,尝试大数据的更深入学习,以及跟机翼学习有关的一些模型,后来我们把整厂的26个参数都拿了出来,然后利用全新的机翼学习模型,就把这个事情做出来了。


刚开始是用单机去跑的,单机跑完之后,出现了一个哭笑不得的事,算出来了很高兴,可是我们跑一台单机需要23个小时,肯定不能这么干,因为我们都是实时的。所以我们就用大数据技术,成功地把时间提到我们可以接受的程度。


拥有这样的大部件预警技术之后,能够提前预知叶片要坏的时间,并做好充足准备。同时该技术还跟我们的风光预测系统结合,可以提前预知什么时候刮什么风,并作出相应的更换或者无休计划。


现在在风电领域有很多像技改,风机发现性能都没有达到最优效果,可能是设计的问题,也有可能是别的问题。有的厂家没有那么强的技术实力,所以我们开发了一个优化,优化完了要评估。其实就是一个合同能源管理的雏形,比如说一个厂家给我们做优化,做完了优化,我们算完了收益之后,是要跟人经济分成的,这一块也需要用到大量的数据,而且在这一块,我们要算的结果要更加的精准,所以也用到了很多数据分析的技术。


我们刚才说的都是风机刚装完,对以前的历史数据进行处理,看看已经存在的一些问题。除此之外,在风电领域最重要的是监视的数据,那都是实时的数据。监视的数据量更大,需要更多的跟大数据有关的技术。


我们集团在2014年的时候,对大数据不是很理解,当时就想大数据能不能在风电圈存活下来?我们有没有必要用?因此一开始做分析的时候,就是简单的可视化软件,算一下就行了。


后来发现这个数据量是非常巨大的,而且我们不仅用到传统的分析数据,还有很多别的数据,比如CMS系统、配件系统、故障诊断系统,这些系统不仅收集了风机和设备的数据,也有很多人的数据,所以数据多样性这个特点目前在风电领域还是比较显著的。有了这样的数据之后,需要强大的计算能力,才能把数据和结果呈现出来,这个数据量也是非常巨大的。


在整个风电领域里面,我们是一个全生命周期的管理。因为我们是运营商,不是太关心技术,我们关心的是我投了钱之后,能够得到足够的收益。如果现在出3个亿,想建一个风电场,需要选择风能源最好的地方建,建完之后,还要在风电场的这些机位上,找到最合适的机位,还要选择最合适的设备,什么是合适的设备?不是说贵就是好。既需要好,还需要它稳定,还需要它备件便宜、故障率低,生产期的事情做好,才能最大化的提高收益。


给大家举一个简单的例子。像天气预报,大家觉得这只有气象局可以做,事实上,在整个风电圈里面,有三四家都可以做到这一块,他们可以清楚知道哪些地方风资源比较好,哪些地方风资源比较差,可以拿这个来选风电场,做微观选址,找合适的机位。但数据量是非常巨大的。


举一个简单的例子,像江苏省,4个江苏省大概是38万平方公里,我们如果需要测量一年的数据,大概要用到96000个课时,会产生20个数据,像整个中国,这个数据每年都是1000个T,而且精度还比较差,如果我们定义成20米,这个数据量的规模可想而知。   


运营商最关注的还是发电量,风电虽然说是清洁能源的主力军,但跟火电以及其他传统能源相比还具有一定差距,所以我们最终关注的还是度电成本。2020年,整个风电装机比现在将翻一番,能源也要翻一番,希望以后在大数据的建设时期,我们能够跟各位去探讨更多的算法,去研究更多的模型,去开发更多的系统,也希望跟合作方和各位一起共同进步,谢谢大家!


来源:数据猿


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存