视频 | 龙源电力集团运行数据分析及优化中心李韶武：风人风语话数据 | 自由微信

视频 | 龙源电力集团运行数据分析及优化中心李韶武：风人风语话数据

Original 2016-10-20 李韶武 数据猿

<数据猿导读>

在本次《G20能效引领计划下的能源大数据》活动中，龙源电力集团运行数据分析及优化中心李韶武以《风人风语话数据》为主题发表了精彩演讲，李韶武表示：风电虽是清洁能源的主力军，跟火电及其他传统能源相比还具有一定差距，待到2020年，整个风电行业将实现大的突破

10月18日，由数据猿联合中关村大数据联盟、青域基金、中国工业节能与清洁生产协会余热利用专业委员会、百分点集团共同主办的《G20能效引领计划下的能源大数据》活动在北京成功举办。

活动现场主持人：数据猿创始人牟蕾

与会分享嘉宾有：

中国大数据产业联盟常务秘书长张涛

中国国电龙源电力集团（北京）风电工程技术有限公司运行数据分析及优化中心主管工程师李韶武

能源基金会工业节能项目主任、中国工业节能与清洁生产协会余热利用专业委员会指导委员会主任何平

青域基金合伙人牟颖

百分点集团能源行业架构师董继军

通用电气中国数字创新坊能源行业战略活动总监秦川

北京思诺环能科技有限公司创始人杨超

沈阳昊宸科技有限公司总经理王昱涵

云智环能科技（北京）有限公司总经理张隽永

视频版

https://v.qq.com/txp/iframe/player.html?vid=r0338loujhb&width=500&height=375&auto=0

文字版

以下内容为“龙源电力集团运行数据分析及优化中心李韶武”分享，并由数据猿编辑整理发布：

李韶武：首先为大家介绍我们集团的示意图，每一个中心都代表了风电场，在我们的印象中，所有的风电场都是处在比较偏僻的地方。至于风电场是什么样的呢？

我们龙源在戈壁拥有一个风电场，不仅可以看到很多风机、黄羊，还可以挖锁阳，锁阳号称是戈壁滩的人参。除此之外，我们在呼伦贝尔大草原、西藏等多地都拥有自己的风电场，同时西藏风电场也是中国首个藏区风电场，附近的景色十分迷人。

其次是风电场实时的示意图，一个风电场一般情况下是5万的容量，33台风机，这些风机分布在整个风电场里面，我们可以明显感觉到，风电场和其他发电企业存在很大差异。

“风机”跟“飞机”只有一字之差，事实上其构造也跟飞机非常相似，都需要有像机翼一样的叶片，这个叶片旋转吸收风能，风能转化成机械能，再由机械能转化成电能，把电能输入给电网，这就是风机对能源的转化过程。

从外观看，风机的构成并不复杂，仅仅是由三只叶片、一根机舱以及一个塔架组成的，但其实里面是非常复杂的系统。每一个风机都是自成系统，因此需要采集到时时刻刻的数据，并把这些数据收集下来。

下面先给大家展示三个小的案例：

案例一

风电行业采集数据的频率是1秒钟采集一次，实时数据展示都是每秒的数据，每10分钟把这些数据处理完之后，存到数据库里面。在小风速的时候，比如在2米每秒以下的情况下，风机没有发电；而风速比较高的时候，同样也没有发电。这是因为我们风机里面存在切入风速和切出风速，只有在切入和切出之间，风机才是正常的运转状态。此外，当风速已经超过3之后，它还有很多点是处在没有发电的状态，这个我们称之为停机状态。

以前在我们风电领域，有一个指标叫可利用率，就是说正常的运行时间比上总的时间，这称之为可利用率，可以帮助我们一目了然地发现风机是否在运转。可是运营商更多关注的是整个性能和它停机的存储电量。

案例二

再给大家举一个例子，这里有一个1.5兆瓦的风机，1.5兆瓦，换一个说法就是1500千瓦。比如说现在风速是10米，刮一小时就可以得到1500度电。在6米每秒的时候，它的功率只有大概300度每小时，7米的时候可能是400度。

我们现在一个风电场就拥有多台风机，像汽车一样，同一个型号的汽车，或者说同一个型号的风机，它的性能是不是一样的呢？这就需要从数据中来寻找答案，我们这里展示了三个风机的性能，每一个颜色表示一个风机。

不同颜色，可以看出来性能有很大的差异，我们把发电性能分为两部分：即风机之间发电性能的一致性和它的稳定性，对于运营商来说是非常重要的。当我们发现它的一致性出现问题的时候，就想知道它背后是什么原因导致它发生了这些问题？

风电领域，除了刚才跟大家说到的风速和功率之外，我们还收集了很多其他传感器的数据。风电领域里面有非常重要的两个参数，一个是叶片的旋转速度，一个是叶片的角度。

旋转速度其实跟飞机的角度是相类似的，飞机在上升和下降的时候，它的机翼和风的速度是有差异的，这个角度被称为桨区角，风机发电性能不一样，跟它控制策略的参数的差异是一样的。

案例三

除了看风机之间的差异之外，一个风机本身发电性能出现了，但一些点在正常的发电性能之外，这个时候就应该对这些点单独进行分析，要看看它是什么原因，导致发生了这些问题。当一些点都集中在区域的上方时，这个参数我们称之为齿内箱油温，由于齿内箱油温高，导致风机发电性能受到限制。像这样会损失很多电量，也是运营商极力避免的事情。

我们对数据的分析，除了刚才利用可视化的方式之外，还尝试从其他的角度着手。我们会看这些发电性能数据随时间的变化情况，同时我们还会从3D效果的展示上，看是不是能够快速的发现一些问题。

上面给大家简单介绍了风电场的基本情况，和风机的情况。下面进入主题：《风人风语话数据》。

我们龙源是目前国内最早从事风电运营的发电企业，拥有超过11000台机组，分布在200个风电场，全国24个省份都有风电场。在中国每6台风机中，其中就有一台是属于龙源的，风电发出的电里面，每4度里面，有1度属于龙源。我们现在也是国内和世界上最大的风电运营商。

刚才也提到了，运营商非常关注性能损失和停机的损失。我们刚才也通过一台一台手动的形式，用可视化的方法，把这些问题查找出来。当我们面对整个集团一万多台风机的时候，采用这种方式肯定不行。于是就想能不能找到一个更加方便的解决方案，帮助我们自动实现这个问题。

怎么去解决呢？我们一般会考虑到整个风机，它感受到多少风，应该发多少电量出来。如果没有能够正常发出电量，就称之为损失电量，这些损失电量又分为性能问题损失的和停机损失的。

风机的数据是非常异常的，它不像我们想的那么干净和整洁，因此我们在去年做了一个事情，把整个集团的一万多台风机的发电性能的模式做了一个聚类和分析，可以看到一共有8种模式，这8种模式下，每一个不在正常状态的都表示了电量的损失，以及效益上的损失。因此我们非常想知道，哪些因素导致它发生了改变？什么时候发生改变？

因此就有了数据分析的两个重点：我们要先找到发生问题的时间，再找到发生问题的原因。为了找到发生问题的时间，我们用了一个方法，叫变点分析法，该方法目前在金融领域等被广泛应用。这个方法是把风机比较重要的参数，跟性能有关系的，比如说时间、风速、功率，做时间排列，然后自动识别出这些性能在什么时候发生的改变。

我们是2014年把它做出来的，2015年投入运用。2014年在我们集团发生了一件非常有意思的事情。当年在江苏省有一个风电场，买的国内最有名的风机制造厂商的风机，买了之后，前一个星期它的发电性能非常非常好，但是三个月之后，它的性能反复出现问题，有时候特别好，有时候特别差，包括我们的领导，也包括风机厂家都不知道原因是什么。

领导说你们要不然分析一下，我们就把这个数据拿过来，用变点分析法分析了一下，之后发现9个点发生了改变，后来我们又把这些数据跟天气数据进行比对，发现所有的点都跟下雨天对应，什么意思？当下完雨之后，风机的性能马上上升，只要不下雨，性能马上下降。

我们发现这个问题之后，跟厂家一块去现场进行勘察，发现叶片设计的不是很合理，叶片对污染物的敏感性特别高，只要是积累了脏东西之后，性能马上下降，因此我们后来做了一些别的尝试，在2015年把这个方法投入了实际运行。

我们前面也提到了，机组之间的一致性有时候会出现差异。为了分析整个集团的数据，我们做了功率属性异常机组问题挖掘。它是基于系统本身的问题和我们主要关注的一些重要的参数，我们在这里面做了数据之间的分析，并建立了数据分析的模型。

还有机组本身的差异，像这样的发电性能的图，当我脱离正常点之外，它背后一定有一些参数出现了差异。发展这些方法，主要是为了告诉我们，我们能够在什么时间点发现这些性能发生了改变，它背后的原因是什么。

我们刚才说的都是跟性能分析有关系的，我们还有很多停机的问题，今天由于时间原因，就不多做介绍了。这些分析的方法也好，案例也好，都是离散的。我们为了整个集团运用，开发了一个系统，叫效能分析系统。

后面有很多数据，包括我们整个风电行业几乎所有的数据源，一共有8个，同时这个系统提供性能分析和故障分析，能够帮助集团公司，帮助省公司，帮助风电场，发现集团公司内应该关注哪些异常的省份，应该关注哪些异常的风电场，风电场内可以找到异常的风机，并且找到异常原因。

一个运行分析数据部门，每天做这么多分析，并且分析出那么多问题，其实并没有用，因为没有创造出价值。我的发电量还是那样没有提升，这个怎么办？我们想能不能从数据分析中，找到优化的方向，找到优化方向之后，做完了优化，还要评估一下，它是不是真的提升了，这些都是跟数据分析有关系的。

我们在2013、2014年做了很多分析，积累了大量的数据和样本的结果，我们把23个风电场的性能问题进行了分析，并统计了其占全厂的比例。说到性能不佳的原因，其中最应该关注的只有4类，这4类占到所有的75%：第一个是方向标的，第二个组建高温，第三个是控制参数，最后是叶片安装角度。通过这些，发现了我们应该优化的方向是哪里。

前面说了很多数据模型，这些数据模型需要强大的计算能力，尤其是在我们面对很多数据量的时候，我们每一个风电场，每年大概可以产生3T到30个T的数据，整个集团每年的数据量大概是100T到上千个T左右，除了计算能力之外，我们还需要把结果进行统计，通过这些统计发现我们优化的方向，指导我们进行生产和运行。这个就是根据我们前面所发现的那些跟性能有关的问题，所找到的优化的方向。

说完了性能问题，下面就是刚才没有说的停机的问题了，当机器发生故障，就停机了。一般说停机这一块，是针对现场故障问题。我停机时间比较长，停机时机不对，什么叫时机不对？比如说小风电的时候，希望它停，不希望它大风电停。针对这些，我们从大数据的角度做了一些分析。比如说像停机时间长的，我们开发了三个系统：远程基础设施系、智能诊断系统和备件定额存储系统。

说到故障诊断系统，我们收取的都是知识库的数据，也就是一些不能够直接处理的非结构化数据。我们收集了整个集团的所有机型的所有故障数据，把它形成了一个统一的故障数的形式，帮助现场人员快速定位，并快速进行反馈。因为现在每个厂家在这一块的故障数不一样，做完统计数之后，就可以让所有集团用统一的语言进行交流。

我们每一个风电场还制订了备件的消耗需求，可以帮助风电场科学地制定备件消耗的存储计划。

我们在故障运行这一块用了很多大数据的技术，风机什么时候坏，做一个运行就知道了。现在在风电领域有一个更重要的问题是大部件的预警。像叶片、齿轮箱、发电机、便电器，这些都是大部件，因为它本身的更换成本非常高，价值也非常高，所以对大部件的预警是非常关键的。在2014、2015年，我们集团发生了比较多起的大部件组坏事件，其中叶片和齿轮箱占80%以上。

多年前在山东某一个风电场，当时这个风电场不是建立在非常偏僻的地方，而是在公路边上。叶片损坏之后，就直接掉下来了，旁边就是一个公路，差一点砸到过往的行人和汽车，由于这个事情，整个风电场停运了小半年。一个风电场停运小半年，我们损失了3000到5000万的电量，就是1500万到2500万，所以说，像这样的事情在整个风电领域是时有发生的，对这个需求也是非常大的。

于是我们就想能够把大部件预警的技术做出来，我们一开始尝试了很传统的数据分析方式，尝试了三个月，整个集团很多人都在做这个事情，但是没有出来。后来就跟我们合作方一起，尝试大数据的更深入学习，以及跟机翼学习有关的一些模型，后来我们把整厂的26个参数都拿了出来，然后利用全新的机翼学习模型，就把这个事情做出来了。

刚开始是用单机去跑的，单机跑完之后，出现了一个哭笑不得的事，算出来了很高兴，可是我们跑一台单机需要23个小时，肯定不能这么干，因为我们都是实时的。所以我们就用大数据技术，成功地把时间提到我们可以接受的程度。

拥有这样的大部件预警技术之后，能够提前预知叶片要坏的时间，并做好充足准备。同时该技术还跟我们的风光预测系统结合，可以提前预知什么时候刮什么风，并作出相应的更换或者无休计划。

现在在风电领域有很多像技改，风机发现性能都没有达到最优效果，可能是设计的问题，也有可能是别的问题。有的厂家没有那么强的技术实力，所以我们开发了一个优化，优化完了要评估。其实就是一个合同能源管理的雏形，比如说一个厂家给我们做优化，做完了优化，我们算完了收益之后，是要跟人经济分成的，这一块也需要用到大量的数据，而且在这一块，我们要算的结果要更加的精准，所以也用到了很多数据分析的技术。

我们刚才说的都是风机刚装完，对以前的历史数据进行处理，看看已经存在的一些问题。除此之外，在风电领域最重要的是监视的数据，那都是实时的数据。监视的数据量更大，需要更多的跟大数据有关的技术。

我们集团在2014年的时候，对大数据不是很理解，当时就想大数据能不能在风电圈存活下来？我们有没有必要用？因此一开始做分析的时候，就是简单的可视化软件，算一下就行了。

后来发现这个数据量是非常巨大的，而且我们不仅用到传统的分析数据，还有很多别的数据，比如CMS系统、配件系统、故障诊断系统，这些系统不仅收集了风机和设备的数据，也有很多人的数据，所以数据多样性这个特点目前在风电领域还是比较显著的。有了这样的数据之后，需要强大的计算能力，才能把数据和结果呈现出来，这个数据量也是非常巨大的。

在整个风电领域里面，我们是一个全生命周期的管理。因为我们是运营商，不是太关心技术，我们关心的是我投了钱之后，能够得到足够的收益。如果现在出3个亿，想建一个风电场，需要选择风能源最好的地方建，建完之后，还要在风电场的这些机位上，找到最合适的机位，还要选择最合适的设备，什么是合适的设备？不是说贵就是好。既需要好，还需要它稳定，还需要它备件便宜、故障率低，生产期的事情做好，才能最大化的提高收益。

给大家举一个简单的例子。像天气预报，大家觉得这只有气象局可以做，事实上，在整个风电圈里面，有三四家都可以做到这一块，他们可以清楚知道哪些地方风资源比较好，哪些地方风资源比较差，可以拿这个来选风电场，做微观选址，找合适的机位。但数据量是非常巨大的。

举一个简单的例子，像江苏省，4个江苏省大概是38万平方公里，我们如果需要测量一年的数据，大概要用到96000个课时，会产生20个数据，像整个中国，这个数据每年都是1000个T，而且精度还比较差，如果我们定义成20米，这个数据量的规模可想而知。

运营商最关注的还是发电量，风电虽然说是清洁能源的主力军，但跟火电以及其他传统能源相比还具有一定差距，所以我们最终关注的还是度电成本。2020年，整个风电装机比现在将翻一番，能源也要翻一番，希望以后在大数据的建设时期，我们能够跟各位去探讨更多的算法，去研究更多的模型，去开发更多的系统，也希望跟合作方和各位一起共同进步，谢谢大家！

来源：数据猿

宾曰语云被法学教授投诉：严重侵权，“违法犯罪”！

二湘：朱令去世一周年，清华学子控诉清华在朱令案中的冷血和无耻

“上海王”柯庆施之死的真相

毕业论文辅导| 你又不是伞，硕士论文|毕业论文|博士论文|课题论文不行就被硬撑了,靠谱的辅导机构才是晴雨伞！

缺人：60r/次，立结~