近两年,随着工业4.0和中国制造2025的提出(相关文章请点击文末超链接),利用数据分析技术得到智能信息并创造和发现新的知识和价值成为了第四次工业革命的最终目标之一。工业大数据是一个新的概念,泛指工业领域的大数据,既包括企业内部制造系统所产生的大量数据,也包括企业外部的大数据。随着测量技术和DCS等控制系统的广泛普及,过程工业中的数据采集相对商业、互联网等行业来说较容易,但由于其各个参数之间还会存在着内在的机理关系,因此其分析难度较大,而且工业生产过程对分析精度的要求也比较高。传统意义上的大数据有4个典型特点(4V),即海量性(volume)、多样性(variety)、高速性(velocity)和易变性(variability)。但由于工业本身具有设备大型化,工艺连续程度高,各参数之间存在复杂的机理关系等特点,工业大数据除了具有以上的4V特性外,还具有以下特点:
在工业生产过程中,常常伴随着多种物理和化学变化,而且各参数之间高度耦合,它们共同构成了一个复杂多变的系统,对这些过程的描述是高维度的。过程工业中各类参数之间的关系都是非线性的,例如在热力学中的压力、温度与熵值和焓值之间以及反应温度和反应速度之间都是典型的非线性关系,这种强烈的非线性关系给数据的理解和知识的挖掘带来了很大的挑战。在生产过程中各种设备和参数应尽可能地运行在理想状态下,但由于各种原因,各参数会发生一定的波动。例如化工生产装置中在开工期间与正常运行时操作工况会存在一些差异;另外,由于原料的性质不是固定不变的,所以操作条件也一直处于波动状态。虽然现如今测量和传感技术已经达到了较高的水平,但由于某些客观原因,比如装置测量仪表损坏,数据信号传输过程中失真等因素,所采集到的数据都会存在大量的噪声。另外,测量环境也会给测量结果造成一定的影响,当测量坏境突变时也会产生大量的噪声。针对海量数据的分析方法目前有很多种,按照功能可以大概分为降维分析、聚类与分类分析、相关性分析和预测分析四大类,每类分析方法中又包含众多不同的算法。降维是将数据从高维度约减到低维度的过程,可以有效地克服过程工业大数据高维度的特点和所谓的“维数灾难”。由于目前所需要处理的数据均为高维度的数据,常常将其作为数据的前处理过程。所谓聚类分析就是指将数据区分为不同的自然群体,每个群体之间具有不同的特征,同时也可以获得每个群体的特征描述。它是一种基于无监督的学习方案,可以用来探索数据。同时,经过聚类分析后的数据可以更进一步进行数据的预测和内容检索等,提高数据挖掘的效率和准确性。
分类分析是指根据数据集的特点构造一个分类器,再根据这个分类器对需要分类的样本赋予其类别。与聚类分析最大的不同的就是分类分析在对数据进行归类之前已经规定了分类的规则,而聚类分析在归类之前没有任何规则,在归类之后才得到每个类别的特点。目前分类算法也存在很多种,按照各算法的技术特点可以分为决策树分类法、Bayes分类法、基于关联规则的分类法和基于数据库技术的分类法等。相关性分析就是研究数据与数据之间的关联程度。该分析方法一直是统计学中研究的热点,已经在金融、心理和气象学中得到了广泛的应用。相关性主要用来表述两个变量之间的关系,是两变量之间密切程度的度量。目前常使用的多变量相关性分析方法有Granger因果关系分析、典型相关分析、灰色关联分析、Copula分析和互信息分析等。基于数据的预测分析是一种从功能上定义的广义概念,在工业生产中包括很大的范畴,例如过程工业中产品质量和产率的预测、生产操作中的优化、预警和装置的故障诊断都可以归属于数据分析中的预测范畴。最常使用的预测分析方法就是应用各种神经网络算法以及其与各种优化算法的结合。目前,应用相对成熟的神经网络有BP神经网络、GRNN神经网络、RBF网络等。神经网络具有以下优点:①理论上能够逼近任意非线性映射;②善于处理多输入输出问题;③能够进行并行分布式处理;④自学习与自适应性强;⑤可同时处理多种定性和定量的数据。目前,大数据分析技术在过程工业中的应用还处于起步阶段,所采用的方法与核心分析手段还是围绕数据挖掘技术的基本算法展开的,只是将该基本算法借助先进的计算机技术应用到更大量的数据范围内,从而发现更有价值的知识,获得更有意义的信息[1]。随着社会生产力的发展促使了企业不但要提高装置的生产效率,提高产品的质量,而且还需要将其对环境的危害降到最低。面对如此严峻的生产形势,工业过程优化则体现出极大的优势,因为过程优化可以有效地跟踪整个装置或企业生产经济利益最优的途径,还可以有效地克服工业过程的干扰和设备性能变化所产生的影响,可以实现经济利益和生产目标的双重最大化。工业过程优化分为动态优化和稳态优化两类情况。而进行过程优化的方法也有很多,其中基于数据分析技术的过程工业优化成为了一个新的研究思路。以石化行业为例,郭超[2]针对常减压蒸馏过程,基于原油电脱盐的数据采用C4.5决策树算法建立了决策树模型,根据该模型对数据进行聚类并提取分类规则,进而找到影响工业上原油电脱盐效果的关键性影响因素,该结果对改进电脱盐装置的操作提供了有效可行的指导方案。
蓝兴英教授团队将互信息的概念应用到某炼油企业提升管反应器的温度监测点分析中,研究了提升管上6个温度点40天的生产数据,得到两两温度点之间的互信息熵并分析其数值,发现提升管反应器的热量主要来源,极大地降低了提升管反应器的操作难度,为工业生产提供了重要的指导意见。当代过程工业生产不断向大型化、连续化、高速化、智能化和精细化的方向发展,其工业过程和设备日益复杂,因此,过程监测和故障诊断已经成为了工业发展的必然趋势。过程监测和故障诊断一般分为信号采集、特征提取、状态识别和诊断决策4个主要步骤,这4个步骤是一个循环的过程,对于复杂的故障通常需要多个循环过程才能提高诊断的准确度,进而解决问题。现今故障发生的原因和机理复杂程度的不断加深,传统的方法已经很难解决这些新的问题。目前,各类化工原料和合成材料大部分均来自石油化工工业,其中乙烯生产装置是石油石化工业的龙头装置,裂解炉是乙烯生产装置的核心。但随着乙烯裂解炉的单炉处理能力增加,设备大型化程度和复杂程度大幅增加,操作难度逐渐复杂,设备故障频发,张晓丹[3]将免疫克隆算法和LVQ神经网络相结合建立的故障诊断模型具有很好的分类性能,该模型可以准确地诊断乙烯裂解炉运行故障,提高了装置运行的安全性和可靠性,同时也为乙烯收率和后续工段的操作稳定性提供有效的保障。聚丙烯是一种性能优良的合成树脂,占世界合成树脂总产量的18%左右,而我国则可以达到30%,广泛应用在电子、汽车、建筑材料、产品包装等各个领域。在聚丙烯生产过程中通常使用多尺度主元分析的方法进行丙烯聚合过程的监测和设备故障诊断,但该方法还不是很成熟经常出现错报和漏报。夏陆岳[4]等使用小波变换阈值对生产数据进行去噪处理,再结合多尺度主元分析方法得到了改进的多尺度主元分析方法,并将其应用到聚丙烯生产过程监测和故障诊断过程中。应用结果表明,使用改进的多尺度主元分析故障诊断模型能够极大地降低传统诊断方法的误报率和漏报率,可以达到工业生产的要求,减少因设备突发故障造成的经济损失。过程工业中产品的产率和质量由装置的操作过程所决定,但产品产率和产品质量数据的测量具有严重的时间滞后性,不能及时地将该结果反馈到生产操作过程中,因此能够快速准确及时地预测产品的产率和产品的质量对提高装置的运行效率具有重要意义。催化裂化是重质油轻质化的重要手段,通过分子筛催化剂的作用将重质馏分油和渣油在适宜的温度和压力的作用下转化为干气、液化气、汽油和柴油,同时副产焦炭。焦炭作为催化裂化的主要副产物,不仅影响催化裂化装置的轻质油收率同时还直接影响装置的热平衡,而目前大部分企业计算催化裂化焦炭产率的方法还是利用烟气的组成进行粗略的估算,而且结果严重滞后。为提高催化裂化装置焦炭产率的预测准确程度并实现在线预测,苏鑫[5]等通过分析催化裂化装置反应-再生系统筛选出了影响催化裂化焦炭产率的28个主要参数,并将遗传算法和BP神经网络相结合,建立了催化裂化装置焦炭产率预测模型,并将该模型应用到某炼厂的生产数据中,其结果表明该预测模型能够准确地预测催化裂化装置的焦炭产率,为优化催化裂化装置操作,提高催化裂化轻质油收率提供了有效的保障。辛烷值是汽油的一个重要的评价参数,它代表了汽油的抗爆性能。而传统测定汽油辛烷值方法费时,测试设备庞大,操作难度大。周小伟[6]等针对该问题,将集总思想与数据分析技术相结合,他把汽油的辛烷值看成是汽油链烷烃、环烷烃、芳烃和烯烃的集总,在此基础上使用BP神经网络建立了清洁汽油的研究法辛烷值预测模型,经过实例计算验证和对比分析发现该模型可以很好地反映汽油研究法辛烷值和各集总组分之间的复杂的非线性关系,可以十分准确地预测汽油的研究法辛烷值,为测定汽油的辛烷值提供了一种新的思路。结语
大数据技术已经在过程工业中得到了初步应用,为解决过程工业中存在的问题提供了一种新的思路。目前该技术已在过程操作优化,过程监测与故障诊断以及产品质量和产率的预测等方面得到了一定的应用并取得了较好的效果。相信随着大数据技术的不断发展,未来该技术的应用领域将会越来越广泛,应用效果将会越来越明显。
[1] 苏鑫, 吴迎亚, 裴华健, 等. 大数据技术在过程工业中的应用研究进展[J]. 化工进展, 2016, 35(6):1652-1659
[2] 郭超. 决策树方法在提高电脱盐效果中的应用[J]. 计算机工程与设计, 2010, 31(10):2372-2375
[3] 张晓丹. 基于免疫克隆算法的LVQ神经网络研究及其在化工工业故障诊断过程中的应用[D]. 华东理工大学, 2014.
[4] 夏陆岳, 潘海天, 周猛飞, 等. 基于改进多尺度主元分析的丙烯聚合过程监测与故障诊断[J]. 化工学报, 2011, 62(8):2312-2317
[5] 苏鑫, 裴华健, 吴迎亚, 等. 应用经遗传算法优化的BP神经网络预测催化裂化装置焦炭产率[J]. 化工进展, 2016, (2):389-396
[6] 周小伟, 袁俊, 杨伯伦. 应用BP神经网络的二次反应清洁汽油辛烷值预测[J]. 西安交通大学学报, 2010, 44(12): 82-86.
化工设计Club交流QQ群(群号:881289423)化工设计微信群请加小编微信:hgsheji,拉你进群