学术咨询

让论文发表更省时、省事、省心

基于约翰逊转换的鲁棒化工过程监控方法

时间:2021年02月26日 分类:科学技术论文 次数:

摘要:化工厂中一个小故障可能导致大事故,从而造成生命财产损失和环境破坏。为了防止小故障演变成大事故,化学工业需要有效的过程监控来及时检测故障和诊断故障原因。传统化工过程监控方法主元分析法(PrincipalComponentAnalysis,PCA)假设数据服从高斯分布

  摘要:化工厂中一个小故障可能导致大事故,从而造成生命财产损失和环境破坏。为了防止小故障演变成大事故,化学工业需要有效的过程监控来及时检测故障和诊断故障原因。传统化工过程监控方法主元分析法(PrincipalComponentAnalysis,PCA)假设数据服从高斯分布,实践中有时并不满足改条件。此外,其使用方差、协方差捕捉数据非线性变化时,鲁棒性较差。本工作提出一种改进的主元分析法—基于约翰逊转换的鲁棒过程监控方法。首先引入约翰逊正态转换(JohnsonTransformation)使过程数据服从高斯分布;其次使用鲁棒性强的斯皮尔曼相关系数(SpearmanCorrelationCoefficient)矩阵代替传统主元分析法的协方差矩阵提取特征向量,构造特征空间;最后将过程数据投影到特征空间,使用T2和SPE统计量实施过程监控。将此方法应用于TE过程故障案例,并与PCA和核主元分析法(KernelPrincipalComponentAnalysis,KPCA)对比,验证了此方法的有效性。

  关键词:斯皮尔曼相关系数;TE过程;约翰逊转换;过程监控

当代化工

  1前言

  化学工业中的物料危险性高,且常常在高温、高压、易燃、易爆、强腐蚀的环境下运行。因此,对化工工业进行有效的过程监控对于确保过程安全和化工产品的质量稳定具有重要意义。过程监控主要包括两个环节:故障检测和故障诊断。故障检测目的是检测故障是否发生。故障诊断是确定发生故障的过程变量,确定故障的根原因。主要的过程监控方法可以分为三类:基于模型的方法、基于知识的方法和数据驱动的方法[1]。

  基于模型的方法根据化工过程的物理化学原理,建立精确的数学模型,利用数学模型的输出和实际输出的残差进行过程监控。基于模型的过程监控方法应用于简单过程时精确、有效,但针对复杂过程建模耗时耗力。基于知识的过程监控方法运用专家经验和过程知识定性地进行过程监控,例如因果分析、专家系统和模式识别。此类方法在应用于大型系统时较基于模型的方法更容易实施,但由于太过依赖专家的知识经验而不够高效准确。而现代化工设备上大量的仪表时刻产生新的过程数据,蕴含大量过程信息。

  数据驱动方法无须建立复杂的数学模型,仅依靠大量的历史数据建模,简便有效,已广泛应用于过程监控[2-9]。数据驱动的过程监控方法可分为基于机器学习的方法和多元统计分析的方法。机器学习的方法主要有 人工神经网络和支持向量机[10-15]等。多元统计分析的方法主要有主成分分析(PrincipalComponentAnalysis,PCA)、偏最小二乘(PartialLeastSquare,PLS)、独立成分分析(IndependentComponentAnalysis,ICA)等[16-20]。

  其中主元分析法因其简单有效的特点目前应用最广泛。PCA首先对数据标准化处理,然后计算数据矩阵的协方差矩阵即皮尔逊相关系数矩阵,接着对矩阵进行对角化处理,得到一个按方差大小排列的特征值矩阵和一个与特征值对应的特征向量矩阵。最后取前几个对应方差最大的特征向量即主元,将过程数据投影到主元空间,利用Hotelling-T2统计量(T2)和平方预测误差统计量(SquaredPredictionError,SPE)得出故障检测的阈值。

  T2统计量代表在特征子空间里观测值到数据中心的距离。SPE统计量代表数据投影到残差空间后的模。故障诊断是通过对T2和SPE统计量分解,确定每个过程变量的贡献度,贡献度大的即为故障变量。PCA作为较早的经典方法,应用过程中也有一些缺点,如PCA提取的主元是一系列变量的线性组合,并没有明确的物理意义,且随着数据维度增加,主元系数增多,计算负荷增大。针对这些缺点,Luo等[21]略去协方差矩阵提取主元这一步,基于过程机理进行相关分析,建立稀疏主元空间,将数据投影到此空间,再利用T2和SPE检测和诊断故障,降低了计算负荷并提升了故障诊断的机理解释能力。

  Yu等[22]利用广义迭代收缩法提出了稀疏PCA,大大降低了计算负荷并提升了主元的解释性从而改善了故障诊断能力。针对PCA静态模型不随时间变化而导致适应性差的问题,Liu等[23]提出一种自适应的增强稀疏PCA。杨尚玉等[24]针对PCA使用的SPE统计量的保守性,用主元相关变量残差和一般变量残差代替SPE统计量。PCA有两个缺点,相关改进研究较少。一是PCA假设数据服从高斯分布,实际工业数据由于噪声等污染有时并不满足此要求。

  针对此缺点,Wang等[25]和Yu等[26]提出了一种半参数的PCA方法,引入半参数的高斯转换模型将数据转换为高斯分布,改善了PCA处理非高斯数据的性能。张端金等[27]提出一种基于小波去噪的PCA方法,改善了PCA的性能。二是由于PCA使用的协方差即皮尔逊相关系数衡量的是严格的线性相关关系,捕捉非线性相关关系表现较差。为了解决此问题,核主元分析法(KernelPrincipalComponentAnalysis,KPCA)[28]被提出,KPCA先将过程数据投影到高维核空间,有些在低维空间中无法获取的非线性特征在高维空间中显示为线性,再对此高维数据进行标准PCA处理。但KPCA需要进行核映射,计算负担较大。

  本工作提出一种方法,能克服标准PCA方法假设数据服从高斯分布后监控效果差、提取非线性特征缺乏鲁棒性的缺点。本方法对过程数据进行约翰逊高斯转换,使其服从高斯分布,将标准PCA中的皮尔逊相关系数矩阵用斯皮尔曼相关系数替代。在TE过程的应用及与PCA和KPCA的对比结果表明本方法具有更高的故障检测率和更优异的故障诊断性能。

  2基于约翰逊转换的鲁棒监控方法

  2.1约翰逊转换由于过程监控方法(如PCA)的适用条件要求,化工过程中的变量都被默认服从正态分布,但实际的效果并不总令人满意。因此,在过程监控之前,对过程数据进行正态变换非常有必要。约翰逊转换方法简单有效,因此选择此方法对过程数据进行正态变换。对于非正态分布、弱正态分布和偏态分布的过程数据,约翰逊转换的实施步骤如下:(1)选取一个合适的z值。一个合适的z值对于较好地拟合非正态数据、偏态数据和弱正态数据,从而获得最优变换,至关重要。z值的取值范围为{0.25,0.26……1.25}。z值的选取与样本容量n关系很大,也与不同的工业数据有关,一般需多次取值试验,寻找使数据变换为最接近高斯分布的最优z值。

  2.2斯皮尔曼等级相关系数斯皮尔曼等级相关系数和皮尔逊相关系数一样,是反映两个随机变量之间变化趋势的方向和程度。它们取值范围都是[-1,1],0表示两个变量不相关,正值表示正相关,负值表示负相关,绝对值越大相关性越强。斯皮尔曼相关系数被定义成等级变量之间的皮尔逊相关系数。

  3TE过程实例研究为了测试基于约翰逊转换的鲁棒过程监控方法的有效性,将此方法应用于TE过程,并与传统的PCA和KPCA方法进行了对比。由于此方法融合了约翰逊转换(JohnsonTransformation)和斯皮尔曼秩相关系数(SpearmanRankingCorrelationCoefficient)的PCA改进方法,因此将此方法称之为JSPCA。

  3.1TE过程简介及故障检测

  TE过程是田纳西伊斯曼(TennesseeEastman)化学品公司基于实际化工过程提出的一个仿真系统。TE过程包括五个操作单元:反应器、冷凝器、压缩机、分离器和汽提塔。TE过程设置了12个操作变量,41个观测变量和21个故障。由于12 个操作变量是人为控制变量,并不会实时变化。而41个观测变量中8个是组分分析变量,也不是实时可测的。因此本文选取33个连续可测量变量作为监控变量。采用的数据集包含正常工况下的500组数据,和21个故障状态下的数据。每个故障都采集了960组数据,前160组为正常工况数据,故障从161组数据引入。

  有关TE过程的详细信息可以参考文献[34]。列出了PCA,KPCA和JSPCA方法对21个故障的检测率。数值越高越好,黑体表示最好的结果,控制限以α=0.95计算。表4列出了PCA,KPCA和JSPCA对21个故障的误诊率。数值越低越好,黑体表示最好的结果,控制限以α=0.95计算。故障10是进料C温度的随机变化,会导致反应器内温度、压力和反应器冷却水出口温度变化,即变量7,9,21。

  PCA的T2贡献图显示变量9为贡献度第二大的变量,SPE贡献图显示变量21和9分别是贡献度第二大和第四大的变量,但其未能诊断出反应器内温度的异常变化,即变量7。而JSPCA的SPE贡献图显示变量7的贡献度最大,其T2贡献图显示变量21和变量9贡献度分列第一和第四。因此JSPCA对故障10诊断效果比PCA要好,它诊断出变量7,9和21都对故障十贡献很大。综合比较两种方法,JSPCA诊断出的信息更多,给出的错误信息也较少。这表明基于斯皮尔曼相关系数构建的特征空间和残差空间具有较好的解耦性能。

  化工师评职知识:当代化工研究好投稿吗

  4结论

  与PCA和KPCA相比,故障检测方面,JSPCA占据数目最多的15个最高故障检测率,同时JSPCA使用T2检测故障时具有最低的故障误诊率。此方法对故障5和故障10的检测率提高最明显,其中JSPCA使用T2对故障5检测率比PCA和KPCA提高了约70%。同时JSPCA的T2误诊率总体上低于PCA和KPCA。JSPCA使用T2对故障10检测率比PCA和KPCA提高了约30%。JSPCA的T2误诊率总体上低于PCA和KPCA。

  这说明JSPCA鲁棒性更好,能排除离群数据的影响,能排除正常数据的波动对故障变量的影响。此外,JSPCA不需要进行计算成本大的核映射,具有简单、高效的特点。但JSPCA使用SPE检测故障时,误诊率太高,会造成报警泛滥。这说明斯皮尔曼相关系数提取的残差空间丢失了大量信息。这是下一步研究的方向。

  参考文献:

  [1]LeoHC,EvanLR,RichardDB.Faultdetectionanddiagnosisin industrialsystems[M].London:Springer-verlag,2002:5-6.

  [2]YangXH,RuiSH,ZhangXL,etal.FaultDiagnosisinChemicalProcessesBasedonClass-IncrementalFDAandPCA[J].IEEEAccess,2019,7:18164-18171.

  [3]FezaiR,MansouriM,AbodayehK,etal.PartialkernelPCAbasedGLRTforfaultdiagnosisofnonlinearprocesses[J].JournalofIntelligentandFuzzySystems,2020,38(4):4829-4843.

  [4]AhmadMR,AhmedSE.OnthedistributionoftheT2statistic,usedinstatisticalprocessmonitoring,forhigh-dimensionaldata[J].Statistics&ProbabilityLetters,2021,168:108919.

  [5]CarlosO,RicardoS,BianchiF,etal.Data-drivenfaultdiagnosisandrobustcontrol:applicationtoPEMfuelcellsystems[J].InternationalJournalofRobustandNonlinearControl,2018,28(12):3713-3727.

  [6]LiZC,YanXF.Performance-drivenensembleICAchemicalprocessmonitoringbasedonfault-relevantmodels[J].SoftComputing,2020,24(16):12289-12302.

  [7]衷路生,夏相明.基于深度残差网络的化工过程故障诊断[J].过程工程学报,2020,20(12):1483-1490.

  作者:王骥1,柳楠1,胡明刚2,田文德1*