学术咨询

让论文发表更省时、省事、省心

基于人机共融的包装机故障诊断系统的设计与实现

时间:2022年02月24日 分类:经济论文 次数:

摘要:随着工业4.0和物联网时代的来临,基于经验和手册的设备维修方式已不能满足复杂设备维修的要求;而传统的设备诊断系统往往只注重从物理传感器采集数据,缺少引入人的经验,难以拥有自学习能力;以ZB45烟草包装机为例,提出一种具有自学习能力的人机共融新型故障诊断

  摘要:随着工业4.0和物联网时代的来临,基于经验和手册的设备维修方式已不能满足复杂设备维修的要求;而传统的设备诊断系统往往只注重从物理传感器采集数据,缺少引入人的经验,难以拥有自学习能力;以ZB45烟草包装机为例,提出一种具有自学习能力的人机共融新型故障诊断系统;系统采用贝叶斯网络,实现对传感器数据的自动推理;通过自然语言处理模块与用户交互,学习用户的维修经验,并用来改进诊断效果;提出了基于凸优化的标签选择方法,根据观察到的现象推荐合适的标签,以快速确定最可能的故障,实现快速找到报警号码对应的故障源;生产现场的实测数据表明,所实现的系统可以有效降低万箱故障次数,有效提高故障诊断精度,降低故障排查时间。

  关键词:人机共融;贝叶斯网络;故障诊断;凸优化;标签选择

人机共融

  0引言

  常见的设备故障报警方法没有故障诊断的功能:当传感器测到某物理量的值出现过大偏差时,系统会显示报警编号。用户必须对照手册,自行诊断导致故障的原因。随着工业4.0和物联网时代的来临,这种基于经验和手册的设备维修方式对于简单的设备有效,但不能满足对复杂设备的要求。

  本文以烟草行业的ZB45型卷包机为研究对象,基于故障树和贝叶斯推理网络,旨在提出一种具有不断自我学习的人机共融的新型故障诊断系统。本文研究方法的关键思想是要结合人的因素,进行人机共融(HumanMachineIntegration)[1]的故障诊断,并在3方面尝试创新的技术方案。

  首先,采用自然语言处理的方法,通过历史工单和维修手册,自动生成故障诊断用的贝叶斯网络和故障搜索用的知识图谱。对数千种故障的复杂系统而言,这样不但可以大大节省人力,也可以减少人为错误的可能,并且可以快速处理新工单,融入知识库。其次,基于贝叶斯网络,实现自学习功能。当工人确定故障源后,可以点击“故障确认”按钮,通知算法正确的结果。

  这样,算法可以不断改进诊断精度。最后,引入“人本传感器”的新概念,让工人点击界面上的标签,输入工人所观察到的现象。有效克服传感器数量远远小于故障数量的问题。让用户做为传感器,帮助算法尽量唯一地确定故障源,加速排错过程。本文提出的人机共融的诊断系统,不但可以在人为工单数据中挖掘信息,还在日常操作中学习工人经验,同时借助人本传感器提高诊断效率。通过人机紧密合作,实现了在工业4.0场景下,新型故障诊断系统的范式。

  1ZB45型包装机故障诊断研究现状

  1.1ZB45型包装机及其故障诊断的必要性

  烟草行业的ZB45型包装机是用于烟支卷接和包装的设备,具有结构复杂、设备贵重、小故障停机次数多、连锁质量波动大、次生浪费较多的特点。其内部有约10000个零部件,约2000种故障,约1500个OPC故障报警代码(OPC代码)。故障和OPC代码之间是多对多的对应关系。有约1300种可导致停机的故障没有对应的OPC故障报警代码。

  ZB45包装机在高速生产运行过程中,包装机极易因各类原因产生短时高频停机,根据对生产环境的统计,单班停机次数平均约为45次,会造成严重的生产效率损失。同时,包装机的频繁启停会使多个关键工序存在加热、升温等不断调整的状态,使包装工艺的质量稳定性变差,同时包装机在每次重启后设备都需自动提出固定数量的烟支,会造成原、辅料浪费,产生巨大的成本损失。

  1.2传统故障诊断方法存在的问题

  包装机产生故障的成因很多,往往会在任意时刻、任意部位产生不同类型的故障。以ZB45包装机的铝箔纸系统为例,可能产生的故障就有数十种,仅其中“铝箔纸撕不开”这一种故障,又会有多种因素与其相关。由此可见,对包装机的准确故障诊断难度极大。

  在现阶段,包装机故障主要依靠维修人员的经验,对故障进行经验性的诊断,主要技术手段是以手工查找纸版手册和维修记录为主,故障诊断存在耗时长、具有主观性的问题,极大依赖于人员经验,技术传承性较差,往往会导致大量故障停机时间。特别是对于一个OPC代码对应多个可能故障的情况。维修手册只记录各种故障可以导致的现象,并且手册有几千页之多。不但查找困难,而且很多故障诊断的经验没有书面记录。

  有经验的工人要根据故障代码,结合自己的观察,及历史故障频次来判断最有可能的故障。而这种经验常常没有书面记录,动辄需要五年、十年的经验积累。随着制造业信息化进程的推进,卷包机数据采集系统实现了从ZB45包装机提取大量实时运行数据,包括运行参数、故障统计、台时产量、物料消耗等信息,同时也建立了基于EAM系统相关的设备故障维修记录,但是两个系统独立运行,缺乏有效的关联策略来实现数据和信息的融合,需要对获取的数据进行更深层次的处理和分析,从各系统数据进行关联挖掘,得出有效、可固化传承的故障诊断及设备维护类知识,并应用到生产过程中。

  1.3相关技术背景

  1.3.1常见的故障诊断方法

  传统的复杂设备故障的诊断主要包括如下方法:

  1)故障树:通过故障树的方法[2][3]建立从传感器可测的故障现象到故障的自动推理引擎。这种方法也常被称做专家系统。不同的故障可以通过逻辑与、或、非的方式关联,共同决定下一级故障发生与否。故障树方法可以用系统可靠性分析,及单一故障情况下的故障诊断。

  2)贝叶斯网络:另一类方法是通过如贝叶斯网络[2][4]的统计学的方法,对多个故障及其故障概率进行自动推理。这类方法需要用户构建由故障和现象为节点的有向无环图(DAG,DirectedAcyclicGraph),并输入条件概率表(CPT,conditionalprobabilitytable)和先验概率以表征不同节点之间的连接关系。如果有足够历史数据,条件概率表和先验概率都可以从数据中得出。这种方法比故障树的表现力更强。故障树可以转换为贝叶斯网络的形式[2],但反之则不一定成立。

  贝叶斯网络的方法可用于大型生产制造系统[4]、楼宇空调[5]的故障诊断及故障冗余控制系统[6]。基本的朴素贝叶斯网络假定故障之间独立出现,即故障出现的概率不会相互影响,同时,故障出现的概率不随时间而变化。动态贝叶斯网络扩展了朴素贝叶斯网络的时间域上的表现力,从而允许出现时变的概率分布。

  3)观测器:如果要通过观测模拟量来分析故障情况,可以采用观测器的方法,并通过在线传感器数据估计系统内部状态。例如:卡尔曼滤波器(Kalmanfilter)或粒子群滤波器(particlefilter)是常见的基于模型的系统状态观测器。对于只有模型结构,但不了解参数的系统,还可以采用在线模式识别的方法,例如在线ARIMA或N4SID的算法等[7]。

  4)数字孪生:近年来,数字孪生(digitaltwin)[8][9][10]的概念得到研究者和工业界的重视,并从3D模型延展到在线监测应用。对于大型的工业控制系统,如石化企业的分布控制系统(DCS,distributedcontrolsystem)[10]及暖通空调系统[11],想要手动建立系统的动力学模型是非常困难的。对这类应用,通过组合子系统的数字孪生而构建全系统的动力学模型是个更好的方案。文献[12]提出了采用在线数字孪生的方法,对暖通空调设备进行在线故障监督和诊断。

  1.3.2自然语言处理技术和知识图谱

  近年来,以深度学习为基础的自然语言处理得到了广泛的工业应用。对设备故障诊断而言,设备维修工单记录和维修手册是故障诊断系统建模和分析的重要数据来源,其描述形式基本上是自然语言。然而,直接通过阅读自然语言,手工建模的方法成本高,时间长。利用自然语言处理技术是提高故障诊断系统建模的有效手段。

  早期的应用主要以针对关键词的统计为主[13]。美国海军采用了自然语言处理的方法对V-22鱼鹰飞机的维护资料进行了系统的分析整理[14]。通过基于Python的NLTK自然语言处理工具包[15]进行分词,该方法识别了维修记录中的自然语言记号,并对核心词进行了统计学分析。在此基础上,可以对历史上相似的故障维护工单进行聚类,并通过统计方法分析改进维修的手段。

  针对烟草机械维护的自然语言处理应用还很少见。文献[16]讨论了烟草机械维护数据库的自然语言处理方法,采用常规的TF-IDF及TextRank模型进行数据建模,然后通过权重矩阵比较实际故障记录与故障数据库中已有故障记录的相似程度,由此进行对同类故障记录的模糊查找,其本身并不直接用于故障诊断。当涉及到具体行业知识时,这种模糊查找方法效果不太理想。知识图谱[17]是一种描述实体之间语义关系的有向图结构。传统的知识图谱一般存于图数据库中,如Neo4J,Dgraph等。

  近年来,随着人工智能和深度学习的兴起,出现了神经网络和知识图谱相结合的流派。例如,DeepWalk[18]可以通过深度学习来学习网络的结构。通过深度图卷积网络(DGCN,deepgraph convolutionnetwork)学习轴承的振动信号,文献[19]提出了一种可以进行故障原因诊断的学习系统。开源软件DeepGraphLibrary(DGL)[20],可以把多种网络结构的数据向量化,并嵌入到神经网络中。利用已有的知识图谱构建技术,我们通过维护手册和工单数据构建知识图谱,并由此生成贝叶斯网络模型,用于故障诊断。

  2人机共融的故障诊断系统

  2.1人机共融的新型交互方式

  人机共融被认为是工业4.0时代的重要场景之一[1]。关于工业机器人的人机共融[21],及离散生产线的人机共融[22]已经有一些成功经验。但对于故障诊断系统的人机共融方式还未见相关报道。我们以ZB45卷包机为实验对象,提出一种故障诊断系统,旨在提高故障诊断效率、降低故障停机时间,并对故障的原因、部位与维护策略进行全面分析,进而实现增效、稳质和降本的效果。其核心思想是通过人机共融的有机合作引导工人监督系统不断学习,解决现有故障建模中缺乏文字描述经验的难点。

  本系统人机共融的特点主要体现在:1)建立基于贝叶斯网络的可扩展故障诊断架构,可以利用OPC代码、用户标签选择、传感器信号等多模态信息,进行自动故障诊断推理;2)通过人机共融的有机合作,向用户提供标签,并接收反馈;学习用户潜在经验,不断提高诊断精度;3)通过自然语言处理的方法,分析历史工单数据,自动构建推理用的贝叶斯网络,减少手工建模时间。其中,机械设备的传感器采集信号处理后产生各类报警信号,并利用相关事件检测算法,触发事件后传送给贝叶斯网络。事件监测算法可以看作与内置的OPC代码报警相同,都是触发事件的布尔量。

  而维修人员产生历史工单,经过自然语言处理模块进行分析,用于生成故障知识图谱,并用于初始化贝叶斯网络。工单的信息经过自然语言处理,生成初选标签,经凸优化过滤后,产生足够的精选标签,供维修人员选择。标签中一般包括维修人员可以看到或听到的各种现象。作为对传感器信号的有效补充,标签可以看成另一种“人工”的传感器。它们也可以触发贝叶斯网络的事件。

  2.2故障树建模

  目前在ZB45包装机应用中积累了维修工人师傅的大量维修记录,但是记录存在标准不一、记录不全、故障重复等问题。在维修工人师傅经验的帮助下,从数十万的维修数据中,清洗整理出1751条完整的故障维修记录,并将故障现象和机器位置相关联,形成故障树,同时对每个故障所对应的故障编码进行对应,通过这种关联,实现对故障的推送。

  3诊断系统的生产成效

  通过对比系统部署前后月份的万箱故障数据。从中可以看到,系统部署后一个月的故障次数为46次,万箱故障次数为46/69296.4*10000=6.63,而部署前一个月的故障次数是64,万箱故障次数为64/66232.2*10000=9.64,同比万箱故障次数下降31.2%。

  4结束语

  面向复杂设备的故障诊断问题,本文以ZB45包装机故障诊断为考察目标,提出了一种实现人机共融的故障诊断系统。系统整合了自然语言处理技术、知识图谱技术和贝叶斯网络理论,主要创新点如下:

  1)通过对历史工单的自然语言处理,自动生成知识图谱和贝叶斯网络;2)针对故障代码(OPC代码)少于故障源的问题,鼓励用户通过选择标签的方式来提高诊断精度。同时,利用用户反馈,提高贝叶斯网络诊断精度;3)结合自然语言处理和凸优化的方法,提供少而精的标签。通过对历史工单的自然语言处理,进行标签初选。随后采用凸优化算法选择恰好足够的标签给用户选择。通过系统实际运行测试,证明该系统能有效降低设备的万箱故障次数,有效减少故障维修时间,提高了设备故障诊断效率。

  参考文献:

  [1]於志文,郭斌.人机共融智能[J].中国计算机学会通讯,2017,13(12):64-67.

  [2]王广彦,马志军,胡起伟.基于贝叶斯网络的故障树分析[J].系统工程理论与实践,2004,24(6):78-83.

  [3]RUIJTERSE,STOELINGAM.Faulttreeanalysis:asurveyofthestate-of-the-artinmodeling,analysisandtools[J].ComputerScienceReview,2015,15:29-62.

  [4]CARBERYCM,WOODSR,MARSHALLAH.ABayesiannetworkbasedlearningsystemformodelingfaultsinlarge-scalemanufacturing[C]//2018IEEEInternationalConferenceonIndustrialTechnology(ICIT),2018:1357-1362.

  [5]XIAOF,ZHAOY,WENJ,etal.BayesiannetworkbasedFDDstrategyforvariableairvolumeterminals[J].Automationinconstruction,2014,41:106-118.

  [6]VILLEZK,VENKATASUBRAMANIANV,NARASIMHANS.Bayesianinferenceforfault-tolerantcontrol[C]//InternationalSymposiumonResilientControlSystems,IEEE,2009:51-53.

  作者:张明琰1宋震2方世杰2