时间:2022年03月05日 分类:电子论文 次数:
摘要:智能变电站作为智能电网战略的重要支点,随着智能变电站一次设备的不断增多,设备信息数据量呈指数级增长,传统的数据检索方法已经无法适应海量数据的处理要求,如何准确高效的检索变电站设备信息成为研究的焦点问题。因此提出了一种基于知识图谱的智能变电站设备一次信息检索方法,首先对智能变电站的一次设备信息进行分类,获取相关设备信息语料。然后,定义非结构化设备信息抽取框架,实现设备信息语料的高效抽取。再利用隐马尔科夫模型对设备信息进行分词,构建变电站一次设备信息知识图谱,实现设备信息的可视化展示,突破二维语义表格的局限。最后,结合知识图谱技术设计了智能变电站一次设备信息管理系统。实验表明基于知识图谱的智能变电站一次设备信息记录检索系统能提供准确的设备信息,实现智能变电站设备信息的高效检索。
关键词:智能变电站;知识图谱;隐马尔科夫模型;一次设备
智能变电站的日常建设和运行中,积累了大量的设备参数和运行数据等信息,但相应的信息往往闲置于系统中,影响了智能变电站的数据价值发现。随着设备信息的不断增加,如何高效地检索设备信息对于变电站工作人员有着重要意义。然而,变电站设备的复杂性使得设备信息难以准确检索[1]。变电站一次设备信息管理存在以下问题:1)变电站一次设备信息是以自然语言的形式进行描述,且格式迥异,增加了计算机对设备信息的理解难度,且设备信息的复杂性给信息的准确检索造成了很大困难;2)一次设备信息管理的智能化程度不够,无法从大量的监测数据和历史数据筛选有效的数据进行利用。
随着人工智能技术、物联网等技术的不断发展,为变电站设备信息的智能化管理提供了新的方向[2]。对于变电站设备信息语料,文献[3-4]通过确立语义框架对文本进行表示,但语义框架难以适应复杂的电力设备信息情况[5],且框架依赖于专家经验定义,难以全面考虑变电站设备复杂化的表达方式。
文献[6-7]利用机器学习算法挖掘语料中的规律对语料特征进行表示。然而,机器学习方法所选取的特征基本上局限于关键词的出现与否[8],或者词的出现频率[9],这些统计特征虽有一定的规律性,但对句中关键词的内在逻辑缺乏充分考虑,可解释性不足,容易局限于缺陷记录的字面特征。随着智能变电站战略的不断推进,变电站设备信息呈倍数增长,对信息储存和检索的要求也越来越高。知识图谱作为一种高效的数据库,可以对变电站设备信息进行有效的管理。因此,文中尝试将知识图谱方法应用在智能变电站的一次设备信息管理中。
首先,将智能变电站信息采集平台收集的数据进行分类;然后,考虑非结构化的数据计算机难以准确识别,定义非结构化的数据提取框架,利用隐马尔科夫模型对收集的数据进行分词和标注,为智能变电站一次设备信息知识图谱构建提供数据支撑;最后结合知识图谱技术设计了智能变电站一次设备信息检索系统。该系统能有效地提高变电站设备信息的检索效率、提高变电站的智能化水平。
1智能变电站一次设备信息采集
随着智能电网的更新建设,变电站也在完善它智能化的飞跃。作为电力产业的一个重要的组成部分,智能变电站中聚集的数据量不断加速增长,加之诸多新能源数据的引入,使得如何利用现有理论知识和工具来处理变电站中的数据、为智能电网提供数据支持,成为一个亟待解决的问题。
1.1智能变电站数据来源
智能变电站的数据来源主要有原始数据、变电站中各个自动化系统的内部数据、故障错误记录信息以及对周围环境进行监测得到数据等[10]。变电站的一次设备直接连接于电力系统的高压电网中,参与电力能源的变换、输送、分配。变电站的一次设备种类繁多,主要包括变压器、断路器、隔离开关等相关设备。变压器是电力系统交流电力能源实现转换的主要设备,可以实现不同电压等级的电力能源间相互转换,以便于电力系统的连接,优化电力能源的传输。
变压器数据不但包括电压、电流、有功、无功、相位等数据,还包括变压器的在线监测数据,主要指变压器状态评估、故障诊断、故障预测常使用的油温和油色谱数据信息,还包括电力变压器绝缘油中溶解气体占相关气体的比重和产生这些气体的速率[11]数据信息。这几种数据参量构成了电力变压器数据的主要组成部分。断路器是接通或断开电力系统各设备连接的重要设备,它配有相对完善的灭弧装置,具有断开电力系统电流的能力。断路器在系统正常运行时可根据需求改变电力系统的连接关系,调节潮流;在系统故障时,断路器可以断开故障电流,切断故障设备和系统的电气连接。
断路器的动作信息是变电站日常运行、管理的重要参考数据。智能变电站中的开关设备有密闭性高、灵敏性好等特点,其中气体绝缘组合电器设备(gasin⁃sulatedswitchgea,GIS)微水和触头温度等多种参数都是需要在线监测的重要参数。对于GIS,在线监测系统主要监测两类数据,一类是六氟化硫(sulfurhexafluoride,SF6)气体的密度,另一类是当有少量的水随SF6进入到监测系统时,所产生的水的含量。
GIS在线监测系统的局部放电监测系统可以监测设备制造、安装以及维修时带入的导电微小颗粒和一些异类物质、导通电流、内部气隙、接地受阻等缺陷。GIS实时系统可以通过采集不同位置信息来确定隐患的方位。通过采用感应器对设备内部的温度信息的采集,GIS的高速光导纤维温度测量仪可以快速、准确地获得设备内部的温度信息。隔离开关、接地开关、电容器、电抗器以及互感器等常见的变电站一次设备所产生的数据在变电站维护、故障诊断中都发挥了重要的作用。环境监测数据对智能变电站数据来说也有相当重大的意义。智能变电站的微气象监测系统能够定时收集智能变电站周围的环境数据,包括空气湿度、雾霾信息等数据。
1.2智能变电站数据分类
为了便于数据采集、加工等工作的运作,把智能变电站的数据作分类处理。其中,一次设备的数据体量庞大、种类繁多,相关相似数据进行聚类分析,大致可分为五种,分别为基本数据、在线监测数据、运行数据、试验数据以及事故数据。
1)基本数据。基本数据是指一次设备的台账、设计参数等,数据通常较为完整准确。包括电力设备的基本参数等信息,如额定值、功率、尺寸大小、出产厂家、出产日期等。这些数据是永久存储在电力设备数据库中的数据,其他的数据是设备的流数据。
2)在线监测数据。在线监测数据是对变电站设备状况进行连续或周期性的自动监视检测,具有监测频率高、数据体量大的特点,能够反映相关设备的电气、机械以及化学特性,例如变压器的绝缘油色谱分析、电容套管的介损等。3)运行数据。运行数据是指在一次设备运行期间,按规定的检查内容和周期对各类一次设备进行巡检后获得的书面或电子文档记录。运行数据是反映电气设备具体运行情况的数据,如电流、电压、有功、无功、断路器动作次数等。
4)试验数据。试验数据能够反映设备电气、机械、化学等性质的数据,其具体值通过利用专业仪器试验得到。
通常所说的设备试验数据都是在设备停电之后进行试验而得到的数据,如直流电阻、绝缘电阻,还包括在设备不停电情况下,远离设备本体进行的数据试验,如油的耐压值等。5)事故数据。在发生故障时,在智能变电站中,事故数据主要指发生短路事故时相关设备的数据,如短路电流的有效值和峰值,短路电流的波形等。
1.3智能变电站数据的特点
设备信息数据一般以一定的形式和结构存储于智能变电站数据库中,历史数据是对变电站既往运行管理状态的忠实记录,使变电站未来的管控更加有章可循、有理可依。历史数据特点如下:1)存储格式迥异。由于电力系统中目前对数据的存储格式并没有统一的标准,导致数据通常以最原始的形式存放。2)数据类型复杂。智能变电站中的数据有整型、实型、布尔型等,此外还包含大量的文档、视频等非结构化数据。
3)重复性。关于某种电力设备的状态数据很有可能在相当长的一段时间内处于稳定的状态,甚至无论在内容、格式或者具体的值域方面都完全相同,但却在数据库中被重复存储。历史数据的这种重复性存储模式不但浪费了宝贵的存储资源,而且在数据的搜索和提取时也将对系统的效率造成影响。
2智能变电站一次设备知识图谱构建
2.1智能变电站一次设备信息抽取
由于变电站一次设备信息复杂多样,收集到的设备信息虽然有相关规范进行规定,计算机仍难以准确识别和处理。且变电站设备信息大多是非结构化的表格文档,具有半结构化文档的特点。以变压器参数表格为例,数据可分为标题和数据两部分,标题表示变压器数据的性质和类别,数据表示变压器实际参数,如“变压器设备参数”为标题,“220kV”为参数数据.数据抽取的任务是提取表格中的所有设备参数信息,识别两者的语义关系。
一般地,变电站设备信息表格的各标题大多存在的内容关联,如设备参数中包括额定电压、额定电流和额定输出功率等,试验数据中包括直流电阻、绝缘电阻和动作次数等,需要根据表格特点建立统一的抽取框架:定义1:表格逻辑结构可以表示为T=集合。其中,id表示设备信息的标识;title表示标题;type={single,multiple},表示标题的类型,single表示“单一区”,multiple表示“多值区”。通过数据匹配抽取表格中的数据。部分变电站一次设备参数如下所示:变压器型号DC9-300/27/∛/1.1,冷却方式AN/AF,额定电流212/5196A,空载损耗25.2kW,电压等级10kV,制造厂商沈阳特变电工。
2.2隐马尔科夫文本分词模型
变电站设备信息中含有大量构词规律复杂的专业术语,因此本文使用隐马尔科夫分词模型(hiddenmarkovmodel,HMM)进行设备信息的处理。设备信息中每个汉字都有属于自己的构词词位。构词词位可用四种标签表示,B代表词首位、M代表词中位、E代表词尾位,S代表独立字。设备信息语料中的每条信息构成观测序列,每个字的构词词位标注构成状态序列。设备信息分词就转换为构词词位标注问题,基于已加工好的语料库,得到HMM的参数信息,再通过维特比算法得到待分词文本的构词词位标注序列。
2.3智能变电站一次设备信息知识图谱自动构建
知识图谱构建的一般过程主要分为3步,即知识抽取、知识表示、知识加工。1)知识表示。用h表示实体,t表示实体的属性,h和t之间的关系用r表示,那么三元组(h,r,t)表示为实体h的t属性描述。2)知识抽取。主要是抽取出非(半)结构化数据包含的实体、属性和关系,作为构成知识图谱的基本元素。并对实体、属性和关系进行整合并加入现有结构化数据,初步形成知识图谱。3)知识加工。在知识图谱不断应用的过程中,评估其数据质量和应用效果,并结合知识的发展与丰富,对知识图谱进行更新与修正。变电站一次设备信息一般都以自然语言记录隐患的设备部件、参数等内容。智能变电站一次设备信息知识图谱的构建过程和传统的知识图谱构建过程进行了以下修改:
1)变电站一次设备信息除抽取实体间及实体与属性的关系外,还要抽取属性间关系。
2智能变电站一次设备信息知识图谱属于专业领域知识图谱,实体词义仅限于电力领域,且电力行业有明确的术语规范,实体歧义问题基本不存在,省去实体消歧步骤。3)关系抽取完成后,需要对关系进行筛选处理,避免关系出现冗余,影响知识图谱的后续应用。
4)数据整合步骤将实体、属性及关系形成的三元组,形成图结构的变电站一次设备知识图谱。Neo4j图数据库由于其图形化的实体-关系属性三元组与知识图谱形成很好的映射。
因此,本文利用Neo4j图数据库的可视化功能使变电站一次设备信息具有更强的可读性,方便使用者快速获取及理解变电站设备相关参数和运行数据,实现了设备信息的分析和储存,并且建立了设备信息之间的相互关联。变电站一次设备知识图谱中的实体及关系数量众多,随着设备的不断更新换代,知识图谱也应进行补全以保证设备信息检索的准确性和实效性。Neo4j图数据库支持大数据集合并且可以不断扩展其容量,可以满足知识图谱的需求。
3智能变电站设备一次信息检索系统
本文基于Centos系统使用Docker部署Djan⁃go后台、ElasticSearch及Vue前端等请求并配置相关参数,联调使用。采用编程设计智能变电站设备信息检索模块,界面简洁易操作,对于变电站工作人员来说,不需要过多的学习时间。变电站工作人员可以通过输入查询内容,经过语义理解和问题模板匹配转换为计算机可识别的Cypher语言进行知识查询,利用Cypher对知识库的实体关系直接进行检索,并通过数据可视化库(data-drivendocument,D3.js)技术以实体关系-属性三元组的形式展示。基于知识图谱的智能变电站一次设备信息检索系统不仅可以为工作人员提供检索服务,还可以利用知识图谱的图结构关联分析特点,设计引导式的图谱检索对结果进行可视化的展示。
4实验分析
智能变电站一次设备信息检索以储存的一次设备为基础,当工作人员进行一次设备查询检索时,工作人员输入的自然语言查询语句经过语义分析处理后输入检索系统中,然后与知识图谱中的设备信息进行匹配,并将整合后的查询结果以可视化三元组的形式展现,而传统的关键词搜索方法则使用SQL语句进行查询。本系统选取500kV变电站作为测试试点,实验数据共96.2MB。其中包含一次设备信息6万余条,天气数据20MB。
通过准确率(Precision)和召回率(Recall)证明变电站设备信息知识图谱的检索效果优于传统关键词搜索方法,其中Re⁃call是指正确结果与实际存在的正确结果的比例,性能越好Recall值越大。基于知识图谱的一次设备信息检索方法在Precision和Recall两个指标上整体高于传统的关键词检索方法,知识图谱在语义级检索上的表现优于传统方法。在信息检索条件3时,指标相差最大,主要原因是“雷击”和“故障”在数据库中没有关系,而变电站一次设备知识图谱中存有它们的三元组关系。基于知识图谱的变电站一次设备信息检索系统能够满足日常检索需求,它可以快速有效的检索设备信息,能减少错误操作,提高智能变电站的安全性。
5结论
文中提出了基于知识图谱技术的智能变电站一次设备信息检索方法,并通过实验进行分析验证。通过深入分析智能变电站设备信息利用率不高、检索效率低的问题,提出利用知识图谱技术对一次设备信息进行管理。知识图谱技术有效实现了设备信息的高效检索和可视化展示。
采用编程技术调用知识图谱中的设备信息。基于知识图谱技术的智能变电站一次设备信息检索系统可以提高设备信息的检索效率及准确性,对智能变电站的稳定运行提供数据支撑。该系统在一定程度上提高了变电站一次设备信息的检索效率,同时也提高了变电站的智能化水平。在后续研究中,将在关系抽取步骤中提取更多语料特征,提高知识图谱构建的精确性,从而提升设备信息的检索效果,这也是后续研究的重要方向。
参考文献
[1]刘梓权,王慧芳.基于知识图谱技术的电力设备缺陷记录检索方法[J].电力系统自动化,2018,42(14):158-164.LiuZiquan,WangHuifang.Amethodofpowerequipmentde⁃fectrecordretrievalbasedonknowledgemappingtechnology[J].PowerSystemAutomation,2018,42(14):158-164.
[2]曹靖,陈陆燊,邱剑,等.基于语义框架的电网缺陷文本挖掘技术及其应用[J].电网技术,2017,41(2):637-643.CaoJing,ChenLushen,QiuJian,etal.Semanticframeworkbaseddefecttextminingtechniqueandapplicationinpowergrid[J].PowerSystemTechnology,2017,41(2):637-643.
[3]赵振兵,段记坤,孔英会,等.基于门控图神经网络的栓母对知识图谱构建与应用[J].电网技术,2021,45(1):98-106.ZhaoZhenbing,DuanJikun,KongYinghui,etal.Construc⁃tionandapplicationofboltandnutpairknowledgegraghbasedonGGNN[J].GridTechnology,2021,45(1):98-106
[4]HuangY,ZhouX.Knowledgemodelforelecticpowerbigdatabasedonontologyandsemanticweb[J].CSEEJournalofPowerandEnergySystems,2015,1(1):19-27.
[5]RudinC,WaltzD,AndersonRN,etal.MachinelearningfortheNewYorkcitypowergird[J].IEEETransactiononPatternAnalysisandMachineIntelligence,2012,34(2):328-345.
作者:张子建,刘俊宇,梁煜,黄晓欧