学术咨询

让论文发表更省时、省事、省心

基于数据挖掘的用户行为特征提取系统构建

时间:2021年12月23日 分类:经济论文 次数:

摘要:为充分缓解电量负荷压力,本文设计了基于数据挖掘的用户行为特征提取系统。按照电力信息提取框架的处置需求,连接用户行为管理模块与电力数据挖掘驱动单元,完成用户行为特征提取系统的硬件环境搭建。采用关联电力用户行为特征树,存储各类待挖掘的电力数据,完成

  摘要:为充分缓解电量负荷压力,本文设计了基于数据挖掘的用户行为特征提取系统。按照电力信息提取框架的处置需求,连接用户行为管理模块与电力数据挖掘驱动单元,完成用户行为特征提取系统的硬件环境搭建。采用关联电力用户行为特征树,存储各类待挖掘的电力数据,完成系统的软件环境搭建,结合相关硬件设备结构,完成基于数据挖掘的用户行为特征提取系统设计。实验结果表明,与基于k-means的提取系统相比,应用新型特征提取系统后,电力用户的总负荷水平明显下降,电子转存频率也由47%提升至98%,用户端主体的电量负荷压力得到良好的平均与协调。

  关键词:数据挖掘;特征提取;行为特征树;数据存储

数据挖掘

  1引言

  数据挖掘本质上是通过搜索功能来获取信息参量的动态过程。数据挖掘根据搜索行为不同可分为无指导数据挖掘和有指导数据挖掘。无指导数据挖掘的搜索需要通过既定属性条件,来寻找某项特定的信息参量,从而对其进行估值和预测。有指导与无指导数据挖掘的不同之处在于,有指导数据挖掘先根据信息要求建立固定的选取模型,然后利用特定条件对信息进行筛选,判断其信息处理能力。如果排除人为的特殊干扰,那么我们可以根据信息间的关联规则不同和聚类效果的差别,来区分有指导与无指导数据挖掘的行为[1-2]。

  随着联合电力供应技术的不断发展,用户端的电量负荷压力不断增加,并且该问题逐渐成为技术发展道路上需要解决的首要问题。为解决该问题,文献[3]提出利用现有K-means聚类法来提取用户行为,并且根据电力用户细分的相关标准,计算相邻两节点间的电力传输量,并结合与之有关的用户层设备,从而建立不同的用户行为据库,完成用户行为特征提取系统构建。

  文献[4]提出基于离散马尔科夫链的用户行为特征提取方法,将离散马尔科夫链应用于用户行为特征数据库系统特征检测中,采用SQL语句作为用户行为特征分析依据,设定用户 行为特征阈值,完成用户行为特征提取。上述方法虽然能够完成用户行为特征提取,但是存在提取效率低、负荷波动性较强的问题,基于此,通过数据挖掘理论方法,并借助挖掘驱动单元和建立行为特征树的研究结构,设计一种能提高现有标准的全新的提取用户行为特征的系统,并借助大量实验进行对比的,使该系统在生产生活中具有实际应用的价值。

  2用户行为特征提取系统硬件执行环境设计

  用户行为特征提取系统硬件执行环境由提取电力信息为主要的框架,管理用户行为模块和挖掘驱动单元为重要组成部分,其具体搭建方法如下。

  2.1电力信息提取框架

  提取电力信息框架把不同用户的行为特征作为该提取系统的运行的理论基础,然后通过利用电力作为媒介,先连接电网和用户服务器,再把行为管理服务器和驱动服务器连接,最终连接电力用户,从而构建起电力信息提取框架。

  2.2用户行为管理模块

  用户行为管理模块作为电力信息提取框架的重要组成元件,其包含了三个组成部分依次是首层的系统管理层,第二层的用户通信层和第三层用户行为特征的采集层。管理层通常由供应电源和挖掘主机以及用户服务器组成。在外部电网保持惯性电量输出的情况下,供应电源是根据挖掘主机的要求进行排列,然后向用户服务器发送需要提取用户的特征行为的指令[5]。

  用户通信层有多个不同的行为管理机相互连接构成,直接连接到用户服务器上,其主要功能是记录各电力用户主体在进行电力信息交换过程的行为。行为特征采集层主要有电力行为仪表和TPI管理主机及用户执行设备组成。TPI管理主机作为管理用户行为模块的核心组成部分,可以不借助其他管理机直接向电力行为仪表发送指令,从而提取用户特征行为,并可以把未处理完的电子信息发送给下级执行设备,为接下来的数据挖掘工作的开展奠定基础[6-7]。

  2.3电力数据挖掘驱动单元

  搭建元件需要考虑能否在电力供应环境下满足向用户端传输电量的需求,因此选择BCM2046芯片作为主要的搭建元件,同时对用户的行为特征进行记录并分析变化趋势。为了提高元件性能,将选择39VF200A芯片辅助BCM2046芯片进行特征提取。将两个芯片与TPI管理主机进行连接,不仅可以承担电力信息提取框架中繁重的数据传输任务,还可以根据既定的电力用户行为特征不同,建立特征树存储结构[8]。电力数据挖掘驱动单元中的传输电压负载较大,为此可以利用挖掘电阻帮助其承担部分传输电压,同时驱动电阻可以连接驱动元件,把多余电量数据发送到其它应用模块。

  3用户行为特征提取系统软件执行环境设计

  进行系统软件执行环境的设计,主要考虑三方面,其一是数据的存储,其二是特征树,其三是提取、整理数据的过程,完成三方面的设计后,联合硬件设施完成提取系统的构建。

  3.1电力用户行为特征树构建

  构建的特征树结构具有体积较小的优点,并且可以将主体分为多个层次,既满足数量级水平,又可以使用挖掘处置权限,从而数据库能够顺利接收特征数据,保障完成后续命令。特征树结构。

  3.2待挖掘数据存储

  待挖掘数据存储是特征系统的重要组成部分,通过节点的承载力,设定挖掘标准。处理层中的挖掘节点可以直接在电力供应环境中提取满足特征的信息参量,而且数据存储层可以整合信息参量形成既定形式。特征收集层可以接收存储层的命令,同时将杂乱的节点进行有序的排列,进而形成稳定的结构。

  3.3提取数据信息处理

  提取数据信息处理是软件执行环境构建的最后一步,此部分可以提取待存储的数据,而提取的标准依据执行需求制定。在整个特征提取的过程中,特征树具有大量的数据是必要条件,然后,通过结合存储的结构获得驱动单元中的数据,完成提取步骤。在提取的时候,提取架构纳入全部待挖掘的信息,通过整理、合并形成适合该提取步骤的新结构,并且具有更强的执行力。当提取数据信息处理步骤设计完成后,整合所有的软硬件,即可完成特征提取的搭建。

  4系统性能验证

  为对比本文系统和传统系统的性能和有效性,进行对比实验,设置实验组和对照组,分别在应用设备上安装本文系统和k-means处理系统,所选设备为运行正常的某电力执行设备,在运行的时候,记录两实验组的具体变化参数。

  4.1实验环境搭建

  为了提高实验精度、降低实验误差,需要进行实验环境的搭建。此次实验环境中主要包括的设备为电力执行设备。在上述电力执行设备支持下,将实验组与对照组进行对比验证,并分别记录两个组别的实验数据。

  4.2电力用户负荷水平

  设定整体实验时间为50min,在此期间内记录实验组与对照组的电力用户负荷水平变化结果。前20min实验时间内,实验组、对照组电子转存频率基本保持相同的变化趋势;第30-40min实验时间内,两组电子转存频率先后达到最大值98%和47%,实验组数值远高于对照组。综上可知,基于数据挖掘的用户行为特征提取系统,确实能够适当提升传输电子的基本转存频率。

  5结束语

  在数据挖掘原理的支持下,用户行为特征提取系统联合管理模块、电力驱动单元等硬件设备,在构建用户行为特征树的同时,处理满足提取需求的数据信息。从实用性角度来看,电子转存频率提升带动电力用户负荷水平的快速下降,有效缓解电力供应环境下用户端主体的电荷负载压力。

  参考文献:

  [1]黄海南,徐锦强,连培昆,等.基于自动检票系统数据挖掘的地铁刚性出行起讫点识别方法[J].科学技术与工程,2019,17(12):360-367.

  [2]王佳辉,钱虹,陈琪琪,等.基于热力学机理与生产数据挖掘相结合的受热面积灰程度的研究[J].热科学与技术,2018,17(5):418-424.

  [3]丁宣宣,郭渊博,雷琦.基于信息熵和改进K-means聚类的混合异常检测特征选择方法[J].信息工程大学学报,2019,20(3):291-296.

  [4]毕猛,王安迪,徐剑,等.基于离散马尔科夫链的数据库用户异常行为检测[J].沈阳工业大学学报,2018,40(1):70-76.

  [5]熊伟,徐永力,崔亚奇,等.高分辨率合成孔径雷达图像舰船目标几何特征提取方法[J].光子学报,2018,47(1):49-58.

  [6]刘杨圣彦,潘翔,刘复昌,等.面向三维模型视图特征提取的残差卷积网络优化[J].计算机辅助设计与图形学学报,2019,18(6):936-942.

  作者:陈景琪,丁凌