当前位置: 编码机 >> 编码机优势 >> 通过改进自动编码器,可提升数据不足条件下
变压器发生故障的情况较少,使得基于机器学习的变压器故障诊断方法存在数据不足的问题。为此,智能电网教育部重点实验室(天津大学)、瑞典皇家理工学院电气工程与计算机科学学院、国网冀北电力有限公司检修分公司的研究人员葛磊蛟、廖文龙、王煜森、宋丽可,在年《电工技术学报》增刊1上撰文,提出一种基于改进自动编码器(IAE)的变压器故障数据增强方法。
首先,针对传统自动编码器生成的数据有限和缺乏多样性的问题,提出改进的变压器故障数据生成策略。其次,考虑到传统卷积神经网络的池化操作会丢失大量特征信息,构建改进的卷积神经网络(ICNN)作为故障诊断的分类器。最后,通过实际数据验证了所提方法的有效性和适应性。仿真结果表明,相对于随机过采样算法、合成少数类过采样技术及自动编码器等传统的数据增强方法,IAE能同时兼顾数据的分布和多样性特征,生成的变压器故障数据对分类器的性能提升效果最好。和传统分类器相比,ICNN在数据增强前、后都具有更高的故障诊断精度。
变压器是一种利用电磁感应原理来实现电压变换的装置,它在输电侧和配电侧都起着至关重要的作用。一旦变压器发生故障,会严重影响电力系统的正常运行,造成负荷大面积失电等严重事故,并带来一定的经济损失。因此,开展变压器故障诊断研究具有重要的理论意义和工程实际应用价值。
目前,大部分的大型电力变压器属于油浸式变压器,变压器油中的溶解气体含量是故障诊断的重要依据。基于分析溶解气体含量发展而来的传统故障诊断方法主要包括三比值法、支持向量机(SupportVectorMachine,SVM)法、贝叶斯网络法、多层感知机(Multi-LayerPerceptron,MLP)法及轻梯度提升机(LightGradientBoostingMachine,LightGBM)法等。这些传统方法的原理简单、对于数据量要求比较小,但它们存在共性的问题,即特征能力不足,故障诊断的精度有限。
近年来,深度学习技术在自然语言处理、计算机视觉和视频分析等多个领域都取得了优异的成绩,这为提升变压器故障诊断精度带来了新的契机。基于深度学习技术的变压器故障诊断方法主要包括卷积神经网络(ConvolutionalNeuralNetwork,CNN)法和深度信念网络法,它们不仅具有强大的特征提取能力,还能映射溶解气体和故障类型之间复杂的非线性关系,相较于传统方法具有更高的诊断精度。
训练集中包含充足且分布均匀的故障样本,是保障深度神经网络具有较强泛化能力的关键条件。然而,变压器发生各类故障的频率差异较大,可能存在信息记录不全或者数据缺失等问题,导致难以满足深度神经网络对于故障样本数据量的要求。因此,如何在数据不足的条件下对变压器故障数据进行增强是亟待解决的问题。
一些专家学者已经对此展开了初步的研究,有学者分别利用随机过采样(RanddomOver-Sampling,ROS)算法和合成少数类过采样技术(SyntheticMinorityOver-samplingTechnique,SMOTE)让每个正样本和附近的多个样本随机结合,极大地增加了原有样本的个数,但无法兼顾故障数据的整体分布特征和多样性的问题。
为了解决这些问题,有学者构建了条件生成对抗网络(ConditionalGenerativeAdversarialNetwork,CGAN),以服从高斯分布的随机噪声作为生成器的输入,产生指定类型的变压器故障样本数据,在一定程度上提升了故障诊断的性能,但存在训练过程不稳定,容易出现梯度消失及调参难度大等问题。
作为备受欢迎的新型深度生成模型,自动编码器(Auto-Encoder,AE)是一种利用输出向量来重构输入特征的前馈神经网络。目前,AE在机器翻译、数据降维、表征学习及图像修复等领域具有较好的应用效果,但在变压器故障数据增强中的应用仍处于初级阶段。理论上,AE可以利用具有强大学习能力的编码器有效地提取溶解气体的潜在特征,并通过解码器反向重构溶解气体数据,更可为变压器故障诊断提供数据保障。
然而,已有的自动编码器的变体,如变分自动编码器,虽然可以应用于数据生成,但它需要将海量的故障样本用于训练模型,这有违数据不足的先决条件。相对而言,传统AE对数据量的要求不高,但它生成的数据和输入数据高度相似,不仅缺少多样性,而且生成的样本个数有限。如何根据变压器的溶解气体特征,设计一种能够兼顾变压器故障数据多样性和样本个数的自动编码器结构,有待进一步的研究。
针对上述的问题,智能电网教育部重点实验室(天津大学)等单位的科研人员在数据不足条件下提出了一种基于改进自动编码器的变压器故障数据增强方法。
图1所提方法的计算流程首先,在分析传统AE的基础上,提出了IAE用于变压器故障数据的增强。其次,针对传统CNN的池化操作会丢失大量特征信息的问题,构建了ICNN作为变压器故障诊断的分类器。再次,以溶解气体数据作为模型的输入特征,并对变压器状态进行编码,提出了相关的指标用于评估模型的性能。最后,通过实际数据进行仿真得出以下结论:
1)IAE的训练过程平稳、收敛速度快,可以很好地拟合原始数据的分布,并生成和原始数据特征相似的数据。相对于ROS、SMOTE和AE等传统的数据增强方法,IAE在考虑数据分布的同时还能兼顾数据的多样性,生成的变压器故障数据对分类器的精度提升效果最好。
2)和MLP、SVM、LightGBM以及CNN等分类器相比,ICNN在数据增强前、后都具有更高的故障诊断精度。CNN的池化操作会让其损失部分特征信息,限制了模型的诊断精度。ICNN通过调节卷积核尺寸来替代传统CNN的池化层可以提升诊断性能。
3)相对于原始训练样本,经过IAE进行数据增强后,MLP、SVM、LightGBM、CNN和ICNN等分类器的诊断精度都有着不同程度的提升,说明利用IAE来生成变压器故障样本数据不受限于某个分类器,具有一定的适应性。
在本项目中,科研人员对深度学习技术在变压器故障数据增强中的应用进行了初步的研究。后续收集到更多的变压器故障样本数据,可以进一步探究当训练集样本个数是否越多,IAE产生的数据对于分类器性能提升效果越好。
以上研究成果发表在年《电工技术学报》增刊1,论文标题为“数据不足条件下基于改进自动编码器的变压器故障数据增强方法”,作者为葛磊蛟、廖文龙等。