当齿轮箱发生轻微故障时,若人工定检不能及时发现,小故障会伴随着风机继续运转,增加齿轮箱负荷,最终导致卡死、串轴、断裂等严重故障,给风场带来巨大的维修成本。
在政策驱动下,我国的风电行业已由快速发展逐步转向稳定、市场化发展。相较于较水电、光伏等新能源,风电行业的信息化较为成熟,因而具备较好的智能化条件和基础。其中,基于风场采集的SCADA数据进行故障诊断、故障预测建模,已成为风电行业的重要趋势。
在典型的大部件中,风力发电机齿轮箱,亦称变速箱,作为将叶轮转速提速为发电机所需转速的重要部件,在双馈式风力发电机中应用广泛。
当齿轮箱发生轻微故障时,若人工定检不能及时发现,小故障会伴随着风机继续运转,增加齿轮箱负荷,最终导致卡死、串轴、断裂等严重故障,给风场带来巨大的维修成本。
如果能通过数据及时发现齿轮箱的运行异常并实时报警,对于降低风机严重故障风险,提高风场发电效率具有重要意义。
文:天数润科 刘杨
齿轮箱数据概述
风力发电机的故障诊断、故障检测方面,常使用的数据有SCADA、CMS等数据。
SCADA作为集控系统的组成部分,其数据存储、提取、建模的过程较为容易。通常,对齿轮箱的测点包括齿轮箱油温、齿轮箱振动、齿轮箱轴转速、齿轮箱轴承温度等。
CMS通过采集高频振动数据,结合时域与频域的分析,给出齿轮箱振动异常的原因与是否需要停机维修的判断。
本次建模使用的数据为10s级别的SCADA数据,包含以上提及的SCADA数据特征。
建模思路
由于SCADA数据中齿轮箱的测点数较少,难以完全描述齿轮箱的运行状况,同时数据质量不佳,部分风机数据的时间间隔为12s,导致瞬时采样点数据时间戳不一致。针对这种情况,采用数据聚合的方法,将不同时间间隔的数据统一聚合为2min级别数据,提取每个特征在该段时间内的平均值、最小值、最大值。
采用聚合方式提取的数据,存在严重的线性相关,使用传统的统计学习方法(不包含树模型)会引入较大的误差,因此需要一层滤波,从原始的聚合数据中提取深层特征,同时需要确保这些特征可以较好地还原数据。因此模型使用降噪自编码器作为自动进行特征提取的工具。
按照2min的时间跨度聚合的数据较风电行业常用的10min级别数据,其时序特征较为明显。尤其在温度等特征方面,2min级别数据中描述了详细温度的变化特征,能够较好的反应风机运行过程中真实发生的工况。因此,在故障预测方面,采用基于LSTM架构的模型,以有效预测齿轮箱健康状况。
训练数据的标注方面,风场提供了齿轮箱故障发生的时间,将故障发生前一周的数据均标记为故障数据,同时选取一部分的齿轮箱未发生损坏的风机数据,以标签0作为正常风机的标注,用以训练模型。
首先,针对SCADA数据,进行按照时间聚合的数据操作;其次,构建降噪编码器模型,通过处理后的数据训练编码部分和解码部分,自动地使用神经网络提取2min级别数据的深层特征;最后,通过数据标签训练LSTM,输入编码后的结果,输出为风机在该时间段内是否发生故障的预测结果。
所有的算法开发与部署皆基于SkyAXE高速运算平台开发。
模型算法说明
降噪自编码器(Denoising AutoEncoder)是一种较为鲁棒的自动特征提取模式,通过在编码前对数据引入噪声(通常为高斯噪声)破坏原始的数据分布,再通过编码-解码过程还原未加入噪声的数据,实现类似滤波(filter)后自动提取特征的过程。
通过引入噪声,破坏原始数据的标准分布后,再通过数据将其还原,模拟了人类对破损图像自动补全的过程,充分利用数据间的相关性,自动提取数据的深层特征,在大批量数据的特征提取方面,其效果较传统的PCA降维方法都有显著地提升,且具有较高的鲁棒性。反映于模型中,可看到其对聚合之后特征的还原效果较好,因此可将编码器部分作为LSTM网络的前半部分,对原始特征进行预处理:
LSTM通过引入Cell的结构,可记忆在时间序列上有所间隔的数据特征,在自然语言处理、视频分析、信号分析等方面已有大量成熟应用。其结构不在赘述。
模型架构
模型整体架构为降噪自编码器的编码部分后接LSTM网络结构,构建模型需要以下几个步骤:
Step 1:训练自编码器
由于降噪自编码器属于无监督学习的神经网络,即不需要外部的标签来训练。输入输出均为原始特征。训练中仍然采用批量训练方法,此时不需要关注聚合数据的故障与否,将全部数据进行训练即可得到能够自动提取深层特征的编码器;
Step 2:构建LSTM网络
由于数据量较大,LSTM模型的堆叠Cell数量较多,网络较深,容易产生梯度爆炸或梯度消失的问题。采用批标准化(Batch Normalization)对每一层的输出进行标准化,解决梯度传播的问题。同时,为了避免模型过拟合,在LSTM层和全连接层中,均使用了Dropout,降低过拟合的概率。构建起多层的LSTM网络后,接收编码器提取的深层特征;
Step 3:训练模型
使用降噪编码器提取的深层特征作为LSTM的数据,故障与否作为标签,训练LSTM模型。从训练误差的下降来看,模型具有较好的稳健性,误差可稳定的下降:
Step 4:模型测试
测试数据集为未用于训练的同风场其他几台风机数据,运行正常的风机没有报出故障,误报率接近于0。而故障风机主要呈现以下两种故障模型:
(1)突发故障
可能是由于瞬时风速过大,符合较大而导致的突发故障。模型在故障发生前并无给出明显的征兆,在系统报警的较近时间段才报出异常,此时风机可能已经处于齿轮箱故障发生的临界点,需要紧急停机进行维修;
(2)渐变故障
此类故障在发生前一段时间,模型已给出一些警报,此时对齿轮箱进行人工检查或维修,可以避免因严重故障导致的齿轮箱彻底更换,降低维修成本,提高风场的运营效率。
总结
齿轮箱是双馈式风力发电机的重要部件,其发生严重故障后更换齿轮箱的维修成本极高。若能尽早发现齿轮箱的损坏,并进行及时的维修,对于指导现场人员作业,实现智能化运营具有重要意义。
虽然模型有效地解决了该风场的离线数据问题,但在实际部署过程中,还需要考虑数据传输的质量、速度等因素,对模型参数进行不断修正,以提高预警的准确率。
随着风场信息化程度的不断提高,智能化必然成为风电行业未来的发展方向。引入AI的建模方法,将有助于提高模型的预测准确率,降低误报率,为业主带来真实的经济价值。
发布评论