《风电机组齿轮箱油冷系统早期故障诊断方法.docx》由会员分享,可在线阅读,更多相关《风电机组齿轮箱油冷系统早期故障诊断方法.docx(11页珍藏版)》请在优知文库上搜索。
1、摘要:油冷系统是风电机组齿轮箱温度调节的重要部件,针对油冷系统部件性能退化、失效及油冷风扇堵塞等问题,提出一种齿轮箱油冷系统早期故障诊断方法。鉴于油冷系统早期故障出现时,进口油温与油池温度的强相关性特征,以及各功率段内油池温度水平升高现象,构建对油冷系统早期故障敏感的特征RXy和S。采用RoC曲线选择最优阈值,通过逻辑回归分类算法自动识别油冷系统早期故障。实验结果表明:所提出的齿轮箱油冷系统早期故障诊断方法能够自动、有效识别油冷系统的早期故障。关键词:风电机组;齿轮箱;油冷系统;相关系数;逻辑回归分类;最优阈值0引言齿轮箱是风电机组的核心部件之一,起到增速和动力传递的作用。风电机组齿轮箱在运行
2、过程中会产生大量的热能,为防止齿轮箱温度过高影响风电机组正常运行,每台齿轮箱都专门配备有油冷系统。油冷系统以空气为介质,通过散热片油通道和风通道间的热量交换实现散热。油冷系统主要包括温控阀、散热片、油冷风扇、管路等部件,通过温控阀对润滑油通路的控制以及散热片的冷却作用实现齿轮箱油温的调节。当齿轮箱油温低于温控阀开启温度时,润滑油经温控阀直接进入齿轮箱;当齿轮箱油温高于温控阀开启温度时,温控阀动作,部分或全部润滑油经冷却后再进入到齿轮箱中。随着风电机组在役运行时间的增加,油冷系统不可避免的会出现温控阀性能的退化、失效问题。而且空气中的灰尘以及飘飞的毛絮有时会粘附在油冷系统的散热片上,降低散热效率
3、。这几种因素都会导致齿轮箱油温过高,过高的齿轮箱油温会使风电机组限功运行甚至停机,从而影响TBA(设备可利用率)、MTBF(平均无故障时间)及发电量指标。针对上述问题,传统的解决方式,一般是在发生油温高故障/警告后再进行排查和处理。这种方式会影响TBAMTBF及发电量指标。随着我国海上风电及分布式风电的发展,无人/少人值守成为未来风电发展的重要方向,被动式的故障解决方案已越来越不能满足要求,主动发现油冷系统早期故障具有重要意义。主动发现油冷系统早期故障即在风电机组报油温高故障/警告前发现故障的存在,可以帮助现场人员提前做好配件准备、维修计划制定、故障检修时机选择等工作,最大程度减小对TBAMT
4、BF及发电量指标的影响,使经济效益最大化。本文对某风场21台风电机组的SCADA离线数据进行分析,筛选出与油冷系统密切相关的变量,并从这些变量中构建齿轮箱油冷系统早期故障敏感特征。然后采用逻辑回归分类算法构造不平衡分类器,实现齿轮箱油冷系统早期故障的自动识别。1早期故障特征构建风电机组SCADA系统中的数据有三百多个变量,这里选取与齿轮箱油冷系统密切相关的三个变量:齿轮箱进口油温,齿轮箱油池温度,风电机组有功功率。下面采用这三个变量构建油冷系统早期故障特征。1.1 数据预处理数据预处理包括数据分组、数据筛选以及数据按功率分箱处理等步骤,如图1所示。图1数据预处理流程图数据分组即按照时间的连续性
5、,以“周”为单位对数据进行分组。分组完成后,筛选掉油池温度低于温控阀开启温度T开启的数据,功率超出0P额(额定功率)的数据以及其他异常数据。然后对各组数据内的功率分别作50kw等宽分箱处理,对于落入各功率分箱的进口油温数据及油池温度数据分别求其平均值,最后拟合得到功率一进口油温曲线及功率一油池温度曲线。功率一进口油温曲线及功率一油池温度曲线分别反映了进口油温及油池温度随功率变化特征,也能够在一定程度上反映油冷系统的散热性能。1.2 敏感特征构建齿轮箱油池温度T池VT开启时,润滑油直接通过温控阀进入齿轮箱,此时齿轮箱进口油温T进与油池温度T池强相关,其功率一进口油温曲线与功率一油池温度曲线也会表
6、现出很强的相关性。如图2为某风场IOl号风电机组部分数据的T池与T进关系图,T开启值为45C,T池与T进强相关,两者的相关系数高达0.9981,如图3为T池V45C时,101风电机组各周功率一进口油温曲线与功率一油池温度曲线相关系数,两者也表现出强相关性,相关系数均大于0.96。图2T池V45C时T池与T进关系图图3T池V45C时两条功率一油温曲线相关系数当齿轮箱油池温度T池开启时,部分或全部润滑油经油冷系统冷却后进入齿轮箱。此时,进口油温T进与油池温度T池之间,以及其功率一进口油温曲线与功率一油池温度曲线之间的这种强相关性将会被破坏,相关系数会减小,相关性减弱。如图4为T池:T开启时,某风场
7、108号风电机组部分数据的T池与T进关系曲线,T开启值为45C,T池与T进相关性弱,两者的相关系数仅为0.171。如图5为T池45C时,108号风电机组各周功率一进口油温曲线与功率一油池温度曲线相关系数。由该图可以看出,在0至25周时间范围内,相关系数值均不超过0.5。三Mwr图4T池45C时T池与T进关系图图5T池45C时两条功率一油温曲线相关系数当出现温控阀性能退化、失效,散热片杂物粘附等问题时,油冷系统的散热能力将会减弱,表现为功率一进口油温曲线与功率一油池温度曲线在油池温度T池T开启时仍然表现出较强的相关性。如图6所示为324号风电机组在2017年1月至2018年3月间,各周的功率一进
8、口油温曲线与功率一油池温度曲线相关系数。其中,在第31周至第46周温控阀出现早期故障时,相关系数均大于0.93,表现出强相关性;现场于第46周完成温控阀更换后,相关系数值基本都下降至0.6以下,而且在温控阀出现早期故障前的31个周,相关系数均小于0.8。温控阀性能退化、失效,散热片杂物粘附等还会导致各功率段内油池温度水平的升高。这里提出采用功率一油池温度曲线与功率轴所围面积S来表征各周内的油池温度水平。本文构建的两个敏感特征分别为油池温度水平S,以及功率一进口油温曲线与功率一油池温度曲线的相关系数Rxy。齿轮箱油冷系统出现早期故障时的敏感特征值,与齿轮箱油冷系统非故障状态时的特征值存在明显区别
9、,如图7所示。所以本文采用油池温度水平S以及相关系数Rxy来判断油冷系统是否存在早期故障。对于存在早期故障的齿轮箱油冷系统,其对齿轮箱油温的调节能力直接反应了油冷系统的故障程度。当油池温度水平S以及相关系数RXy均大于临界值时,则表明油冷系统存在早期故障,且已不能十分有效调节油池温度。在风电机组的运维过程中,更关心的是油冷系统存在早期故障且已不能十分有效调节油池温度的风电机组,这些机组才是运维人员需要去及时处理的目标机组。油池温度水平S以及相关系数Rxy的临界值是确定某机组是否为目标机组依据,而该临界值往往难以确定。为此,本文采用上述早期故障特征提取方法获取风电机组的大量敏感特征数据,通过风电
10、机组运行日志、现场工作票记录以及齿轮箱油温数据来确定各个敏感特征数据的故障标签,然后通过机器学习算法搭建分类器,自动识别出目标机组。图6324#风电机组两条功率一油温曲线相关系数图7敏感特征RXy及S分布图2分类器构建与最优阈值选择所采用的机器学习算法为逻辑回归分类算法,该分类算法预测函数为Sigmoid函数,如下所示:MH)二一二l+ex式中,工为样本特征;6为模型参数0,逻辑回归分类算法的代价函数为:-/(8)=tGJogkJ+(-B)iog(-MJ),式中,加为样本特征数;.埼为样本特征;W为样本标签,取0或1。,式(2)所示代价函数为似然函数,代价函数取最大值时所对应的值即为最佳模型参
11、数。采用逻辑回归分类算法识别目标机组是一种不平衡分类问题。在平衡分类问题中,逻辑回归函数的判别阈值通常设置为0.5,而对于不平衡分类问题则需重新确定最优阈值。本文采用ROC曲线来选取逻辑回归函数的最优判别阈值。如图8所示ROC曲线,纵坐标为TRP,横坐标为FPRoTRP代表分类器预测的故障样本中实际故障样本占所有故障样本的比例;FPR代表分类器预测的故障样本中实际非故障样本占所有非故障样本的比例,TRP及FPR的计算公式如下:TPTPR=(3)PFPFPR=(4)N式中,P为样本中所有故障样本的数目;N为所有非故障样本的数据;TP为分类器预测的故障样本中实际为故障样本的数目;FP为分类器预测的
12、故障样本中实际为非故障样本的数目。1.O-08I06g400000204060810FPRtmsepoMverate)图8ROC曲线FPR越大,分类器预测的故障样本中实际为非故障样本的数目就越多;TPR越大,分类器预测的故障样本中实际为故障样本的数目越多。因此,对于ROC曲线上的点,越靠近(0,1),其所对应的阈值越好。在逻辑回归分类器中,对于任意一个阈值都能得到一组(FPR,TPR)值。阈值最大时,对应ROC曲线上的点(0,0),阈值最小时,对应ROC曲线上的点(1,1)OROC曲线上最靠近(0,1)的点所对应阈值即为最优阈值。最优阈值选定后,考虑到ROC曲线的性质,即使验证集中的故障样本和
13、非故障样本的分布发生变化,ROC曲线依然能够基本保持不变,最优阈值也会基本保持不变。3实验实验数据为某风场21台风电机组的SCADA离线数据,各台风电机组的数据粒度均为1min,数据时间长度均为15个月,如表1所示。对21台风电机组的SCADA离线数据分别进行数据预处理和敏感特征构建,得到这21台风电机组在各周内的敏感特征RXy及S。通过查询风电机组运行日志、现场工作票记录以及齿轮箱油温数据,结合风电机组在各周内的敏感特征Rxy及S,确定风电机组油冷系统在各周内的故障标签(1故障/0非故障)。表1实验数据情况表类型,风电机组号原始数据时间范围数据粒度训练集,IOh106107s210213s2
14、14215、324P2017年1月至.2018年3月一1mine验证集104、105-10821“212、216p测试集“217、31和320、323322、323325在该风场21台风电机组中,选定8台风电机组数据作为训练集,6台风电机组数据作为验证集,7台风电机组数据作为测试集。训练集中的样本与验证集中的样本比例约为6:4。为避免因数据划分引入额外偏差,训练集和验证集中的故障样本数与非故障样本数据的比例基本相同,约为1:8。为提升模型收敛速度及精度,有必要对训练集、验证集和测试集中的样本特征RXy及S进行标准化处理。标准化处理完成后,就可将训练集中的样本特征输入至逻辑回归分类算法中进行训练
15、,得到模型参数。图9中的ROC曲线为逻辑回归分类算法对验证集数据进行分类时得到,由该曲线得到的逻辑回归函数最优判别阈值为0.21,相应的RoC曲线上的点为(0.00693,0.99986)。以0.21作为最优阈值,采用训练好的逻辑回归分类算法分别对验证集和测试集进行分类,得到分类结果如图10、图11。图10、图H中,右侧图为未标准化且未分类时的数据分布图,左侧图则为分类后的数据分布图;右侧图的横坐标为各周油池温度水平S,纵坐标为各周的相关系数Rxy;左侧图的横坐标为标准化后的各周油池温度水平Norm_S,纵坐标为标准化后的各周相关系数Norm_Rxyo在图10、图11的左侧图中,“”代表故障样本,“”代表非故障样本。验证集中数据分类正确率为91.32%,TPR为100%,FPR为1.19%;测试集中数据分类正确率为85.73%,TPR为100%,FPR为2.08%,如表2所示。线曲OcR9图100OOO120000-20-2020000100000120000NormSS图10验证集分类前后对比图图11测试集分类前后对比图表2分类结果类型分类一正确率:TPR1FPRC最优分类阈值,、验证集“91.32%41001.1