基于GRNN的台风灾害杆塔故障预警
扫描二维码
随时随地手机看文章
引言
台风灾害是引发输电线路故障的重要原因之一,东南沿海地区历史线路故障统计数据显示,台风灾害导致的线路跳闸故障已占到跳闸总数的20%以上。台风的强风暴雨往往会导致一处或多处的断线、倒塔故障,引发地区性的电力瘫痪:如2016年的"莫兰蒂"台风,历史性地造成7基500kV杆塔和15基220kV杆塔损坏:再如2019年的"利奇马"台风,台风灾害的波及范围达到近25万km2,造成大批变电站、输电线路断电停运,影响了数省生产活动的正常进行。因此,建立科学的防风抗灾机制,在台风来临时为调度工作提供科学合理的技术信息支持,有着极其重要的意义。
近年来,沿海地区各省市电力公司逐渐开始对输配电线路台风预警方法展开研究。现有的方法有通过台风预测路径和风圈范围对风圈范围内的输电线路做出预警:也有一些研究是针对线路杆塔的抗风设计参数,综合地形进行考虑。文献提出了一种基于数据挖掘的方法来对热带气旋的生成进行预测:文献则提出使用几何纠正和残差修正结合的方式来提高定位精度:文献提出通过建设台风实时跟踪监测预警平台,对台风活动进行实时监测,为电网防灾预警提供实时信息依据:文献提出构建电网信息和地理环境信息一体化平台,依据台风实况的预报信息,结合区域情况,给出预警:文献提出建立融合电网设备信息和自然环境信息的一体化、可视化预警平台,对气象灾害预警实现自动处理。就文献来看,对于台风灾情,其仅仅针对台风自身的状态给出预报信息,或是部分结合电网信息、输电线路实况进行预判。这些工作方法需要工作人员依靠经验来分析台风预报信息并作出判断,带有一定的个人主观性,科学依据不足。
现代社会,人们已经克服了对台风等自然灾害进行监测的难题,但当下对台风致灾预警所用到的数据更多是实时观测的数据,相关的历史数据往往被忽略。在进行台风致灾预警时,更多的是直观的因果关联,并未能研究数据潜在的相关性。VGRR具有很好的非线性映射能力和学习速度,可以用于发掘台风灾害与故障之间的相关性,从而实现对杆塔故障进行预测的目的。基于此,本文提出了基于VGRR的台风灾害杆塔故障预测模型,采集台风灾害时与杆塔相关的风速、风向、降雨量等信息,进行处理得到数据集,再对数据集进行重采样处理,形成神经网络的训练和测试样本,通过对神经网络进行训练、测试以验证其准确率。
1台风灾害杆塔故障预测模型
1.1数据采集
本文应用到的数据包括:福建省建立的台风监视系统收录的实际监测信息,福建某市市内气象站的经纬度信息和近三年内强台风期间的风速、风向、降雨量等气象信息:电网相关信息有从电网公司获取的该市的配电网输电杆塔的经纬度信息,以及该市在强台风期间发生的杆塔故障统计数据。
台风灾害下的跳闸故障大多数是风偏跳闸故障,绝缘子串风偏角过大时会引发杆塔跳闸故障,造成停电事故。杆塔是否发生风偏跳闸与杆塔所承受的台风风速大小、线路走向和风向间的夹角有很大关系:另外,台风灾害往往伴随着暴雨的影响。综上,将台风灾害时间划分为离散时间段,每段步长为1h,统计每个步长的台风信息向量X=[x1,x2,x3,x4,x5]。其中,x1为降雨量:x2为目标杆塔承受的极大风速:x3为极大风速对应的风向与线路走向夹角极大值:x4为目标杆塔5min的平均风速值,即1h时间段内5min平均风速的平均值:x5为风向与线路5min平均夹角,即1h时间段内5min平均夹角的平均值。
鉴于杆塔所在位置与气象站实际位置存在偏差,实际精准气象信息难以捕捉,本文通过选取距离杆塔最近的三个气象站的数据进行加权计算获得实用数据。距离较远的气象站测量数据与杆塔处气象参数的误差会较大,计算时其相应的权重也较低。
根据距离平方反比衰减规律,不同气象站数据权重的计算方法为:
式中:di(i=1,2,3)表示气象站i与该杆塔的距离,可以通过实地情况获得。
杆塔处风速类数据,0(即目标杆塔承受的极大风速、目标杆塔5min的平均风速值)的计算方法为:
式中:,i表示气象站i的风速类数据。
杆塔处风向类数据a0(即极大风速对应的风向与线路走向夹角极大值、风向与线路5min平均夹角)的计算方法为:
式中:ai表示气象站i的风向类数据:aline表示该杆塔所在线路走向与地球正北方向的夹角,可以通过该杆塔与相邻同线路杆塔经纬度信息求出。
通过计算可得到每个杆塔处的气象输入数据,将其与杆塔故障的历史数据匹配,形成单个样本。
1.2样本集生成
在台风期间,通常大部分杆塔都没有发生故障,因此非故障样本的数量会远多于故障样本数量,这样会产生不平衡的数据集。如果直接将不平衡的数据集代入神经网络的输入,将会使预测的结果偏向多数样本即非故障结果,故采取了重采样的方法以平衡数据集:对故障样本采用过采样方法中经典的合成少数类过采样算法(sMoTE)增加样本数目:对非故障样本采用随机欠采样删除冗杂样本,再通过单边选择算法(oss)对样本进行消噪处理。
sMoTE算法是用以解决数据的非平衡问题的一种过采样算法,该算法的基本思想是通过对少数样本的分析,模拟生成新的样本并带回数据集中,实现对少数类样本的扩大采样,以此来平衡原数据集内不同类数据的数量。它能显著改善随机过采样方法中出现的分类过拟合现象,而且不会损失有价值的信息。
单边选择算法(oss)是一种具有代表性的欠取样算法,该算法通过计算比较样本间的"距离",将多数类样本划分为"噪声样本""边界样本"和"安全样本",以减少多数类样本、均衡数据为目的,对"噪声样本""边界样本"合理去除,对"安全样本"适当精简。oss具有一定的选择性,在处理过程中主要删去的是噪声样本及边界样本,而有用的样本则尽可能地保留下来。
通过基于sMoTE的故障样本采样和基于oss的非故障样本采样,使正常样本和故障样本数量相当,提升了数据集的均衡程度。
1.3广义回归神经网络模型
GRNN由输入层、模式层、求和层和输出层组成。如图1所示,对应的网络输入X=[x1,x2,…,xn]T,其输出y=[y1,y2,…,yk]T。
输入层共有n个神经元,对应测试样本数据向量,即X=[x1,x2,…,xn]T的维数,输入层将变量直接送入模式层。
模式层神经元个数相当于训练样本的数量,该层计算测试样本与训练样本中每一个样本的高斯函数取值,其神经元传递函数为:
g为平滑因子,该值对神经网络的性能影响很大,需要优化取值。如果g过大,预测输出将会近似训练样本输出的平均值:如果g过小,将使输出结果靠向拥有最近协变量的训练样本。因此,确定一个合适的g,能够让所有训练样本的因变量均被考虑在内。
求和层中的节点个数等于输出样本的维度加1,即I+1,本层输出分为两部分,使用两种类型神经元进行求和。第一部分为第一个节点,该节点输出为模式层神经元输出的算术求和,其输出为:
第二部分为其余I个节点,其输出为模式层神经元输出的加权和,其输出为:
其中,加权系数yij为第i个模式层节点对应的训练样本的输出的第j个元素。
输出层中的神经元数目等于训练样本中输出向量的维数I,每个神经元的输出等于各神经元对应求和层的输出与求和层第一个节点相除,即:
1.4平滑因子计算
本文采用平均绝对误差(MeanAbsoluteDeviation)遴选合适的平滑因子a值。
平滑因子a具体的选取步骤如下:
(1)令平滑因子a的取值范围(0,0.2],选一个初始的平滑因子参数,本文从0.2开始:
(2)初始化皿AE0为较大数值(如50):
(3)将训练样本及初始平滑因子ai代入训练GRNN网络,在得到测试结果后计算出相应皿AEi:
(4)比较皿AEi与皿AE0,保留误差较小的a作为新的平滑因子:
(5)以0.01为步长,将所有的平滑因子值代入,重复步骤(3)~(4):
(6)得到皿AE最小的取值,作为最终实际应用在网络中的平滑因子a。
1.5基于GRNN的台风灾害杆塔故障预测
台风灾害下杆塔跳闸故障预警的方法如图2所示,具体内容分为两个部分,一是根据历史数据对神经网络进行训练,二是根据实时数据实现杆塔跳闸故障预测。
关于神经网络的训练部分,首先根据气象台收录的台风历史数据、电网系统中的杆塔经纬度数据,将台风灾害期间的天气信息与杆塔进行关联,再结合使用1.1节中所列方式,形成神经网络输入数据:将历史杆塔故障信息作为相应的输出数据,生成神经网络的一个样本。将多组样本形成集合,对样本集合进行重采样,得到平衡样本集。将平衡样本集作为神经网络的训练数据,用以训练神经网络。
基于实时数据的杆塔预测是将实时采集的气象数据及位置信息输入训练完成的神经网络,得到神经网络的输出结果,预测杆塔是否会发生故障。
2台风灾害杆塔故障预测算例分析
2.1模拟场景
确定模型建立的流程后,借助Mat1ab软件来实现建模。本次预测所用的训练数据及预测数据包括福建省2016年"苏迪罗""尼伯特""莫兰蒂""鲇鱼"台风期间的数据以及相应的气象站、杆塔信息。通过1.1、1.2介绍的方式对数据进行处理后,得到训练用样本共计586组,预测用样本共计140组。用586组训练样本对网络进行训练后,再投入预测样本进行预测。
2.2故障预测结果
2.2.1预测结果
对140组预测结果统计得:在实际故障样本中,第8、9、17、21、52组的绝对误差达到了0.5及以上,共计5组;第5组的绝对误差在0.1~0.2,共计1组;其余组的绝对误差在0.1以内。以上共计5组偏差较大,占比3.57%。
2.2.2评价指标
输出结果的分布图如图3所示。
输出分布图反映了预测结果与实际情况的偏差。理想的输出结果应当呈现近"Z"形,图中预测结果存在很多毛刺,实际上仅有少数几组样本输出错误,其他输出值均接近实际值。
由于杆塔是否跳闸属于"非白即黑"的情形,所以选择指标为二分类的评价指标。将杆塔跳闸故障视为正类,设定输出为"1";杆塔正常运行视为负类,设定输出为"0"。这样,对输出的判定即为一个分类的过程,以0.5为阈值,对预测结果作评估。由2.2.1的结论可得,在预测样本集中,有第8、9、17、21、52组的预测结果与实际情况相反。综上,140组预测样本输出有135组预测值逼近实际值,总的正确率在96.43%。其中,70组故障样本中出现了5组错误结果,占比7.14%:而70组正常样本中0组预测失误,占比0%。
采用命中率(RTP)、假警率(RFP)和准确率(RACC)作初步评估:
式中:TP表示杆塔跳闸故障得到正确预测:TN表示杆塔正常运行得到正确预测:FN表示杆塔跳闸故障被错误预测:FP表示杆塔正常运行被错误预测。
以0.5为阈值分类,所得结果如表1所示。
预测的命中率达到92.8%,准确率达到了96.43%。
通过2.2.2中绝对误差分析得,这些样本无法通过调整二分类的分类阈值来达到避免错误的目的。图3中存在故障类样本的拒动,主要原因为故障样本数据较为接近非故障样本数据而导致误判、拒动。总的来说,绝大多数的样本都能实现正确的预测分类,GRNN基本能实现对跳闸故障的预警。
3结论及展望
针对现有的台风灾害下杆塔故障预测方法难以进一步提高预测准确性的问题,文中采用历史台风信息、杆塔信息以及故障信息,提出了基于广义回归神经网络的杆塔故障预警方法。基于实际杆塔故障数据的预测结果表明,文中方法具有96.43%的预报正确率,准确率较高,可以为线路台风防御提供决策依据。但文中选用的数据较为片面,缺少杆塔自身影响参数,训练数据总体偏少,对故障预报的效果有一定影响,在未来的研究中,需要进一步考虑其他影响因素,采用合适的优化处理,使用更多的训练数据和新的数据挖掘方法,以提高台风灾害下杆塔故障预测的准确性。