分享

基于大数据的输电线路故障警告模型设计

 GXF360 2017-12-17

郑茂然1,余江1,陈宏山1,高宏慧1,张静伟1,吕梁2,刘智勇2

(1.中国南方电网有限责任公司电力调度控制中心,广州510623;2.山大地纬软件股份有限公司,济南250100)

摘要:发展输电线路远程故障诊断是建设智能电网的重点内容。针对输电线路的上传数据单一、数量多、利用率低等问题,基于背景平台提供的大数据处理集群技术,以朴素贝叶斯算法结合时间序列相似性故障匹配建立输电线路故障预警模型。模型采用采集到的相关电气量、开关量、事件顺序信息、电网拓扑等数据以及输电线路故障过程中故障录波装置所获取的数据,采用朴素贝叶斯算法挖掘潜在故障发生因素(即故障因子)的发生指数,随后结合时间序列相似性故障匹配对输电线路进行故障预警。案例分析表明,所构建的模型能较好地挖掘出故障因子,预测结果较好。

关键词:输电线路;大数据;朴素贝叶斯算法;时间序列相似性匹配;故障预警模型

0 引言

社会经济的发展对电力的依赖性越来越强。大规模停电事故往往始于电网某一线路的故障,并随着电网拓扑的强关联性及存在的脆弱环节而不断扩大。对于某些供电网架薄弱的地区,单一线路故障就可能导致负荷损失[1]。在不提高电价转移经济压力的前提下,运用先进的智能化技术,对输电线路故障进行预警,开展差异化运维,减少线路故障发生的概率,有利于提高供电可靠性。

目前,针对输电线路故障的相关研究大部分仅依赖现有数据信息对故障进行诊断,如文献[2]仅依赖于查询跳闸线路周围的落雷参数实现雷击故障的自动诊断。事实上,电力系统存在上传数据单一、数量繁多、利用率低等问题[3],依靠此类数据难以实现故障预测的全面性和前瞻性,信息响应的及时性差,并且很难对线路异常情况做好跟踪并预测发展趋势。随着互联网技术的发展,大数据应用已在电力企业管理中崭露头角。文献[4]提出针对风电机组运行过程中产生的海量实时历史数据,通过建模技术进行挖掘建模,使用量化状态评估技术,通过定量的数据将机组的综合状态进行直观显示,对风电机组运行过程中的潜在故障和性能下降提前预警并提供优化运行指导;文献[5]针对电力大数据的平台架构和关键技术开发了一套基于PDMiner平台的电力系统安全评估与故障诊断系统,能准确地提取故障类型、风险区域等数据背后的准确信息。大数据技术有望成为对输电线路的运行状态进行异常跟踪和故障诊断的技术手段。

本文针对输电线路的磨损、老化及各类突发状况如雷雨、大雾、冰雪等恶劣环境因素引起的运行数据变化信息,基于大数据信息挖掘的理念,针对海量数据模型训练、预测计算时的高速度需求,选取朴素贝叶斯算法对可能导致输电线路故障的因素(即故障因子)的发生可能性的高低(即发生指数)进行挖掘,结合历史数据以时间序列相似性故障匹配对输电线路进行故障预警,以提高输电线路安全性和可靠性,避免大规模停电事故的发生。

1 线路故障预警建模设计

故障预警是一种信息反馈机制,即在故障发生之前对其进行预测预报。本文构建的输电线路故障预警模型是指通过故障发生的先行指标和发展趋势,度量未来故障风险强弱程度,当某种状态超过预警阈值时,发出预警信号并通知工作人员提前制订防范措施[6]

本文基于可采集的输电线路故障特征数据,以大数据计算集群为海量数据处理平台,以朴素贝叶斯算法对海量数据进行挖掘,从而获取故障因子发生指数,并对异常指数因子进行异常跟踪,以时间序列相似性故障匹配对输电线路进行故障诊断,当异常运行状态达到某一相似阈值时,对输电线路进行故障预警,辅助工作人员制订解决方案,实现对输电线路的异常跟踪和故障预警。

1.1 线路故障特征数据

输电线路故障主要包含雷击、覆冰、鸟害、污闪、山火故障等[7],针对不同故障类型,模型所采集的特征数据不同。线路故障特征如表1所示。

除电气特征量外,故障特征中还包含气象数据,即使是同一气象参数,不同的线路故障原因,相关气象参数的数值范围不尽相同。以空气湿度为例,发生雷击故障时的空气湿度大多为54% ~60%;发生污闪时的空气湿度很高,污秽的电阻率降低从而导致发生污闪;发生山火故障时的空气湿度则很低,空气干燥更易使可燃物达到着火点。

在实际运行时,不同输电线路故障所采集的特征数据不同,各监测点每天需要存储并传输的实时数据为百万单位级,每一类特征数据所包含的信息价值单一,如文献[2]构建的故障预测往往仅依赖于某一类数据,而难以实现海量数据的价值利用。针对整体数据存在信息单一、实时数据海量及利用率低等问题,故需要选择合理的数据学习算法对海量数据进行处理。

表1 线路故障特征
Tab.1 Characteristics of different fault types

障类型 故障特有特征项故雷击 输电线路属性、气象数据、地理信息数据、环境电阻率、周边磁场与电场、避雷线数据、雷击记录等。覆冰输电线路绝缘性、气象数据、导线舞动幅值、覆冰厚度、环境风速、弧垂偏差、杆塔倾斜率、垂直负荷、覆冰故障记录等。鸟害绝缘子属性与悬挂方式、气象数据、地域特性、植被覆盖、杆塔类型、季节与时间、周边电场数据、防鸟设备安装数据、鸟类活动与习性、线路鸟闪记录等。污闪绝缘子属性、气象数据、季节性与时段性、工业环境分布、空气污染数据、污秽成分分析、线路积污速率、防污设备安装数据、线路污闪记录等。山火植被条件、地理条件、气象数据、季节性与时段性、线路距地高度、线路网络山体分布、森林火灾等级、防火设备信息、山火故障记录等。

1.2 线路故障预警模型构建过程

线路故障预警模型遵循南网总调统一的云平台架构[8],主要分为信息采集、数据预处理等7个环节,以朴素贝叶斯算法实现对海量数据的挖掘,从而获取不同故障类型的故障因子发生指数,以时间序列相似性故障匹配对输电线路进行故障诊断,预警模型的数据处理流程如图1所示。

图1 预警模型数据处理流程图
Fig.1 Data processing flow of early warning model

1)信息采集

信息采集主要包含3个方面的内容,一是服务于各个专业的信息管理系统采集的输电线路相关的历史数据与实时数据;二是气象数据及环境数据;三是接入线路、母线的所有电流支路的故障录波装置在电网故障过程中所记录的用以确定检测目标的数据变化信息。

2)信号处理

信号处理旨在构建故障判别指标体系,即预处理信息采集数据,筛选故障预警特征项。主要包含构建基于朴素贝叶斯算法的故障因子挖掘数据库,以及构建基于时间序列相似性故障匹配的故障判别特征库。以雷击故障预警为例,可采集的监测特征项主要包括土壤电阻率、线路电压瞬时值等64项,信号处理为后续算法模型提供了特征数据输入,同时,基于现场反馈故障样本,备用特征项可以不断丰富优化故障判别特征。

3)故障因子挖掘

针对故障因子挖掘数据库所提供的特征项,基于朴素贝叶斯算法定义各故障的信息量和控制量,对故障判别特征库给出的潜在故障因子进行数据挖掘,并对异常指数故障因子进行异常状态跟踪,可以为基于量变预测质变奠定基础。

4)时间序列相似性匹配

基于故障判别特征库所提供的特征项,将包含统一时标基准的时序信息构成时间序列,根据不同的输电线路构造了相应的时间序列模型,设置了时间序列距离,明确了诊断的基本推理策略与方式,对达到一定相似阈值指标的输电线路进行故障预警。

5)故障诊断推送

将故障诊断结果推送给相关工作人员,辅助其提前制订现场故障解决方案,完成故障处理。

6)故障样本反馈

根据现场确认,将输电线路诊断情况、保护装置信息及故障原因等进行反馈,不断丰富故障样本库,完善故障判别特征库,更新故障预测准确度。

7)可视化结果展示

基于异常跟踪与故障诊断信息,将数据以多种形式进行展示,如故障特征分析展示,故障原因、故障位置及诊断结果的统一展示等。

1.3 线路故障预警模型关键点

数据学习算法应用于大数据处理时,往往存在内存开销过大、学习速度慢、数据过拟合而导致泛化性能差等问题,且由于大数据存在复杂、高维、多变等特性,需要采用降维和特征选择技术以降低大数据处理难度[9]。针对以上问题,将朴素贝叶斯算法运用于大数据的潜在故障因子挖掘。朴素贝叶斯算法最大的优势在于大数据量训练和查询时所具备的高速度,可基于实时反馈数据不断优化预测结果。然而朴素贝叶斯算法保证其预测准确性的前提,是特征项之间存在相对独立性。故本文仅选取与预测结果关联性强但彼此相对独立的部分特征,实现对每个故障因子变化状况的预测[10]

经数据筛选后的采集数据,部分特征与故障发生存在必然的关联性,为提高故障预测的准确度,采用时间序列相似性故障匹配将所挖掘的故障因子与关联特征构成时序事件,从而实现故障预警。通过朴素贝叶斯算法与时间序列相似性故障匹配结合构建故障预警模型,朴素贝叶斯算法通过故障因子挖掘预测故障因子指数,辅助时间序列相似性故障匹配提高故障预测的全面性和前瞻性,基于时间序列相似性故障匹配避免了朴素贝叶斯算法特征项的关联性,二者结合可有效实现输电线路运行异常跟踪、故障预警。

2 故障判别指标体系特征筛选

2.1 测度指标概念

朴素贝叶斯算法需要尽可能地减少特征项之间的关联性,而采集信息中包含大量与故障类型相关且彼此关联的特征项,需要采用基于时间序列相似性故障匹配对预警目标相关特征项进行补充利用,分别基于朴素贝叶斯算法和时间序列相似性故障匹配的特点构建故障因子挖掘数据库和故障判别特征库,通过数据预处理将数据分类构建成满足不同算法模型[11]的故障判别指标体系,为故障预警提供数据支撑。

首先定义测度指标:给定两个特征项 aj和ak(j,k∈1,2,…,N)(N为待选特征项数量),其概率密度为 p(aj)和p(ak),联合概率密度为 p(aj,ak),则aj和ak之间的互信息[12]为:

相关性和冗余度的测度指标分别定义为

综合考虑上述两个测度指标,最大相关最小冗余准则如下:

式(1)—(4)中:c为目标类别;I(aj,c)为特征项aj和目标类别c之间的互信息;I(aj,ak)为特征项aj与特征项ak之间的互信息;D为特征项与目标类别的相关性,R为特征项之间的冗余度。

故障判别指标体系特征筛选过程如下:

1)基于信息采集数据作为原始数据集A,包含N个特征的原始特征集,S为选中特征集,初始为空集,F为待选特征集,初始包含N个特征;

2)计算aj∈F与目标类c之间的互信息I(aj,c),找到使max[D]成立的特征,并记为,令重复本步骤,直到F为空集,此时,SN中的特征按照特征项与目标类的相关性随j的递增呈降序排列;

3)将SN中的特征项aj(j=1)依次与其余各项求互信息,即得到特征项aj(j=1)与各项的冗余度集Rj(j=1),令j=j+1,重复本步骤,直到j>N,此时获得各特征项间的冗余度二维集合R={R1,R2,…,RN};

4)基于试凑法初始化相关性阈值,并根据模型的故障预警模型正确率的验证,可修正相关性阈值,将中高于相关性阈值的特征项归于故障因子挖掘数据库;

5)根据最大相关最小冗余准则设置初始化冗余度阈值γ,对于故障因子挖掘数据库中的特征项aj(j=1),将冗余度集合Rj(j=1)内数值大于γ且存在于故障因子挖掘数据库的特征项移入故障判别特征库,令j=j+1,重复本步骤,直至遍历完故障因子挖掘数据库内的特征项,由此获取故障因子挖掘数据库和故障判别特征库。

2.2 雷击线路故障测度指标

以雷击故障采集特征项线路服役寿命为例进行说明,其中C=0和C=1分别表示雷击故障未发生和发生,基于训练样本集所获取的样本数据可得其概率值为p(C=0)=0.991 3、p(C=1)=0.008 7。表2—3分别为线路服役寿命a1的概率值p(a1)及雷击故障发生与未发生条件下线路服役寿命a1的概率值p(a1)。

表2 线路服役寿命a1的概率值
Tab.2 Probability value of line service life a1

a1/a 特征概率值p(a1) a1/a 特征概率值p(a1) 0~1 0.04 6~7 0.07 1~2 0.1 7~8 0.04 2~3 0.19 8~9 0.02 3~4 0.21 9~10 0.01 4~5 0.2 >10 0.01 5~6 0.11

表3 雷击故障对线路服役寿命a1概率值的影响
Tab.3 Probability value of line service life a1 under the condition of lightning fault

a1/a p(a1,C=1)/ p(a1,C=0) a1/a p(a1,C=1)/ p(a1,C=0) 0~1 0.093/0.849 6~7 0.240/0/667 1~2 0.104/0.822 7~8 0.245/0/635 2~3 0.112/0/807 8~9 0.263/0.621 3~4 0.127/0.756 9~10 0.271/0.609 4~5 0.162/0/734 >10 0.285/0.598 5~6 0.221/0/680

由以上数据可得线路服役寿命和雷击故障的相关性如式(5)所示。

基于样本获取的相似度阈值,将线路服役寿命特征项归入故障因子挖掘数据库,并基于故障因子挖掘数据库所含有的特征项,使用同样的计算方法可获得线路服役寿命与其他特征项之间的冗余度,然后将低相似度且冗余度超出阈值的特征项归入故障判别特征库,如相对湿度特征项等,即可完成故障判别指标体系的构建。事实上,在雨/雾天气中,相对湿度增大,导线表面易形成水滴、凝露,致使表面电场畸变,增大电场的不均匀程度,降低其起晕电压而产生电晕放电,导致输电线路使用年限缩短[13]。说明相对湿度与线路的服役寿命存在显著关联性,对雷击故障的发生均存在影响,本文对特征项的分类方法符合实际情况。

3 基于朴素贝叶斯算法的故障因子挖掘

针对数据类型单一、数量多、利用率低等问题都可能导致故障匹配预测失效的情况,以朴素贝叶斯算法[14]进行大数据挖掘,获取故障因子发生指数,从而提高故障检测的全面性与及时性,具体如下。

1)基于故障因子挖掘数据库所提供的特征项,定义x={a1,a2,…,am}为一个待分类项,而每个a为潜在故障因子x的一个特征项。

2)确定潜在故障因子类别集合C={y1,y2},其中,y1为潜在故障因子发生为真,y2为潜在故障因子发生为假。

3)将以往输电线路故障发生情况明确的历史数据作为一个已知分类的待分类项集合,即确定训练样本集。

4)统计得到在各类别下各个特征属性的条件概率估计,即

如果即某个类别下某个特征项没有出现时,模型预测的质量会大大降低,为此引入Laplace校准,对每一类别下所有特征项的计数加1,训练样本集数量足够大,并不会对结果产生影响,并且解决了上述发生频率为0的尴尬局面。5)根据贝叶斯定理有如下推导:

因为分母对于所有类别为常数,只将分子最大化即可,进一步化简可得

6)将待检测样本数据投入故障因子挖掘模型中,本方法采用朴素贝叶斯算法实现故障因子挖掘,为时间序列相似性故障匹配提供预测数值,以避免单纯的二分类不符合下一环节精度要求,故本环节求得故障因子发生指数为故障发生与故障未发生的概率比:

7)当故障因子发生指数高时,不断对该异常状态进行跟踪检测,将实时变化的异常特征因子指数传递给故障判别特征库内作为基于时间序列相似性故障匹配的输入特征,从而对可能存在的故障做出合理预测,算法易于实现并行计算,实时性高,便于实现异常跟踪。

4 基于时间序列相似性故障匹配

输电线路故障前后关联特征量的发展过程有时序特征,可以采用基于时间序列相似性故障匹配[15-16]进行故障预警。根据故障判别特征库数据确定基于时间序列相似性故障匹配的输入特征,定义时间序列为某个电气量记录值和时间节点组成元素的有序集合,记为X={x1=(v1,t1),x2=(v2,t2),…,xn=(vn,tn)},其中,xi=(vi,ti)表示时间序列在ti时刻所记录的信息为vi;1,2,…,n代表事件发生的先后次序,且事件顺序与时间节点顺序同步,即i≤jti≤tj,i,j∈(1,2,…,n)。

本文时间序列的相似性以编辑距离来衡量[17],距离越小,两个时间序列的相似度就越高,以编辑距离计算两个事件发生的时间序列之间的距离,将实时事件发生序列X={x1,x2,…,xm}和标准序列Y={y1,y2,…,yn}进行对比,序列X和序列Y之间的编辑距离Dm,n可用式(10)从D0,0递归计算得到。

其中当xi∈yj时,L(xi,yi)=0,否则,L(xi,yi)=1。此外,根据历史数据聚类设置事件权重与相似度距离阈值,相似度越小,故障事件发生的可能性越高。

以单相接地为例,不论是突发性事件还是线路老化导致的量变性事件,均可以使用线路的使用年限、运行状态、故障发生数据、天气信息等数据进行故障因子挖掘,如雷击导致的单相接地的宏观典型数据“地表温度—相对湿度—地面气压—地闪密度—避雷线电流数据—氢氧化物含量—故障因子(雷击指数)—电流升高—保护动作—电流衰减至零”的时序信息,利用系统采集到的包含统一时标基准的电气量信息,可根据故障关联特征将信息构造成相应的时间序列诊断规则[18],然后基于挖掘预测出此类故障因子发生指数,即将实时信息构成的序列与标准序列比对,采用基于时间序列相似性进行故障预警,结合电网拓扑结构及历史故障数据给出故障发生后的数据分析。

5 实例分析

以某电网为系统实施背景平台,数据主要来自于智能变电站、智能电表、实时监测系统、现场移动检修系统、测控一体化系统等信息管理系统、互联网的遥信、遥测数据和包含气象信息的环境数据,以及线路、母线、主变设备的所有电流支路电流、电压变化的波形数据。以雷击导致的线路单相接地故障进行案例实现说明。

1)故障判别指标体系

雷击导致的线路单相接地问题为突发性输电线路故障,主要以基于朴素贝叶斯算法的故障因子挖掘模型实现对线路老化度、布局合理度、雷击指数等预测,给出区域各故障因子指数。

以2013年统计的输电线路故障数据为依据,全年跳闸次数为1 311次,其中雷击607次,占比46.3%,以雷击故障案例作为故障因子挖掘模型的训练集雷击故障样本,以该区域发生降雨但未发生雷击的样本案例69 236起作为正常样本混入训练集,随后以2014年上半年雷击故障案例和未雷击案例作为测试样本集,进而对所建故障因子挖掘模型进行测试。以2014年发生的某220 kV输电线路A相遭遇雷击故障的特征数据对雷击指数进行挖掘。

基于样本采集数据对故障特征进行梳理,构建的故障判别指标体系主要包含:1)构建基于朴素贝叶斯算法故障因子挖掘的故障因子挖掘数据库,相关性阈值设为=0.021,本次故障因子挖掘数据库包含特征项15类,如表4所示;2)构建基于时间序列相似性故障匹配故障判别特征库冗余度阈值γ=[91 64 43 42 3 26 22 12 11 1 5 5 5 5 5]×10-4,除上一环节所挖掘到的雷击指数外,本次故障判别特征库另包含特征项6类,如表5所示。

2)故障因子挖掘

根据故障因子挖掘数据库所提供的数据特征统计得到在各类别下各个特征属性的条件概率,也列入表4[19]

表4 故障因子挖掘主要特征及其条件概率
Tab.4 Main characteristics and Its conditional probability of fault factor mining

数据来源 主要特征 测试样例特征数值发生雷击条件下概率值不发生雷击条件下概率值智能变电站监控系统、故障录波装置线路服役寿命/a 6~7 0.24 0.12土壤电阻率/ Ω·cm 5×104 0.53 0.18线路电压瞬时值/kV 220 0.38 0.27地理信息系统水域分布/km 2~8 0.75 0.24海拔高度/m 500~600 0.31 0.23线路地面距离/m 6.5 0.52 0.47地面倾角/(°) 43 0.32 0.15输电线路监测系统、故障录波装置线路工频电场/(kV/m) 8.9 0.71 0.33线路工频磁场/mT 0.56 0.63 0.19气象信息 雷雨时长/min 30~40 0.63 0.44雷雨等级 暴雨 0.47 0.31避雷线高度/m 15~18 0.24 0.26避雷线间距/m 12~15 0.37 0..18避雷线保护角/(°) 5.71 0.55 0.33档案数据测控一体化系统 雷击记录/次2 0.84 0.12

此外,经历史数据训练可得,雷击事件发生的概率为0.008 7,雷击事件不发生的概率为0.991 3,最终获得本次雷击发生与未发生计算概率为:

表5 时间序列相似性距离
Tab.5 Time series similarity distance

故障因子类型 雷击标准时间序列阈值范围 区域日常数值 故障发生前记录数值 编辑距离 事件权重 相似度距离地表温度 >18℃ 12~28℃ 26℃ 0 1 0相对湿度 62%<y<79% 54%~60% 68% 0 98 0地面气压 <920 hPa 960~980 hPa 840 hPa 0 1.6 0地闪密度 >6.2 0 28.6 0 12 0避雷线电流数据 >1 kA 0 A 0 A 1 000 0.01 10氮氧化物的体积分数 >1.7×10-9 <1.11×10-9 8.9×10-9 0 10 0雷击指数 <1.34 3.69×104 4.04×10-3010

故障发生与否的雷击指数差异明显,适用于下一环节的故障匹配。此类异常指数故障因子应保持实时的异常跟踪。

3)雷击故障诊断

针对故障因子挖掘模型获取的故障因子指数,本文以基于时间序列相似性故障匹配对雷击导致的故障进行预测及数据分析,对2013年607起雷击故障案例所采集到的特征信息进行聚类归纳,可以获取典型时间序列事件,相似度阈值取126,相似度数值越低,雷击故障发生可能性越高。同样选取2014年发生的某一220 kV输电线路单相雷击故障的数据进行示例说明,使用所建预警模型对本区域雷击故障发生前的数据进行测试,可得时间序列相似性距离,同样列入表5。

表中,本区域遭遇雷击事件与基于历史数据获取的区域雷击事件相似度距离为10,小于相似度距离阈值,由此对本区域做出雷击预警的诊断。理论分析表明,雷电发生存在特有的雷电轨迹与雷电主导向,处于下风向的输电线路更易遭遇雷击,而由于水域交界处的土壤电阻率存在突变,雷电轨迹明显受这一因素影响[20],测试数据与雷击故障特征关联数据吻合。

以该地区2014年上半年324起雷击故障案例和34 591起未发生雷击的案例作为测试样本集,对所建预警模型进行测试评价,结果如表6所示。

表6 基于时间序列相似性故障匹配的测试结果
Tab.6 Test results based on time series similarity fault matching

匹配项 预测为无雷击 预测为雷击 测试总数实际发生雷击 57 267 324实际未发生雷击 34 453 138 34 591测试总数34 510 405 34 915

模型指标评价:

模型预测的准确性超过99%,由于各地区输电线路运行环境存在较大差异,系统诊断正确率和召回率无法保证精确度100%。随着电网的不断发展,输电线路故障数据不断累积,模型参数更加全面,可满足小区域样本训练需求,提高系统诊断精确率,保障电网运行稳定性。

6 结语

本文分析了基于大数据的输电线路故障预警模型的关键环节,构建了故障预警模型。首先采用朴素贝叶斯算法实现海量数据实时处理,由于该算法特征项需要独立,为避免特征项间强关联存在,仅选取部分特征以该算法对故障因子发生指数进行挖掘;随后结合现有可检测数据,以基于时间序列的相似性故障匹配对输电线路运行状况进行故障预警。为保证海量数据处理的及时性与有效性,以大数据计算集群对海量数据进行实时数据处理,提高数据处理的稳定性和可靠性。对实际电网线路雷击故障的分析表明,所构建的故障预警模型较好地挖掘出了故障因子,并与基于时间序列相似性的故障匹配相结合,对输电线路故障做出了较好的预测。

参考文献:

[1] 刘通,代洲,王颂,等.架空输电线路的故障模式及相关故障树分析[J].南方电网技术,2013,7(6):108-112.LIU Tong,DAI Zhou,WANG Song,et al.Analysis of the fault modes and interrelated fault trees of overhead transmission lines[J].Southern Power System Technology,2013,7(6):108-112.

[2] 陶汉涛,冯万兴,卢恩泽,等.输电线路跳闸雷电绕反击故障自动诊断系统的研发[J].高压电器,2016,52(5):34-41.TAO Hantao,FENG Wanxing,LU Enze,et al.Research and development of automatic diagnosis system of lightning trip-out shielding failure and back striking fault for transmission line[J].High Voltage Apparatus,2016,52(5):34-41.

[3] 刘广一,朱文东,陈金祥.智能电网大数据的特点、应用场景与分析平台[J].南方电网技术,2016,10(5):102-110.LIU Guangyi,ZHU Wendong,CHEN Jinxiang,et al.Characteristics,application scenarios and analysis platform of smart grid big data[J].Southern Power System Technology,2016,10 (5):102-110.

[4] 吕庭彦,李亚冬,蒋维.基于大数据挖掘技术的风电机组安全经济运行状态综合评估系统[C]//中国电力企业联合会.2013电力行业信息化优秀成果集.北京:中国电力企业联合会,2013.

[5] 常成.基于PDMiner大数据挖掘平台的电力系统安全评估及故障诊断系统[J].电力与能源,2016,37(1):7-11.CHANG Cheng.Power system security assessment and fault diagnosis system based on PDMiner large data mining platform[J].Electricity and Energy,2016,37(1):7-11.

[6] 王建.输电线路气象灾害风险分析与预警方法研究[D].重庆:重庆大学,2016.

[7] 苏寅生.考虑外部环境的电网故障概率模型综述[J].南方电网技术,2015,9(6):87-92.SU Yinsheng.Survey on power system contingency probability models considering ambient factors[J].Southern Power System Technology,2015,9(6):87-92.

[8] 梁寿愚,胡荣,周华锋.基于云计算架构的新一代调度自动化系统[J].南方电网技术,2016,10(6):8-14.LIANG Shouyu,HU Rong,ZHOU Huafeng,et al.A new generation of power dispatching automation system based on cloud computing architecture[J].Southern Power System Technology,2016,10(6):8-14.

[9] 何清,李宁,罗文娟.大数据下的机器学习算法综述[J].模式识别与人工智能,2014,27(4):327-336.HE Qing,LI Ning,LUO Wenjuan,et al.A survey of machine learning algorithms for big data[J].Pattern Recognition and Artificial Intelligence,2014,27(4):327-336.

[10] JIANG Qingchao,HUANG Biao,DING S X.Bayesian fault diagnosis with asynchronous measurements and its application in networked distributed monitoring[J].IEEE Transactions on Industrial Electronics.2016,63(10):6316-6324.

[11] 陈佳俊,陈玉峰,严英杰,等.基于时空联合聚类方法的输变电设备状态异常检测[J].南方电网技术,2015,9(11): 65-72.CHEN Jiajun,CHEN Yufeng,YAN Yingjie,et al.Anomaly detection of state information of power equipment based on spatiotemporal clustering[J].Southern Power System Technology,2015,9(11):65-72.

[12] 李扬,顾雪平.基于改进最大相关最小冗余判据的暂态稳定评估特征选择[J].中国电机工程学报,2013,33(34):179-186,27.LI Yang,GU Xueping.Feature selection for transient stability assessment based on improved maximal relevance and minimal redundancy criterion[J].Proceedings of the CSEE,2013,33 (34):179-186,27.

[13] 蒋兴良,李源军.相对湿度及雾水电导率对直流输电线路电晕特性的影响[J].电网技术,2014,38(3):576-582.JIANG Xingliang,LI Yuanjun.Impact of relative humidity and water fog conductivity on corona characteristics of HVDC power transmission lines[J].Power System Technology,2014,38 (3):576-582.

[14] YANG Youlong,WU Yan.On the properties of concept classes induced by multivalued Bayesian networks[J].Information Sciences,2012,184(1):155-165.

[15] 钟锦源.含时序信息的电力系统故障诊断方法与应用[D].杭州:浙江大学,2015.

[16] ZHAO Xiangfu,OUYANG Dantong,ZHANG Liming,et al.Reasoning on partially-ordered observations in online diagnosis of DESs[J].AI Communications,2012,25(4):285-294.

[17] 廖志伟,岳苓,文福拴.基于混合规则网络和警报时序特性的电力系统故障诊断[J].电力系统自动化,2013,37(10): 72-79.LIAO Zhiwei,YUE Ling,WEN Fushuan.Fault diagnosis of power system based on hybrid rule network and alarm timing characteristics[J].Automation of Electric Power Systems,2013,37(10):72-79.

[18] 沈鑫,曹敏,薛武,等.基于物联网技术的输变电设备智能在线监测研究及应用[J].南方电网技术,2016,10(1):32-41.SHEN Xin,CAO Min,XUE Wu,et al.Research and application of intelligent online monitoring of power transmission and transformation equipment based on technology of internet of things[J].Southern Power System Technology,2016,10 (1):32-41.

[19] 王云飞.输电线路雷击选择性及其影响因素的研究[D].成都:西南交通大学,2009.

[20] 吴巍巍,江聪世,汤振鹏,等.基于时空聚类的雷电时空丛聚特性分析[J].高电压技术,2016,42(5):1586-1593.WU Weiwei,JIANG Congshi,TANG Zhenpeng,et al.Analysis on spatiotemporal clustering characteristics of lightning based on spatiotemporal clustering[J].High Voltage Engineering,2016,42(5):1586-1593.

Design of Fault Warning Model of Transmission Line Based on Big Data

ZHENG Maoran1,YU Jiang1,CHEN Hongshan1,GAO Honghui1,ZHANG Jingwei1,LLiang2,LIU Zhiyong2
(1.Power Dispatching Control Center,CSG,Guangzhou 510663,China;2.Dareway Software Co.,Ltd.,Jinan 250100,China)

Abstract:The development of remote fault diagnosis of transmission line is one of the focuses of the construction of smart grid.To solve the problems of homogeneous uploaded data,enormous amount of data,and poor data utilization,naive Bayes algorithm is used together with similarity fault matching by time sequence to establish a transmission line fault warning model,based on the big data processing cluster technology provided by the background platform.The model uses collected data of electrical and switching information,event sequence information,power network topology,and data acquired by fault recorders during transmission line failure,and applies naive Bayes algorithm to excavate the occurrence factor of potential fault(i.e.,fault factor),then,by cooperating with similarity fault matching by time sequence,the fault of transmission line can be forecasted.Case analysis shows that the model can excavate fault factors correctly and the forecast result is satisfactory.

Key words:transmission line;big data;naive Bayes algorithm;similarity matching by time sequence;fault warning model

文章编号:1674-0629(2017)04-0030-08

中图分类号:TM76

文献标志码:A

DOI:10.13648/j.cnki.issn1674-0629.2017.04.005

收稿日期:2016-12-15

作者简介:

郑茂然(1981),男,高级工程师,硕士,从事电力系统继电保护运行管理工作,ranran_zheng@126.com;

余江(1975),女,高级工程师(教授级),博士,从事电力系统继电保护技术管理工作,yujiang@csg.cn;

陈宏山(1979),男,高级工程师,硕士,从事电力系统继电保护运行管理工作,chenhs@csg.cn。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多