首页 > 范文大全 > 正文

机器学习法在计量系统告警信息中的研究与应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇机器学习法在计量系统告警信息中的研究与应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:随着计算机技术、网络技术和数据库技术的快速进步和发展,电力运行网络已经引入了先进的自动化管理技术,开发了许多的分布式管理系统,电力系统运行积累了海量的数据。尤其是计量告警系统规模巨大,告警信息种类繁多,人工识别已经无法满足现代电网实时监控需求,需要采用机器学习、数据挖掘技术,从海量告警信息中挖掘潜在的模式,对告警信息进行自动化分类管理,以提高报警信息分析的准确度,提高电网监控管理成效,为电网计量系统正常运行提供支撑。

Abstract: With the fast growth and the rapid development of the computer, internet and database technology, some advanced automation technologies have been imported into the electric power operation network, and many distributed management systems have been developed. The power system operation has accumulated vast amounts of data, especially the alarming system. Because of so many different kinds of alarm information, artificial recognition has been unable to meet the demand of real-time monitoring of the modern electric network. Therefore it should use the machine learning method and the data mining technology to mine potential models from these different kinds of alarm information and apply the automatic classification management to the alarm information so as to enhance the accuracy of alarm information analysis and improve the efficiency of grid monitoring management, which can support the normal operation of the power grid measuring system.

关键词:机器学习;计量系统;告警信息;数据挖掘

Key words: machine learning method;measuring system;alarm information;data mining

中图分类号:TP274 文献标识码:A 文章编号:1006-4311(2016)11-0171-04

0 引言

随着计算机技术、网络技术和数据库技术的快速发展,电网运行管理开发了许多的自动化系统,比如SCADA系统、EMS系统、OPEN-3000管理系统、远程抄表系统等,均可以从电网中采集信息数据,是电网运行管理计量系统的重要组成部分[1]。目前,计量系统作为电网信息化系统的关键内容之一,可以保持电力系统的正确运行、量化统计电量信息、实现电力设备与网络的自动化调度和管理[2]。但是,由于国家电网运行网络的快速发展和建设,网络拓扑结构复杂,接入设备种类和数量均数以万计,因此需要构建专业的值班团队全天候、全区域地进行远程综合监控,分析监控信息,工作量非常大,给工作人员带来了严重的工作压力,降低了监控信息的分析质量和准确度。为了能够迅速地处理计量系统的告警信息,可以对报警监控信号逻辑化、条理化和有效化分析,为监控人员提供一个智能的分析工具,有力地支撑值班人员的判断和决策,定位计量系统的故障位置,提高电网运行的可靠性和准确性[3]。

机器学习算法可以从计量系统海量的告警信息中进行挖掘和分类管理,以便帮助监控人员发掘有价值的信息,实现用电需求侧综合性的实时信息采集与分析处理,基于电量计量的业务分析和研究,能够支持配电网建设,提高用电终端的电能利用效率,提升社会综合效益。本文详细地分析了计量系统告警信息的应用与发展现状,描述了常用的机器学习算法,设计了一种基于SVM的告警信息挖掘算法。实验结果表明,该算法能够准确挖掘计量信息数据模式,提高电网监控的准确度,并且能够在较短的数据处理时间,优化的数据处理内容。

1 常用机器学习算法分析

1.1 线性回归算法

计量系统告警信息分析过程中,线性回归算法采用目标函数与误差函数,可以实现数据信息分类,目标函数如公式(1)和公式(2)所示。

2 计量系统告警信息挖掘分析

2.1 计量系统告警信息挖掘算法设计

支持向量机(Support Vector Machine)是一种基于统计学习理论的有监督学习算法,其被Vapnik等人在上个世纪90年代提出,采用结构风险最小化原则的理论基础,能够通过适当地选择函数子集及该子集中的判别函数,使学习机器实际承受的风险达到最小化程度,因此可以通过学习训练样本得到最小误差分类器,并且测试用例集的误差仍然处于最小化[4]。具体的,支持向量机的基本运行思想是:在线性可分的情况下,可以在原始解空间寻找两类样本的最优分类超平面;在线性不可分的情况下,支持向量机可以加入松弛变量进行有效的分析,采用非线性映射,将低维输入空间的样本映射到高维属性空间,变为线性情况,从而使得支持向量机在高维分类算法进行学习和测试,并且可以在特征空间获取最佳的分类超平面。接着,针对分类超平面进行优化,采取结构风险最小化原理,在属性空间中构建最优的分类超平面,使得分类器获取全局最优。

传统支持向量机在计量系统告警信息分类中无法准确判断,降低了分类的召回率,为了解决上述问题,本文引入了回归预测的基本思想。回归预测思想可以有效利用算法采集告警信息上下文数据,充分地考虑告警信息分类的内容,结合当前告警信息表达背景,可以大幅度提升告警信息分析精确度[5]。因此,本文提出改进的SVM告警信息分类算法,详细描述如下。

本文提出的基于回归预测的SVM算法包含训练和分类模块,这两个模块的功能可以描述如下:

①基于回归预测的SVM训练模块。

在基于回归预测的SVM算法的训练模块中,其关键功能模块包括四个部分,分别是控制模块、告警信息分类训练模块、告警信息分类数据读取模块、告警信息分类评估模块。本文的算法中,将这四个功能模块进行有效的集成,完成对告警信息分类的评估。算法执行流程如图2所示。

1)首先根据需要确定输入的告警信息特征序列化条件,确定告警信息特征序列,统计一段上下文告警信息特征序列的取值范围。

2)然后调用告警信息词汇特征库,读取本模块的控制函数、分类算法评估函数,紧接进行告警信息特征内容序列的统计工作,并且将告警信息特征评估值的结果保存到LIST结构数据中。

3)算法取出LIST中保存的数据,将其传输到预测模型,训练告警信息分类功能模块,生成一个告警信息分类模型。

②基于回归预测的SVM预测模块。

告警信息分类模型训练完毕,采用以下步骤分类实际的告警信息。关键步骤描述如下:

1)获取告警信息内容实际数据,根据要求设定告警信息特征上下文取值范围。

2)统计告警信息特征出现在上下文的位置。

3)调用本模块中的告警信息分类函数,评估实际的告警信息取向。

改进算法的具体流程如图3所示。

经过上述过程执行完毕之后,就可以获取对改进的SVM算法的训练模型,并且将其应用到实际的告警信息分类过程中。详细实验和实验结果将在下属章节中进行描述。

2.2 计量系统告警信息挖掘算法实验结果分析

本文从SCADA系统、EMS系统、OPEN-3000管理系统、远程抄表系统等计量系统中提取相关的告警数据,为了能够验证本文算法的有效性,与线性回归算法、朴素贝叶斯方法和K近邻方法的实验结果进行比较,以便能够突出本文算法的有效性。首先,本文对告警信息的种类进行识别,使用的评价方法采用准确度、召回率、F值,三种识别方法的运行结果如表1所示。

实验结果表明,在识别告警信息时,本文提出的基于回归预测的SVM算法具有较高的准确度、召回率、F值,获取了比K近邻算法、朴素贝叶斯分类算法、线性回归算法更高的效果。

3 结束语

随着计算机技术在电网运行中的应用和管理,电力计量系统接入设备数量和种类较多,告警信息数据量大,人工分析无法快速、实时定位信息。本文基于回归预测设计了一种支持向量机算法,该算法能够准确地对告警信息进行分类,便于对不同类别的告警信息进行判断,及时响应,优化电网运行。

参考文献:

[1]赵硕.云计算和机器学习算法在电力负荷预测中的研究应用[D].华北电力大学,2014:1-3.

[2]虞尚智.机器学习算法在短期电力负荷预测中的应用[J].科学技术与工程,2013,13(08):2231-2234.

[3]宣婷婷,李峰,谭啸风.分布式发电系统中机器学习实时应用[J].华东电力,2014,12(12):1241-1243.

[4]汤进,黄莉莉,赵海峰,等.使用自适应线性回归的多标签分类算法[J].华南理工大学学报(自然科学版),2013,40(9):69-74.

[5]李晶辉,张小刚,陈华,等.一种改进隐朴素贝叶斯算法的研究[J].小型微型计算机系统,2013,34(7):1654-1658.

[6]陈雪云,卢伟胜.GSwMKnn:基于类别基尼系数子空间的加权互K近邻算法[J].计算机系统应用,2014,2(2):137-141.