首页 > 范文大全 > 正文

基于粗糙集和信息熵的BP神经网络故障诊断

开篇:润墨网以专业的文秘视角,为您筛选了一篇基于粗糙集和信息熵的BP神经网络故障诊断范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:针对粗糙集只能处理量化数据,容错和推广能力较差的缺点以及BP神经网络的维数灾难问题,提出1种基于信息熵的粗糙集属性离散化方法. 该方法利用粗糙集对属性进行约简,解决BP神经网络的维数灾难问题,并将BP神经网络用于模式分类补偿粗糙集属性约简用于模式分类时的不足. 实例分析表明该方法具有较好的故障诊断效果.

关键词:粗糙集; 信息熵; 离散化; 神经网络; 故障诊断

中图分类号:TP212文献标志码:A

Fault diagnosis of bp neural network based on

rough set and information entropy

WANG Faxing1, SHEN Yonghong2

(1. Tongda College, Nanjing Univ. of Post & Telecommunications, Nanjing 210046, China;

2. School of Mathmatics & Statistics, Tianshui Normal Univ., Tianshui Gansu 741000, China)

Abstract: Rough set can only process quantization data, and the ability of fault-tolerant and generalization is weak, meanwhile, BP neural network has the dimension disaster problem. So a rough set attribute discretization method based on information entropy is proposed. The attribute is reduced to solve the dimension disaster problem of BP neural network. BP neural network is used to deal with the pattern classification to make up for the shortcoming brought by attribute reduction. The example result shows that the method has better performance for fault diagnosis.

Key words: rough set; information entropy; discretization; neural network; fault diagnosis

收稿日期:2009-05-08修回日期:2009-08-28

作者简介: 王发兴(1981―),男,甘肃武威人,讲师,硕士,研究方向为小波分析和计算机仿真等,(E-mail)

0引言

粗糙集理论是PAWLAK教授于20世纪80年代提出的1种新的处理模糊和不确定性知识的数学工具,具有无须提供除问题所需处理的数据集合之外的任何先验信息,仅根据观测数据删除冗余信息,比较不完整知识的程度――粗糙度、属性间的依赖性和重要性来抽取分类规则等的能力,其主要思想就是在保持系统分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则.目前,粗糙集理论已被广泛应用于机器学习、决策分析、模式识别与数据挖掘、故障诊断等领域.[1]

粗糙集模式识别的核心思想是首先导出问题的决策或分类规则,然后以此构成识别器对待识样本数据进行识别.当待识样本数据满足分类规则的条件时都会得到准确的识别结果,但当条件不满足时往往会有识别错误或不能识别的现象发生,其容错能力和推广能力相对较弱.BP神经网络是神经网络中最具代表性的1种,具有较强的模式分类能力,且容错能力和推广能力相对较好.但当网络维数较大或输入样本较多时,网络训练时间过于冗长.鉴于以上分析,在文献[1]中给出基于信息熵的属性离散化方法的基础上,本文克服粗糙集和BP神经网络各自用于模式识别时的缺点,将两者加以结合,从而建立1种基于新的离散化算法的粗糙集和BP神经网络故障诊断识别模型,以期在故障诊断识别中能取得更好的应用效果.

1粗糙集理论和信息熵

1.1粗糙集理论

1.1.1知识表达系统和决策系统

定义1在粗糙集理论[2-7]中,知识表达系统被定义为1个四元组S=(U,A,V,f).其中U={x,x2,…,xn}为对象的非空有限集合,也称为论域;A={a1,a2,…,am}为属性的非空有限集合;V为属性值域,V=∪a∈AVa;f:U×AV为一信息函数,表示对每一a∈A,x∈U,f(x,a)∈Va.当上述知识表达系统中属性A=C∪D,C∩D=Φ,其中C为条件属性集,D为决策属性集时,也称知识表达系统为决策系统.该系统通常采用决策表表达.[2-5]

1.1.2不可分辨关系

不可分辨关系是粗糙集理论中的1个重要概念.在决策表中,描述对象的属性是1种不精确信息,这种不精确信息造成对象之间是不可分辨或不分明的,观察这种不可分辨关系的对象正是粗糙集理论研究的出发点.

定义2S为知识表达系统,若PA,则定义属性集P的不可区分关系ind(P)为:

ind(P)={(x,y)∈U×U,a∈P,f(x,a)=

f(y,a)}(1)

如果(x,y)∈ind(P),则称x和y是P不可分辨的.不可分辨关系实际上是1种等价关系,具有不可分辨关系的对象是属性值完全相同的对象.符号U/P表示不可分辨关系ind(P)在U上导出的划分,称ind(P)中的等价类为P基本类.

1.1.3粗糙集的下近似、上近似及正域

定义3令XU,R是U上的1个等价关系.当X为R的某些等价类的并时,称X是R可定义的,否则称X是R不可定义的.称R可定义集为R精确集,称R不可定义集为R粗糙集.粗糙集可以用两个精确集,即粗糙集的下近似和上近似描述.其定义[3-6]如下:R-(X)=∪{YU/R|Y∩X≠Φ}(2)

R-(X)=∪{YU/R|YX}(3)其中,也称POSR(X)=R-(X)为X的R正域.

1.1.4属性约简

在决策表中,不同的条件属性具有不同的重要程度,一些属性可提供丰富的信息,对产生决策起着至关重要的作用,而其他一些属性却似乎可有可无.因此,可以在保证决策表具有正确分类能力的同时,对条件属性进行约简,去掉不必要的冗余信息.这就涉及到对属性约简的问题,其定义[3-4,6-7]如下:

定义4对于一给定的知识表达系统S=(U,A,V,f),条件属性C的约简是C的1个非空子集P.它满足:(1)a∈P,a都是D不可省略的;(2)POSP(D)=POSC(D),则称P是C的1个约简.

1.2信息熵

信息熵可表征信源整体的统计特征,是总体平均不确定性的量度.对于某一特定的信息源,其信息熵就只有1个,不同的信息源,因统计特性不同,其熵也不同.SHANNON定义自信息的数学期望为信息熵,即信息源的平均信息量H(X)=E[-log P(xi)]=-Ni=1P(xi)log P(xi)(4)式中:P(xi)表示事件xi发生的先验概率.

给定知识表达系统S和U为论域,P为U上的等价关系,令U/P={X1,X2,…,Xn},记P(Xi)=|Xi||U|,则依据式(4),可定义知识P的熵[8]为:H(P)=-ni=1P(Xi)log P(Xi)(5)2BP神经网络结构及BP算法

2.1BP神经网络结构

BP神经网络是指具有非线性传递函数神经元构成的、采用误差反向传播算法(BP算法)的前馈网络,在各领域有广泛的应用.[9-10]该网络通常由输入层、隐层(一层或多层)和输出层组成,层与层之间多采用全互联方式,同一层单元之间不存在相互连接,层间的连接权值和节点的阈值通过学习调节.理论上已证明,1个单隐层BP网络可以实现任意维到维的非线性连续映射,而且各节点均采用Sigmoid函数时,1个隐含层就足以实现任意判别分类问题.[11]常见的3层BP网络模型结构见图1.图 13层BP神经网络模型

2.2BP算法

BP算法是建立在梯度下降法基础上的适合于多层神经元网络的1种网络学习算法,主要思想是将学习过程分为2个阶段[8]:第1阶段(正向传播过程),给出输入信息通过输入层经隐含层逐层处理并计算每个单元的实际输出值;第2阶段(反向过程),若在输出层未能得到期望的输出值,则逐层递归地计算实际输出与期望输出之差值(即误差),以便根据此差调节权值,就是可对每个权重计算出接受单元的误差值与发送单元的激活值的积.因为该积与误差对权重的(负)微商成正比,将其称作权重误差微商.权重的实际改变可由权重误差微商逐个模式地计算出来,即它们可以在该组模式上进行累加.

3故障诊断模型

3.1基于信息熵的粗糙集属性离散化方法

对于决策表S=(U,C∪D,V,f),对每个连续型条件属性a∈C,论域中其有限个属性值经过排序后为la=va0

对于断点cai,决策属性值为j(j=1,2,…,r(d))的实例中,属于集合X且属于a的值又小于断点值cai的实例个数记为lXj(cai),大于断点cai的实例个数记为rXj(cai),令lX(cai)=r(d)j=1lXj(cai)rX(cai)=r(d)j=1rXj(cai)(7)因此,断点cai可以将集合X分成两个子集Xl和Xr,且有H(Xl)=-r(d)j=1pj log2pj, pj=lXj(cai)lX(cai)(8)

H(Xr)=-r(d)j=1qj log2qj, qj=rXj(cai)rX(cai)(9)因此,定义断点cai针对集合X的信息熵为HX(cai)=|Xl||U|H(Xl)+|Xr||U|H(Xr)(10)综合以上所述,可给出如下基于信息熵的属性离散化算法,为此首先引进记号:记P为已选取的断点集合;B为候选断点的集合;H为决策表信息熵;Va为属性a的值域;初值由式(6)取为H=H(X),其算法步骤如下:

(1)P=Φ,H=H(X);

(2)计算对每个断点c∈B针对集合X的信息熵,记为H(c,X);

(3)若H≤min{H(c,X)}或者min{H(c,X)}=0,则结束并转式(10),否则转式(4);

(4)选择使H(c,X)最小的断点cmin加到P中,B=B-{cmin};

(5)由步骤(4),断点cmin将集合X划分成X1和X2两类,依据步骤(2)针对X1和X2分别计算使得H(c,X1)和H(c,X2)取得最小的断点,分别记为cmin1和cmin2;

(6)若min{H(c,X1)}

若min{H(c,X1)}>min{H(c,X2)},则转(8);否则转(9);

(7)令X=X2,H=H(X2),转(2);

(8)令X=X1,H=H(X1),转(2);

(9)选取X1和X2中断点数目较少的集合记为Xr(r=1 or 2),并令X=Xr,H=H(Xr),转(2);

(10)对任一属性a,若存在断点ca∈P,而ca=min{Va}或ca=max{Va},则依据离散化时区间的选择对得到的断点集P进行检查,从而决定对断点ca进行取舍.

3.2BP神经网络故障诊断模型的构建

3.2.1故障诊断系统结构

故障诊断系统的结构框图见图2.图 2故障诊断系统结构

3.2.2构建过程及步骤

构建过程及步骤如下:

(1)构造学习样本集.从收集的原始数据中产生所需要的学习样本,数据的多少取决于许多因素,如神经网络的大小,测试的需要及输入、输出的分布等.其中,网络大小最为关键,通常较大的网络需要较多的训练数据.

(2)连续属性的离散化及决策表的形成.基于粗糙集的算法对数据的要求之一就是属性必须是离散值.然而,在实际应用领域,相当多的数据是连续的,因此要对数据进行离散化处理.采用离散化后的条件属性和决策属性值形成1张二维表格,每行描述1个对象,每列对应对象的1种属性.

(3)属性约简.对离散化后的数据利用粗糙集进行约简, 得到约简后各子神经网络输入.

(4)将约简后的属性数据作为神经网络的输入,并训练神经网络.

(5)输入诊断集进行故障诊断,并输出诊断结果.[12]

4应用实例

选取文献[11]中给出的某变压器的20组故障诊断样本数据对本文所述方法进行可行性与有效性分析.所构建的故障诊断决策表见表1,其中,A={s1,s2,s3,s4,s5}表示条件属性,分别表示所测的变压器中H2,CH4,C2H6,C2H4和C2H2的相对值;D为决策属性,有5种决策值,分别是无故障、低温放电、高温放电、低能量放电和高能量放电.

对表1样本数据进行基于信息熵的粗糙集属性离散化方法处理后,所得结果见表2.表 1变压器故障诊断决策表序号s1s2s3s4s5D146.1711.3733.128.520.620241.8833.5114.558.760.540333.4629.3232.9927.782.550446.8135.988.457.490.310515.2221.9817.8546.920.00160.8943.8827.0427.980.001735.1350.968.155.650.001837.9830.957.8723.010.001911.1921.7911.3052.982.392100.9516.0112.8968.410.9621115.0322.193.2657.961.0321220.0831.073.9843.221.5321358.0118.664.688.629.7831486.996.485.281.030.0031585.866.984.512.560.0031683.687.964.452.720.5631720.2316.961.6924.7434.5241826.8616.762.9838.9613.6141943.9224.416.6223.910.5442048.1210.884.2322.4623.684

表 2离散化后故障诊断决策表序号s1s2s3s4s5D1524350245443033546704553220514471161546117353111835351191347721012475211141762121517721373337314713113157121131671214317221684182216841944363420622584

按照粗糙集理论所给出的基于差别矩阵的属性约简算法进行约简后形成如下3个约简属性组合,分别为{s1,s3,s5},{s1,s4,s5}和{s1,s2,s3}.任选其中1组作为输入节点构建神经网络.不妨取约简属性集{s1,s3,s5},由于故障类别共分为5种,因此选输出节点为5个,选隐层节点为6个,误差精度为0.001.利用样本数据对所构建的BP神经网络进行训练,其误差曲线见图3.网络经过61次训练就达到预定精度要求.

图 3BP神经网络训练误差曲线

利用表2所给待识样本数据对训练好的神经网络进行检验,其结果见表3.从检验结果分析,与文献[11]中的识别结果基本一致,仅有对样本8的识别结果不相一致.在文献[11]中对实际故障为中温过热的样本8识别结果为低温过热,而此处识别结果为高温过热.虽然两者识别结果有些差异,但两者对故障类型的认定完全一致.因此,本文所构建的故障诊断模型具有一定的可行性与有效性.

表 3故障诊断及诊断结果(最后1列为检验结果)序号实际故障H2CH4C2H6C2H4C2H2检验结果1正常7.35.73.42.73.102低温过热12012033830.5413局部高温过热20.619.87.560.91.5224铁心多点接地4297156598025有局部放电1563933446036工频续流放电200471511512947层间绝缘不良98121322951528中温过热58761822029围频放电31.25.41.312.513.1410磁路高温过热7251813912995.82

5结论

随着设备结构的日趋复杂,故障类别也日趋多样,因此在实际生活中,对故障类别的诊断显得尤为重要.在实际故障诊断中采集到的数据往往是1个真实的数据,而且这些数据样本的分类边界不确定,故障与征兆之间的关系往往也不确定.本文在分析粗糙集和BP神经网络各自用于故障识别时的优缺点的基础之上,充分将两者的优点进行有机结合,并针对粗糙集只能处理量化数据的特点,给出1种基于信息熵的粗糙集属性离散化方法,从而建立1种新的故障诊断模型.通过对应用实例的分析发现,该模型对所给样本基本都进行准确识别,且与文献[8]相比,所需属性数更少.因此,该模型的提出将为有效进行故障识别以及其他诸如识别、分类等领域应用问题的解决提供更多可靠性方法.

参考文献:

[1]沈永红, 王发兴. 基于信息熵的粗糙集属性离散化方法及应用[J]. 计算机工程与应用, 2008, 44(5): 221-224.

[2]郭小荟, 马小平. 基于粗糙集的故障诊断特征提取[J]. 计算机工程与应用, 2007, 43(1): 221-224.

[3]胡寿松, 何亚群. 粗糙决策理论与应用[M]. 北京: 北京航空航天大学出版社, 2006: 4-51.

[4]PAWLAK Z.ROUGH set[J].Int J Comp & Infor Sci, 1982, 11(5): 341-356.

[5]曾黄麟. 粗集理论及其应用[M]. 重庆: 重庆大学出版社, 1998: 8-41.

[6]王国胤. Rough集理论与知识获取[M]. 西安: 西安交通大学出版社, 2001: 117-140.

[7]梁吉业, 孟晓伟. 信息熵在粗糙集理论中的应用[J]. 山西大学学报: 自然科学版, 2002, 25(3): 281-284.

[8]袁曾任. 人工神经元网络及其应用[M]. 北京: 清华大学出版社, 1999: 66-68.

[9]马维国. 纺纱生产BP神经网络模型[J]. 2004, 13(3): 57-59.

[10]张长君, 邹开其. 恶劣气象条件下高速公路匝道控制的神经网络方法[J]. 计算机辅助工程, 2006, 15(3): 86-88.

[11]王晓霞, 王涛. 基于BP神经网络的变压器故障诊断[J]. 华东电力, 2008, 36(2): 112-116.

[12]周天沛. 基于粗糙集―神经网络系统轴承故障诊断[J]. 轴承, 2008(2): 39-42.