开篇:润墨网以专业的文秘视角,为您筛选了一篇基于D—S证据理论的几种组合算法的研究范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!
【摘 要】D-S证据理论是一种非常有效的不确定性推理方法,其核心是D-S证据组合算法,为不确定信息的表达和合成提供了强有力的方法。本文对D-S组合算法及其几种改进组合算法进行讨论,分析了算法之间的内在联系,通过一个例子对比了运算结果,最后总结了这几种算法的适用性。
【关键词】D-S证据理论;证据组合算法;高冲突证据
0.概述
随着火电厂信息化的不断发展,目前电厂广泛采用的分散控制系统DCS可以对整个机组实现实时的、全方位和多层次的监控,这些关于设备和系统的丰富信息是进行故障诊断的宝贵资源。采用多源信息融合技术可以充分挖掘这些信息的内涵,并有效全方位的综合利用,从而提高对故障诊断的准确性、有效性和可靠性。因此多源信息融合理论在电力系统的故障诊断中具有较高的理论优势和应用前景。
D-S证据理论构造了不确定性模型的一般框架,建立了命题和集合之间的一一对应关系,把命题的不确定性问题转化为集合的不确定问题。D-S证据理论是信息融合技术中极其有效的一种不确定性推理,其核心是D-S证据组合规则,为不确定信息的表达和合成提供了强有力的方法。本文对D-S组合算法及其改进组合算法进行讨论、分析和对比。
1.基本概念[1,2]
设为识别框架,则函数m:2满足:
m(Φ)=0
m(A)=1 (1)
则称函数m为A的基本概率分配函数。m(A)称为命题A的基本概率赋值,表示对命题A的精确信任度,表示了对A的直接支持。设为一识别框架,m:2[0,1]是上的基本概率分配函数,定义函数Bel:2[0,1]
Bel(A)=m(B)(?A?) (2)
则称函数Bel为上的信任函数,称Bel(A)为命题A的信任度。Bel(A)表示A的所有子集的可能性度量之和,即表示对A的总的信任程度。由此,基本概率赋值可以表示为:
m(A)=(-1)Bel(B)(?A?) (3)
从这种意义上说,基本概率赋值和信任函数精确地传递同样的信息。如果识别框架的一个子集为A,且m(A)>0,则称的子集A为信任函数Bel的焦元。信任函数的全部焦元的并集成为信任函数的核(Core)。设为一识别框架,定义函数Pl:2[0,1]。
pl(A)=m(B)=1-Bel() (4)
则称函数Pl为上的似真函数,称Pl(A)为命题A的似真度。Pl(A)表示不否定A的信任度,是所有与A相交的集合的信任分配之和。它与信任函数传递的是同样的信息。当证据拒绝A时,Pl(A)=0;当没有证据反对A时,Pl(A)=1。于是我们有
Bel(A)≤pl(A) (5)
2.几种证据组合规则
2.1 D-S组合规则
D-S组合规则采用了称作正交和的规则。
设Bel1和Bel2是同一识别框架上的信任函数,m1和m2分别是对应的基本概率分配函数,焦元分别是A1,…,Ak和B1,…Br,则组合后新的基本概率分配函数 , 定义为组合算子:
(6)
其中:。在式中,若K≠1,则m确定一个基本信任分配函数;若K=1,则认为m1和m2完全矛盾的。
D-S组合规则为了保持基本概率分配函数的归一性,在处理矛盾因子时,使两个证据的公共焦元的基本概率赋值变为原来的1/(1-K),这意味着把局部的冲突放在全局中去分配。这里的“冲突”是指证据之间所支持命题的不一致性。
2.2 Yager组合规则
对于证据冲突的问题,Yager修改D-S组合规则,提出了一个与基本概率分配函数(Basic Probability Assignment Function,用m表示)不同的概念:基础概率分配函数(Ground Probability Assignment Function,用q表示)。这两者的主要区别有两点:一是归一化因子;二是m()的确定,它代表了由不知道所引起的不确定性。基础概率分配q(A)的定义如下[3]:
(7)
其中B和C是幂集2的子集,A是B和C的交集。注意这个公式里没有归一化因子,它是通过让q(Φ)≥0,(这里的Φ表示的是空集),从而避免了归一化的问题,而在D-S组合公式1中,有m(Φ)=0这个条件,为满足bpa之和等于1,就必须进行归一化。q(Φ)的计算式与D-S组合规则中的K的一样,即:
在处理由不知道所引起的不确定性的基本概率赋值时,Yager把代表冲突的q(Φ)加到了q()上,从而转化成Yager规则下的基本概率赋值mY()。这样做的后果显然是增大了不确定性。则Yager规则下的组合公式如下:
mY(Φ)=0 (9)
mY(A)=q(A) (10)
mY()=q()+ q(Φ) (11)
显然,就可以得到在Yager证据组合规则下的函数q与在D-S证据组合规则下的函数m之间的关系:
m(Φ)=0 (12)
m(A)=q(A)/(1-q(Φ)),A≠Φ, (13)
m()=q()/(1-q(Φ)) (14)
当q(Φ)=0时,也就是证据没有冲突的情况下,Yager规则的结果与D-S规则的相等。
2.3 Inagaki组合规则
Inagaki利用Yager定义的基础信任分配函数q的概念,定义一个连续型参数w(Continuous Parametrized Class),提出了一种统一的(Unified)组合规则,它包含了D-S和Yager两种组合规则。Inagaki认为所有的组合规则可以表达为如下形式[4]:
m(C)=q(C)+f(C)q(Φ),C≠Φ (15)
(16)
f(C)≥0 (17)
其中:函数f可以解释为q(Φ)的比例函数(Scaling Function)。参数w表示冲突,定义如下:
w=,?C≠,Φ (18)
把公式18带入到公式15可得:
m(C)=q(C)+wq(C)q(Φ)=q(C)(1+q(Φ))
同样有:
m(D)=q(D)+wq(D)q(Φ)=q(D)(1+q(Φ))
两式相比则有:
=,?C,D≠,Φ (19)
上式表明m和q的比率是一致的,这也是Inagaki规则的限制条件,说明在Inagaki组合规则中,认为所有的信息源(包括传感器和专家的知识、判断等)都是可靠的,不存在关于其可靠性和可信度的判断。如果对证据的可靠性进行判断,就必然增加权重系数,m和q的比率就会变化,等式19就不再成立。从公式15、16和18可知,Inagaki证据组合规则如下:
mw(C)=[1+wq(Φ)]q(C),C≠Φ, (20)
mw()=[1+wq(Φ)]q()+[1+wq(Φ)-w]q(Φ) (21)
0≤w≤ (22)
在公式中参数w的确定是重要的一步,其取值将直接影响组合后的结果,但现有文献中并没有给出一个合理明确的方法,一般只能从专家经验或者仿真实验中得到。在Inagaki组合规则中,当参数w取某些特定值时,就会相应转换成D-S规则和Yager规则。当w=0时,公式22就转化成公式12,公式23就转化成公式13;当w=1/1-q(Φ)时,公式22就转化成公式15,公式23就转化成公式16。在公式22中,若参数w取其上限值时,即:wext=1/(1-q(Φ)-q()),就得到另一种组合规则,称为极限规则(Extreme Rule or Extra Rule)。
mext(C)=q(C),for C≠ (23)
mext()=q() (24)
从公式23可知,(1-q(Φ))/(1-q(Φ)-q())可以理解为q(C)的比例因子,也就是说,最后的组合结果包含了冲突q(Φ)和由不知道所引起的不确定q(),其作用是对证据进行了选择。从以上可知,参数w如何选择,其本质就是如何处理冲突信息。Yager证据组合规则(w=0)把冲突那部分概率全部赋予了识别框架,没有改变证据;D-S组合规则(w=1/1-q(Φ))忽略所有的冲突信息,采用归一化方法把冲突信息按比例分配给了其它命题,因此对证据进行了较大程度的选择;Inagaki极限组合规则(wext=1/1-q(Φ)-q()),既包含了冲突q(Φ)又包含了由不知道所引起的不确定q(),对证据的选择程度由q(Φ)和q()的大小决定。w值越大,对证据的选择作用也越大。
3.不同组合规则的比较
本文采用具有高冲突证据的例子来比较各种组合规则的处理结果。
假定引起故障的原因有A、B和C三种情况,有两组证据,
m1(A)=0.9,m (B)=0.1,m1(C)=0.0;
m2(A)=0.0,m2(B)=0.1,m2(C)=0.9;
3.1 D-S组合规则
根据D-S组合规则可以得到如下表1的信任分配组合结果。
表1 D-S 组合规则的信任分配组合结果
根据公式6,由表1可知:
K=∑m(Φ)=0.09+0.81+0.09=0.99,
1-K=1-0.99=0.01;
m12(A)=m(A)/(1-K)=0;
m12(B)=m(B)/(1-K)=0.01/0.01=1;
m12(C)=m(C)/(1-K)=0;
m12()=m()/(1-K)=0;
例子中可以看出,两个证据支持都很低的命题B经过合成之后的支持度是1,而支持很高的命题A和C合成后的支持度却都是0,即使再增加新的证据,无论新证据对A和C的支持度是多少,组合后的支持度都为0,说明只要有一条证据否定某一命题,则组合后将始终被否定。产生这种有悖于常理结果的原因是D-S组合公式把空集m(Φ)的值舍去,并采用归一化因子K来保证所有基本信任分配m之和等于1,实质上是把冲突的那部分值按各自比重的不同分配给了其它命题,显然只有命题B不为0,所以这部分值都分配给命题B。
3.2 Yager组合规则
利用Yager组合规则计算也会得到与D-S组合规则相同的中间运算结果矩阵,见表1,但是在冲突的处理上有明显的不同,并且采用一个新的概念,就是基础概率分配函数q。根据公式10可得:
q12(A)=m12(A)=0;
q12(B)=m12(B)=0.01;
q12(C)=m12(C)=0;
q12(Φ)=m12(Φ)=K=∑m(Φ)=0.99;
q12()=m12()=0
根据公式11、12和13则有:
mY(A)=0;mY(B)=0.01;mY(C)=0;
mY()=q12(Φ)+q12()=0.99
Yager组合规则虽然没有采用归一化因子K,但是把冲突那部分概率赋值分配给了未知命题mY(),从而增大了未知命题的概率分配,因此其最终结果是降低了命题的信任度,提高了命题的似真度,而且也比原始证据对命题的判断要小的多。当证据冲突越严重,似真度提高的越显著。所以Yager组合规则的应用也有其局限性。
3.3 Inagaki组合规则
Inagaki规则也需要用到D-S规则的中间运算结果,并且使用了Yager组合规则中的基础信任分配函数q的概念。从Inagaki规则的组合公式中可知,m12(B)的值跟参数w有直接的关系。当w=0时,Inagaki组合规则就变成了Yager证据组合规则。当w=1/1-q(Φ)=1/(1-0.99)=100时,Inagaki组合规则就变成了D-S证据组合规则,此时m12(B)=1。当w=wup=1/(1-q(Φ)-q()),就是Inagaki上限规则,但在本例中q()=0,此时就变成D-S规则。当w取不同值时,Inagaki规则是对D-S规则的扩展和延伸。当w的取值不断增加时,对证据的选择作用也不断加强。
4.讨论
总之,通过对D-S理论的证据组合规则的研究,我们发现,在冲突很小或者冲突不相关时,并且所有的信息源被认为是可靠的情况下,D-S组合可以认为是合理的,Yager规则、Inagaki规则和D-S规则得出基本相似的结果。随着相关的冲突水平增加,冲突不被忽略,则可以采用Yager规则和Inagaki组合规则。在选择采用哪个组合运算时,首先要考虑的问题是冲突的程度和关联度,以及如何用某一个组合规则处理这些问题。 [科]
【参考文献】
[1]Shafer,G..A mathematical theory of evidence Princeton,NJ,Princeton University Press,1976.
[2]Dempster,A.P.Upper and lower probabilities induced by a multivalued mapping.The Annals of Statistics,1967,28:25-339.
[3]Yager, R.On the Dempster-Shafer Framework and New Combination Rules. Information Sciences 41,1987:93-137.
[4]Inagaki,T.Interdependence between Safety-Control Policy and Multiple-Sensor Schemes via Dempster-Shafer Theory.IEEE Transactions on Reliability 40(2),1991:182-188.