您好,欢迎来到意榕旅游网。
搜索
您的当前位置:首页证据理论

证据理论

来源:意榕旅游网


证据理论(Evidence Theory)方法

我们将讨论一种被称之为登普斯特-谢弗(Dempster-Shafer)或谢弗-登普斯特(Shafer-Dempster)理论(简称D-S理论或证据理论)的不精确推理方法。这一理论最初是以登普斯特(Dempster,1967年)的工作为基础的,登普斯特试图用一个概率区间而不是单一概率数值去建模不确定性. 1976年,谢弗(Shafer,1976年)在《证据的数学理论》一书中扩展和改进了登普斯特工作. D-S理论具有好的理论基础。确定性因子能被证明是D-S理论的一种特殊情形。在§2我们将描述一种简化的证据理论模型MET1 . 在§3我们将给出支持有序命题类问题的具有凸函数性质的简化证据理论模型。围绕证据理论的一些新的研究工作,将在第六章介绍。

§1 D-S理论(Dempster-Shafer Theory)

● 辨别框架(Frames of Discernment)

D-S理论假定有一个用大写希腊字母 Θ 表示的环境(environment),该环境是一个具有互斥和可穷举元素的集合: Θ = { θ1 , θ2 , … , θn }

术语环境在集合论中又被称之为论域(the universe of discourse)。一些论域的例子可以是:

Θ = { airliner , bomber , fighter }

Θ = { red , green , blue , orange , yellow } Θ = { barn , grass , person , cow , car }

注意,上述集合中的元素都是互斥的。为了简化我们的讨论,假定 Θ是一个有限集合。其元素是诸如时间、距离、速度等连续变量的D-S环境上的研究工作已经被做。

理解 Θ 的一种方式是先提出问题,然后进行回答。假定 Θ = { airliner , bomber , fighter }

提问1:“这军用飞机是什么?”;

答案1:是 Θ的子集{ θ2 , θ3 } = { bomber , fighter } 提问2:“这民用飞机是什么?”;

答案2:是 Θ的子集{ θ1} = { airliner },{ θ1} 是单元素集合。

−31−

因为元素是互斥的,环境是可穷举的,对于一个提问只能有一个正确的答案子集。环境的所有子集是对应论域的所有可能的有效答案。 飞机环境的所有可能的子集由图5.1.1示出。注意,图5.1.1是一个格,子集节点可以有多个父亲节点,这个格(Lattice)是一个分层结构。从 Θ到 ∅ 的任一路径都表达了连接父节点到儿子节点的子集分层关系,例如,∅⊂{A}⊂{A,B}⊂{A,B,C} . 当一个环境的元素可以被解释成可能的答案,并且仅有一个答案是正确的,那么该环境被称之为一个鉴别框架。

鉴别这个术语意味着,对于一个提问,从与该提问相关的所有可能的答案中能区分出一个正确的答案。

能区分出一个正确的答案需要鉴别框架是可穷举的,其子集是不相交的。

一个大小为N的集合包括自身恰有2N个子集,这些子集定义了幂集,记为2Θ,对于飞机框架有

2Θ = {∅,{A},{B},{F},{A,B},{A,F},{B,C},{A,B,C}}

2Θ 和对应于环境的所有可能提问的正确答案之间存在着一一对应关系。

● MASS函数和无知

在贝叶斯理论中,后验概率随着证据而改变是所需要的。同样地,

在D-S理论中,关于证据的信任

−32−

{ A , B } Θ = { A , B , F } { A , F }{B , F } { A } { F } { B }

∅ 图5.1 飞机环境的所有子集,其中A , B , C 分别代表airliner , bomber和 fighter

也可以改变。在D-S理论中,习惯上把证据的信任度类似于物理对象的质量去考虑,即证据的质量(Mass)支持了一个信任。关于质量这一术语也被称为基本概率赋值(BPA , the Basic Probability Assignment)或简称为基本赋值(Basic Assignment)。为了避免与概率论相混淆,我们将不使用这些术语,而是简单的使用质量(Mass) 一词。

即使在无知的情D-S理论和概率论的基本区别是关于无知的处理。

况下,概率论也必须分布一个等量的概率值。假如你没有先验知识,那么你必须假定每一种可能性的概率值都是P

1

P=

N

−33−

其中,N是可能性的总数。 事实上,这赋值为P是在无可奈何的情况下作出的。但是,概率论也有一种冠冕堂皇的说法,即所谓的中立原理(the principle of indifference )。当仅仅有两种可能性存在的时候,比方说“有石油”和“没有石油”,分别用H和¬H表示,那么出现应用中立原理的极端情况。在与此相类似的情况中,即使在没有一点知识的条件下,那么也必须是P = 50 % ,因为概率论要求P(H)+P(¬H) = 1,就是说,要么赞成H,要么反对H,对H无知是不被允许的。

在没有关于¬H的任何证据的情况下,即使不用中立原理,那么约束P(H)+P(¬H) = 1也要求必须对¬H进行概率赋值。

D-S理论不要求必须对无知假设H和反驳假设H赋以信任值,而是仅仅将Mass分配给你希望对其分配信任的环境的子集。任一未被分配给具体子集的‘信任’被看成‘未表达意见’,并将其分配给环境 Θ . 反驳一个假设的‘信任’,实际上,是对该假设的‘不信任’,但不是对该假设‘未表达意见’。 例1.1

假定一个敌友飞机识别(IFF , Identification Friend or Foe)传感器(敌友飞机识别(IFF , Identification Friend or Foe)传感器也被简称为敌友飞机识别器), 从一架飞机的应答器获得了一个响应。如果某飞机是友机,那么它的发射机应答器应通过回送它的识别代码立即进行应答。若接收应答的飞机未收到某架飞机A的应答,那么接收应答的飞机的缺省处理结果是:飞机A是一架敌机。一架飞机A* 可能因下列原因未能发送应答信息: • A* 的敌友飞机识别器发生了故障 • A* 的发射机应答器发生了故障 • A*上没有敌友飞机识别器

• A* 的敌友飞机识别器受到了干扰 • A* 收到了保持其雷达沉默的命令

假定因敌友飞机识别器的故障,导致了关于目标飞机有0.7的可能性是敌机的证据,其中仅仅轰炸机和战斗机被认为是敌机。由此,这Mass的赋值为 m1({B , F}) = 0.7 其中,m1系指由第一个敌友飞机识别器提供的证据的Mass值。注意,

−34−

其余的信任将被留给环境 Θ ,作为未表达意见的部分: m1({Θ}) = 1-0.7 = 0.3

注意‘未表达意见’既不是信任,也不是不信任。 而概率论对此却给出不同的结果

P(敌机) = 0.7 P(¬敌机) = 1-0.7 = 0.3

对同一个问题,两种理论却给出了不同的处理,这正体现了D-S理论和概率论之间的主要差别。

证据理论 概率论

0.7 m1({B , F}) 支持假设 P(敌机) 支持假设 0.3 m1({Θ}) 未表达意见 P(¬敌机) 反驳假设

环境的幂集合中的任一个集合,若其Mass值大于0(zero),则称其为焦点元素(focal element)。使用焦点元素这一术语的原因是:一个幂集合元素X的Mass值m(X)大于0,意味着可用证据在X中的被聚焦,或者说被集中。

表5.1.1说明Mass比概率有大得多的自由度:

D-S理论 概率论

∑Pj=1 m(Θ) 不必须等于1

j

如果X⊆Y, 如果X⊆Y,

m(X) ≤ m(Y)不是必须的 P(X) ≤ P(Y) 是必须的

m(X) 和m(¬X)

P(X) + P(¬X) = 1

之间没有什么关系

表5.1.1 D-S理论和概率论的比较

每一个Mass 能被形式化表成一个函数,该函数映射幂集合中的每一个元素成为区间 [0 , 1]的一个实数。函数的形式化描述为 m:2Θ→ [0 , 1] 按着惯例,空集合的Mass通常被定义为0(zero),m(∅) = 0 . Θ的幂集合2Θ 的所有子集的Mass和为1 ∑X∈2Θm(X)=1 或 ∑m(X)=1

X⊆Θ

−35−

例如,在飞机环境中有

∑m(X)=m1({B,F})+m1(Θ)=0.7+0.3=1

X∈2Θ

组合证据

当新的证据变成可用的时候,我们希望组合所有的证据以产生一个更好的信任评价。为了说明如何组合证据(也称之为证据组合),我们首先看一个证据组合一般公式的一种特殊的情形。

假定另一类型的一个传感器用0.9的信任识别出目标飞机为轰炸机。现在,来自传感器的证据的Mass为:

, F}) = 0.7 m1(Θ) = 0.3 m1({B

m2({B}) = 0.9 m2(Θ) = 0.1

其中,m1和m2与第一和第二种类型的传感器相对应。

使用下述登普斯特的组合规则的特殊形式以产生组合Mass m3(Z)=m1⊕m2(Z)=∑m1(X)×m2(Y)

X∩Y=Z

其中,求和遍布使X ∩ Y = Z成立的所有元素X与Y,操作符 ⊕ 表示正交和或直接和。

登普斯特的规则组合两个Mass以产生一个新的Mass,新Mass表示初始可能是冲突的证据间的一致意见。

这新Mass通过仅仅对交集的Mass求和汇集了一致意见,集合的交集表达了公共的证据元素。

十分重要的一点是:用于组合的证据必须是差错的(independent errors)。注意,差错的证据 ≠ 采集的证据。 表5.1.2给出了登普斯特的组合规则,其中每一个交集之后都跟随一个数值(两个Mass的乘积)。

m1({B , F}) = 0.7 m1(Θ) = 0.3

m2({B}) = 0.9 m2(Θ) = 0.1 {B} 0.63 { B , F } 0.07 {B} 0.27 Θ 0.03 表5.1.2 行列Mass相乘

m12({B})=m1⊕m2({B})=0.63+0.27=0.90 (轰炸机)

m12({B,F})=m1⊕m2({B,F})=0.07 (轰炸机或战斗机) m12(Θ)=m1⊕m2(Θ)=0.03 (未表示意见)

−36−

这m12({B}) 表示目标飞机是轰炸机的信任。但是,这m12({B , F}) 和 m12(Θ) 却包含着另外的信息。因为它们的集合中包含了轰炸机,所以把它们的正交和贡献给轰炸机一个信任似乎是合理的。

由此,关于 {B} 的最大信任为0.03 + 0.07 + 0.9,关于 {B} 的最小信任为0.9,{B} 的真实的信任在区间 [0.9 , 1.0] 中的某处。

在证据推理中,证据导致一个证据区间(EI , Evidence Interval)。EI的下界在证据推理中被称为support (Spt) ,在D-S理论中被称为Bel,这上界被称为plausibility(Pls)。这support是基于证据的最小信任,而plausibility是基于证据的最大信任。我们有,0 ≤ Bel ≤ Pls ≤ 1成立。

在证据理论中,下界和上界有时被称做下概率和上概率。表5.1.3给出了一些通常的证据区间。

support 或belief函数(即Bel函数)是一个集合和它的所有子集的总的信任。Bel之定义如下:

Bel(X)=∑m(Y)

Y⊆X

以飞机环境中的第一个传感器为例,

Bel1({B , F}) = m1({B , F}) + m1({B}) + m1({F}) = 0.7 + 0 + 0 = 0.7 区间含义的解释

[1 , 1] 完全是真的 [0 , 0] 完全是假的 [0 , 1] 完全无知 [Bel , 1] 其中0 < Bel < 1 趋向于支持 [0 , Pls] 其中0 < Pls < 1 趋向于反驳

[Bel , Pls] 其中0 < Bel ≤ Pls < 1 既趋向于支持又趋向于反驳

表5.1.3一些通常的证据区间

证据区间

Mass是关于一个集合的信任,而不包括它的任何一个子集的信任,Mass是一个较为局部的信任。

belief函数应用于一个集合和该集合的任何一个子集, Bel是一个更为全局的信任。

这Mass 和belief函数之间的关系可表示为

−37−

m(X)=∑(−1)

Y⊆X

X−Y

Bel(Y) 其中,|X-Y| 是集合X-Y的基数。

Bel1 ⊕ Bel2 ({B , F})

= m1 ⊕ m2 ({B , F}) + m1 ⊕ m2 ({B}) + m1 ⊕ m2 ({F}) = 0.07 + 0.90 + 0 = 0.97

实际上,Bel(Θ) = 1,因为所有的Mass和必须等于1。 证据组合恰恰在不同的子集中重新分配了Mass值。 一个集合S的证据区间,EI (S),可用信任来定义: EI(S)=[Bel(S),1−Bel(S)] 如果S = {B},那么 S={A,F},有Bel({A , F}) = m1 ⊕ m2 ({A , F}) +

所以,又有EI ({B}) = [0.90 , 1 − 0] m1 ⊕ m2 ({A}) + m1 ⊕ m2 ({F}) = 0,

= [0.90 , 1] .

一个集合X的似然性(plausibility)被定义为不反对X(或不反驳X)的程度:

Pls(X)=1−Bel(X)=1−∑m(Y)

Y⊆X

● 信任的标准化

假定第三个传感器报告了关于目标飞机的一个冲突的证据 m3 ({A}) = 0.95 m3 (Θ) = 0.05

表5.1.4给出了证据组合的十字相乘的结果:

m3 ({A}) = 0.95 m3 (Θ) = 0.05

m1 ⊕ m2 ({B})m1 ⊕ m2 ({B , F})m1 ⊕ m2 ({Θ})

0.90 0.07 0.03 ∅ 0.855

∅ 0.0665

{A} 0.0285 Θ 0.0015

{B} 0.045 {B , F} 0.0035 表5.1.4 组合第三个证据

因为有 {A} ∩ {B} = ∅ ,{A} ∩ {B , F} = ∅,所以出现了空集合。具体计算如下:

m1 ⊕ m2 ⊕ m3 ({A}) = 0.0285 m1 ⊕ m2 ⊕ m3 ({B}) = 0.045 m1 ⊕ m2 ⊕ m3 ({B , F}) = 0.0035

m1 ⊕ m2 ⊕ m3 (∅) = 0.855 + 0.0665 = 0.9215

−38−

m1 ⊕ m2 ⊕ m3 (Θ) = 0.0015

注意,我们有所有Mass之和必须等于1,即

X⊆Θ

∑m1⊕m2⊕m3(X)=1,其中求和只需遍及所有的焦点元素。

但是,由于m1 ⊕ m2 ⊕ m3 (∅) > 0就产生了问题:该事实与m (∅) = 0之定义相矛盾。

一种解决办法是使焦点元素标准化。就是用某种原则把 m1 ⊕ m2 ⊕ m3 (∅) 分给焦点元素。

首先定义 Κ=∑m1(X)×m2(Y),然后对每一个焦点元素Z作:

X∩Y=∅

置Z ← Z / (1−Κ)

对表5.1.4 的例子,Κ= 0.855 + 0.0665 = 0.9215,1 −Κ= 0.0785,每个焦点元素标准化后的值为: m1 ⊕ m2 ⊕ m3 ({A}) = 0.363 m1 ⊕ m2 ⊕ m3 ({B}) = 0.573 m1 ⊕ m2 ⊕ m3 ({B , F}) = 0.045 m1 ⊕ m2 ⊕ m3 (Θ) = 0.019

可见,由于第三个(与前两个证据相冲突的)关于 {A} 的证据的存在,显著地侵蚀了对 {B} 的信任。有, Bel ({B}) = m1 ⊕ m2 ⊕ m3 ({B}) = 0.573 Bel({B})=Bel({A,F})=m1⊕m2⊕m3({A,F})+

=m1⊕m2⊕m3({A})+

=m1⊕m2⊕m3({F})=0.363又有,{B} 的证据区间

EI({B})=[Bel({B}),1−Bel({B})]=[0.573,1−0.363]=[0.573,0.673] 注意,由于 {A} 的冲突证据使 {B} 的support和plausibility都明显地减小了。

登普斯特的证据组合规则的一般形式为

∑m1(X)×m2(Y)

其中,Κ=∑m1(X)×m2(Y) m1⊕m2(Z)=X∩Y=Z1−ΚX∩Y=∅

注意,当 Κ=1时,正交和无定义。Κ的值指出了被组合证据相互冲突的程度。当 Κ=0时,表示两个证据完全一致(完全相容);当

−39−

Κ=1时,表示两个证据完全冲突;当 0<Κ<1时,表示两个证据部分相容。

● 移动(Moving Masses and Sets)

移动 Mass 的模拟有利于理解支持(support)和似真性(plausibility)。主要原则如下:

• 支持(support)是赋予一个集合和它的所有子集的Mass; • 一个集合的Mass能够自由地移入它的子集;

• 一个集合的Mass不能移到它的超集(superset)中去;

则这些被移动的Mass• 如果从一个集合移动Mass进入它的子集,

在相应的子集中仅仅能贡献给子集的似真部分,而不能贡献给支持部分;

• 环境 Θ 的Mass能移到任一子集。

假定 M(X) = 0. 6 ,M(Y) = 0. 4, 分别是X和Y的支持。X的似真性是0. 6,因为Y的Mass不能移入X . 然而,X的Mass能移入

Y,所以Y的似真性是 0. 4 + 0. 6 = 1 . X和Y 的证据区间是 EI(X) = [0. 6 , 0. 6] , EI(Y) = [0. 4 , 1] .

X

Y

图5. 2 移动 Mass

● D-S理论的困难

由于标准化使D-S理论出现了困难,并导致了与人们期待相反的结果。1984年,扎德(Zadeh)引用了两个医生A , B关于对同一个患者疾病的信任的例子。关于一个患者疾病的信任如下: mA (脑膜炎) = 0.99 , mA (脑 瘤) = 0.01 mB (脑震荡) = 0.99 , mB (脑 瘤) = 0.01

−40−

两个医生都认为这个患者得脑瘤的可能性只有0. 01 . 用登普斯特的证据组合规则计算如下:

mA ({脑膜炎}) = mA ({脑 瘤}) =

0.99 0.01

mB ({脑震荡}) =

∅ 0.9801 ∅ 0.0099

0.99

mB ({脑 瘤}) =

{脑 瘤} 0.0001 ∅ 0.0099

0.01

mA ⊕ mB ({脑 瘤}) = 0.0001

mA ⊕ mB (∅) = 0.9801 + 0.0099 + 0.0099 = 0.9999 1 −Κ= 1 − 0.9999 = 0.0001 标准化后得到:

mA ⊕ mB ({脑 瘤}) = 1,mA ⊕ mB ({脑膜炎}) = 0,mA ⊕ mB ({脑震荡}) = 0

这样一个结果与我们的直觉完全不同。

我们认为不仅当Κ=1时,不能做正交和,而且当Κ接近于1的时候也不能做正交和。

§2 一种简化的证据理论模型MET1

考虑集合 S= {s1,s2,…, sn},设 µ 是集合2S ∪ {S} 上的一个函数,说 µ 是

2S ∪ {S}上的一个基本支持函数(这里的基本支持函数与D-S中的Mass函数相当),如果 µ 满足: ① ∀A⊂S,都有0≤µ(A)≤1; ② µ(∅)=0; ③ ∑µ(A)≤1 ;

A⊂S

④ ∑µ(A)+µ(S)=1.

A⊂S

在比较普遍的一类应用问题中,∀A⊂2SU{S},若µ(A) > 0,则必有:

A=余集S,或者,A=单个元素集合{si},1≤i≤n 换言之,如果A∉{S}U{{si}1≤i≤n},则必有µ(A)=0.

−41−

在后面将看到,基于此,可使基本支持函数的运算大为简化。

2,L,n. 于是基本支 为简便计,简记µ({si})为µ(si),对于i=1,

持函数的定义又可改述如下:

2S ∪ {S}上的一个函数 µ 说是{S}∪{{si}1≤i≤n}上的一个基本支持函数,如果 µ 满足: ① 0≤µ(si),1≤i≤n;

② ∑µ(si)≤1;

1≤i≤n

③ µ(S)=1−∑µ(si) .

这样,基本支持函数 µ 就完全取决于它在集合{S}U{{si}1≤i≤n}中的元素的取值。

● 组合规则(或曰综合函数)

设 µ,ν 是{S}U{{si}1≤i≤n}上的两个基本支持函数,其直乘积函数(也称之为综合函数,或组合规则、综合运算、直乘积运算等)定义如下:

λ = µ ⊗ ν

µ(si)ν(si)+µ(si)ν(S)+µ(S)ν(si) λ(si)= D D=ν(S)×µ(S)+∑(µ(si)ν(si)+µ(si)ν(S)+µ(S)ν(si)) 1≤i≤n

其中,D ≠ 0 . 如果D = 0,则说 µ 与 ν 相互矛盾,对相互矛盾的基本支持函数 µ 与 ν 不作直乘积运算。

可以证明存在一个基本支持函数 ε 对于任意一个基本支持函数 µ,都有 ε ⊗ µ = µ 所以,我们有:{s1,s2,..., sn}上的所有基本支持函数和 ⊗,构成一个无穷有壹的阿贝尔半群。

● 综合函数(综合运算)的封闭性、可交换性与可结合性⊗ 若µ,ν 是S上的两个基本支持函数,那么 ω = µ ⊗ν 也是S上的基本支持函数。

ω = µ ⊗ν = ν ⊗ µ ,ω′=µ⊗ν⊗γ=(µ⊗ν)⊗γ=µ⊗(ν⊗γ),证明从略。

● 关于A的 µ 支持函数

−42−

1≤i≤n

对于 ∀ A ⊂ S ,

定义关于A的 µ 支持函数,

φ(A)=∑µ(a), (φ(A) 对应于D-S 理论中的Bel , Spt , Belief

a∈A

函数) .

● 关于A的 µ 不反对函数

ψ(A)=µ(S)+φ(A)=1−∑µ(a)+∑µ(a)=1−∑µ(a)

a∈S

a∈A

a∈S\\A

直观上说,φ(A)是A中元素的 µ 值总和,ψ(A) 是1减去S − A中元素的 µ 值总和。这里的φ(A)和ψ(A)分别与D-S理论中support和plausibility对应。ϕ(A)和ψ(A) 之含义由图5.2.1示出。

S 无知A (不反对A)S

S S−A 反对A

A

支持A

(不反对A)

图5.2.1 ϕ (A) 和 ψ (A)

显然,对于任意A和 µ ,有ϕ(A) ≤ ψ(A) ;又对于S的任意两个子集A1和A2我们有ψ(A1)−φ(A1)=ψ(A2)−φ(A2)=µ(S)

我们可以把 ψ(A)−φ(A) 看成是对A无知的程度。 在应用中,称集合S为一个“概念”。设X是2 ∪ {S}上的一个变量,称X = A为一个命题(简记为A),表示 “S是A” 。命题A的不确定性值 ∈ [ϕ(A),ψ(A)],并称 [ϕ(A),ψ(A)] 为命题A 的证据区间,简记为 EI(A) 。

为了说清楚命题A的不确定性值究竟在EI(A) 中的何处,在

−43−

S

MES1中定义了关于命题A 的 µ 认可函数:

f(A)=(A)+[ψ(A)−φ(A)]×A÷S,对于任意A∈2SU{S} 或者

⎛A⎞

⎟,其中0≤α,β≥1是两个待定常数。 f(A)=(A)+[ψ(A)−φ(A)]×β×⎜⎜S⎟⎝⎠

其中,A和S 分别表示A和S中元素的个数。

α

可以证明命题A 的 µ 认可函数满足: ① 0≤f(A)≤1,对于∀A⊂S;

② ∑f(a)=1 , 其中f(a) 表示f({a}) .

a∈S

事实上, f(A) ≥ 0自明。证明 f(A) ≤ l如下: 注意 f(A) = ϕ(A)+[ψ(A)-ϕ(A)]×⎢A ⎜/ ⎢S ⎜

= ∑µ(a)+[1-∑µ(a)]×⎢A ⎜/ ⎢S ⎜

a∈A

a∈S

≤ ∑µ(a)+1-∑µ(a) = 1

a∈S

a∈S

对于󰀀,我们有,

f(A) = ϕ(A) + [ψ(A) − ϕ(A) ]×⎢A ⎜/ ⎢S ⎜

µ(S)

×S = µ(S)+∑µ(a)=1 ∑f(a)=∑µ(a)+

a∈S

a∈S

S

a∈S

显证毕󰀀

然有,

ϕ(A)≤f(A)≤ψ(A)

下面,让我们看一个例子。

设S = {油层,同层,水层,干层,气层},µ 是S上的基本支持函数,且

µ(油层)=0.40,µ(同层)=0.30,µ(水层)=0.00,µ(干层)=0.10,µ(S)=0.20 于是,对于A={油层,同层},支持函数、不反对函数和认可函数的值分别为 ϕ(A) = µ(油层)+µ(同层) =0.70

ψ(A) = µ(S)+ϕ(A) =0.20+0.7=0.90 f (A) = ϕ(A) +[ψ(A)-ϕ(A)]×⎢A ⎜/ ⎢S ⎜ = 0.70+(0.90-0.70)×2÷5=0.78

上面,我们讨论了 µ 支持函数,µ 不反对函数和 µ 认可函数。注意,我们的这些讨论都是在同一个概念S上进行的。在实际应用中,通常将同时来考虑多个不同的概念S,T,… 。为此,我们将S上的 µ 支持函数,µ 不反对函数,µ 认可函数及 µ 基本支持函数分别记为:

ϕS,ψS,fS,µS .

l 定义规则

在定义规则之前,我们先给出,MET1用于油气资源评价的一个具体例子。

−44−

[ 方法名] :用有机碳含量评价生油岩丰度

[ 方法注释 ] :作者:吴立真;时间:1985年8月;参考文献:黄弟藩,《中国陆相油气生成》 [ 对应任务 ] :生油岩丰度评价

[ 方法适应条件 ] :有机碳含量低于4%

L L L L

[ 规 则 ] :(1)如果:有机碳含量大于1.0%

则:有可信度(CF1)证明应属于高丰度,同时 有可信度(CF2)证明应属于较高丰度; (2)如果:有机碳含量属于区间 [0.6% ,1.0%] 则:有可信度(CF1)证明应属于高丰度,同时 有可信度(CF2)证明应属于较高丰度,同时 有可信度(CF3)证明应属于较低丰度; (3)如果:有机碳含量属于区间 [0.4% ,0.6%]

则:有可信度(CF2)证明应属于较高丰度,同时 有可信度(CF3)证明应属于较低丰度,同时 有可信度(CF4)证明应属于非生油岩; (4)如果:有机碳含量小于0.4%

则:有可信度(CF3)证明应属于较低丰度,同时 有可信度(CF4)证明应属于非生油岩;

下面将给出上面MET1用于油气资源评价的一个具体例子的进一步解释。

我们定义规则的形式化描述:

〈后件〉¦ ¦ =(〈属性值1〉〈可信度1〉…〈属性值k〉〈可信度k〉) 或

〈后件〉¦ ¦ =(〈属性值1〉〈可信度1〉)且

(〈属性值2〉〈可信度2〉)且 … (〈属性值k〉〈可信度k〉)

命题 B ¦ ¦ =(〈属性值1〉〈属性值2〉…〈属性值k〉),实际上命题B是一组命题:T是属性值1,T是属性值2,… ,T是属性值k ,这里T是一个概念。

命题B的可信度因子:

CF = (〈可信度1〉〈可信度2〉…〈可信度k〉)

=(CF1 , CF2 , … , CFk)

并满足: CFi≥0i=1,2,L,k; 2)∑CFi≤1

1≤i≤k

〈前件〉由若干个〈断言〉的逻辑与连接所构成:

〈前件〉¦ ¦ =〈断言〉AND〈断言〉AND … AND〈断言〉

〈规则〉¦ ¦ = IF 〈断言〉AND〈断言〉AND … AND〈断言〉

THEN (〈属性值1〉〈可信度1〉…〈属性值k〉〈可信度k〉)

为定义〈前件〉的可信度,首先来定义一个〈断言〉的可信度。〈谓词〉是〈断言〉的核心,所有〈谓词〉的解释都是由系统或用户给出的。〈谓词〉在 [ 0 , 1] 上取值。一个〈规则〉的〈前件〉的可信度BF,定义为反复使用如下规则得到的值:

󰀀 若〈前件〉中只有一个〈断言〉 , 则〈前件〉的可信度定义为该〈断言〉的可信度; 󰀀 使用一个新的〈断言〉代替用AND连接的〈断言〉,这个新〈断言〉的可信度被定义为这些用AND

−45−

连接的〈断言〉的可信度中的最小值。

定义一个〈规则〉之〈后件〉的可信度CER为:

CER=(BF×CF1 BF×CF2 … BF×CFk) ,其中BF是〈前件〉的可信度,CFi是〈后件〉中的可信度因子,即规则强度。

下面通过属性A(或命题A)来阐明其可信度因子CFi的解释:

CF 可信度因子CFi的解释

CF4 CF3 CF2 CF1 1

0 X

ε1=(Y-X)×d1 ;ε2=(Z-Y)×d3 ;ε3=ε2; 取 d1 = d3

假定A取非负实数值

1 A ≥ Z+ε3 CF1=

(A-Z+ε3)÷(2×ε3) Z-ε3 < A < Z+ε3 1 Y+ε2 ≤ A ≤ Z-ε3 CF2= 1-(A-Z+ε3 )÷(2×ε3 ) Z-ε3 < A < Z+ε3 (A-Y+ε2 )÷(2× ε2 ) Y-ε2 < A < Y+ε2

1 X+ε1 ≤ A ≤ Y- ε2 CF3= (Y+ε2 -A)÷(2×ε2 ) Y- ε2 < A < Y+ε2 (A-X+ε1 )÷(2× ε1 ) X- ε1< A < X+ ε1

1 A ≤ X-ε1 CF4=

(X+ε1-A)÷(2×ε1 ) X-ε1 < A < X+ ε1

如果一条〈规则〉之〈后件〉中有一个概念T上的命题A,T

={t1,t2,L,tn},则当这条产生式

规则被触发后,就得到一个关于命题 A = { a1,a2,…,ak } 的可信度(或该规则之结论的可信度)

CER=(BF×CF1 BF×CF2 … BF×CFk)

我们利用这组值,来定义T上的一个基本支持函数 µT : BF×CFi 如果 a =ai ( ai ∈ A) µT(a) =

0 若

a∈TUT且a ∉ A;

−46−

{}

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务