Prise en compte des fractiles dans la repr´esentation possibiliste continue

3.4 Repr´esentation de l’information par des distributions de possibilit´e continues

3.4.2 Prise en compte des fractiles dans la repr´esentation possibiliste continue

nue

Supposons que l’expert fournisse le mode M et la médiane m de la distribution de proba- bilité unimodale inconnue. Soit PM,m_I l’ensemble de telles probabilités bornées par I = [b, c] et on suppose que m < M . Nous pouvons alors raffiner l’approximation possibiliste πL en

tenant compte de l’information additionnelle apportée par la médiane, à savoir F (m) = 0.5. Cela signifie que F passe par le point de coordonnée (m, 0.5). Ainsi, à la place de FL, nous

pouvons considérer la fonction de répartition linéaire par morceaux F_Lm sur les segments [(b, 0), (m, 0.5)], [(m, 0.5), (M, F (M ))], [(M, F (M )), (c, 1)]. Clairement, F _{≤ F}m

L < FL sur

[b, M ] (voir Figure 3.9.a). Par conséquent, en choisissant encore les intervalles [x, y] tels que (x_M−b)_−b = (c_c_−M−y), nous obtenons une distribution de possibilité linéaire par morceaux plus spécifique πm

L ≤ πL qui domine toutes les probabilit´es de mode M et de m´ediane m (voir

Figure 3.9.b). C’est `a dire PM,m_I _{⊂ P(π}m_L). En particulier :

π_Lm(m) = πm_L(m) = 0.5 + (1_{− F (M))}m− b M_{− b}

où (m−b)_M_−b = (c−m)_c_−M . Ce résultat précise le fait que quand p est unimodale, la médiane se trouve nécessairement dans l’intervalle [M +b₂ ,c+M₂ ]. En effet, supposons que m < M +b₂ , nous avons πp(m)≤ πL(m) < 0.5 ce qui est contradictoire avec le fait que πp(m) = F (m)+1−F (f(m)) =

0.5 + 1_{− F (f(m)) ≥ 0.5 o`u f(m) = max{y, p(y) ≥ p(m)}.}

Notons que cette distribution de possibilité πm_L dépend de F (M ), et que si M > m, l’inégalité F (M ) _≥ _2(mM−b_−b) reste valide, puisque πm

60 Repr´esentations math´ematiques de la connaissance a) b) PSfrag replacements 0 0 0.5 0.5 1 1 F convexe F concave m mM _M_m F(M ) b c b c F FL πL πm L πm L(m) = π m L(m) Fm L

Fig. _{3.9 – Distribution de possibilit´e π}m

L respectant la condition de Dominance quand on

connaˆıt la m´ediane, le mode M , F (M ) et le support.

possibilité triangulaire πLest retrouvée, par exemple quand le mode et la médiane co¨ıncident

(F (M ) = 0.5). Si F (M ) = 1 (le cas le plus asymétrique) alors πm_L(m) = 0.5. L’exploita- tion de cette représentation nécessite une estimation de F (M ). Mais cette quantité est une bonne mesure de l’asymétrie de la distribution de probabilité. Ce résultat est facile à étendre à d’autres fractiles, ou ensemble de fractiles si ceux-ci sont connus à priori. En particulier, considérons le cas où un expert donne les fractiles x1, x2 et x3, à 5%, 50% et 95%, et le mode

M . Par d´efinition x2est la m´ediane, et nous supposons que celle-ci co¨ıncide avec le mode. Soit

la famille de probabilit´es Px1,x2,x3

I ayant ces fractiles d´efinis. Avec un raisonnement similaire

au précédent nous pouvons représenter cette connaissance par la distribution de possibilité (symétrique) suivante : π(x1) = π(x3) = F (x1) + 1− F (x3) = 0.1, π(x2) = 1 en faisant

des interpolations lin´eaire sur [b, x1], [x1, x2], [x2, x3] et [x3, c] pour chaque valeur de π(x).

Clairement Px1,x2,x3

I ∪ PM,m ⊂ P(π) (respectant la Condition de Dominance definie dans le

chapitre 2 `a la Section 2.5). 0 1 2 3 4 5 6 7 8 9 10 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Repr´esentations math´ematiques de la connaissance 61

3.4.3 Distribution de possibilit´e continue connaissant le mode et le sup-

port :Condition de Dominance par les Intervalles de Pr´ediction

Supposons que I = [b, c] contienne la distribution de probabilit´e inconnue p et nous supposons que p est sym´etrique et unimodale. Soit PS

I l’ensemble des probabilit´es sym´etriques

de support I. Leur mode est forcément b+c₂ du fait de la symétrie (cela inclut la distribution uniforme sur I). Si p est symétrique, la transformation optimale (voir chapitre 2 à la Section 2.5) π_p?autour du mode est convexe de chaque côté du mode [31]. La distribution de possibilité triangulaire symétrique πS de support I et de noyau b+c₂ est donc telle que πS ≥ πp?,∀p, et

est réellement égale à sup_p∈PS

Iπp [31]. Ainsi, nous avons non seulement P(πS) contenant P

S I

mais aussi les α-coupes de πS encadrent les plus ´etroits intervalles de pr´ediction de niveau de

confiance 1_{− α de toutes les probabilit´es contenues dans P}S I, i.e,

∀λ ∈ [0, sup(p)], {x|p(x) ≥ λ} ⊆ (πS)α ={x|πS(x)≥ 1 − P ({x|p(x) ≥ λ})}

Néanmoins, P(πS) contient aussi des densités de probabilité qui ne sont pas symétriques et

dont le mode diffère de b+c₂ . Nous pouvons dire que la p-box [F , F ] définie par F (x) = x− b c− b si x≤ b + c 2 et 1 sinon et F (x) = x_{− b} c− b si x≥ b + c 2 et 0 sinon est une représentation plus informative des densités symétriques de support inclus dans I que P(πS). Mais, notons dans ce cas que la distribution de possibilité π = min(F , 1− F )

si x6= b+c

2 domine aussi de telles distributions symétriques et est même plus précise que la

p-box. Mais, bien sûr, elle n’encadre pas leurs intervalles de prédiction. Tout le mérite de la distribution de possibilité πSest précisément d’encadrer les intervalles de prédiction dans PS_I.

De fa¸con int´eressante, notons que πS = 2· min(F , 1 − F ) pour x 6= b+c₂ .

Si nous connaissons des fractiles, nous pouvons raffiner la représentation comme expliqué dans le paragraphe précédent. De tels raffinements respecteraient la Condition de dominance par les intervalles de prédiction (see Figure 3.10) du fait de l’hypothèse de la symétrie. Quand p est asymétrique, la transformation optimale π_p?, associée à p peut ne pas être convexe de chaque côté du mode M . Ainsi, les α-coupes de la distribution de possibilité triangulaire πL de noyau {M} ne contient pas toujours les (1 − α) intervalles de prédiction optimaux

des mesures de probabilité de mode M , clairement mis en évidence dans le théorème 4 sur les transformations optimales des densités linéaires par morceaux. Par exemple, considérons l’exemple de la Figure 3.11 suggéré dans [31], où :

p(x) = 0.6x + 1.2 sur [_{−2, −1.5]} p(x) = (0.2/3)x + 0.4 sur [_{−1.5, 0]} p(x) =−0.2x + 0.4 sur [0, 2].

L’intervalle [−1.4, 1.4], correspondant à l’0.3-coupe de la distribution de possibilité triangulaire, ne contient pas l’intervalle de prédiction au niveau de confiance 0.7 de la mesure de probabilité de mode 0, qui est [−1.5, 1.5] : la transformation optimale de p (voir Chapitre 2 Section 2.5) n’est en effet pas convexe partout. Nous pouvons néanmoins trouver une borne supérieure de π?

p pour une densit´e unimodale asym´etrique continue p. Alors, en utilisant la

concavité de F et en considérant les intervalles emboˆıtés Jx= [x, max{y, p(y) ≥ p(x)} = f(x)]

62 Repr´esentations math´ematiques de la connaissance −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 p π_L π_p* transformation optimale de p

Fig. _{3.11 – transformation optimale de p autour du mode.}

– Pour x≤ M, π?

p(x)≤ F (x) + 1 − F (f(x)) ≤ FL(x) + 1− F (M) = F (M )(x_M−b−b)+ 1− F (M).

– Pour x_{≥ M, π}_p?(x)_{≤ F (f}−1(x)) + 1_{− F (x) ≤ F (M) + 1 − F}L(x) = 1−1−F (M)_c_−M (x− M)

La connaissance de la valeur F (M ) est nécessaire pour pouvoir couvrir π?_p (voir Figure 3.12 pour exemple). En général, il sera difficile de trouver une distribution de possibilité plus informative qui tienne compte des intervalles de prédiction de toutes les mesures de probabilité sur un intervalle I avec un mode fixé, dû à la large étendue de telles distributions. On pourra rajouter de l’information sur la densité inconnue p telle que sa convexité-concavité.

Théorème 5 Si la densité p est croissante convexe sur ]b, M [ et strictement décroissante concave sur ]M, c[ alors π?_p est aussi convexe sur ]b, M [.

Preuve.Nous devons montrer que la dérivée seconde de π_p?est positive sur ]b, M [. Considérons p1 (la partie gauche de p) et p2 (la partie droite de p) définie comme suit :

– _{∀x ∈ [b, M], p}1(x) = p(x) et 0 sinon.

– _{∀x ∈ [M, c], p}2(x) = p(x) et 0 sinon.

Pour x_{∈ [b, M], π}_p?(x) = F (x) + 1_{− F (f(x)) où f(x) = max{y, p(y) ≥ p(x)}.} Si on dérive π? p sur ]b, M [, on obtient : π_p?0(x) = F0(x)_{− f}0(x)F0(f (x)) = p1(x)− f 0 (x)p2(f (x)) Cependant p1(x) = p2(f (x)), donc : π?_p0(x) = p1(x) 1− f0(x) Par conséquent en dérivant de nouveau :

π?_p00(x) = p0₁(x)1_{− f}0(x)_{− p}1(x)f

Représentations mathématiques de la connaissance 63 Nous savons que p1(x) = p2(f (x)) ; si nous dérivons cette égalité, on obtient :

f0(x) = p

1(x)

2(f (x))

La fonction p1 croˆıt sur ]b, M [, ainsi p01 ≥ 0. La fonction p2 d´ecroˆıt strictement sur ]M, c[,

ainsi p0₂ < 0. Nous en d´eduisons alors que f0_{≤ 0 ≤ 1. On en conclu donc que :} p0₁(x)1_{− f}0(x)_{≥ 0 ∀x ∈]b, M[}

En d´erivant de nouveau f0, nous obtenons

f00(x) = p 00 1(x)− (f 0 (x))2p00₂(f (x)) p0 2(x)

Nous savons que p est convexe sur ]b, M [ (resp. concave sur ]M, c[), nous avons p00₁(x) _{≥ 0} pour tout x_{∈]b, M[ (resp. p}00₂(x)_{≤ 0 pour tout x ∈]M, c[).}

Par cons´equent, p00₁(x)− (f0

(x))2p00₂(f (x)) ≥ 0 pour tout x ∈]b, M[ et donc f00

(x) ≤ 0 pour tout x_{∈]b, M[. Nous concluons que}

p1(x)f

(x)_{≤ 0 ∀x ∈]b, M[} En bref, nous avons :

p0₁(x)1_{− f}0(x)_{≥ 0 et p}1(x)f

(x)_{≤ 0 ∀x ∈]b, M[}

Nous avons donc prouvé que π_p?00 est positive sur ]b, M [, et ainsi la convexité de π_p?sur ]b, M [.2 Supposer F (M ) < 0.5 est cohérent avec la convexité de p sur [b, M ] et sa concavité sur [M, c]. Dans ce cas, une distribution de possibilité linéairement croissante de 0 à 1 sur [b, M ] couvre toutes les transformations optimales de telles densités de ce côté. De l’autre côté du mode, l’utilisation d’une forme linéaire est possible avec π(c) = 1− F (M) (voir Figure 3.12). Pour résumer, si nous supposons que F (M ) est connue, alors selon le théorème 5 sur la dérivée seconde de p une distribution de possibilité plus informative, dont les coupes contiennent les intervalles de prédictions des densités de mode M ayant de telles caractéristiques, peut être calculée.

Dans le document Représentation et propagation de connaissances imprécises et incertaines: Application à l'évaluation des risques liés aux sites et sols pollués. (Page 60-64)