• Aucun résultat trouvé

Chapitre 2 : Les modèles de la Recherche d’Information

4. Les Réseaux Possibilistes

4.1 La théorie des possibilités

La théorie des possibilités introduite par Zadeh [Zadeh, 1978] et développée par Dubois et Prade [Dubois et Prade, 1988] [Dubois et Prade, 1998] traite l’incertitude sur l’intervalle [0,1], appelé échelle possibiliste, d’une manière qualitative ou quantitative. En fait, Lotfi Zadeh a formalisé la théorie des possibilités pour traiter l’incertitude permettant ainsi de traiter l’ignorance et de prendre en compte la pertinence d’une information incertaine. Dans cette théorie, l’information fournie par une source sur la valeur réelle d’une variable x est codée sous forme d’une distribution de possibilités dont les valeurs sont supposées être mutuellement exclusives, puisque x prend en définitive une seule valeur (sa vraie valeur), qui appartient à un ensemble Ω donné [Sandri, 1991]. La théorie des possibilités se base sur deux mesures de confiance : la mesure de possibilité et la mesure de nécessité [Fabiani, 1996].

4.1.1 Distribution de possibilité

La théorie des possibilités est basée sur les distributions de possibilité. Une distribution de possibilité, notée par π, est une application de Ω (l’univers de discours) vers l’échelle [0,1] traduisant une connaissance partielle sur le monde, noté ω. L’échelle possibiliste est définie de deux manières. Dans le cadre numérique les valeurs des possibilités traduisent souvent les bornes supérieures des probabilités. Dans le cadre qualitatif, les valeurs de possibilité peuvent être considérées comme un ordre de classement des états possibles. La combinaison des distributions de possibilité, exprimée à l’aide des normes triangulaires (t-normes) dépend du cadre. Les opérateurs « produit » et « minimum » peuvent être utilisés pour combiner des distributions de possibilité indépendantes dans les cadres quantitatif et qualitatif respectivement.

Normalisation : Une distribution de possibilité est dite α-normalisée, si son degré de

normalisation, noté α(π), est égal à α. Ainsi : ) ( max ) (π π ω α α = = ω (3.17) Lorsque α = 1, π est dite normalisée.

Marginalisation : Soit une distribution de possibilité jointe, π sur Ω, une distribution

marginale relative aux sous ensembles de variables peut être dérivée en utilisant l’opérateur

maximum. Ainsi, ∀X ⊆ V ∀x ∈ dom(X) :

[ ]

}

{

X x

x = π ω ω =

π( ) maxω ( ): (3.18) Où V : ensemble de variables {A1, A2, ...., AN} ;

X : sous ensemble de V ;

dom(X) : domaine de X, produit cartésien des domaines des variables de X ; x : une instance de X, si X = {A1, A2, …, Aj}, alors x = (α1, α2, ..., αj) ;

ω[X] = x : configuration de X dans ω.

Une distribution de possibilité π sur permet de qualifier les évènements en terme de mesure de plausibilité et de certitude respectivement.

4.1.2 Mesures de possibilité et de nécessité

Dire qu’un évènement est non possible n’implique pas seulement que son événement contraire est possible mais qu’il est certain. Deux mesures duales sont utilisées : la mesure de possibilité Π(φ), et la mesure de nécessité N(φ).

- La possibilité d’un évènement A, notée Π(A) est obtenue par Π(A) = maxx∈Aπ(x) et

décrit la situation la plus normale dans laquelle A est vraie ;

- La nécessité N(A) = minx∉A1 - π(x) = 1 - Π( A ) d’un événement A reflète la situation

la plus normale dans laquelle A est faux.

La distance entre N(A) et Π(A) évalue le niveau d’ignorance sur A. Rappelons que N(A) > 0 implique Π(A) = 1. Lorsque A est un ensemble flou, cette propriété n’est plus vérifiée et dans ce cas l’inégalité N(A) ≤ Π(A) est vérifiée.

4.1.3 Conditionnement possibiliste

En logique possibiliste, le conditionnement consiste à modifier la distribution de possibilité initiale π à l’arrivée d’une nouvelle information i. Soit φ, une sous classe de ω, φ = [i] l’ensemble des modèles de i. La distribution initiale π est remplacée par π′ = π(•|φ). Dans un cadre quantitatif, les éléments de φ sont proportionnellement modifiés :

φ ω φ ω π φ ω π ∈ Π = si p ( ) ) ( ) ( ; 0 Sinon (3.19) avec : |p : conditionnement basé sur le produit dans un cadre qualitatif, le degré de possibilité

maximal est affecté aux meilleurs éléments de φ : 1siπ(ω)=Π(ω)etω∈φ = ) (ω φ π m π(ω)siπ(ω)pΠ(ω)etω∈φ (3.20) 0 sinon

|m : conditionnement basé sur le minimum.

4.1.4 L’indépendance possibiliste

La théorie des possibilités offre plusieurs définitions de l’indépendance [Ben Amor et al., 2002] [De Campos et al., 1999a] [De Campos et al., 1999b]. En particulier, deux définitions ont été utilisées pour le développement des réseaux possibilistes :

- Relation de non-intéractivité [Zadeh, 1978], cette relation est basée sur le conditionnement

ordinal et elle est définie comme suit : . , , )), ( ), ( min( ) (xyz = Π xz Π yzx y z Π (3.21)

- Relation d’indépendance basée sur le produit, cette relation est basée sur le conditionnement

basé sur le produit et elle est définie comme suit : Cette forme d’indépendance est définie par : . , , ), ( ). ( ) (xyzxz Π yzx y z Π (3.22) Ou d’une façon équivalente par :

. , , ), ( ) (xyzxzx y z Π (3.23)

4.1.5 Logique possibiliste

La logique possibiliste est une extension de la logique classique qui permet un raisonnement dans le cas d’évidence incomplète (incertitude) et de connaissances partiellement incohérentes. De point de vue syntaxique, un poids déterminant le niveau de priorité par rapport aux autres formules est associé à chaque formule. C’est un outil de raisonnement en présence d’informations incertaines, basé sur la relation de préférence entre les formules et non sur les valeurs numériques contrairement à la logique probabiliste.

L’ensemble de formules est appelé une base de connaissances possibilistes [Dubois et al., 1994]. De point de vue sémantique, la logique possibiliste permet d’ordonner les interprétations. Les modèles ont un degré 1 car ils sont complètement cohérents avec la base de connaissances. Les contre modèles dont les degrés de priorité sont faibles (poids) sont préférés aux contre modèles de degré de priorité plus important.

Dans la logique possibiliste, les règles sont modélisées par des clauses logiques :

p → q = ¬p∨ q (3.24) Des valeurs sont attachées aux bornes inférieures des degrés de nécessité et de possibilité de p et q qui sont considérées comme des propositions booléennes. Les axiomes de la théorie des possibilités permettent de modéliser p implique q avec un poids α > 0 par l’inégalité

N(p → q) ≥ α (3.25) ou d’une manière équivalente par :

Π (p ∧¬q) ≤ 1 - α (3.26)

pour signifier que p ∧¬

q est quelque peu impossible.

La distribution de possibilité exprimant cette information (connaissance) est π telle que : π(x) = 1 - α si p ∧¬

q vraie à l’état x

= 1 sinon (3.27) La distribution de possibilité induite par plusieurs propositions, mesurée par des nécessités, est obtenue par une intersection floue (utilisant le minimum) des distributions de possibilité induites par chaque proposition.

4.2 Réseaux Possibilistes (RP)

Les travaux existant sur les réseaux possibilistes sont soit des adaptations directes de l’approche probabiliste [Benferhat et al., 1999], ou des méthodes d’apprentissage à partir de données imprécises [Borgelt et al., 2000]. La théorie des possibilités offre deux définitions du conditionnement, ce qui conduit à deux définitions des réseaux causaux possibilistes. Les réseaux possibilistes basés sur le produit sont très similaires aux réseaux probabilistes.

4.2.1 Définitions

Un graphe possibiliste orienté sur un ensemble de variables V ={A1, A2,…, AN} est caractérisé

par une composante qualitative et une composante numérique. La première est un graphe acyclique orienté. La structure du graphe représente l’ensemble des variables ainsi que l’ensemble des relations d’indépendance. La seconde composante quantifie les liens du graphe en utilisant des distributions de possibilité conditionnelles de chaque noeud dans le contexte de ses parents. Ces distributions de possibilité doivent vérifier la contrainte de normalisation. Pour chaque variable Ai :

- Si Ai est un noeud racine et domAile domaine de Ai, la possibilité a priori de Ai doit satisfaire : i i i i A a Π(a )=1,∀adom max (3.28) - Si Ai n’est pas un noeud racine, la distribution conditionnelle de Ai dans le contexte de

ses parents doit satisfaire : i i i i A i A a Π(a )=1,∀adom max θ (3.29) Avec : i A dom : Le domaine de Ai i A

θ : L’ensemble des configurations possibles des parents de Ai

4.2.2 Réseaux possibilistes basés sur le minimum

Un graphe possibiliste basé sur le minimum, noté par GPM, est un graphe possibiliste où les

possibilités conditionnelles sont obtenues par le conditionnement minimum (formule 3.30). La distribution de possibilité des réseaux possibilistes basée sur le minimum, notée par πM, est

obtenue par la règle de chaînage : ) ( ) ,..., , ( 1 2 1.. i A i N i N M A A A MIN Aθ π = = Π (3.30) Avec : MIN est l’opérateur minimum.

4.2.3 Réseaux possibilistes basés sur le produit

Un graphe possibiliste basé sur le produit, noté par GPP , est un graphe possibiliste où les

possibilités conditionnelles sont obtenues par le conditionnement produit (formule 3.31). La distribution de possibilité des réseaux possibilistes basés sur le produit, notée par πP , est

obtenue par la règle de chaînage : ) ( ) ,..., , ( 1 2 N i 1..N i Ai P A A A PROD Aθ π = = Π (3.31) Avec : PROD est l’opérateur produit.

4.2.4 Exemple des Réseaux Possibilistes

La figure 3.9 représente un exemple des réseaux possibilistes. Les tableaux 3.2 et 3.3 fournissent les distributions de possibilité conditionnelles et a priori associées aux variables binaires A, B, C et D. En utilisant la règle de chaînage (3.30) basée sur l’opérateur minimum, la distribution jointe liée au réseau possibiliste est donnée par le tableau 3.4. En particulier [Ben Amor et al., 2006]:

Figure 3.9 : Exemple de réseau causal possibiliste

A B C D π(A) π(B|A) π(C|A) π(D|BC)

a ΠΠ(a) ΠΠ b a Π(b|a) ΠΠΠ c a ΠΠ(c|a) ΠΠ

a1 1 b1 a1 1 c1 a1 0,3

a2 0,9 b1 a2 0 c1 a2 1

b2 a1 0,4 c2 a1 1

b2 a2 1 c2 a2 0,2

Tableau 3.2 : Distribution de possibilité initiales (1)

π(a1b2c1d2) = min (π(a1), π(b2|a1), π(c1|a1), π(d2|b2c1))

= min (1 ; 0,4 ; 0,3 ; 0,8) = 0,3. d b c ΠΠΠΠ(d|bc) d b c ΠΠΠΠ(d|bc) d1 b1 c1 1 d2 b1 c1 1 d1 b1 c2 1 d2 b1 c2 0 d1 b2 c1 1 d2 b2 c1 0,8 d1 b2 c2 1 d2 b2 c2 1

Tableau 3.3 : Distribution de possibilité initiales (2)

ω π(ω) ω π(ω) ω π(ω) ω π(ω)

a1b1c1d1 0,3 a1b2c1d1 0,3 a2b1c1d1 0 a2b2c1d1 0,9

a1b1c1d2 0,3 a1b2c1d2 0,3 a2b1c1d2 0 a2b2c1d2 0,8

a1b1c2d1 1 a1b2c2d1 0,4 a2b1c2d1 0 a2b2c2d1 0,2

a1b1c2d2 0 a1b2c2d2 0,4 a2b1c2d2 0 a2b2c2d2 0,2 Tableau 3.4 : Distribution de possibilité jointe

4.2.5 Propagation dans les Réseaux Possibilistes

Un des traitements les plus intéressants que l’on peut appliquer sur les réseaux possibilistes est d’évaluer l’impact de la réalisation d’un certain événement sur le reste des variables. Ce traitement peut être réalisé à travers les algorithmes de propagation qui consistent à calculer les distributions de possibilité a posteriori pour chaque variable A sachant l’évidence E sur le reste des variables.

Dans les réseaux bayésiens probabilistes, ce problème est classé comme NP-difficile, sauf pour les polyarbres (graphes simplement connectés) où la propagation peut être réalisée en un temps polynomial [Cooper, 1990]. Plusieurs algorithmes de propagation dans les réseaux Bayésiens ont été développés. Ces algorithmes peuvent être classés en deux catégories :

- méthodes exactes tels que l’algorithme de Kim et Pearl [Pearl, 1988] (valable pour les graphes orientés acycliques sans boucles) et l’algorithme de propagation dans les arbres de jonction [Jensen, 1996] [Lauritzen et al., 1988] où les graphes initiaux avec boucles sont transformés en arbres de jonction sans boucles.

- méthodes approximatives qui fournissent une estimation des lois marginales et s’avèrent utiles avec certaines applications de grandes tailles. On peut citer à titre d’exemple la méthode Monte-Carlo [Chavez et Cooper, 1990].

Les algorithmes de propagation possibilistes qui ont été proposés dans la littérature sont, principalement, une adaptation directe des méthodes exactes [Fonck, 1994] [Borgelt et al., 1998], avec la même complexité algorithmique.

Par ailleurs, les algorithmes proposés pour les réseaux possibilistes basés sur l’opérateur produit sont très semblables aux algorithmes probabilistes puisqu’ils utilisent le même opérateur. Ceci n’est pas le cas si on utilise l’opérateur minimum. En effet, cet opérateur

possède des propriétés particulières, telles que l’idempotence, qui peuvent être exploitées afin d’éviter les adaptations directes. Ces propriétés ont motivés [Ben Amor et al., 2003] pour mieux étudier ces réseaux et proposer un nouveau algorithme de propagation pour les réseaux possibilistes basés sur le conditionnement ordinal.

4.3 Les interprétations de la théorie des possibilités

La théorie des possibilités permet de représenter tous les cas où il existe un ensemble convexe de mesure de probabilités admissibles sur Ω de cardinal fini ; cet ensemble étant défini comme l’ensemble des mesures de probabilités P vérifiant les contraintes [Fabiani, 1996] :

∀ A∈

P

(Ω), N(A) ≤ P(A) ≤ Π(A) (3.32)

Dans ce cadre Dubois et Prade suggèrent que [Fabiani, 1996] :

a. la théorie des possibilités est adaptée pour évaluer des degrés de vraisemblance sur des hypothèses d’état rivales et précises (les singletons par exemple).

b. la théorie des possibilités est plutôt adaptée pour représenter des degrés de confiance sur des propositions imprécises, c'est-à-dire pouvant chacune être partitionnée en sous hypothèses d’état mutuellement exclusives entre lesquelles on ne peut pas décider.

Figure 3.10 : Les limites des théories de traitement de l’incertitude [Gacôgne, 1997] Par ailleurs, l’usage de la théorie des possibilités en RI avait déjà été suggéré par Prade et Testemale [Prade et Testemale, 1987] qui proposaient un nouveau modèle d’indexation sous forme de groupes de mot-clés, pondérés par des degrés de possibilité et de nécessité. De leur part, [Brini et Boughanem, 2003] ont proposé un modèle de reformulation de requête basé sur la technique de Relevance Feedback. Ensuite, ces mêmes auteurs ont proposé avec Didier Dubois un modèle possibiliste quantitatif de recherche d’information [Brini, 2005]. Nous mettons l’accent particulièrement, dans cet état de l’art, sur ce modèle en vue de proposer dans la suite une extension vers un cadre qualitatif possibiliste.