• Aucun résultat trouvé

Fusion dans le cadre évidentiel

Fusion d’attributs et désignation de la zone d’intérêt

3.1 Fusion d’attributs

3.1.3 Fusion dans le cadre évidentiel

La fusion évidentielle (ou crédibiliste) permet à la fois de gérer l’incertitude et l’imprécision mais aussi le conflit. Ceci n’est rendu possible que grâce au modèle des croyances transférables de Smets. Ce modèle permet la représentation et l’agrégation des informations pour permettre en sortie de processus de se prononcer, dans notre cas, sur l’appartenance d’un pixel à une classe d’objets. Les travaux dans ce domaine portent sur des applications aussi variées que :

– le diagnostic : défaut logiciel ([PG11]), défaillance de pales de rotor ([YHH+11]), détection de fautes ([LYHH11]), détection de bruit ([TC11]) ;

– le médical : classification des patients atteints d’osteoarthrite ([JBHR06]), diagnostic médical ([Str06]), estimation de la viabilité du myocarde ([MRJ01]) ;

– la segmentation d’images : [CCFM04], [HMS04], [BSF+11], [AMMM06] ;

– l’environnement : intrusion de contaminants dans un réseau d’eau [YWR11], détection de feux de forêt [ZMA+11], cartographie [MFF11], évaluation d’impacts environnementaux [Awa11].

Compte-tenu de la supériorité de l’évidentiel sur les probabilités et les possibilités, nous choisissons pour cette étude d’utiliser ce cadre pour le processus de reconnaissance des objets en présence dans la scène chirurgicale. La mise en œuvre de ce type de fusion passe par les deux étapes suivantes :

1. l’étape crédale (ou étape de représentation) correspond au processus de création/agrégation des informations. Celle-ci consiste à :

(a) définir le cadre de discernement servant à définir le niveau de précision du système ;

(b) procéder à la création de fonctions de croyance que l’on appelle masses, représentatives de la

"confiance" que l’on a pour une proposition donnée ;

(c) sélectionner la règle de combinaison servant à agréger ces masses.

2. l’étape pignistique consiste à choisir le critère de décision permettant de statuer sur la classe à laquelle appartient le pixel.

Remarque :Même si aujourd’hui des ponts existent entre les différents cadres mathématiques comme l’illustre la figure3.3(le lecteur pourra se référer à [Nor88] pour un passage du cadre crédibiliste aux chaînes de Markov), il est préférable de choisir celui ayant le meilleur rapport simplicité de mise en œuvre/précision du résultat. En effet, utiliser le cadre le plus général implique une complexité parfois difficile à gérer notamment lorsque des données manquent ou lors d’une perte d’information du fait de la limitation de la représentation des données. La figure3.3présente les cadres mathématiques les plus répandus : la théorie des probabilités (XVIIème siècle), des sous-ensembles flous (1965), et évidentielle (1967) ainsi que les ponts permettant de passer des uns aux autres. Sont présentes également la théorie des ensembles aléatoires (1974) et la théorie des ensembles approchés (1982). La première, développée par [Ken74] (random sets) appliquée à l’origine pour des transformations morphologiques, a été rapprochée de la théorie de l’évidence par les travaux de [Ngu08] (la référence fait état d’une revisite de la version datant de 1978) et des ensembles flous par [Orl78]. Le lecteur pourra se référer à [FJGB02] pour plus de détails à ce propos.

Fig. 3.3 – Représentation ensembliste des cadres mathématiques en fusion de données.

3.1.3.1 Etape 1 : l’étape crédale Définition du cadre de discernement

Soit l’ensemble Θ le cadre de discernement (ou monde) ayant pour expression (3.4) dans le cas de n classes :

Θ ={{θ1},{θ2}, ...,{θn}} (3.4) L’adaptation de l’équation (3.4) à notre étude s’écrit :

Θ ={{peau},{sang},{graisse},{champs stériles},{instruments}} (3.5) A la différence des probabilités, le résultat de la fusion évidentielle n’est pas restreint à cet ensemble mais à une extension deΘintégrant les unions de classes, appelée power set.

Ce power set noté2Θ ,(Θ,∪) représente l’ensemble exclusif (θi∩θj =∅,∀i6=j) des 2n disjonctions d’hypothèses formées par :

1. ∅, A1, A2, ..., An⊆2Θ,Aiétant une proposition.

2. siAiet Aj ⊆2Θ alorsAi∪Aj ⊆2Θ.

Dans ces conditions, l’équation (3.4) donne le power set2Θ suivant :

2Θ={{∅},{θ1}, ...,{θn},{θ1∪θ2}, ...,{θn1∪θn}, ...,{θi∪θj∪θn}, ...,{θ1∪...∪θn}} (3.6)

L’ensemble 2Θ contient donc des classes uniques (singletons) telles que {θi} et des combinaisons de classes suivant l’opérateur∪à l’image de{θi∪θn}. Notons la présence de deux autres éléments particu-liers notés{∅}et{θ1∪. . .∪θn}. Ces deux propositions permettent explicitement de modéliser le conflit et l’ignorance (ou le doute), ce qui n’est pas permis dans les cadres probabilistes et possibilistes. La no-tion d’ignorance étant dans le cas probabiliste modélisée par une équi-probabilité des proposino-tions et non contenue dans une proposition unique. Le cadre crédibiliste offre donc des mécanismes supplémentaires comparativement aux autres cadres.

Les combinaisons d’hypothèses ne se résument pas uniquement à l’opérateur union. Ainsi d’autres opé-rateurs comme l’intersection servent à enrichir le power set et par voie de conséquence offrent plus de possibilités en termes de décisions. Comme l’illustrent les équations (3.9), il existe des sur-ensembles du power set dénommés hyper-power sets notés DΘ , (Θ,∪,∩) (tel que 2Θ ⊆DΘ) et le super-power set notéSΘ,(Θ,∪,∩, c(.)). Ce dernier reprend l’hyper-power set complété de l’opérateur complémentc(.) (tel que2Θ⊆DΘ⊆SΘ).

DΘ = {{∅},{θ1},{θ2},{θ1∪θ2},{θ1∩θ2}} (3.7) SΘ = {{∅},{c(∅)},{θ1},{c(θ1)},{θ2},{c(θ2)},{θ1∪θ2}, . . . (3.8)

{c(θ1∪θ2)},{θ1∩θ2},{c(θ1∩θ2)}}

Il appartient donc à l’utilisateur de définir le cadre de discernement approprié compte-tenu de l’appli-cation et de la puissance de calcul disponible. En effet, passer d’un power set à un hyper-power set ou à un super-power set implique un accroissement des hypothèses à traiter comme le montre le tableau 3.3. [Abb09] estime à1,7.1015Go l’espace mémoire nécessaire dans le cas oùn= 8dans l’hypothèse où chaque élément deDΘoccupe2n−1 bits.

|Θ|=n |2Θ|= 2n |DΘ| |SΘ| ∼22n1

2 4 5 8

3 8 19 128

4 16 167 32768

5 32 7580 2,1.109

6 64 7828353 9,2.1018

7 128 ∼2,4.1012 ∼1,7.1038

Tab.3.3 – Nombre d’hypothèses à évaluer fonction du nombre de classes et types de cadres utilisés.

L’énumération des hypothèses pour |SΘ| n’est pas triviale, et est communément appelée problème de

Dedekind. Le lecteur pourra se rapporter à [KT10] et [DS09] pour de plus amples détails.

Remarque :Nous avons fait l’hypothèse dans ces descriptions que le cadre de discernement est suffi-samment exhaustif pour contenir le résultat approprié. On parle alors de monde "clos" (ou "fermé").

Dans le cas contraire il s’agira de monde "ouvert" et le résultat peut alors être en dehors deΘ. Usuel-lement, l’insertion d’une classe fictive θn+1 permet de combler ce manque d’exhaustivité sans pour autant permettre d’appréhender sa signification.

Utiliser des sur-ensembles de Θ permet théoriquement des résultats plus précis mais a pour inconvé-nient de nécessiter des capacités de traitement importantes. Nous nous limiterons donc dans cette étude au power set2Θ contenant les disjonctions deΘ. Il est toutefois possible de passer ultérieurement àDΘ voire àSΘ, moyennant peu de frais ce qui est un avantage du cadre crédibiliste par rapport aux autres cadres de discernement. Nous nous intéressons maintenant à la création des masses permettant d’évaluer la croyance que l’on a en une information.

Création du jeu de masses

Les experts, ou agents rationnels selon [Den97], émettent un avis pour chacune des propositions de2Θ (identiquement pour DΘ et SΘ). Ces avis ou masses, notés m, prennent la forme de fonctions définies par :

m: 2Θ→[0,1] (3.9)

La somme de ces masses est, pour un expert donné, égale à 1 (i étant le numéro de l’expert et A la proposition considérée) :

X

A2Θ

mi(A) = 1 (3.10)

Chacune des masses est représentative de la croyance accordée. Plus le degré de croyance est élevé et plus la masse associée est proche de 1. Ainsi la certitude totale en une propositionAse traduit parm(A) = 1 et l’ignorance totale parm(θ1∪. . .∪θn) = 1plus couramment notée m(Θ) = 1.

Pour affecter des valeurs aux masses, deux méthodes sont possibles :

1. La méthode dite de Denœux ([Den00]) qui repose sur l’évaluation d’une distance euclidienne notée di séparant le vecteur x correspondant aux caractéristiques de l’objet à évaluer et xi le ième le terme correspondant au centroïde du vecteur d’apprentissage L (notons qu’il est possible de remplacerxi correspondant au centroïde intervenant dansdi par leskplus proches voisins comme utilisé dans [LMK+06]). Ce type d’approche s’appuie sur une fonction strictement décroissanteφi

(vérifiant φi(0) = 1 et lim

d0φi(di) = 0) qui prend généralement la forme : φi(di) = exp(−γi(di)2).

Le paramètre γi >0 (pouvant être identique pour l’ensemble des classes), influence la volatilité des classes ainsi que les performances de la fusion. [Mar05] propose d’utiliser l’hypothèse suivante

∀i∈N, γi=γ= 1/d2,détant la distance moyenne entre les vecteurs d’apprentissage vérifiant{θi}. Ainsi la fonction de croyance mij(.) (premier indice pour le numéro de l’hypothèse et le second pour celui de la source) est définie par :

( mij({θi}) =αjφi(di)

mij(Θ) = 1−αjφi(di) (3.11) Le coefficient αj (∈[0,1]) traduit la représentativité de l’information, ce qui s’avère différent de la notion de fiabilité faisant intervenir les mécanismes d’affaiblissement qui seront explicités plus en détail par la suite ;

2. La seconde est celle d’Appriou ([App98]) qui s’oriente plus vers les techniques probabilistes dont voici les deux variantes :

Le coefficientRjsert à normaliser les fonctions de masse et est compris entre0et max 1

ip(sj|{θi}), où p(sj| {θi})représente la densité de probabilités desj considérant{θi}. L’estimation de p(sj| {θi}) peut se faire à l’aide d’une distribution de probabilités modélisée ou bien approchée expérimenta-lement.

Application du cadre évidentiel dans notre étude

Pour cette étude, la création des masses reposera sur l’approche d’Appriou (modèle 1) pour sa simplicité de mise en œuvre. Chaque expert va statuer sur la "véracité" de chaque proposition de2Θ. L’attribut mouvement n’est constitué que d’un seul expert. Ceci est également l’attribut forme. Cependant, pour l’attribut couleur, trois experts sont utilisés : un pour chaque couche de l’image (H/S/V). Effectuer l’allo-cation sur2Θpour cinq experts demande un temps de calcul conséquent. Pour ne pas altérer la réactivité du système, nous segmentons le cadre de discernement Θ en quatre cadres distinctsΘi (cf. remarque ci-dessous). ChaqueΘiest composé des singleton{θi},c{θi},{∅}et{Θi}. Cette fragmentation limite la puissance de la fusion évidentielle, la règle de combinaison n’ayant plus "accès" à l’intégralité du cadre de discernement d’origine. Cependant, l’adoption du formalisme crédibiliste nous permet de réutiliser rapidement l’ensemble des disjonctions2Θ si le système de calcul le permet.

Remarque : Les cadres de discernement pouvent être amenés à évoluer par des opérations de raffi-nement et de grossissement. Ainsi pour deux cadres de discerraffi-nement distinctsΘ1 et Θ2, une masse mΘ1(X)peut s’écrire comme le produit résultant de ces deux espaces induisant une redéfinition de la fonction de croyance : mΘ1↑Θ1×Θ2(X). L’expression de cette nouvelle fonction de croyance au sein d’une règle de combinaison est proposée ici sous sa forme générique :

(mΘ11⊚mΘ22)(X) = (mΘ11Θ1×Θ2⊚mΘ22Θ1×Θ2)(X) (3.13) où l’opérateur⊚correspond à toute opération de combinaison de fonction de croyance.

Ce cas particulier n’est pas d’actualité ici car nour relaxons le cadre de discernement (génération de quatre cadres n’intéragissant pas ensemble). Il ne faut donc pas confondre grossissement (ou raffine-ment) d’un cadre et décomposition.

(a) Cadre de discernement avant fractionnement. (b) Obtention du cadreΘi.

(c) Déconditionnement pour la classe sang. (d) Déconditionnement pour la classe peau.

(e) Déconditionnement pour la classe champs stériles. (f) Déconditionnement pour la classe instrument.

Fig.3.4 – Exemple de classification par les séparateurs à vaste marge.

Ainsi, la classe "sang", tout comme les autres classes d’objets, forme un cadre de discernement à part entière, composé des propositions "sang", "non sang", "ignorance" et "conflit". Par convention nous noterons parΘ1 le cadre de discernement de la classe sang,Θ2la classe peau,Θ3la classe champ stérile etΘ4 les intruments.

Pour affecter les masses à chaque proposition des cadres Θ1, Θ2, Θ3 et Θ4, nous utilisons la démarche proposée par [FL05]. Celle-ci consiste à parcourir l’image acquise par la caméra et à récupérer les coordon-nées chromatiques du premier pixel. Au préalable, des histogrammes représentatifs des classes d’objets pour chacun des experts (couleur, mouvement et forme) sont stockés en mémoire. Chaque classe possède donc cinq histogrammes.

Pour l’attribut couleur, la valeur du premier histogramme pour la première composante colorimétrique du pixel correspond àp(s1| {θi}). Il est alors possible de calculerm01,m11,m21etm31. Cette procédure est réitérée pour les deux autres composantes. On obtient doncp(s2| {θi})etp(s3| {θi})ce qui nous donne au final neuf masses représentatives de la classe d’objet pour l’attribut couleur. Vient ensuite l’attribut forme qui nous permet de calculer les massesm04,m14,m24etm34. Nous effectuons la même chose pour l’attribut mouvement, qui grâce à l’estimation du flot optique est capable de nous restituer une image des pixels en mouvement. Le niveau de gris des pixels est représentatif de l’amplitude du mouvement.

Ainsi, en comparant le niveau de gris du pixel considéré à l’histogramme de la classe pour cet attribut, nous obtenons de nouvelles masses : m05, m15, m25 et m35. Au final, chacune des propositions deΘ1

possède cinq masses issues de cinq experts (sources) différents.

Afin de gagner encore en temps de calcul nous prenons le partie d’éliminer certains experts superflus : – les experts forme et mouvement pour les classes sang, peau et champ stérile dans la mesure où la

reconnaissance de ce type d’objet est principalement conditionnée par la couleur (tableaux 3.4c, 3.4d et3.4e) ;

– l’expert couleur pour la classe instrument car nous ne possédons pas les histogrammes représenta-tifs de p(si| {instrument}),i∈ {1,2,3}(tableau3.4f).

Nous avons considéré, jusqu’à présent, que ces sources ont des performances équivalentes. Or, ceci n’est pas toujours le cas notamment lorsqu’il s’agit de sources hétérogènes. Pour intégrer ces disparités, les masses vont être affaiblies.

Affaiblissement des masses

L’affaiblissement de masse permet de prendre en compte la fiabilité des sources d’informations. Ceci revient à pondérer la massemij suivant les modalités suivantes :

( mβij(A) =βjmij(A),∀A∈2Θ mβij(Θ) = 1−βij(1−mij(Θ))

L’affaiblissement vérifie doncβij∈[0,1], les extrema représentant respectivement la non-fiabilité (entraî-nantmβij(Θ) = 1) et la fiabilité totale de la source pour la proposition considérée. Cependant, quantifier la fiabilité d’un capteur n’est pas toujours aisé. De plus, dans notre cas, la reconnaissance des objets est influencée par l’éclairement de la scène. Dans la mesure où le chirurgien peut potentiellement en moduler le niveau, il est intéressant de s’attarder sur les performances de la méthode pour différentes configurations d’éclairement.

Nous proposons d’utiliser une matrice de confusion qui condense dans une matrice, l’aptitude des mé-thodes à bien classifier les pixels mais aussi les erreurs d’appariement. Il est alors possible d’attribuer βij aux valeurs contenues dans la matrice. Dans un cadre plus courant, la définition de βij se fait en calculant la moyenne de la diagonale de la matrice de confusion (βij ∼βj). Cette matrice de confusion est une synthèse simple des résultats de classification où chaque cellule donne le taux de classification de la proposition Ai enAj. Si l’on considère un problème à deux classesΘ = {{sang},{peau}} où un expert doit se prononcer sur l’appartenance des pixels d’une image au cadre de discernementΘ, il serait possible de trouver la matrice de confusion suivante :

sang1 non sang1

sang2 VP FP

non sang2 FN VN

Tab.3.4 – Exemple de matrice de confusion ("1" correspond à la vérité terrain et "2" à celle du système).

– VP : nombre de pixels reconnus correctement comme étant du sang ; – VN : identification correcte des pixels non-sang ;

– FP : pixels associés à du sang et qui en réalité ne l’étaient pas (fausse détection) ; – FN : pixels manqués par le système.

A partir des valeurs contenues dans les cellules, il est possible de calculer certaines grandeurs plus re-présentatives de l’efficacité du système de reconnaissance telles que la précision P et le rappel R. La première définie par P = V PV P+F P, correspond à la probabilité que l’avis soit correct lorsqu’il s’agit de sang. Inversement, la seconde rend compte des bonnes détections de la classe non-sang,R= V PV P+F N. Dans le cadre de ces travaux, nous utiliserons comme coefficient de pondération des masses, la distance définie par :

D=p

(1−Précision)2+ (1−Rappel)2 βj= 1− 1

√2D (3.14)

Ainsi une reconnaissance parfaite se traduit parβj = 1(a contrarioβj= 0). Une fois chacune des masses affaiblies, il faut procéder à leur agrégation pour n’obtenir qu’une seule masse représentative de chaque proposition. Les règles de combinaison permettant la fusion de ces avis sont explicitées dans la section suivante.

Les règles de combinaison en fusion évidentielle

Le but des règles de combinaison consiste en une mutualisation des connaissances permettant, suivant différentes modalités, de fournir en sortie de processus une masse unique pour chacune des propositions composant le power set.

Règle de combinaison conjonctive et disjonctive

La première règle conçue est celle de Dempster en 1967, étendue en 1976 par Shafer, dite de combi-naison conjonctive normalisée (ou encore de combicombi-naison de Dempster et de somme orthogonale). Pour une proposition donnée, les masses sont "additionnées" les unes aux autres et le résultat est noté m ([LDB01]) :

m=m1⊕m2⊕. . .⊕mn (3.15)

avec X

A2Θ

m(A) = 1.

Pour deux experts1et2fournissant respectivement m1etm2, nous obtenons (sous hypothèse de totale

fiabilité des sources et A étant un élément focal appartenant àΘ) :

Le terme m12 de l’équation (3.16), connu sous le nom de règle conjonctive de Smets, est présenté en (3.17). Une interprétation intuitive de cette règle conjonctive correspond à l’opération "ET" de la théorie ensembliste. révé-lateur de l’inconsistance de la fusion ([JF96]) et traduit le conflit global (k attribué à {∅}). La règle de combinaison de Dempster peut donc être appliquée aux cadres de discernement fermés ; sa généralisation àN experts s’écrit donc :

L’expression généralisée du conflit devient donc :k= X

A1...AN=

YN j=1

mΘj(Aj).

Une variante de la règle conjonctive, dite règle disjonctive proposée par [DP88] permet de réaliser l’opé-ration logique "OU" entre les masses de croyance. On obtient pourN sources :

règle disjonctive

Les règles de combinaison conjonctive et disjonctive ne sont pas les seules permettant d’agréger des masses de croyance. D’autres auteurs ont proposé des solutions notamment pour répartir plus judicieusement le conflit. Par la suite, nous utiliserons les règles conjonctives et disjonctives. Cependant de nombreux travaux décrient ces règles du fait de leur non-idempotence. Dès lors, ce processus de fusion sera étendu aux règles de [Yag87], [DP88] et [Sma05]. Nous nous limitons ici aux règles les plus connues. Le lecteur pourra compléter cette description des règles de combinaison en se rapportant aux travaux de [LCV02], [Ina91] et [FDV+06] sur les fonctions génériques.

Règle de combinaison de Yager

Cette règle permet de résoudre le problème de non-idempotence de la règle conjonctive. [Yag87] proposa de répartir le conflit sur l’ignorance totale à savoirΘtelle que pour∀A∈2Θ, A6= Θ,A6=∅:

Règle de combinaison de Dubois et Prade

Proposé par Dubois et Prade, cette règle distribue le conflit partiel sur l’union des sources le générant (l’intersection de ces deux propositions étant vide) :

règle de Dubois et Prade

Le résultat tendra donc vers une conjonction en l’absence de conflit et vers une disjonction lorsque celui-ci sera proche de 1.

Règle de combinaison PCR5

Actuellement, l’une des techniques les plus abouties pour la gestion du conflit, la règle dite Proportio-nal Conflict Redistribution développée par [Sma05] est opérante même dans DΘ. Sa cinquième version (PCR5) est plus performante que les précédentes mais ne s’applique qu’à deux sources (3.22). Ce dernier point a été pallié par [MO06] qui propose une extension à N experts sous le nom de règle PCR6.

mΘPCR5(X) =mΘ2(X) + X

Nous venons de voir les règles de combinaison de masse les plus utilisées permettant d’avoir un avis unique sur chaque proposition de 2Θ. Il s’agit donc maintenant de décider de la classe d’objets la plus représentative du pixel considéré. En l’absence d’information complémentaire les règles conjonctives, disjonctives, de Yager, Dubois et Prade et PCR5 seront utilisées. L’analyse des performances statuera sur la règle la plus adaptée au problème de reconnaissance d’objets dans une scène chirurgicale.

3.1.3.2 Etape 2 : l’étape pignistique

Cette étape consiste, à partir des masses résultantes issues de l’étape crédale, à en extraire une sortie unique représentative du problème posé. Pour cela, plusieurs critères sont possibles :

– le maximum de croyance ; – le maximum de plausibilité ;

– le maximum de probabilité pignistique.

Les deux premiers critères permettent un comportement respectivement pessimiste et optimiste du sys-tème. Dans la mesure où le maximum de probabilité pignistique est un compromis entre ces deux critères, nous privilégions son usage. Basé sur le principe de la raison insuffisante, la probabilité pignistique notée BetP est définie par :

Ainsi, pour chaque singleton du cadre de discernement, la mesure BetP est calculée. La proposition correspondant au maximum de BetP est définie comme étant la réponse du système au problème de reconnaissance d’objets. Cette prise de décision peut être combinée à la notion de choix en environnement risqué. Résumé dans [Den97], ce type de méthode s’appuie, à l’image du cadre probabiliste, sur une

décision minimisant l’espérance du coût f (à valeur dans R). Ainsi, dans le cas d’une distribution de probabilitésBetP, l’espérance associée s’écrit :

EBetP(f) = X

AΘ

f(A)BetP(A) (3.24)

Il est possible d’utiliser d’autres mécanismes que celui de la probabilité pignistique pour le calcul de (3.24), et atteindre des comportements pessimistes (minimisation de l’espérance supérieure) ou opti-mistes (minimisation de l’espérance inférieure).

Dans le cadre de cette étude, nous utiliserons la prise de décision définie en (3.23). Quatre propositions composant le cadre de discernement Θi sont calculés. Pour composer une image unique représentative des objets en présence dans l’image, nous sélectionnons le maxima des probabilités pignistiques des pre-mières propositions. L’utilisation de la notion de risque pour l’établissement des probabilités pignistiques constitue une perspective de ces travaux.

Nous avons vu l’ensemble des mécanismes permettant de reconnaître des objets présents dans la scène chirurgicale. Nous proposons en table1 un synopsis de la procédure de désignation de la zone d’intérêt.

Entrée du programme : Image Icouleur de tailleM×N de la scène opératoire.

Entrée du programme : Image Icouleur de tailleM×N de la scène opératoire.