Des r´ egions vers les objets

Dans le document The DART-Europe E-theses Portal (Page 44-48)

Figure 2.13 – Une variabilit´e importante de l’initialisation : ´epaisseur, positionnement, r´egularit´e (premi`ere ligne) entraˆıne une faible variabilit´e des r´esultats (deuxi`eme ligne)

initialise le traitement : en effet, une variabilit´e importante de l’´epaisseur du ruban, de son positionnement (plutˆot int´erieur ou ext´erieur), de sa forme (plus ou moins r´eguli`ere), fournit des r´esultats tr`es similaires.

Le ruban peut ˆetre trac´e soit `a l’aide de segments (figures2.13.b,c,d,e), soit `a main lev´ee (figure2.13.f,g).

Les figures 2.13.b et c pr´esentent deux r´esultats obtenus avec deux ´epaisseurs diff´erentes (10 et 40 pixels). Le ruban de la figure2.13.c est obtenu avec 10 clics de la souris seulement ; en revanche, il fournit des d´etails pr´ecis de la tˆete et des jambes de l’animal.

Dans la figure2.13.d, la segmentation est obtenue avec un ruban positionn´e plutˆot dans l’objet alors que dans la figure 2.13.e, il est plutˆot dans le fond. Bien que ces r´esultats ne soient pas exactement identiques, ils diff`erent assez peu.

Dans les figures 2.13.f et g, on a jou´e sur la r´egularit´e de la forme du ruban : l’utilisateur peut effectivement dessiner des ”pˆat´es” qui contiennent de nombreux d´etails de contour afin de les extraire correctement, comme le montre la jambe arri`ere dans les figures2.13.m et n.

Enfin, la m´ethode pr´esent´ee peut ˆetre utilis´ee telle quelle, sans modification, avec un nombre quel-conque de racines et un ruban ferm´e peut avoir une topologie quelconque et ˆetre connexe `a un nombre quelconque de racines, comme le montre l’exemple de la figure 2.14. L’approche propos´ee garantit un nombre d’objets final ´egal au nombre de racines. Il est donc important que le ruban soit ferm´e pour que l’int´erieur puisse se distinguer de l’ext´erieur.

2.10 Des r´ egions vers les objets

Dans cette section, nous proposons une approche qui simplifie un r´esultat de segmentation en regroupant les r´egions en objets.

Pour ce faire, nous utilisons des crit`eres de plus haut niveau.

L’outil utilis´e est toujours la pyramide irr´eguli`ere.

2.10.1 Introduction

Nous traitons ici les probl`emes relatifs `a une m´ethode g´en´erique et automatique d’extraction d’objets dans les images (voir [MLT99] pour un r´ecapitulatif des m´ethodes existantes). Afin de proposer une

(a) Image originale (b) Initialisation (c) Partition obtenue

Figure 2.14 – Segmentation de plusieurs r´egions d’int´erˆet

nouvelle m´ethode non fond´ee sur la connaissancea priori du contenu s´emantique de l’image ou sur un mod`ele quelconque d’objet, plusieurs m´ethodes efficaces sont int´egr´ees et interviennent successivement dans la pyramide de graphe irr´eguli`ere : (1) Une analyse locale de l’homog´en´eit´e de l’image est effectu´ee pour initialiser une segmentation locale et ainsi ´eviter une sur-segmentation. (2) La pyramide de graphe r´ealise unesegmentation localedes zones h´et´erog`enes de l’image. En utilisant un crit`ere de similarit´e, elle g´en`ere un empilement de partitions pr´ecises. (3) La pyramide est de nouveau utilis´ee sur les r´egions issues de la segmentation pour un traitement degroupement perceptuelselon des crit`eres issus de la th´eorie du Gestalt. Ces crit`eres sont bien adapt´es `a une m´ethode n’utilisant pas de mod`ele puisqu’ils prennent en compte uniquement la pertinence visuelle des r´egions.

2.10.2 Groupement de r´ egions orient´ e perception

Principe

Nous appelons groupement perceptuel le fait de fusionner plusieurs r´egions sur des crit`eres perceptuels.

Lors du traitement de groupement perceptuel, deux contraintes doivent ˆetre respect´ees : premi`erement, seuls les meilleurs groupements locaux doivent ˆetre retenus ; ce qui signifie qu’un maximum de combinai-sons de r´egions doit ˆetre ´etudi´e (parmi deux, trois, quatre, . . . , nvoisins). Deuxi`emement, le r´esultat ne doit pas ˆetre influenc´e par l’ordre des groupements.

La pyramide irr´eguli`ere a ´et´e choisie afin de r´ealiser l’´etape de groupement pour trois raisons prin-cipales. Premi`erement, sa structure de graphe est bien adapt´ee `a la manipulation en parall`ele (i.e.

ind´ependante) de r´egions. Deuxi`emement, les crit`eres de groupement de r´egions sont facilement inter-changeables. Enfin, les it´erations du traitement sont simplement obtenues par g´en´eration de niveaux suppl´ementaires r´esultant des fusions entre r´egions.

Le graphe final de la pyramide locale constitue le graphe initial de la pyramide de groupement. En effet, la pyramide locale est ´etendue avec des niveaux suppl´ementaires induits par le groupement de r´egions.

Dans [LeG03] les auteurs groupent seulement des paires de r´egions. Contrairement `a leur travail, avec notre m´ethode, un nombre quelconque de r´egions peut fusionner simultan´ement en un seul groupement.

Cela fournit plus de choix dans la strat´egie de groupement et donc, plus d’adaptativit´e au contenu de l’image.

Crit`eres de groupement

Les crit`eres choisis pour effectuer le groupement sont d´eriv´es de la th´eorie du Gestalt [Wer58] qui n’utilise aucun mod`ele d’objet. La vision humaine effectue des groupements ind´ependants (appel´es Ges-talt) fond´es sur cinq propri´et´es principales : la proximit´e, la similarit´e, la fermeture, la continuit´e et la sym´etrie [ZTB04].

2.10. DES R ´EGIONS VERS LES OBJETS 39 Des ´energies sont extraites de ces propri´et´es et sont calcul´ees pour des r´egions ou des groupements de r´egions. Le but est de s´electionner les groupements de plus faibles ´energies repr´esentant une forte pertinence visuelle. Le coˆut d’un groupement est compos´e de plusieurs fonctions d’´energie propos´ees par [LeG03].

Ef usionest le coˆut de l’op´eration de fusion fond´e sur la diff´erence des moyennes des composantes Lab, et sur l’´etude des jonctions (continuit´e des contours) des diff´erentes r´egions du groupement.

Eregion est le coˆut de la r´egion r´esultant d’une fusion. il peut ˆetre consid´er´e comme le degr´e de pertinence du groupement potentiel (plus l’´energie est faible, plus le degr´e de pertinence est important).

Ce coˆut est fond´e sur la compacit´e, la convexit´e et l’aire du groupement.

La fonction d’´energie d’une r´egion r´esultant d’un groupement est donn´ee parE=Ef usion+Eregion. Une ´energie faible indique un fort int´erˆet visuel. Au contraire, une forte valeur indique une r´egion ou un groupement ind´esirable. Le but ´etant de r´ealiser le groupement qui assure la plus faible ´energie localement.

2.10.3 Choix des meilleurs groupements

S´election du meilleur groupement local Soit vc un sommet, c ∈ J1, NK et nc le nombre de ses voisins. Tous les groupements incluant vc et les diff´erentes combinaisons de ses voisins sont consid´er´es.

Le nombre de combinaisons est donn´e par la formule suivante : C(vc) = Ef usion etEregion sont calcul´ees pour chacun de ces groupements.

Soitgc le groupement incluantvc ayant la plus faible ´energieE(gc).gc est un groupement potentiel si : (1)gc am´eliore localement l’´energie de la partition, (2)E(gc) indique une forte pertinence visuelle. Si ce n’est pas le cas,gc n’est pas retenu.

Notons que dans nos exp´erimentations, le nombre maximum de voisins par combinaisons est limit´e `a 5 ou 6, ce qui donne respectivementC(vc) = 31 ouC(vc) = 63.

S´election du meilleur groupement global Un ensembleGde groupements potentiels est `a pr´esent d´efini sur toute l’image. Les groupements effectivement r´ealis´es sont s´electionn´es dansGpar ordre crois-sant des ´energies. Lorsqu’un groupementgsest s´electionn´e, tout groupement deGqui intersecte avecgs

est exclu. Ainsi, la fusion de chaque groupement s´electionn´e peut ˆetre correctement r´ealis´ee. Ces fusions engendrent, dans la pyramide, un niveau suppl´ementaire correspondant `a la nouvelle partition.

Cette s´election assure les meilleurs groupements dans l’image enti`ere. Le traitement de groupement est r´eit´er´e jusqu’`a ce que le nombre de sommets reste stable.

2.10.4 R´ esultats

Les diff´erents r´esultats obtenus avec cette m´ethode sont pr´esent´es dans les figures2.15,2.16et 2.17.

Pour des images complexes dont la dimension est d’environ 300×300 pixels, la segmentation locale g´en`ere habituellement une partition de 100 `a 200 r´egions. De cette partition, l’´etape de groupement donne une partition de moins de 20 r´egions. En g´en´eral, l’´etape orient´ee similarit´e converge en moins de 100 niveaux et l’´etape orient´ee perception s’´etend seulement sur 10-15 ´etages suppl´ementaires. L’aspect hi´erarchique de la pyramide constitue un grand avantage car lorsque dans les derniers niveaux de la pyramide des objets s´emantiques sont perdus, l’utilisateur peut facilement parcourir la pyramide afin de les r´ecup´erer.

C’est le cas dans la figure2.15.d qui repr´esente une partition comportant 13 r´egions, qui d´efinit avec une bonne pr´ecision les animaux.

(a) Image originale (b) Masque d’ho-mog´en´eit´e Lab

(c) Segmentation locale (d) Un esultat interm´ediaire de grou-pements

Figure2.15 – Diff´erents niveaux de segmentation avec plusieurs objets d’int´erˆet

(a) Image originale (b) R´esultat de la pyra-mide locale

(c) Groupement in-term´ediaire

(d) Groupement final

Figure2.16 – Diff´erents niveaux de la segmentation d’une image comportant un objet d’int´erˆet

(a) Image originale (b) Utilisation de 2 egions maximum par groupement

(c) Utilisation de 4 egions maximum par groupement

(d) Utilisation de 6 egions maximum par groupement

Figure 2.17 – R´esultats obtenus avec des groupements locaux pour des nombres de r´egions maximum diff´erents

Dans le document The DART-Europe E-theses Portal (Page 44-48)