• Aucun résultat trouvé

5.4 Apprentissage

6.1.4 Analyse et choix d’une repr´esentation

Rappelons que nous souhaitons d´eterminer les structures s´emantiques de l’image, en exploitant les relations spatiales et contextuelles entre les mots visuels. Nous avons donc test´e les diff´erents modes de repr´esentation sus-pr´esent´es, afin de choisir la mieux appropri´ee pour notre objectif.

En ce qui concerne les hypergraphes, l’id´ee est de mˆeler segmentation et reconnais- sance pour mettre directement en ´evidence les structures de l’image. Pour ce faire, nous nous proposons d’exploiter les outils de partitionnement des hypergraphes pour la seg- mentation d’images, les relations spatiales et contextuelles ´etant alors prises en compte directement dans la segmentation. La proc´edure que nous avons adopt´ee est la suivante. A partir de l’image multispectrale, l’hypergraphe de voisinage spatiocolorim´etrique de l’image est construit. Nous avons choisi de suivre une approche vectorielle qui prend en compte les d´ependances entre les composantes. La distance colorim´etrique permettant de g´en´erer les hyperarˆetes est la distance euclidienne, appliqu´ee dans une grille rectan- gulaire et un 8-voisinage.

La figure 6.2(a) montre une image dont l’hypergraphe a ´et´e construit en utilisant un seuil colorim´etrique fix´e `a 35. Afin de visualiser le comportement de l’hypergraphe ob-

6.1. REPRESENTATION DES INFORMATIONS EXTRAITES´ 113

(a)

(b)

FIG. 6.2 – Visualisation du comportement d’un hypergraphe de voisinage spatiocolo- rim´etrique vectoriel avec un seuil de 35. (a) Image Pelican de Toulouse, `a 1 m ; (b) Chaque pixel de l’image a une intensit´e qui est fonction du nombre de pixels de son voisinage qui appartiennent `a l’hyperarˆete dont il est le centre : les zones blanches sont les plus homog`enes.

tenu, nous pr´esentons dans la figure 6.2(b), la mˆeme image dans laquelle chaque pixel a un niveau de gris d´ependant du nombre de pixels de son voisinage qui appartiennent `a l’hyperarˆete centr´ee en ce pixel : plus un pixel a de voisins appartenant `a l’hyperarˆete dont il est le centre, plus son intensit´e est forte. Donc dans la figure 6.2(b), les zones blanches sont les plus homog`enes.

Le but d’un k-partitionnement d’hypergraphes1 est de partitionner les noeuds de l’hypergraphe en k sous-ensembles disjoints, de telle sorte qu’une certaine fonction d´efi- nie sur les hyperarˆetes soit optimis´ee (minimisation de la coupe des hyperarˆetes, mini- misation de la somme des degr´es externes). Une repr´esentation par hypergraphes paraˆıt donc int´eressante pour repr´esenter plus efficacement le contenu de l’image de fac¸on `a faire apparaˆıtre les structures d’int´erˆet pour l’utilisateur. Mais cela n´ecessite de d´efinir une fonction ad´equate sur les hyperarˆetes (par exemple une fonction de saillance parti- culi`ere), ce qui n’est gu`ere trivial. Et lorsqu’elle est mal choisie, cela peut aboutir `a un

1Pour ce faire, il existe un outil de partitionnement d’hypergraphes appel´e HMETIS : http ://gla-

(a) (b)

FIG. 6.3 – Test de codage de l’image en un texte, puis segmentation de l’image par parti- tionnement du texte. (a) Image Pelican de Toulouse `a 1 m de r´esolution ; (b) Image seg- ment´ee : une r´egion est une suite de lettres dans le texte et les fronti`eres des r´egions sont donn´ees par les noeuds terminaux dans l’arbre recouvrant de poids minimal. Les couleurs sont distribu´ees de mani`ere al´eatoire.

partitionnement de l’image totalement non intuitif.

Par ailleurs, nous avons test´e la repr´esentation de l’image en un texte sur une image Pelican. L’id´ee ´etait de transformer l’image en un texte et d’utiliser cette repr´esentation lin´eaire qui conserve l’information spatiale (puisque la suite de lettres est obtenue par parcours de l’arbre recouvrant de poids minimal) pour identifier des suites de lettres ou des sous-s´equences particuli`eres pouvant repr´esenter des objets ou structures parti- culiers de l’image. Un partitionnement judicieux (suivant un crit`ere d’entropie minimale par exemple) du texte code de l’image pourrait nous aider `a parvenir `a nos fins. De mˆeme, l’utilisation de m´ethodes a contrario, afin de mettre en ´evidence des sous-s´equences sin- guli`eres de la chaˆıne, pourrait ˆetre une alternative int´eressante. Cependant, les difficult´es li´ees `a la manipulation et `a l’exploitation des informations contenues dans le texte pour nos besoins, ainsi que la longueur du texte pour de grandes images se sont av´er´ees tr`es contraignantes. En effet, les tests de partitionnements du texte que nous avons effectu´es ne nous ont gu`ere donn´e de r´esultats convaincants. La figure 6.3 montre un exemple de segmentation de l’image par partitionnement du texte, o `u les fronti`eres des r´egions sont donn´ees par les noeuds terminaux des brins de l’arbre pendant le parcours selon 4 di- rections. Outre les structures lin´eaires qui sont assez bien d´etect´ees, les autres structures ou objets de l’image sont assez confuses. Diff´erents autres tests ont ´et´e effectu´es sur des images synth´etiques plus simples, g´en´eralement avec des r´esultats d´ecevants.

Pr´ecisons que si dans ces exp´erimentations nous avons travaill´e avec le pixel, cela est tout `a fait g´en´eralisable au niveau de la r´egion, en segmentant l’image au pr´ealable et en consid´erant un noeud comme ´etant une r´egion. Par ailleurs, ces deux modes de repr´esentation, d’une mani`ere ou d’une autre, sont bas´es sur les graphes qui sont un outil classique pour ce type de probl`eme. Donc dans la suite, nous utiliserons les graphes

6.2. D ´ETERMINATION NON SUPERVISEE DE STRUCTURES D´ ’INTER´ ETˆ 115

FIG. 6.4 – Chaˆıne de traitement d´efinie pour la d´etection des structures dans une image.

d’adjacence comme mode de repr´esentation dans nos exp´erimentations. Nous en ferons usage comme d’un outil pour le regroupement spatial des r´egions.