• Aucun résultat trouvé

D´etermination non supervis´ee de structures d’int´erˆet

Suivant le principe de compositionnalit´e s´emantique, l’image est d’abord d´ecompos´ee en zones ´el´ementaires `a l’aide d’une segmentation. Notons qu’il est ´egalement possible de d´etecter des formes particuli`eres de l’image telles que les r´eseaux routiers ou flu- viaux ; cependant, nous n’en tiendrons pas compte dans cette exp´erimentation. Les zones ´el´ementaires sont ensuite quantifi´ees pour cr´eer les mots visuels. Puis, de mˆeme que la compr´ehension d’une phrase n´ecessite de comprendre les mots et la syntaxe entre ces mots, nous exploitons les relations existant entre ces mots visuels, en particulier les re- lations d’adjacence. Les mots visuels peuvent donc ˆetre regroup´es suivant leurs attri- buts g´eom´etriques et/ou topologiques afin de former des structures d’int´erˆet, c’est-`a-dire saillantes au regard d’un crit`ere `a d´efinir.

La figure 6.4 r´ecapitule les ´etapes que nous avons d´efinies pour la mise en ´evidence des structures potentiellement int´eressantes de l’image.

6.2.1 Protocole

La proc´edure suivie est celle sch´ematis´ee dans la figure 6.4. L’image est donc d’abord partitionn´ee en r´egions ´el´ementaires. Apr`es l’´etape de quantification, une ´etiquette est associ´ee `a chaque cluster, repr´esent´e par un mot visuel. Chaque r´egion de l’image est ainsi dot´e d’une ´etiquette, signifiant son appartenance `a un cluster. Par la suite, nous ne manipulons plus les caract´eristiques de bas niveau et nous int´eressons aux relations d’adjacence entre les r´egions.

Pour repr´esenter cette adjacence, nous avons utilis´e les graphes. Ainsi, nous avons cr´e´e le graphe pond´er´e d’adjacence des r´egions, dans lequel le poids d’une arˆete d´etermi- ne le d´egr´e d’adjacence entre ses deux extr´emit´es. Le degr´e d’adjacence repr´esente la force du lien entre les deux r´egions voisines. Il peut s’exprimer de plusieurs mani`eres :

– la compacit´e ou la forme de la r´egion finale obtenue par regroupement, ceci afin de juger de la r´egularit´e de la forme de la r´egion obtenue. elle peut ˆetre d´etermin´ee `a l’aide du rapport isop´erim´etrique que nous d´etaillons dans la section suivante.

– la longueur relative de la fronti`ere commune, c’est-`a-dire le nombre de pixels ap- partenant aux deux r´egions adjacentes normalis´e par le p´erim`etre de la r´egion fi- nale.

– la distance entre les centres de gravit´e des deux r´egions ´el´ementaires. – ...

Des op´erations sur les graphes sont ensuite men´ees, pour d´etecter de mani`ere non supervis´ee, les objets et structures de l’image. L’algorithme propos´e est le suivant (algo- rithme 6.2.1) :

Algorithme 6.2.1: Pseudo-code pour la d´etection non supervis´eee des structures. 1 : Construire le graphe pond´er´e d’adjacence des r´egions,

2 : Calculer une matrice de probabilit´es Pi,j, repr´esentant la probabilit´e qu’une

r´egion d’´etiquette i soit adjacente `a une r´egion d’´etiquette j,

3 : Identifier le couple d’´etiquettes (i∗, j∗) tel que P (i∗, j∗) = maxi,j P (i, j),

4 : Extraire toutes les r´egions d’´etiquette i∗adjacentes `a des r´egions d’´etiquette j∗, 5 : Pour chacune des paires de r´egions adjacentes d’´etiquette i∗et j∗, d´ecider de les

associer suivant un certain crit`ere tenant compte du poids de l’arˆete.

6 : Attribuer une mˆeme nouvelle ´etiquette aux r´egions issues des regroupements, 7 : Retourner `a l’´etape 1, tant que les groupements effectu´es sont significatifs.

La matrice de probabilit´es Pi,jpeut juste compter les occurrences des paires de r´egions

adjacentes d’´etiquette i et j, ou introduire une pond´eration en tenant compte du degr´e d’adjacence entre les diff´erents couples de r´egions. Par ailleurs, la d´ecision d’associer une r´egion de la classe i∗ `a une r´egion de la classe j∗ se fait suivant un certain crit`ere d´ependant du poids de l’arˆete. Par exemple, si le poids de l’arc qui les relie est sup´erieur `a ceux des autres arˆetes ayant l’une des deux r´egions pour extr´emit´e, ou plus g´en´eralement, si le poids de l’arc entre les deux r´egions est sup´erieur `a un certain seuil. En modifiant le crit`ere associ´e au poids des arcs et la valeur du seuil, diff´erents regroupements peuvent ˆetre envisag´es. En particulier, si l’utilisateur peut interagir avec ces param`etres (soit direc- tement, soit par apprentissage `a travers des exemples), les structures mises en ´evidence n’en seront que plus pertinentes.

6.2.2 D´etection des bˆatiments et de leurs ombres

Dans cette section, nous nous focalisons sur le probl`eme actuel de la d´etection des bˆatiments et des ombres associ´ees. Cette probl´ematique est pr´esente, entre autres, dans les tˆaches de reconstruction 3D des bˆatiments, de mesure du degr´e d’urbanisation d’une commune ou encore de mise `a jour de bases de donn´ees 2D. Dans la litt´erature, grand nombre des m´ethodes de d´etection des bˆatiments sont bas´ees sur la morphologie math´e- matique, mais peuvent cependant n´ecessiter une intervention forte de l’utilisateur dans le processus. Par exemple, dans [Matti-Gallice & Collet, 2004], les auteurs appliquent une classification supervis´ee en post-traitement des r´esultats fournis par les op´erateurs mor- phologiques, pour l’extraction du bˆati en milieu p´eriurbain. D’autres m´ethodes r´eclament des donn´ees sp´ecifiques telles que les mod`eles num´eriques d’´elevation (MNE). Ainsi, disposant de mod`eles num´eriques d’´elevation haute r´esolution, Ortner et ses coll`egues

6.3. APPRENTISSAGE SUPERVISE DES RELATIONS ENTRE LES MOTS VISUELS´ 117

[Ortner et al., 2003] mod´elisent un bˆatiment par une silhouette rectangulaire, une fonc- tion de co ˆut indiquant la pertinence de la silhouette propos´ee, et un estimateur de toit permettant de construire un toit pour une silhouette pertinente donn´ee.

Nous proposons ici, une m´ethode non supervis´ee qui permet de d´etecter directement, dans une image satellitaire `a haute r´esolution, des bˆatiments et les ombres qui leur sont associ´ees.

Nous avons effectu´e des tests sur une image Pelican `a 50 cm de r´esolution, visua- lis´ee en fausses couleurs dans la figure 6.5 en haut `a gauche. Cette image repr´esentant le tissu urbain de la ville de Toulouse a tout d’abord ´et´e segment´ee par l’algorithme Mean shift, puis les caract´eristiques spectrales et g´eom´etriques de r´egions ´el´ementaires obte- nues ont subi une quantification vectorielle, suivant la proc´edure pr´ec´edemment d´ecrite. Le graphe d’adjacence des r´egions de l’image est pond´er´e par le rapport du nombre de pixels communs et du p´erim`etre de la r´egion form´ee en fusionnant les deux r´egions ´el´ementaires :

ηa,b=

ξa,b

πa+ πb− 2.ξa,b

(6.6) o `u πaet πbsont les p´erim`etres des r´egions Raet Rbrespectivement, et ξa,best la longueur

de la fronti`ere commune entre ces deux r´egions.

Lors du premier balayage, les deux mots du vocabulaire visuel les plus souvent as- soci´es, c’est-`a-dire maximisant la matrice des probabilit´es d’adjacence, correspondent `a deux classes d’objets que nous sommes en mesure de nommer : il s’agit des bˆatiments et des ombres, repr´esent´es en blanc et en marron (figure 6.5 en bas `a gauche). Cependant, nous pouvons constater qu’il n’est pas possible de grouper syst´ematiquement toutes les ombres adjacentes aux bˆatiments. En effet, on y trouve les ombres des grands arbres, qui ne peuvent ˆetre associ´es aux bˆatiments, mais aussi une ombre peut ˆetre adjacente `a deux bˆatiments proches. Le choix du seuil permet alors de prendre une d´ecision par rapport aux deux r´egions `a ˆetre group´ees. Ici, le crit`ere de regroupement tient compte de la com- pacit´e, c’est-`a-dire de la r´egularit´e de la forme de la r´egion obtenue, d´etermin´ee `a l’aide du rapport isop´erim´etrique :

CM =

4πS

P2 (6.7)

o `u S et P sont respectivement la surface et le p´erim`etre de la r´egion finale. La compa- cit´e est comprise entre 0 et 1, et est maximale pour un cercle. La compacit´e de la r´egion obtenue par fusion de deux r´egions `a grouper doit donc ˆetre sup´erieure `a un seuil. En cas de conflit, si par exemple il est possible de grouper une r´egion “ombre” avec chacune des deux r´egions “bˆatiments” qui lui sont adacentes, on groupe l’ombre avec le bˆatiment qui, fusionn´e `a l’ombre, donne une r´egion dont la forme est plus r´eguli`ere. Dans la fi- gure 6.5 en bas `a gauche, les r´egions encercl´ees sont des exemples de bˆatiments associ´es automatiquement `a leurs ombres, mˆeme pour de fortes valeurs du seuil.

De mani`ere it´erative, il est possible de d´etecter aussi les grands arbres et leurs ombres, puis les bˆatiments et les ombres avec les pelouses voisines, etc. C’est une hi´erarchie de l’information pouvant mettre en ´evidence des structures s´emantiques appartenant `a des classes de m´elange.