• Aucun résultat trouvé

6.3 Apprentissage supervis´e des relations entre les mots visuels

6.3.2 Exp´erimentations sur les forˆets m´elang´ees

Sans aucune perte de g´en´eralit´e, nous nous int´eressons dans la suite au cas particu- lier des forˆets m´elang´ees (classe 313), principalement compos´ees des forˆets de feuillus et des forˆets de conif`eres. A partir de l’image de r´egions ´etiquet´ees (classification), il s’agit d’ap- prendre les r`egles de regroupement sur le graphe pond´er´e d’adjacence des r´egions, ceci en exploitant les r`egles de base de CORINE. En effet, l’apprentissage doit ˆetre effectu´e sous la contrainte du respect de la taille de la r´egion minimale dans CORINE Land Co- ver, et de sa nomenclature, qui d´efinit les forˆets m´elang´ees comme des formations v´eg´etales principalement constitu´ees par des arbres, mais aussi par des buissons et des arbustes, o `u ni les feuillus, ni les conif`eres ne dominent. Ensuite, forts de cet apprentissage, nous allons essayer de retrouver les zones de forˆets m´elang´ees dans les images.

Les regroupements des r´egions sur le graphe sont effectu´es par croissance de r´egions. Partant d’une r´egion initiale appartenant soit aux forˆets de feuillus, soit aux forˆets de co- nif`eres, le graphe est parcouru en largeur d’abord. L’algorithme de parcours en largeur d’abord d´ecouvre tous les sommets `a distance k avant de d´ecouvrir un sommet `a dis- tance k + 1. Ayant d´ecouvert tous les sommets `a distance k − 1 et une partie des sommets `a distance k, on commence par d´ecouvrir tous les voisins des sommets `a distance k − 1 avant de commencer `a consid´erer les voisins des sommets `a distance k.

A chaque ´etape du parcours du graphe, le co ˆut de regroupement des deux r´egions est calcul´e. La fonction de co ˆut utilis´ee est conc¸ue en tenant compte au minimum des contraintes de superficie et de proportion de chacune des composantes dans une zone de forˆets m´elang´ees. En effet, on v´erifie les conditions suivantes :

– La superficie de la r´egion obtenue par regroupement est sup´erieure `a la superficie de la r´egion minimale dans CORINE Land Cover, soit smin = 25ha.

– Les proportions de forˆets de feuillus et de conif`eres dans la nouvelle r´egion sont respect´ees. Soient αminet αmax, les bornes inf´erieure et sup´erieure de la proportion

(a)

(b)

FIG. 6.6 – Fonctions de co ˆut de regroupement associ´ees `a la contrainte de superficie (a) et `a la contrainte de proportion des feuillus ou de conif`eres (b) dans la r´egion obtenue.

proportions effectives de feuillus et de conif`eres pr´esentes dans la nouvelle r´egion, alors :    αmin≤ βf ≤ αmax αmin≤ βc≤ αmax et βf + βc≤ 1

Les diff´erents co ˆuts Cpet Csassoci´es `a chaque contrainte peuvent s’exprimer `a l’aide

des ´equations suivantes par exemple : Cp = max



1 − f (βf − αmin) + f (βf− αmax), 1 − f (βc− αmin) + f (βc− αmax)

 Cs = 1 π.  arctan(−(s − smin)) + π 2  (6.8) o `u f est une fonction sigmo¨ıde telle que :

f (x) = 1 1 + exp(λx)

Ces contraintes sont repr´esent´ees dans les figures 6.6(a) et 6.6(b). Le co ˆut total s’ex- prime alors par : C = a.Cs+ b.Cp, les coefficients a et b exprimant le poids accord´e `a

6.3. APPRENTISSAGE SUPERVISE DES RELATIONS ENTRE LES MOTS VISUELS´ 121

FIG. 6.7 – Image SPOT de la r´egion du Loiret, 20m de r´esolution et 3 bandes spectrales :

R, V et PIR. Les zones (1 `a 5) d´etour´ees en blanc sont des forˆets m´elang´ees suivant la clas- sification de CORINE Land Cover.

chaque contrainte.

Bien s ˆur, d’autres contraintes peuvent ˆetre prises en compte, `a l’instar du nombre de noeuds moyen (r´egions ´el´ementaires) dans la r´egion obtenue, de la taille moyenne des noeuds, etc.

Sur les zones de forˆets m´elang´ees utilis´ees pour l’apprentissage, le graphe est donc par- couru, les relations spatiales entre les r´egions sont apprises de cette mani`ere, en calculant la fonction de co ˆut.

Sur une image test d´ecompos´ee en mots visuels, le graphe est parcouru `a partir d’une r´egion initiale. Et pour chaque regroupement, la fonction de co ˆut est calcul´ee. Si le co ˆut obtenu est sup´erieur `a un seuil d´etermin´e lors de l’apprentissage, l’algorithme arrˆete les regroupements pour cette r´egion d’initialisation et passe `a une autre r´egion pour initiali- ser un nouveau regroupement ou une nouvelle structure.

La figure 6.7 montre une image SPOT de la r´egion du Loiret dans laquelle les zones de forˆets m´elang´ees selon CORINE Land Cover sont d´etour´ees (zones 1 `a 5). Les tests ef- fectu´es avec la m´ethode d´ecrite ci-dessus ont donn´e les r´esultats de la figure 6.8. Les zones d´etect´ees comme ´etant des forˆets m´elang´ees (d´etour´ees en vert) peuvent ˆetre class´ees en deux cat´egories : celles qui ont une intersection avec une forˆet m´elang´ee de CORINE, et les fausses alarmes.

Dans le premier cas, les d´elimitations des zones d´etect´ees comme ´etant des forˆets m´elang´ees ne sont pas les mˆemes que celles donn´ees par CORINE. Par exemple, lors des tests de regroupement, certaines r´egions de la zone 2 ont ´et´e associ´ees `a d’autres r´egions pour former une forˆet m´elang´ee recouvrant partiellement la zone 2. Pour ´evaluer l’identi- fication des zones de forˆet m´elang´ee donn´ees par la v´erit´e de terrain, nous avons utilis´e la

FIG. 6.8 – R´esultats donn´es par les tests de regoupement : les zones d´etour´ees en vert repr´esentent les forˆets m´elang´ees obtenues.

TAB. 6.1 – Evaluation de la reconnaissance par regroupement des r´egions ´el´ementaires,

des zones de forˆets m´elang´ees d´elimit´ees par la classification de CORINE Land Cover. Zone 1 Zone 2 Zone 3 Zone 4 Zone 5

Ncom Nv 0.50 0.47 0 0.80 0.34 Ncom Nc 0.84 0.48 0 0.51 0.36 tR 0.42 0.23 0 0.40 0.12 F − score 0.63 0.48 0 0.61 0.34

quantit´e tR, d´efinie comme suit :

tR= Ncom Nv .Ncom Nc (6.9) o `u Ncomest la taille (nombre de pixels) de la zone commune entre la forˆet m´elang´ee r´eelle

et celle d´etect´ee, Nv, la taille de la forˆet m´elang´ee selon la v´erit´e de terrain, et Nc, la taille

de la forˆet m´elang´ee obtenue. tRest ´egale `a 1 lorsque la zone d´etect´ee apr`es regroupement

des r´egions est identique `a celle de la v´erit´e de terrain, et nulle lorsqu’il n’y a aucune intersection. La grandeur Ncom

Nv est appel´ee rappel, tandis que

Ncom

Nc est la pr´ecision. Une

mesure populaire qui combine la pr´ecision et le rappel est leur pond´eration, nomm´ee F-score :

F − score = 2.precision × rappel

precision + rappel (6.10)

La table 6.1 montre les r´esultats obtenus pour les 5 r´egions. On note que la r´egion 1 est la mieux identifi´ee.

6.4. CONCLUSIONS 123

FIG. 6.9 – Exemple de zone d´etect´ee comme forˆet m´elang´ee (d´etour´ee en vert), par re-

groupement de r´egions ´el´ementaires. La zone d´etour´ee en blanc est la forˆet m´elang´ee correspondant `a la v´erit´e de terrain CLC. La r´egion initiale a ´et´e choisie manuellement.

Les fronti`eres des r´egions obtenues varient en fonction de la r´egion initiale choisie pour le parcours du graphe. Lorsque la r´egion est choisie de mani`ere judicieuse, il est pos- sible d’obtenir une forˆet m´elang´ee plus proche de celle de CORINE. La figure 6.9 montre un exemple de forˆet m´elang´ee obtenue (en vert) tandis que dans la v´erit´e de terrain, la forˆet m´elang´ee est la zone d´etour´ee en blanc. Dans ce cas, tRvaut 0.46 (au lieu de 0.23). Notons

que les contours des deux zones ne coincident toujours pas. Ceci peut ˆetre d ˆu au fait que la classification de CORINE est manuelle et peut ˆetre remise en cause.

En ce qui concerne les fausses alarmes, ces zones d´etect´ees comme ´etant des forˆets m´elang´ees satisfont les contraintes de CORINE. En effet, chacune de ces zones respecte le crit`ere de superficie minimale et r´epond `a la d´efinition d’une forˆet m´elang´ee donn´ee par la nomenclature. Dans la figure 6.8, les r´egions rouges correspondent aux forˆets de feuillus, tandis que les r´egions sombres sont des forˆets de conif`eres. La plupart des forˆets m´elang´ees d´etect´ees contiennent en majorit´e ces deux classes. Ceci nous am`ene `a penser qu’il existe des informations utilis´ees par la classification de CORINE dont nous n’avons pas tenu compte. Ces informations pourraient ˆetre pr´esentes dans l’image, mais surtout ext´erieures `a l’image satellitaire, d’o `u l’importance des donn´ees exog`enes dans la consti- tution des cartes CORINE Land Cover.

6.4

Conclusions

Dans ce chapitre, nous illustrons le principe de compositionnalit´e s´emantique que nous avons appliqu´e aux images. En effet, l’importance de l’utilisation des relations spa- tiales entre les mots visuels pour identifier des classes de m´elange est mise en ´evidence. Nous avons tout d’abord insist´e sur le choix du mode de repr´esentation de ces relations spatiales, important pour exploiter efficacement les liens d’adjacence entre les mots vi- suels. Deux approches ont ´et´e pr´esent´ees, faisant usage des graphes pour manipuler les relations d’adjacence : une approche non supervis´ee nous permettant de d´eterminer les

structures dans l’image, exemplifi´ee par la d´etection des bˆatiments et leurs ombres dans les images satellitaires, et une approche supervis´ee d’apprentissage des relations spa- tiales, test´ee sur la classe des forˆets m´elang´ees de CORINE Land Cover. Dans le chapitre suivant, nous nous attachons `a r´esoudre notre probl`eme `a l’aide de mod`eles statistiques d’analyse textuelle, qui ne prennent pas en compte les relations spatiales entre les mots visuels.

125

Chapitre 7

Annotation s´emantique des images

satellitaires bas´ee sur le mod`ele LDA

Dans cette partie, nous mettons en oeuvre un apprentissage s´emantique supervis´e bas´e sur un mod`ele faisant abstraction des relations d’adjacence entre les mots visuels, afin d’attribuer aux r´egions de l’image, une s´emantique d´ependant du contexte de l’utili- sateur. Nous l’illustrons via une application tr`es pr´esente dans la litt´erature, et qui est en- core l’objet de plusieurs travaux (voir section 5.4.1) : l’annotation s´emantique d’images. Diff´erentes approches ont ´et´e propos´ees pour annoter les images naturelles. Ici, nous nous int´eressons aux images satellitaires et proposons d’utiliser une m´ethode d’analyse de textes : l’Allocation Dirichlet Latente (Latent Dirichlet Allocation ou LDA) [Blei et al., 2003b] pour l’annotation de grandes images satellitaires, en utilisant des concepts s´eman- tiques d´efinis par l’utilisateur. L’approche pr´esent´ee ici combine une ´etape de classifica- tion supervis´ee d’imagettes extraites de la grande image `a annoter, et une phase de prise en compte de l’information spatiale entre ces imagettes.

7.1

Approche d’annotation s´emantique de grandes images

Dans cette partie, nous d´ecrivons notre approche d’annotation s´emantique de gran- des images satellitaires, exploitant le mod`ele LDA.

Soient S concepts s´emantiques d´efinis par l’utilisateur. Pour chaque concept, ce der- nier fournit un ensemble d’images exemples qui seront utilis´ees pour l’apprentissage. Soit une grande image I `a annoter avec les S concepts s´emantiques, nous appelerons ensemble de test, la collection des imagettes Id, de taille ´egale, telles que :

[

d

Id=I (7.1)

L’annotation de la grande image I sera consid´er´ee pour nous, comme la classification supervis´ee des imagettes Id en S classes Cs, s ∈ {1, . . . , S}correspondant aux concepts

s´emantiques d´efinis par l’utilisateur. La classification supervis´ee est bas´ee sur le mod`ele LDA propos´e dans [Blei et al., 2003b]. Par d´efinition, l’Allocation Dirichlet Latente est un mod`ele g´en´eratif probabiliste pour les collections de donn´ees discr`etes telles que les corpus de texte. Comme d´etaill´e dans la section 5.4.2.2, l’id´ee de base de ce mod`ele hi´erarchique `a trois niveaux, bas´e sur une repr´esentation en sac-de-mots, est que les docu- ments d’un corpus sont repr´esent´es comme des m´elanges sur des topics latents, chaque

FIG. 7.1 – Les diff´erentes ´etapes de notre algorithme d’annotation s´emantique d’images de grande taille.

topic ´etant caract´eris´e par une distribution sur des mots. Dans la section 5.4.2.3, nous avons d´etaill´e le processus d’utilisation du LDA pour la mod´elisation des images. Notre tˆache de classification inclut donc le calcul des mots visuels pour la repr´esentation des images, la g´en´eration du mod`ele pour chaque classe lors de l’apprentissage, et l’applica- tion sur les images de l’ensemble de test.

Par ailleurs, l’ordre des images dans une collection ´etant n´eglig´e dans le mod`ele LDA, nous introduisons l’information spatiale entre les imagettes de l’ensemble de test, de mani`ere `a prendre en compte les relations entre des imagettes voisines dans la grande image. Nous montrerons par la suite, `a l’aide d’exp´erimentations effectu´ees sur une s´erie d’images, que cette op´eration am´eliore la tˆache d’annotation de mani`ere notable.

Les diff´erentes ´etapes de notre approche d’annotation sont r´ecapitul´ees dans la figure