• Aucun résultat trouvé

3 Validation expérimentale de la méthode ARC

3. VALIDATION EXPÉRIMENTALE DE LA MÉTHODE ARC 93

2002a). La segmentation est transformée en graphe, la végétation et les routes sont extraites. La

végétation est extraite à l’aide de l’algorithme présenté dans le chapitre 4, les routes sont extraites par comparaison aux routes présentes dans le système d’information géographique OpenStreet-Map2.

Nous choisissons de tester notre méthode sur trois images. La première est une image Quick-Bird d’une résolution de 0,7 mètres, acquise en 2002, représentant un quartier à Saint-Orens, dans la banlieue de Toulouse. Les deux autres sont des images Pleiades d’une résolution de 0,5 mètres, acquises en 2012, représentant deux quartiers de Strasbourg (le quartier des Quinze et une zone résidentielle de Cronenbourg). L’ensemble des jeux de données est présenté en détail dans l’annexe A.

3.2 Expérimentations préliminaires sur une image QuickBird

Dans un premier temps nous cherchons à vérifier l’efficacité de notre méthode sur une image à très haute résolution spatiale QuickBird d’une résolution de 0.7 mètres.

Une fois l’image segmentée et transformée en graphe, le processus d’apprentissage prend place : les exemples sont extraits, les règles sont apprises et les concepts correspondants sont générés puis utilisés pour étiqueter les objets. La figure 5.8(a) montre que deux concepts ont été appris (en jaune et bleu sur l’image). La végétation est représentée en vert, les routes en gris. Enfin, la règle de composition est apprise et le concept composé correspondant est généré. Le résultat est présenté dans la figure 5.8(b). Les pavillons sont extraits avec une précision de 0.82 après comparaison avec une vérité terrain fournie par l’expert géographe. Nous pouvons voir que certains pavillons pourtant évident pour un oeil humain n’ont pas été identifiés (par exemple les pavillons notés a, b et c sur l’image 5.8(b)). Après observation il apparaît que l’objet composé correspondant au pavillon a est plus grand que les exemples fournis par l’expert et donc ne satisfait pas la contrainte de taille de la règle apprise, les segments composant le pavillon b sont mal identifiés dans la phase précédente, l’objet composé correspondant au pavillon c ne satisfait pas les contraintes de composition de la règle apprise. Il s’avère que la nature des pavillons n’est pas la même dans l’image : les îlots sont découpés différemment et contiennent des pavillons de différentes formes et tailles. Un biais est induit par le fait que les exemples ne sont pas représentatifs de l’ensemble des types de pavillons présents sur cette image. Ceci montre que le choix et la qualité des exemples est cruciale. Ces conclusions sont à l’origine de l’introduction du paramètre d’affinage dans la génération de la règle de composition.

Les résultats montrent un certain nombre de faux positifs que nous pouvons qualifier de valeurs aberrantes (objets trop petits, ou trop allongés). En effet il existe un biais dans l’extraction des segments correspondant aux exemples. Cette expérience a permis d’identifier ce biais et de le corriger pour éliminer ce type de valeurs aberrantes dans les expériences futures (voir algorithme 6).

Les résultats présentés dans la figure 5.8 ont été obtenus avec les meilleurs paramètres (pour l’algorithme de segmentation et la méthode ARC) identifiés par une analyse empirique. Nous évaluerons dans le chapitre 7 l’influence des différents paramètres de la méthode ARC sur la

segmentation de travail du LIVE (voir annexe B).

3.3 Expérimentations sur des images Pléiades

Les résultats des deux expériences suivantes sont présentés dans le tableau 5.5 et dans la figure 5.9.

(a) En bleu et jaune, les deux concepts appris par la méthode. La végétation en vert, les routes en gris

(b) Les pavillons extraits

Figure 5.8 – Application de la méthode sur une image QuickBird ( c DigitalGlobe 2001). À gauche le résultat de la phase d’apprentissage : deux concepts sont appris (en bleu et jaune sur l’image). En vert la végétation, en gris les routes. À droite, le résultat de l’extraction des objets composés pavillon.

Cronenbourg. Cette première expérience sur une image Pleiades permet de tester la

porta-bilité de notre méthode. En effet cette petite image représente un quartier résidentiel contenant des pavillons homogènes. Ces pavillons sont plus faciles à identifier. Le résultat de l’apprentissage est donné dans la figure 5.9(a) et évalué dans le tableau 5.5. Nous pouvons voir que les pavillons sont extraits avec une F-mesure de 0.746 après comparaison avec la vérité terrain, ce qui est un bon résultat. Le taux de faux positifs est très faible : seul deux pavillons sont extraits en dehors des deux îlots centraux. La précision et le rappel inférieur à 0.8 sont expliqués par le fait que des segments sont incorrectement étiquetés composant de pavillon (allée de garage, terrasse, à cause de leur signature spectrale) et ainsi l’extraction des objets composés est partiellement biaisée.

Quartier des Quinze. Pour cette seconde expérience, la scène est plus grande et plus variée.

Le paysage est plus complexe : les pavillons sont différents en taille et signature spectrale. Les îlots sont plus complexes : grands jardins, présence de piscines ou de terrasses par exemple. Par conséquent, cette expérience nous permet de tester l’efficacité de notre méthode en situation réelle. La figure 5.9(b) montre les pavillons extraits par la règle de composition apprise par notre méthode et les résultats sont évalués dans le tableau 5.5. Les pavillons sont extraits avec une F-mesure de 0.572. Ce chiffre est expliqué par le grand nombre de faux positifs (pavillons reconnus comme tel en dehors de tout îlot résidentiel pour la plupart) et donc par la faible précision. Dans l’ensemble les pavillons appartenant aux îlots résidentiels sont bien reconnus, malgré le biais identifié dans l’expérience sur Cronenbourg (composant de pavillon mal identifié).

3. VALIDATION EXPÉRIMENTALE DE LA MÉTHODE ARC 95 Précision Rappel F-Mesure Indice de Jaccard

Cronenbourg 0.733 0.760 0.746 0.595 Quinze 0.519 0.636 0.572 0.400 Table5.5 – Évaluation des résultats sur les images Pleiades.

(a) Cronenbourg (b) Quartier des Quinze

Figure5.9 – Résultats sur les deux images Pleiades. Les résultats sur Cronenbourg sont bons, mais la précision est faible pour le quartier des Quinze. Ceci s’explique par le grand nombre de faux positifs en dehors de tout îlot résidentiel. En rouge les pavillons extraits. En vert et noir sur l’image de Cronenbourg, la végétation et la route.

Les résultats présentés dans cette section montrent que la méthode proposée permet d’ap-prendre une règle de composition capable de reconnaître des pavillons dans des images repré-sentant des paysages urbains. Les résultats sur Cronenbourg sont très encourageants, car ils illustrent le bon déroulement de l’algorithme dans un cas favorable (i.e. classe homogène, objets bien séparés). Cependant, les résultats ne sont pas aussi bons sur le quartier des Quinze. Dans une image hétérogène telle que celle-ci, le choix des exemples est crucial. L’expert doit être sûr que les exemples qu’il choisit soient représentatifs de l’ensemble de la classe pavillon. De plus, l’image étant plus grande elle contient d’autres objets qui ne sont ni pavillon, ni végétation, ni route. Ceci contribue à l’augmentation du nombre de faux positifs.

En regardant en détail les hiérarchies de concepts générées par la méthode ARC pour les différentes expériences, nous nous apercevons que les propriétés spatiales choisies n’ont pas eu d’impact lors de l’apprentissage automatique de règles : les relations d’adjacence ne permettent pas d’identifier différents types de composant de pavillon. L’ajout d’information contextuelle n’a pas été pertinent dans ces expériences. Ceci est illustré dans la figure 5.10.

objet concept 1 règle 1 concept 2 règle 2 (a) Exemple 1 objet concept 1 règle 1 concept 3 règle 3 concept 2 règle 2 concept 4 règle 3 (b) Exemple 2

Figure5.10 – Deux exemples de hiérarchies de concepts appris par la méthode ARC. Dans les deux cas, l’apprentissage sur les relations spatiales n’a pas permis de différencier les concepts appris dans l’étape précédente.

Conclusion et contributions

Dans ce chapitre nous avons proposé et présenté un algorithme d’apprentissage de règles de composition qui a pour but de faire le lien entre la représentation de la connaissance experte et l’image. La méthode ARC apprend automatiquement des règles floues à partir d’exemples et à l’aide de la méthode ARFCAH et génère des concepts qui permettent de classer les segments dans le but de pouvoir les regrouper à l’aide d’une règle de composition unique. La méthode a été testée sur une image QuickBird ainsi que sur deux extraits d’une image Pleiades.

Les résultats obtenus montrent que la méthode est capable d’apprendre une règle permettant l’extraction des pavillons dans des images représentant des quartiers résidentiels. Pour cela, la qualité des exemples est importante, et ceux-ci doivent être représentatifs de l’ensemble des instances de la classe à apprendre. Cependant malgré des exemples représentatifs, les F-mesures obtenues lors des différentes expériences ne sont pas à la hauteur de nos espérances. Beaucoup de faux positifs sont retenus (ceci est particulièrement vrai dans l’expérience sur le quartier des Quinze). Ceci s’explique par le fait que les propriétés spatiales ne sont pas retenues par l’algorithme ARFCAH car elles ne permettent pas d’identifier différents composants de la classe

pavillon. La relation d’adjacence seule ne permet pas d’apporter suffisamment d’information

contextuelle.

Pour remédier à cela et tirer pleinement parti de l’information contextuelle à différents ni-veaux, nous proposons d’utiliser la méthode ARC en tant que première étape d’une approche montante-descendante dans laquelle des objets composés de plus haut niveau sémantique sont extraits et permettent de mettre à jour la classification des objets aux niveaux inférieurs. Cette approche permettra de prendre en compte à la fois les relations spatiales et les relations de com-position entre objets de différents niveaux (i.e. îlot urbain). Cette méthode est présentée dans le chapitre 6.

Valorisation scientifique : Les travaux présentés dans ce chapitre ont donné lieu à une

publication lors de la conférence IGARSS 2013 (Belarte et al.,2013a) ainsi qu’une publication à l’atelier fouille de données complexes de la conférence EGC 2013 (Belarte et al.,2013b). Cette dernière a été suivie par une publication dans le numéro spécial de la revue francophone RNTI

3. VALIDATION EXPÉRIMENTALE DE LA MÉTHODE ARC 97