• Aucun résultat trouvé

L’analyse que nous avons men´ee ainsi que les r´esultats obtenus ouvrent un certain nombre de perspectives pour des travaux futurs, `a court et `a long terme.

Robustesse de l’approche d’annotation propos´ee A court terme, des traitements sup- pl´ementaires peuvent ˆetre mis en oeuvre, afin d’am´eliorer la robustesse de la m´ethode d’annotation propos´ee. Par exemple, une classe de rejet pourrait ˆetre introduite, pour les cas o `u les classes s´emantiques d´efinies par l’utilisateur ne couvrent pas la totalit´e de l’image, ou alors lorsqu’il existe une ambigu¨ıt´e sur la classe d’un ´echantillon de test

8.2. PERSPECTIVES 157

et qu’aucune d´ecision ne peut ˆetre prise de mani`ere s ˆure. Cette classe de rejet peut ˆetre d´efinie en pr´ecisant un seuil sur la probabilit´e d’appartenance d’un ´echantillon `a chacune des autres classes. Si aucune des probabilit´es n’est sup´erieure `a ce seuil, l’´echantillon est alors attribu´e `a la classe de rejet. Ce seuil peut ˆetre d´etermin´e de mani`ere automatique, ou alors fix´e par un expert de mani`ere `a ajuster les r´esultats.

Par ailleurs, la m´ethode d’annotation s´emantique que nous avons propos´ee a ´et´e ´evalu´ee sur des images Quickbird `a haute et tr`es haute r´esolution. Il pourrait ´egalement ˆetre int´eressant de l’´evaluer sur des images `a plus faible r´esolution, afin de juger de la robustesse de la m´ethode `a la r´esolution des images.

Types de mots et de documents Dans nos travaux, nous avons plus souvent consid´er´e qu’un mot est une fenˆetre de pixels. Nous avons ´egalement men´e quelques exp´erimenta- tions avec des mots comme des segments de l’image, sans r´esultats concluants `a cause de la complexit´e des traitements `a effectuer. Une alternative pourrait ˆetre de consid´erer qu’un document est une r´egion de l’image, obtenue apr`es une segmentation grossi`ere. Dans ce cas, les mots seraient des pixels de la r´egion. La proc´edure serait alors exacte- ment la mˆeme, sauf que on classifierait plut ˆot les r´egions de l’image. Pour essayer de pallier l’effet de la segmentation grossi`ere, on pourrait exploiter la multir´esolution, ou alors effectuer plusieurs segmentations avec des algorithmes diff´erents, et/ou en faisant varier leurs param`etres, et classifier s´epar´ement chaque image segment´ee. Puis, afin de d´eterminer la meilleure annotation de l’image, une sorte de consensus, tenant compte de l’appartenance d’un pixel `a une mˆeme classe dans les diff´erentes classifications, pourrait ˆetre b´en´efique.

Introduction de la connaissance externe La difficult´e d’apprendre les cartes CORINE Land Cover nous conduit `a nous interroger sur l’introduction de la connaissance ex- terne pour am´eliorer le traitement de la s´emantique. En effet dans notre ´etude, nous avons pu estimer la quantit´e d’information que la seule image satellitaire apporte `a la constitution de la carte CLC. Nous avons ainsi constat´e l’importance des informations exog`enes (cartes topographiques IGN, photographies a´eriennes, etc) utilis´ees par le pho- tointerpr`ete, qui pourraient sensiblement accroˆıtre la qualit´e de l’identification des classes de m´elange en particulier. Mais alors, se pose le probl`eme d´elicat de la repr´esentation de cette connaissance externe. Avec une carte topographique par exemple, une approche simple pourrait consister `a utiliser la l´egende associ´ee `a la carte, qui est donc annot´ee. Cette derni`ere est fusionn´ee `a la carte CLC, en gardant `a chaque fois la plus petite re- gion. Chaque r´egion de la nouvelle carte est associ´ee `a un couple constitu´e de sa classe dans la carte topographique et sa classe dans CLC. Les diff´erents couples constituant un ensemble de sous-classes, l’apprentissage est effectu´e pour chaque couple possible, `a partir de zones d’apprentissage de l’image satellitaire. Chaque r´egion de l’image de test sera donc attribu´ee `a une sous-classe, et r´ecup`erera la classe CLC correspondante. Cette d´emarche, qui n’est pas optimale, pourrait permettre de constituer une hi´erarchie entre les classes CLC et celles de la carte topographique.

Combinaison de mod`eles Nous avons montr´e dans le dernier chapitre de ce docu- ment, que pour l’annotation des images satellitaires, certains mod`eles d´ecrivaient mieux certaines classes. Une direction de recherche, que nous n’avons pu explorer dans le temps imparti, est de combiner l’utilisation de ces diff´erents mod`eles afin d’am´eliorer l’identifi-

cation de chaque classe. Une ´etape de s´election de mod`eles serait alors n´ecessaire, pour choisir pour chaque classe, le mod`ele qui la repr´esente le mieux. Il faudrait tenir compte des types de donn´ees sur lesquelles s’appliquent les mod`eles (pixels, documents, etc), mais ´egalement du co ˆut, en termes de temps de calcul, que pourrait n´ecessiter une telle op´eration d’optimisation.

Relations spatiales En ce qui concerne les relations spatiales, dans cette th`ese nous nous sommes restreints aux relations d’adjacence entre les mots visuels, mais l’impor- tance des autres types de relations n’est pas `a d´emontrer. En effet, afin de reconnaˆıtre les structures dans les images, il serait ´egalement possible d’utiliser les relations spatiales m´etriques pour tenir compte de la distance s´eparant les r´egions d’int´erˆet, ou les relations directionnelles qui font appel `a une direction de l’espace ou du plan (`a gauche de, `a droite de, etc). Pour ces relations qui sont souvent impr´ecises, il est plus int´eressant d’utiliser des repr´esentations floues, en introduisant un degr´e de satisfaction de la relation entre les deux objets. Ces relations floues peuvent ˆetre mod´elis´ees par exemple `a partir d’ou- tils de morphologie math´ematique floue. Ceci rentre dans le domaine du raisonnement spatial. Comme dans le cas de l’adjacence, le degr´e de satisfaction de la relation m´etrique ou de direction entre deux objets de l’image pourrait ˆetre stock´e dans une matrice non sym´etrique, ou une liste. Cette information pourrait faire ´emerger une certaine r´egularit´e dans l’image, en d´etectant par exemple des objets ayant la mˆeme orientation, ou des couples d’objets ´equidistants. On obtiendrait ainsi des indications sur la localisation de certaines structures dans l’image.

Par ailleurs, nous ne nous sommes int´eress´es qu’aux relations binaires entre les r´e- gions. Les relations d’ordre sup´erieur (ternaires par exemple), pourraient acc´el´erer le processus d’identification des structures de l’image : par exemple, une “rue” est entre deux “pˆat´es de maisons”, moyennant cependant un algorithme plus complexe.

159

161

Annexe A

CORINE Land Cover

CORINE Land Cover est un inventaire biophysique de l’occupation des terres, four- nissant une information g´eographique de r´ef´erence pour 29 Etats europ´eens et pour les bandes c ˆoti`eres du Maroc et de la Tunisie. Cette description repose sur une taxinomie pr´ecise afin d’assurer la consistence des r´esultats produits par les photointerpr`etes. Cette base de donn´ees g´eographiques est produite, g´er´ee et utilis´ee `a l’aide d’un Syst`eme d’In- formation G´eographique (SIG).