D´ etection de regards de visite sur des images ` a tr` es haute r´ esolution spatiale par une m´ ethode
d’apprentissage
Benjamin Commandr´ e ∗1,2 , Driss En-Nejjary 1,3 , Lionel Pibre 3,4 , Marc Chaumont 3,5 , G´ erard Subsol 3 , Laurent Deruelle 4 , Mustapha Derras 4 , Carole Delenne ∗1,2 , and Nan´ ee
Chahinian ∗1
1 HydroSciences Montpellier (HSM) – Univ. Montpellier, CNRS, Institut de recherche pour le d´ eveloppement [IRD] – France
2 Littoral, Environnement : M´ ethodes et Outils Num´ eriques (LEMON - INRIA) – CRISAM - Inria Sophia Antipolis - M´ editerran´ ee – France
3 Laboratoire d´Informatique de Robotique et de Micro´ electronique de Montpellier (LIRMM) – Universit´ e de Montpellier : UMR5506, Centre National de la Recherche Scientifique : UMR5506 – 161
rue Ada - 34095 Montpellier, France
4 Berger-Levrault – Berger-Levrault – 104 avenue du Pr´ esident Kennedy 75016 Paris, France
5 Universit´ e de Nˆımes (UNIMES) – Universit´ e de Nˆımes – Rue du Docteur Georges Salan 30021 Nˆımes Cedex 1, France
R´ esum´ e
L’utilisation de la t´ el´ ed´ etection en milieux urbains s’est focalis´ ee dans un premier temps sur l’identification et l’estimation des surfaces urbaines (Weng, 2011), la mise en ´ evidence de l’expansion urbaine (Xian et Crane, 2005), la quantification du microclimat (Arthur- Harthnaft et al., 2001) ou de l’ˆılot de chaleur urbain (Dousset et Gourmelon, 2004; Gallo et al., 1994).En combinant les approches multi-spectrales et multi-temporelles, des suivis ont ainsi pu ˆ etre faits sur l’´ evolution de ces ph´ enom` enes. A mesure que la r´ esolution spatiale des images s’am´ eliorait, l’identification d’objets pr´ ecis du paysage urbain devenait possi- ble (Bhaskaran et al., 2010). Ainsi, depuis quelques ann´ ees, les images sont utilis´ ees pour d´ etecter les r´ eseaux routiers (P´ eteri et Ranchin, 2006, Stoica et al. 2004), la v´ eg´ etation urbaine (H´’ofle, 2012), les caract´ eristiques du bˆ ati (Hermosilia et al., 2011; Freire et al., 2010; Lhomme et al., 2004). En comparaison, la localisation d’objets de plus petite di- mension (inf´ erieure ` a un immeuble) reste relativement peu ´ etudi´ ee et pose le probl` eme de l’identification d’objets dans un environnement variable, sur fond non-uniforme et souvent peu contrast´ e.
Dans le cadre du projet Cart’eaux*, nous proposons une m´ ethode de d´ etection de regards de visite (plaques d’´ egout) sur des images ` a tr` es haute r´ esolution spatiale. Cette m´ ethode par apprentissage consiste ` a appliquer un r´ eseau de neurones ` a convolution, AlexNet, sur des orthophotos ` a tr` es haute r´ esolution spatiale prises dans le visible.
Le r´ eseau est entrain´ e sur une image ` a 5cm de r´ esolution de la ville de Prades-Le-Lez dans l’H´ erault. Afin de pallier le manque de donn´ ees – seulement 605 plaques d’´ egout pr´ esentes
∗