• Aucun résultat trouvé

Géomatique, environnement et épidémiologie

2.3. Identification de l’occupation du sol par classification des images

L’environnement peut aussi être caractérisé qualitativement en réalisant une carte d’occupation du sol à partir d’images satellitaires ou de photographies aériennes. Cette démarche est fondamentale en épidémiologie mais aussi dans de nombreux autres domaines d’application (agronomie, foresterie, urbanisme…) car elle permet de passer d’informations sur la luminance à des classes d’occupation du sol plus simples à conceptualiser. Dans son article de revue sur l’apport de la télédétection en santé, Beck et al. (2000) présentent de nombreux exemples de types d’occupation du sol (tels que les cultures, la forêt ou les surfaces en eau) pouvant être reliés à l’épidémiologie de maladies humaines.

Pour cartographier l’occupation du sol, différentes méthodes de classification peuvent être utilisées. Toutes les méthodes reposent sur un processus permettant de regrouper au sein de mêmes classes les pixels qui possèdent des caractéristiques semblables.

2.3.1. Interprétation visuelle versus analyse numérique

On peut tout d’abord distinguer l’interprétation visuelle des méthodes d’analyse numérique. L’interprétation visuelle nécessite une connaissance d’expert de la zone à cartographier. Même si l’exactitude des résultats peut être élevée, la méthode reste subjective, difficile à mettre en œuvre lorsqu’il y a beaucoup de données à traiter (un nombre important d’images par exemple), et ne permet pas d’assurer la standardisation dans le temps et dans l’espace (Curran et al., 2000). L’analyse numérique est plus objective et permet de mieux utiliser toutes les données disponibles : l’ensemble des canaux de l’image ainsi que les autres sources éventuellement disponibles (relatives au relief ou à la pédologie par exemple). C’est pourquoi l’analyse numérique est plus fréquemment mise en œuvre.

2.3.2. Classifications numériques : méthodes non supervisées ou supervisées

Parmi les méthodes de classification numérique, on différencie classiquement les classifications non supervisées, automatiques et ne nécessitant aucune connaissance a priori du terrain, et les classifications supervisées pour lesquelles l’utilisateur doit définir le nombre et la nature des classes qu’il souhaite obtenir et fournir des échantillons d’apprentissage (ou de référence).

2.3.2.1. Classifications non supervisées

Bien qu’il existe plusieurs types de classifications non supervisées, les algorithmes sur lesquelles elles se fondent sur le même principe : les pixels ayant des propriétés spectrales similaires sont agrégés pour former des classes. Le principal inconvénient de cette approche est la nécessité pour l’utilisateur de légender les classes après classification, lesquelles n’ont pas toujours de signification biologique. Néanmoins, ces méthodes peuvent être très rapides et utiles si l’élément recherché apparaît dans les groupes proposés (Girard & Girard, 1999). Elles peuvent notamment être utilisées en première étape d’une classification si l’on veut distinguer des éléments très différents tels que la mer de la terre.

2.3.2.2. Classifications supervisées

Les classifications supervisées sont généralement plus longues à réaliser car elles nécessitent un recueil préalable d’informations sur les échantillons d’apprentissage. Ces derniers servent de référence pour caractériser chaque classe ; le reste de l’image étant ensuite classé par analogie avec ces classes de référence. Ces méthodes peuvent être décomposées en trois étapes (Curran et al., 2000).

La première étape consiste à définir les classes d’occupation du sol que l’on souhaite cartographier et à relever sur le terrain des parcelles d’apprentissage pour chacune des classes. Au sein d’une classe, les parcelles doivent être les plus homogènes possibles. Chaque classe va ainsi être caractérisée par un ensemble de propriétés définies par les parcelles d’apprentissage. Ces propriétés sont le plus souvent relatives aux caractéristiques spectrales des parcelles, mais d’autres propriétés, comme la texture (distribution spatiale des niveaux de gris pouvant décrire des motifs répétés dans l’image tels que l’alternance de rangs de vignes ou l’aspect cotonneux de la canopée d’une forêt de feuillus), le contexte ou des informations auxiliaires (par exemple le relief), peuvent également être prises en compte. L’utilisation de données auxiliaires peut se révéler très utile et permet parfois de réduire le nombre de parcelles d’apprentissage nécessaire (Foody & Mathur, 2004).

Lors de la deuxième étape, un algorithme de classification permet de classer les autres pixels de l’image dans la classe à laquelle ils ressemblent le plus en fonction de leurs propriétés. Il existe plusieurs types de classifications selon l’algorithme utilisé. Les types les plus fréquents sont les classifications i) de type métrique par distance minimale aux centres des classes (le pixel est classé dans la classe dont il est le plus proche en terme de distance aux centres des classes de référence), ii) de type arithmétique par hypercube (en définissant des bornes ou des seuils pour définir les classes) et iii) de type statistique par maximum de

vraisemblance (pour chaque pixel est calculée la probabilité d’appartenance aux différentes classes ; si la probabilité maximale d’appartenance dépasse un seuil défini par l’utilisateur, le pixel sera classé dans la classe correspondante, sinon il ne sera pas classé). La méthode de classification par maximum de vraisemblance permet de minimiser les risques d’erreur en utilisant au mieux les probabilités d’appartenance (Girard & Girard, 1999). Beaucoup de travaux portent sur ces algorithmes de classification, notamment sur l’apport de la logique floue, qui permet d’estimer l’appartenance d’un pixel à une classe non plus de façon booléenne mais en attribuant une valeur comprise entre 0 et 1 en fonction d’une règle d’appartenance. Cette règle d’appartenance décrit la relation entre l’attribut permettant de classer le pixel dans une classe et l’appartenance de ce pixel à cette classe. Elle peut prendre différentes formes, par exemple une relation sous forme de singleton, de seuil ou de courbe linéaire, gaussienne, en V, ou en S. De nouvelles approches comme les réseaux neuronaux sont actuellement développées et devraient prochainement être implémentées dans les logiciels classiques de traitement d’image. Quels que soient la méthode ou l’algorithme choisis, le résultat de la deuxième étape de la classification est une carte d’occupation du sol.

La dernière étape consiste à évaluer la précision de la classification à partir d’un nouveau jeu de parcelles de référence, les parcelles de validation, qui n’ont pas servi à réaliser la classification. Une matrice de confusion est construite afin de comparer, pour les parcelles de validation, la classe prédite par l’algorithme à la classe réelle observée sur le terrain (Curran

et al., 2000). Si la classification comporte trop de confusions, l’ensemble de la procédure est

de nouveau mis en œuvre afin de l’améliorer.

Classiquement, les éléments classés sont les pixels (classification pixel à pixel ou CPP). Récemment, des méthodes de classification orientées objet (COO) ont été mises au point. Elles font appel à une première phase de segmentation de l’image en objets, puis les trois étapes de classification décrites ci-dessus (ou d’autres méthodes de classification) peuvent être appliquées non plus aux pixels mais aux objets segmentés. Les algorithmes de segmentation délimitent les objets en fonction de leur homogénéité. Le logiciel eCoginition® par exemple va agréger de proche en proche les pixels voisins jusqu’à ce qu’un seuil d’hétérogénéité soit franchi. À ce moment le processus s’interrompt et l’objet est délimité. Un des intérêts de ces approches est que les objets peuvent être décrits avec un plus vaste choix d’attributs que les pixels (Benz et al., 2004). Il est en effet possible d’intégrer dans les COO des informations sur la forme et la taille des objets ainsi qu’un nombre plus important que dans les CCP de variables relatives aux propriétés spectrales (moyenne ou écart-type de la luminance au sein d’un objet par exemple), texturales et topologiques (sur les objets voisins).