• Aucun résultat trouvé

Géomatique, environnement et épidémiologie

3. Maladie et vecteur

3.1. Lien entre environnement et maladie

Comme souligné précédemment, la géomatique ne peut s’appliquer à l’épidémiologie que si l’environnement a une influence sur la maladie étudiée. Ce lien entre environnement et maladie est beaucoup moins bien décrit du point de vue du processus physique impliqué que celui entre image et environnement (Curran et al., 2000). Dans le cas d’une maladie vectorielle, l’environnement peut exercer des influences à plusieurs niveaux : i) sur la biologie des hôtes, ii) sur celle des vecteurs et iii) sur celle du pathogène ainsi que iv) sur les interdépendances entre ces trois populations. L’effet sur les seuls vecteurs est lui-même très complexe, intégrant des effets sur l’habitat (présence, abondance, disponibilité des gîtes larvaires ou de repos) et sur le cycle de développement (durée du développement larvaire, survie des stades, fréquence de piqûre, dispersion). L’environnement a donc une forte influence sur la dynamique des populations de vecteurs. Étant donné la force de ce lien, on peut choisir de mettre en relation les données environnementales décrites à partir de l’image avec des données spatialisées concernant le vecteur. On peut aussi choisir d’utiliser des données spatialisées concernant la maladie même si, par essence, ce lien est moins direct que celui entre vecteur et environnement (Curran et al., 2000). Travailler sur la maladie offre deux avantages : i) les données sur la maladie sont souvent plus faciles à recueillir que celles sur les

vecteurs et ii) elles intègrent les facteurs liés à l’exposition des hôtes (Jackson et al., 2006 ; Linard et al., 2007). Si les deux approches ne sont pas exclusives, elles sont rarement mises en œuvre en parallèle par la même équipe pour étudier à la fois la maladie et les vecteurs.

3.2. Données épidémiologiques sur la maladie et les vecteurs

Dans une approche fondée sur la maladie, les données utilisées peuvent être le nombre de cas ou, de préférence, l’incidence* ou la prévalence*, qui ont l’avantage de tenir compte de la taille de la population totale et de l’hétérogénéité de sa distribution spatiale. Concernant les vecteurs, les données peuvent être analysées en termes de présence/absence ou d’abondance. Comme dans toute étude épidémiologique, la qualité de l’échantillonnage est fondamentale et le plan d’échantillonnage devra être adapté aux objectifs de l’étude (Toma et al., 2001). Lorsqu’il n’est pas possible de recueillir des données exhaustives, l’étude devra s’attacher à être la plus représentative possible de la population étudiée. Comme toujours, le nombre d’observations déterminera la puissance de l’étude (sa capacité à mettre en évidence un lien statistique) et les marges d’erreur associées aux résultats.

3.3. Localisation des données épidémiologiques

La localisation des données épidémiologique est l’un des points critiques du recueil des données. Il est généralement très difficile de connaître précisément le lieu d’exposition à cause, entre autres, de la mobilité des individus. Cette difficulté est d’autant plus marquée que l’échelle d’étude est fine. Ainsi, il est souvent nécessaire de poser l’hypothèse que les individus sont d’autant plus exposés qu’ils vivent à proximité d’un environnement à risque.

Les données épidémiologiques peuvent être recueillies de manière ponctuelle ou surfacique. L’entité ponctuelle la plus souvent choisie est le domicile (cas humain), l’élevage (cas animal) ou le lieu de capture (animal sauvage ou vecteur). Lors du recueil de données ponctuelles, l’étape de localisation des cas est souvent effectuée par GPS (global positioning system ou système de positionnement mondial) et peut s’avérer très coûteuse en temps. Pour des données surfaciques (définies pour un polygone), la localisation des hôtes est souvent définie selon des limites administratives, même si un zonage écologique est préférable. Grâce aux SIG, il est néanmoins possible de définir de nouvelles zones : par exemple Jackson (2006) définit des secteurs délimités par les routes car ces dernières peuvent constituer des barrières partielles pour les cervidés, hôtes de la maladie de Lyme.

Les données environnementales sont le plus souvent disponibles sous forme de surfaces, le pixel de l’image déterminant la taille de la plus petite surface pour laquelle l’information

pourra être disponible. La correspondance entre l’échelle de recueil des données épidémiologiques et l’échelle de caractérisation de l’environnement reste souvent délicate à gérer. De plus, comme indiqué dans la partie 1.3, un compromis entre résolutions spatiale et temporelle doit être établi. Ce compromis dépend essentiellement de l’objectif de l’étude, comme l’illustrent les exemples présentés dans la partie 4.2 de ce chapitre.

3.4. Modélisation du lien entre environnement et maladie/vecteur

Les données environnementales et épidémiologiques (concernant la maladie ou le vecteur) peuvent être mises en correspondance dans un SIG grâce à leurs attributs spatiaux. Pour lier ces données, deux types de modèles peuvent être utilisés : les modèles mécanistes et les modèles statistiques.

3.4.1. Les modèles mécanistes

Les modèles mécanistes, aussi appelés biologiques, supposent une connaissance a priori des lois déterminant le phénomène étudié, par exemple ici entre environnement et transmission d’une maladie. D’abord, ces liens sont transcrits sous forme d’équations mathématiques. Ensuite, des données expérimentales ou des observations de terrain peuvent être utilisées pour estimer certains paramètres du modèle ou pour tester la validité des lois établies. Enfin, ces modèles peuvent servir à quantifier l’effet de la variation de certains facteurs ou de mesures de contrôles sur le niveau de transmission. En épidémiologie, les modèles en compartiments sont très fréquemment utilisés. La population est scindée en différents groupes en fonction de leur statut sanitaire. Par exemple, les modèles SEIR répartissent les individus en quatre groupes : sensibles (S), en incubation (E), infectieux (I) et résistants (R). L’évolution au cours du temps du nombre d’individu dans chaque compartiment est définie par les paramètres de transition (temps de séjour dans chaque compartiment et coefficient de transmission du groupe infectieux). Classiquement, dans ces modèles, on quantifie le taux de transmission en utilisant le taux de reproduction de base, noté R0, qui correspond au nombre attendu de cas secondaires suite à l’introduction d’un cas

primaire dans une population vierge (Macdonald, 1952). Ainsi, ce taux R0 permet de

déterminer si les conditions permettant la survenue d’une épidémie dans une population sont réunies (R0 > 1) ou non (R0 < 1) (Diekmann & Heesterbeek, 2000).

En épidémiologie, les modèles mécanistes spatialisés restent rares (Tran, 2004). En effet, ces modèles mécanistes spatialisés exigent d’avoir une connaissance très fine des phénomènes étudiés (Rogers & Randolph, 2006), ce qui limite pour l’instant leur utilisation dans le

domaine de la télédétection appliquée à l’épidémiologie, le lien entre environnement et transmission des maladies n’étant encore que très imparfaitement compris ou quantifié.

3.4.2. Les modèles statistiques

Lorsque les connaissances biologiques sont incomplètes, les modèles statistiques sont préférables (Rogers & Randolph, 2006). Pour identifier les facteurs environnementaux liés à la maladie ou au vecteur, de nombreuses méthodes, très diverses, sont disponibles (Guisan & Zimmermann, 2000). On peut citer, entre autres, les régressions et modèles linéaires généralisés (GLM), les méthodes de classification, les réseaux neuronaux, les techniques d’ordination, les approches bayésiennes, les méthodes des enveloppes environnementales (Guisan & Zimmermann, 2000) ou les méthodes hybrides, faisant appel à des algorithmes génétiques (algorithme GARP : Genetic algorithm for rule-set production) pour généraliser des techniques plus classiques telles que les méthodes de modélisation de niche écologique (Stockwell & Peters, 1999).

La régression logistique est très souvent utilisée en épidémiologie et en écologie, notamment pour cartographier l’habitat potentiel d’une espèce (Rushton et al., 2004). Cette méthode permet d’établir une relation entre une variable (dite « expliquée ») qualitative à deux classes et des variables explicatives qualitatives ou quantitatives (Hosmer & Lemeshow, 2000). Ainsi, ces modèles permettent d’étudier la présence ou l’absence d’une espèce (hôte, vectrice ou réservoir) ou encore le statut malade ou sain d’un individu (Bouyer, 1991a, 1991b).

Il existe de nombreuses approches pour sélectionner les variables à intégrer dans un modèle statistique (ce qui suppose de choisir les variables, leur codage et la façon de tenir compte d’éventuelles interactions) (Bouyer et al., 1995) et ensuite pour choisir le « meilleur » modèle parmi une série de modèles candidats (Horne & Garton, 2006 ; Stephens et al., 2005). Ces approches peuvent êtres automatiques (telles que les procédures pas à pas) ou non, purement statistiques ou intégrer d’autres critères (par exemple on peut vouloir « forcer » une variable dans un modèle). Le plus souvent, on recherche le meilleur compromis entre l’exactitude (adéquation entre la réalité observée et les résultats prédits par le modèle) et la parcimonie (nombre minimal de variables dans le modèle décrivant correctement la relation). De nombreux indicateurs sont disponibles pour apprécier ces qualités (Rogers, 2006). Selon les objectifs de l’étude, d’autres critères peuvent être pris en compte comme la précision du modèle (évaluant l’étendue du domaine de variation de chaque variable, due à un manque de connaissance ou à une incertitude) ou sa capacité à être généralisé (c’est-à-dire à être appliqué

ailleurs ou dans d’autres situations). Enfin, les performances du modèle peuvent être évaluées sur le jeu de données qui a servi à sa construction (validation interne) ou sur un nouveau jeu de données (validation externe). Une validation systématique des modèles doit être encouragée. Une fois le modèle validé, l’inversion de la relation statistique observée permet d’obtenir des cartes de risque ou la prédiction de périodes à risque.