• Aucun résultat trouvé

Variables explicatives du nombre de cas par zone de santé

La première étape a consisté à faire le choix de la variable épidémique à considérer parmi toutes celles qui avaient été testées : taux d’attaque hebdomadaire maximal, taux d’attaque hebdomadaire moyen, la variance du taux d’attaque, le pourcentage de semaines épidémiques (ayant un nombre de cas rapportés de choléra supérieur ou égal à 1, le nombre de périodes de réactivation des épisodes épidémiques et le nombre brut de cas. Une analyse en composantes principales (ACP) a été effectuée, à titre exploratoire, à partir du tableau comportant des variables épidémiques et des variables environnementales de chacune des zones de santé des espaces géographiques étudiés afin de rechercher une éventuelle corrélation entre les variables qualifiant les épidémies afin d’éliminer les variables redondantes pour les analyses futures (92).

Les relations entre le nombre de cas de choléra dans les zones de santé et leurs caractéristiques géographiques ont été modélisées en utilisant un Modèle Linéaire Généralisé (GLM). Un modèle prédictif du choléra a été construit à partir des cas de choléra rapportés dans les zones de santé (composant les deux blocs géographiques) et des données environnementales des zones de ces blocs. Pour ce faire, les relations statistiques ont été étudiées reliant le nombre de cas de choléra dans chaque zone de santé et les variables géographiques et environnementales suivantes : superficie, population, situation (en bord de lac ou non) et présence/absence de ville de plus de 100 000 habitants, de port de commerce et d’axe routier majeur. Trois modèles ont été comparés afin de rechercher le plus adapté à nos données: un modèle de Poisson (mod0) et deux types de modèles négatifs binomiaux (93-95).

Ainsi,

- en considérant qu’on veut prédire un taux, c'est-à-dire une valeur qui va de 0 à 1, il pouvait être possible d’utiliser une fonction de lien binomiale,

- en considérant qu’on veut prédire un nombre de cas à partir d’un nombre qui est l’effectif d’une population, on aurait pu utiliser une fonction de lien dont l’erreur de distribution est supposée être poissonienne,

- en considérant que la variation est sur-dispersée, et avec les mêmes intentions que ci- dessus, on aurait alors préféré une fonction de lien binomiale négative (qui inclut un paramètre relatif à la dispersion) plutôt que poissonien,

- enfin la binomiale négative n’ayant pu être appliquée pour des raisons diverses (ex pas de convergence), elle aurait pu être remplacée d’une certaine manière par une distribution quasi-poissonnienne, qui ne présuppose pas de connaître pleinement le type d’erreur de distribution de la variable réponse.

Après avoir testé tous ces modèles, les relations entre le nombre de cas de choléra dans les zones de santé et les variables géographiques ont finalement été modélisées à

l'aide d'un modèle binomial négatif de type II (fonction logarithmique pour à la fois la moyenne et la distribution des paramètres):

f(y | µ, σ)= Γ

(

y+

(

µ σ

))

σ y

(

Γ

(

µ σ

)

Γ

(

y+1

)(

1+σ

)

(y+(µ σ))

)

f(y | µ, σ)= Γ

(

y+

(

µ σ

))

σ y

(

Γ

(

µ σ

)

Γ

(

y+1

)(

1+σ

)

(y+(µ σ))

)

Où: µ est la moyenne, σ est le paramètre de dispersion et

((

11+ σ+ σ

))

µµ est la déviation

standard.

Chaque variable a été sélectionnée suivant une démarche pas à pas et les meilleurs modèles ont été comparés en fonction des critères d’Akaike en se référant aux ouvrages de Venables et Ripley [81] et de Rigby et coll. (94). Un modèle final a ainsi été établi ne gardant que les variables explicatives dont le coefficient diffère significativement de zéro au risque α de 0,05.

Une éventuelle structuration spatiale des résidus aurait pu biaiser les résultats obtenus (les points de données seraient alors non-indépendants). La structuration spatiale des résidus a été explorée en attribuant à chaque cas de choléra, le centroïde de la zone de santé où il a été notifié. Un variogramme empirique a été calculé sur cette base. Ensuite, une enveloppe de variogramme a été calculée en exécutant 1000 permutations des valeurs résiduelles sur les centroïdes. Les limites d'enveloppe ont été alors comparées au variogramme empirique, qui s’est alors avéré être inclus dans l’enveloppe. Cette analyse indique que l’hypothèse nulle d’une distribution spatiale aléatoire des résidus ne peut-être écartée.

Validation de la relation entre le choléra et les variables environnementales.

L’étude des données de 2002-2005 sur le bloc géographique « Katanga - Kasaï Oriental » a permis d’obtenir des valeurs des Odds ratios correspondant au poids de chaque variable environnementale. Ces valeurs ont été utilisées pour calculer un score de risque qui a été attribué à chaque zone de santé et positionné sur une carte. Cette carte des valeurs des scores a ensuite pu être comparée à la carte des cas de choléra obtenus sur la période 2006-2007, permettant d’établir jusqu’à quel point, les zones identifiées comme à risque sur la base des données 2002-2005 avaient bien été les plus touchées pendant les deux années suivantes. Une deuxième validation a consisté à rechercher si les variables environnementales mises en évidence par les modélisations effectuées au Katanga et au Kasaï, étaient retrouvées sur les provinces voisines du Kivu.

Recherche des zones de rétraction et/ ou de zones sanctuaires du choléra

Il a été considéré comme zone de rétraction, tout espace géographique délimité sur le plan administratif ou sanitaire, qui se caractérise par la présence et la persistance de cas de choléra après une phase de flambée épidémique, alors que d’autres zones sont depuis plusieurs semaines revenues à une notification de zéro cas. Introduire sous forme d’hypothèse

Entre 2000 à 2007, une recherche des zones où persistait le choléra a été menée d’abord dans la région Katanga-Kasaï Oriental, puis dans la région des deux provinces du

rétraction, c'est-à-dire des périodes de quatre semaines consécutives où le nombre de cas de choléra a été le plus faible (considérée comme les périodes où la probabilité attendue d’extinction du choléra est la plus forte). Trois périodes de rétraction ont été identifiées sur les séries temporelles des cas de choléra des blocs géographiques « Katanga-Kasaï Oriental », puis « Nord-Kivu-Sud-Kivu ». Pour chacune des périodes de rétraction identifiées, nous avons ensuite reportés sur une carte les zones de santé où le choléra était encore présent.

Les calculs et les représentations graphiques ont été faits à l’aide d’ArcGIS 8.3®, de R 7.2 (93) et des progiciels complémentaires suivants : MASS[9], maptools (96), sp(93), GAMLSS (94) et GeoR (95). (Les mêmes outils ont été utilisés pour le reste du travail pour des opérations similaires)

Etude de la dynamique temporelle

Recherche du caractère saisonnier

Pour cette étude, il n’a été considéré que les séries temporelles longues d’au moins quatre ans. Ainsi, cette étude n’a concerné que des zones lacustres. Cinq zones géographiques ont été retenues pour l’étude du caractère saisonnier du choléra en zones lacustres. La zone 1 : « Nord-Kivu », représentée par les zones de Goma et de Kirotshe, la zone 2 : « Nord du Sud-Kivu », représentée par les zones de Bukavu et Katana, la zone 3 : « Sud du Sud-Kivu » représentée par Uvira et Fizi, la zone 4 « Kalemie » représenté par les zones de Kalemie et Nyemba, puis la zone 5 : « lac Upemba », représentée par les zones de Bukama et Kinkondja. Ces zones ont été regroupées en fonction de leur proximité géographique et du caractère synchrone de la dynamique temporelle des cas de choléra qui y sont rapportés.

Analyse de la cinétique de l’épidémie,

Décomposition du signal : saisonnalité, tendance et résidus

Cette analyse a été effectuée sur des séries hebdomadaires de six ans (pour le Katanga/Kasaï Oriental) et de huit ans (pour le Nord-Kivu/Sud-Kivu). Cette analyse a permis de tester la saisonnalité de l’incidence du choléra déjà largement évoquée pour le choléra en zone côtière (97).

Les analyses effectuées dans cette approche ont consisté en :

- l’extraction d’une tendance supposée périodique (il faut vérifier ensuite qu’elle est en phase avec un développement saisonnier d’un point de vue climatologique) ; - l’extraction d’une tendance non périodique (par exemple la diminution du nombre de cas au cours des années) ;

- la recherche dans les résidus d’une éventuelle auto-corrélation temporelle

qui pourrait biaiser l’estimation de la moyenne résiduelle.

Un modèle autorégressif (AR) a ensuite été utilisé pour établir si les résidus satisfaisaient bien l’hypothèse de stationnarité, à savoir l’absence de tendance résiduelle.

La sélection entre les différents modèles (en procédant avec un ordre 0, 1, 2, 3, et c.) a été effectuée selon les critères d’Akaike. Ces trois étapes permettent d’explorer ensuite les éventuelles corrélations entre séries, indépendamment des autres composantes, notamment périodiques/saisonnières. En effet, la corrélation de deux séries temporelles peut être due à une cause externe qui les détermine simultanément (ex. : effet périodique de la saison à l’échelle régionale, qui pourrait expliquer à lui seul la corrélation de zones d’étude à une échelle infra-régionale), et l’extraction de la composante périodique saisonnière permet d’identifier d’éventuelles causes de corrélations non saisonnières.

Les séries temporelles ont été analysées, à la recherche d’un déterminisme saisonnier, en utilisant une méthode consistant à décomposer les séries en une tendance générale, une composante saisonnière à l’aide du logiciel MASS (93), d’après les indications de Cleveland et al. (98). Cleveland et al. (1990) in Venables & Ripley (2002) (93) ont proposé un algorithme de calcul qui est résumé ainsi: « the periodic component is found by taking the mean of each time unit (week 1, week 2…). The seasonal values are removed, and the remainder loess smoothed to find the trend. The overall level is removed from the seasonal component and added to the trend component. This process is iterated a few times. The 'remainder' component is the residual from the seasonal plus trend fit. ». Enfin l’autocorrélation résiduelle dans les résidus a été analysée en utilisant les méthodes autorégressives (AR) ou de moyenne mobile (MA) ou mixte (ARMA).

Les calculs et les graphiques ont été effectués avec les logiciels R 2.4 (R Development Core Team, 2006) (99), R packages MASS version 7.2-30 (93), maptools (Lewin-Koh and Bivand, 2006) (96), sp (Pebesma and Bivand, 2005) (100), geoR (Ribeiro and Diggle, 2001) (101) et ArcGIS 8.3.