• Aucun résultat trouvé

Les statistiques spatiales en épidémiologie

La dimension spatiale est l’un des aspects importants en épidémiologie même si elle est souvent négligée. En effet, la dispersion dans l’espace de l’inoculum ou de la propagule est l’élément clef dans le développement d’une épidémie (Skelsey, 2008a; Gosme, 2007). Elle apporte des informations qui sont importantes à chaque étape d’une étude épidémiologique. Entre autres, elle permet d’estimer l’échelle spatiale pertinente à l’étude d’un pathosystème (Gosme, 2007). Il existe de nombreuses méthodes statistiques permettant d’analyser le développement des épidémies à la fois dans le temps et dans l’espace.

1.4.1. L’analyse spatiale en épidémiologie

La considération de la dimension spatiale d’une épidémie a commencé au cours des années 1980 où de nombreuses méthodes d’analyse de la répartition spatiale des individus ont été développées. L’analyse de la structure spatiale d’une maladie représente la description de la répartition des individus malades dans l’espace et son évolution dans le temps (Gosme, 2007, Carlo et Xavier, 2008). Différentes terminologies sont utilisées pour présenter la répartition dans l’espace des individus malades au sein d’une population de plantes hôtes :

31

 Agrégation : par exemple, lorsqu’une plante est malade, la probabilité que les plantes voisines soient malades augmente, autrement dit, les individus malades sont regroupés. Dans ce cas, agrégation est synonyme d’hétérogénéité ou de surdispersion, cependant surdispersion réfère à la variance de la distribution de fréquence et non à la répartition spatiale des plantes. L’intensité de l’agrégation représente la saturation relative de la maladie au sein des foyers (Madden et al., 2007).

 Répartition aléatoire : c’est le cas où la probabilité qu’une plante soit malade est indépendante du statut malade des plantes voisines (Madden et al.,2007). Autrement dit, chaque point de l’espace a la même chance d’accueillir une plante malade (Gosme, 2007).

 Répartition uniforme : c’est le cas où la probabilité qu’une plante soit malade est réduite par sa proximité à une autre plante malade. Cette situation s’observe rarement dans les études spatiales en phytopathologie (Madden et al., 2007).

L’analyse de la structure spatiale d’une maladie requiert la définition du type de variables considérées. Par exemple, le dénombrement des individus malades dans chaque unité d’échantillonnage permet de définir soit une variable de comptage, si ce nombre n’est pas limité par le nombre d’individus observés, soit une variable d’incidence dans le cas contraire (Gosme, 2007).

32

1.4.2. Analyse de données non géoréférencées

C’est une analyse basée sur une approche distributionnelle, c'est-à-dire, que l’on teste l’ajustement de la distribution des observations par rapport à une distribution théorique.

Indice de dispersion. Dans le cas des données de comptage, l’indice de

dispersion le plus utilisé est le rapport V/M, où V est la variance et M, la moyenne. Un rapport V/M inférieur à 1 indique que la répartition est uniforme, un rapport V/M égal à 1 indique une répartition aléatoire alors qu’un rapport V/M supérieur à 1 indique une agrégation (Carlo et Xavier, 2008). Pour des données d’incidence, l’indice de dispersion est le ratio de deux variances, la variance observée (estimée à partir des données) et la variance estimée sous la prémisse que les données suivent une distribution binomiale (Madden et al, 2007).

Loi de distribution. La répartition spatiale des données est obtenue par la

comparaison de la distribution des fréquences observées par rapport à une distribution théorique. Pour des données de comptage, la distribution des fréquences observées est comparée à la distribution de la négative binomiale et à celle de Poisson (Madden et al., 2007). Ainsi, la distribution des fréquences observées suit la loi de Poisson lorsque la répartition est aléatoire et la loi de la négative binomiale lorsqu’il y a agrégation. La loi de la négative binomiale comporte deux paramètres dont k, une mesure d’hétérogénéité. Plus k se rapproche de zéro plus le degré d’agrégation est élevé (Madden et al., 2007).

33

Pour des données d’incidence, c’est la distribution binomiale et la distribution de la β-binomiale qui servent généralement de base comparative. Quand les fréquences observées suivent la loi de la binomiale, la répartition spatiale des données est aléatoire et quand les fréquences observées suivent la loi de la β-binomiale, on observe une agrégation (Madden et al., 2007). La loi de la β-binomiale fournit deux paramètres dont θ qui reflète l’agrégation, lorsque θ est égal à zéro, on retrouve une répartition aléatoire (Gosme, 2007; Carlo et Xavier, 2008).

Loi de puissance (Taylor). L’agrégation peut être évaluée en utilisant l’analyse

par l’ajustement de la loi de puissance qui est liée aux lois de probabilité. La loi de la puissance mise en évidence par Taylor (1961) décrit la relation empirique qui existe entre la variance (V) et la moyenne (M) (Taylor, 1963).

Pour des données de comptage, cette loi s’exprime sous la forme : ln(V) = β0 + β1 ln(M)

où β0 et β1 représentent respectivement l’ordonnée à l’origine (intercept) et la pente

de la courbe de régression. Une valeur β1 > 1 signifie qu’il y a agrégation dans tous

les ensembles de données analysées (Gosme, 2007; Madden et al., 2007).

Pour des données d’incidence, Hughes et Madden (1992) proposent de transformer l’équation précédente sous la forme :

ln(Vobs) = ln(A) + β ln(Vth)

où Vobs et Vth sont respectivement la variance observée et théorique et ln(A) et β représentent respectivement l’ordonnée à l’origine (intercept) et la pente.

34

1.4.3. Analyse de données géoréférencées

Ces méthodes d’analyses explicites sont applicables seulement à certains types de données notamment, les données collectées par cartographie intensive. Ce type d’échantillonnage dit spatialisé considère à la fois l’état de la maladie et l’emplacement des unités d’échantillonnage. Toutefois, les analyses de données non géoréférencées sont aussi applicables à ce type de données géoréférencées (Samalens, 2009).

Cartographie. La cartographie permet de représenter la répartition des plantes

malades ou de l’intensité de la maladie dans une parcelle sur une carte. En exploitant l’aspect visuel, la cartographie permet d’avoir une vision globale de l’épidémie. Il n’est pas toujours possible d’identifier la structure spatiale d’une épidémie avec de telles cartes. Toutefois, certains logiciels comme SADIE (Spatial analysis by distance indices) ou ArcGIS (Environmental Systems Research Institute, Inc.) permettent d’améliorer la visualisation (Gosme, 2007).

Géostatistique. La géostatistique s’intéresse à la variation d’une variable aléatoire

dont les valeurs sont localisées en certains points de l’espace à la condition que les données soient géoréférencées et que la variable soit stationnaire sur l’étendue (surface de la zone d’observation) de l’étude (Samalens, 2009; Carlo et Xavier, 2008). Les calculs de géostatiques sont basés sur la covariance (cov (h)) entre paires de données séparées par une distance h.

La semi-variance quantifie la variance entre les valeurs mesurées à des points séparés par une distance h (cov(0) – cov(h) (Samalens, 2009). Sa représentation

35

graphique est appelée semi-variogramme (ou variogramme si l'on multiplie cette valeur par deux). La représentation graphique du rapport cov(h)/cov(0) s’appelle autocorrélogramme. Une augmentation de la semi-variance ou une diminution de l’autocorrélation avec la distance est synonyme d’une agrégation (Samalens, 2009). Un variogramme peut permettre de définir un certain nombre de paramètres ci- dessous (Gosme, 2007):

L’effet de pépite la variance due à une structure spatiale inférieure au grain

(le carré de la plus petite distance possible entre points de mesure). L’effet de pépite est représenté par l’ordonnée à l’origine.

 Le seuil la variance intrinsèque de la variable dans la population. Il est représenté par le niveau asymptotique de la courbe.

 La portée la distance maximale à laquelle les individus sont corrélés. Elle est représentée par l’abscisse correspondant à la distance où la courbe atteint le seuil.

Documents relatifs