• Aucun résultat trouvé

L’objectif est de tester si deux placettes ne sont pas simplement deux échantillons d’une même communauté, dont les différences ne sont que des fluctuations dues au hasard. Sous l’hypothèse nulle, les observations 𝑞�𝑠𝑖 sont des réalisations des

mêmes probabilités 𝑝𝑠+.

Le test est réalisé de la façon suivante :

Chaque valeur 𝑦𝑠𝑖 est tirée dans une loi binomiale ℬ�𝑦, 𝑦𝑠+� � et 𝐻𝑦 𝛽 est cal-

culée,

• La simulation est répétée un grand nombre de fois, par exemple 10 000, et les valeurs extrêmes sont éliminées. Au seuil de risque 𝛼 = 5%, les 251ème et 9750ème valeurs simulées définissent les bornes de l’intervalle de con- fiance de l’hypothèse nulle.

L’hypothèse nulle est rejetée si la valeur observée de 𝐻𝛽 n’est pas dans cet inter-

valle, en général au-delà de la borne supérieure. Il peut arriver que les deux pla- cettes soient plus semblables que sous l’hypothèse nulle, c'est-à-dire que les fré- quences varient moins que dans le tirage d’une loi binomiale, si deux placettes ont été plantées avec le même nombre d’arbres de chaque espèce par exemple. Le code proposé pour R (R Development Core Team, 2010) se trouve en annexe 4.

Exemples

Données simulées

Des exemples théoriques sont utiles pour comprendre les déterminants de 𝐻�𝛽,

notamment la richesse de la communauté et l’effort d’échantillonnage. Deux dis- tributions de fréquences sont tirées au hasard, de respectivement 20 et 40 es- pèces. Les fréquences de chaque espèce sont tirées dans la même loi uniforme et normalisées pour que leur somme soit égale à 1. Une paire de placettes est en-

suite tirée 1 000 fois selon ces fréquences, avec une espérance de 500 ou 5 000 points.

𝐻�𝛽 est calculée pour chaque paire de placettes et les résultats sont affichés sous

la forme d’un histogramme des fréquences, lissé pour obtenir une densité de pro- babilité par la fonction density de R.

Figure 37: Densités de probabilité de 𝑯𝜷 obtenues à partir de 1 000 simulations du modèle présenté dans le texte.

Deux placettes forestières sont tirées dans la même communauté. 𝑯𝜷 n’est pas nulle à cause des différences stochastiques entre les tirages. Les barres verticales sont les 5ème et 95ème centiles. La première colonne cor-

respond à des placettes de 500 arbres environ, la seconde de 5 000 arbres, la première ligne à 20 espèces, la seconde à 40. Toutes choses égales par ailleurs, 𝑯𝜷 décroît avec le nombre d’arbres et croît avec le nombre

d’espèces.

Les résultats se trouvent en Figure 37.

0.000 0.005 0.010 0.015 0.020 0 20 40 60 80 100 120 140 Beta Diversity D ens ity 0.0000 0.0005 0.0010 0.0015 0.0020 0 500 1000 1500 Beta Diversity D ens ity 0.005 0.010 0.015 0.020 0.025 0.030 0.035 0.040 0 20 40 60 80 Beta Diversity D ens ity 0.001 0.002 0.003 0.004 0 200 400 600 800 Beta Diversity D ens ity

La valeur de 𝐻�𝛽 calculée entre deux placettes ne change pas si les effectifs sont

multipliés par 10 sans changer les fréquences. Mais l’hypothèse nulle du test est que les deux placettes sont issues de la même communauté : quand plus d’individus sont échantillonnés, les fréquences observées convergent vers leur probabilité à cause de la loi des grands nombres. Une valeur observée de 𝐻�𝛽= 0.002 montre une différence significative entre deux placettes de 5 000

arbres (Figure 37, en haut à droite), mais si les placettes ne contiennent que 500 individus (en haut à gauche), cette valeur est en dessous de la borne inférieure de l’intervalle de confiance et indique que les placettes sont probablement trop simi- laires pour que ce soit simplement le résultat du hasard.

𝐻�𝛽 tend à augmenter avec le nombre d’espèces. La borne supérieure de

l’intervalle de confiance avec 20 espèces (en haut) correspond approximativement à la borne inférieure avec 40 espèces (en bas).

Données réelles

Le test est appliqué à des données réelles, quatre placettes de 1 ha de forêt tropi- cale sur les dispositifs forestiers de Paracou (Gourlet-Fleury et al., 2004) et des Nouragues (Bongers et al., 2001), en Guyane française. Pour la clarté du raison- nement, nous admettrons que ces placettes représentent des environnements contrastés et constituent ensemble un échantillon représentatif de chaque forêt. Les caractéristiques de chaque placette sont résumées dans le Tableau 8.

Placette NH20 NL11 P006 P018 Total

Nombre d’arbres 558 515 643 481 2197

Nombre d’espèces 203 182 147 149 425 𝑯� 4,74 4,63 4,19 4,42 5,29

Nombre de Hill 114 103 66 83 199

Tableau 8 : Résumé des quatre placettes de 1 hectare.

Les deux premières sont situées aux Nouragues, les deux dernières à Paracou. 𝑯� est la diversité 𝜶 de Shan- non.

Le premier résultat est que les placettes des Nouragues sont plus diverses que celles de Paracou. Les nombres de Hill donnent une représentation intuitive du niveau de diversité : par exemple, la placette NH20 est aussi diverse que le serait une placette de taille identique avec 114 espèces de fréquence égale, alors que la placette P006 l’est à peu près deux fois moins.

Le Tableau 9 montre comment la diversité peut être décomposée entre les forêts puis entre les placettes ou regroupée dans l’autre sens. Les valeurs de 𝐻�𝛽 peuvent

être testées contre l’hypothèse nulle d’absence de différence entre les placettes ou les forêts. Par exemple, la diversité 𝛽 entre les deux placettes des Nouragues at- tendue sous l’hypothèse nulle est 0,144, ce qui correspond à un nombre de Hill de 1,16 (Figure 38). Placette NH20 NL11 P006 P018 𝑯𝒑𝒍𝒂𝒄𝒆𝒕𝒕𝒆𝒔 pondéré 2,46 2,22 2,40 1,89 𝑯𝜷𝒑𝒍𝒂𝒄𝒆𝒕𝒕𝒆𝒔 0,42 (N=1,52) 0,45 (N=1.56) 𝑯𝒇𝒐𝒓ê𝒕 5,11 (N=165) 4.74 (N=114) 𝑯𝒇𝒐𝒓ê𝒕 pondéré 2,49 2.42 𝑯𝜷𝒇𝒐𝒓ê𝒕 0,38 (N=1,46) 𝑯𝒕𝒐𝒕𝒂𝒍 5,29 (N=199)

Tableau 9 : Regroupement successif des placettes des Nouragues et de Paracou.

La première ligne contient la diversité 𝜶 des placettes, pondérée par le nombre d’arbres. La deuxième ligne contient les valeurs de diversité 𝜷 entre les placettes. La somme des deux donne la diversité 𝜸 de la forêt (ligne 3). À son tour, celle-ci peut être considérée comme la diversité 𝜶 au niveau de regroupement supérieur. Sa valeur pondérée (ligne 4) est ajoutée à celle de la diversité 𝜷 entre forêts (ligne 5) pour donner la diversité

totale (ligne 6).

Figure 38: Densités de probabilité de 𝑯𝜷 sous l’hypothèse nulle pour les placettes des Nouragues. Les traits verticaux sont les bornes de l’intervalle de confiance.

0.10 0.12 0.14 0.16 0.18 0 10 20 30 Beta Diversity D ens ity

mun). Les valeurs inférieures à 0,1 (N=1,10) ou supérieures à 0,2 (N=1,22) ont une probabilité si faible qu’elles peuvent être considérées comme jamais atteintes si les deux placettes proviennent de la même communauté. La valeur réelle ob- servée aux Nouragues est 0,42, très au-dessus de l’intervalle de confiance. Toutes les valeurs de diversité 𝛽 du tableau sont hautement significatives (au-delà de 99,99%). On peut observer que la diversité à l’intérieur des forêts est similaire à celle entre les forêts (tous les nombres de Hill autour de 1,5). Les placettes au- raient pu être groupées directement. Dans ce cas, la diversité entre placettes au- rait été de 0,81 (significative au-delà de 99,99%). Le nombre de Hill correspon- dant est 2,25, ce qui signifie que les 4 placettes sont aussi différentes que 2,25 placettes de même effectif sans espèces communes.

C

ONCLUSION

Les informations qu’un écologue cherche à retirer immédiatement de l’observation d’un semis de points représentant une communauté végétale sont les densités de chaque espèce et l’existence ou non d’interactions entre les plantes. Ceci est en substance l’introduction de l’article de Pielou (1959) et la mo- tivation des développements méthodologiques présentés ici.

Caractériser

Les méthodes ont largement progressé depuis l’article de Pielou, avec un saut qualitatif net correspondant à l’introduction de la fonction K par Ripley (1976; 1977). Des revues ou des manuels sont régulièrement produits pour permettre aux praticiens de comprendre et utiliser les nouveaux outils (Perry et al., 2002 ; Fortin et Dale, 2005 ; Law et al., 2009). En amont, littérature sur les processus ponctuels s’est enrichie : une synthèse de l’état de l’art peut être trouvée dans Møller et Waagepetersen (2004). Entre cette approche théorique et les manuels pour praticiens se trouve une place pour une approche assez rigoureuse sur le plan mathématique mais orientée vers les applications empiriques (Diggle, 1983 ; Stoyan et al., 1987 ; Cressie, 1993 ; Illian et al., 2008 par exemple). L’objectif de ce travail était de proposer des avancées méthodologiques dans cet esprit.

Une façon de synthétiser les nombreuses approches passées en revue est une ty- pologie des outils, dans le but de montrer leur cohérence plus que de fournir un guide pratique (on se référera pour cela à la liste plus haut). L’accent est mis en- suite sur le problème nommé « MAUP » par les économistes, qui affecte les statis- tiques discrètes : la délimitation des zones peut créer ou masquer des structures sans rapport avec le phénomène étudié, ce qui constitue une motivation supplé- mentaire pour traiter des données spatialisées.

Synthèse

• Ensuite, selon leur appréhension de l’espace (le vocabulaire est celui de Brülhart et Traeger, 2005) : les indices absolus qui ne concernent que les quadrats considèrent que chacun doit contenir le même nombre d’objets et mesurent les écarts à cette égalité, les indices topographiques considèrent que le nombre d’objets ou leur poids doit être proportionnel à la surface et enfin les indices relatifs utilisent une autre référence que la surface, par exemple la surface terrière totale des arbres dans une parcelle.

• Enfin, selon leur valeur de référence : les moins élaborés fournissent un ré- sultat à comparer à deux valeurs extrêmes correspondant à une équirépar- tition parfaite, c'est-à-dire un maximum de dispersion, et une concentra- tion maximum de tous les objets en un lieu unique. Les autres permettent de comparer le résultat à une hypothèse nulle, généralement l’indépendance entre les points, accompagnée d’un intervalle de confiance permettant de conclure à la significativité de la structure observée.

Les tableaux ci-dessous résument les types d’indices : • Fondés sur les quadrats :

Référence Type d’indice

Extrêmes Hypothèse nulle

Absolu Indice d’Herfindahl (page 191) -

Topographique Indices d’entropie généralisée

GE(α) Variance relative (page 185) Méthode de Greig-Smith (page 186)

Relatif Indice de Gini (page 188)

Indice G d’Ellison et Glaeser (page 189)

Indices d’entropie généralisée GE(α)

Indice γ d’Ellison et Glaeser (page 189)

MTAD de Rysman et Greens- tein (page 194)

• En espace continu :

Référence Type d’indice

Extrêmes Hypothèse nulle

Référence Type d’indice

Extrêmes Hypothèse nulle

Topographique - Indice R d’Evans et Clark (page 167)

Fonctions F et G de Diggle (page 168)

Fonctions J de Van Lieshout et Baddeley (page171)

g et K de Ripley, L de Besag ginhom et Kinhom de Baddeley et al.

O-ring de Wiegand et al.

Relatif - Tk de Cuzick et Edwards Kd de Duranton et Overman D de Diggle et Chetwynd M de Marcon et Puech

La MAUP

Toutes les méthodes fondées sur les quadrats nécessitent un découpage de l’espace a priori. En foresterie, on dispose couramment de données par parcelle, en économie de données par unités administratives plus ou moins détaillées. Or, toutes les mesures sont sensibles à l’échelle géographique retenue.

Ce résultat est connu sous le nom du Problème des Unités Spatiales Modifiables (Modifiable Areal Unit Problem – MAUP) dont le terme a été introduit par Openshaw et Taylor (1979). Une littérature abondante s’est développée à ce sujet en économie (par exemple Arbia, 1989 ; Fotheringham et Wong, 1991 ; Amrhein, 1995 ; Morphet, 1997). Le problème est résumé par Morphet (1997, page 1039) : « le résultat sera sensible à la forme, à la taille et à la position des unités spatiales

choisies »1. Les manifestations de la MAUP sont essentiellement le problème d’échelle et le problème d’agrégation.

Le problème d’échelle est dû à la résolution du zonage choisi. Pour l’expliquer, considérons une distribution de points sur un territoire, Figure 39 (-a-), et deux découpages possibles : en 4 zones (-b-), puis 8 zones par redécoupage (-c-).

Une certaine hétérogénéité est détectée dans la figure c alors que la figure b montre une parfaite régularité de la distribution (1 point par zone). Le découpage en b est trop grossier et masque l’hétérogénéité à petite échelle. Le problème in- verse est également possible : un découpage trop détaillé peut masquer la concen- tration en découpant les agrégats.

-a- -b-

-c- -d-

Figure 39 : Illustration du problème d’échelle et d’agrégation

Le problème d’agrégation se manifeste par des résultats différents selon le dé- coupage géographique. Ce problème est illustré sur la Figure 39 par les cas b et d. Chaque territoire est divisé en 4 zones de mêmes tailles, mais sur la figure b la distribution est régulière alors que sur la figure d, deux quadrats n’ont aucun point. Quel que soit l’indice utilisé, l’agrégation sera plus grande en d.

Comme le souligne Arbia (2001, page 413) : « nous pouvons facilement imaginer

que la situation soit encore pire dans les cas réels, où les unités spatiales sont irré- gulières en taille et en forme »2. Ainsi, tous les indices reposant sur un découpage de l’espace doivent se soumettre aux critiques de la MAUP si le découpage n’est pas lié au phénomène observé ; en d’autres termes si le découpage est arbitraire (parcelles forestières) ou sans rapport (découpage administratif). Une précaution possible, mise en place par Barrios et al. (2003) consiste à vérifier l’absence

d’autocorrélation spatiale (voir page 195) entre les zones et changer d’échelle si nécessaire : évaluer la concentration spatiale au niveau des régions si les dépar- tements sont autocorrélés par exemple.

Obtenir des informations sur les processus