partie I M´ ethodes et Mod` eles d’´ etudes ´ ecologiques
7.1 Mod` ele hi´ erarchique pour donn´ ees de comptage
a mod´eliser sa propre structure.
Ce mod`ele a pour vocation d’ˆetre utilis´e pour caract´eriser la distribution spatiale et, si
le contexte le permet, de caract´eriser les domaines d’´echelles de la distribution de la
po-pulation. Ce mod`ele a ´egalement pour vocation d’estimer des abondances de population
spatialis´ee ainsi que l’erreur d’estimation associ´ee. Notre approche peut typiquement
s’ap-pliquer au comptage d’animaux `a partir d’´echantillonnage en transect, (voir section 4.4
m´ethode d’´echantillonnage de population animale). Le d´eveloppement de ce mod`ele adapt´e
aux populations animales a fait l’objet de la r´edaction d’un article (voir Annexes Article 2).
Article 2 : Coupling a hierarchical model with geostatistics to model the spatial distribution
of wildlife population : an application to transect survey data.
Bellier, E. Monestiez, P. G. Certain, J. Chadœuf, V. Bretagnolle en r´evision
7.1 Mod`ele hi´erarchique pour donn´ees de comptage
A partir de la m´ethode de”strip-transect”, les donn´ees sont r´ecolt´ees le long d’un
tran-sect, dans une bande de largeur fixe, au sein de cette zone la probabilit´e de d´etection est
consid´er´ee comme homog`ene (voir section 4.4).
A partir de ce type d’´echantillonnage, les donn´ees sont de nature ”ponctuelle”. Pour
pouvoir utiliser des m´ethodes de type g´eostatistique, il faut passer `a une variable continue,
pour cela les transects sont d´ecoup´es en unit´es d’´echantillonnage, ayant pour largeur, la
7.1 Mod`ele hi´erarchique pour donn´ees de comptage 47
largeur du ”strip” choisie lors de l’´echantillonnage. Ensuite, le choix de la longueur de la
cellule est d´etermin´ee de mani`ere empirique, de fa¸con que la longueur de la cellule ne doit
pas ˆetre trop grande pour ne pas perdre les structures spatiales `a petite ´echelle, ni trop petite
pour ne pas avoir un trop grand nombre de z´eros dans la distribution statistique des donn´ees.
Les cellules sont centr´ees sur un site set contiennent un certain nombre d’observations et
un certain nombre d’individus (les deux diff`erent quand une observation contient plus d’un
individu).
Le mod`ele hi´erarchique est compos´e de trois niveaux. Le premier niveau d´efiniN
s|Z
so`u
N
sest le nombre d’individus observ´es pour une cellules, etZ
sest le nombre d’observations
dans une cellule ayant pour aire v
s. Pour chaque cellule centr´ee sur le site s de la zone
d’´etudeV, on d´efinit :
N
s|Z
s∼
(
N
s= 0 si Z
s= 0
N
s=P
Zs i=1L(θ, τ) si Z
s6= 0 (7.1)
N
speut ˆetre mod´elis´e par une distribution discr`ete et positiveL(θ, τ) ayant pour esp´erance
θ et pour variance τ
2. Le second niveau d´efini Z
s|Y
s, o`u le nombre d’observations Z
sest
mod´elis´e par une distribution de Poisson ayant pour param`etre Y
s∗v
s, o`u v
sest l’aire de
l’unit´e d’´echantillonnage :
Z
s|Y
s=P(Y
s∗v
s). (7.2)
En d’autres termes,Z
sest le nombre d’observations, etY
sest la densit´e th´eorique
d’ob-servations par unit´e d’aire,Y
speut ˆetre consid´er´e comme un champ al´eatoire positif, il peut
ˆ
etre d´ecompos´e comme le produit d’une d´erive d´eterministe m
set d’un champ al´eatoire
positif stationnaireX
s:
Y
s=m
sX
s. (7.3)
La variable latenteX
sest d´efinie par sa moyenne, une variance σ
2X, et une fonction de
covariance C
X(s−s
0) qui d´epend uniquement de la distance entre s et s
0. Il n’y a pas
d’hypoth`ese distributionnelle sur X except´e X≥0.
7.1.1 Mod´elisation de la distribution des tailles de groupes d’individus
Dans le but d’estimer des abondances `a partir de la densit´e d’observations Y
s, la taille
de groupe des organismes peut ˆetre mod´elis´ee par une distribution discr`ete et positive, par
exemple par une distribution de Poisson ou une loi n´egative binomiale, ou par des versions
tronqu´ees de ces distributions (White & Bennetts, 1996).Les param`etres de la distribution
sont estim´es par maximum de vraisemblance. Pour valider le choix de la distribution, la
distribution empirique des donn´ees peut ˆetre compar´ee `a des distributions simul´ees `a partir
Fig. 7.1.D´ecomposition des deux niveaux latents `a partir du niveau observ´e du mod`ele hi´erarchique, d’apr`es (Walker et al., 2007).
des param`etres estim´es, ce qui permet de disposer de bandes de confiance par bootstrap
param´etrique (Efron & Tibshirani, 1993).
L’ind´ependance entre le nombre d’observationZ
set le nombre d’individusN
spar cellules
est test´ee. Pour cela la distribution du nombre d’individus par cellule est compar´ee aux
distributions obtenues par bootstrap param´etrique sous hypoth`ese d’ind´ependance.
7.1.2 Couplage du mod`ele hi´erarchique `a la g´eostatistique
Calcul d’un variogramme `a partir de donn´ees de comptage
Les diff´erentes sources de variabilit´e de la distribution des populations animales ont ´et´e
prises en compte dans le calcul du variogramme exp´erimental. Ces corrections s’effectuent
en deux ´etapes :
7.1 Mod`ele hi´erarchique pour donn´ees de comptage 49
Etape 1- La d´efinition du champ latent deY repr´esentant la densit´e th´eorique
d’obser-vation va nous permettre de corriger l’effet de p´epite du variogramme de Z :
γ
Y∗=γ
∗Z−m, (7.4)
o`um est l’esp´erance math´ematique deY.
Cette correction prenant en compte la loi de Poisson deZ permet de mod´eliser la
varia-bilit´e dˆue `a l’al´ea de l’observation, c’est-`a-dire la rencontre.
Etape 2- En prenant en compte le mod`ele multiplicatif (i.e. niveau 3 du mod`ele
hi´erarchique) et sim est constant le variogramme deγ
Xpeut s’exprimer :
γ
X∗= 1
m
2γ
Y∗= 1
m
2(γ
Z∗−m). (7.5)
Quand au sein de l’aire d’´etudemn’est pas constante, l’estimation deγ
Xdevient d´elicate,
une solution propos´ee est de calculerγ
Xdans des sous-domaines o`u la moyenne est constante
ou pour des paires de diff´erences o`u la moyenne est constante.
Cartographie de la densit´e spatiale d’observation : Le krigeage multiplicatif.
La carte de la densit´e spatiale d’observation est obtenue `a partir de l’interpolation
spa-tiale de Y en utilisant les donn´eesZ (nombre d’observations par cellule). Pour prendre en
compte les modifications effectu´ees au niveau du variogramme Z, le krigeage ordinaire est
modifi´e. L’interpolation deY est obtenue en pond´erant le nombre d’observations par cellule
Z, par les valeurs de la d´erivem
αetm
0(i.e.m
αcorrespond aux valeurs de la d´erive spatiale
au point observ´e etm
0correspond `a la valeur de la d´erive spatiale au point de la grille de
pr´ediction) :
Y
0∗=
nX
α=1w
αm
oZ
αm
α. (7.6)
La condition de non-biais surY
0∗implique la contrainte habituelle sur les poidsw
α:
n
X
α=1
w
α= 1. (7.7)
L’expression du carr´e moyen de l’erreur de pr´ediction (MSEP) peut ˆetre d´eduite de 7.7
(voir Appendix A de l’article 2 pour les d´etails) :
E
(Y
o∗−Y
o)
2=m
2oσ
X2+
nX
α=1w
2αm
α+
nX
α=1 nX
β=1w
αw
βC
αβ−2
nX
α=1w
αC
αo. (7.8)
La minimisation du carr´e moyen de l’erreur de pr´ediction (MSEP) conduit `a un syst`eme
de krigeage `a (n+1) ´equations, o`u µ est le multiplicateur de Lagrange introduit du fait de
la contrainte sur les poids w
α.
nX
β=1w
βC
αβ+ w
αm
α+µ=C
αopour α= 1, . . . , n
nX
α=1w
α= 1
(7.9)
Le syst`eme de krigeage est exprim´e en covariance, car la covariance est pr´ef´erentiellement
utilis´ee pour les calculs, quand le variogramme et la covariance existent, tel que :
C
ss0=σ
X2−γ
X(s−s
0).
L’expression de la variance d´eduite du syst`eme de krigeage s’´ecrit :
Var(Y
o∗−Y
o) =m
2oσ
2X−
nX
α=1w
αC
αo−µ
. (7.10)
On peut facilement montrer que le krigeage de X
0d´efini tel que X
0∗= P
nα=1
w
αZαmα