• Aucun résultat trouvé

partie I M´ ethodes et Mod` eles d’´ etudes ´ ecologiques

7.1 Mod` ele hi´ erarchique pour donn´ ees de comptage

a mod´eliser sa propre structure.

Ce mod`ele a pour vocation d’ˆetre utilis´e pour caract´eriser la distribution spatiale et, si

le contexte le permet, de caract´eriser les domaines d’´echelles de la distribution de la

po-pulation. Ce mod`ele a ´egalement pour vocation d’estimer des abondances de population

spatialis´ee ainsi que l’erreur d’estimation associ´ee. Notre approche peut typiquement

s’ap-pliquer au comptage d’animaux `a partir d’´echantillonnage en transect, (voir section 4.4

m´ethode d’´echantillonnage de population animale). Le d´eveloppement de ce mod`ele adapt´e

aux populations animales a fait l’objet de la r´edaction d’un article (voir Annexes Article 2).

Article 2 : Coupling a hierarchical model with geostatistics to model the spatial distribution

of wildlife population : an application to transect survey data.

Bellier, E. Monestiez, P. G. Certain, J. Chadœuf, V. Bretagnolle en r´evision

7.1 Mod`ele hi´erarchique pour donn´ees de comptage

A partir de la m´ethode de”strip-transect”, les donn´ees sont r´ecolt´ees le long d’un

tran-sect, dans une bande de largeur fixe, au sein de cette zone la probabilit´e de d´etection est

consid´er´ee comme homog`ene (voir section 4.4).

A partir de ce type d’´echantillonnage, les donn´ees sont de nature ”ponctuelle”. Pour

pouvoir utiliser des m´ethodes de type g´eostatistique, il faut passer `a une variable continue,

pour cela les transects sont d´ecoup´es en unit´es d’´echantillonnage, ayant pour largeur, la

7.1 Mod`ele hi´erarchique pour donn´ees de comptage 47

largeur du ”strip” choisie lors de l’´echantillonnage. Ensuite, le choix de la longueur de la

cellule est d´etermin´ee de mani`ere empirique, de fa¸con que la longueur de la cellule ne doit

pas ˆetre trop grande pour ne pas perdre les structures spatiales `a petite ´echelle, ni trop petite

pour ne pas avoir un trop grand nombre de z´eros dans la distribution statistique des donn´ees.

Les cellules sont centr´ees sur un site set contiennent un certain nombre d’observations et

un certain nombre d’individus (les deux diff`erent quand une observation contient plus d’un

individu).

Le mod`ele hi´erarchique est compos´e de trois niveaux. Le premier niveau d´efiniN

s

|Z

s

o`u

N

s

est le nombre d’individus observ´es pour une cellules, etZ

s

est le nombre d’observations

dans une cellule ayant pour aire v

s

. Pour chaque cellule centr´ee sur le site s de la zone

d’´etudeV, on d´efinit :

N

s

|Z

s

(

N

s

= 0 si Z

s

= 0

N

s

=P

Zs i=1

L(θ, τ) si Z

s

6= 0 (7.1)

N

s

peut ˆetre mod´elis´e par une distribution discr`ete et positiveL(θ, τ) ayant pour esp´erance

θ et pour variance τ

2

. Le second niveau d´efini Z

s

|Y

s

, o`u le nombre d’observations Z

s

est

mod´elis´e par une distribution de Poisson ayant pour param`etre Y

s

∗v

s

, o`u v

s

est l’aire de

l’unit´e d’´echantillonnage :

Z

s

|Y

s

=P(Y

s

∗v

s

). (7.2)

En d’autres termes,Z

s

est le nombre d’observations, etY

s

est la densit´e th´eorique

d’ob-servations par unit´e d’aire,Y

s

peut ˆetre consid´er´e comme un champ al´eatoire positif, il peut

ˆ

etre d´ecompos´e comme le produit d’une d´erive d´eterministe m

s

et d’un champ al´eatoire

positif stationnaireX

s

:

Y

s

=m

s

X

s

. (7.3)

La variable latenteX

s

est d´efinie par sa moyenne, une variance σ

2X

, et une fonction de

covariance C

X

(s−s

0

) qui d´epend uniquement de la distance entre s et s

0

. Il n’y a pas

d’hypoth`ese distributionnelle sur X except´e X≥0.

7.1.1 Mod´elisation de la distribution des tailles de groupes d’individus

Dans le but d’estimer des abondances `a partir de la densit´e d’observations Y

s

, la taille

de groupe des organismes peut ˆetre mod´elis´ee par une distribution discr`ete et positive, par

exemple par une distribution de Poisson ou une loi n´egative binomiale, ou par des versions

tronqu´ees de ces distributions (White & Bennetts, 1996).Les param`etres de la distribution

sont estim´es par maximum de vraisemblance. Pour valider le choix de la distribution, la

distribution empirique des donn´ees peut ˆetre compar´ee `a des distributions simul´ees `a partir

Fig. 7.1.D´ecomposition des deux niveaux latents `a partir du niveau observ´e du mod`ele hi´erarchique, d’apr`es (Walker et al., 2007).

des param`etres estim´es, ce qui permet de disposer de bandes de confiance par bootstrap

param´etrique (Efron & Tibshirani, 1993).

L’ind´ependance entre le nombre d’observationZ

s

et le nombre d’individusN

s

par cellules

est test´ee. Pour cela la distribution du nombre d’individus par cellule est compar´ee aux

distributions obtenues par bootstrap param´etrique sous hypoth`ese d’ind´ependance.

7.1.2 Couplage du mod`ele hi´erarchique `a la g´eostatistique

Calcul d’un variogramme `a partir de donn´ees de comptage

Les diff´erentes sources de variabilit´e de la distribution des populations animales ont ´et´e

prises en compte dans le calcul du variogramme exp´erimental. Ces corrections s’effectuent

en deux ´etapes :

7.1 Mod`ele hi´erarchique pour donn´ees de comptage 49

Etape 1- La d´efinition du champ latent deY repr´esentant la densit´e th´eorique

d’obser-vation va nous permettre de corriger l’effet de p´epite du variogramme de Z :

γ

Y

Z

−m, (7.4)

o`um est l’esp´erance math´ematique deY.

Cette correction prenant en compte la loi de Poisson deZ permet de mod´eliser la

varia-bilit´e dˆue `a l’al´ea de l’observation, c’est-`a-dire la rencontre.

Etape 2- En prenant en compte le mod`ele multiplicatif (i.e. niveau 3 du mod`ele

hi´erarchique) et sim est constant le variogramme deγ

X

peut s’exprimer :

γ

X

= 1

m

2

γ

Y

= 1

m

2

Z

−m). (7.5)

Quand au sein de l’aire d’´etudemn’est pas constante, l’estimation deγ

X

devient d´elicate,

une solution propos´ee est de calculerγ

X

dans des sous-domaines o`u la moyenne est constante

ou pour des paires de diff´erences o`u la moyenne est constante.

Cartographie de la densit´e spatiale d’observation : Le krigeage multiplicatif.

La carte de la densit´e spatiale d’observation est obtenue `a partir de l’interpolation

spa-tiale de Y en utilisant les donn´eesZ (nombre d’observations par cellule). Pour prendre en

compte les modifications effectu´ees au niveau du variogramme Z, le krigeage ordinaire est

modifi´e. L’interpolation deY est obtenue en pond´erant le nombre d’observations par cellule

Z, par les valeurs de la d´erivem

α

etm

0

(i.e.m

α

correspond aux valeurs de la d´erive spatiale

au point observ´e etm

0

correspond `a la valeur de la d´erive spatiale au point de la grille de

pr´ediction) :

Y

0

=

n

X

α=1

w

α

m

o

Z

α

m

α

. (7.6)

La condition de non-biais surY

0

implique la contrainte habituelle sur les poidsw

α

:

n

X

α=1

w

α

= 1. (7.7)

L’expression du carr´e moyen de l’erreur de pr´ediction (MSEP) peut ˆetre d´eduite de 7.7

(voir Appendix A de l’article 2 pour les d´etails) :

E

(Y

o

−Y

o

)

2

=m

2o

σ

X2

+

n

X

α=1

w

2α

m

α

+

n

X

α=1 n

X

β=1

w

α

w

β

C

αβ

−2

n

X

α=1

w

α

C

αo

. (7.8)

La minimisation du carr´e moyen de l’erreur de pr´ediction (MSEP) conduit `a un syst`eme

de krigeage `a (n+1) ´equations, o`u µ est le multiplicateur de Lagrange introduit du fait de

la contrainte sur les poids w

α

.

n

X

β=1

w

β

C

αβ

+ w

α

m

α

+µ=C

αo

pour α= 1, . . . , n

n

X

α=1

w

α

= 1

(7.9)

Le syst`eme de krigeage est exprim´e en covariance, car la covariance est pr´ef´erentiellement

utilis´ee pour les calculs, quand le variogramme et la covariance existent, tel que :

C

ss0

X2

−γ

X

(s−s

0

).

L’expression de la variance d´eduite du syst`eme de krigeage s’´ecrit :

Var(Y

o

−Y

o

) =m

2o

σ

2X

n

X

α=1

w

α

C

αo

−µ

. (7.10)

On peut facilement montrer que le krigeage de X

0

d´efini tel que X

0

= P

n

α=1

w

αZα

donne les mˆemes valeurs de poids wet de multiplicateur de Lagrangeµ, alors les krigeages

de Y

0

et deX

0

deviennent ´equivalents en utilisant la relationY

0

=m

0

X

0

.