• Aucun résultat trouvé

L ES CETACES EN M EDITERRANEE

C. Les Méthodes

4) Utilisation des habitats, distribution et abondance par la modélisation spatiale

La méthode standard pour estimer l’abondance des populations animales, et en particulier pour les cétacés, est le « distance sampling » appliqué aux transects linéaires. Le principe est d’estimer la fonction de détection, c'est-à-dire la distance moyenne jusqu’à laquelle les cétacés sont détectés avec une probabilité de 1. Cette distance est appelée largeur de bande effective. En appliquant cette distance de part et d’autre des transects, les lignes parcourues par le navire deviennent des bandes d’épaisseur égale à 2 fois cette distance de détection. L’abondance totale des cétacés est estimée par extrapolation du nombre de cétacés observés, sur la surface totale parcourue par le navire, à toute la région échantillonnée, multiplié par le nombre moyen d’individus par groupe. Une condition à l’utilisation de cette méthode est un échantillonnage aléatoire assurant une couverture de l’ensemble de cette zone selon une probabilité égale (pour éviter les sur/sous échantillonnages de certaines régions de la zone). Dans notre cas, nous avons utilisé les ferries, appelés navires d’ « opportunité » (on profite d’un navire qui a une ligne non-dédiée à l’observation) comme plateforme d’échantillonnage. La condition de l’échantillonnage aléatoire n’est pas respectée et il n’est donc pas possible d’appliquer l’extrapolation pour calculer l’abondance totale. Cependant, les deux paramètres de largeur de bande effective et de taille moyenne de groupe calculés par la méthode de « distance sampling » sont nécessaires pour calculer l’abondance par la modélisation spatiale des distances d’attente.

a. Estimation de la largeur de bande effective et de la taille de groupe par « Distance sampling »

Afin d’obtenir une bonne estimation de la largeur de bande effective, il faut s’assurer (i) que g(0) (probabilité de détection sur l’axe du navire) est égale à 1, c’est-à-dire que tous les individus positionnés sur la ligne de transect sont détectés, et (ii) que les individus sont repérés à leur position d’origine, avant un éventuel mouvement de réponse, c'est-à-dire la fuite ou l’attraction des animaux par le navire.

- La largeur de bande effective µ (en mètres) est calculée à partir de la distance perpendiculaire entre la ligne de transect (i.e. le cap du navire) et l’observation. La distance

perpendiculaire Dx est calculée grâce à la distance radiale et l’angle d’observation selon la

formule: Dx = Dr . sin(θ)

Où Dr est la distance radiale en mètres (m) et θ l’angle en degré entre la ligne de transect et l’observation (Fig. 2.18). Dr Dx θ Distance perpendiculaire P ro b a b ili d e d é te c ti o n 1 0 0 1

1 2

Fig. 2.18. (1) Calcul de la distance perpendiculaire (Dx) à partir de la distance radiale (Dr) et de l’angle d’observation (θ), et (2) histogramme de fréquence des distances perpendiculaires et fonction de détection.

L’ensemble de ces données est compilé dans le logiciel « Distance 5.0.Bêta 5» afin d’ajuster une fonction de détection sur les distances perpendiculaires. Les observations correspondent à des conditions de visibilité toujours supérieures ou égales à 3 (visibilité supérieure à 4 miles nautiques) et à un indice d’état de la mer toujours faible. Cependant, suivant les recommandations de Buckland et al. (2001), une troncature des données les plus éloignées de la ligne a été effectuée afin d’éliminer d’éventuels points aberrants. La probabilité de détection g(x) est ensuite estimée par différents types de modèles, incorporant ou non les covariables de conditions météorologiques pouvant affecter g(x). Deux critères entrent en jeu afin de déterminer le meilleur modèle s’ajustant aux données: le Critère d’Information d’Akaike (AIC) doit être le plus faible possible et le test de χ² sur la qualité de l’ajustement doit être le plus proche de 1.

- La taille de groupe attendue E[s] est également calculée par le logiciel Distance afin d’estimer un possible biais de détection des groupes. Ce biais se traduirait par une meilleure détection des grands groupes en comparaison des petits groupes, à la même distance. Cette

approche ajuste une régression des moindres carrés du logarithme de la taille de groupe versus la distance, menant à une pente si un biais est présent, ce qui n’a pas été le cas.

b. Modélisation spatiale des distances d’attente

Une méthode alternative, pour estimer l’abondance à partir d’échantillonnage non dédié à la méthode standard « distance sampling », est l’approche basée sur les modèles (Hedley 2000, Marques 2000). Elle combine la méthode standard (line transect/distance sampling) et les analyses spatiales. Cette méthode présente 2 avantages :

- La densité étant modélisée à partir des données d’observations comme une fonction des données environnementales associées à ces observations, des cartes de densités peuvent être réalisées. Elles permettent la visualisation des variations spatiales (et non plus un découpage arbitraire de la zone d’étude en sous-zones) et le calcul d’abondance de n’importe quelle région de la zone d’étude par l’intégration des densités.

- Cette approche permet d’étudier les relations entre la densité et les différentes variables environnementales, c'est-à-dire l’étude des habitats. Les variables significatives serviront au calcul de l’abondance. Les variables environnementales testées sont: SST, Chl a, gradients de SST et Chl a, ADT, amplitude des courants géostrophiques, bathymétrie et pente. La période de l’année sera également testée

La méthode de modélisation des distances d’attente proposée par Hedley (2000) semble particulièrement bien adaptée à notre échantillonnage à partir des navires d’opportunité (Henry 2005). La distance d’attente est définie par la distance parcourue entre 2 observations i et i+1. Les distances d’attente sont exprimées en fonction des variables environnementales à l’aide de GAMs (Generalized Additive Models, Hastie & Tibshirani 1990). La raison de l’utilisation de ce type de modèle est qu’il ne requiert pas que les relations soient linéaires. Il est en effet facile d’imaginer à quel point les phénomènes biologiques ne sont pas linéaires. Les GAMs permettent ainsi plus de flexibilité par l’intégration de fonctions de lissage:

[ ]

= +

k ki k i f z l E g ( )

β

0 ( ), i=1,…,n

Où g est la fonction de lien entre les valeurs attendues de distance d’attente E(li) et les covariables explicatives,

β

0est l’intercepte, fk sont les fonctions de lissage des covariables explicatives, zki est la valeur de la kième covariable explicative à la iième observation, et n est le nombre d’observation.

Le lissage optimal est fixé par la fonction mgcv du logiciel R afin de limiter la flexibilité offerte par les fonctions de lissage. Une flexibilité excessive aboutirait à exagérer l’ajustement aux données par un lissage avec autant de degré de liberté qu’il y a de points, ce qui en ferait un mauvais prédicateur. Cependant, la décision d’inclure ou de retirer une covariable du modèle n’est pas automatique. La procédure de décision proposée par Wood (2001), essentiellement basée sur la valeur de validation croisée généralisée (generalized cross validation, GCV), a donc été utilisée. Le GCV estime l’efficacité de la prédiction d’observations non utilisées dans l’ajustement du modèle. Il choisit donc le modèle qui ajuste au mieux les données et qui présente également une prédiction efficace.

La densité de surface D est alors estimée à l’aide de la distance d’attente, par la relation inverse (plus la distance entre 2 détections est courte, plus la densité est élevée) démontrée par Hedley (2000) :

1 1 2 1 ) 0 , ( + + =i i l µ x D

Où µ est la largeur de bande effective (estimée par la fonction de détection par la méthode de distance sampling), et l la distance d’attente. D est la densité de groupe, et il faut multiplier par la taille de groupe E[s] pour obtenir la densité totale. L’abondance est estimée en intégrant l’ensemble des densités (=pixels) de la zone voulue sur la carte de prédiction. La méthode de bootstrap non-paramétrique permet de calculer un intervalle de confiance (à 95%) des estimations d’abondance. Pour ceci, le trajet a été choisi comme unité de ré-échantillonnage (1000 échantillons avec remise).

D. Résultats: interactions échelles-dépendantes entre les