• Aucun résultat trouvé

Résumé

La compréhension des motifs de distribution d’espèces est aujourd’hui un aspect essentiel dans de nombreuses études à large échelle spatiale. Cependant, dans des zones vastes comme l’océan Austral, l’effort d’échantillonnage est très hétérogène compte tenu de son accès difficile et des conditions climatiques extrêmes. Les modèles de niche écologique (MNE) représentent alors une alternative efficace pour prédire la répartition des espèces et tenter de combler certaines lacunes. Cependant, de nombreux facteurs peuvent générer des biais dans la performance prédictive des modèles et les projections spatiales. Dans le présent chapitre, j’ai donc cherché à tester si des MNE fiables pouvaient être générés pour des organismes marins benthiques à l’échelle de l’océan Austral. J’ai cherché à identifier les principaux facteurs à grande échelle qui déterminent la distribution des espèces sélectionnées. La robustesse des MNE a donc été testée en fonction de l’effort d’échantillonnage, de la taille des niches des espèces ainsi que de leur biogéographie. Cette approche est particulièrement pertinente dans une démarche qui cherche à évaluer les états des habitats et écosystèmes marins dans un contexte de changement climatique. Elle est notamment adoptée dans le cadre du développement de stratégies de conservation durable. On ne peut en effet s’évertuer à produire des modèles de distribution futurs si les modèles actuels ne sont pas fiables et robustes. A cette fin, l’impact de l’effort d’échantillonnage a été testé à l’aide de deux ensembles de données : un ensemble contenant toutes les données disponibles jusqu’en 2005 et un second contenant toutes les données disponibles jusqu’en 2015, y compris les données des campagnes menées lors du Census of Antarctic Marine Life (CAML) et de l’année polaire internationale (API) (2005-2010). La précision des MNE a ensuite été testée en utilisant une approche de vérification de terrain ou « ground-truthing » en comparant les données récentes de présences/absences collectées pendant la période du CAML et de l’API aux prédictions du modèle pré-CAML.

Nos résultats montrent l’importance de l’approche des MNE et du rôle des facteurs abiotiques en tant que facteurs influençant la distribution des espèces à large échelle spatiale. L’ajout de données récentes aux modèles a considérablement amélioré les prédictions des MNE et modifié les contributions respectives des prédicteurs environnementaux. Cependant, l’intensité des changements entre les modèles, d’une période à une autre, a évolué en fonction des outils d’échantillonnage, de la largeur de la niche écologique des espèces et de la présence de barrières biogéographiques à la dispersion.

Enfin, il faut souligner la nécessité et le besoin d’apport de nouvelles données et l’importance de l’approche de vérification de terrain pour tester la précision des MNE. L’importance des données collectées par le biais d’initiatives internationales, telles que le CAML et l’API, est considérable, comme le démontre le présent travail, si l’on souhaite améliorer la modélisation de la distribution des espèces à de larges échelles spatiales. Enfin, les MNE constituent bien des outils cohérents dans le cadre de mise en place de stratégies de conservation, en particulier dans le contexte du changement climatique actuel et de la mise en place d’un réseau d’Aires Marines Protégées dans l’océan Austral.

Ce chapitre a fait l’objet d’une publication acceptée dans Diversity and Distribution (Appendice 17): Fabri-Ruiz, S., Danis, B., David, B., Saucède, T. (2018) Can we generate robust Species Distribution Models at the scale of the Southern Ocean? Diversity and Distribution

I. Introduction

La distribution des espèces est le résultat d’un jeu d’interactions complexes entre facteurs historiques, géologiques et climatiques, et facteurs actuels, océanographiques et écologiques. L’histoire paléogéographique de l’océan Austral a été marquée, au Cénozoïque, par la séparation de l’Australie et de l’Antarctique d’une part, et l’ouverture du passage de Tasmanie, et la séparation entre l’Antarctique et l’Amérique du Sud d’autre part, et l’ouverture du passage de Drake. Cette évolution paléogéographique a permis la mise en place puis le renforcement du Courant Circumpolaire Antarctique (CCA) et l’isolement partiel du biota Antarctique du reste des océans (Eastman, 2000; Clarke et al., 2004; Brandt, 2005). Le refroidissement de l’océan et les oscillations climatiques associées aux cycles glaciaires/interglaciaires ont également fortement influencé l’évolution de la biodiversité marine antarctique au Cénozoïque (Allcock & Strugnell, 2012). La biodiversité antarctique actuelle présente des caractéristiques biogéographiques et des traits d’histoire de vie uniques, comprenant des niveaux d’endémisme élevés (Brandt et al., 2007b; Griffiths et al., 2009; Kaiser et al., 2013; Saucède et al., 2014a), des adaptations aux températures froides proches du point de congélation de l’eau de mer (Eastman, 2000; Cheng & William, 2007; Portner et al., 2007), du gigantisme (Moran & Woods, 2012) et une forte proportion d’espèces incubant leurs juvéniles (David & Mooi, 1990; Hunter & Halanych, 2008; Sewell & Hofmann, 2011). Ces caractéristiques uniques font de l’océan Austral un laboratoire naturel fascinant pour les études écologiques, évolutives et biogéographiques (David & Saucède, 2015). Cependant, son éloignement et des conditions climatiques extrêmes font de l’océan Austral une région difficile d’accès pour mener à bien des missions de terrain qui impliquent de fortes contraintes logistiques et financières (Kaiser et al., 2013; Kennicutt et al., 2014; Gutt et al., 2018).

Au cours des dix dernières années, des efforts importants ont cependant été déployés pour améliorer notre connaissance de la biodiversité marine de l’océan Austral, notamment à travers le développement de collaborations internationales (Schiaparelli et al., 2013), l’amélioration des méthodes d’échantillonnage, le développement des technologies satellitaires, de véhicules téléguidés (ROV) et de véhicules sous-marins autonomes (AUV) (Kaiser et al., 2013; Gutt et al., 2018). Ainsi, dans le cadre du Census of Antarctic Marine Life (CAML) et de l’Année Polaire Internationale (API), 18 campagnes océanographiques ont été menées en Antarctique et de nouvelles données de biodiversité ont ainsi été acquises (Schiaparelli et al., 2013). Pendant la même période, plusieurs campagnes océanographiques ont également été menées dans les archipels subantarctiques de Crozet et de Kerguelen (Améziane et al., 2011; Féral et al., 2016). De nouvelles données sur la biodiversité marine ont été compilées et des ensembles de données ont été rendus disponibles via le SCAR Marine Biodiversity Information Network (SCAR-MarBIN) (Griffiths et al., 2011b; De Broyer et al., 2017) et l’Atlas Biogéographique de l’océan Austral (De Broyer et al., 2014). Néanmoins, des lacunes importantes persistent dans notre connaissance de la biodiversité marine dans l’océan Austral, car de nombreuses espèces n’ont pas encore été décrites mais aussi parce que les distributions des espèces sont encore mal comprises ou peu renseignées. Les zones sous-échantillonnées, telles que les eaux profondes (Brandt et al., 2014; Fabri-Ruiz et al., 2017), les régions isolées telles que la mer d’Amundsen ou encore l’île Bouvet (Griffiths et al., 2011b, 2014), restent très peu étudiées.

Les modèles de niche écologique (MNE) constituent un outil précieux qui peut contribuer à combler ces lacunes. Souvent utilisés pour la surveillance et la prévision de l’impact des changements environnementaux sur les espèces et leur répartition (Kennicutt et al., 2014; Gutt et al., 2015, 2018), les MNE sont employés dans le cadre du développement de stratégies de conservation et la définition d’Aires Marines Protégées (Rodríguez et al., 2007; Franklin, 2013; Guisan et al., 2013). Un nombre croissant d’études à grande échelle spatiale sur l’océan Austral utilise les MNE (Loots et al., 2007; Thiers et al., 2017). Des MNE ont été générés pour des espèces de plancton, des prédateurs supérieurs (phoque crabier, lion de mer, orque épaulard, rorqual), des poissons ou encore des céphalopodes (Duhamel et al., 2014; Xavier et al., 2016; Nachtsheim et al., 2017; Pinkerton et al., 2010). Les MNE élaborés pour les organismes benthiques antarctiques sont en revanche limités à quelques cas d’études comprenant des crevettes profondes (Basher & Costello, 2016), des cirripèdes (Gallego et al., 2017) ou encore des échinides (Pierrat et al., 2012b).

Une grande variété de méthodes de MNE a été développée (Elith et al., 2006; Elith & Graham, 2009). Chaque méthode présente ses propres limites (Beale & Lennon, 2012), que des solutions techniques permettent de contourner (Barry & Elith, 2006; Dormann et al., 2007, 2008; van Proosdij et al., 2016). Ainsi, l’effort d’échantillonnage (Clarke et al., 2007; Griffiths et al., 2011b), la taille de l’échantillon et l’ajout de nouvelles occurrences peuvent impacter l’exactitude des modèles, la qualité de leurs projections et leur performance prédictive (Wisz et al., 2008; Aguiar et al., 2015). La présence de biais dans les jeux de données spatiales reste également un problème fondamental pour les prédictions des MNE. Les occurrences provenant de bases de données sont souvent biaisées spatialement, les régions proches des stations scientifiques ou les régions faciles d’accès étant souvent plus fortement échantillonnées. Le biais spatial dans les données échantillonnées peut se traduire par un biais dans l’espace environnemental, c’est-à-dire que certaines parties de l’environnement seront mieux échantillonnées que d’autres. Elles pourraient ainsi avoir plus de poids dans le modèle et conduire à des inférences et des prédictions de distribution inexactes (Loiselle et al., 2008; Bystriakova et al., 2012; Fourcade et al., 2014; Stolar & Nielsen, 2015).

Des études récentes (Saupe et al., 2012; Qiao et al., 2015) ont mis en évidence que la performance des MNE était conditionnée par la taille des niches écologiques des espèces et par leur biogéographie. Les MNE réalisés pour des espèces présentant une grande niche écologique et une large aire de répartition ont tendance à être plus sensibles à la quantité de données disponibles que ceux réalisés pour des espèces aux niches étroites et aux aires de distribution restreintes (Hernandez et al., 2006; Tessarolo et al., 2014). Saupe et ses co-auteurs (2012) ont également exploré différentes configurations de facteurs qui limitent la distribution des espèces (facteurs de l’environnement abiotique et facteurs biogéographiques tels que les barrières à la dispersion). Cette étude fournit un cadre conceptuel pour tester si les MNE permettent de réaliser des modèles de distribution réalistes et si les distributions des espèces sont davantage influencées par l’environnement abiotique ou la biogéographie. On peut supposer que les espèces à forte capacité de dispersion devraient être davantage contraintes par l’environnement, comme dans les motifs de distribution de type Hutchinson’s Dream (Saupe et al., 2012), tandis que les espèces endémiques devraient être limitées

Peut-on générer des MNE fiables et robustes à l’échelle de l’océan Austral dans le cas d’organismes marins benthiques ? Quels sont les effets respectifs de l’effort d’échantillonnage, de l’écologie des espèces et de leur biogéographie sur la robustesse des modèles ? Dans le présent travail, j’ai cherché à évaluer la fiabilité et la robustesse des MNE à grande échelle dans l’océan Austral et testé l’impact de l’effort d’échantillonnage, de la niche écologique des espèces et de la biogéographie sur les résultats des modèles. Les échinides sont des organismes communs dans les communautés benthiques Antarctiques et occupent une large gamme d’habitats. L’impact de l’effort d’échantillonnage a été testé en utilisant les données de présences/absences de campagnes récentes réalisées pendant la période du CAML et de l’API. Pour tester la pertinence des MNE, cinq espèces d’échinides présentant des niches écologiques différentes (côtières ou profondes) et des traits d’histoire de vie contrastés (incubant les juvéniles ou présentant une larve planctonique dispersante) ont été sélectionnées. La biogéographie des espèces a été prise en compte, en particulier l’endémisme et les limites à la dispersion notamment par le Front Polaire. Considérant les données de présences des espèces et les descripteurs abiotiques de l’environnement, j’ai cherché à identifier les principaux facteurs qui expliquent la distribution des espèces sélectionnées à grande échelle en tenant compte des biais potentiels susceptibles d’avoir un impact sur les résultats du modèle.

II. Matériels et Méthodes

1. Données d’occurrence et espèces étudiées

Les données de distribution utilisées sont des occurrences d’espèces d’échinides compilées dans une base de données publiée par Fabri-Ruiz et ses collaborateurs (2017). Elle comprend des données d’échantillonnage de terrain collectées depuis l’expédition du Challenger en 1872 jusqu’aux récentes campagnes océanographiques menées jusqu’en 2015. Seules les données d’occurrence associées à une date d’échantillonnage connue ont été prises en compte.

Pour chaque espèce, les occurrences ont été subdivisées en deux ensembles de données : un premier ensemble incluant les données disponibles avant 2005 (avant la période du CAML), puis un second ensemble de données comportant toutes les occurrences connues jusqu’en 2015. Cinq espèces d’échinides ont été sélectionnées pour leurs caractéristiques autoécologiques et leurs distributions biogéographiques (Tableau 2). Elles se répartissent en deux familles: les Echinidae (Dermechinus horridus (Agassiz, 1878), Sterechinus diadema (Studer, 1876), et Sterechinus neumayeri (Meissner, 1900)), et les Cidaridae (Ctenocidaris nutrix (Thomson, 1876) et Rhynchocidaris triplopora (Mortensen, 1909)). La systématique des cinq espèces étudiées est confortée par des données moléculaires. Les espèces Sterechinus neumayeri et Sterechinus diadema ont été récemment identifiées comme des unités génétiques distinctes (Díaz et al., 2011); Ctenocidaris nutrix, Rhynchocidaris triplopora (Lockhart, 2006) et Dermechinus horridus (Saucède pers. comm.) font l’objet de travaux moléculaires en cours. S. neumayeri et R. triplopora sont distribués exclusivement dans les eaux antarctiques, au sud du Front Polaire, tandis que C. nutrix et S. diadema se trouvent de part et d’autre de celui-ci. D. horridus est une espèce subantarctique distribuée au nord du Front Polaire. Les espèces de Cidaridae sélectionnées sont incubantes alors que celles d’Echinidae sont dispersantes. La plupart des Cidaridae antarctiques incubent les juvéniles et ne présentent aucun

stade planctonique dans leur cycle de vie. Inversement, les Echinidae libèrent des larves planctotrophes. Ces traits d’histoire de vie contrastés suggèrent différentes capacités de dispersion et des distributions spatiales distinctes entre les espèces des deux familles.

Cidaridae Echinidae Ctenocidaris nutrix Rynchocidaris triplopora Dermechinus horridus Sterechinus diadema Sterechinus neumayeri Mode de

reproduction Incubant Incubant Disperseur Disperseur Disperseur Distribution Antarctique / Subantarctique Antarcticque Subantarctique Antarctique / Subantarctique Antarctique

Tableau 2 : Mode de reproduction et distribution des espèces étudiées

Ces espèces occupent des environnements contrastés. C. nutrix, R. triplopora et S. neumayeri sont essentiellement présentes dans les 500 premiers mètres de profondeur (Figure 55). S. diadema peut occasionnellement être trouvée plus profondément, au-delà de 1 000 mètres. L’espèce D. horridus affectionne particulièrement les zones de plateau océanique et de pente profonde. R. triplopora et S. neumayeri occupent des environnements avec de fortes salinités et de faibles températures, entre -1,8°C et 2°C (Figure 56). À l’inverse, C. nutrix et S. diadema sont présentes dans des gammes de température et de salinité de fond beaucoup plus larges, de -2 à 5°C pour la température de fond. D. horridus occupe, quant à elle, des environnements avec des températures supérieures à 2°C et des valeurs de salinité qui oscillent entre 34 et 34,5 psu.

Figure 55 : Gamme de profondeurs (mètres) occupée par les espèces sélectionnées.

Figure 56 : Gamme de températures (°Celsius) et de salinité de fond (psu) occupée par les espèces sélectionnées. Les points gris représentent l’ensemble des valeurs de température et de salinité de fond de la zone de projection du modèle.

2. Les descripteurs environnementaux

Les descripteurs environnementaux ont été sélectionnés pour leur pertinence écologique vis à vis des échinides, telle qu’établie dans des synthèses antérieures (David et al., 2005b). Ces descripteurs ont été compilés à partir de différentes sources (Fabri-Ruiz et al., 2017) et ajustés à la même taille de pixel (0,1°) en utilisant R 3.4 (R Core Team, 2017) et le package raster (Hijmans & van Etten, 2012). Préalablement à la modélisation, la colinéarité entre les variables a été vérifiée et supprimée en fonction des valeurs de coefficient de corrélation de Pearson calculées entre les paires de variables (r > 0.7) (Appendice 4). Une matrice de distance a été construite avec les coefficients de corrélation et une classification ascendante hiérarchique (la distance entre deux groupes correspond à la valeur maximale de toutes les paires de distances entre les éléments des deux groupes) a été réalisée en utilisant le package virtual species (Leroy et al., 2016).

Treize (pour les espèces antarctiques) ou douze (pour les espèces subantarctiques) prédicteurs environnementaux ont été sélectionnés : l’amplitude de la salinité de fond, l’amplitude de la salinité de surface, l’amplitude de température de surface, l’amplitude de température de fond, la concentration en chlorophylle a d’été, la géomorphologie, la profondeur, la concentration moyenne en oxygène de fond, la salinité de fond moyenne, la salinité de surface, la pente, la température de fond, et, pour les espèces présentes en Antarctique, la concentration en glace de mer. Les valeurs ont été moyennées sur [1955-2012] pour les données de températures, de salinité de fond et de surface et pour l’oxygène de fond. Les données d’amplitude ont été calculées en ôtant les moyennes d’été à celles d’hiver.

3. La modélisation

Plusieurs procédures de modélisation ont été testées avant de sélectionner l’approche la plus stable et présentant les performances prédictives les plus élevées (Appendice 3, Appendice 4). Les Random Forest (RF), une méthode d’apprentissage automatique, s’est avérée être la plus appropriée à notre étude (Breiman, 2001). Les modèles ont été réalisés en utilisant le package biomod2 (Thuiller et al., 2009) avec R 3.4 (R Core Team, 2017). Les paramètres utilisés pour calculer les RF sont : mtry = la racine carrée du nombre de variables, ntree = 500 et nodesize = 5. Pour chaque espèce, des modèles distincts ont été générés sur la base des jeux de données pré- et post-CAML.

Comme les données d’absences réelles n’étaient pas disponibles, des pseudo-absences ont été générées pour construire les modèles. Différentes stratégies de sélection des pseudo-absences sont disponibles dans la littérature en fonction du nombre de pseudo-absences, du nombre de réplicas et de la stratégie d’échantillonnage. Compte tenu de notre choix de modèle (RF), Barbet-Massin et al (2012) recommandent de sélectionner des pseudo-absences (pour les deux périodes) à 2° des enregistrements d’occurrence. Mille pseudo-absences ont été générées pour les deux périodes. Chaque ensemble de données a été subdivisé en deux sous-ensembles : un premier sous-ensemble de données comprenant 70% des données a été utilisé pour calibrer le modèle et un second sous-ensemble comprenant 30% des données a été utilisé pour tester et évaluer la robustesse du modèle. Les modèles ont finalement été projetés sur la zone d’étude définie. L’étendue de la zone d’étude

et al., 2010; Barve et al., 2011). Pour limiter l’extrapolation, les occurrences à plus de 2 500 mètres ont été retirées de l’analyse.

Depuis les premières expéditions en 1872, une grande variété de méthodes d’échantillonnage a été utilisée pour collecter des spécimens (Fabri-Ruiz et al., 2017). L’utilisation de méthodes d’échantillonnage différentes ne permet pas de travailler sur des données de présences/absences car tous les types d’instruments n’ont pas forcément été conçus pour échantillonner les espèces sélectionnées (Ghiglione et al., 2017). De ce fait, l’absence d’une espèce dans un échantillon ne peut être traduite comme une véritable absence. Les échantillons obtenus par capture accessoire peuvent être inclus dans les MNE utilisant des présences seules. Il n’a pas été possible de tester l’effet du type d’échantillonneur sur les modèles car cela aurait trop limité le nombre de données disponibles pour la construction de MNE robustes.

Un problème courant des MNE est de prédire des composantes inappropriées de l’espace environnemental qui sont sous-échantillonnées et qui peuvent correspondre à des zones géographiques spécifiques et restreintes. Pour corriger les biais d’échantillonnage, les données incluses dans le modèle ont été pondérées sur la base d’une carte de Kernel Density Estimation (Elith et al., 2010). Cette carte a été construite sur la base de toutes les occurrences d’échinides et générée à l’aide de Spatial Analyst dans ArcGIS. v10.2 (ESRI 2011).

L’autocorrélation spatiale (AS) constitue un problème critique des analyses spatiales en écologie lorsque les valeurs des variables géographiquement proches ne sont pas indépendantes (Legendre, 1993). L’AS présente dans les résidus des MNE viole l’hypothèse « d’erreurs indépendantes » et peut augmenter artificiellement les erreurs commission, c’est à dire le nombre de faux positifs. L’espèce est prédite présente alors qu’elle est absente. Pour corriger l’AS dans nos modèles, plusieurs réplicas de pseudo-absence ont été générés lors de la calibration. Par la suite, l’AS a été quantifiée sur les résidus à l’aide de l’indice du I de Moran en utilisant les outils de statistiques spatiales dans ArcGIS. Les réplicas présentant une AS significative ont été retirés. La projection du modèle a été réalisée avec 11 réplicas sans AS pour toutes les espèces, ce qui correspond au nombre minimum de réplicas sans AS obtenu pour toutes les espèces.

4. L’évaluation de la performance du modèle

L’évaluation quantitative de la performance du modèle permet de déterminer l’adéquation entre les modèles obtenus et les données d’occurrence observées. Dans les MNE, les modèles sont rarement testés a posteriori en effectuant une vérification directement sur le terrain (Costa et al., 2010), car cela implique des problèmes logistiques et financiers majeurs. D’anciennes études ont souligné comment la taille de l’échantillon pouvait affecter les modèles de distribution (Hernandez et al., 2006; Wisz et al., 2008). Une solution à ce problème réside dans la dégradation du jeu de données initial en supprimant aléatoirement les occurrences et en testant l’impact sur la performance du modèle et les projections spatiales. La validation du modèle s’appuie généralement sur des métriques

Documents relatifs