• Aucun résultat trouvé

Cadre théorique et méthodologique

4. La modélisation statistique

4.1. Modéliser pour expliquer ou pour prédire ?

L’utilisation des modèles de distributions d’espèces est faite dans un objectif explicatif et/ou prédictif (Araujo & Guisan 2006, Elith & Leathwick 2009). Dans certains cas, les modèles peuvent permettent de comprendre les processus à l’origine des patrons écologiques ou des relations entre une espèce et son environnement (Heikkinen et al. 2007). Dans ce cas, l’objectif est de savoir si la combinaison des variables explicatives introduites dans le modèle statistique permet d’expliquer correctement les variations de la variable réponse. On mesure le degré de concordance entre les observations et les valeurs ajustées par le modèle (Pearce & Ferrier 2000). Pour quantifier cette performance, différentes mesures existent selon le type de méthodes statistiques. Il peut s’agir par exemple d’un R² pour les modèles linéaires ou d’un pourcentage de déviance expliquée pour les GLMs (Modèle Linéaire Généralisé) et les GAMs (Modèle Additif Généralisé).

Dans d’autres cas, les SDMs sont extrapolés pour prédire la distribution des espèces dans des domaines géographiques non échantillonnés (e.g. Randin et al. 2006, McAlpine et al. 2008, Vallecillo et al. 2009). Ces modèles peuvent être également couplés à de multiples scénarios alternatifs d’évolution de l’environnement (e.g. du climat ou des paysages) pour évaluer les impacts des changements environnementaux potentiels sur les communautés d’espèces (e.g. Jetz et al. 2007, Buisson & Grenouillet 2009). Cet intérêt pour la prédiction s’est considérablement développé dans les études des dernières années (Guisan & Thuiller 2005). Il s’agit de quantifier la capacité du modèle statistique calibré à reproduire une distribution observée de présence-absence ou d’abondance. Différents types de mesures existent pour évaluer les performances des modèles à prédire des présence-absence, par exemple l’AUC de courbe ROC (Area Under the Curve of Receiver Operating Characteristic) ou à prédire des abondances, par exemple le coefficient de corrélation de rang de Spearman. Dans cette thèse, j’ai construit différents modèles soit à visée explicative et/ou prédictive en fonction des objectifs posés (voir Tableau 1 du Chapitre 2).

4.2. De nombreuses méthodes mathématiques disponibles

Deux grands groupes de méthodes statistiques sont couramment utilisés dans la littérature dans un objectif explicatif. Le premier groupe est celui des méthodes de régression (e.g. Modèle Linéaire, GLM ou encore GAM). Ces méthodes sont univariées car une seule variable réponse est reliée à plusieurs variables explicatives (e.g. Sanderson et al. 2009, Wretenberg et al. 2010). Les méthodes de régressions sont largement utilisées par les écologues et elles peuvent être étendues à des types de données complexes. Par exemple, quand le nombre de zéros (i.e. absences) est tellement important que les données ne peuvent pas s’ajuster à des distributions standards (e.g. la distribution de poisson pour des données d’abondance), l’ensemble de données est dit ‘gonflé à zéro’. Dans ce cas, les méthodes classiques de régressions (comme par exemple un GLM avec une distribution de poisson) ne sont pas adaptées. Des modèles alternatifs comme les modèles ‘gonflés à zéros’ ou les modèles

mélangés ont été développés pour remédier à ce problème (Martin et al. 2005,Potts & Elith 2006). Dans cette thèse, j’ai utilisé ces types de modèles dans le chapitre 1 de la partie 2 pour modéliser des abondances d’espèces. Le deuxième groupe est celui des méthodes d’ordination (e.g. Analyse Canonique des Correspondances (CCA), Ordination quadratique sous contraintes (CQO)) dans lesquelles les espèces sont ordonnées le long de gradients qui sont des combinaisons linéaires des variables explicatives. Ces méthodes sont multivariées car plusieurs variables réponses (e.g. la distribution de plusieurs espèces) sont simultanément reliées aux variables explicatives (e.g. Cushman & MacGarigal 2004, Sirami et al. 2007).

Plus récemment, des chercheurs ont spécialement développé des méthodes pour la prédiction, incluant les méthodes de classification et les méthodes par apprentissage (e.g. les réseaux de neurones artificiels, Lek & Guégan 1999, Olden et al. 2004, Monteil et al. 2005 et les forêts d’arbres décisionnels, Prasad et al. 2006, Cutler et al. 2007). Certaines de ces méthodes fournissent des sélections de variables et des estimations de coefficient bien contrôlées, et plusieurs sont capables de détecter et d’ajuster automatiquement des interactions entre variables prédictives (Elith & Leathwick 2009). En conséquence, les performances prédictives de ces nouvelles méthodes peuvent dépasser celles des techniques plus conventionnelles (Elith et al. 2006). La nature complexe et parfois ‘boite noire’ de ces techniques a probablement limité leur utilisation, particulièrement pour les études se focalisant sur l’interprétation écologique des modèles. Cependant, des outils pour visualiser et résumer les sorties de ces modèles sont en développement (Monteil et al. 2005, Elith & Leathwick 2009).

En fonction des objectifs des études et des types de variables réponses mesurées, j’ai utilisé différentes méthodes statistiques mentionnées dans le Tableau 1 du Chapitre 2. La justification du choix de ces méthodes est détaillée dans les différents chapitres du manuscrit.

Références

Araujo, M. B., and A. Guisan. 2006. Five (or so) challenges for species distribution modelling. Journal of Biogeography 33:1677-1688.

Austin, M. P. 2002. Spatial prediction of species distribution: an interface between ecological theory and statistical modelling. Ecological Modelling 157:101-118.

Buisson, L., and G. Grenouillet. 2009. Contrasted impacts of climate change on stream fish assemblages along an environmental gradient. Diversity and Distributions 15:613-626.

Changhui, P. 2000. From static biogeographical model to dynamic global vegetation model: a global perspective on modelling vegetation dynamics. Ecological Modelling 135:33-54.

Cushman, S. A., and K. MacGarigal. 2004. Hierachical analysis of forest bird species-environment relationships in the Oregon Coast Range. Ecological Applications 14:1090-1105.

Cutler, D. R., T. C. Edwards, K. H. Beard, A. Cutler, K. T. Hess, J. Gibson, and J. J. Lawler. 2007. random forests for classification in ecology. Ecology 88:2783-2792.

Dullinger, S., T. Dirnbock, and G. Grabherr. 2004. Modelling climate change-driven treeline shifts: relative effects of temperature increase, dispersal and invasibility. Journal of Ecology 92:241-252.

Elith, J., H. Graham, P. Anderson, M. Dudik, S. Ferrier, A. Guisan, J. Hijmans, F. Huettmann, R. Leathwick, A. Lehmann, J. Li, G. Lohmann, A. Loiselle, G. Manion, C. Moritz, M. Nakamura, Y. Nakazawa, C. M. Overton, P. A. Townsend, J. Phillips, K. Richardson, R. Scachetti-Pereira, E. Schapire, J. Soberon, S. Williams, S. Wisz, and E. Zimmermann. 2006. Novel methods improve prediction of species' distributions from occurrence data. Ecography 29:129-151.

Elith, J., and J. R. Leathwick. 2009. Species Distribution Models: Ecological Explanation and Prediction Across Space and Time. Annual Review of Ecology Evolution and Systematics 40:677-697.

Elton C. S. 1927. Animal ecology. University of Chicago Press.

Grinnell, J. (1917). The niche-relationships of the California Thrasher. Auk 34: 427–433.

Guisan, A., and W. Thuiller. 2005. Predicting species distribution: offering more than simple habitat models. Ecology Letters 8:993-1009.

Guisan, A., and N. E. Zimmermann. 2000. Predictive habitat distribution models in ecology. Ecological Modelling 135:147-186.

Hanski I. 1999. Metapopulation ecology. Oxford University Press.

Heikkinen, R. K., M. Luoto, R. Virkkala, R. G. Pearson, and J. H. Korber. 2007. Biotic interactions improve prediction of boreal bird distributions at macro-scales. Global Ecology and Biogeography 16:754-763.

Heinanen, S., and M. von Numers. 2009. Modelling species distribution in complex environments: an evaluation of predictive ability and reliability in five shorebird species. Diversity and Distributions 15:266-279.

Hutchinson, G.E. (1957). Concluding remarks. Cold Spring Harbor Symposia on Quantitative Biology 22 (2): 415–427

Jetz, W., D. S. Wilcove, and A. P. Dobson. 2007. Projected impacts of climate and land-use change on the global diversity of birds. Plos Biology 5:1211-1219.

Kearney, M., and W. P. Porter. 2004. Mapping the fundamental niche: physiology, climate, and the distribution of a nocturnal lizard. Ecology 85:3119-3131.

Lek, S., and J. F. Guégan. 1999. Artificial neural networks as a tool in ecological modelling, an introduction. Ecological Modelling 120:65-73.

Lilleskov, E. A., and J. L. Parrent. 2007. Can we develop general predictive models of mycorrhizal fungal community-environment relationships? New Phytologist 174:250-256.

Martin, T. G., B. A. Wintle, J. R. Rhodes, P. M. Kuhnert, S. A. Field, S. J. Low-Choy, A. J. Tyre, H. P. Possingham, and M. Anderson. 2005. Zero tolerance ecology: improving ecological inference by modelling the source of zero observations. Ecology Letters 8:1235-1246.

McAlpine, C. A., J. R. Rhodes, M. E. Bowen, D. Lunney, J. G. Callaghan, D. L. Mitchell, and H. P. Possingham. 2008. Can multiscale models of species' distribution be generalized from region to region? A case study of the koala. Journal of Applied Ecology 45:558-567.

Monteil, C., M. Deconchat, and G. Balent. 2005. Simple neural network reveals unexpected patterns of bird species richness in forest fragments. Landscape Ecology 20:513-527.

Olden, J. D., M. K. Joy, and R. G. Death. 2004. An accurate comparison of methods for quantifying variable importance in artificial neural networks using simulated data. Ecological Modelling 178:389-397.

Potts, J. M., and J. Elith. 2006. Comparing species abundance models. Ecological Modelling 199:153-163.

Prasad, A., L. Iverson, and A. Liaw. 2006. Newer Classification and Regression Tree Techniques: Bagging and Random Forests for Ecological Prediction. Ecosystems 9:181-199.

Pulliam, H. R. 2000. On the relationship between niche and distribution. Ecology Letters 3:349-361.

Randin, C. F., T. Dirnbock, S. Dullinger, N. E. Zimmermann, M. Zappa, and A. Guisan. 2006. Are niche-based species distribution models transferable in space? Journal of Biogeography 33:1689-1703.

Sanderson, F., A. Kloch, K. Sachanowicz, and P. Donald. 2009. Predicting the effects of agricultural change on farmland bird populations in Poland. Agriculture, Ecosystems & Environment 129.

Sirami, C., L. Brotons, and J. L. Martin. 2007. Vegetation and songbird response to land abandonment: from landscape to census plot. Diversity and Distributions 13:42-52.

Vallecillo, S., L. Brotons, and W. Thuiller. 2009. Dangers of predicting bird species distributions in response to land-cover changes. Ecological Applications 19:538-549.

Vanreusel, W., Maes, D., and Van Dyck H. 2007. Transferability of Species Distribution Models: a FunctionaHabitat Approach for Two Regionally Threatened Butterflies. Conservation Biology 21:201- 212

Vetaas, O. R. 2002. Realized and potential climate niches: a comparison of four Rhododendron tree species. Journal of Biogeography 29:545-554.

Wretenberg, J., T. Part, and A. Berg. 2010. Changes in local species richness of farmland birds in relation to land-use changes and landscape structure. Biological Conservation 143:375-381.

Chapitre 2

Ensembles de données biologiques

Documents relatifs