• Aucun résultat trouvé

MODELES DE DISTRIBUTION PAR LES VARIABLES PAYSAGERES DU PLATEAU OUEST (SI PLATEAU) PLATEAU OUEST (SI PLATEAU)

D 2 = Déviance nulle Déviance − Déviance nulle résiduelle (11)

3.4.2.2. MODELES DE DISTRIBUTION PAR LES VARIABLES PAYSAGERES DU PLATEAU OUEST (SI PLATEAU) PLATEAU OUEST (SI PLATEAU)

Dans ce chapitre, nous développons un modèle de distribution de la richesse spécifique adapté à la prédiction sur la région biogéographique du plateau ouest (GONSETH et al., 2001). Cette zone est plus vaste et elle est actuellement dénuée d'informations à cette échelle. Pour ce faire, nous nous sommes basés sur le second système d'informations avec des données disponibles pour l'ensemble de la zone et qui proviennent uniquement de l'OFT (chapitre 3.3.1.2). L'objectif est de proposer une méthode d'estimation rapide de la richesse spécifique floristique en identifiant les hot spots potentiels. Le but poursuivi est d'optimiser les ressources disponibles pour la conduite d'inventaires sur le terrain.

L'objectif de cette modélisation est de pouvoir, à partir d'un modèle GAM calibré sur le canton de Genève, extrapoler un modèle de prédiction de la RST potentielle pour l'ensemble du plateau ouest (Figure 32). Le développement de ce modèle, pour être cohérent, doit se faire sur une zone la plus homogène possible en terme de conditions climatiques, de géomorphologie et d'occupation du sol (OFFICE FEDERALDELA STATISTIQUE, 2001). Nous nous sommes donc restreints à la région du plateau qui regroupe la partie ouest du Bassin lémanique et rhénan (région 21) et le Plateau occidental (région 22) au sens du découpage de la Suisse en régions biogéographiques (GONSETH et al., 2001;

Figure 32). Cette zone représente 5'512 kilomètres carrés, avec une amplitude altitudinale de 868 mètres. Il faudra être attentif à ce dernier point si des variables concernant l'altitude sont retenues dans le modèle final. En effet, si ce cas se présente, on sortirait de l'enveloppe environnementale de la zone de calibration pour le facteur altitude. Par conséquent, il faudra restreindre la zone de prédiction pour être cohérent avec l'amplitude altitudinale de la zone de calibration.

Région 21 (ouest)

Région 22

Région 21 (ouest)

Région 22

Figure 32: Régions biogéographiques de Suisse. En gras: zone de prédiction.

Cette prédiction sera réalisée avec une résolution d'un kilomètre carré. Le but poursuivi est double:

1. Pouvoir rapidement identifier, à l'échelle d'une région, les hot spots potentiels de richesse floristique. En effet, les inventaires exhaustifs sont coûteux, que ce soit en terme de ressources humaines (compétences entre autres), temporelles et financières (par exemple sur Genève: 30 personnes pendant 12 ans, chapitre 2.2.4.6; SCHMILL, 2001; LATOUR, com. pers.). Ils sont néanmoins indispensables, si des plans de gestion ou des mesures de conservation doivent être pris pour une espèce particulière. En effet, des connaissances tant quantitatives que qualitatives de ce qu'on désire protéger sont nécessaires (KÄSERMANN et MOSER, 1999). On peut ainsi définir une stratégie d'échantillonnage spatiale dirigée, afin de réduire les coûts (financiers, humains et temporels) lors de l'identification de ces zones de haute richesse spécifique (hot spots potentiels);

2. Déterminer les facteurs du paysage qui influencent la répartition de la RST à cette échelle.

Le but de cette modélisation est donc essentiellement prédictif. Dans ce cadre, la modélisation est utile à cause:

• De la grande échelle spatiale considérée dans l'étude sur le paysage;

• Des différents composants et processus considérés;

• Des difficultés en terme de ressources (temporelles et financières) associées avec des études sur la richesse floristique de cette envergure.

Une méthode couramment utilisée pour pallier à la méconnaissance de la répartition de la diversité lors d'inventaires est l'échantillonnage selon les gradients environnementaux les plus marqués d'une région (GILLISON et BREWER, 1985; AUSTIN et HEYLIGERS, 1989;

NICHOLLS, 1989; WESSELS et al., 1998). L'hypothèse est qu'en échantillonnant l'ensemble de ces gradients, on aura relevé l'ensemble de la diversité (WESSELS et al., 1998). Cette méthode est plus efficace (rapport taux d'effort / résultats) que le relevé le long de transects placés au hasard. Une autre possibilité proche étant de faire un échantillonnage stratifié au hasard (spécifique des habitats; WESSELS et al., 1998). Le biais de cette méthode est qu'en fait on reporte le problème de l'échantillonnage sur les variables environnementales (qui souffrent elles aussi inévitablement d'un biais; AUSTIN

et HEYLIGERS, 1989; WESSELS et al., 1998). Pour une revue des différentes méthodes d'échantillonnage et de leur efficacité respective, on peut avantageusement consulter KOOP (1990), GIBBONS et al., (1997), TOWNSEND PETERSON et SLADE (1998) et HIRZEL et GUISAN (2002).

L'optimisation des zones d'échantillonnage est courante dans les études sur la faune, la végétation, la flore, ou les espèces rares (MICHAELSEN et al., 1994; WALSH et DAVIS, 1994;

NELDNER et al., 1995; GIBBONS et al., 1997; TOWNSEND PETERSON et SLADE, 1998; YOCCOZ

et al., 2001). La plupart du temps, l'objectif visé est la création de réserves qui englobent le maximum de diversité pour un groupe faunistique ou floristique donné (BELBIN, 1995; FAITH et WALKER, 1996; FREITAG et al., 1997; LOMBARD et al., 1997; MURIUKI

et al., 1997; ARAUJO, 1999; POLASKY et al., 2000).

Au terme de cette étude, nous pourrons confronter différentes méthodes d'échantillonnage. Ainsi, on comparera entre elles la méthode d'échantillonnage au hasard, la stratégie dirigée, définie par notre modèle, et la méthode optimale déterminée par LATOUR (2003).

La procédure de modélisation est similaire à celle exposée pour la modélisation de la richesse spécifique avec le Si BIOLAND. Néanmoins, nous disposons cette fois d'un set de données d'entraînement (sur Genève) et d'un set pour la prédiction. Nous calibrons les modèles grâce aux données de terrain existantes sur Genève (point 2.3) et nous prédisons une richesse spécifique potentielle à l'aide des variables paysagères. Les résultats seront notamment comparés avec des données existantes, ainsi qu'avec d'autres modèles similaires développés dans la même zone géographique (WELTEN et SUTTER, 1982; WOHLGEMUTH, 1998).

3.4.2.3. MODELES DE DISTRIBUTION PAR LES VARIABLES TAXONOMIQUES Finalement, nous allons nous intéresser à la structure et à la composition floristique de la richesse spécifique totale. Dans cette optique, nous allons étudier l'utilisation de niveaux taxonomiques supérieurs (genre, famille) pour prédire la richesse spécifique. Il s'agit de réduire l'exhaustivité spécifique (nombre d'espèces) lors de la détermination de zones de haute richesse spécifique (hot spots) et d'utiliser les genres et/ou les familles comme palliatifs à la connaissance de la richesse spécifique totale. Par conséquent, les buts poursuivis sont (1) d'analyser la composition de la RST et (2) de réduire le nombre d'espèces à échantillonner et de réduire le taux de connaissance nécessaire dans l'évaluation de la richesse spécifique totale (WILLIAMS et GASTON, 1994; MARGULES et PRESSEY, 2000). Il s'agira donc d'identifier quels sont les genres et les familles qui représentent le mieux la richesse spécifique totale du canton de Genève. Pour ce faire, nous allons dans ce cas modéliser la RST à partir de la RS générique et de la RS en famille. Nos variables explicatives sont, dans chaque cas, le nombre d'espèces par genre par maille kilométrique et le nombre d'espèces par famille par maille (chapitre 3.1.3).

Comme nous ne disposons dans ce cas que d'un seul type de variables explicatives, un seul set de modèles sera développé dans chaque cas.

3.4.3. Richesse spécifique des espèces menacées - Modèles de distribution par les variables paysagères du Canton de Genève (SI BIOLAND)

Dans ce chapitre, nous nous intéresserons à la RS des espèces menacées selon les catégories UICN de la Liste Rouge (LANDOLT, 1991; chapitre 3.2.3). Comme pour la modélisation de la RST par les variables paysagères, l'objectif de cette modélisation est descriptif et inférentiel. Dans ce cas particulier, il s'agit de préciser quelles sont les composantes du paysage genevois qui influencent ce groupe d'espèces.

La procédure décrite sera appliquée pour modéliser la distribution de la richesse spécifique brute des espèces menacées (Figure 29, chapitre 3.4.1). A la vue de l'expérience acquise lors de la précédente modélisation (RST), seuls trois sets de modèles seront développés (A, B et D).

Finalement, un second modèle sera étudié concernant la distribution de la richesse spécifique relative des espèces menacées (pondération par la RST). Le but est d'évaluer quelle mesure de la richesse spécifique des espèces menacées est la plus pertinente pour des modélisations de ce type (richesse spécifique brute versus richesse spécifique

relative des espèces menacées). Dans ce cas, et pour la même raison que précédemment, seuls deux sets seront développés (B et D).

Cette modélisation doit permettre d’aborder plus spécifiquement les problèmes de conservation des espèces sensibles. Dans ce cas, les hypothèses testées sont:

● Les variables paysagères permettent également de prédire la répartition potentielle de la richesse spécifique des espèces menacées. Par conséquent, certaines variables paysagères influencent de manière positive ou négative la distribution de la richesse spécifique (WESSELS et al., 1999); ainsi, ces variables peuvent servir d'indicateurs de la richesse floristique en espèces menacées;

● Les activités humaines sont la cause principale de menace pesant sur les espèces. C'est également un facteur important induisant la raréfaction. Par conséquent, les pôles environnement transformé, infrastructures anthropiques et influences humaines interviennent de manière plus marquée dans cette modélisation.

3.4.4. Richesse spécifique des espèces rares - Modèles de distribution par les variables paysagères du Canton de Genève (SI BIOLAND)

A ce niveau, nous nous intéresserons à la RS des espèces rares (taxons présents dans moins de 15 unités d'échantillonnage; chapitre 3.2.4). L'objectif est toujours descriptif et inférentiel. Il s'agit d'identifier les influences du paysage sur ce groupe sensible d'espèces et de comparer ce résultat avec les précédents concernant la RS des espèces menacées.

Exactement la même procédure que décrite précédemment sera appliquée pour modéliser la richesse spécifique brute des espèces rares (Figure 29, chapitre 3.4.1). Vu le nombre plus faible de variables explicatives avec un D2 supérieur à 10.0 % pour les modèles univariés, nous n'avons pas développé de set B de modèles (par couche d'informations). Ainsi, nous n'avons réalisé que deux sets de modèles (A et D).

Cette modélisation poursuit le même but que la précédente, à savoir, permettre d’aborder plus spécifiquement les problèmes de conservation des espèces rares. Les hypothèses testées restent les mêmes:

● Les variables paysagères permettent également de prédire la répartition potentielle de la richesse spécifique des espèces rares. Par conséquent, certaines variables paysagères influencent de manière positive ou négative la distribution de la richesse spécifique (WESSELS et al., 1999); ainsi, ces variables peuvent servir d'indicateurs de la richesse floristique en espèces rares;

● Les activités humaines sont la cause principale de menace pesant sur les espèces. C'est également un facteur important induisant la raréfaction. Par conséquent, les pôles environnement transformé, infrastructures anthropiques et influences humaines interviennent de manière plus marquée dans cette modélisation.

Il s'agira d'approcher le mode de distribution de ce groupe et de clarifier si la conservation de ce dernier nécessite des mesures particulières par rapport au groupe précédent des espèces menacées. Ces deux groupes sont issus de concepts différents.

Le premier découle d'une classification de la part d'experts selon des critères subjectifs, alors que la seconde est une classification selon un seuil limite de fréquence, qui est une

"mesure" absolue (critère objectif).

4. RESULTATS

4.1. Richesse spécifique totale

4.1.1. Modèles de distribution par les variables paysagères du Canton de Genève

Le premier modèle GAM a été élaboré pour mettre en relation la Richesse Spécifique Totale (RST) par kilomètre carré avec les variables du paysage (composition et structure). Le but poursuivi est prédictif et consiste dans l'isolement des variables paysagères (VP) qui expliquent le mieux la distribution de la richesse floristique à l'échelle cantonale. Sur cette base, nous essaierons de dégager des causalités par rapport aux variables explicatives retenues. Dans un premier temps, l'ensemble des 302 unités d'échantillonnage ont été intégrées dans les modèles, ce qui représente la totalité de l'effort d'échantillonnage (la surface N° 40 a été rattachée à la surface N° 39).

Comme le nombre de variables intégrées simultanément dans un modèle ne peut être qu'au maximum de 25, nous avons été obligé de réaliser plus de 60 modélisations afin de tester les différentes combinaisons possibles de variables explicatives. Les résultats de l'ensemble des modèles sont donnés en annexe (annexe 9.14). Ainsi, on trouvera les variables retenues dans chaque modèle de distribution (drop contribution > 0), ainsi que la déviance expliquée par le modèle (D2).

Les modèles (N° 1 à 6, annexe 9.14) issus du premier set (A) ont, d'une manière générale, une déviance expliquée qui décroît logiquement au fur et à mesure qu'on intègre des variables explicatives avec un D2 plus faible pour le modèle univarié. Le meilleur modèle retient 10 variables pour un D2 de 79.0 % (modèle N° 2). Il s'agit de VP liées aux constructions, à la longitude, à la végétation naturelle, au Modèle Numérique d'Altitude, ainsi qu'à la pédologie et au réseau hydrologique. Le D2 moyen des modèles de ce set est de 67.2 % et un r moyen de validation de 0.82 (validation croisée, r moyen = 0.75).

Dans le deuxième set (B) de huit modèles (N° 7 à 14, annexe 9.14), les variables explicatives ont été testées par couche d'informations d'origine. On a ainsi développé des modèles avec uniquement des variables sur la végétation naturelle (N° 7), la géomorphologie (N° 8), le Modèle Numérique d'Altitude (N° 9), l'hydrologie (N° 10), les infrastructures anthropiques (N° 11), l'inventaire de la zone agricole (N° 12), les surfaces de compensation écologique (N° 13), ainsi qu'un modèle (N° 14) qui regroupait toutes les autres variables insuffisamment représentées pour justifier le développement d'un modèle propre. Mis à part ce dernier, qui regroupe des variables trop hétérogènes, la couche d'informations la plus explicative est la végétation naturelle (Modèle N° 7; 5 variables retenues sur 16; D2 = 60.8 %). Viennent ensuite l'hydrologie

(N° 10; 4 variables retenues sur 13; D2 = 60.0 %), le Modèle Numérique d'Altitude (N°

9; 5 variables retenues sur 12; D2 = 55.0 %), la géomorphologie (N° 8; 3 variables retenues sur 5, D2 = 52.7 %), les infrastructures anthropiques (N° 11; 4 variables retenues sur 22; D2 = 52.7 %), l'inventaire de la zone agricole (N° 12; 3 variables retenues sur 23; D2 = 27.3 %) et les surfaces de compensation écologique (N° 13; 1 variables retenues sur 13; D2 = 16.8 %). Les types d'indices retenus sont, dans l’ordre, des indices quantitatifs (13 variables sur 30), géométriques (12 variables sur 30), de distance (4 variables sur 30), et de diversité (1 variables sur 30). Le D2 moyen est de 48.4 %, le r de validation égale 0.68 et le r moyen de validation croisée égale 0.63.

Dans le troisième set (C) de cinq modèles (N° 15 à 19, annexe 9.14), les variables ont été regroupées selon le type d'informations qu'elles apportent: quantitatif, géométrique, distance, lien et diversité (catégories d'indices, Tableau 7, chapitre 3.3.2.4.1). Le meilleur modèle (N° 15) intègre 8 variables explicatives sur 21, concernant les indices quantitatifs avec un D2 de 75.0 %. En deuxième position, on trouve les indices géométriques (N° 19; 7 variables retenues sur 19; D2 = 71.4 %), les indices de diversité (N° 18; 3 variables retenues sur 4; D2 = 56.1 %), puis les indices de lien (N° 17; 1 variable retenue sur 1; D2 = 37.7 %, résultat du modèle GAM univarié) et enfin les indices de distance (N° 16; 2 variables retenues sur 2; D2 = 28.1 %). La couche d’informations la plus représentée dans les jeux de variables retenues est la végétation naturelle (7 variables sur 21). Viennent ensuite le Modèle Numérique d’Altitude (5 variables sur 21), puis, à égalité, les infrastructures anthropiques et la géomorphologie (3 variables sur 21). La déviance moyenne expliquée égale 53.7 %, avec un r moyen de validation de 0.75 et un r moyen de validation croisée de 0.70.

Le quatrième set (D) inclut quarante-trois modèles (N° 20 à 62, annexe 9.14) qui réalisent notamment la synthèse des trois sets précédents. Nous avons recherché le meilleur jeu de données qui explique le plus de déviance de la RST, mais aussi le modèle le mieux validé et le plus robuste. Le choix du modèle a donc pris en compte la déviance expliquée (D2), les coefficients r de validation et de validation croisée, mais nous avons également procédé à une analyse visuelle des graphiques de courbes de réponses. Bien que l'ensemble de ces modèles soit parfois proche (déviance expliquée, coefficients r de validation et de validation croisée), le choix des variables explicatives, ainsi que la variation des contributions, nous ont permis d'effectuer une sélection du modèle considéré comme le plus pertinent. Pour ces modèles, nous n’avons intégré qu’un Modèle Numérique d’Altitude sur les deux disponibles. Nous avons retenu le modèle le plus homogène sur l’ensemble du territoire, afin d’éviter des artefacts dus à l’échantillonnage des points altimétriques (chapitre 3.1.1.1). Par conséquent, les variables des tables 20, 28 et 33 ont été retirées des jeux de données (annexe 9.8). Le meilleur modèle est le N° 61. Il est décrit en détail ci-dessous. Le D2 moyen de cette prospection est de 78.4 % avec un r moyen de validation de 0.89 (validation croisée, r moyen = 0.85).

Le dernier set (E) comprend deux modèles (N° 63 et 64, annexe 9.14). Ces deux modèles permettent d'estimer l'amélioration qu'on peut attendre en éliminant les carrés kilométriques excentriques. Il s'agit de quatre unités d'échantillonnage situées dans l'enclave de Céligny, pour lesquelles il manque essentiellement des données liées à la topographie. Ces modèles sont comparés avec leurs homologues qui comprennent toutes les mailles kilométriques (modèles N° 23 et 35, annexe 9.14). La déviance expliquée augmente en moyenne de 1.5 % ce qui ne justifie pas qu'on supprime ces carrés kilométriques.

La Figure 33 illustre les différentes valeurs moyennes de D2 et de r (validation et validation croisée) pour les différents sets de données (ceux-ci sont classés par ordre de performance). On peut observer qu’il y a logiquement une forte corrélation entre ces valeurs. La plus forte corrélation étant entre le D2 et le r de validation (r2 = 0.988, p-value < 0.001; Figure 34).

0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 80.00 90.00 100.00

D2 moyen 48.42 53.67 67.21 78.42 82.59

Validation: r moyen 68.00 75.00 81.67 88.51 91.00

Cross-Validation: r moyen 62.50 69.75 75.00 84.60 88.50

B C A D E

Figure 33: Comparaison des D2 et des r (validation et validation croisée) des différents sets de modèles de RST ordonnés.

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 40

50 60 70 80 90

Validation

D2 R2= 0.9877

p-value < 0.001

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

40 50 60 70 80 90

Validation

D2 R2= 0.9877

p-value < 0.001

Figure 34: Corrélation entre le D2 et le r de validation des modèles de RST.

Le modèle final (modèle N° 61, annexe 9.14) comporte onze VP et il explique le maximum de déviance de la RST (variable expliquée). Le D2 égale 81.2 % pour un seuil de signification de p = 0.05. La distribution de la RST est donc une variable qui est bien prédite à cette échelle grâce aux variables du paysage. Les variables explicatives retenues sont, par ordre de contribution:

1. HYD_FRAG_SUM_AREA (805): surface terrestre des carrés kilométriques (sans l'Arve, le Rhône et le lac Léman);

2. MNAG_SLOP_STD (113): déviation standard des pentes;

3. VEG_COMBI_DIV (204): nombre de types différents de végétation naturelle (richesse);

4. HYD_RIV_SEG (94): nombre de segments de rivières;

5. MNAG_ASP_RANGE (107): amplitude des expositions (variation);

6. ROUT_DIST_MAX (154): distance maximum au réseau routier;

7. BAT_DIST_RANGE (18): amplitude des distances aux bâtiments hors-sol (variation);

8. ROUT_LONG (166): longueur totale des routes goudronnées;

9. VEG_DIST_MIN (207): distance minimum à une zone de végétation naturelle;

5 Ce nombre correspond au numéro de variable indiqué dans l'annexe 9.10. Il sera systématiquement repris dans le texte et les figures.

10. PED_NBR (146): nombre d'unités pédologiques;

11. VEG_ILOT_NBR (212): nombre d'îlots de végétation naturelle.

Graphiquement, les contributions de chaque variable prise indépendamment (modèle GAM univarié; partie de droite) et dans le cadre du modèle retenu (partie de gauche) sont illustrées dans la Figure 35. La drop contribution exprime la part de contribution qui est perdue lorsqu'on retire cette variable explicative du modèle. Le Tableau 9 donne les valeurs de contribution. Les variables ayant des contributions égales à zéro sont celles qui ont été testées dans la modélisation, mais qui n'ont pas été retenues dans le modèle final.

0 20 40 60 80 100 120

DROP CONTRIBUTION

0 500 1000 1500

VEG.COMBI.DIV

0 500 1000 1500

VEG.COMBI.DIV

Figure 35: Partie de gauche: Contribution des variables explicatives retenues dans le modèle de RST N° 61. Partie de droite: Contribution indépendante des variables explicatives testées (modèles GAM univariés).

Trois variables expliquent 73.5 % de la déviance, ce qui représente 90.5 % de la déviance expliquée par le modèle complet (11 variables). Il s'agit des variables 1 à 3 citées dans la liste ci-dessus (N° 80, 113 et 204; modèle N° 62, annexe 9.14).

Numéro Variable Drop Alone

204 VEG.COMBI.DIV 86.754729 1607.386000

176 SAI6.NBR.UNITE 0 1546.843819

80 HYD.FRAG.SUM.AREA 127.616274 1473.439158 46 CONS.FRAG.SUM.AREA 0 1472.089617 113 MNAG.SLOP.STD 121.598978 1123.649873 212 VEG.ILOT.NBR 21.612972 1060.847421

211 VEG.ILOT.MEAN.SI 0 913.090594

102 MNAG.ALT.RANGE 0 896.929927

94 HYD.RIV.SEG 53.311123 759.947126

206 VEG.DIST.MEAN 0 745.152448

146 PED.NBR 26.293759 689.842834

107 MNAG.ASP.RANGE 52.486271 687.130305

214 VEG.MEAN.AREA 0 686.056729

154 ROUT.DIST.MAX 35.086692 652.438019

259 ZOAG.SUM.AREA 0 647.222950

193 SCE.ILOT.NBR 0 615.818129

18 BAT.DIST.RANGE 32.608409 613.710474

72 HYD.DIST.MEAN 0 586.286845

207 VEG.DIST.MIN 27.119848 565.638499 166 ROUT.LONG 30.971490 554.689414

11 ASSO.NBR 0 529.110743

14 ASSO.SURF.POURCENT 0 520.716257

null.dev 3657.404365

resid.dev 688.139267

D2 0.811850

df.residual 254.264847

n 302

Tableau 9: Contribution des variables explicatives retenues dans le modèle de RST N° 61.

La Figure 36 illustre les courbes de réponse de la RST en fonction des VP retenues. L'axe vertical exprime l'influence de chaque variable sur la prédiction à l'échelle du prédicteur linéaire avant sa transformation par la fonction de lien (chapitre 3.3.3.2.3).