• Aucun résultat trouvé

3. Méthodes d’étude :

3.8 Analyse statistique

Toutes les analyses statistiques ont été réalisées à l’aide du logiciel R (R CRAN Core Team, 2014).

3.8.1 Analyses statistiques des données issues du protocole de transects La démarche de sélection de modèle suivante a été appliquée afin d’étudier localement les taux de croissance. L’autocorrélation des taux de croissance a été testée par un test de Moran (fonction moran.test du package spdep) et visualisée à l’aide d’un variogramme (fonction variog du package geoR).

Nous avons découpé notre zone d’étude en 752 mailles de 500 m x 500 m recouvrant l’ensemble de la ZPS*. Au sein de chaque maille, nous avons différencié les facteurs de l’habitat d’une part, (composition et configuration) en nous basant sur l’occupation des sols et, d’autre part, sur les paramètres relatifs aux outardes en utilisant les données de transect. Toutes ces variables sont calculées à l’échelle de la maille. Ils sont listés ci-dessous :

Variables du paysage : - Nombre de parcelles,

- Indice de diversité des cultures (i.e. Indice de Shannon Wiener sur les types d’occupation des sols,fonction diversity du package vegan).

Proportion de chaque type d’occupation des sols (6 catégories, cf. Tableau 4 ) : - Distance à la ligne de fret la plus proche,

- Distance à la LGV* la plus proche, - Distance au tracé de la future LGV*. Facteurs relatifs aux outardes :

- Nombre de mâles l’année précédente, - Nombre de mâles l’année étudiée, - Nombre de femelles l’année précédente, - Nombre de femelles l’année étudiée,

- Nombre de mâles dans les mailles voisines l’année en cours, pondérés par l’inverse de leur distance au carré,

-

Nombre de mâles dans les mailles voisines l’année précédente, pondérés par l’inverse de leur distance au carré.

La modélisation des effectifs voisins a été réalisée à l’aide de la fonction spautolm et

dnearneigh du package spdep. Différents modèles ont été testés, couplant une distance de

portée de l’autocorrélation spatiale (500, 1000, 1500, 2000, 2500, 3000, 5000 m) à une fonction de distance (1/x ou 1/x²). Le meilleur modèle décrivant l’autocorrélation spatiale pour chaque sexe a été évaluée par AIC. Dans les deux cas, la fonction de distance retenue est de la forme 1/x², et la portée de la distance de 1500 m pour les mâles et 3000 m pour les femelles.

67

Tableau 4 : Synthèse des regroupements d’occupation des sols (pour les définitions détaillées de chaque type d’occupation des sols, voir Tableau 3).

Défavorable Bâti, Bois, Eau

Couvert ras Maraîchage, Labour, Vigne jeune

Cultures ligneuses Arboriculture, Vigne nue, Vigne enherbée, Vigne arrachée Friches hautes Friche arboricole, Friche mixte, Friche viticole

Milieux prairiaux Luzerne, Prairie, Pâture, Céréales Friches herbacées Friche herbacée (sans pâturage)

Les regroupements de type d’occupation des sols se font par type de phénologie de végétation et de récolte,

Le nombre de femelles détectées chaque année à l’aide de ce protocole est élevé par rapport à d’autres études connues, ceci étant un des effets des fortes densités d’individus observés sur cette zone. Bien que, contrairement aux mâles, elles n’ont pas une probabilité de détection fixe ni élevée, compte tenu du nombre d’observations, elles ont été étudiées de la même manière.

Les taux de croissance sont modélisés à l’aide d’un glm (modèle linéaire généralisé) avec effet aléatoire (glmm ; fonction glmer du package lme4). Pour chaque sexe, un sous-jeu de données est créé, comportant uniquement les mailles ayant contenu au moins un individu du sexe étudié lors d’une des 4 années de prospection.

Nous avons construit un modèle complet pour chaque sexe comportant, en effets fixes, les variables de configuration, les variables de composition, les variables sociales et, en effets aléatoires, les données fondamentales de chaque maille (identifiant de la maille niché (nested) dans l’identifiant de l’îlot de la ZPS* et croisé avec l’année étudiée). Nous effectuons sur chacun des modèles une sélection bidirectionnelle par étapes (bidirectional

stepwise selection, fonction dredge du package MuMIn). Les modèles dont la différence

d’AIC est inférieure à 4 sont retenus. Seul le modèle le plus parcimonieux est conservé. Les valeurs des pentes et des p-values des facteurs conservés dans le modèle le plus parcimonieux sont calculées à l’aide de Likelihood Ratio Tests (fonction lrtest du package

lmtest) successifs en comparant le modèle complet et un modèle comportant uniquement

68

3.8.2 Analyses statistiques des données issues des protocoles de quadrats Toutes variables ont été standardisées afin d’autoriser les comparaisons multiples.

Une Analyse en Composante Principale (ACP) est réalisée sur ces 5 catégories de hauteur par quadrat (Figure 29).

Figure 29 : Analyse en composante principale des hauteurs de végétation par classes de hauteur (H0 = 0-10 cm, H10 = 10-30 cm, H30 = 30-50 cm, H50 = 50-70 cm, H70 = 70 cm et plus) (n=582).

Le premier axe de l’ACP décrit la hauteur globale de la végétation sur le quadrat (41,15 % de la variance expliquée) tandis que le second est en lien avec l’hétérogénéité des parcelles, opposant des quadrats présentant à la fois des fortes et faibles hauteurs de végétation à des quadrats homogènes présentant une majorité de végétation de taille moyenne (28,56 % de la variance expliquée).

Les variables temporelles (date en jour Jullien en linéaire et en quadratique, heure de prospection) et les variables mesurées à l’échelle du quadrat (type d’occupation des sols, hauteur et recouvrement de végétation, abondance d’orthoptères, taille de la parcelle) ont été intégrées au démarches de sélection de modèle. D’autres variables ont été calculées à l’échelle du paysage, dont le ratio de chaque type d’occupation des sols dans quatre tampons (buffers) circulaires de taille croissante, centrés sur le barycentre du quadrat (100 m, 250 m, 500 m, 1000 m). Comme l’occupation des sols n’est enregistrée qu’au sein de la ZPS*, les tampons les plus larges proches des bordures de la ZPS* renferment une forte proportion dont l’occupation des sols n’est pas connue. Seuls les buffers dont 90 % de l’occupation des sols est connue ont été conservés à chaque échelle (Tableau 5). Le ratio de chaque type d’occupation des sols est calculé ainsi que l’indice de diversité des types d’occupation des sols (selon la formule de Shannon-Wiener), et un indice de configuration/fragmentation du paysage en calculant le nombre de parcelles par la surface de chaque tampon.

69

Tableau 5 : Nombre de quadrats par taille de tampon.

Nous avons utilisé des modèles linéaires généralisés (glm). Notre démarche de sélection de modèles, pour déterminer quels modèles sont les plus ajustés aux comptages, a permis de tester les variables candidates comme variables indépendantes. Du fait du nombre important de quadrats vides, nous avons modélisé séparément leur présence et leur abondance en cas de présence, en utilisant des modèles de type Hurdle (fonction hurdle du package pscl). Ils nous ont permis de modéliser la présence/absence via une loi binomiale, et l’abondance des outardes par une loi de Poisson. Pour chaque modèle, le nombre d’outardes a été modélisé en utilisant l’aire prospectée (à l’échelle logarithmique) en offset.

Comme le nombre de variables était élevé, nous avons opté pour une démarche ascendante par étape (stepwise forward model selection) pour éviter des modèles sur-paramétrés. Les variables significatives ont été ajoutées une par une et testées (avec un seuil de significativité fixé à 0,05) de la plus à la moins significative. Chaque variable explicative a été testée à la fois en présence/absence et en abondance. Le modèle final à chaque échelle ne contient que les variables significatives.

Notre sélection de modèle se déroule en 4 étapes. Nous construisons dans un premier temps un modèle qui inclut uniquement les variables locales, i.e. mesurées à l’échelle du quadrat pour expliquer le nombre total d’outardes de chaque sexe. Une fois le meilleur modèle obtenu pour chaque sexe à l’échelle locale, on teste l’effet de la présence et de l’abondance du sexe opposé sur la présence et l’abondance du sexe étudié. Pour ce faire, nous ajoutons dans le modèle obtenu à la première étape le nombre d’individu du sexe opposé contacté sur le même quadrat. Cette variable est factorielle et comprend 3 niveaux (0, 1, >1).

Dans une troisième étape, on inclut dans le meilleur modèle de la seconde étape les variables régionales, i.e. mesurées à l’échelle d’un des tampons. Puis la même procédure de sélection qu’à la première étape est utilisée, pour ne conserver que les variables significatives pour chaque taille de tampon. Cette procédure est appliquée indépendamment à chaque tampon notamment parce que les tailles des jeux de données diffèrent (Tableau 5). Enfin, l’effet de la densité de mâles à chaque échelle régionale est testé dans une quatrième étape. Cette densité de mâle est calculée à partir des résultats des campagnes de transects effectuées dans le même temps que les campagnes de quadrats (cette méthode permet de ne considérer que les mâles de façon non biaisée).

Tampon 100 m 250 m 500 m 1000 m

Nombre de quadrats 519 455 390 237 Nombre de quadrats occupés 117 112 100 72

Nombre de mâles 102 97 81 54

70

71