• Aucun résultat trouvé

Partie V : Discussion générale et perspectives

I- 6-5-3 Choix d’analyse : les modèles GLMM et PlsGLM

- Un modèle linéaire généralisé mixte (GLMM) :

Pour analyser les effets des éléments du paysage sur la présence de chenilles dans les parcelles de cotonnier, nous avons réalisé un modèle linéaire généralisé mixte (GLMM), suivi d’une sélection de modèle basée sur le critère d’information d'Akaike corrigé (AICc) (Akaïke

1974, Sanderson et al. 2009).

La régression linéaire désigne la mise en relation entre une variable à expliquer et une ou plusieurs variables explications. Elle permet ainsi de prédire la variable à expliquer en fonction de la (des) variables explicative(s). La régression linéaire est dite généralisée lorsque i/la distribution de la variable à expliquer suit une loi autre que la loi normale (Poisson, binomiale), la distribution est alors affectée d’une fonction différente de la fonction linéaire (Nelder et Wedderburn. 1972). Dans notre travail, la variable à expliquer est représentée par la proportion de cotonniers infestés versus celle des cotonniers non infestés ; la distribution de cette variable est donc binomiale et nous l’avons affecté dans le modèle d’une fonction logit. Dans notre travail, nous avons ajouté une variable aléatoire (l’année) pour prendre en compte la dépendance entre les observations des deux années. En effet, les parcelles étaient parfois les mêmes entre les deux années. Le modèle analysé est donc un modèle mixte du fait de la présence de variables explicatives fixes et aléatoires.

Partie I : Cadre de la thèse

43

Nous avions neuf variables explicatives dont cinq variables paysagères [la proportion en surface des couverts végétaux principaux (cotonnier, maïs, tomate, et végétation naturelle), l’hétérogénéité de chaque paysage (l’indice de diversité de Shannon)] et quatre variables agricoles [les fréquences de sarclage manuel et de traitement aux pesticides ; la date de semis et le précédent cultural]. Nous voulions déterminer quelles variables étaient plus ou moins importantes pour expliquer l’abondance d’H. armigera dans les parcelles de cotonnier. Nous avons utilisé pour déterminer l’importance relative de chaque variable dans le modèle, l’approche théorique de l’information développée par Burnham and Anderson (2002); et repris par Kamil (2013). Cette méthode s’appuie sur le critère d’Akaike corrigé (AICc) en

raison du grand nombre de variables explicatives (neuf variables explicatives) et du faible nombre d’observations (40 observations correspondant aux 40 parcelles sélectionnées). A partir du modèle saturé de toutes les variables explicatives, tous les modèles possibles sont générés (2^9=512 modèles) et assignés d’une valeur Wm (Akaike Weight) qui représente le poids du modèle ou encore la probabilité relative d’être le meilleur modèles de Kullback– Leibler dans un ensemble de n modèles (Sanderson et al. 2009). Un modèle est considéré comme le meilleur modèle ou le modèle le plus probable si Wm>0.9. Il est également possible de générer des moyennes des meilleurs modèles pour plus de précisions. Cette analyse est développée dans la partie III de la thèse.

- La régression linéaire généralisée mixte des moindres carrés partiels (PlsGLM) :

La régression PLS est une méthode indiquée pour résoudre les problèmes de colinéarité entre variables explicatives. Nous avons rencontré cette situation lorsque nous voulions analyser les effets des éléments du paysage sur trois échelles de buffers concentriques (échelle au voisinage immédiat = 100m de rayon, intermédiaire = 250m de rayon et distance maximale = 500m de rayon). Les variables étant fortement corrélées (r>|0.7|).Pour cette étude nous avions 37 variables explicatives. En effet, cette méthode statistique est spécialement construite pour des situations où le nombre de variables explicatives est très grand comparé au nombre d’observations et/ou ces variables explicatives sont corrélées entre elles. La régression PLS est donc une méthode pour construire des modèles de prédiction quand les variables explicatives sont nombreuses et très colinéaires. La régression Pls est une association de l’algorithme développé pour l’analyse en composantes principales (NIPALS par Wold (1966) et de l'approche PLS proposée par Wold (1975) pour l'estimation des modèles d'équations structurelles sur les variables latentes (Path models with

44

latent variables), (Tenenhaus 1998). La régression PLS permet aussi d’intégrer la possibilité des données manquantes (ce qui n’était pas le cas dans notre étude).

Cette méthode d’analyse permet aussi de classer les variables explicatives par rapport à leur importance pour expliquer la (les) variables à expliquer : le coefficient VIP (importance des variables dans la projection) est généré pour caractériser l’importance de chaque variable explicative. Pour VIP>1, la variable est considérée comme importante pour expliquer le modèle. Cette analyse est développée dans la partie IV-4 de la thèse.

Partie II : Origine géographique des individus

d’Helicoverpa armigera présents dans le Nord

Bénin et le long d’un gradient latitudinal

46

Il s’agit pour cette partie de la thèse de traiter de l’étude de l’origine géographique des populations d’ H. armigera. Déterminer l’origine géographique des populations est une méthode indirecte pour identifier et caractériser les mouvements des ravageurs observés dans un endroit donné. La partie II-1 est une synthèse bibliographique des outils utilisés pour l’analyse de la migration. Dans les parties II-2 et II-3 sont présentés les résultats des mises au point méthodologiques réalisées pendant la thèse pour déterminer l’origine géographique des populations d’ H. armigera. Ces mises au point concernent deux méthodes : la méthode d’analyse des isotopes stables d’Hydrogène et la méthode d’analyse de la flore bactérienne. Dans la partie II-4 nous présentons les résultats d’une étude de la dynamique des populations d’H. armigera le long du gradient sud-nord du Bénin. Nous avons analysé le déplacement graduelle des pics d’infestation entre les sites situés dans le sud et ceux situés dans le nord. Finalement, dans le point II-5, nous présentons une synthèse des précédentes parties et des perspectives d’amélioration des méthodes mises au point.

II- 1 : Revue de littérature: les outils pour l’analyse des

Documents relatifs