• Aucun résultat trouvé

Pour chaque échantillon simulé, les critères meanAIC et mAIC sont calculés pour les quinze sous modèles possibles construits à partir des quatre covariables simulées. Pour le premier plan de simulation, les proportions de décisions correctes par rapport à la sélection de variables sont rapportées dans les tableaux 2.3 et 2.4 pour le scénario 1 et dans les tableaux 2.5 et 2.6 pour le

scénario 2. Notons que lorsque la taille des groupes est grande (i.e. Sc= 320), mAIC éprouve

des difficultés à converger dès que σ2

` dépasse 0.15. Le tableau 2.7 récapitule la performance

de mAIC pour Sc= 80et βf ixe= 0.2 sous les trois scénarios pour faciliter la comparaison.

Les résultats suggèrent que la performance des deux critères n’est pas vraiment affectée par l’existence de l’autocorrélation temporelle dans les variables réponses (i.e. ρ > 0) ni par la présence de changements comportementaux chez les animaux. Dans les deux cas, les résultats présentent des patrons similaires aux résultats obtenus pour le modèle de régression logistique conditionnelle mixte ordinaire et sont présentés dans l’annexe A.2 et l’annexe A.3, respective- ment.

Dans les scénarios 1 et 3, les simulations ont montré que mAIC domine meanAIC lorsque les tailles des groupes sont Sc = 80 et que la partie fixe des coefficients βf ixe = 0.2. Pour le

scénario 2, les résultats suggèrent que mAIC est plus performant que meanAIC uniquement lorsque σ2

2 = 0.005 ou σ24 = 0.005. Dans les trois scénarios, dès que βf ixe = 0.4, meanAIC

et mAIC ont tous les deux une bonne performance avec meanAIC dominant mAIC pour toutes les valeurs de σ2

2 > 0.005. Remarquons que la performance de meanAIC s’améliore

considérablement lorsque βf ixe passe de 0.2 à 0.4, par exemple, dans le scénario 1 (et 3) du

premier plan de simulation. Lorsque Sc= 80 et la variance de l’effet aléatoire σ2

2 = 0.15, on

voit la proportion de choix corrects de meanAIC passer de 15.5% à 84.5%.

Sous les trois plans de simulation, meanAIC a une excellente performance lorsque la taille des strates est Sc= 320. Par exemple, pour βf ixe = 0.2et σ2

2 = 0.15, la proportion de choix

corrects pour meanAIC passe de 15.5% à 98.5% lorsque la taille des groupes passe de Sc= 80

à Sc= 320sous le premier plan de simulation. Ces résultats sont résumés dans le tableau 2.4

pour le scénario 1.

Concernant la robustesse de mAIC face au choix de la structure des effets aléatoires, on remarque que la performance de mAIC est maximale lorsque la structure des effets aléatoires est correctement spécifiée sous le scénario 1 et minimale sous le scénario 3. Par exemple, pour σ22 = 0.30, la proportion de modèles correctement choisis par mAIC passe de 63% sous le scénario 1 à 48% sous le scénario 3. Le tableau 2.7 présente la performance de mAIC sous les trois scénarios.

βf ixe= 0.2 βf ixe= 0.4

σ22 meanAIC mAIC meanAIC mAIC 0.005 0.015 0.445 0.435 0.635

0.15 0.155 0.585 0.845 0.685 0.3 0.225 0.630 0.950 0.700 0.8 0.295 0.720 0.985 0.715 1.5 0.275 0.675 0.980 0.720

Table 2.3 – Plan de simulation 1 - scénario 1 : Proportion des 200 simulations où les critères meanAIC et mAIC ont choisi le bon modèle. La taille des groupes est Sc= 80 ∀c et βf ixe ∈ {0.2, 0.4}.

Sc= 80 ∀c Sc= 320 ∀c σ22 meanAIC mAIC meanAIC mAIC 0.005 0.015 0.445 0.600 0.650 0.150 0.155 0.585 0.985 0.65 0.300 0.225 0.630 0.975 NA 0.800 0.295 0.720 0.955 NA 1.500 0.275 0.675 0.955 NA

Table 2.4 – Plan de simulation 1 - scénario 1 : Proportion des 200 simulations où les critères meanAIC et mAIC ont choisi le bon modèle. La taille des groupes est Sc =∈ {80, 320}, βf ixe= 0.2.

βf ixe = 0.2 βf ixe= 0.4 σ22 σ24 meanAIC mAIC meanAIC mAIC 0.005 0.005 0.030 0.405 0.460 0.700 0.005 0.150 0.030 0.450 0.430 0.710 0.005 0.300 0.045 0.285 0.470 0.705 0.005 0.800 0.055 0.325 0.505 0.630 0.005 1.500 0.070 0.305 0.485 0.630 0.150 0.005 0.190 0.585 0.845 0.730 0.150 0.150 0.550 0.515 0.850 0.705 0.150 0.300 0.535 0.450 0.860 0.670 0.150 0.800 0.490 0.445 0.825 0.655 0.150 1.500 0.530 0.530 0.890 0.685 0.300 0.005 0.305 0.670 0.950 0.735 0.300 0.150 0.775 0.535 0.915 0.685 0.300 0.300 0.875 0.575 0.955 0.720 0.300 0.800 0.845 0.525 0.945 0.645 0.300 1.500 0.855 0.530 0.940 0.615 0.800 0.005 0.355 0.710 0.980 0.675 0.800 0.150 0.970 0.625 0.995 0.715 0.800 0.300 0.985 0.530 0.975 0.730 0.800 0.800 0.975 0.545 0.995 0.615 0.800 1.500 0.990 0.580 0.995 0.620 1.500 0.005 0.305 0.680 0.995 0.730 1.500 0.150 0.980 0.620 0.985 0.600 1.500 0.300 0.980 0.630 0.985 0.705 1.500 0.800 0.985 0.560 0.985 0.660 1.500 1.500 0.980 0.590 0.970 0.645

Table 2.5 – Plan de simulation 1 - scénario 2 : Proportion des 200 simulations où les critères meanAIC et mAIC ont choisi le bon modèle. La taille des groupes est Sc= 80 ∀c et βf ixe

{0.2, 0.4}. scénario 2 σ22 scénario 1 σ24 = 0.005 σ24 = 0.15 σ24 = 0.3 σ42 = 0.8 σ42= 1.5 scénario 3 0.005 0.445 0.405 0.450 0.285 0.325 0.305 0.570 0.150 0.585 0.585 0.515 0.450 0.445 0.530 0.490 0.300 0.630 0.670 0.535 0.575 0.525 0.530 0.480 0.800 0.720 0.710 0.625 0.530 0.545 0.580 0.460 1.500 0.675 0.680 0.620 0.630 0.560 0.590 0.515

Table 2.7 – Plan de simulation 1 : Proportion des 200 simulations des scénarios 1, 2 et 3 où le critère mAIC a choisi le bon modèle. La taille des groupes est Sc= 80 ∀c et βf ixe= 0.2.

σ22 σ24 meanAIC mAIC 0.005 0.005 0.495 0.62 0.005 0.150 0.655 NA 0.005 0.300 0.585 NA 0.005 0.800 0.525 NA 0.005 1.500 0.530 NA 0.150 0.005 0.940 0.73 0.150 0.150 0.945 NA 0.150 0.300 0.970 NA 0.150 0.800 0.980 NA 0.150 1.500 0.955 NA 0.300 0.005 0.985 NA 0.300 0.150 0.975 NA 0.300 0.300 0.980 NA 0.300 0.800 0.960 NA 0.300 1.500 0.935 NA 0.800 0.005 0.970 NA 0.800 0.150 0.965 NA 0.800 0.300 0.990 NA 0.800 0.800 0.955 NA 0.800 1.500 0.960 NA 1.500 0.005 0.970 NA 1.500 0.150 0.955 NA 1.500 0.300 0.960 NA 1.500 0.800 0.940 NA 1.500 1.500 0.975 NA

Table 2.6 – Plan de simulation 1 - scénario 2 : Proportion des 200 simulations où les critères meanAIC et mAIC ont choisi le vrai modèle. La taille des groupes est Sc = 320 ∀c et βf ixe= 0.2.

2.4

Conclusion du chapitre

Dans ce chapitre, nous avons présenté meanAIC ainsi que l’étude de simulation effectuée pour évaluer sa performance comme critère de sélection de variables pour les modèles de régression logistique conditionnelle mixte. Il s’agit d’un critère basé sur l’information d’Akaike, calculable lorsque le modèle est ajusté par une méthode d’estimation en deux étapes, même lorsque la structure des effets aléatoires est inconnue. Il est ainsi très utile comme premier filtre pour les variables lorsque l’inférence marginale est impraticable, notamment en présence de données massives. En résumé, comme pour les GLMMs (Craiu and Duchesne(2018)), les résultats de simulation suggèrent que meanAIC est très performant lorsque la nombre d’observations par groupe est élevé (i.e Sc= 320, ∀c) ou lorsque les effets fixes sont relativement forts (i.e β = 0.4).

Sc = 80, ∀c) et que les effets fixes sont relativement faibles (β = 0.2). En outre, les résultats

montrent que la performance de meanAIC croît avec la variance des effets aléatoires. Quant à la robustesse de mAIC face au choix de la structure des effets aléatoires, nous concluons que la performance de mAIC dépend de la structure d’effets aléatoires spécifiée a priori pour le modèle multinomial logit mixte et se détériore lorsque celle-ci est mal spécifiée.

Chapitre 3

Application : données de sélection

d’habitat chez les caribous

Les études de sélection d’habitat constituent un élément clé pour l’élaboration des plans de conservation et de gestion des espèces, notamment celles sensibles aux perturbations et aux transformations de leur habitat. Ces études fournissent des connaissances approfondies sur le comportement de sélection d’habitat chez ces espèces et permettent d’identifier les com- posantes essentielles de leurs habitats préférés. Ainsi, les plans de conservation peuvent être développés autour du maintien de ces composantes. Dans ce chapitre, nous illustrons la capa- cité de meanAIC à identifier les types d’habitats préférés ou évités par le caribou forestier dans la forêt boréale québécoise. Pour cela, nous avons utilisé des données télémétriques collectées sur des caribous femelles adultes dans le cadre d’un programme de suivi de cette espèce, qui est condidérée comme vulnérable au Québec et menacée au Canada. Dans la première section, nous présentons le jeu de données disponible pour l’analyse. Dans la deuxième section, nous présentons le travail effectué et les résultats obtenus pour la sélection de variables à l’aide de meanAIC et mAIC, ce dernier obtenu en ajustant un modèle multinomial logit mixte aux données.

3.1

Les données

Le jeu de données à notre disposition contient les données télémétriques de K = 9 caribous femelles adultes, collectées dans le cadre d’un programme de suivi de cette espèce, pendant la période allant du mois de mai 2005 au mois d’octobre 2012. Ces caribous ont été équi- pées de colliers GPS et localisées pratiquement à toutes les heures dans la zone 50–52◦Nord,

68–71◦Ouest (fig 3.1) couvrant 18500 km2 de la forêt boréale dans la région de la Côte-Nord du Québec (Canada). Chaque lieu visité a été apparié à 20 lieux témoins échantillonnés aléa- toirement à l’intérieur du domaine disponible à l’animal au moment de sa relocalisation. Ainsi, chaque animal génère un groupe de 2106 à 6425 strates en moyenne dépendant de la saison,

la strate s contenant un seul cas (Yc

s = 1), correspondant au lieu visité, et 20 lieux témoins

(Yc

s = 0) échantillonnés aléatoirement.

En plus de la variable binaire Y , les caractéristiques environnementales de ces lieux sont obte- nues à l’aide des Systèmes d’Information Géographiques (SIG). Ainsi, le jeu de données analysé contient 15 covariables caractérisant les déplacements des caribous dans la zone de l’étude. Ces covariables peuvent être classées en deux principaux groupes : 6 variables continues carac- térisant le mouvement (déplacement) de l’animal et 9 variables indicatrices caractérisant les lieux visités ou échantillonnés. Le premier groupe de variables englobe la distance parcourue par l’animal entre deux temps d’observation, le cosinus par rapport à la persistance direction- nelle1 et les distances à certains endroits qui pourraient influencer le déplacement du caribou.

En effet, la distance euclidienne de chaque emplacement observé et échantillonné aux coupes récentes (0-5 ans), aux coupes en regénération (6-20 ans), aux vieilles coupes (21-50 ans), et à la route la plus proche ont été calculées. Le deuxième groupe de covariables contient des va- riables indicatrices indiquant la présence ou l’absence de certaines caractéristiques écologiques dans les lieux visités et échantillonnés. Ces lieux ont été caractérisés par différents types de couverture terrestre : forêt de conifères dense, forêt de conifères ouverte sans lichen, forêt de conifères ouverte avec lichen, forêt mixte et décidue, eau, et les dénudés secs. En outre, des variables caractérisant les perturbations du territoire rajoutent trois catégories : les routes, les coupes de 0 à 20 ans et les feux de 0 à 50 ans. Notons que ces trois dernières catégories seront regroupées en une seule variable indiquant la présence ou l’absence de perturbations sur les lieux visités et échantillonnés. Le tableau 3.1 présente la codification utilisée pour les variables dans le code R.

Figure 3.1 – La zone d’étude (50–52◦Nord, 68–71◦Ouest) située dans la région de la Côte- Nord du Québec, Canada. Source :Basille et al. (2013)

1. La persistance directionnelle est une mesure de la volonté de l’animal de continuer dans la même direction que son pas précédent (Fortin et al.(2005)). Pour une localisation donnée, la covariable mise dans le modèle est le cosinus de la différence entre la direction de la localisation et la direction de la persistance directionnelle.

Étiquette Définition

Step.length Distance parcourue entre deux temps d’observations Dist.toYoungcut Distance à la coupe 0 à 5 ans la plus proche Dist.toRegengcut Distance à la coupe 6 à 20 ans la plus proche

Dist.toOldcut Distance à la coupe 21 à 50 ans la plus proche Dir.pers.cos Cosinus par rapport à la persistance directionnelle Conifere.dense Conifère dense (variable indicatrice)

Conifere.ouvert.sans.lichen Conifère ouvert sans lichen (variable indicatrice) Conifere.ouvert.avec.lichen Conifère ouvert avec lichen (variable indicatrice)

Mixte.et.decidus Mixte et décidus (variable indicatrice)

Eau Eau (variable indicatrice)

Denude.sec Dénudé sec (variable indicatrice)

perturbations Perturbations (Feu 0 à 50 ans, Coupes 0 à 21 ans ou Routes) (variable indicatrice)

Table 3.1 – Tableau de codification des variables

3.2

Sélection de variables à l’aide de meanAIC et mAIC

Dans cette section, nous illustrons l’utilisation de meanAIC et mAIC comme critères de sélection de variables pour les modèles de régression logistique conditionnelle mixte à l’aide des données de caribous, présentées dans la section 3.1.

La période de collecte des données (mai 2005 - octobre 2012) a permi le suivi des caribous pendant quatre saisons : été , automne, hiver et mise-bas. Puisque le caribou forestier change d’habitat d’une saison à l’autre pour combler ses exigences saisonnières (Losier et al.(2015)), il semble raisonnable d’effectuer la sélection de variables pour chaque saison séparemment. Tous les modèles considérés vont contenir les six variables caractérisant le mouvement du caribou (distances et cosinus par rapport à la persistance directionnelle). Les modèles candidats diffè- reront donc par la présence ou l’absence des perturbations et des différentes caractéristiques des habitats (7 variables), faisant un total de 27= 128modèles à comparer. Pour chacun de ces

modèles, meanAIC est obtenu en ajustant un modèle de Cox stratifié aux données de chaque individu à l’aide de la fonction coxph du package survival. mAIC est calculé en ajustant un modèle multinomial logit mixte à l’aide de la fonction mlogit du package mlogit.

Le nombre de strates par individu (groupe) est 2106 en moyenne l’été, 5224 en automne, 4444 dans la période de mise-bas, et 6425 en hiver. En se basant sur les résultats de simulation (voir la section 2.3 du chapitre 2), meanAIC aura une excellente performance dans ce cas. Or, le nombre élevé de strates par groupe rend le calcul de mAIC difficile car l’optimisation de la fonction de vraisemblance marginale du modèle multinomial logit mixte devient numé- riquement complexe (voir cas de simulation où Sc= 320). Ainsi, nous calculons mAIC sur la

strates. Pour pouvoir comparer, nous effectuons également une sélection de variables à l’aide de meanAIC en utilisant ces mêmes observations sélectionnées. Afin d’évaluer la robustesse de mAIC face au choix de la structure des effets aléatoires, nous comparons les sélections de variables proposées par mAIC en considérant trois différentes structures pour les effets aléatoires : i) un effet aléatoire devant la variable "Distance parcourue entre deux temps d’ob- servation", ii) un effet aléatoire devant la variable "Distance à la coupe 0 à 5 ans la plus proche" et iii) un effet aléatoire devant la variable "Cosinus par rapport à la persistance directionnelle". Notons que ces variables semblaient raisonnables pour recevoir un coefficient aléatoire après vérification auprès de biologistes. On répète cette analyse quatre fois en échantillonnant 150 strates par groupe aléatoirement à chaque fois.

Les résultats de sélection de variables sont présentés dans le tableau 3.2 pour meanAIC et dans le tableau 3.4 pour mAIC. Tel que mentionné dans le paragraphe précédent, la sélection de variables à l’aide de mAIC a été reprise quatre fois et les résultats obtenus pour les trois derniers essais sont rapportés en annexe B. Sans surprise, les résultats de sélection de variables varient d’une saison à l’autre pour les deux critères. Ainsi, meanAIC, calculé sur la totalité des données de chaque saison, choisit le modèle complet pour les saisons d’hiver, d’automne et de mise-bas. Pour les données de l’été, ce dernier élimine les variables Conifere.ouvert.sans.lichen, Denude.secet perturbations. Un résumé de ces modèles ajustés à l’aide de la fonction Ts.estim du package TwoStepCLogit est fourni dans le tableau 3.3. La fonction Ts.estim calcule l’estimateur "Two-Step" proposé dansCraiu et al.(2011). Ainsi, le tableau 3.3 présente, pour chaque saison, les estimés des coefficients de régression (la colonne "beta") du modèle retenu par meanAIC ainsi que leurs erreurs type, dans la colonne "sd". Pour mAIC, nous nous contentons de conclure quant à sa robustesse face au choix de la structure des effets aléatoires. Ainsi, en comparant les sélections de variables obtenues pour les différentes structures d’effets aléatoires considérées, nous concluons que les choix de mAIC varient selon la structure supposée pour les effets aléatoires. Notons que cette conclusion est basée sur les résultats des quatre essais effectués. Le détail des modèles choisis par mAIC est présenté en annexe B. Notons que les modèles choisis par mAIC sont différents d’une saison à l’autre et d’un essai à l’autre. Nous avons également effectué une sélection de variables à l’aide de meanAIC en utilisant les mêmes échantillons de 150 strates par groupe. Les sélections obtenues par meanAIC sont également différentes d’un essai à l’autre, vu le nombre faible de strates considéré dans chaque groupe.

VariablesSaison Été Automne Hiver Mise-bas Conifere.dense 3 3 3 3 Conifere.ouvert.sans.lichen X 3 3 3 Conifere.ouvert.avec.lichen 3 3 3 3 Mixte.et.decidus 3 3 3 3 Eau 3 3 3 3 Denude.sec X 3 3 3 perturbations X 3 3 3 meanAIC 8528.481 18290.26 19202.03 15876.76 X : variable exclue du modèle ; 3 : variable retenue dans le modèle.

Table 3.2 – Modèles choisis par meanAIC.

Été Automne Hiver Mise-bas

Coefficients beta sd beta sd beta sd beta sd Step.length -0.004458 0.000401 -0.006005 0.000567 -0.008149 0.000752 -0.005759 0.000380 Dist.toYoungcut -0.000382 0.000139 -0.000050 0.000114 0.000100 0.000238 -0.000069 0.000150 Dist.toRegencut 0.000129 0.000095 0.000051 0.000083 -0.000203 0.000112 0.000113 0.000084 Dist.toOldcut -0.000133 0.000155 0.000024 0.000064 0.000165 0.000215 -0.000070 0.000130 Dist.toRoad 0.000331 0.000130 0.000199 0.000075 0.000203 0.000213 0.000202 0.000082 Dir.pers.cos 0.044581 0.028474 -0.016224 0.026675 -0.173126 0.017998 -0.144039 0.032974 Conifere.ouvert.sans.lichen X X -0.491004 0.185913 -0.274094 0.229900 -0.419596 0.339612 Conifere.dense -0.031554 0.101015 -0.830016 0.170366 -0.415079 0.205311 -0.544074 0.308718 Conifere.ouvert.avec.lichen 0.308312 0.050110 0.003671 0.148533 0.190031 0.230619 -0.147452 0.363556 Mixte.et.decidus -0.300755 0.074309 -0.797687 0.129895 -0.619419 0.205037 -0.651471 0.307253 Eau -1.300522 0.242486 -1.662648 0.167947 -0.462756 0.232530 -1.700002 0.302563 Denude.sec X X -0.183973 0.142293 0.003416 0.221262 -0.140828 0.385272 perturbations X X -0.501074 0.170255 -0.245334 0.362055 -0.327823 0.431428

Table 3.3 – Résumé des modèles choisis par meanAIC ajustés à l’aide de Ts.estim du package TwoStepCLogit

Été Automne

VariablesEffet aléatoire Step.length Dist.toYoungcut Dir.pers.cos Step.length Dist.toYoungcut Dir.pers.cos

Conifere.dense 3 X X 3 3 3 Conifere.ouvert.sans.lichen X X X X X 3 Conifere.ouvert.avec.lichen X 3 X 3 X X Mixte.et.decidus 3 X 3 3 3 3 Eau 3 X 3 3 3 3 Denude.sec X X X 3 X X perturbations 3 X 3 X X X mAIC 5570.572 6517.622 5619.417 4657.397 4956.43 4752.807 Hiver Mise-bas

VariablesEffet aléatoire Step.length Dist.toYoungcut Dir.pers.cos Step.length Dist.toYoungcut Dir.pers.cos

Conifere.dense 3 X 3 3 X X Conifere.ouvert.sans.lichen 3 X 3 X X X Conifere.ouvert.avec.lichen 3 3 X X X X Mixte.et.decidus 3 3 3 3 X X Eau 3 X X 3 X 3 Denude.sec 3 X X X X X perturbations X X X X X X mAIC 3879.104 4336.867 4003.656 4668.063 5170.226 4702.494 X: variable exclue du modèle ; 3 : variable retenue dans le modèle.

Table 3.4 – Essai 1 : modèles choisis par mAIC pour les différentes structures d’effets aléa- toires.

3.3

Conclusion du chapitre

Le travail présenté dans ce chapitre est une simple illustration de l’utilisation de meanAIC et mAIC comme critères de sélection de variables pour le modèle de régression logistique conditionnelle mixte dans le cadre d’une étude de sélection d’habitat. Les données de cette étude ont été collectées sur des caribous femelles adultes équipées de colliers GPS dans la forêt boréale québecoise. Les caribous étant relocalisées à des fréquences élevées, le calcul de mAIC est rendu numériquement complexe vu le nombre très élevé de strates par animal. meanAIC, par contre, tire plutôt profit de cette grande quantité d’observations pour chaque animal, d’après l’étude de simulation. De plus, les résultats montrent que les sélections de variables obtenues à l’aide de mAIC varient selon la structure des effets aléatoires supposée, d’où l’intérêt de meanAIC qui ne nécessite pas la spécification de la structure des effets aléatoires a priori.

Conclusion

Dans ce mémoire nous avons évalué la performance de meanAIC dans le cadre des modèles de régression logistique conditionnelle mixte. meanAIC est un critère de sélection de variables basé sur l’information d’Akaike, développé parCraiu and Duchesne(2018) pour les GLMMs. Il est calculable lorsque le modèle est ajusté à l’aide d’une méthode d’estimation en deux étapes et ne nécessite pas la spécification a priori de la structure des effets aléatoires, contrairement aux critères d’information basés sur la vraisemblance marginale tels que mAIC.

Ce travail a été principalement motivé par les applications en écologie comportementale ba- sées sur les données télémétriques de déplacement animal. Ces données sont en effet souvent collectées selon un plan d’échantillonnage cas-témoins apparié et sont donc analysées à l’aide d’un modèle de régression logistique conditionnelle mixte. Dans ce domaine d’étude, la sélec- tion de variables est traditionnellement basée sur les critères d’information. Or, en présence de données massives telles les données télémétriques de déplacement animal, le calcul des critères d’information devient difficile vu la complexité de l’optimisation numérique de la fonction de vraisemblance marginale. En outre, généralement peu est a priori connu sur la structure des effets aléatoires dans le stade préliminaire de l’analyse, d’où l’intérêt pour un critère qui ne requiert pas cette spécification comme meanAIC.

La performance de meanAIC a été évaluée par simulation. Nous avons généré des données groupées et stratifiées à partir de trois différents devis de simulation : un premier devis basé sur le modèle de régression logistique conditionnelle mixte ordinaire, un deuxième devis où les données sont générées en tenant en compte l’autocorrélation temporelle possiblement existante dans les données de déplacement animal et un troisième devis où les données sont simulées à partir d’un modèle de régression logistique conditionnelle mixte à chaîne de Markov cachée modélisant le changement d’états comportementaux connu chez certains animaux. Les simu- lations ont été effectuées en considérant un certain nombre de combinaisons de nombre de strates par groupe (moyen et élevé), variance des coefficients aléatoires (petite, moyenne et grande), taille des effets fixes (petite et modérée). Nous nous sommes également intéressé à la comparaison de meanAIC et de mAIC. Les résultats de simulation suggèrent que meanAIC est nettement meilleur que mAIC pour toutes les combinaisons de paramètres sauf pour le cas où la taille du groupe, la variance de l’effet aléatoire et la taille de l’effet fixe sont simulta-

nément petits. Nous aimerions également mentionner que, contrairement à mAIC, meanAIC est calculable lorsque les strates contiennent plusieurs cas (i.e m > 1), bien que ce cas de figure n’ait pas été étudié dans le cadre de ce mémoire.

La robustesse de mAIC face aux choix de structure des effets aléatoires a été évaluée. Pour chacun des devis de simulation et pour toutes les combinaisons de paramètres, nous avons considéré trois scénarios : un premier scénario où la structure des effets aléatoires est correc- tement spécifiée pour mAIC, un deuxième scénario où celle-ci est partiellement mal spécifiée et un dernier scénario où la structure des effets aléatoires est complètement mal spécifiée. Les résultats de simulation montrent que la performance de mAIC est influencée par le choix de la structure des effets aléatoires et se détériore lorsque celle-ci est mal spécifiée.

Documents relatifs