• Aucun résultat trouvé

Chapitre 4. Étude par simulation

4.4. Étude 1: Méthodes bootstrap pour le plan aléatoire simple sans remise

4.4.2. Discussion: cas de paramètres linéaires

À la lumière des résultats indiqués au tableau 4.2, les trois premières méthodes bootstrap par pseudo-population, à savoir Booth et coll. (1994), Chao et Lo (1994) et Bickel et Freedman (1984) montrent un comportement similaire en terme du signe du BR observé de de la variance de l’estimateur Horvitz-Tompson du total et de sa valeur. Ce résultat n’est pas surprenant car d’une part Ep V∗ ˆt∗HT < Vp tˆHT et d’autre part parce que

les BRT de chacune de ces trois méthodes bootstrap évalués dans les différents scénarios sont semblables. Le tableau 4.13 donne les valeurs du BRT de chacune des trois méthodes en fonction des valeurs de la fraction de sondage f et de la taille de l’échantillon n. Pour ce qui est des autres méthodes bootstrap, qui se calent explicitement sur l’estimateur de variance dans le cas linéaire, à savoir la méthode de Sitter (1992a) et les méthodes bootstrap direct ou pondéré, elles montrent un comportement similaire en terme du BR. En effet, les BR associés à ces méthodes bootstrap sont inférieurs à 2% en valeur absolue dans les quatre scénarios tandis que les BR associés aux trois premières méthodes bootstrap par pseudo-population dépassent 2% en valeur absolue dans les trois derniers scénarios. En ce qui concerne la stabilité mesurée ici par la racine carrée de l’erreur quadratique moyenne relative REQM R, toutes les méthodes ont des performances équivalentes. Les différentes méthodes bootstrap sont plus stables dans le cas d’un cœfficient de variation petit; voir le

tableau 4.1. Dans le cas de ty, il s’agit des scénarios 1, 3 et 4 alors qu’il s’agit des scénarios 1 et 3 dans le cas de tz.

Les tableaux 4.3 à 4.11 donnent les performances des méthodes en terme des erreurs de couverture et de la longueur moyenne des intervalles de confiance. Toutes les méthodes ont des comportements relativement voisins en terme des propriétés des intervalles de confiance, notamment les intervalles de confiance asymptotique, percentile et bootstrap de base. Ceci se manifeste clairement dans les quatre scénarios par des valeurs proches pour les erreurs de couverture bilatérale et pour la longueur moyenne des intervalles de confiance. Statistique- ment parlant, l’erreur globale de couverture théorique (5%) est respectée par les intervalles de confiance asymptotique, percentile et bootstrap de base dans le cas du total tz (tableau 4.8, tableau 4.9 et tableau 4.10). En revanche, elle n’est respectée que par les intervalles de confiance asymptotique et percentile dans le troisième scénario dans le cas du total ty

et pour certaines méthodes dans le dernier scénario. Toutefois, les taux de couverture bi- latérale observés pour les intervalles de confiance asymptotique, percentile et bootstrap de base restent proches de 95%. Ils sont autour de 93% dans les scénarios 1 et 4 et autour de 92% dans le scénario 2 (tableau 4.3, tableau 4.4 et tableau 4.5). On peut également constater que les taux d’erreur inférieure et supérieure L et U de couverture unilatérale des intervalles de confiance asymptotique, percentile et bootstrap de base de ty sont sta-

tistiquement différents de 2,5%. Ce constat ne s’applique pas à la lettre aux intervalles de confiance asymptotique, percentile et bootstrap de base de tz. En fait, les deux taux

d’erreur de couverture unilatérale observés L et U ne sont pas statistiquement différents de 2,5% dans le scénario 3 et seulement pour L dans le scénario 4.

Les intervalles de confiance t-bootstrap du ty produits par les méthodes bootstrap ont pour la plupart des taux d’erreur de couverture unilatérale proches de la valeur théorique et respectent bien le taux de couverture bilatérale (tableau 4.6).

Pour le total tz le t-bootstrap a amélioré les taux d’erreur L et U comparativement

aux autres type d’intervalle de confiance, toutefois le taux de couverture global s’est trouvé affecté par ce gain de symétrie dans le scénario 2 et pour certaines méthodes bootstrap particulières (tableau 4.11). Il s’agit des méthodes suivantes: Bickel et Freedman (1984),

Sitter (1992b), McCarthy et Snowden (1985) Sitter (1992a), Rao et coll. (1992) mise en œuvre avec n0 = dn2e et Antal et Tillé (2014). En effet, le taux de couverture bilatérale observé dans le deuxième scénario pour ces méthodes avoisine 97%.

Le gain apporté par le t-bootstrap en terme des taux d’erreur de couverture unilatérale vient du fait que les intervalles de confiance t-bootstrap sont plus larges que les intervalles percentiles ou asymptotiques (voir tableaux 4.7 et 4.12). Toutefois, il faut signaler que le choix de la méthode pour mettre en œuvre le t-bootstrap semble avoir un effet sur la longueur dudit intervalle de confiance. En effet, les intervalles de confiance t-bootstrap produits par les méthodes de Rao et Wu (1988) et Rao et coll. (1992) mises en œuvre avec n0 = dn2e, ainsi que ceux produits par Chipperfield et Preston (2007) et Antal et Tillé (2014) sont plus larges comparativement à ceux produits par les autres méthodes bootstrap. Il faut noter que cette remarque ne s’applique à la méthode de Antal et Tillé (2014) que dans les deux premiers scénarios. Ce constat peut être expliqué par le fait que ces méthodes manipulent seulement la moitié des données lors du second bootstrap pour estimer la variance de l’estimateur bootstrap. En effet, pour les méthodes de Rao et Wu (1988) et Rao et coll. (1992) elles sont mises en œuvre avec n0 = dn2e. Pour la méthode de Chipperfield et Preston (2007) l’échantillon bootstrap qui sera utilisé pour estimer la variance de l’estimateur bootstrap est aussi de taille n0 = dn2e. Pour la méthode de Antal et Tillé (2014), dans les deux premiers scénarios elle se comporte comme la méthode de Chipperfield et Preston (2007). En fait, les deux premiers scénarios se caractérisent par un taux de sondage relativement faible (f = 0,07). Pour simplifier les choses, supposons que f = 0 de telle sorte que les ajustements bootstrap pour chacune des deux méthodes sont égaux à a∗i = 2mi où les mi, i = 1, · · · , n sont générés selon un mécanisme qui consiste à

échantillonner sans remise dans s un échantillon de taille n/2. Pour vérifier cela il suffit de remplacer dans la formule relative à la construction des ajustements bootstrap de la méthode Chipperfield et Preston (2007) f par 0 et dn2e par n/2 qui est entier. Rappellons que la méthode de Antal et Tillé (2014) consiste à générer des ajustements bootstrap selon un mécanisme qui mixe deux plans d’échantillonnage, le plan de Bernoulli de paramètre f et un plan de type “One-One” qui consiste à sélectionner la moitié des unités selon le plan

aléatoire simple sans remise puis les doubler. Donc si f = 0 les ajustements bootstrap seront générés seulement selon le second plan et par conséquent a∗i = 2mi. D’où la ressemblance

entre les deux méthodes dans les deux premiers scénarios qui se caractérisent par un taux de sondage proche de 0.