Résultats et interprétation - Méthodologie d’estimation

Méthodologie d’estimation

3.2 Résultats et interprétation

Cette section est consacrée aux résultats liés aux calculs de la taille et de la puissance. Par ailleurs, pour dériver les puissances et les tailles, nous réalisons 1000 simulations Monte Carlo et 399 tirages bootstraps avec le modèle de base deLi et Racine(2013). Les calculs sont fondés sur les statistiques non standardisées Wn (lissée et non lissée). La simulation est réalisée sur R. Les tirages bootstrap et

le calcul des fenêtres de lissage sont parallélisés sur Colosse (Calcul Québec) à l’aide des fonctions "foreach" et "dopar" des package foreach et doSNOW développés parAnalytics et Weston(2014b,a). En procédant ainsi, nous réduisons considérablement le temps de calcul des simulations. Bien entendu, ce temps est fonction du nombre de nœuds alloués à la parallélisation. Nous avons généralement utilisé entre 24 et 48 processeurs, selon la taille des échantillons.

3.2.1 Estimation de la taille du test

Comme décrit plus haut, le calcul de la taille est basé sur le PGD donné par l’équation (2.1). Les estimations sont faites pour des variables dépendantes polytomiques ordonnées et non ordonnées avec

2. Ce rang sera dans ce cas, soit 1, soit 2, car la probabilité d’obtenir un eide exactement 0 ou 1 est infime.

3. Cette approche est celle utilisée parLi et Racine(2013) et elle est particulièrement utile lorsqu’elle est adaptée au cas des réponses polytomiques.

un nombre de classe c ∈ {2, 3, 4, 5} et un nombre d’observations n ∈ {200, 300, 400, 500}. Par ailleurs, deux types de modèles paramétriques sont estimés à savoir le probit ordonné et le logit multinomial simple4.

D’après le tableau3.1, les résultats de la simulation montrent que les tailles sont relativement proches de celles attendues avec les statistiques asymptotiques, ce qui révèle que les tests proposés par Fan et al. (2006) et Li et Racine (2013) conservent leurs bonnes propriétés en échantillon fini : ils ne rejettent que rarement l’hypothèse nulle de spécification correct, lorsque le vrai modèle est utilisé pour établir la probabilité conditionnelle en petit échantillon. Par exemple, pour le modèle probit binaire avec n=200, les tailles au seuil de 1% , 5% et 10% sont respectivement 1,8% , 8,0% et 16,5% pour les deux statistiques (lissée et non lissée). Un résultat similaire est obtenu au niveau du modèle logit binaire. Par ailleurs, quel que soit le type de statistique (lissée ou non lissée), la taille du test ne varie presque pas. Ce qui confirme les résultats deLi et Racine(2013). De plus, la taille des deux tests ne s’améliore ni lorsque n croît à nombre égale de modalités, ni quand le nombre c de modalités de la variable dépendante augmente en conservant la taille de l’échantillon fixe.

TABLE3.1: Taille basée sur le modele H0: y∗i = 1 + xi− zi+ uiavec M=1000, B=399 et σu= 1

Probit multinomial ordonné Logit multinomial non ordonné

y lissée y non lissée y lissée y non lissée

n c 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 200 2 0.018 0.080 0.165 0.018 0.080 0.165 0.026 0.113 0.174 0.026 0.113 0.174 300 2 0.021 0.085 0.158 0.021 0.085 0.158 0.024 0.087 0.152 0.024 0.087 0.152 400 2 0.015 0.070 0.131 0.015 0.070 0.131 0.017 0.091 0.156 0.017 0.091 0.156 500 2 0.020 0.094 0.164 0.020 0.094 0.164 0.018 0.099 0.174 0.018 0.099 0.174 200 3 0.010 0.078 0.147 0.010 0.079 0.146 0.026 0.108 0.181 0.026 0.108 0.181 300 3 0.019 0.075 0.131 0.019 0.075 0.131 0.039 0.107 0.184 0.039 0.107 0.184 400 3 0.015 0.063 0.127 0.015 0.063 0.127 0.027 0.106 0.197 0.027 0.106 0.197 500 3 0.013 0.066 0.127 0.013 0.066 0.127 0.030 0.116 0.200 0.030 0.116 0.200 200 4 0.018 0.080 0.137 0.020 0.078 0.136 0.030 0.116 0.195 0.030 0.116 0.195 300 4 0.014 0.072 0.130 0.014 0.072 0.130 0.037 0.101 0.194 0.037 0.101 0.194 400 4 0.015 0.062 0.122 0.015 0.062 0.122 0.035 0.129 0.210 0.035 0.129 0.210 500 4 0.017 0.075 0.133 0.017 0.075 0.133 0.037 0.127 0.211 0.037 0.127 0.211 200 5 0.014 0.071 0.142 0.014 0.071 0.143 0.028 0.107 0.181 0.028 0.107 0.181 300 5 0.014 0.057 0.110 0.016 0.057 0.110 0.040 0.122 0.204 0.040 0.122 0.204 400 5 0.010 0.071 0.136 0.010 0.071 0.135 0.032 0.119 0.198 0.032 0.119 0.198 500 5 0.008 0.062 0.121 0.008 0.062 0.121 0.047 0.138 0.229 0.047 0.138 0.229

3.2.2 Estimation de la puissance du test

Le calcul de la puissance est basé sur trois modèles alternatifs proposés parFan et al.(2006) etLi et Racine(2013) comme indiqué dans la section2.1. Dans le tableau3.2, l’alternative sinusoïdale (H1a)

conduit à une puissance minimale de 30% approximativement pour les deux types de modèles (probit ordonné et logit multinomial simple) et pour la grande majorité des seuils critiques. Plus précisément, la probabilité de rejeter H0au seuil de 1% sachant qu’elle est fausse est au minimum de ∼ 30%. Cette

probabilité augmente à ∼ 50% si on accepte d’accroitre le risque de se tromper un peu plus souvent, soit au seuil de 10%. Notons que, lorsque l’on maintient la taille d’échantillon fixe, la puissance du test ne s’accroît pas nécessairement avec le nombre de modalités de la variable réponse. Comme attendu, la puissance s’accroît avec n. Pour ce qui est de la puissance selon le type de statistique utilisée (lissée versusnon lissée), il n’y a pas de gain significatif de puissance pour la statistique lissée. Même si par endroit nous observons des gains de puissance, ceux-ci restent très faibles (de l’ordre de 10−3) au regard de l’aléa attendu.

TABLE3.2: Puissance basée sur le modele DGP H1a : y∗i = 1 + xi− zi+ sin(0, 5πxi) + uiavec M=1000,

B=399 et σu= 1

Probit multinomial ordonné Logit multinomial non ordonné

y lissée y non lissée y lissée y non lissée

n c 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 200 2 0.387 0.546 0.616 0.386 0.546 0.616 0.298 0.483 0.575 0.296 0.479 0.573 300 2 0.484 0.628 0.703 0.483 0.628 0.703 0.381 0.590 0.693 0.377 0.590 0.692 400 2 0.599 0.744 0.804 0.600 0.744 0.804 0.494 0.668 0.746 0.494 0.666 0.746 500 2 0.734 0.838 0.873 0.734 0.838 0.873 0.570 0.751 0.837 0.570 0.751 0.835 200 3 0.406 0.583 0.683 0.407 0.582 0.683 0.298 0.486 0.585 0.299 0.483 0.584 300 3 0.585 0.756 0.818 0.584 0.755 0.817 0.437 0.605 0.695 0.431 0.600 0.695 400 3 0.755 0.869 0.902 0.754 0.869 0.902 0.526 0.743 0.814 0.526 0.743 0.814 500 3 0.835 0.926 0.953 0.835 0.925 0.953 0.656 0.822 0.880 0.656 0.821 0.881 200 4 0.415 0.636 0.735 0.413 0.634 0.734 0.313 0.469 0.558 0.312 0.468 0.554 300 4 0.609 0.769 0.828 0.607 0.768 0.828 0.402 0.599 0.692 0.400 0.597 0.692 400 4 0.769 0.886 0.932 0.769 0.885 0.932 0.557 0.723 0.803 0.550 0.721 0.804 500 4 0.866 0.944 0.966 0.866 0.944 0.966 0.634 0.804 0.868 0.633 0.805 0.869 200 5 0.422 0.612 0.727 0.420 0.609 0.727 0.304 0.441 0.517 0.299 0.440 0.528 300 5 0.617 0.786 0.854 0.614 0.786 0.853 0.406 0.586 0.656 0.402 0.585 0.656 400 5 0.784 0.906 0.938 0.783 0.906 0.938 0.530 0.695 0.780 0.530 0.694 0.781 500 5 0.892 0.962 0.976 0.892 0.961 0.976 0.608 0.774 0.861 0.607 0.774 0.859

Pour l’hypothèse alternative quadratique H1b, le tableau3.3 montre que la puissance du test est su-

périeure à 90% quel que soit le modèle et le type de statistique utilisé pour tester la spécification correcte. Les autres résultats pour ce DGP sont similaires aux résultats obtenus sous H1a. Notons en

particulier l’absence de gains de puissance en faveur de la statistique lissée.

TABLE3.3: Puissance basée sur le modele DGP H1b : y∗_i = 1 + xi− zi+ x2i + uiavec M=1000, B=399

et σu= 1

Probit multinomial ordonné Logit multinomial non ordonné

y lissée y non lissée y lissée y non lissée

n c 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 200 2 0.934 0.985 0.998 0.934 0.984 0.998 0.836 0.938 0.970 0.834 0.938 0.968 300 2 0.989 0.999 1.000 0.989 0.999 1.000 0.942 0.993 0.998 0.939 0.993 0.998 400 2 0.998 1.000 1.000 0.998 1.000 1.000 0.983 0.997 0.999 0.983 0.997 0.99 500 2 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.999 1.000 1.000 200 3 0.947 0.994 0.997 0.947 0.993 0.997 0.903 0.966 0.983 0.898 0.963 0.983 300 3 0.995 1.000 1.000 0.995 1.000 1.000 0.976 0.998 1.000 0.975 0.997 1.000 400 3 1.000 1.000 1.000 1.000 1.000 1.000 0.996 1.000 1.000 0.996 1.000 1.000 500 3 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 200 4 0.955 0.993 0.998 0.954 0.991 0.998 0.920 0.974 0.992 0.914 0.973 0.988 300 4 0.996 1.000 1.000 0.995 1.000 1.000 0.989 0.998 0.999 0.988 0.998 0.999 400 4 1.000 1.000 1.000 1.000 1.000 1.000 0.999 1.000 1.000 0.999 1.000 1.000 500 4 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 200 5 0.965 0.994 0.997 0.964 0.994 0.997 0.911 0.975 0.991 0.902 0.971 0.991 300 5 0.998 1.000 1.000 0.998 1.000 1.000 0.989 1.000 1.000 0.986 0.999 1.000 400 5 1.000 1.000 1.000 1.000 1.000 1.000 0.998 1.000 1.000 0.998 1.000 1.000 500 5 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000

Les résultats du test de puissance pour l’alternative hétéroscédastique sont présentés dans le tableau

3.4. On note les mêmes tendances que pour les alternatives quadratiques et sinusoïdales. La puissance est virtuellement unitaire lorsque n est supérieur à 300 et lorsque c est supérieur à 3.

D’après nos analyses, les gains de puissance apportés par la statistique lissée sont donc négligeables. Ces résultats contrastent avec ceux deLi et Racine(2013) qui obtiennent systématiquement des gains de puissance pour la statistique lissée à tous les seuils critiques. Sous l’hypothèse d’absence d’erreur de codage, ces différences pourraient être dues à la variance inférieure du terme stochastique du PGD, supérieure dans nos simulations en comparaison à Li et Racine (2013). Ces auteurs utilisent une variance quatre fois inférieure pour l’erreur normale. Dans ce contexte, nos paramètres de lissage pourraient être sous optimaux comparés à ceux de Li et Racine (2013). Sachant que les variables explicatives de nos modèles sont toutes pertinentes, nous nous attendons à observer peu de surlissage des fenêtres optimales calculées par validation croisée par les moindres carrés. Le tableau3.5donne donc la proportion de paramètres de lissage qui peut être considérée comme excessivement large pour les 1000 simulations de Monte Carlo, en fonction de la taille de l’échantillon et du nombre de modalités de la variable dépendante. Dans ce tableau, nous nous concentrons sur le PGD considéré

TABLE3.4: Puissance basée sur le modele DGP H1c : y∗i = 1 + xi− zi+ xiuiavec M=1000, B=399 et

σu= 1

Probit multinomial ordonné Logit multinomial non ordonné

y lissée y non lissée y lissée y non lissée

n c 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 0.01 0.05 0.1 200 2 0.877 0.951 0.971 0.876 0.951 0.971 0.781 0.913 0.954 0.778 0.909 0.953 300 2 0.982 0.995 0.998 0.982 0.995 0.998 0.938 0.986 0.992 0.935 0.984 0.990 400 2 0.998 1.000 1.000 0.998 1.000 1.000 0.989 0.998 0.999 0.989 0.997 0.999 500 2 0.998 1.000 1.000 0.998 1.000 1.000 0.996 0.998 1.000 0.996 0.998 1.000 200 3 0.993 0.998 0.998 0.993 0.998 0.998 0.996 0.998 0.998 0.995 0.998 0.998 300 3 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 400 3 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 500 3 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 200 4 0.997 0.999 0.999 0.997 0.999 0.999 0.999 1.000 1.000 0.998 1.000 1.00 300 4 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 400 4 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 500 4 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 200 5 0.995 0.998 0.999 0.995 0.997 0.999 1.000 1.000 1.000 1.000 1.000 1.000 300 5 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 400 5 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 500 5 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000

sous H1a: plus de 15% des fenêtres de lissage continues (variable x) peuvent être considérées comme

excessivement larges5. Cette proportion peut même être supérieure pour les autres PDG utilisés6. Le surlissage n’est pas un problème avec les variables discrètes réponse et explicative du modèle car il n’y virtuellement pas de surlissage. Cela pourrait vouloir dire que l’accroissement de puissance établi par

Li et Racine(2013) pourrait ne pas avoir la portée générale souhaitée dans les applications pratiques. Si cette explication était plausible, nous devrions probablement constater certaines distorsions de taille et de puissance dans nos simulations par rapport à celles deLi et Racine(2013), dues à une estimation moins performante du modèle non paramétrique. Or, ce n’est pas ce que nous constatons. De plus, des simulations menées7avec la variance utilisée parLi et Racine(2013) ne nous permettent pas non plus de constater les gains de puissance établis par ces auteurs par rapport à la statistique deFan et al.

(2006). Dans notre cas, nous concluons donc que les gains de puissance apportés par le lissage de la variable réponse ne concordent pas avec ceux établis parLi et Racine(2013) et qu’ils mériteraient peut-être d’être confirmés ou infirmés par d’autres simulations.

5. Le seuil informel de ‘surlissage’ du paramètre de lissage est fixé à 0.75nq+41 _{pour la variable continu et à 0.75}c−1

c pour la variable discrète. Ces seuils correspondent aux valeurs asymptotiques définies par le Lemme 2.1.

6. Ces résultats n’ont pas été reportés ici. 7. Ces résultats sont disponibles sur demande.

TABLE3.5: Fenêtres de lissage conditionnelles, DGP H1a : y∗i = 1 + xi− zi+ sin(0, 5πxi) + ui avec

M=1000, ui∼ N(0, 1)

x z y

n c Moy Med Seuil Rejet Moy Med Seuil Rejet Moy Med Seuil Rejet 200 2 0.242 0.252 0.310 0.169 0.091 0.073 0.375 0.019 0.001 0.000 0.375 0.000 200 3 0.257 0.263 0.310 0.232 0.100 0.086 0.375 0.010 0.003 0.000 0.500 0.000 200 4 0.270 0.275 0.310 0.293 0.109 0.100 0.375 0.010 0.004 0.000 0.562 0.000 200 5 0.285 0.288 0.310 0.356 0.116 0.105 0.375 0.006 0.005 0.000 0.600 0.000 300 2 0.224 0.230 0.290 0.148 0.064 0.052 0.375 0.005 0.001 0.000 0.375 0.000 300 3 0.238 0.244 0.290 0.197 0.074 0.067 0.375 0.001 0.001 0.000 0.500 0.000 300 4 0.251 0.259 0.290 0.272 0.082 0.075 0.375 0.002 0.002 0.000 0.562 0.000 300 5 0.260 0.267 0.290 0.329 0.088 0.083 0.375 0.001 0.003 0.000 0.600 0.000 400 2 0.213 0.219 0.276 0.158 0.046 0.040 0.375 0.000 0.000 0.000 0.375 0.000 400 3 0.227 0.234 0.276 0.178 0.057 0.052 0.375 0.000 0.000 0.000 0.500 0.000 400 4 0.239 0.246 0.276 0.256 0.064 0.059 0.375 0.000 0.001 0.000 0.562 0.000 400 5 0.249 0.253 0.276 0.330 0.069 0.065 0.375 0.000 0.001 0.000 0.600 0.000 500 2 0.204 0.209 0.266 0.121 0.039 0.035 0.375 0.000 0.000 0.000 0.375 0.000 500 3 0.217 0.220 0.266 0.159 0.047 0.044 0.375 0.000 0.000 0.000 0.500 0.000 500 4 0.229 0.234 0.266 0.227 0.055 0.051 0.375 0.000 0.001 0.000 0.562 0.000 500 5 0.238 0.241 0.266 0.296 0.060 0.057 0.375 0.000 0.001 0.000 0.600 0.000

Conclusion

L’adéquation entre les formes fonctionnelles postulées par l’économiste et les relations observées dans les données demeure un sujet important de préoccupation en recherche appliquée, en particulier quand il s’agit de décrire et d’extrapoler des choix individuels. Les estimateurs non paramétriques par noyaux mixtes (continus et discrets) permettent de tester l’adéquation entre les densités conditionnelles pos- tulées et les choix observés. Ces estimateurs fournissent également un modèle flexible utilisable en cas de rejet de la fonction de probabilité postulée.

Nos simulations confirment que les tests récemment proposés par Fan et al.(2006) et Li et Racine

(2013) présentent de bonnes propriétés statistiques en échantillon fini (taille et puissance). Ces tests identifient de manière statistiquement fiable le vrai modèle (bonne taille) lorsque ce dernier est un logit/probit polytomique ordonné ou non ordonné. Ils rejettent ces mêmes modèles avec une fréquence élevée (bonne puissance) lorsque le chercheur omet des non linéarités ou de l’hétéroscédasticité dans son modèle. Par contre, nous n’avons pas pu confirmer les gains de puissances systématiques mis en avant par Li et Racine (2013) par rapport au test deFan et al. (2006). D’après nos simulations, le lissage de la variable dépendante discrète n’entraîne pas de gains significatifs de puissance par rapport à une situation ou seul la variable explicative discrète est lissée. Nous n’avons donc trouvé aucune raison de privilégier l’un des deux tests en échantillon fini.

Les deux tests peuvent être relativement aisément programmés sur R si l’on emploie les fonctions fournies dans le package np. Nous recommandons l’utilisation de fenêtres de lissage optimales par la méthode de validation croisée par moindres carrés, comme suggéré parFan et al. (2006) et Li et Racine(2013). Pour des échantillons de grande taille (> 1000 observations) et avec plusieurs variables explicatives, la librairie npRmpi de R permet de paralléliser aisément le calcul de ces fenêtres dans un environnement Open MPI. Dans la pratique, il n’est pas rare que la validation croisée par les moindres carrés conduise à des fenêtres optimales sous-lissées. Le sous-lissage peut se révéler frustrant lorsqu’il affecte une variable explicative continue. Le chercheur devra alors recourir à des fenêtres de lissage ‘sous-optimales’ selon ce critère pour établir une relation lisse entre la variable explicative et la proba- bilité conditionnelle. Il serait donc intéressant de répéter nos simulations pour vérifier la performance des tests avec différentes méthodes de sélection des paramètres de lissage. Une autre extension utile serait d’explorer la taille et la puissance du test lorsque l’on accroît le nombre de variables explicatives continues. Cela permettrait de quantifier l’impact du ‘curse of dimentionality’ (trappe de la dimension)

sur la performance du test. En effet, dans la pratique, la probabilité conditionnelle implique de plusieurs facteurs explicatifs discrets et continus.

Annexe A

Annexes

Dans le document Tests non paramétriques de spécification pour densité conditionnelle : application à des modèles de choix discret (Page 32-41)