• Aucun résultat trouvé

Contrôle des hypothèses du théorème de Gauss-Markov

Déterminer l’existence de la surmortalité des jeunes

2.2 Estimation des modèles

2.2.2 Contrôle des hypothèses du théorème de Gauss-Markov

Jusqu’à présent, la qualité d’estimation des modèles proposés n’a été jugée que de manière visuelle en comparant les valeurs de q(x) observées et estimées. Mais cette méthode intuitive, au demeurant indispensable, ne procure aucune mesure quantifiable de la qualité d’approximation. Pour dépasser cette limite, il faut ob-server les termes d’erreur . Or, ils sont régis par certaines hypothèses qui doivent être vérifiées pour que l’estimation par les moindres carrés ne soit pas biaisée.

Les termes d’erreurs sont habituellement définis comme la différence entre les valeurs observées qx et prédites ˆqx, soit x =qxqˆx. Dans notre cas, l’usage de pondérations incite à considérer à la place les erreurs pondérées

x= qxqˆx wx

pour lesquelles il s’agira premièrement de trouver la définition dewx qui per-mette au mieux le respect des hypothèses régissant la méthode des moindres carrés.

Il ressort des analyses précédentes que ce choix se fera entrewx=q1x etwx=q1x2, soit entre des pondérations simples et quadratiques, puisque les pondérations cu-biques sont génératrices d’importantes déviations du modèle aux âges avancés. Le théorème de Gauss-Markov énonce que dans le cas où les erreurs ont une espérance nulle, sont non corrélées et homoscédastiques, le meilleur estimateur non biaisé des coefficients (BLUE) est celui des moindres carrés. Le contrôle de ces trois conditions implique de tester les affirmations suivantes.

1. E(x) = 0

2. cor(x1, x2) = 0 ∀x16=x2 3. var(x) =σ2 ∀x

L’hypothèse d’espérance nulle demande de calculer la moyenne des termes d’er-reur, en supposant que ces termes sont centrés sur zéro. Le cas contraire indiquerait que le modèle sur- ou sous-estime systématiquement toutes les valeurs deq(x).

La seconde hypothèse est moins centrale dans notre cas, puisqu’elle concerne habituellement les séries temporelles pour lesquelles l’autocorrélation est un pro-blème courant. Or, ici les données ne sont pas tirées de séries temporelles, mais elles sont néanmoins ordonnées selon l’âge. Dans le cas où une corrélation, en particulier de premier ordre (lien entre un terme d’erreur et celui qui le suit directement), est avérée, cela serait le signe d’une déviation systématique du modèle dans certaines

portions des observations.

Le troisième critère de qualité postule l’homoscédasticité du modèle, c’est-à-dire la stabilité de la variance des erreurs en fonction de l’âge. Cette analyse peut être réalisée non-seulement visuellement, mais aussi par le test de Park (Park 1966), en régressant le logarithme du carré des résidus sur le logarithme de la variable dépendante (ln(qx2) =θ·ln(2x)), puis en observant la significativité du coefficient sig(θ)8. Ce point, qui est un hypothèse centrale dans la méthode des moindres car-rés, a été notamment critiqué dans le cas du modèle de Heligman et Pollard dont les erreurs d’estimation seraient de plus en plus variables aux âges avancé (Gage and Mode 1993). Or, cette critique repose non-seulement sur la version originale du modèle (sans la formulation "logistique" du dernier terme 1+GHGHxx) dont on sait qu’elle capture mal l’aplatissement de la force de mortalité aux grands âges, mais fait également usage des termes d’erreurs absolus et non pondérés. Or, la justifica-tion de l’usage des pondérajustifica-tions est justement la diminujustifica-tion de l’hétéroscédasticité.

Un quatrième contrôle à effectuer consiste à vérifier que les termes d’erreur suivent une distribution normale. Bien que cette hypothèse ne fasse pas partie du théorème de Gauss-Markov, sa violation peut indiquer une mauvaise définition de la forme fonctionnelle de certains paramètres ce qui remettrait en cause l’usage des tests basés sur l’hypothèse de normalité, comme ceux de Student, de Fisher ou du Chi-2. Or, ces tests servent notamment à comparer les modèles entre eux, ce qui est un point crucial.

Pour qu’on puisse la considérer comme normale, la distribution des résidus devrait avoir une asymétrie (skewness) nulle et un coefficient d’aplatissement ( kur-tosis)9 de 3. Le test de Jarque et Berra permet de tester ces deux critères simul-tanément (Jarque and Bera 1980).

Une application de ces quatre critères sur une population réelle (en l’occurrence les hommes américains en 1960) montre que la centralité, la normalité ainsi que l’homoscédasticité sont nettement améliorées en utilisant des pondérations simples plutôt que quadratiques (figure 2.6). Dans le premier cas, avec une asymétrie de -0.53 et un aplatissement de 2.98, le test de Jarque-Bera ne rejette pas l’hypothèse de normalité. Dans le second cas, par contre, l’hypothèse de normalité est claire-ment rejetée avec une asymétrie de -1.33 et surtout un aplatisseclaire-ment de 10.46. De plus, la tendance à l’hétéroscédasticité semble visuellement bien moindre avec les pondérations simples, ce qui est confirmé par le test de Park.

Au final, des quatre critères, seul celui de l’autocorrélation des résidus incite à l’utilisation des pondérations quadratiques plutôt que simples. Cette corrélation semble due principalement à une surestimation des taux entre 30 et 50 ans. On peut

8. Une valeur significative deθsignifierait que la magnitude absolue de l’écart entre les valeurs observées et prédites dépend de l’âge.

9. Nous utiliserons ici la définition "classique" du kurtosis qui est égale au 4e moment centré réduit. Dans la littérature on trouve également une définition "normalisée" du kurtosis mesurant l’excès d’aplatissement, égale à la définition classique moins 3, de manière à centrer le kurtosis autour de 0.

donc conclure que, sur cette population, l’usage des pondérations simples permet de réduire fortement les biais sur les termes d’erreurs, alors que les pondérations quadratiques engendrent une hétéroscédasticité et une absence de normalité dans les résidus.

Figure2.6 – Analyse des termes d’erreur Modèle HP : Hommes américains 1960

Distribution

Afin de contrôler que ces résultats ne sont pas uniquement dus aux particu-larités de l’exemple choisi, les hypothèses du théorème de Gauss-Markov ont été testées sur un échantillon de 100 tables de mortalité tirées aléatoirement10. Pour chacun de ces cas, la moyenne ( ¯x), l’autocorrélation (Corr(x, x+1)), l’asymétrie (G1(x)), l’aplatissement (G2(x)) et l’homoscédasticité (sig(θ)) ont été calculées

10. L’échantillon aléatoire compte 100 tables de mortalités tirées de laHuman Mortality Data-base, et comporte 30 pays, 63 années distinctes comprises entre 1900 et 2010, et 52 populations féminines contre 48 masculines.

(figure 2.7). Ces résultats confirment ceux obtenus sur le cas particulier précédent, à savoir que les pondérations simples dominent dans tous les indicateurs sauf celui de l’autocorrélation des termes d’erreur. Plus précisément, l’usage des pondérations simples permet d’obtenir une distribution de résidus plus centrée (dans 100% des cas), symétrique (76%) et aplatie (98%), qui se rapproche d’une distribution nor-male, et l’hétéroscédasticité est plus faible dans tous les cas observés, bien que le test de Park rejette souvent l’hypothèse de constance de la variance.

Figure 2.7 – Test des hypothèses du théorème de Gauss-Markov

simple quadratique

En conclusion à cette première analyse de la qualité du modèle de Heligman et Pollard, nous pouvons avancer que les critères d’application de la méthode des moindres carrés et de la qualité d’approximation aux âges qui nous intéressent sont relativement bien remplis à condition d’utiliser des pondérations simples égales à l’inverse de la variable dépendante (wi = q1x). Même si l’hétéroscédasticité n’est pas totalement éliminée, elle est fortement limitée et est nettement améliorée par rapport à d’autres définitions de pondérations.

2.2.3 Identification des paramètres et choix d’un algorithme