• Aucun résultat trouvé

Déterminer l’existence de la surmortalité des jeunes

2.1 Modèles de mortalité

2.1.4 Mortalité des jeunes adultes

La bosse de surmortalité des jeunes adultes a été modélisée pour la première fois par Thiele, un actuaire danois de la fin du XIXe siècle. Ce modèle fait également l’hypothèse des causes concurrentes : "the causes of death naturally fall into three or four large groups, which can be known by the ways in which they operate upon different ages [...], childhood, middle age, and old age" (Thiele 1871, 313). Sa formule s’exprime algébriquement par5

µ(x) =a1e−b1x+a2e12b2(x−c)2+a3eb3x

c détermine l’âge auquel la bosse atteint son maximum, a2 le niveau de ce maximum et b2 la concentration de la bosse. Le premier et le troisième terme sont explicitement inspirés respectivement des modèles d’Oppermann et Gompertz.

La publication de cette nouvelle formule, la première à englober l’ensemble de la vie humaine, n’a étrangement pas engendré de nombreuses applications. Cette absence peut s’expliquer en partie par la formulation peu robuste du premier terme (figure 2.4). La persistance de ce défaut pourrait surprendre, mais s’explique par l’intérêt essentiellement actuariel de Thiele, qui reconnait lui-même que bien que

"the determination of the true rate of mortality in childhood is a difficult problem (...) it is of less importance, since insurances are seldom effected at young ages"

(Thiele 1871, 314). Toutefois, cette imprécision aurait très bien pu être corrigée lorsque de meilleures données sur la mortalité infantile ont fait leur apparition.

L’absence d’une telle démarche laisse à penser que l’intérêt scientifique pour la mortalité des jeunes adultes n’était simplement pas suffisant pour qu’une meilleure formulation soit proposée.

En effet, il faut attendre plus d’un siècle pour voir réapparaître des modèles, plus précis cette fois, incluant les jeunes adultes. Le plus connu d’entre eux est sans conteste celui de Heligman et Pollard, qui lui-aussi décrit l’évolution de la mortalité selon trois termes additifs. Le deuxième, qui estime la mortalité des jeunes adultes, reprend exactement la formule de Thiele, même si les paramètres sont exprimés de manière légèrement différente. Le troisième est une fonction exponentielle gompert-zienne. L’apport du modèle de Heligman et Pollard, par rapport à celui de Thiele, est essentiellement d’améliorer la qualité d’estimation dans les premières années de vie par une double exponentielle où A ∼= q1, C capte le rythme du déclin de la mortalité au début de l’existence etB mesure la proximité deq0 et q1. Comme dans le modèle de Thiele, le deuxième terme contient trois paramètres mesurant la sévérité (D), la concentration (E) et la localisation (F) de la bosse de surmortalité des jeunes adultes. Formellement, la fonction est la suivante

q(x)

p(x)=A(x+B)C +De−E·(ln(x)−ln(F))2+GHx

5. Dans l’article original,b3 etb2 sont exprimés respectivement négativement et au carré, ce qui ne répond à aucune nécessité mathématique. La version simplifiée indiquée ici est celle figurant dansWunsch et al.(2002).

Elle a la particularité d’être estimée sur la quantité q(x)p(x) = 1−q(x)q(x) . Cette for-mulation de type logistique permet de restreindre les valeurs de q(x) à l’intervalle [0 ;1[. Ce choix, parfois critiqué pour sa complexité inutile (Gage and Mode 1993), est en effet superflu puisqu’une modélisation du taux de mortalitém(x) à la place du quotienq(x) aurait permis de s’affranchir de cette limite supérieure. Une autre solution est proposée directement par Heligman et Pollard afin de tenir compte d’une certaine concavité observée sur la droite d’équationln(q(x)p(x)), sous la forme

q(x) =A(x+B)C+De−E·(ln(x)−ln(F))2+ GHx 1 +KGHx ou, alternativement,

q(x) =A(x+B)C +De−E·(ln(x)−ln(F))2+ GHxK 1 +GHxK

L’expérience montre toutefois que le paramètre K a rarement été retenu dans la littérature, puisqu’il n’a ni interprétation théorique, ni grande utilité mathéma-tique. Une version plus simple, qui inclut une formulation asymptotique du dernier terme (impliquant que limx→q(x) = 1) a été proposée ultérieurement sous la forme

q(x) =A(x+B)C+De−E·(ln(x)−ln(F))2+ GHx 1 +GHx

Ce modèle permet d’atteindre une qualité d’approximation élevée dans la plu-part des cas, qui reflète souvent de manière adéquate la bosse observée aux alentours de 20 ans lorsqu’elle est suffisamment symétrique (figure 2.4).

Ce n’est toutefois pas toujours le cas, ce qui a motivé la révision proposée par Kostaki, qui a mis en évidence une déviation systématique de la courbe estimée par rapport aux observations dans la première partie de la bosse de surmortalité Kostaki (1992). Cette inadéquation tient dans le fait que le paramètre E est seul responsable de la courbure de la bosse avant et après son sommet (point F). Or, dans de nombreux cas, la courbure est nettement plus faible après qu’avant le sommet de la bosse, formant un sorte de plateau qui rejoint lentement la progression exponentielle dans la seconde moitié de la vie. Afin de remédier à ce défaut, Kostaki propose de diviser le rebond en deux parties situées avant et après le point F, et de permettre une différence de courbure entre ces deux parties. Formellement,

q(x) p(x) =

(

A(x+B)C +De−E1·(ln(x)−ln(F))2+GHx pour xF A(x+B)C +De−E2·(ln(x)−ln(F))2+GHx pour x > F

E2 est un neuvième paramètre permettant d’exprimer la courbure de la bosse après le sommet. Alternativement, on peut simplement ajouter un coefficient

multiplicatif au paramètre E dans la seconde partie de la courbe égal à EE21 et me-surant le rapport de courbure entre la seconde et la première partie de la bosse. Ce nouveau paramètre prend des valeurs entre 1 (dans ce cas on retrouve le modèle ori-ginal de Heligman et Pollard) et 0 (plateau total après le sommet). Dans l’exemple des hommes suisses entre 1980 et 1984, le rapportk=EE21 s’élève à 0.39 (figure 2.4).

Notons qu’il n’est pas nécessaire de diviser la procédure d’estimation en deux étapes pour estimer la courbe avant et après le sommet de la bosse. Il suffit d’intro-duire dans la formule un terme booléen du type (x < F), qui permet d’appliquer la première formule avant le point F, et un autre du type (x > F) appliquant la seconde formule après. Les deux fonctions partageant les mêmes valeurs de D (hau-teur de la bosse) et F (localisation), la continuité de la fonction est alors garantie.

Figure 2.4 – Application des lois de Thiele, Heligman-Pollard et Kostaki sur les hommes suisses en 1980-1984

0 20 40 60 80

−8

−6

−4

−2

âge

log(qx)

obs Thiele HP Kostaki

D’autres modèles incluant un traitement spécifique de la mortalité des jeunes adultes ont été proposés. Ils s’opposent à celui de Heligman et Pollard dans la mesure où ils sont définis par des équations distinctes pour chaque portion de la vie. La technique proposée par Mode and Busby (1982) consiste à estimer trois courbes de survie différentes sur les intervalles d’âge [0; 10], [10; 30] et [30;∞[. Ils s’assurent ainsi une meilleure qualité d’approximation locale, au détriment de la cohérence globale. Formellement, le modèle de Mode et Bosby s’écrit comme suit

µ(x) =





a1e−b1x pourx≤10 a4b4(xy4)2 pour 10≤x≤30 a2+a3eb3x pourx≥30

µ(x) suit d’abord une loi exponentielle négative comme celle de Thiele, puis une fonction parabolique entre 10 et 30 ans et enfin une loi de Makeham-Gompertz après 30 ans. Un autre modèle a été proposé quelques années plus tard par Mode and Jacobson(1984), qui divise la procédure cette fois-ci en deux tronçons, compo-sés chacun de deux termes additifs qui comptent au total 10 paramètres. Le modèle de Mode et Jacobson s’écrit de la manière suivante

µ(x) =

(b5d5(x+y5)d5−1·e[a5−b5(x+y5)d5]+e[a6−b6·ln(y6x)2] pourx <30

a2+a3eb3x pourx≥30

La principale différence entre ces deux modèles et celui de Heligman et Pollard est qu’ils sont estimés par segments, et chaque terme est calculé uniquement sur l’intervalle d’âge qui le concerne. Une simple estimation de chacun des termes au-rait pour conséquence de ne pas garantir la continuité de la courbe prédite, ce qui engendrerait la situation absurde dans laquelle certains âges connaitraient deux différentes valeurs de µ(x). Afin de corriger ce défaut, les auteurs proposent de fixer des conditions supplémentaires dans la procédure d’estimation, qui consistent premièrement à utiliser la courbe de survie comme référence, puis à faire passer cette courbe exactement par certains points observés comme 5, 10, 15, 20 et 40 ans. Cela revient à fixer arbitrairement certains points d’accrochage, en plus de l’arbitraire déjà induit par la définition de la largeur des portions concernées par chaque équation. La compléxité de cette procédure explique probablement le peu de succès qu’elle a rencontré dans la littérature.

Pourtant, une étude comparative a conclu à une supériorité du modèle de Mode et Jacobson sur les deux autres, même si la méthode d’estimation et les critères de comparaison sont discutables (voir la sectionContrôle des hypothèses du théorème de Gauss-Markov). Les auteurs reconnaissent également que certains paramètres n’ont pas de signification théorique, contrairement au modèle d’Heligman et Pol-lard (Gage and Mode 1993, 450). Les extrêmes atteints par les deux solutions proposées par Mode et ses confrères, tant dans le nombre de paramêtres que la fastidiosité de la procédure, illustrent la difficulté de développer des modèles de mortalité capables d’atteindre une bonne qualité d’approximation tout en limitant

leur complexité. Cette balance entre qualité et complexité est une pierre d’achop-pement constante dans la sélection des modèles de mortalité.