• Aucun résultat trouvé

surmortalité des jeunes adultes

4.1.3 Extrapolation des cohortes non-éteintes

La question de la projection du futur des générations non-éteintes a reçu de nombreuses réponses. Certains auteurs préconisent l’usage de la méthode des gé-nérations éteintes (Survival ratio method), qui repose sur l’idée que "le nombre des survivants d’un certain âge, au sein d’une genération, est égal a la somme de tous les décès survenus après cet âge, dans la meme génération, jusqu’à extinction" (Depoid 1973, 760). La reconstitution de générations non-éteintes selon cette méthode né-cessite de suposer que les quotients de décès (qx) d’une certaine génération éteinte puissent être appliqués à la génération suivante (Bourbeau and Lebel 2000). Cette méthode a donc le défaut important de maintenir la mortalité stable au cours du temps, au-delà des dernières observations connues.

Une alternative plus réaliste consiste à projeter les taux de mortalité de période, puis d’en extraire les trajectoires des cohortes qui apparaissent sur la diagonale du diagramme de Lexis. C’est cette approche qui a été privilégiée notamment par Wilmoth and Ouellette (2012) ou Shkolnikov et al.(2011) pour la projection des cohortes non-éteintes. Par rapport à la méthode des générations éteintes, celle-ci a l’avantage de prendre en compte l’évolution de la mortalité au cours du temps.

La qualité de la projection doit cependant être élevée afin de tenir sur une période d’environ 60 ans.

Il y a environ 20 ans de cela,Lee and Carter(1992) ont introduit une technique de projection démographique devenue depuis très populaire. Elle consiste dans un premier temps à résumer l’évolution des taux de mortalité par âge dans le temps mx,t (x= âge, t= année) en seulement trois composantes additives.

ln(mx,t) =αx+βx·κt+x,t

αx correspond à la moyenne du logarithme des taux de mortalité par âge calculée sur l’ensemble de la période considérée, moyenne qui est soustraite à la matrice des mx,t pour la centrer avant d’estimer les autres composantes. κt, lui, représente la tendance générale du niveau de mortalité au cours du temps. Enfin, puisqu’il n’est pas réaliste de supposer que cette évolution moyenne s’applique à tous les âges avec la même force, le terme βx permet moduler de cette évolution générale en fonction de l’âge.

Le modèle de Lee-Carter est estimé par une décomposition en valeurs singu-lières (DVS) et est en cela assimilable à une analyse en composantes principales (ACP), puisque son objectif est de diminuer la complexité de la matrice desmx,ten un nombre inférieur de dimensions. Ainsi, partant d’une matrice contenantN xM valeurs de mx,t(N = nombre de groupes d’âge, M = nombre d’années), le modèle réduit l’information à 2·N+M coefficients. Dans le cas d’une ACP, les coeffi-cientsβxcorresponderaient à la première dimension isolée, alors que les coefficients κtcorrespondraient à la projection de chaque période sur cette première dimension.

L’estimation du modèle de Lee-Carter pour les hommes suisses entre 1876 et 2011 confirme la proximité de ce modèle avec une ACP (figure 4.3). Le coefficient κtindique une baisse continue du niveau de mortalité (sauf pour 1918). La struc-ture par âge deβx, qui est quasiment identique à la première dimension de l’ACP, indique que les progrès décrits par κt ont été plus importants au début qu’à la fin de la vie. Cette dimension explique à elle seule 81% de l’évolution des taux de mortalité entre 1876 et 2011, tout en réduisant la complexité à 2.6% de son niveau originel2. La différence entre l’ACP et le modèle de Lee-Carter s’explique principa-lement par le fait que le second utilise une autre méthode de décomposition (DVS).

Quoi qu’il en soit, le modèle est très puissant puisqu’il permet une forte réduction de la complexité tout en conservant une grande part de l’information. Cette recette explique son succès incontestable dans la communauté des démographes au cours des vingt dernières années.

La dernière étape du modèle de Lee-Carter consiste à extrapoler linéairement la tendance dekttout en gardant fixes les valeurs deαxetβxau cours du temps.

Cette étape constitue le point faible du modèle et celui sur lequel l’essentiel des critiques se sont focalisées. En effet, comme le montre la figure 4.3, l’hypothèse de linéarité n’est pas toujours tenable car le coefficientκta eu tendance à progresser plus rapidement après la Seconde Guerre mondiale. Cette caractéristique est pro-bablement liée également au fait que βx est artificiellement maintenu constant au cours du temps. Cette constatation a mené à plusieurs tentatives de reformulation du modèle.Booth et al. (2002) ont par exemple proposé une méthode permettant de déterminer statistiquement la longueur d’observation "optimale" permettant de ne conserver que la période respectant l’hypothèse de linéarité de κt. Malheureu-sement, cette réduction de la profondeur d’analyse diminue fortement la qualité de la projection à long terme.

Une méthode plus récente et plus convaincante a été proposée par Hyndman and Ullah (2007). Elle consiste essentiellement à utiliser d’autres dimensions de la décomposition afin de capter plus d’information et de permettre une modulation progressive des évolutions à différents âges. Techniquement, les auteurs utilisent également une autre méthode de décomposition (functional data analysis), ainsi qu’un lissage préalable de αx par spline, mais l’esprit de cette approche reste le même que celui de Lee et Carter. Ces améliorations techniques modifient quelque peu la terminologie, ce qui a pour conséquence que le modèle s’exprime algébrique-ment sous la forme suivante.

ln(mx,t) =µ(x) +

K

X

k=1

βt,k·φk(x) +t(x)

µ(x) est une fonction lissée équivalente àαxdans le modèle de Lee-Carter, φk(x) est la fonction exprimant la kème dimension de la décomposition effectuée et βt,k est un jeu de coefficients décrivant l’évolution de la kème fonction dans le

2. La dimension de la matrice originelle est de 91 classes d’âge x 136 années = 12’376, alors que les coefficients estimés ne sont que 91+91+136 = 318.

Figure4.3 – Modèle de Lee-Carter et Analyse en Composantes Principales sur les données des hommes suisses de 1876 à 2011

0 20 40 60 80

−7

−6

−5

−4

−3

−2

−1

ln(mx)

âge (x) αx

0 20 40 60 80

−5 0 5 10

Dimension 1

âge (x) βx

ACP LC

1880 1920 1960 2000

−0.15

−0.10

−0.05 0.00 0.05 0.10 0.15

Projection 1

temps (t) κt

temps. Lorsque k = 1, le modèle de Hyndman-Ullah se résume à un modèle de Lee-Carter dans lequel βx =φ(x) etκt=βt. Dans son esprit, ce nouveau modèle est donc une généralisation de celui de Lee et Carter, dans la mesure où le premier conserve plus de dimensions, donc plus d’information que le second. Appliqué aux mêmes données des hommes suisses sur les trois premières dimensions (K= 3), il permet une analyse plus fine que le modèle de Lee-Carter (figure 4.4). La fonction φ2(x), notamment, permet de distinguer l’évolution relative aux âges situés environ entre 20 et 40 ans, pour lesquels on observe dans un premier temps une améliora-tion plus rapide que la moyenne3, suivie d’une rapide détérioration relative entre 1960 et 1990, puis d’une nouvelle amélioration plus rapide que les autres groupes d’âges au cours des deux dernières décennies.

3. Le coefficientβ2croît, mais sur des valeurs négatives deφ2, ce qui implique une baisse plus rapide demx que sur les autres groupes d’âge.

Figure 4.4 – Modèle fonctionnel de Hyndman-Ullah sur les données des hommes suisses de 1876 à 2011

0 20 40 60 80

1880 1900 1920 1940 1960 1980 2000

−15

1880 1900 1920 1940 1960 1980 2000

−4

1880 1900 1920 1940 1960 1980 2000

−1.0

Selon ses auteurs, le modèle fonctionnel de Hydman et Ullah est supérieur à celui de Lee et Carter ainsi qu’à d’autres variantes grâce à la prise en compte de plusieurs dimensions, particulièrement au-delà d’un horizon de 7 ans (Hyndman and Ullah 2007). Un autre avantage de ce modèle est qu’il est applicable à d’autres types de taux que le risque de décès, comme le montrent les auteurs en effectuant des projections de taux de fécondité et même de migration. Dans une autre publi-cation, cette méthode est étendue aux cas dans lesquels plusieurs sous-populations sont projetées simultanément (p.ex. par sexe ou sur plusieurs sous-régions), tout en maintenant une "cohérence" de l’ensemble (Hyndman et al. 2013). Nous avons toutefois renoncé à utiliser ce nouveau développement car il nous paraissait inutile, voire fallacieux, d’imposer une convergence entre l’espérance de vie des hommes et des femmes sur le long terme.

La méthode que nous avons donc retenue pour la projection des cohortes non-éteintes est la suivante. L’ensemble des taux de mortalité de période sont utilisés afin d’estimer un modèle fonctionnel de Hyndman et Ullah sur trois dimensions (K=3)4. Sur la base de ce modèle, les taux de mortalité de période sont projetés dans le futur sur une période de 61 ans, soit autour de 2070 suivant les données disponibles pour chaque pays. Cette projection utilise une méthode univariée pour chaque coefficient βk, ce qui est rendu possible par le fait que les fonctions φk

sont orthogonales et donc que les coefficientsβk,tne sont pas corrélés, ainsi qu’un modèle ARIMA qui permet de réduire le poids des valeurs absurdes (outliers) dans la projection. Enfin, les taux de mortalité des cohortes sont complétés en utilisant les taux de mortalité de période projetés. Plus précisément, le taux de mortalité

4. Cette tâche est grandement facilitée par l’existence de la librairie Rdemographyqui contient l’ensemble des fonctions nécessaires à l’estimation de ce type de modèles (de même que celui de Lee-Carter d’ailleurs), ainsi qu’à la projection des taux de mortalité.

de la cohorte c à l’âge x est défini comme le taux de mortalité à l’âge xpour la périodet=c+x. Algébriquement,

mcx,c=mpx,t=c+x

Dans le cas des hommes suisses, cette procédure concerne les cohortes nées entre 1921 et 1981. Les données de la Human Mortality Database ne couvrent pas les cohortes plus récentes, qui seraient de toute manière inutiles étant donné qu’elles n’ont pas encore passé la période de surmortalité des jeunes adultes. La figure 4.5 représente la trajectoire des cohortes jusqu’au moment où celles-ci sont observées (en couleurs pâles) et leur projection au-delà (en couleurs foncées). Les trajectoires projetées semblent plausibles, ce qui renforce le crédit de la méthode utilisée. Toutes les cohortes reconstruites sont représentées en annexes (figures A.1 et A.2).

En conclusion, la base de données extraite de la HMD et déployée par nos soins comporte pour chaque sexe 3051 séries transversales et 2033 séries longitudinales.

Au total, cela représente plus de 10’000 tables de mortalité réparties sur quatre siècles et quatre continents. Certes, elle n’inclut aucun pays du Sud, notamment d’Afrique, mais elle couvre deux siècles et demi d’évolution socioéconomique du monde occidental, de l’Europe de l’Est et d’Extrême-Orient. Elle permet également d’adopter une perspective de genre en comparant systématiquement les hommes et les femmes dans l’espace et le temps.