• Aucun résultat trouvé

3.2 Lissage et interpolation des données brutes

3.2.3 Lissage paramétrique

Cette méthode est basée sur l’hypothèse que la mortalité (s’agissant des taux instantanés ou des taux de décès annuels) est fonction de l’âge. L’objectif étant d’obtenir le meilleur ajustement possible avec les taux à lisser avec le moins de paramètres possibles, il faut donc concilier qualité de l’ajustement et nombre de paramètres. Le risque serait de spécifier un trop grand nombre de paramètres, ce qui rendrait le modèle parfaitement adapté aux données étudiées mais dénué de toute qualité d’estimation de la mortalité d’une autre population pourtant proche.

Lissage de Gompertz-Makeham

La fonction de type Gompertz-Makeham de la forme :

GMα(x) = α + β · γx = µ(x) nous avions montré que :

S(t) = exp(−αt − β

log(γ)

t− 1))

La détermination peut être effectuée par différentes méthodes. Renshaw, princi- palement, a proposé la détermination des r+s paramètres de cette fonction par la méthode des modèles linéaires généralisés. L’utilisation de cette technique se justifie parfaitement par l’absence de normalité des taux de mortalité.

Rappel sur la régression linéaire simple Faire de la régression linéaire de y sur x, c’est s’intéresser à la dépendance entre y et x. y peut dépendre de x, mais il peut aussi dépendre d’une infinité d’autres facteurs. Le modèle sous-jacent à la régression simple est :

Y = f (x) + ε

où :

Y est la variable à expliquer (par exemple la mortalité d’un individu) x la variable explicative ou le prédicteur (par exemple l’âge de l’individu)

ε est l’erreur commise dans l’approximation de Y par f(x), aussi appelé résidu

En général nous disposons d’un certain nombre n d’observations :

Yi = f (xi) + εi avec i = 1, ..., n

Quand nous parlons de régression linéaire, cela revient à supposer f affine, que chaque εi est indépendant et identiquement distribué ∀i (i.i.d.), centré et de même

variance σ2 (hypothèse d’homoscedasticité, i.e. toutes les mesures ont été faites

indépendamment des autres, dans les mêmes conditions)

Si nous considérons le modèle Yi = β0+ β1 · xi + εi avec i = 1, ...n et Eεi = 0, Vεi = σ2 et εi i.i.d., sans pour autant supposer la loi de εi, le problème est alors d’estimer les paramètres β0 et β1, déterminer σ2, créer des intervalles de confiances

pour Yi et valider la modélisation.

Si la linéarité entre les paramètres est supposée, nous utilisons la méthode des moindres carrés et nous cherchons à minimiser la somme des écarts quadratiques entre Yi et β0 + β1· xi. Nous cherchons donc à minimiser :

n

X

i=1

(Yi− β0+ β1· xi)

ce qui revient à minimiser la grandeur que nous noterons δ2

n : δ2n= 1 n n X i=1 (Yi − β0+ β1· xi)

En annulant successivement les dérivés par β0 et β1 de δn2, des estimateurs de β0

et β1 sont alors trouvés :

ˆ β0 = Y − β1x ˆ β1 = 1 n n P i=1 xiYi− Y x 1 n n P i=1 x2 i − (x)2 = Covarianceempirique(x, Y ) V arianceempirique(x) = Cx,Y S2 x

Ainsi l’équation de la droite des moindres carrés est obtenue :

Y + Cx,Y

S2

x

(xi− x)

qui est la version empirique de la meilleure approximation affine de Y.

En considérant le modèle précédent, Yi = β0 + β1 · xi + εi, avec E(εi) = 0 et V(εi) = εi, d’après le théorème de Gauss-Markov, ˆβ0 et ˆβ1 sont des estimateurs sans

biais à variance minimale parmi tous les estimateurs sans biais linéaires. Intéressons nous maintenant à l’estimation de la variance des résidus :

σ2 = V(Yi− β0− β1xi) Soient

Ei = Yi− ˆβ0− ˆβ1xi

les résidus empiriques, nous avons le résultat suivant :

ˆ σ2 = n P i=1 (Ei− En)2 n − 2

où En est la moyenne empirique des résidus empiriques.

Tout ceci a été effectué sans hypothèses sur la loi des εi. Cette régression permet l’estimation de valeurs inconnues (e.g. la mortalité lissée) sous forme de combinaison linéaire d’un prédicteur - par exemple, l’âge. Cette linéarité implique qu’un certain changement du prédicteur entraîne un certain changement de la variable estimée de la même ampleur. Or ce type de réponse de la variable au prédicteur n’est valable que dans certains cas. La réponse au prédicteur peut dans certains cas être plutôt exponentielle ou de type logistique (la réponse attendue ne peut être que 0 ou 1).

Rappel sur les modèles linéaires généralisés L’intérêt des modèles linéaires généralisés est, précisément de généraliser la prédiction au cas où la variable réponse suit une distribution quelconque. Le recours à une fonction de lien entre la variable réponse et le prédicteur, afin que la réponse varie linéairement avec le prédicteur, n’est donc plus indispensable.

Sous l’hypothèse que Y1, ..., Yn sont i.i.d. de densité f, nous obtenons, par maxi- misation de la log vraisemblance de f :

EY = b0(θ)

VY = b00(θ)a(φ)

Dans ce cas, l’hypothèse est faite que la loi de Y est dans la famille exponentielle, i.e. la densité de Y peut être écrite sous la forme

f (y, θ, φ) = exp(yθ − b(θ)

a(φ) − c(y, φ))

Par exemple dans le cas de la loi Binomiale de paramètre n,p où P(Y = y) =

Cnypy(1 − p)n−y, P(Y = y) peut être réécris sous la forme :

exp(ylog( p

1 − p) + nlog(1 − p) + log(C y n))

où peut être identifier :

exp(y log( p 1 − p) | {z } θ + nlog(1 − p) | {z } -b(θ) + log(Cny) | {z } c(y,φ) )

Nous avons alors :

θ = log( p 1 − p) ⇔ p 1 − p = exp(θ) ⇔ p = exp(θ) 1 − exp(θ)

b(θ) = −nlog(1 − p) = nlog(1 + exp(θ))

a(φ) = 1

Il faut aussi définir le prédicteur linéaire

x0i = (xi0, ..., xip)

sont les variables exogènes associées à l’individu i et

β =      β0 .. . βp     

le vecteur des paramètres inconnus à estimer. Définissons aussi la fonction de lien g :

g(µi) = ηi = x0

⇔ µi = g(x0iβ)

Ensuite, β et φ sont estimés par maximum de vraisemblance. L’objectif est donc d’annuler la dérivée de la log vraisemblance de f en les β et en φ. La résolution se fait ensuite par la méthode de Newton Raphson.

Nous obtenons :

• Soit u(β) le vecteur gradient dont l’élément en position j est égal à :

δ

δβj

log(L)

• Soit H (β) la matrice Hessienne dont l’élément en position (j,k) est égal à : δ2

δβjδβklog(L)

Par définition du maximum de vraisemblance :

u( ˆβ) = 0

≈ u(β∗) +H (β∗)( ˆβ − β∗) par développement limité

⇒ ˆβ = β∗−H ←)u(β∗)

Avec la méthode de Newton Raphson, nous partons d’une valeur ˆβ(0) et nous obte-

nons itérativement :

ˆ

β(r+1)= ˆβ(r)−H←( ˆβ(r))u( ˆβ(r))

Retour au lissage de Gompertz Makeham Supposons que Ex soit l’effectif sous risque l’année x, c’est à dire le nombre de personnes présente dans l’étude à l’âge x et étant soumis, par exemple, au risque de décès entre les âges x et x+1 avec

la probabilité de décès égale à qx. Supposons aussi que la probabilité de décès de chaque individu compris dans la population Ex est indépendant de la probabilité de décès des autres individus de cette population. Alors le nombre de décès entre les âges x et x+1, Dx, est une variable aléatoire suivant une loi Binomiale. Nous avons

Dx ∼ Bin(Ei, qx) Soit qx = GMr,s α 1 + GMαr,s

en utilisant la transformation logit comme fonction de lien pour qx, nous trouvons que :

qx

1 − qx

= GMαr,s(x) c’est à dire que qx

1−qx correspond au prédicteur linéaire.

En résumé, le lissage par moyenne mobile présente l’avantage d’être simple à utiliser, mais présente l’inconvénient d’être sensible aux valeurs extrêmes, auxquelles nous serons confrontées.

Le lissage par la méthode de Whittaker Henderson quant à lui présente une bonne alternative : en effectuant un arbitrage entre fidélité aux données et régularité, cette méthode permet d’éliminer d’éventuelles fluctuations injustifiées des taux, tout en conservant une proximité avec les taux non lissés. Nous utiliserons préférentielle- ment ce type de lissage, avec un paramètre lambda permettant d’obtenir un lissage suffisant. Le choix de ce paramètre est arbitraire, dans la suite de l’étude, nous le choisirons le plus faible possible afin d’obtenir un lissage, tout en étant fidèle aux données.

Un problème non résolu par le lissage demeure : bien souvent, nous ne disposons pas d’observations de personnes très âgées. Toutefois, il n’est pas impossible que de telles personnes soient présentes dans le portefeuille à l’avenir. Il faut donc tenter d’extrapoler les taux obtenus aux grands âges, grâce notamment aux techniques présentées dans la partie suivante.

Documents relatifs