R EVUE DE STATISTIQUE APPLIQUÉE
F LORIAEN E. C. DE V YLDER
M ARC J. G OOVAERTS
Estimation de la variance, dans un modèle classique, si les coefficients d’aplatissement des variables sont connus
Revue de statistique appliquée, tome 41, n
o3 (1993), p. 5-20
<http://www.numdam.org/item?id=RSA_1993__41_3_5_0>
© Société française de statistique, 1993, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
ESTIMATION DE LA VARIANCE,
DANS UN MODÈLE CLASSIQUE,
SI LES COEFFICIENTS D’APLATISSEMENT DES VARIABLES SONT CONNUS
Floriaen E.C. De
Vylder (1),
Marc J. Goovaerts(2)
(1 ) Université Cath. de Louvain, Place des Doyens 11348 Louvain-la-Neuve,
Belgique
(2) Katholieke Universiteit Leuven de Bériotstraat 34 3000 Leuven,
België
RÉSUMÉ
Le coefficient
d’aplatissement
de la variable nondégénérée
X est défini parLe modèle
statistique
considéré est défini par les variablesindépendantes
Xl, ... , Xn telles que-
Si m est connu, l’estimateur non biaisé de variance minimum
de s2
dans la familleSi m n’est pas connu, un estimateur
optimal de s2
se laisse dériver, mais il est tropcompliqué
pour être
pratique
et nous en proposons une variante.L’estimateur
classique de s2
estoptimal
si les e2 sont nuls, donc enparticulier
si lesvariables Xi sont normales et de
façon plus générale
si les Xi ont même loi(auquel
cas les e2 sontégaux,
de même que leswi ).
Mots clés : Estimateur, Variance minimum, Non biaisé,
Coefficient d’aplatissement,
Théoriede la crédibilité.
SUMMARY
The kurtosis of the non
degenerated
random variable X is defined to be6 F. E. C. DE VYLDER, M. J. GOOVAERTS
The considered statistical model is defined
by
the random variables Xi,..., Xnsatisfying
When m is known, the minimum-variance unbiased estimator of
s2
in thefamily
equals
If m is non known, an
optimal
estimator fors2
can be found, but it is toocomplicated
tobe
practical
and we suggest a variant of it. The classical estimator fors2 is optimal
if thekurtosisses vanish, thus
certainly
when the random variables arenormally
distributed.Key
Words : Estimator, Minirrium variance, Unbiased, Kurtosis,Credibility theory.
1. Coefficient
d’aplatissement
d’une variable aléatoireSoit X une variable non
dégénérée
en unpoint,
avec moment d’ordrequatre
fini. Le coefficientd’aplatissement e(X )
de X est défini parCe coefficient
d’aplatissement
n’est autre que le coefficient "/2 de Fisher.On a
La valeur extrême - 2 est atteinte si et seulement si X
prend
2 valeursdistinctes,
chacune avec laprobabilité 1/2.
En effet :Les variables normales ont un coefficient
d’aplatissement
nul. Enquelque
sorte ladistribution normale sert comme référence
lorsque
des excès sont considérés.Quelques
autres coefficientsd’aplatissement
sont mentionnés ci-dessous.Si N est une Poisson de
paramètre
À :Si N est binomiale de
paramètres
n, p :Si N est uniforme sur {0, 1,...,n} :
Si X est uniforme sur
[0, a] :
Si X est gamma avec densité
Si X est Pareto avec densitÉ alors
Si X est
lognormale
avec densitéalors
Le cas de la loi de Poisson montre
déjà
que le coefficientd’aplatissement peut prendre
des valeurs arbitrairementgrandes.
2.
Espérance
d’une formehomogène
dedegré quatre
Ci-dessous n est un entier fixé strictement
positif.
Les indicesi, j,
p, qprennent toujours
toutes les valeurs1, 2,...,
n.. Théorème 1
Soient
Vi,..., Yn
des variablescentrées,
nondégénérées, indépendantes,
avecun moment d’ordre
quatre
fini chacune. Notons8 F. E. C. DE VYLDER, M. J. GOOVAERTS
Alors
où
bij
est lesymbole
de Kronecker etbijpq
lesymbole prenant
la valeur 1 sii = j = p = q et la
valeur 0 sinon.Démonstration
On vérifie que la formule
(*)
est vraie dans tous les caspossibles (i = j = p = q), (i = j = p ~ q),...
A titre
d’exemple :
La formule
(**)
résulte directement de la formule( * ) .
3. Définition du modèle considéré
Nous considérons le modèle
statistique
défini par les variablesindépendantes
avec moment d’ordre quatre fini
Xl, ... , Xn
telles queNous
supposons 82
> 0. Les variablesXi
ne sont donc pasdégénérées.
Noussupposons connus les
poids
Wi > 0 et lesei -2.
Leproblème
est d’estimermets2.
L’estimateur
classique
de m estIl est bien connu, et on le vérifie
facilement, qu’il
estoptimal
dans la classe des estimateursDans cette note,
optimal
est synomyme de non biaisé de variance minimum.Le
problème
restant est donc l’estimation de-s 2
.Nous supposerons d’abord que m est connu. Ce cas met bien en évidence le rôle
joué
par les coefficientsd’aplatissement
dansl’optimalité
des estimateurs.Nous notons
Dans les
optimisations,
nousappliquerons
la méthodeclassique
dumultiplica-
teur de
Lagrange.
4. Estimation
de s2 si
m est connuCherchons l’estimateur
optimal de s2 dans
la classe des estimateurs de la formeOn a
et l’absence de biais se traduit donc par la contrainte linéaire
Par la formule
( * )
du théorèmeprécédent,
on aD’où
qui
est à minimiser sous la contrainteL
C’l U1 = 1 sur les coefficients inconnus Cl.10 F. E. C. DE VYLDER, M. J. GOOVAERTS
Supposons
d’abord 2 +et :1
0(i
==1,... n).
Soit -2"B lemultiplicateur
deLagrange correspondant
à la contrainte. Alors on a à rendre minimumL’annulation de la dérivée
partielle
en c2 fournit lesystème
D’où,
carl par la contrainte.Considérons ensuite le cas où un e2, par
exemple
el,égale -2.
Alors on vérifieque l’estimateur
optimal de s2
estOn a alors :
Théorème 2
L’estimateur
optimal de s2
dans la classeest
si tous les ei
dépassent
strictement -2.Si un coefficient
d’aplatissement
estégal
à-2,
soit el parexemple,
alorsl’estimateur
optimal
estet il est de variance nulle.
Comparaison
avec l’estimateurclassique
L’estimateur
classique
des2,
dans le cas m connu, estDe
l’expression générale
de VarS2m
dérivée dans la démonstrationprécédente,
résulteque
On observe alors que :
a)
L’estimateurclassique 2m.cl égale
l’estimateuroptimal 2m
si et seulementsi e 1 = ... = en. En
particulier, l’estimateur classique
estoptimal
si les coefficientsd’aplatissement
sontnuls,
cequi
est enparticulier
réalisé si les variablesXi
sont normales.b)
Le rapportsi un coefficient
d’aplatissement
tend vers -2 ou vers l’infini.c)
Par définition del’optimalité
desm,
on aCette
inégalité équivaut
àqui
résulte aussi del’inégalité
de Schwarzavec
5. Estimation
de s2 si
m est non connuProblème
Nous cherchons l’estimateur
optimal de s2 de
la forme12 F. E. C. DE VYLDER, M. J. GOOVAERTS
et où m est l’estimateur
classique
de m.Autre
expression
deS2
Alors
D’où
La contrainte
De cette
expression
résulte queL’absence de biais se traduit donc par la contrainte linéaire en les inconnues C,,
Variance de
S2
Par la formule
(**)
du théorème1,
on aPuisque
on a
où
et
Estimateur
optimal analytique
des2
A
partir
de cetteexpression
de VarS2
on obtient facilement par la méthode dumultiplicateur
deLagrange,
lesystème
linéaire en les ci et en À fournissant le minimum deVar S2
sous la contrainte d’absence de biais. La solutionunique
de cesystème
se laisse alorsexpliciter
au moyen de la dérivation matricielle parexemple.
L’estimateur
optimal
ainsi obtenu est peu intéressant parce que tropcompliqué.
Estimateur
optimal numérique
des2
Si les w2 et les e2 sont connus
numériquement,
onpeut employer
unalgorithme numérique quelconque
pour minimiser VarS2
sous la contrainte d’absence de biais.En
particulier,
onpourrait
résoudrenumériquement
lesystème
linéaire mentionné ci-dessus,
mais il existe des routinesnumériques générales qui
évitent la considération de cesystème
et le calcul des dérivéespartielles
en les c2.En
pratique,
si n n’est pas tropgrand,
on peut donc déterminer l’estimateuroptimal de s2
danschaque
casparticulier
si les w2 et les ei sont connus.Estimateur
analytique approximativement optimal
A
partir
depoids
relatifs connus p2quelconques
on obtient l’estimateur sans biais suivantde s2 :
14 F. E. C. DE V.YLDER, M. J. GOOVAERTS
Tenant
compte
de ce que nous aappris
leparagraphe précédent
dans le cas m connu,nous
prendrons
pi =W’l / (2 + ei ) .
L’estimateur
approximativement optimal
des 2 mais
exactement sansbiais,
ainsi obtenu estCas des
coefficients d’aplatissement
nulsSi les ei sont tous
nuls,
l’estimateuroptimal analytique
se laisseexpliciter
facilement. En
effet,
par la méthode dumultiplicateur
deLagrange,
on a alors àminimiser
L’annulation de la dérivée
partielle
en c2 fournit lesystème
linéaireOn vérifie que ce
système
et la contrainte de non-biais sont satisfaits pourCette solution fournit le minimum absolu cherché. Nous avons donc démontré la théorème suivant.
Théorème 3
Si el = ... - en ==
0,
l’estimateuroptimal de 82
dans la classeest l’estimateur
classique
Cet estimateur est alors
identique
à l’estimateurapproximativement optimal s2
considéré ci-dessus.
Remarque
Dans le cas des coefficients
d’aplatissement nuls,
onpeut
montrer que2cl
estoptimal
dans laclasse, beaucoup plus large,
des estimateurs de la formeCe résultat semble difficile à obtenir par la méthode des
multiplicateurs
deLagrange,
car les
n4
inconnues aijpq ne sont pas seulement liées par la contrainte d’absence debiais,
mais par des contraintes desymétrie
telles que aijpq = ajiqp parexemple.
Le résultat
indiqué
est obtenu dans DeVylder
& Goovaerts(April 1992)
par des méthodes deprojection orthogonale
dansl’espace
de Hilbert des variables de carréintégrable
sur un espace deprobabilité
fixé.6.
Exemple d’application Coefficient d’aplatissement
d’une moyennearithmétique
Soit
où les variables
UZ
sonti.i.d.,
chacune avecespérance
m,variance s2
et coefficientd’aplatissement
e. AlorsEn
effet,
pour démontrer la dernièrerelation,
posons Y = X -EX, Vi = U, - EUi (i
=1,..., k).
Par la formule(**)
du théorème1,
on a alorsPuisque Ey2
=s2/k,
on a la formule annoncée.Définition
du modèle considéréSupposons
que les variablesX1, ... , Xn
soient telles que16 F. E. C. DE V,YLDER, M. J. GOOVAERTS
où les
Uij
sonti.i.d.,
chacune avecespérance
m, variances2 et
coefficientd’aplatis-
sement e.
Alors les variables
Xi,..., Xn
sontindépendantes
etNous supposons que les variables
Xi
sont observables etqu’elles
ont la structureindiquée,
mais que les réalisations descomposantes Uij
sontignorées.
Estimation de 82
Les considérations
précédentes d’appliquent
maintenant avec w. =ki,
ei -e/ki.
On pourraestimer 82
paroù c est la constante convenable assurant l’absence de biais.
Si on
sait,
parexemple,
que e estgrand comparé
auxki,
sans connaître la valeurexacte de e, on pourra
adopter
l’estimateuroù ci est la constante convenable assurant l’absence de biais. Cet estimateur sera encore
optimal,
en bonneapproximation, puisque 2ki
estnégligeable
devant e parhypothèse.
Les
hypothèses
faitesjustifient
doncl’emploi
despoids
relatifsk;,
alors que l’estimateurclassique emploierait
lespoids
relatifski.
7.
Application
à la théorie de la crédibilité Problèmepréliminaire
Notre
problème préliminaire
est la détermination du coefficientd’aplatissement e (1B1),
dans leshypothèses qui suivent,
de la variableNous supposons les variables
Xl, .... Xn indépendantes,
avecPar des calculs directs basés sur la formule
(**)
du théorème1,
on obtientSupposons
deplus
quechaque
variableXi
soit moyennearithmétique
de wi variablesindépendantes,
dites composantes élémentaires deXi,
chacune avecespérance
m, variancea2
et coefficientd’aplatissement
e.Alors,
par les formules du début duparagraphe
Alors Var M
Le modèle de crédibilité de Bühlmann-Straub
Ce modèle est décrit en détail dans chacun des articles
indiqués
dans lesréférences,
le troisièmeexcepté.
Nous considérons le
portefeuille
avec variables observablesXji
etpoids
naturels wji
correspondants ( j - 1,..., k;
i =1,..., n).
La variableXji
estl’observation du
contrat j
et de l’année i.La moyenne observée du
contrat j
estLe
poids
de crédibilité ducontrat j
estoù a est le
paramètre d’hétérogénéité
duportefeuille
ets2 le paramètre
de variabilité des observations dans le temps.L’estimation de
s2 ne
posegénéralement
pas deproblème pratique.
Elle n’estpas considérée ci-dessous.
L’estimateur
de,Bichsel-Straub
Les variables
j ( j
=1,
... ,k)
sontindépendantes,
telles queLa situation semble
classique.
Lepseudo-estimateur
de Bichsel-Straub pour aest celui défini par
18 F. E. C. DE VYLDER, M. J. GOOVAERTS
En
fait,
leparamètre
à estimer afigure
dans les zJ etBS n’est
pas un estimateurau sens propre du terme. Il est pourtant
employé
avec succès par lespraticiens,
dela manière itérative suivante. On fixe une valeur initiale ao à
partir
delaquelle
oncalcule,
parâBs,
unpremier
itéré al. On recommence avec ai pour trouver a2,...On démontre que la suite ao, a1, a2,... converge vers une valeur a~ ne
dépendant
pas de la valeur initiale ao > 0. L’estimation
adoptée
est alors aux. Enpratique,
laconvergence est très
rapide.
Nous ne discuterons pas ici la
méthodologie
despseudo-estimateurs.
Il se faitque
âBs
apratiquement poussé
dans l’oubli les autresestimateurs,
de typeclassique,
de a.
Le
problème qui
nouspréoccupe
est queâBS
ne tient nullement compte des coefficientsd’aplatissement
desJ.
Dans certainsportefeuilles
à sinistres rares, les coefficientsd’aplatissement
sont loin d’êtrenégligeables
etl’optimalité
deâBS
estfort douteuse dans ces cas.
Estimateur tenant compte des
coefficients d’aplatissement
Considérons un contrat
fixé,
lej-ième,
duportefeuille.
La loi du vecteur(XJ1....,XJn)
de ses variables observablesdépend
d’unparamètre
inconnu03B8J (le plus
souventmultidimensionnel),
traité en variable aléatoire0398J,
dite la variable destructure du contrat. Dans une multitude de
portefeuilles pratiques,
on peut admettre que leshypothèses
faites sur le vecteur(X1,...,Xn)
duproblème préliminaire,
restent
valables,
pour8.1 fixé,
pour le vecteur conditionnel(XJ1,
...1 xi Il /0398J ).
On aboutit ainsi à un coefficient
d’aplatissement, toujours
pour8.1 fixé,
mais
qui
est inutilisable pour la dérivation dee(J).
En
effet,
onignore
leplus
souvent la loi de8j’
Deplus,
les observations sontgénéralement
trop rarespour estimer
lese(0398J). Par exemple,
il estutopique
de vouloirestimer,
pour un conducteurautomobile,
àpartir
d’observations concernant seulementce
conducteur,
leparamètre 03BB
de son processus d’arrivées desinistres,
admettant quece soit un processus de Poisson
homogène.
L’hypothèse simplificatrice
que nous ferons pour sortir de cetteimpasse
est quepour un certain
paramètre
einterprété
comme étant un coefficientd’aplatissement
moyen des composantes élémentaires des variables observables. Travailler avec cet e, même
interprété
et estimégrossièrement,
vaudra sans doute mieuxqu’adopter
lavaleur e =
0, implicitement
admise par Bichsel et Straub dans la construction de leur estimateurBS.
Par
exemple,
dans unportefeuille
en assuranceautomobile,
le À moyen s’estime trivialement et il suffit alors deprendre
pour e l’inverse de ce À moyen. On trouveainsi pour e des valeurs
qui
peuvent être de l’ordre degrandeur
de10, qui
sont loind’être
négligeables
dans certains cas.L’exemple numérique qui
suit le prouvera.En
définitive,
les considérations duparagraphe
5 nous conduisent aupseudo-
estimateur
où ej est
approximé
pare/wj.
et c est la constante de non-biais.Explicitement,
on obtientBonus-malus en assurance automobile dans le cas de contrats couvrant
plusieurs
véhicules
Nous allons
appliquer
cequi précède
à unportefeuille
en assurance automobilecomposé
de 996 contrats couvrant chacun de un à quatre véhicules. Les véhicules couverts par un même contrat sont indiscernables parhypothèse.
Pourchaque
contratnous
disposons
descouples
où wji
(i
=1,2,3)
est le nombre de véhicules assurés durant l’année i etNji
lenombre de sinistres survenus durant cette année. Nous avons travaillé sur
statistiques
réelles.
Le modèle de Bühlmann-Straub ne
s’applique
pas aux nombres de sinistresNji,
maisbien,
auxfréquences Xji
=Nji/wji.
En vue d’élaborer une tarification
bonus-malus,
basée seulement sur le nombre de sinistres survenus(et
non sur leurscoûts),
il est nécessaire d’estimer lafréquence
annuelle
future,
soitYj,
danschaque contrat j.
Elle résulte de la formule de Bühlmann- StraubCi-dessous nous comparons
quelques
estimations obtenues d’une part àpartir
dea,
d’autre part à
partir
deâBs.
Nous
reproduisons
les résultats relatifs à quatre contratsparticuliers,
numérotésde 1 à 4. Il s’avère que la considération des coefficients
d’aplatissement
est loin d’êtrenégligeable.
20 F. E. C. DE VYLDER, M. J. GOOVAERTS
Références