• Aucun résultat trouvé

Estimation du paramètre de second ordre par la méthode des moments pondérés

N/A
N/A
Protected

Academic year: 2021

Partager "Estimation du paramètre de second ordre par la méthode des moments pondérés"

Copied!
6
0
0

Texte intégral

(1)

HAL Id: inria-00386771

https://hal.inria.fr/inria-00386771

Submitted on 22 May 2009

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires

Estimation du paramètre de second ordre par la méthode des moments pondérés

Julien Worms, Rym Worms

To cite this version:

Julien Worms, Rym Worms. Estimation du paramètre de second ordre par la méthode des moments

pondérés. 41èmes Journées de Statistique, SFdS, Bordeaux, 2009, Bordeaux, France, France. �inria-

00386771�

(2)

Estimation du param` etre de second ordre par la m´ ethode des moments pond´ er´ es

Julien Worms (1) & Rym Worms (2)

(1) Laboratoire de Math´ ematiques de Versailles, UMR 8100,

Universit´ e de Versailles-St-Quentin, 45 av. des Etats-Unis, 78035 Versailles cedex (2) Laboratoire d’Analyse et de Math´ ematiques Appliqu´ ees, UMR 8050, Universit´ e Paris XII Val-de-Marne, 61 av. du G l de Gaulle, 94010 Cr´ eteil cedex

R´ esum´ e: La m´ ethode P.O.T. (Peaks Over Threshold) consiste ` a utiliser la loi de Pareto G´ en´ eralis´ ee (GPD) pour approximer la loi des exc` es au del` a d’un seuil ´ elev´ e. Dans ce travail, la m´ ethode des moments pond´ er´ es (PWM) est utilis´ ee pour estimer les param` etres de second ordre qui permettent d’affiner cette approximation : en particulier cela donne lieu ` a l’introduction d’un nouvel estimateur du param` etre de second ordre ρ, qui sera compar´ e ` a d’autres estimateurs r´ ecents par le biais de simulations lors de l’expos´ e. Des r´ esultats de normalit´ e asymptotique sont ´ etablis pour ces estimateurs, et confirment que l’estimation de ρ doit reposer sur un plus grand nombre d’exc` es que lorsque l’on d´ esire estimer l’indice γ des valeurs extrˆ emes.

Abstract: The P.O.T. method (Peaks Over Threshold) consists in using the generalized Pareto distribution (GPD) as an approximation for the distribution of excesses over a high threshold. In this work, the method of probability-weighted moments (PWM) is called upon in order to estimate the second order parameters which yield a refinement of this approximation : in particular, this leads us to introduce a new estimator for the second order parameter ρ, which will be compared to other recent estimators through some simulations during the course of the talk. Asymptotic normality is proved for the estimators and these results confirm that, in order to estimate ρ, much more excesses must be used than in the case of the estimation of the tail index γ.

Mots-cl´ es: Valeurs extrˆ emes, queue de distribution, loi de Pareto g´ en´ eralis´ ee, param` etre

de second ordre, moments pond´ er´ es.

(3)

1. Introduction

On se place dans le cadre classique de la th´ eorie des valeurs extrˆ emes, en consid´ erant une suite de r´ ealisations ind´ ependantes (X i ) i≥1 d’une mˆ eme variable al´ eatoire r´ eelle X de loi de fonction de r´ epartition F appartenant au domaine d’attraction d’une des lois des valeurs extrˆ emes H γ , o` u γ ∈ R est commun´ ement appel´ e indice des valeurs extrˆ emes associ´ ee ` a F . L’´ etude de techniques d’estimation de cet important param` etre γ a fait et fait encore l’objet de nombreux travaux : l’affinage de ces techniques repose souvent sur une bonne connaissance d’un autre param` etre d’int´ erˆ et, ρ, param` etre dit de second ordre, d´ efini plus bas et dont l’estimation est un des objectifs du pr´ esent travail.

Les r´ esultats pr´ esent´ es ici s’inscrivent dans le cadre classique des m´ ethodes bas´ ees sur l’information apport´ ee par les observations exc´ edant un seuil grand donn´ e. Si s + (F ) = sup{x ; F (x) < 1} d´ esigne le point terminal (` a droite) de F , on consid` ere la fonction de r´ epartition F u de la loi des exc` es au del` a d’un seuil u donn´ e, d´ efinie pour x ≥ 0 par

F u (x) = P ( X ≤ u + x | X > u ).

Comme cela a ´ et´ e ´ etabli dans Balkema & De Haan (1974), l’appartenance de F au do- maine d’attraction de la loi des valeurs extrˆ emes H γ ´ equivaut ` a l’existence d’une fonction d’´ echelle σ(·) strictement positive telle que la loi des exc` es au del` a d’un seuil u grand puisse ˆ etre approxim´ ee par une loi de Pareto g´ en´ eralis´ ee (GPD), autrement dit telle que

u%s lim

+

(F ) sup

0<x<s

+

(F )−u

F u (x) − G γ,σ(u) (x) = 0.

Cette caract´ erisation est ` a la base de techniques d’estimation de γ (m´ ethodes de type Peaks Over Threshold, ou POT; voir Pickands (1975)) et surtout d’approximation de la queue de F : pour une suite de seuils (u n ) telle que u n → s + (F ) par valeurs inf´ erieures, en se basant sur les observations X 1,N

n

≤ . . . ≤ X N

n

,N

n

qui, parmi X 1 , . . . , X n , d´ epassent le seuil u n (on notera plus loin k n la r´ ealisation du nombre al´ eatoire d’exc` es N n ), il est possible d’estimer les param` etres γ et σ n = σ(u n ) par la m´ ethode des moments pond´ er´ es (abr´ eg´ ee PWM dans la suite). Hosking & Wallis (1987) l’on fait sous l’hypoth` ese que F est exactement une loi GPD, arguant du fait que la m´ ethode du maximum de vraisemblance, applicable dans ce cadre et la plus efficace asymptotiquement, pr´ esente en pratique de s´ erieux d´ efauts.

Dans Diebolt, Guillou, Worms (2003), les r´ esultats de normalit´ e asymptotique ´ etablis dans Hosking & Wallis (1975) ont ´ et´ e ´ etendus au cas consid´ er´ e ici, c’est-` a-dire pour F seulement suppos´ ee appartenir au domaine d’attraction d’une GPD : ils ont ´ egalement ´ et´ e compl´ et´ es par un r´ esultat fonctionnel de convergence en loi de l’estimateur correspondant G ˆ γ

n

σ

n

de F u

n

. Plus pr´ ecis´ ement, ces r´ esultats ont ´ et´ e prouv´ es en supposant satisfaites les conditions classiques suivantes :

(C0) F est deux fois d´ erivable et inversible d’inverse F −1 (C1) lim

t→+∞ A(t) = 0

(C2) A est de signe constant ` a l’infini et il existe ρ ≤ 0 tel que |A| ∈ RV ρ

(4)

o` u A est d´ efinie par A(t) = V 00 (ln t)/V 0 (ln t) − γ, avec V (t) = ¯ F −1 (e −t ). Les conditions (C1) et (C2) sont commun´ ement appel´ ees conditions de premier et de second ordre, la premi` ere suffisant ` a assurer la propri´ et´ e d’approximation de la loi des exc` es par une GPD et la seconde permettant de pr´ eciser la vitesse avec laquelle cette approximation a lieu, par le biais du param` etre ρ.

Le point de d´ epart du pr´ esent travail ´ etait d’essayer d’am´ eliorer l’estimation de la queue de distribution dans ce cadre, en se basant sur le r´ esultat suivant : sous les hy- poth` eses d´ ecrites ci-dessus, il a ´ et´ e d´ emontr´ e dans Raoult & Worms (2003) que, quand u n → s + (F ), on a pour tout y,

F u

n

n y) − G γ (y) = −a n D γ, ρ (y) + o(a n )

o` u G γ = G γ,1 , σ n = V 0 (V −1 (u n )), a n = A(e V

−1

(u

n

) ) (donc a n → 0 en vertu de (C1)) et D γ,ρ est une fonction d’expression explicite que nous ne d´ etaillerons pas ici. Ceci sugg` ere donc que, pour tout y, la probabilit´ e F u

n

(x) est mieux approxim´ ee par G γ,σ

n

(x) − a n D γ,ρ (x/σ n ) que par G γ,σ

n

(x) seul.

Cette approximation de F u

n

nous a permis d’estimer les param` etres de second ordre ρ et a n , en utilisant la m´ ethode des moments pond´ er´ es. L’estimation de ρ n’est pas un sujet nouveau : depuis une quinzaine d’ann´ ees plusieurs estimateurs de ρ ont ´ et´ e propos´ es, et le nouvel estimateur introduit ici, et pour lequel on d´ emontre la normalit´ e asymptotique, apparait comme comp´ etitif en particulier dans des cadres o` u ρ est proche de 0. Plusieurs simulations seront pr´ esent´ ees pendant l’expos´ e pour attester de ce fait.

2. M´ ethode PWM pour l’estimation des param` etres de second ordre

La m´ ethode PWM est bas´ ee sur l’utilisation des moments pond´ er´ es de la loi de fonction de r´ epartition ˜ G n (y) = G γ,σ

n

(y)− a n D γ,ρ (y/σ n ) plutˆ ot que ceux de la loi GPD seule G γ,σ

n

, comme cela ´ etait le cas dans Diebolt, Guillou, Worms (2003). On consid` ere les trois premiers moments (note: leur d´ ependance en n ne sera pas incluse dans les notations afin de ne pas alourdir celles-ci) d´ efinis par

˜

v j = E (X(1 − G ˜ n ) j (X)), pour j = 0, 1, 2 et lorsque γ < 1, on a ˜ v 0 = v 0 et ˜ v j = v j + o(a n ) (pour j = 1, 2) o` u

v j := σ n

(j + 1)(j + 1 − γ) + a n σ n u j

et u j := (j + 1)(j + 1 − γ)(j + 1 − γ − ρ).

Ce sont ces approximations des 3 premiers moments pond´ er´ es de B qui seront utilis´ ees

ici, et dans un premier temps le param` etre γ est consid´ er´ e connu : en inversant le syst` eme

liant v 0 , v 1 , v 2 aux 3 param` etres restants ρ, a n , σ n et en rempla¸cant ces moments pond´ er´ es

par des estimateurs ˆ v 0 , v ˆ 1 , ˆ v 2 , nous obtenons des estimateurs not´ es ˆ ρ γ , a ˆ n,γ , σ ˆ n,γ . Les es-

timateurs ˆ v j choisis sont les moments pond´ er´ es de la loi empirique de l’´ echantillon des

(5)

exc` es Y 1,N

n

, . . . , Y N

n

,N

n

au del` a du seuil u n (i.e. Y i,N

n

:= X i,N

n

− u n ) : conditionnellement

`

a N n = k n , cela donne, pour j = 0, 1, 2, ˆ

v j := 1 j + 1

k

n

X

i=1

1 − i − 1 k n

k+1

1 − i k n

j+1 ! Y i,k

n

.

3. R´ esultats de normalit´ e asymptotique

Pour obtenir les r´ esultats de normalit´ e asymptotique des estimateurs des moments pond´ er´ es (et donc a fortiori des estimateurs des param` etres), nous avons recours ` a la condition suivante, dite condition de troisi` eme ordre, introduite dans Fraga Alves, De Haan & Lin (2003) :

(C3) il existe une fonction B et une constante β 6= 0 telles que B soit de signe constant ` a l’infini, |B| ∈ RV β , et pour tout x ∈ R

t→+∞ lim 1 B(e t )

V (t+x)−V (t) V

0

(t) − R x

0 e γs ds

A(e t ) − I γ,ρ (x)

!

= Z x

0

e γs Z s

0

e ρz Z z

0

e βy dydzds

Th´ eor` eme 1

Sous les conditions (C0)-(C3), si −1 < γ < 1/2 et si ∃λ 1 , λ 2 ∈ R telles que lim n→∞ p

n (1 − F (u n )) a n b n = λ 1 (1) lim n→∞

p n (1 − F (u n )) a 2 n = λ 2 (2) lim n→∞

p n (1 − F (u n )) a n = ±∞ (3) alors, pour presque toute suite k n → +∞, conditionnellement ` a N n = k n , le vecteur de coordonn´ ees √

k n (ˆ v jn − v jn ) (j = 0, 1, 2) converge en loi vers une loi gaussienne d’esp´ erance λ 1 C et de matrice de covariance Γ (C et Γ sont d´ efinies explicitement, C

´ etant fonction de γ, ρ, β et Γ de γ uniquement).

Th´ eor` eme 2

Sous les conditions (C0)-(C3) et (1)-(3), si l’on suppose −1 < γ < 1/2 connu, alors pour presque toute suite k n → +∞, conditionnellement ` a N n = k n , les suites

p k n a n ( ˆ ρ γ − ρ), p

k n a n (ˆ a n,γ /a n − 1), p

k n (ˆ σ n,γn − 1) convergent en loi vers des lois gaussiennes d´ efinies explicitement.

Le th´ eor` eme pr´ ec´ edent met en ´ evidence les normalisations n´ ecessaires ` a l’obtention

de la normalit´ e asymptotique des estimateurs de ρ, a n , et σ n , mais dans le cas o` u γ

(6)

est suppos´ e connu. On constate en particulier que le nombre d’exc` es k n n´ ecessaire pour aboutir ` a la normalit´ e asymptotique de ˆ ρ γ doit ˆ etre bien plus grand que le nombre d’exc` es habituellement pris pour l’estimation de γ; ce constat a d´ ej` a ´ et´ e fait dans d’autres cadres et par d’autres auteurs, et se trouve v´ erifi´ e ici ´ egalement. Le r´ esultat ci-dessous montre que ces normalisations ne peuvent toutefois ˆ etre conserv´ ees lorsque l’on remplace γ par un estimateur de celui-ci.

On consid` ere que (˜ u n ) d´ esigne une suite de seuils (convergeant vers s + (F )) et que N ˜ n est ´ egal au nombre d’exc` es parmi X 1 , . . . , X n au del` a du seuil ˜ u n . On pose ˜ a n = A(e V

−1

u

n

) ).

Th´ eor` eme 3

Supposons les conditions (C0)-(C3) et (1)-(3) satisfaites et −1 < γ < 1/2.

Soit ˆ γ = ˆ γ n un estimateur de γ qui soit fonction des N ˜ n exc` es au del` a de u ˜ n , et (k n ) et (˜ k n ) des suites tendant vers +∞ telles que, pour une certaine constante λ, ˜

k ˜ n = o(k n ) et ˜ k n 1/2 ˜ a n → λ ˜ quand n → ∞. (4) Si conditionnellement ` a N ˜ n = ˜ k n on a

k ˜ 1/2 n (ˆ γ − γ) −→ N d (˜ λc, d) quand n → ∞

alors pour presque toutes suites (k n ) et (˜ k n ) satisfaisant ` a (4), on a, conditionnellement

`

a N n = k n et N ˜ n = ˜ k n , convergence en loi vers des gaussiennes (d´ efinies explicitement) des suites

q ˜ k n a n ( ˆ ρ ˆ γ − ρ),

q k ˜ n a n (ˆ a n,ˆ γ /a n − 1) et

q ˜ k n (ˆ σ n,ˆ γn − 1).

Bibliographie

[1] A. Balkema & L. de Haan (1974), Residual life time at a great age, Annals of Proba- bility, vol 2, 792-801.

[2] J. Diebolt, A. Guillou, R. Worms (2003), Asymptotic behaviour of the probability weighted moments and penultimate approximation, ESAIM Probability & Statistics, vol 7, 219–238.

[3] M.I. Fraga Alves, M.I. Gomes, L. de Haan (2003), A new class of semi-parametric estimators of the second order parameter, Portugaliae Mathematica, vol 60, no. 2, 193- 213.

[4] M. I. Fraga Alves, L. de Haan & T. Lin (2003), Estimation of the parameter controlling the speed of convergence in extreme value theory, Mathematical Methods of Statistics, vol.

12, no. 2, 155-176.

[5] J. Pickands III (1975), Statistical inference using extreme order statistics, Annals of Statistics, vol 3, 119-131.

[6] J.P. Raoult, R. Worms (2003), Rate of convergence for the generalized Pareto approx-

imation of the excesses, Advances in Applied Probability, vol 35, no. 4, 1007–1027.

Références

Documents relatifs

Si d'un point M on mène cinq normales quelconques à une surface du second ordre, ayant pour centre O, les cinq pieds de ces normales peuvent être regardés comme les sommets de

3° Si l'ellipsoïde est de révolution autour de son petit axe, tout point de cet axe est le centre d'une sphère en- veloppant la surface, et telle que la puissance, par rap- port à

On voit de même que pour avoir l'équation du lieu, il faudra appliquer la relation (|3) aux coefficients de l'équa- tion (c').. — Trouver le lieu des sommets des trièdres dont

Dans les ouvrages de Géométrie analytique les plus ré- cents ^ il n'est pas fait mention du procédé de calcul que Lagrange emploie {Mécanique analytique, 1788, t. Il, section 9)

un point fixe P trois droites rec- tangulaires qui percent une surface du second ordre en trois points A, B, C, le lieu du pôle M du plan ABC, par rapport à cette surface, est

Si d'un point P rVune surface du second ordre S, on mène trois droites PA, PB, PC, etc., le plan ABC coupe en un point fixe I la droite menée de P qui a ses deux conjuguées tangentes

Pour ces valeurs infinies de m, la fonction v se reduit a AJB; ainsi deux des quatre cônes qui envelop- pent la courbe d'intersection de deux surfaces du second degré dans le

Elle engendrera ainsi une surface dont Téquation résultera de l'élimination de h entre les deux équations (3) et s'obtiendra évidemment en substituant z en place de h dans la