• Aucun résultat trouvé

Estimateurs robustes du param`etre de m´emoire d

2.2 Analyse par ondelette

2.3.5 Estimateurs robustes du param`etre de m´emoire d

Malgr´e toutes ces propri´et´es asymptotiques int´eressantes, l’estimateur bdLRWn pr´esente quelques limites. Stoev et al. [2006] ont montr´e que cet estimateur ´etait sensible aux

valeurs aberrantes. En effet, il est bien connu que la variance empirique est tr`es sensible `a la pr´esence des valeurs aberrantes dans les observations. Une faible proportion de valeurs atypiques, dans certains cas mˆeme une seule valeur peut affecter l’estimateur classique de la variance, le rendant ainsi pratiquement inutile ; voir par exemple Deutsch et al. [1990] Chan [1992], Chan [1995] [Maronna et al., 2006, Chapter 8] et les r´ef´erences qui s’y trouvent. Comme les donn´ees aberrantes sont assez courantes en pratique, la d´efinition d’un estimateur de la variance qui est insensible aux observations aberrantes est d’une grande importance pratique (c’est une demande r´ecurrente des chercheurs s’int´eressant aux donn´ees hydrologiques ou aux trafics en particulier). Stoev et al. [2005] et Stoev et al. [2006] proposent de remplacer `a chaque ´echelle de d´ecomposition les moments em- piriques d’ordre 2 (les scalogrammes) par la m´ediane empirique des carr´es des coefficients d’ondelettes. Les auteurs de ces articles ont montr´e, `a l’aide de nombreuses simulations que cette proc´edure ´etait beaucoup moins sensible `a la pr´esence de donn´ees aberrantes que l’estimateur bas´e sur les scalogrammes classiques. Ces auteurs n’ont toutefois pas d´evelopp´es de r´esultats th´eoriques pour ´etablir la consistance et la normalit´e asymptotique de l’estimateur ainsi construit. Dans le contexte similaire de l’estimation du coefficient d’autosimilarit´e d’un processus gaussien, Coeurjolly [2008b] a propos´e des m´ethodes tr`es similaires pour obtenir des estimateurs semi-param´etriques du param`etre de Hurst `a l’aide des m´ethodes de filtrages discrets pour une classe de processus Gaussien centr´e `a incr´ement stationnaire et localement auto-similaire. Voir Coeurjolly [2008b] et les r´ef´erences qui s’y trouvent.

Dans cette contribution, nous ´etudions les propri´et´es asymptotiques de l’estimateur propos´e par Stoev et al. [2006], pr´esentons et ´etudions les propri´et´es asymptotiques d’un nouvel estimateur robuste du param`etre de m´emoire bas´e sur le carr´e de l’estimateur du param`etre d’´echelle propos´e par Rousseeuw and Croux [1993] et dont les propri´et´es asymptotiques sont ´etudi´ees dans L´evy-Leduc et al. [2009].

Estimateur robuste de Croux et Rousseeuw.

Soit X une variable al´eatoire de fonctions de r´epartitions FX. Un estimateur robuste du

param`etre d’´echelle est l’estimateur propos´e par Rousseeuw and Croux [1993]. Il est bas´e sur la corr´elation int´egrale de Grassberger-Procaccia d´efinie par

r7→ U(r, FX) =

Z Z 1

{|x−x′|≤r}dFX(x)dFX(x′) , (2.102)

qui mesure la probabilit´e que deux copies ind´ependantes X et X′de fonction de r´epartition

FX tombent `a une distance plus petite que r. L’estimateur robuste introduit par [Rousseeuw

´etant proportionnelle au premier quartile de r 7→ U(r, FX), `a savoir,

σCR(FX)def= c(FX) inf{r ≥ 0, U(r, FX)≥ 1/4} , (2.103)

o`u c(FX) est une constante d´ependant uniquement de la forme de FX. Ce param`etre

d’´echelle peut ˆetre vu comme un analogue `a l’estimateur de la diff´erence moyenne de Gini n−1(n− 1)−1P

1≤i6=j≤n|Xi− Xj|, o`u la moyenne est remplac´ee par un quantile.

La constant c(FX) en (2.103) est l`a pour assurer la consistance. Dans la suite, la

fonction de r´epartition FX est suppos´ee appartenir `a la famille Gaussienne

{Φµ,σ(·) = Φ((· − µ)/σ), µ ∈ R, σ ∈ R∗+} , (2.104)

o`u Φ est la fonction de r´epartion d’une variable al´eatoire Gaussienne standard.

Soit X un processus Gaussien stationnaire. Etant donn´ees les observations (X1, . . . , Xn),

la fonction de r´epartition des observations peut ˆetre estimer en utilisant la fonction de r´epartition empirique. r 7→ Fn(r) = n−1Pni=11

{Xi≤r}. En rempla¸cant FX par Fn dans

(2.103), on obtient l’estimateur robuste du param`etre d’´echelle b

σn,CR[Φ] = c(Φ){|Xi− Xj|; 1 ≤ i, j ≤ n}(kn), (2.105)

o`u kn=⌊n2/4⌋. Ainsi `a une constante multiplicative c(Φ) pr`es, bσn,CR[Φ] est la statistique

du kn-i`eme ordre de la distance |Xi− Xj| entre toutes les paires d’observations. Comme

mentionn´e dans Rousseeuw and Croux [1993], bσn,CR[Φ] a plusieurs propri´et´es int´eressantes:

il a une formule simple et explicite dont l’interpr´etation est intuitive; l’estimateur n’est pas affect´e mˆeme si (50%) des observations sont abberrantes; De plus comme prouv´ee dans L´evy-Leduc et al. [2009] sa fonction d’influence est born´ee. Pour une d´efinition de ces quantit´es, qui sont classiques dans la statistique robuste, voir par exemple (Huber [1981]). L’estimateur Rousseeuw et Croux est aussi int´eressant car il peut ˆetre impl´ement´e assez efficacement. Sa complexit´e algorithmique est de O(n log n).

L’´ecart absolu moyen.

Bien que de nombreux estimateurs du param`etre d’´echelle existent, la m´ediane empirique reste toujours la plus couramment utilis´ee. Si (X1, . . . , Xn) sont des observations d’une

variable al´eatoire de fonction de r´epartition FX, alors on notera sa m´ediane empirique

par mediXi. Soit X un processus Gaussien stationnaire. Etant donn´ees les observations

(X1, . . . , Xn), la fonction de r´epartition des observations peut ˆetre estimer en utilisant

la fonction de r´epartition empirique. Un estimateur robuste du param`etre d’´echelle est l’´ecart absolu moyen. donn´e par

b σn,MAD(Φ) = m(Φ)  med 1≤i≤n Xi− med 1≤i′≤nXi′  . (2.106)

Comme dans le cas de l’estimateur de Rousseeuw et Croux la constante m(Φ) assure la consistance. Nous montrerons dans le chapitre 5 que cette constante est ´egale `a 1/Φ−1(3/4) = 1.4826. Cet estimateur poss`ede ´egalement des propri´et´es int´eressantes qui sont essentiellement les mˆemes que celles de l’estimateur de Rousseeuw et Croux.

R´esultats asymptotiques

Soit X un processus M(d) Gaussien. Alors d’apr`es (2.43), les coefficients d’ondelettes {Wj,k} sont des processus Gaussien centr´es. Le carr´e de l’´ecart absolu moyen d´efini en

(2.106) est donn´e par b σ2MAD,j=  m(Φ) med 0≤i≤nj−1|Wj,i| 2 ,

o`u les observations (X1, . . . , Xn) sont remplac´ees par (Wj,0, . . . , Wj,nj−1). De mˆeme, le

carr´e de l’estimateur de Rousseeuw et Croux d´efini en (2.105) est donn´e par b

σCR,j2 =c(Φ){|Wj,i− Wj,k|; 0 ≤ i, k ≤ nj− 1}(knj)

2

,

o`u c(Φ) = 2.21914 voir(L´evy-Leduc et al. [2009]). En rempla¸cant dans (2.75) les scalo- grammes par bσ2CR,j et bσMAD,j2 , on obtient deux estimateurs robustes du param`etre de m´emoire b dLRW∗,n (J0, w)def= JX0+ℓ j=J0 wj−J0log bσ∗,j2  , (2.107) o`u∗ d´esigne CR et MAD;

Th´eor`eme 2.3.3. Soit X un processus M (d) Gaussien de densit´e spectrale g´en´eralis´ee f d´efinie en (2.11) tel que f∈ H(β, L, ε) pour tout L > 0, 0 < β ≤ 2 et ε ∈ (0, π].

Supposons que les hypoth`eses (W-1)-(W-4) sont satisfaites avec (1 + β)/2− α < d ≤ M.

Alors, si, quand n→ ∞, J0(n) est tel que

n2−(1+2β)J0(n)→ 0 , (2.108)

et (J1(n)) = (J0(n) + ℓ) une s´equence satisfaisant (S-1), alors on a le th´eor`eme de la

limite centrale suivant:

p n2−J0(n)  b d∗,n(J0, w)− d  d −→ N 0, wTV(d)w , (2.109)

o`u V(d) est la matrice (1 + ℓ)× (1 + ℓ) d´efinie par

V∗,i,j(d) =X p≥2 4c2 p(IF∗) p! K(d)p2pd|i−j|+i∧j X τ ∈Z 2|i−j|−1 X r=0  Z π −π

D(r)∞,|i−j|(λ; d)eiλτdλp, 0≤ i, j ≤ ℓ .

(2.110)

Dans (2.110), K(d) est d´efini en (2.90), D∞,|i−j|(·; d) est d´efinie en (2.84), cp(IF∗) =

E[IF(X,∗, Φ)Hp(X)], o`u Hp est le p-i`eme polynˆome d’Hermite et IF(·, ∗, Φ) sont les fonc-

La preuve du Th´eor`eme 2.3.3 est donn´ee dans le Chapitre 5, Section 5.6. Les per- formances de nos estimateurs ont ´et´e test´ees via des simulations Monte Carlo, sur les donn´ees hydrologiques du Nil et sur les donn´ees de trafic Internet. Toutes ces applications sugg`erent fortement l’utilisation d’estimateurs robustes pour estimer d. Principalement l’estimateur bdCR,n qui a une efficacit´e asymptotique relative qui oscille entre 0.63 et 0.79

pour une plage de valeurs de d allant au del`a de l’intervalle de stationnarit´e.

Documents relatifs