• Aucun résultat trouvé

Estimateurs robustes du param`etre de m´emoire d

2.2 Analyse par ondelette

2.3.5 Estimateurs robustes du param`etre de m´emoire d

I0(d) + 2 κ

X u=1

Iu(d) 2(2d1)u

u

X

i=0

2i

2−2(i−η)(i+u−η) )

, (2.99) o`u K(d) est d´efini en (2.90),

η def= X j=0

j 2j

2−2 et κ def= X j=0

(j−η)2 2j

2−2 , (2.100) et

Iu(d)def= Z π

π|D,u(λ;d)|2 dλ= (2π)1X

τ∈Z

Cov2

W0,0(d), W(d)u,τ

, (2.101)

Les th´eor`emes 2.3.1 et 2.3.2 ci-dessus ont ´et´e ´etendus aux processus lin´eaires par Roueff and Taqqu [2009].

2.3.5 Estimateurs robustes du param`etre de m´emoire d

Malgr´e toutes ces propri´et´es asymptotiques int´eressantes, l’estimateur dbLRWn pr´esente quelques limites. Stoev et al. [2006] ont montr´e que cet estimateur ´etait sensible aux

valeurs aberrantes. En effet, il est bien connu que la variance empirique est tr`es sensible `a la pr´esence des valeurs aberrantes dans les observations. Une faible proportion de valeurs atypiques, dans certains cas mˆeme une seule valeur peut affecter l’estimateur classique de la variance, le rendant ainsi pratiquement inutile ; voir par exemple Deutsch et al.

[1990] Chan [1992], Chan [1995] [Maronna et al., 2006, Chapter 8] et les r´ef´erences qui s’y trouvent. Comme les donn´ees aberrantes sont assez courantes en pratique, la d´efinition d’un estimateur de la variance qui est insensible aux observations aberrantes est d’une grande importance pratique (c’est une demande r´ecurrente des chercheurs s’int´eressant aux donn´ees hydrologiques ou aux trafics en particulier). Stoev et al. [2005] et Stoev et al. [2006] proposent de remplacer `a chaque ´echelle de d´ecomposition les moments em-piriques d’ordre 2 (les scalogrammes) par la m´ediane empirique des carr´es des coefficients d’ondelettes. Les auteurs de ces articles ont montr´e, `a l’aide de nombreuses simulations que cette proc´edure ´etait beaucoup moins sensible `a la pr´esence de donn´ees aberrantes que l’estimateur bas´e sur les scalogrammes classiques. Ces auteurs n’ont toutefois pas d´evelopp´es de r´esultats th´eoriques pour ´etablir la consistance et la normalit´e asymptotique de l’estimateur ainsi construit. Dans le contexte similaire de l’estimation du coefficient d’autosimilarit´e d’un processus gaussien, Coeurjolly [2008b] a propos´e des m´ethodes tr`es similaires pour obtenir des estimateurs semi-param´etriques du param`etre de Hurst `a l’aide des m´ethodes de filtrages discrets pour une classe de processus Gaussien centr´e `a incr´ement stationnaire et localement auto-similaire. Voir Coeurjolly [2008b] et les r´ef´erences qui s’y trouvent.

Dans cette contribution, nous ´etudions les propri´et´es asymptotiques de l’estimateur propos´e par Stoev et al. [2006], pr´esentons et ´etudions les propri´et´es asymptotiques d’un nouvel estimateur robuste du param`etre de m´emoire bas´e sur le carr´e de l’estimateur du param`etre d’´echelle propos´e par Rousseeuw and Croux [1993] et dont les propri´et´es asymptotiques sont ´etudi´ees dans L´evy-Leduc et al. [2009].

Estimateur robuste de Croux et Rousseeuw.

SoitX une variable al´eatoire de fonctions de r´epartitions FX. Un estimateur robuste du param`etre d’´echelle est l’estimateur propos´e par Rousseeuw and Croux [1993]. Il est bas´e sur la corr´elation int´egrale de Grassberger-Procaccia d´efinie par

r7→U(r, FX) = Z Z

1{|xx|≤r}dFX(x)dFX(x), (2.102) qui mesure la probabilit´e que deux copies ind´ependantesXetXde fonction de r´epartition FX tombent `a une distance plus petite quer. L’estimateur robuste introduit par [Rousseeuw and Croux, 1993, p. 1277] d´efinit l’´echelleσCR(FX) d’une fonction de r´epartionFX comme

´etant proportionnelle au premier quartile der 7→U(r, FX), `a savoir,

σCR(FX)def= c(FX) inf{r≥0, U(r, FX)≥1/4} , (2.103) o`u c(FX) est une constante d´ependant uniquement de la forme de FX. Ce param`etre d’´echelle peut ˆetre vu comme un analogue `a l’estimateur de la diff´erence moyenne de Gini n1(n−1)1P

1i6=jn|Xi−Xj|, o`u la moyenne est remplac´ee par un quantile.

La constant c(FX) en (2.103) est l`a pour assurer la consistance. Dans la suite, la fonction de r´epartition FX est suppos´ee appartenir `a la famille Gaussienne

µ,σ(·) = Φ((· −µ)/σ), µ∈R, σ∈R

+}, (2.104)

o`u Φ est la fonction de r´epartion d’une variable al´eatoire Gaussienne standard.

SoitXun processus Gaussien stationnaire. Etant donn´ees les observations (X1, . . . , Xn), la fonction de r´epartition des observations peut ˆetre estimer en utilisant la fonction de r´epartition empirique. r 7→ Fn(r) = n1Pn

i=11{Xir}. En rempla¸cant FX parFn dans (2.103), on obtient l’estimateur robuste du param`etre d’´echelle

b

σn,CR[Φ] =c(Φ){|Xi−Xj|; 1≤i, j≤n}(kn), (2.105) o`ukn=⌊n2/4⌋. Ainsi `a une constante multiplicativec(Φ) pr`es,bσn,CR[Φ] est la statistique dukn-i`eme ordre de la distance |Xi−Xj|entre toutes les paires d’observations. Comme mentionn´e dans Rousseeuw and Croux [1993],bσn,CR[Φ] a plusieurs propri´et´es int´eressantes:

il a une formule simple et explicite dont l’interpr´etation est intuitive; l’estimateur n’est pas affect´e mˆeme si (50%) des observations sont abberrantes; De plus comme prouv´ee dans L´evy-Leduc et al. [2009] sa fonction d’influence est born´ee. Pour une d´efinition de ces quantit´es, qui sont classiques dans la statistique robuste, voir par exemple (Huber [1981]).

L’estimateur Rousseeuw et Croux est aussi int´eressant car il peut ˆetre impl´ement´e assez efficacement. Sa complexit´e algorithmique est deO(nlogn).

L’´ecart absolu moyen.

Bien que de nombreux estimateurs du param`etre d’´echelle existent, la m´ediane empirique reste toujours la plus couramment utilis´ee. Si (X1, . . . , Xn) sont des observations d’une variable al´eatoire de fonction de r´epartition FX, alors on notera sa m´ediane empirique par mediXi. Soit X un processus Gaussien stationnaire. Etant donn´ees les observations (X1, . . . , Xn), la fonction de r´epartition des observations peut ˆetre estimer en utilisant la fonction de r´epartition empirique. Un estimateur robuste du param`etre d’´echelle est l’´ecart absolu moyen. donn´e par

b

σn,MAD(Φ) =m(Φ)

1medin

Xi− med

1inXi

. (2.106)

Comme dans le cas de l’estimateur de Rousseeuw et Croux la constante m(Φ) assure la consistance. Nous montrerons dans le chapitre 5 que cette constante est ´egale `a 1/Φ1(3/4) = 1.4826. Cet estimateur poss`ede ´egalement des propri´et´es int´eressantes qui sont essentiellement les mˆemes que celles de l’estimateur de Rousseeuw et Croux.

R´esultats asymptotiques

Soit X un processus M(d) Gaussien. Alors d’apr`es (2.43), les coefficients d’ondelettes {Wj,k} sont des processus Gaussien centr´es. Le carr´e de l’´ecart absolu moyen d´efini en (2.106) est donn´e par

b

σ2MAD,j =

m(Φ) med

0inj1|Wj,i| 2

,

o`u les observations (X1, . . . , Xn) sont remplac´ees par (Wj,0, . . . , Wj,nj1). De mˆeme, le carr´e de l’estimateur de Rousseeuw et Croux d´efini en (2.105) est donn´e par

b

σCR,j2 =

c(Φ){|Wj,i−Wj,k|; 0≤i, k≤nj−1}(knj)

2

,

o`u c(Φ) = 2.21914 voir(L´evy-Leduc et al. [2009]). En rempla¸cant dans (2.75) les scalo-grammes par σb2CR,j et σbMAD,j2 , on obtient deux estimateurs robustes du param`etre de m´emoire

dbLRW,n (J0,w)def=

JX0+ℓ j=J0

wjJ0log bσ2,j

, (2.107)

o`u∗ d´esigne CR et MAD;

Th´eor`eme 2.3.3. Soit X un processus M(d) Gaussien de densit´e spectrale g´en´eralis´ee f d´efinie en (2.11) tel que f ∈ H(β, L, ε) pour tout L > 0, 0 < β ≤ 2 et ε ∈ (0, π].

Supposons que les hypoth`eses (W-1)-(W-4) sont satisfaites avec(1 +β)/2−α < d≤M. Alors, si, quandn→ ∞, J0(n) est tel que

n2(1+2β)J0(n) →0, (2.108)

et (J1(n)) = (J0(n) +ℓ) une s´equence satisfaisant (S-1), alors on a le th´eor`eme de la limite centrale suivant:

pn2J0(n)

db,n(J0,w)−d d

−→ N 0,wTV(d)w

, (2.109)

o`u V(d) est la matrice (1 +ℓ)×(1 +ℓ) d´efinie par V,i,j(d) =X

p2

4c2p(IF)

p! K(d)p2pd|ij|+ijX

τ∈Z 2|i−j|X1

r=0

Z π

π

D(r),|ij|(λ;d)eiλτp

, 0≤i, j≤ℓ . (2.110) Dans (2.110), K(d) est d´efini en (2.90), D,|ij|(·;d) est d´efinie en (2.84), cp(IF) = E[IF(X,∗,Φ)Hp(X)], o`u Hp est lep-i`eme polynˆome d’Hermite etIF(·,∗,Φ) sont les fonc-tions d’influences d´efinies en (5.17), (5.18) et (5.19).

La preuve du Th´eor`eme 2.3.3 est donn´ee dans le Chapitre 5, Section 5.6. Les per-formances de nos estimateurs ont ´et´e test´ees via des simulations Monte Carlo, sur les donn´ees hydrologiques du Nil et sur les donn´ees de trafic Internet. Toutes ces applications sugg`erent fortement l’utilisation d’estimateurs robustes pour estimer d. Principalement l’estimateur dbCR,n qui a une efficacit´e asymptotique relative qui oscille entre 0.63 et 0.79 pour une plage de valeurs dedallant au del`a de l’intervalle de stationnarit´e.

2.3.6 Estimateur semi-param´etrique par maximum de vraisemblance