• Aucun résultat trouvé

Un théorème limite pour fonctionnelles de clusters sur champs aléatoires stationnaires.

N/A
N/A
Protected

Academic year: 2021

Partager "Un théorème limite pour fonctionnelles de clusters sur champs aléatoires stationnaires."

Copied!
7
0
0

Texte intégral

(1)

HAL Id: hal-01817304

https://hal.archives-ouvertes.fr/hal-01817304

Submitted on 17 Jun 2018

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

Un théorème limite pour fonctionnelles de clusters sur champs aléatoires stationnaires.

José Gómez

To cite this version:

José Gómez. Un théorème limite pour fonctionnelles de clusters sur champs aléatoires stationnaires..

50èmes Journées de Statistique, May 2018, Paris Saclay, France. �hal-01817304�

(2)

Un th´ eor` eme limite pour fonctionnelles de clusters sur champs al´ eatoires stationnaires.

Jos´ e G. G´ omez 28 mai 2018

Laboratoire de Math´ ematiques Nicolas Oresme - LMNO, UMR CNRS 6139, Normandie Universit´ e, UNICAEN, 14000 Caen, France.

jose3g@gmail.com

R´ esum´ e. Dans cette note, nous fournissons un th´ eor` eme de la limite centrale pour les lois fini-dimensionnelles des processus empiriques de fonctionnelles de clusters qui agissent sur les champs al´ eatoires stationnaires. La praticit´ e et l’applicabilit´ e du r´ esultat d´ epend principalement d’un terme de d´ ependance T que nous simplifions ` a l’aide de conditions connues de d´ ependance faible.

Mots-cl´ es. Th´ eor` eme de la limite centrale, fonctionnelle de cluster, d´ ependance faible, valeurs extrˆ emes, m´ ethode de Lindeberg.

Abstract. In this note, we provide a central limit theorem for the finite dimensional marginal distributions of empirical processes of cluster functionals which act on the sta- tionary random fields. The practicality and applicability of the result depends mainly on a dependence term T that we simplify with the help of known conditions of weak dependence.

Keywords. Central limit theorem, cluster functional, weak dependence, extreme values, Lindeberg methode.

1 Introduction

A l’aube des r´ ` ecents d´ eveloppements dans le traitement de grandes masses de donn´ ees via

parallel processing, il est int´ eressant de developer la construction de statistiques en fonction

de blocs de donn´ ees et d’´ etudier leur inf´ erence. D’ailleurs, bien souvent, dans certaines ap-

plications seulement quelques donn´ ees sont pertinentes pour les estimations, sans compter

qu’elles sont g´ en´ eralement cach´ ees dans la grande masse de donn´ ees brutes. Donc, cela

nous am` ene ` a l’id´ ee de penser aux clusters de donn´ ees jug´ ees pertinentes (ou d’extrˆ emes,

dans le contexte de la th´ eorie des valeurs extrˆ emes). Malgr´ e le fait que ce ne soit peut-

ˆ etre pas l’id´ ee la plus naturelle d’un point de vue physique mais math´ ematiquement la

plus simple et pratique, on dit que deux valeurs pertinentes appartiennent ` a deux clusters

diff´ erents s’ils appartiennent ` a deux blocs diff´ erents. De plus, on consid` ere seulement les

cœurs des blocs, o` u le cœur d’un bloc B est d´ efini ici comme le plus petit sous-bloc de B

(3)

qui contiendrait toutes les valeurs jug´ ees pertinentes dans le bloc B. Cela nous permet donc de supprimer les donn´ ees inutiles pour notre ´ etude et de consid´ erer des fonctionnelles qui agissent sur les clusters. Dans le contexte de ce travail, nous d´ eveloppons quelques r´ esultats sur le comportement asymptotique de ces fonctionnelles de clusters pour les champs al´ eatoires stationnaires, inspir´ es par les travaux de Drees & Rootz´ en (2010) § 2.1 et G´ omez (2017a).

Pr´ ecis´ ement, notons n := (n

1

, . . . , n

d

) et 1 := (1, . . . , 1) ∈ N

d

. La tendance : n → ∞ signifiera ici que n

i

→ ∞ pour tout i ∈ [d], en notant [n] := [1 : n] et [k : n] :=

{k, k + 1, . . . , n} ⊂ Z . Afin d’´ eviter les cas non-d´ eg´ en´ er´ es, ´ etant donn´ e un champ al´ eatoire stationnaire X =

X

t

∈ R

k

: t ∈ N

d

, nous d´ efinissons X

n,t

:= L

n

(X

t

) I

A

(X

t

), qui est une normalisation de la variable al´ eatoire X

t

` a travers une certaine fonction L

n

: R

k

−→

R

k

, telle que

P (X

n,1

∈ · | X

n,1

∈ A) −→

n→∞

G(·), (1)

o` u G est une fonction de r´ epartition non d´ eg´ en´ er´ ee et A est un sous-ensemble de R

k

\ {0}, que nous appellerons ici, l’ensemble de pertinence. On notera X

N

l’ensemble de variables al´ eatoires normalis´ ees X

n,t

, associ´ ees au champ X, avec t ∈ Q

d

i=1

[n

i

] et n ∈ N

d

. On divise cet ensemble X

N

en m

1

· · · m

d

sous-blocs ou sous-grilles, tel que pour chaque i ∈ [d], nous prenons m

i

:= dn

i

/r

i

e := max {k ∈ N : k ≤ n

i

/r

i

} −→

ni→∞

∞, o` u r

i

:= r

ni

est une valeur enti` ere telle que r

i

= o(n

i

). On d´ efinit alors les d−blocs de X

N

par

Y

n,j1...jd

:= (X

n,t

)

t∈Qd

i=1[(ji−1)ri+1 :jiri]

, (2)

o` u (j

1

, . . . , j

d

) ∈ D

n,d

:= Q

d i=1

[m

i

].

D´ efinition 1 Soit y = (x

t

)

t∈Qd

i=1[ri]

un d−bloc. On d´ efinit le cœur du bloc y (par rapport

`

a l’ensemble de pertinence A) comme suit :

y

c

=

(x

t

)

t∈Qd

i=1[ri,I : ri,S]

, si x

t

∈ A pour certain t ∈ Q

d i=1

[r

i

];

0, sinon;

o` u, pour chaque i ∈ [d], r

i,I

et r

i,S

sont d´ efinis par :

r

i,I

:= min

j

i

∈ [r

i

] : x

(j1,...,ji,...,jd)

∈ A, avec (j

1

, . . . , j

i−1

, j

i+1

, . . . , j

d

) ∈ Y

k∈[d]\{i}

[r

k

]

 ,

r

i,S

:= max

j

i

∈ [r

i

] : x

(j1,...,ji,...,jd)

∈ A, avec (j

1

, . . . , j

i−1

, j

i+1

, . . . , j

d

) ∈ Y

k∈[d]\{i}

[r

k

]

.

(4)

D´ efinition 2 Soit (E, E ) un sous-espace mesurable de ( R

k

, B( R

k

)), pour certain k ≥ 1, tel que 0 ∈ E. Soit B

l1,...,ld

(E) l’ensemble des blocs (ou grilles) ` a coefficients dans E et de taille l

1

× l

2

× · · · × l

d

, avec l

1

, . . . , l

d

∈ N . Consid´ erons maintenant l’ensemble

E

:=

[

l1,...,ld=1

B

l1,...,ld

(E),

dot´ e de la tribu E

induite par les tribus bor´ eliennes sur B

l1,...,ld

(E), pour l

1

, . . . , l

d

∈ N . On dit que la fonction mesurable f : (E

, E

) −→ ( R , B( R )) est une fonctionnelle de cluster si

f (y) = f (y

c

), pour tout y ∈ E

, et f (0) = 0. (3) Soit F une classe de fonctionnelles de clusters et soit {Y

n,j1j2...jd

: (j

1

, . . . , j

d

) ∈ D

n,d

} la famille de blocs de taille r

1

× r

2

× · · · × r

d

d´ efinie en (2). Le processus empirique Z

n

de fonctionnelles de clusters en F , est le processus (Z

n

(f))

f∈F

d´ efini par

Z

n

(f ) := 1

√ nv

n

X

(j1,...,jd)∈Dn,d

(f(Y

n,j1...jd

) − E f (Y

n,j1...jd

)), (4)

o` u n := n

1

· · · n

d

et v

n

:= P (X

n,1

∈ A), en notant toujours A l’ensemble de pertinence.

En supposant que les fonctions de covariance existent et que la condition de Lindeberg soit satisfaite pour les variables {f(Y

n,j1,...,jd

) : (j

1

, . . . , j

d

) ∈ D

n,d

}, nous d´ emontrons la convergence des lois fini-dimensionnelles (fidis) du processus (4) vers celles d’un processus Gaussien centr´ e, en utilisant des techniques similaires ` a celles utilis´ ees par Bardet et al. (2007) pour montrer leurs TLCs.

Le reste du document est constitu´ e par deux sections : la Section 2, o` u nous four- nissons les lemmes essentielles pour montrer le TLC pour les fidis du processus empirique (4) ; la Section 3, o` u nous discutons l’applicabilit´ e du TLC en utilisant des arguments de d´ ependance faible, dans le sens de Doukhan & Louhichi (1999), et en mentionnant un exemple assez utile pour l’´ etude des valeurs extrˆ emes de champs al´ eatoires stationnaires.

Si le lecteur est int´ eress´ e, les preuves des r´ esultats mentionn´ es dans cette note sont d´ evelopp´ ees dans le chapitre 5 de la th` ese de doctorat de l’auteur, G´ omez (2017b).

2 R´ esultats

D’abord, on consid` ere les hipoth` eses suivantes :

(Bas) r = (r

1

, . . . , r

d

) ∈ N

d

est tel que r

i

= o(n

i

) et r

i

→ ∞ pour chaque i ∈ [d].

De plus, nv

n

−→ ∞ et, en notant r := r

1

· · · r

d

, rv

n

−→ 0.

(Lin) E (f(Y

n

) − E f(Y

n

))

2

I

{|f(Yn)−Ef(Yn)|>√ nvn}

= o(rv

n

), ∀ > 0 et ∀f ∈ F ;

(5)

(Cov) (rv

n

)

−1

Cov (f (Y

n

), g(Y

n

)) −→ c(f, g), ∀f, g ∈ F ; o` u Y

n

d´ enote un bloc g´ en´ eral de X

N

, i.e., Y

n

=

D

Y

n,1

.

D’ailleurs, soient Y

n,j1...jd

, avec (j

1

, . . . , j

d

) ∈ D

n,d

, les blocs al´ eatoires d´ efinis en (2).

Alors, pour chaque k−uplet de fonctionnelles de clusters f

k

= (f

1

, . . . , f

k

) et chaque (j

1

, . . . , j

d

) ∈ D

n,d

, nous d´ efinissons :

W

n,j1...jd

:= 1

√ nv

n

(f

1

(Y

n,j1...jd

) − E f

1

(Y

n,j1...jd

), . . . , f

k

(Y

n,j1...jd

) − E f

k

(Y

n,j1...jd

)) . (5) Sans perte de g´ en´ eralit´ e et afin de simplifier l’´ ecriture, nous consid´ ererons d = 2 dans la suite de cette section.

Soit maintenant (W

n,ij0

)

(i,j)∈Dn,2

une suite de variables al´ eatoires ind´ ependantes centr´ ees qui prennent leurs valeurs dans R

k

, ind´ ependante de la suite (W

n,ij

)

(i,j)∈Dn,2

d´ efinie en (5), et telle que W

n,ij0

∼ N

k

(0, Cov(W

n,ij

)), pour tout (i, j) ∈ D

n,2

. On d´ enote par C

b3

l’ensemble des fonctions born´ ees h : R

k

−→ R , qui ont toutes leurs d´ eriv´ ees partielles continues et born´ ees jusqu’` a l’ordre 3. Alors, for h ∈ C

b3

et n = (n

1

, n

2

) ∈ N

2

, on d´ efinit

n

:=

E

h

 X

(i,j)∈Dn,2

W

n,ij

 − h

 X

(i,j)∈Dn,2

W

n,ij0

. (6)

Lemme 1 (Lindeberg sous ind´ ependance) Supposons que les blocs {Y

n,ij

: (i, j) ∈ D

n,2

} soient ind´ ependants et que les vecteurs al´ eatoires (W

n,ij

)

(i,j)∈Dn,2

d´ efinis en (5) satisfassent l’hypoth` ese suivante :

(Lin’) Il existe δ ∈ (0, 1] tel que, pour chaque (i, j) ∈ D

n,2

, E kW

n,ij

k

2+δ

< ∞, pour tout n ∈ N

2

et tout k−uplet de fonctionnelles de clusters (f

1

, . . . , f

k

) ∈ F

k

.

Alors, pour tout n ∈ N

2

,

n

≤ 6 · kh

(2)

k

1−δ

· kh

(3)

k

δ

· A

n

, o` u A

n

:= P

(i,j)∈Dn,2

E kW

n,ij

k

2+δ

.

Remarque 1 En prenant < 6kh

(2)

k

(kh

(3)

k

)

−1

et en utilisant de mani` ere appropri´ ee la deuxieme in´ egalit´ e de la preuve du Lemme 1, voire le Chapitre 5 de Gomez (2017b), on pourrait utiliser la condition classique de Lindeberg. En effet, on obtiendrait :

n

≤ 2 kh

(2)

k

B

n

() + kh

(3)

k

a

n

4

3 + p B

n

()

, (7)

o` u

B

n

() = X

(i,j)∈Dn,2

E kW

n,ij

k

2

I

{kWn,ijk>}

, pour > 0, n ∈ N

2

;

a

n

= X

(i.j)∈Dn,2

E kW

n,ij

k

2

< ∞, pour n ∈ N

2

.

(6)

Remarque 2 Note que les hypoth` eses (Lin) et (Cov) impliquent respectivement que B

n

() −→

n→∞

0 et a

n

−→

n→∞

P

k

i=1

c(f

i

, f

i

) < ∞. Donc, si les blocs {Y

n,ij

: (i, j) ∈ D

n,2

} sont ind´ ependants et si les hypoth` eses (Lin) et (Cov) sont satisfaites, alors en utilisant la Remarque 1, les fidis du processus empirique (Z

n

(f))

f∈F

de fonctionnelles de clusters con- vergent vers celles d’un processus Gaussien (Z(f ))

f∈F

centr´ e et de fonction de covariance c.

Dans le cas d´ ependant, nous avons besoin de quelques notations suppl´ ementaires. En effet, soit L

ji

:= {(i, v) : v ∈ [j ]} ⊂ D

n,2

, pour (i, j) ∈ D

n,2

. Nous notons L

0i

= L

j0

= ∅ pour i ∈ [m

1

] et j ∈ [m

2

]. Alors, pour chaque k ∈ N , f

k

= (f

1

, . . . , f

k

) ∈ F

k

, t ∈ R

k

et n ∈ N

2

; on d´ efinit

T

n,t

(f

k

) := X

(j1,j2)∈Dn,2

Cov

 exp(iht, X

(u1,u2)∈Dn,2\(Sj1−1

l=0 Lml 2∪Ljj2

1)

W

n,u1u2

i), exp (iht, W

n,j1j2

i)

(8)

Lemme 2 (Lindeberg sous d´ ependance) Supposons que les vecteurs (W

n,ij

)

(i,j)∈Dn,2

d´ efinis en (5) satisfassent l’hipoth` ese (Lin’). Pour le cas sp´ ecial des fonctions exponen- tielles complexes h(w) = exp(iht, wi) pour certain t ∈ R

k

, on obtient pour chaque k ∈ N et chaque k−uplet f

k

= (f

1

, . . . , f

k

) de fonctionnelles de clusters, l’in´ egalit´ e :

n

≤ T

n,t

(f

k

) + 6ktk

2+δ

A

n

, n ∈ N

2

. Le r´ esultat suivant d´ erive du lemme pr´ ec´ edent et de la Remarque 1.

Th´ eor` eme 1 (TLC de Lindeberg pour fonctionnelles de clusters) Supposons que l’hypoth` ese basique (Bas) et les hypoth` eses de convergence (Lin) et (Cov) soient satisfaites.

Alors, si pour chaque k ∈ N , T

n,t

(f

k

) converge vers z´ ero, lorsque n → ∞, pour tout t ∈ R

k

et tout k−uplet f

k

= (f

1

, . . . , f

k

) ∈ F

k

de fonctionnelles de clusters, les fidis du processus empirique (Z

n

(f))

f∈F

convergent vers celles d’un processus Gaussien centr´ e (Z (f))

f∈F

de fonction de covariance c (d´ efnie en (Cov)).

Remarque 3 Le th´ eor` eme pr´ ec´ edent peut ˆ etre reformul´ e pour d = 3 comme suit. Soit S

i

= {(u, v, w) : u ∈ [i], v ∈ [m

2

], w ∈ [m

3

]} ⊆ D

n,3

, pour i ∈ [m

1

], avec la convention S

0

= ∅. De plus, soient L

kij

= {(i, j, w) : w ∈ [k]}, pour (i, j, k) ∈ D

n,3

, et L

kij

= ∅ si i, j ou k est z´ ero. Alors, si (Bas), (Lin), (Cov) sont satisfaites (pour d = 3), et si pour chaque k ∈ N ,

T

n,t

(f

k

) = X

(j1,j2,j3)∈Dn,3

|Cov (exp(iht, V

n,j1j2j3

i), exp (iht, W

n,j1j2j3

i))| (9) converge vers z´ ero, lorsque n → ∞, pour tout t ∈ R

k

et tout k−uplet f

k

= (f

1

, . . . , f

k

) ∈ F

k

de fonctionnelles de clusters, o` u

V

n,j1j2j3

:= X

(u1,u2,u3)∈Dn,3\

(

Sj1−1 ∪ Sj2−1 l=0 Lmj3

1l∪Ljj3

1j2

)

W

n,u1u2u3

,

(7)

les fidis du processus empirique (Z

n

(f ))

f∈F

de fonctionnelles de clusters convergent vers celles d’un processus Gaussien (Z(f ))

f∈F

centr´ e et de fonction de covariance c.

3 Discussion et Commentaires

Dans le th´ eor` eme pr´ ec´ edent, ` a part les hypoth` eses habituelles de convergence (la condi- tion de Lindeberg et l’existence de la fonction de covariance), il est important d’assurer la convergence vers z´ ero du terme (8) (ou (9) pour le cas d = 3), qui comprend la d´ ependence entre les blocs. Par contre, la mani` ere dont est d´ efini ce terme de d´ ependance est d´ esavantageuse, parce qu’on ne peut pas v´ erifier directement et facilement sa conver- gence vers z´ ero. Cependant, puisque ce terme de d´ ependance est la somme de covariances, on peut alors le borner par le coefficient de m´ elange fort de Rosenblatt (1956) ou bien par les coefficients de d´ ependance faible de Doukhan & Louhichi (1999), avec pour but de construire des conditions plus commodes et faciles ` a prouver dans la pratique.

Dans cet expos´ e, on fournira ces conditions de d´ ependance faible et on illustrera quelques exemples de champs al´ eatoires qui satisfassent ces conditions. De plus, on montrera une application des fonctionnelles de clusters et des processus empiriques de fonctionnelles de clusters, en prouvant la normalit´ e asymptotique de l’iso-extr´ emogramme d´ efini en Gomez (2017b).

Bibliographie

[1] Bardet, J.M., Doukhan, P., Lang, G. & Ragache, N. (2007), Dependent Lindeberg Central Limit Theorem and Some Applications. ESAIM: Prob. and Stat., 12, 154–172.

[2] Doukhan, P. & Louhichi, S. (1999), A new weak dependence condition and applications to moment inequalities. Stochastic Processes and their Applications, 84, 313 – 342.

[3] Doukhan, P. & G´ omez, J.G. (2018), On extreme values in stationary weakly dependent random fields. Soumis ` a Cyclostationary: Theory and Methods V, Lecture Notes in Applied Condition Monitoring, Springer.

[4] Drees, H & Rootz´ en, H. (2010), Limit Theorems for Empirical Processes of Cluster Functionals. The Annals of Statistics, 38, 2145–2186.

[5] G´ omez, J.G. (2017a), Dependent Lindeberg central limit theorem for the fidis of em- pirical processes of cluster functionals. Statistics : A Journal of Theoretical and Applied Statistics. https://doi.org/10.1080/02331888.2018.1470630

[6] G´ omez, J.G. (2017b), Th´ eor` emes limites pour des fonctionnelles de clusters d’extrˆ emes et applications. Th` ese de doctorat de l’Universit´ e de Cergy Pontoise, Soutenue le 13 novembre 2017, Cergy-Pontoise.

[7] Rosenblatt, M. (1956), A central limit theorem and a strong mixing condition. Pro-

ceedings of the National Academy of Sciences of the United States of America, 42, 43–47.

Références

Documents relatifs

Montrer alors (sans utiliser la loi forte des grands nombres) `a l’aide des fonions cara´eriiques que.. X 

Montrer alors (sans utiliser la loi forte des grands nombres) `a l’aide des fonions cara ´eri iques que.. X 

Le champ ´ electrique en un point M est contenu dans les plans de sym´ etrie passant par M , soit tous les plans obtenus par rotation autour de la droite OM.. On peut donc calculer

Dans le cas d’un tirage réjectif, nous établissons sous certaines hypothèses sur la régularité des trajectoires et sur les probabilités d’inclusion du plan, un théorème

Functional laws of the iterated logarithm for the increments of empirical and quantile processes.. Uniform in Bandwidth Functional

D’autre part, un article antérieur de Basu et Dorea ([3], 1979) montre que le principe d’invariance a lieu pour des champs aléatoires de carré intégrable de type accroissement

- On étudie le comportement limite des fonctionnelles des types a et b ci-dessous des processus stables et des marches aléatoires appartenant au domaine d’attraction

Objectifs : Utiliser les fonctions propos´ ees par R pour simuler des donn´ ees sous une loi usuelle (nouveaut´ es ici : les lois de Bernoulli B(p) et Binˆ omiale B(n, p)) faire