HAL Id: hal-01817304
https://hal.archives-ouvertes.fr/hal-01817304
Submitted on 17 Jun 2018
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Un théorème limite pour fonctionnelles de clusters sur champs aléatoires stationnaires.
José Gómez
To cite this version:
José Gómez. Un théorème limite pour fonctionnelles de clusters sur champs aléatoires stationnaires..
50èmes Journées de Statistique, May 2018, Paris Saclay, France. �hal-01817304�
Un th´ eor` eme limite pour fonctionnelles de clusters sur champs al´ eatoires stationnaires.
Jos´ e G. G´ omez 28 mai 2018
Laboratoire de Math´ ematiques Nicolas Oresme - LMNO, UMR CNRS 6139, Normandie Universit´ e, UNICAEN, 14000 Caen, France.
jose3g@gmail.com
R´ esum´ e. Dans cette note, nous fournissons un th´ eor` eme de la limite centrale pour les lois fini-dimensionnelles des processus empiriques de fonctionnelles de clusters qui agissent sur les champs al´ eatoires stationnaires. La praticit´ e et l’applicabilit´ e du r´ esultat d´ epend principalement d’un terme de d´ ependance T que nous simplifions ` a l’aide de conditions connues de d´ ependance faible.
Mots-cl´ es. Th´ eor` eme de la limite centrale, fonctionnelle de cluster, d´ ependance faible, valeurs extrˆ emes, m´ ethode de Lindeberg.
Abstract. In this note, we provide a central limit theorem for the finite dimensional marginal distributions of empirical processes of cluster functionals which act on the sta- tionary random fields. The practicality and applicability of the result depends mainly on a dependence term T that we simplify with the help of known conditions of weak dependence.
Keywords. Central limit theorem, cluster functional, weak dependence, extreme values, Lindeberg methode.
1 Introduction
A l’aube des r´ ` ecents d´ eveloppements dans le traitement de grandes masses de donn´ ees via
parallel processing, il est int´ eressant de developer la construction de statistiques en fonction
de blocs de donn´ ees et d’´ etudier leur inf´ erence. D’ailleurs, bien souvent, dans certaines ap-
plications seulement quelques donn´ ees sont pertinentes pour les estimations, sans compter
qu’elles sont g´ en´ eralement cach´ ees dans la grande masse de donn´ ees brutes. Donc, cela
nous am` ene ` a l’id´ ee de penser aux clusters de donn´ ees jug´ ees pertinentes (ou d’extrˆ emes,
dans le contexte de la th´ eorie des valeurs extrˆ emes). Malgr´ e le fait que ce ne soit peut-
ˆ etre pas l’id´ ee la plus naturelle d’un point de vue physique mais math´ ematiquement la
plus simple et pratique, on dit que deux valeurs pertinentes appartiennent ` a deux clusters
diff´ erents s’ils appartiennent ` a deux blocs diff´ erents. De plus, on consid` ere seulement les
cœurs des blocs, o` u le cœur d’un bloc B est d´ efini ici comme le plus petit sous-bloc de B
qui contiendrait toutes les valeurs jug´ ees pertinentes dans le bloc B. Cela nous permet donc de supprimer les donn´ ees inutiles pour notre ´ etude et de consid´ erer des fonctionnelles qui agissent sur les clusters. Dans le contexte de ce travail, nous d´ eveloppons quelques r´ esultats sur le comportement asymptotique de ces fonctionnelles de clusters pour les champs al´ eatoires stationnaires, inspir´ es par les travaux de Drees & Rootz´ en (2010) § 2.1 et G´ omez (2017a).
Pr´ ecis´ ement, notons n := (n
1, . . . , n
d) et 1 := (1, . . . , 1) ∈ N
d. La tendance : n → ∞ signifiera ici que n
i→ ∞ pour tout i ∈ [d], en notant [n] := [1 : n] et [k : n] :=
{k, k + 1, . . . , n} ⊂ Z . Afin d’´ eviter les cas non-d´ eg´ en´ er´ es, ´ etant donn´ e un champ al´ eatoire stationnaire X =
X
t∈ R
k: t ∈ N
d, nous d´ efinissons X
n,t:= L
n(X
t) I
A(X
t), qui est une normalisation de la variable al´ eatoire X
t` a travers une certaine fonction L
n: R
k−→
R
k, telle que
P (X
n,1∈ · | X
n,1∈ A) −→
n→∞
G(·), (1)
o` u G est une fonction de r´ epartition non d´ eg´ en´ er´ ee et A est un sous-ensemble de R
k\ {0}, que nous appellerons ici, l’ensemble de pertinence. On notera X
Nl’ensemble de variables al´ eatoires normalis´ ees X
n,t, associ´ ees au champ X, avec t ∈ Q
di=1
[n
i] et n ∈ N
d. On divise cet ensemble X
Nen m
1· · · m
dsous-blocs ou sous-grilles, tel que pour chaque i ∈ [d], nous prenons m
i:= dn
i/r
ie := max {k ∈ N : k ≤ n
i/r
i} −→
ni→∞
∞, o` u r
i:= r
niest une valeur enti` ere telle que r
i= o(n
i). On d´ efinit alors les d−blocs de X
Npar
Y
n,j1...jd:= (X
n,t)
t∈Qdi=1[(ji−1)ri+1 :jiri]
, (2)
o` u (j
1, . . . , j
d) ∈ D
n,d:= Q
d i=1[m
i].
D´ efinition 1 Soit y = (x
t)
t∈Qdi=1[ri]
un d−bloc. On d´ efinit le cœur du bloc y (par rapport
`
a l’ensemble de pertinence A) comme suit :
y
c=
(x
t)
t∈Qdi=1[ri,I : ri,S]
, si x
t∈ A pour certain t ∈ Q
d i=1[r
i];
0, sinon;
o` u, pour chaque i ∈ [d], r
i,Iet r
i,Ssont d´ efinis par :
r
i,I:= min
j
i∈ [r
i] : x
(j1,...,ji,...,jd)∈ A, avec (j
1, . . . , j
i−1, j
i+1, . . . , j
d) ∈ Y
k∈[d]\{i}
[r
k]
,
r
i,S:= max
j
i∈ [r
i] : x
(j1,...,ji,...,jd)∈ A, avec (j
1, . . . , j
i−1, j
i+1, . . . , j
d) ∈ Y
k∈[d]\{i}
[r
k]
.
D´ efinition 2 Soit (E, E ) un sous-espace mesurable de ( R
k, B( R
k)), pour certain k ≥ 1, tel que 0 ∈ E. Soit B
l1,...,ld(E) l’ensemble des blocs (ou grilles) ` a coefficients dans E et de taille l
1× l
2× · · · × l
d, avec l
1, . . . , l
d∈ N . Consid´ erons maintenant l’ensemble
E
∪:=
∞
[
l1,...,ld=1
B
l1,...,ld(E),
dot´ e de la tribu E
∪induite par les tribus bor´ eliennes sur B
l1,...,ld(E), pour l
1, . . . , l
d∈ N . On dit que la fonction mesurable f : (E
∪, E
∪) −→ ( R , B( R )) est une fonctionnelle de cluster si
f (y) = f (y
c), pour tout y ∈ E
∪, et f (0) = 0. (3) Soit F une classe de fonctionnelles de clusters et soit {Y
n,j1j2...jd: (j
1, . . . , j
d) ∈ D
n,d} la famille de blocs de taille r
1× r
2× · · · × r
dd´ efinie en (2). Le processus empirique Z
nde fonctionnelles de clusters en F , est le processus (Z
n(f))
f∈Fd´ efini par
Z
n(f ) := 1
√ nv
nX
(j1,...,jd)∈Dn,d
(f(Y
n,j1...jd) − E f (Y
n,j1...jd)), (4)
o` u n := n
1· · · n
det v
n:= P (X
n,1∈ A), en notant toujours A l’ensemble de pertinence.
En supposant que les fonctions de covariance existent et que la condition de Lindeberg soit satisfaite pour les variables {f(Y
n,j1,...,jd) : (j
1, . . . , j
d) ∈ D
n,d}, nous d´ emontrons la convergence des lois fini-dimensionnelles (fidis) du processus (4) vers celles d’un processus Gaussien centr´ e, en utilisant des techniques similaires ` a celles utilis´ ees par Bardet et al. (2007) pour montrer leurs TLCs.
Le reste du document est constitu´ e par deux sections : la Section 2, o` u nous four- nissons les lemmes essentielles pour montrer le TLC pour les fidis du processus empirique (4) ; la Section 3, o` u nous discutons l’applicabilit´ e du TLC en utilisant des arguments de d´ ependance faible, dans le sens de Doukhan & Louhichi (1999), et en mentionnant un exemple assez utile pour l’´ etude des valeurs extrˆ emes de champs al´ eatoires stationnaires.
Si le lecteur est int´ eress´ e, les preuves des r´ esultats mentionn´ es dans cette note sont d´ evelopp´ ees dans le chapitre 5 de la th` ese de doctorat de l’auteur, G´ omez (2017b).
2 R´ esultats
D’abord, on consid` ere les hipoth` eses suivantes :
(Bas) r = (r
1, . . . , r
d) ∈ N
dest tel que r
i= o(n
i) et r
i→ ∞ pour chaque i ∈ [d].
De plus, nv
n−→ ∞ et, en notant r := r
1· · · r
d, rv
n−→ 0.
(Lin) E (f(Y
n) − E f(Y
n))
2I
{|f(Yn)−Ef(Yn)|>√ nvn}= o(rv
n), ∀ > 0 et ∀f ∈ F ;
(Cov) (rv
n)
−1Cov (f (Y
n), g(Y
n)) −→ c(f, g), ∀f, g ∈ F ; o` u Y
nd´ enote un bloc g´ en´ eral de X
N, i.e., Y
n=
DY
n,1.
D’ailleurs, soient Y
n,j1...jd, avec (j
1, . . . , j
d) ∈ D
n,d, les blocs al´ eatoires d´ efinis en (2).
Alors, pour chaque k−uplet de fonctionnelles de clusters f
k= (f
1, . . . , f
k) et chaque (j
1, . . . , j
d) ∈ D
n,d, nous d´ efinissons :
W
n,j1...jd:= 1
√ nv
n(f
1(Y
n,j1...jd) − E f
1(Y
n,j1...jd), . . . , f
k(Y
n,j1...jd) − E f
k(Y
n,j1...jd)) . (5) Sans perte de g´ en´ eralit´ e et afin de simplifier l’´ ecriture, nous consid´ ererons d = 2 dans la suite de cette section.
Soit maintenant (W
n,ij0)
(i,j)∈Dn,2une suite de variables al´ eatoires ind´ ependantes centr´ ees qui prennent leurs valeurs dans R
k, ind´ ependante de la suite (W
n,ij)
(i,j)∈Dn,2d´ efinie en (5), et telle que W
n,ij0∼ N
k(0, Cov(W
n,ij)), pour tout (i, j) ∈ D
n,2. On d´ enote par C
b3l’ensemble des fonctions born´ ees h : R
k−→ R , qui ont toutes leurs d´ eriv´ ees partielles continues et born´ ees jusqu’` a l’ordre 3. Alors, for h ∈ C
b3et n = (n
1, n
2) ∈ N
2, on d´ efinit
∆
n:=
E
h
X
(i,j)∈Dn,2
W
n,ij
− h
X
(i,j)∈Dn,2
W
n,ij0
. (6)
Lemme 1 (Lindeberg sous ind´ ependance) Supposons que les blocs {Y
n,ij: (i, j) ∈ D
n,2} soient ind´ ependants et que les vecteurs al´ eatoires (W
n,ij)
(i,j)∈Dn,2d´ efinis en (5) satisfassent l’hypoth` ese suivante :
(Lin’) Il existe δ ∈ (0, 1] tel que, pour chaque (i, j) ∈ D
n,2, E kW
n,ijk
2+δ< ∞, pour tout n ∈ N
2et tout k−uplet de fonctionnelles de clusters (f
1, . . . , f
k) ∈ F
k.
Alors, pour tout n ∈ N
2,
∆
n≤ 6 · kh
(2)k
1−δ∞· kh
(3)k
δ∞· A
n, o` u A
n:= P
(i,j)∈Dn,2
E kW
n,ijk
2+δ.
Remarque 1 En prenant < 6kh
(2)k
∞(kh
(3)k
∞)
−1et en utilisant de mani` ere appropri´ ee la deuxieme in´ egalit´ e de la preuve du Lemme 1, voire le Chapitre 5 de Gomez (2017b), on pourrait utiliser la condition classique de Lindeberg. En effet, on obtiendrait :
∆
n≤ 2 kh
(2)k
∞B
n() + kh
(3)k
∞a
n4
3 + p B
n()
, (7)
o` u
B
n() = X
(i,j)∈Dn,2
E kW
n,ijk
2I
{kWn,ijk>}, pour > 0, n ∈ N
2;
a
n= X
(i.j)∈Dn,2
E kW
n,ijk
2< ∞, pour n ∈ N
2.
Remarque 2 Note que les hypoth` eses (Lin) et (Cov) impliquent respectivement que B
n() −→
n→∞
0 et a
n−→
n→∞
P
ki=1
c(f
i, f
i) < ∞. Donc, si les blocs {Y
n,ij: (i, j) ∈ D
n,2} sont ind´ ependants et si les hypoth` eses (Lin) et (Cov) sont satisfaites, alors en utilisant la Remarque 1, les fidis du processus empirique (Z
n(f))
f∈Fde fonctionnelles de clusters con- vergent vers celles d’un processus Gaussien (Z(f ))
f∈Fcentr´ e et de fonction de covariance c.
Dans le cas d´ ependant, nous avons besoin de quelques notations suppl´ ementaires. En effet, soit L
ji:= {(i, v) : v ∈ [j ]} ⊂ D
n,2, pour (i, j) ∈ D
n,2. Nous notons L
0i= L
j0= ∅ pour i ∈ [m
1] et j ∈ [m
2]. Alors, pour chaque k ∈ N , f
k= (f
1, . . . , f
k) ∈ F
k, t ∈ R
ket n ∈ N
2; on d´ efinit
T
n,t(f
k) := X
(j1,j2)∈Dn,2
Cov
exp(iht, X
(u1,u2)∈Dn,2\(Sj1−1
l=0 Lml 2∪Ljj2
1)
W
n,u1u2i), exp (iht, W
n,j1j2i)
(8)
Lemme 2 (Lindeberg sous d´ ependance) Supposons que les vecteurs (W
n,ij)
(i,j)∈Dn,2d´ efinis en (5) satisfassent l’hipoth` ese (Lin’). Pour le cas sp´ ecial des fonctions exponen- tielles complexes h(w) = exp(iht, wi) pour certain t ∈ R
k, on obtient pour chaque k ∈ N et chaque k−uplet f
k= (f
1, . . . , f
k) de fonctionnelles de clusters, l’in´ egalit´ e :
∆
n≤ T
n,t(f
k) + 6ktk
2+δA
n, n ∈ N
2. Le r´ esultat suivant d´ erive du lemme pr´ ec´ edent et de la Remarque 1.
Th´ eor` eme 1 (TLC de Lindeberg pour fonctionnelles de clusters) Supposons que l’hypoth` ese basique (Bas) et les hypoth` eses de convergence (Lin) et (Cov) soient satisfaites.
Alors, si pour chaque k ∈ N , T
n,t(f
k) converge vers z´ ero, lorsque n → ∞, pour tout t ∈ R
ket tout k−uplet f
k= (f
1, . . . , f
k) ∈ F
kde fonctionnelles de clusters, les fidis du processus empirique (Z
n(f))
f∈Fconvergent vers celles d’un processus Gaussien centr´ e (Z (f))
f∈Fde fonction de covariance c (d´ efnie en (Cov)).
Remarque 3 Le th´ eor` eme pr´ ec´ edent peut ˆ etre reformul´ e pour d = 3 comme suit. Soit S
i= {(u, v, w) : u ∈ [i], v ∈ [m
2], w ∈ [m
3]} ⊆ D
n,3, pour i ∈ [m
1], avec la convention S
0= ∅. De plus, soient L
kij= {(i, j, w) : w ∈ [k]}, pour (i, j, k) ∈ D
n,3, et L
kij= ∅ si i, j ou k est z´ ero. Alors, si (Bas), (Lin), (Cov) sont satisfaites (pour d = 3), et si pour chaque k ∈ N ,
T
n,t∗(f
k) = X
(j1,j2,j3)∈Dn,3
|Cov (exp(iht, V
n,j1j2j3i), exp (iht, W
n,j1j2j3i))| (9) converge vers z´ ero, lorsque n → ∞, pour tout t ∈ R
ket tout k−uplet f
k= (f
1, . . . , f
k) ∈ F
kde fonctionnelles de clusters, o` u
V
n,j1j2j3:= X
(u1,u2,u3)∈Dn,3\
(
Sj1−1 ∪ Sj2−1 l=0 Lmj31l∪Ljj3
1j2