- - -
- - -
Dépôt Institutionnel de l’Université libre de Bruxelles / Université libre de Bruxelles Institutional Repository
Thèse de doctorat/ PhD Thesis Citation APA:
Rifi, K. (1993). Bornes de Berry-Esséen pour les statistiques de rangs sérielles (Unpublished doctoral dissertation). Université libre de Bruxelles, Faculté des sciences, Bruxelles.
Disponible à / Available at permalink : https://dipot.ulb.ac.be/dspace/bitstream/2013/212821/1/472c276b-713e-45ea-bfd3-fc1e04542800.txt
(English version below)
Cette thèse de doctorat a été numérisée par l’Université libre de Bruxelles. L’auteur qui s’opposerait à sa mise en ligne dans DI-fusion est invité à prendre contact avec l’Université ([email protected]).
Dans le cas où une version électronique native de la thèse existe, l’Université ne peut garantir que la présente version numérisée soit identique à la version électronique native, ni qu’elle soit la version officielle définitive de la thèse.
DI-fusion, le Dépôt Institutionnel de l’Université libre de Bruxelles, recueille la production scientifique de l’Université, mise à disposition en libre accès autant que possible. Les œuvres accessibles dans DI-fusion sont protégées par la législation belge relative aux droits d'auteur et aux droits voisins. Toute personne peut, sans avoir à demander l’autorisation de l’auteur ou de l’ayant-droit, à des fins d’usage privé ou à des fins d’illustration de l’enseignement ou de recherche scientifique, dans la mesure justifiée par le but non lucratif poursuivi, lire, télécharger ou reproduire sur papier ou sur tout autre support, les articles ou des fragments d’autres œuvres, disponibles dans DI-fusion, pour autant que :
Le nom des auteurs, le titre et la référence bibliographique complète soient cités;
L’identifiant unique attribué aux métadonnées dans DI-fusion (permalink) soit indiqué;
Le contenu ne soit pas modifié.
L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé pour donner accès à l’œuvre. Toute autre utilisation non mentionnée ci-dessus nécessite l’autorisation de l’auteur de l’œuvre ou de l’ayant droit.
--- English Version ---
This Ph.D. thesis has been digitized by Université libre de Bruxelles. The author who would disagree on its online availability in DI-fusion is invited to contact the University ([email protected]).
If a native electronic version of the thesis exists, the University can guarantee neither that the present digitized version is identical to the native electronic version, nor that it is the definitive official version of the thesis.
DI-fusion is the Institutional Repository of Université libre de Bruxelles; it collects the research output of the University, available on open access as much as possible. The works included in DI-fusion are protected by the Belgian legislation relating to authors’ rights and neighbouring rights.
Any user may, without prior permission from the authors or copyright owners, for private usage or for educational or scientific research purposes, to the extent justified by the non-profit activity, read, download or reproduce on paper or on any other media, the articles or fragments of other works, available in DI-fusion, provided:
The authors, title and full bibliographic details are credited in any copy;
The unique identifier (permalink) for the original metadata page in DI-fusion is indicated;
The content is not changed in any way.
It is not permitted to store the work in another database in order to provide access to it; the unique identifier (permalink) indicated above must always be used to provide access to the work. Any other use not mentioned above requires the authors’ or copyright owners’ permission.
b 933^
U niversité L ibre de B ruxelles
F aculté des S ciences
B ornes de B erry -E sséen
POUR LES STATISTIQUES DE RANGS SÉRIELLES
Thèse présentée en vue de l'obention du grade de Docteur en Sciences
(Grade scientifique)
U S-
U niversité L ibre de B ruxelles
F aculté des S ciences
B ornes de B erry -E sséen
POUR LES STATISTIQUES DE RANGS SÉRIELLES
Thèse présentée en vue de l'obention du grade de Docteur en Sciences
(Grade scientifique)
PLAN DE LA THESE
I. Introduction.
II.Comportement asymptotique de la fonction caractéristique d’une statistique de rangs sérielle, linéaire et simple.
2.1. introduction et résultat principal.
2.2. Résultats préliminaires et preuves
III.Borne de Berry-Esseen pour des statistiques de rangs sérielles, linéaires et simples.
3.1. Introduction
3.2. Bornes de Berry-Esséen.
3.3. Préliminaires.
3.4. Preuve du théorème.
CHAPITRE I
INTRODUCTION.
Mon travail consiste à étudier les statistiques de rangs sérielles, linéaires et simples d'ordre k (entier k > 1) de la forme suivante:
T® =(n-k)“^/2
t=k+l ar^(R^^^(n) n
où désignent k+1 fonctions scores, et
sont les rangs associés à une suite de variables aléatoires
’ ^2’ ••• 5 ^n.'
Hallin, M., Ingenbleek, J.-Fr et M.L.,l\iri (1985) ont prouvé la normalité asymptotique de la statistique T® sous l'hypothèse H
q, selon laquelle les variables aléatoires sont indépendantes et de même loi, contre des hypothèses contiguës. Ceci leur a permis de tester l'hypothèse d'indépendance de séries chronologiques contre l'hypothèse d'un autorégressif moyenne mobile (ARMA).
Ce travail se compose de deux parties principales:
l Ai. première partie est consacrée à étudier le comportement asymptotique de la fonction caractéristique de la statistique Nous démontrons en particulier que celle-ci peut être bornée pour les grandes valeurs de l'argument parcn“'^ où c et /c sont des constantes positives.
Dans la seconde partie, nous utilisons le lemme de lissage de Esséen et le
résultat de la première partie pour établir une borne de Berry-Esséen pour la
statistique Nous démontrons que la fonction de distribution de ne
s'écarte pas de celle de la normale standard de plus de 0(n“^/^ ). Ce résultat
permet en particulier de borner le terme d'erreur pour les tests d'hypothèses
déeris ci-dessus.
CHAPITRE II
COMPORTEMENT ASYMPTOTIQUE DE LA FONCTION CARACTERISTIQUE D’UNE STATISTIQUE DE RANGS
SERIELLE, LINEAIRE ET SIMPLE
2.1. INTRODUCTION ET RESULTAT PRINCIPAL.
Soient Xj, X
2,-; Xj, n variables aléatoires indépendantes de fonctions de densités de probabilité et de fonctions de répartitions respectives fj, f2,---, fn et Fj,
Fn-
Si X| n,X2 ndésignent la statistique d'ordre associée à Xj, X2,—, Xj,, alors la statistique des rangs sera définie par
(2.1.1.) Xt=X(n) t=l,2,...,n.
.Tl
On définit une statistique de rangs sérielle, linéaire et simple d'ordre k (un entier positif) par
(2.1.2.) T«=(n-k)-V2 ^ ^ b
" t=k+l t t-k
oùajj =(ani,an2,-,ann) et bjj = (bni,bn2,-,bnn ) sont deux vecteurs de nombres réels (scores).
moyenne et la variance de sont notées
(2.1.3.) et (a*^^ f = a^().
Si désigne la statistique standardisée définie par
(2.1.4.) «
* fk') *
alors la fonction de distribution F^^(x) et la fonction caracténstique ^(u) de sont données par
F*(x) =P(T* <x) xeIR,
(2.1.5.)
4 00
Ee'“’n= Jei^dl-^) usIR,
— CO
où les espérances précédentes sont prises sous l'hypothèse d'indépendance II ci-
dessus.
On se propose d'étudier le comportement asymptotique de la fonction caractéristique ^^^(u) de T* |>our de grandes valeurs de l'argument u sous des conditions "raisoimables" sur les vecteurs scores et et sur les distributions de probabilité Fj, F2,---> Fn de Xj, X2, Xjj. Celle-ci sera d'utilité majeure pour établir une terne de Berry-Esséen et un développement d'Edgeworth pour la distribution de la statistique .
Exemple CoefiBcient d'autocorrélation de Spearman-Wald-Wolfowitz d'ordre 1.
(2.1.6.) =(n-l)
n Z t =2
(n) Tj(n) R n+1n+1
t -1
moyenne et la variance de sous l'hypothèse d'indépendance et d'équi- distribution s'écrivent
ET<»=(n-l)*/2
" 12(n+l)
(Sf)2+sj'>l+[n(n-l)] (n))2_s(n)j
où =^j = n(n + l)/2 ,
Sf =n(n + lX2n + l)/6, 1
=n(n + l)(2n + l)(3n^ +3n-l)/30 .
Ainsi, lorsque n —» + 0(n~') .
cf. IlALLiN et M
elard(1988).
□
Nous supposerons dans la suite de ce chapitre que est borné. Cf.
l'exemple ci-dessus et le lemme 3.3.8 qui donne une estimation de dans le cas de variables aléatoires indépendantes et éqmdistribuées. Cette condition, nécessaire pour la validité de la plupart des résultats de ce chapitre, est satisfaite dans presque tous les cas usuels.
Dans un premier temps nous allons traiter le cas d'une statistique de rangs sérielle, linéaire et simple d'ordre k = 1 (cf. théorème 2.2.1). Ensuite le résxütat obtenu sera généralisé dans les corollaires 2.1.2 et 2.1.3 au cas d'un délai quelconque k > 1.
Notations et conditions techniques
Condiüon (II.1). Un vecteur score = (anl>^n2’—’®nn ) vérÿ/e la condition 01.1)57/ existe des nombres strictement positifs diet K tels que
(2.1.7.)
n Z j-1
*nj — an 5; an Z (anj-an)^^An
j=l
où din = — i est moyenne arithmétique des scores aj^|,aj^2»-->^nn- 1
«j=l
ConÆiion (11.2}. Deux vecteurs scores §j^ = (a^j,aj^2>-"5^nn )
-n - (^nl’^n2>-"’^nn ) vérifient cette condition s'ils sont concordants, c'est à dire pour tout entiers ie/j, l^i,j^n
( 2 . 1 . 8 .) ani <=>bni ^b^j.
Pour f >0, soit y(ani,an2»- ^ mesure de Lebesgue X du f-voisinage de l'ensemble {aui,an25 ->ann}5 c'est à dire
(2.1.9.) y(ani,an2, ",ann î f) = X{x e IR: 3 j, 1 ^ j ^ n/ X -a nj <f}-
ConÆûon (II.3). Un vecteur score (ani,aj^25-“>ann ) vérifie la condition (II.3) s'il existe ô > 0 et f ^ n~^^^Logn tels que
( 2 . 1 . 10 .) y(anhan2»"-jann7f)^^fl'-
Cette dernière condition a été utilisée dans A
lbersB
ickelet
vanZ
wet(1976) et dans B
ickelet
vanZ
wet(1978) lors de l'étude de statistiques de rangs pour des problèmes à un échantillon et à deux échantillons. Elle permet de s'assurer que les scores anl»^n2’—’^nn concentrés autour de trop peu de points et par conséquent d'éviter que la distribution de ne soit trop "proche" d'une distribution dégénérée.
CondUion (II.4). Les fonctions de densités de probabilité respectives fi,f2,...,fn des variables aléatoires indépendantes sont telles qu'il existe une fonction de densité de probabilité f et une suite de nombres réels (Cn)» décroissante
et admettant pour limite zéro, telles que lorsque n —^
( 2 . 1 . 11 .) (ft(x)-f(x))^
f(x) dx ^ n
Pour un vecteur (X^”\x^"V--»Xj^^) de variables aléatoires indépendantes de fonctions de densité de probabihté marginales respectives fin’f2n’-"»fnn ’ ^ condition (H. 4) permet aux résultats de se chapitre d'être valables aussi bien sous l'hypothèse d'équidistribution fjjj = f2n = ••• = fnn = certaine densité que sous des alternatives contiguës dans le sens que la suite de distributions conjointes nf=ifin(Xi) est contiguë à la suite nf=ifn(xi) où (xi,X2,.-v,Xn)eR.
Par exemple, dans des problèmes de position des hypothèses contiguës peuvent être de la forme
H^; fin(x) = ... = fnn(x) = f(x) contre
Hi: fjn(x) = f(x-<?in) l<i<n avec f une densité spécifiée et max = 0(n~^/^).
OOSTERHOOFF et VAN ZwET (1979) ont montré que la condition de contiguïté ci-
dessus est plus forte que la condition (B. 4).
Soit Tfi une statistique de rangs sérielle, linéaire et simple d'ordre un. Pour tout réel
U,on définit la fonction caractéristique v’n(^) de la statistique centrée par
(2.1.12.) ^n(u) = Eexp{iu(Tn-Ain)}
où Ain désigne la moyeime de Tn sous l'hypothèse H.
THEOREME 2.1.1.
Pour une statistique de rangs sérielle, linéaire et simple d'ordre un de la forme
Tn = Z bnRj")
t=2 t
où n^2, §n =(ani,an2»->^nn) ^n = (bni,bn2> -,bnn) sont deux vecteurs scores.
On suppose que
(i) il existe des nombres strictement positifs a, A, b et B tels que la condition (II.1) soit vérifiée pour les deux vecteurs de scores .
(ii) ces deux vecteurs de scores vérifient aussi la condition (H. 2).
(in) il existe ô > 0 et f ^ n Log n pour lesquelles les vecteurs scores
§n =(^npan2»->ann) ^n = (bni,bn2,...,bnn ) /o co«iùùo« (H.3).
(iv) il existe une fonction de densité de probabilité f et une suite de nombres réels (£n) décroissante et admettant pour limite zéro, telles que (II.4) soit satisfaite.
Alors, sous l'hypothèse d'indépendance H, il existe des nombres strictement positifs c, C et X ne dépendant que üfe a. A, b, B, ô et (Cn) tels que pour Logn |u| ^ c
(2.1.13.) lq>n(u)| ^
□
COROLXAIRE 2.1.2.
Pour une statistique de rangs sérielle, linaire et simple de délai quelconque k entier ^ 1, définie par
(2.1.14.) T®=(n-k)-l/2 X anRÎ")bnR;") . avecn>k+l.
" t=k+l t t-k
Si la fonction caractéristique ^ est donnée par (2.1.15.) (p^‘^>(u)=Eexp{iu(T®
où désigne la moyenne sous l'hypothèse H.
Alors sous l'hypothèse II et les conditions (i),(ii) (iii) et (iv) du théorème 2.1.1, il existe des nombres strictement positifs c,C et K ne dépendant que a, A, b, B, ô et
(£jj) tels que, pour Logn ^ |u| ^
(2.1.16.) <Pn^(u) <Cn-’^Logn
□
COROLLAIRE 2.1.3.
Plus généralement, soit une statistique de rangs sérielle, linaire et simple, de délai quelconque k entier ^ 1, àe la forme suivante:
(2.1.17.) =(n-k)”^/^
n
Z .( 0 )
t=k+l nR (n)
t nR (n) t-1
,(k-l) nR (n)
t-k+1 nR (n)
t-k
où n>k+l et a^'^ “ (^nP^n2’"'’^nndésignent (k+1) vecteurs scores.
La fonction caractéristique est définie par (2.1.15.) ci-dessus où est remplacé par sa nouvelle expression dans (2.1.17.).
Sous l'hypothèse IL si on suppose que
(i) il existe des nombres strictement positifs a® et A*-’^ (0<i<k) tels que la
condition (H.1) soit vérifiée pour les (kt 1) vecteurs scores.
(ii) ces (k+1) vecteurs scores sont deux à deux concordants (cf. condition 11.2/
(iii) il existe ô>0 et ^^^Logn pour lesquelles les vecteurs scores
^^nP*n2’‘"’®nn ^ ^ i ^ k) vérifient la condition (H.3).
(iv) il existe une fonction de densité de probabilité f et une suite de nombres réels (E
jj) décroissante et admettant pour limite zéro, telles que II.4 soit satisfaite.
Alors, la conclusion du corollaire précédent énoncée dans la formule (2.1.16.) reste vraie.
□
Les conditions du théorème 2.1.1 et des corollaires 2.1.2 et 2.1.3 peuvent êtres allégées sous l'hypothèse H
qselon laquelle les variables aléatoires Xj, X2 , Xjj sont indépendantes et équidistribuées suivant une même loi de probabilité continue.
Nous énonçons ce résultat dans le théorème suivant.
THEOREME 2.1.4.
Soit une statistique de rangs sérielle, linaire et simple, de délai quelconque k entier ^ 1, de la forme suivante:
(2.1.18.) =(n-k)"^/^ X a(k)
t=k+l nRf
OM n > k + 1 et a® = (Snl’^n2’"'’^nn ^ ^ k;), désignent (k+1) vecteurs scores.
Soit q)^^ la fonction caractéristique définie par
<p(^k)(u)=Eexp{iu(T®
où désigne la moyenne sous l'hypothèse H
q. On suppose que
(i) il existe des nombres strictement positifs a^*^ et A® (0 ^ i ^ k) tels que la condition (U. 1) soit vérifiée pour ( k +1) vecteurs scores.
(ii) ces ( k +1 ) vecteurs scores sont deux à deux concordants (cf. condition (II.2).
Alors, sous l'hypothèse nulle H
q, il existe des constantes strictement positifs c, C et K ne dépendant que «sfe a, A, b et B tels que, pour Logn ^ |u| ^ cn^^
(2.1.19.)
□
2.2. RESULTATS PRELIMINAIRES
La démonstration du théorème 2.2.1 sera décomposée en plusieurs étapes intermédiaires. Nous commençons par énoncer l'inégalité de Bernstein, celle-ci sera la clé des démonstrations de plusieurs résultats de cette section.
LEMME 2.2.1. INEGALITE DE BERNSTEIN
Si est une suite de variables aléatoires indépendantes de moyennes nulles et de variances finies, il existe une constante réelle c telle que pour tout réel positif 6
q
2 (2.2.1.) P(|Xi +X2 +...+Xn | ^ l-2exp(-—--- -)
ZJ l 5 j | 4-
C(/
où B„=E(ÎXi)^.
i=l
Preuve.
Voir par exemple Korz, J
ohnsonet R
ead(1982), R
enyi(1970) ou S
avage(1961).
□
COROU.AIRE 2.2.2.
Soient Yj,Y2,...,Yj r variables aléatoires indépendantes et de distributions de Bernoulli de paramètres respectifs 7rj,7r2,-.,7rj..
Si on pose
tt= ^J
tT
jet Bj = 7rj(l -
tT
j), alors il existe une constante c telle que pour tout réel positif a < 7t
P(Y ^a) ^l-2exp{ —(7T-a)^/(2Bf +c(7r-a))}.
Preuve. D'après l'inégalité de Bernstein, il existe une constante c telle que pour tout 6 >Q
P(ZÎ(Yi-7Ti) ^0)^l-2exp{-0V(2Br +c0)>.
Maintenant, il suffit d'appliquer l'inégalité précédente pour 0 =
tt- o: après avoir remarqué que
P(i:ÎYi >7T-0)^P( ZÎCYi-TTi) ^d).
□
Dans la suite, sauf dans les démonstrations des corollaires 2.1.2 et 2.1.3 où on mettra l'accent sur les généralisations de la preuve du théorème 2.2.1 à im délai quelconque k, et afin de simplifier les notations, nous supprimons les suffixes supérieurs (n) et (k) dans l'écriture de et noterons aussi aj, bj et a^^^ les scores a„j, bj^j et a^^ (pourO ^ i ^ k et 1 ^ j < n).
Factorisation de la statistique
Soient [x] le plus grand entier inférieur ou égal à un réel x et I{Q} la fonction indicatrice d'un ensemble Q. Posons
(2.2.2.) ni =[n/2J , nj =[ni/2] , n3 =[(ni -l)/2]
et décomposons la statistique Tjj en deux termes
où
(2.2.3.)
(n-l)>/2T„=T„,+T„j
ni
Tnl ’
ni-1
Tn2 = 2^aR2t+l^k2t +^Rn*’Rn-l
I
æsstatistiques T^i et 7^2 peuvent encore s'écrire sous la forme suivante:
1 n2
(2-2-4.) Tni =- Z (^R4
i+^R4t-2 ^^R4t-I
^
t = l
1 ri2
+ 2,^/^R4t "^R4t-2^^R4t-l ~^R4t-3^
^
t=l
+ ^Rnj ^Rn,-1 {"limpair}.
(2.2.5.) 1 "3
Tn2 = - Z (aR4t^i + aR4j_jXbR4t+bR4j_2) t=l
1 113
+ T ^ (aR4t+i~aR4^_j)(bR4j-bR4j_2)
^ t=l
+ aR„bR„_,{nimpairJ.
Maintenant, pour t = 1, 2,..., n3, on définit les variables aléatoires et Dj comme suit:
(2.2.6.) Pt f4t-2(^4t-2)f4t(^4t)
f4t-2(^4t-2)f4t(^4t) + f4t-2(X4t)f4j(^4t-2) (2.2.7.) Dt =(a4t -a4t-2Xb4t-l -b4t-3)+(24t+l ~a4t-lXb4t -b4t-2)-
LEMME 2.2.3.
Pour tout U elR et n'^6 , si 03 = [([n/2]-l)/2], alors sous l’hypothèse H
(2.2.8.) |v?n(u)| <E II{l-2pt(l-Pt)(l-cos((n-l)-^2^o^))jl/2 t=l
Preuve.
Pour t = 1, 2, ..., n3 , si on pose
Ut =min(R4t_2 2R4t) ^ = max (R4t_2 , R4t).
alors, conditionnellement à la statistique d'ordre Xi.n,X2 n, -,Xn:n couples (Ut, Vt ), t = 1, 2,..., 03, les paires {X4t_2 >X4t} sont globalement déterminées, mais on ne sait pas quelle est la valeur prise par X4t_2 ou par X4t. E>e façon plus précise, les n3 couples (R4 j_2 ,R4j ) sont conditionnellement indépendants et prennent les valeurs ( Ut, Vt ) et ( Vt, Ut ) avec les probabilités
(2.2.9.) Pt =
f4t-2(Xut ;n)f4t(X Vt ;n)
f4t-2(Xut:n)f4t(Xvt:n)+f4t-2(Xvt:n)f4t(Xut:n)
et (1 - Pt) respectivement.(cf. le théorème de la page 36, Hâjek et Sidâk,1967).
Maintenant, conditionnellement par rapport
à la statistique d'ordre Xi n, X2;n,—.Xn;n notée X,.jj à l'ensemble 9?i défini par
3îi == { Rt : t impair compris entre 1 et n}
Rj^.i si n impair, Rn,-i si n| impair, Rnj-2 et à l’ensemble (U , V ) des couples (U^, ), t = 1,2,...413 ;
les termes suivants [voir factorisations dans les formules (2.2.4.) et (2.2.5)]
où W{ , pour t = 1, 2, ..., n3, sont des variables aléatoires indépendantes définies par sont (conditionnellement) constants.
De plus, on a
(2.2.10.) |Eexp{iu(Tn-yUn)}/X.;n,9ei,(U.,V.)|-
= IÎ|Rexp(iiu(n-l)“^/^{(bR -bR4^_3)(avt -au^)
t=l ^
+ (2R4t+i -2R4t-i)(^Vt -but)}Wt)l
1 si (R4t_2,R4t) = (Ut,Vt) -1 si (R4t_2,R4t)=(Vt,Ut)
et telles que P(W| = 1) = 1-P(W| = -1) = Pj .
Ainsi, l'expression (2.2.10 ) devient
|Eexp{iu(Tji -/in)}/X.;n,9îi,(U. ,V.)|
"3
t=i n n{l-2Pt(l-Pt)(l-cos(u(n-l) -bR^^_3)(avt -auj)
+ (“R4t+l -“R4,-
i)(*>V, -bu,)»)}'/".
Le résultat du lemme 2.2.3 s'obtient en remarquant que pour 1 ^ t ^ n3 Pt(l-Pt) = Pt(l-Pt)
Pt| = (avt -aut)(b4t-i-b4t_3)+ (a4t+i-a4t_i)(bv^ -bu^)
□
Considérons les nombres réels dj,...,djn et pi,...,Pu, avec 0<pt <1 pour 1 ^ t < m.
Pour f>0 et 0<£<i , soit y(dj ,...,dj„ ;pj ,...,Pj„ ; f ,£) la mesure de Lebesgue X du f-voisinage de l'ensemble de ces d^ pour lesquels le p^
correspondant vérifie £^pt <l-£, c'est à dire (2.2.11.) y(di,...,d m >Pl 5-">Pm j f>^)
= X{xelR:3tl^t^m/|x-dt|<fet£^Pt ^l-£}.
LEMME 2.2.4.(
vanZ
wet, 1982)
Supposons que des nombres réels positifs d, D, ô' et £ existent tels que
m „ m
(2.2.12.) ;^pt(l-pt)d^ >dm, xdJ<Dm,
t=l t=l
(2.2.13.) 7(di,...,dn,;pj,...,pjn;f,£)^ô'mr,
pour un certain ^ m^^'^^Logm.
Alors, pour tout Cj > 0 , il existe des constantes C2 > 0, C > 0 et x > 0 ne dépendant que de d,D,ô',£etCi, telles que
(2.2.14.) n{l-2pt(l-pt)(l-cos(m“^/^udt))}*/^
t=l
pour cjl^gm ^ |u| ^ C2 m^^^.
UiMMK 2.2.5.
ScMs la condition (iv) du théorème 2.1.1, si les (pt), t = l,2,...,n3, sont donnés par la formule (2.2.6.), alors pour tout £ e ]0, ^[ ef 77 e ]0 , , il existe Cj et
kjdes nombres réels positifs tels que
(2.2.15.) P(£ < < 1 - £ pour au moins [rjnj indices t ) ^ 1 - Cje -Kin
Preuve. Pour t = 1, 2, ..., n3
E|2pt-l| = E{ |f4t-2(^4t-2)f4t(^4t)~f4t-2(^4t)f4t(^4t-2)|
f4t-2(X4t-2)f4t(X4t)+f4t-2(X4t)f4t(X4t-2) }
et puisque le rapport precedent est symétrique en X4t_2 et X4^ , on trouve
E|2pt -1| = ^ Jj|f4t-2(x)f4t(y) -f4t-2(y)f4t(x)| ‘ix dy
< J|f4t(x)-f4t_2(x)|dx.
D'autre part, d'après l'inégalité de Markov on a P(Pt €[£,]-£])=P(|2pt-l|^:l-2£)<
Maintenant, on utilise la condition (iv) pour avoir
flUt-Ut-2 N ■” Z J|ft -f| ï Z J s ef ■
nt=H I
Ainsi, on obtient
(2.2.16.) 113 n
5;P(Pt 6
é[£,1-£])^
t=i l-/e
Par ailleurs, si pour 1 ^ t < 03 on définit la variable aléatoire par fl si Pt e[£,l-£]
''■H . 1^0 smon
alors sont des variables aléatoires indépendantes de distributions de Bernoulli de paramètres respectifs 7rj,...,7rn^ donnés par =P(Pt
1 ^ t < n3-
Pour TJ e ]0, i[, on pose
tj^ = -i(l -
tj) et comme 0 il existe im entier positif n^ tel que si n > n^, on a
Q e ' 1/2
— +--- ^ TJo- 4n 1-2£
Par conséquent, d'après (2.2.16.)
♦ n£ ' 1/2
Xf3«-j_[îyn] ^n3-^-^-n7j-l 1/2
n-5 n£^
^ ---UTJ - 1 4 1-2£
1 9 .V2
>n{(j-îj)-—
4 4n l-2c
^nrjo.
ainsi [îjn] < TTt • De plus on obtient aussi
- [H*}' .1/2
2Zf^^t(l-’rt) + c{Zf^7Tt-[îjn] }
Maintenant, d'après le corollaire 2.2.2 on a
P(e^Pt <l-£ pour au moins [îjn] indices t) = P(^J^3Yt 2:[i?n] )
^l-2exp-(^J*3 7c^ -[î7n]V/{2Zr^^t(l-^t) +c(^:J’3 7rt -[ï7n] )>
où Cjn^ =2 et n +ci7o>-
La démonstration du lemme s'achève en remarquant que pour tout n < n„ il existe des nombres positifs C| jj et /c tels que
Rappelons que sous l'hypothèse H étudiée, Xj, X2, ..., X„ sont des variables aléatoires indépendantes et de fonctions de densité de probabilité respectives fj, f2,..., f„. Afin de simplifier le reste de la démonstration du théorème 2.1.1, nous évoquons un lemme de VAN ZWET (1982) qui permet de ramener le modèle initial de l'hypothèse H au cas de l'hypothèse nulle Hg selon laquelle Xj, X2, ..., X„ sont des variables aléatoires indépendantes et équidistribuées suivant la même fonction de densité de probabilité f. Notons P et E (respectivement Pg et Eg) la probabilité et l'espérance sous H (Hg).
IJiMME 2.2.6. (VAN ZWET, 1982)
Sous la condition (iv) du théorème 2.1.1, pour tout événement A dans la a- algèbre engendrée par Xi,X2,...,Xjj on a
et en prenant Cj = et /cj = min «in-
n<rio
□
(2.2.17.) P(A)^2{e"^nPo(A)}'/2
□
r 1 *
Notons [xJ le plus petit entier supérieur ou égal à im réel x.
LEMMI-: 2.2.7.
Sous les conditions (i) et (ü) du théorème 2.1.1, il existe ôj >0 , et deux sous ensembles et
\2dans {l,2,...,n} vérifiant
* * . cardij ^[ôjn] cardl2^[ôin] 5} = min ( et tels que, pour tout ( tj , t2 )^Ii x I2. on a
a
®l2 ^ ou
64A 64B
»tl -at2 ^-4 (2.2.18.) et
bt2 ^4 ou btj -bt2
Preuve. Soient a(j),a(-2),---5 et bj-j^,b(^2)v"j^>(n) nombres (at)et(bt) classés par ordre croissant. Pour t = 1,2,..., ni-[n/2], on pose
“t =2(n-t+l) ~®(t) = ^(n-t+1) “*^(1)
Si a et b désignent les médianes respectives de (aj.) et (bt), alors on a
ni ni m ~
Z«t = Z(a(n-t+l)-a)+ Z(a-3(t))
t=l t=l t=l
De plus,
= Z |at -
t=i
a
n - n ~ JJ ~
Z l^t -a| < Z l^t -a| +n |a-a| ^2 ^ l^t -a| .
t=l t=l t=l
De là, on obtient
"2 1^1 “1
(2.2.19.) Z«t ^X Z |at-a| ^an/2.
t-1 2t=i
D'autres part, on a
"2 2 "2 n2
Z ^ 2 X (a(n-t+l) -a)^+2 2: (a(t) -a)^
t=l t=l t=l
( 2 . 2 . 20 .)
<2x(at-a)^
t-1
^ 2An.
Ixs relations (2.2.19.) et (2.2.20.) pennettent de conclure que, pour t <[ôan] et
a^ a
Oa =--- , ona «t
“ 64A 4
. X a
c est a dire aj-^-t+i) - ^ — •
Sinon il existerait t^ < [ô^n] tel que
«t < —• 4
Et comme (a^) est une suite décroissante, on aurait les inégalités suivantes a >a* ■to + 1 > ... >(x n2 ■
Ainsi, on pourrait écrire
n2 to-1 Ï 12
Z«t = Z«t + Z«t t=l t=l t=to-l
1 to~l
—7 Z «jHn 2 -to+l)7
to-1 t=l 4
to -1 t=l 4
•/2 an
^{ 2 An(to-l)> +-7 O
^ {2Ana^n/64A}
8
an
De façon analogue, on peut démontrer que pour t < fô|,n] et = 64 B
4
c'est à dire ^(n-t+1)
Soient maintenant ôj = min ,0^ ) et 11 la permutation qui permet de ranger (a^.) et (bj) par ordre croissant; la permutation n est la même pour (a^) et (b^) d'après la condition (ii), c'est à dire
»(t) =an(t) et b(t)=bn(t)- Rnfin les ensembles d'indices
( 2 . 2 . 21 .)
Il =ir^l,2,...,[ôinf},
I2 = Il ^{n-[ôin] +l,n-[ôin] +2,...,n}
— 1 r
1*
vérifient les conditions du lemme 2.2.6, car si si = Il (ti) avec 1 S ti < [ôinj et S2=n~Xt2) avec 1 < t2 < [ô)n] , alors on a
^S2 ^sj ~^(n-t2 + l) ^(ti)
^ ^(n-t2+l) “^(t2) ti <t2
^3(n-ti+l)si tl ^*2
^min(atj
a 4 De la meme manière, on démontre que
Ceci achève la démonstration du lemme 2.2.7.
n
lÆMME 2.2.8.
Sous l'hypothèse H, si les conditions (i), (ii), (iii) et (iv) du théorème 2.1.1 sont satisfaites, il existe des nombres réels positifs C
2et
k2ne dépendant que de A, b, B, ô et (£„) tels que
(2.2.22.) P(y(Di,D2,...,Dn3;O^Ô2nf)^l-C2e-’^2n _
Preuve.
D'après le lemme 2.2.7, il existe ôj >0 et deux ensembles d'indices Ij et I2 dans {l,...,n} vérifiant
cardii >[ôin]* cardl2 ^[^in]
â
l)
où ô] = min (--- ,--- ), et tels que pour tout
‘ 64A 64B
hi,
(tl 5 *2 )^Il ^^2
b 4 ■ Posons
(2.2.23.) r = ôh
3Ïr+8 et ô'
ôôî
n
et fixons R3,R7,...,R4t_],...,R4r_i dans l'ensemble {1, ..., n}. En laissant aléatoires les valeurs de R4^ et R4t-2 1 ^ t ^ r, on construit y(D],D2 ,...,Dj ;f) par récurrence en choisissant successivement et sans remplacement les valeurs de Ri,R5,...,R4t+],...,R4r+i-
Supposons avoir déjà choisi les valeurs de Rj, II5,... ,R4(k-i)-fi dans l'ensemble {1, ..., n}\{R3,R7,...,R4t_j,...,R4r_i>. Alors, on a
(2.2.24.) y(13i,D2 ,...,Dk;f) =
t(D
i,D2 ,..., Dk_i ;n+2f ,
sauf si lD]^-Dt | <2f pouruncertaint ^k-1, c'est à dire saul' si
k-L r
(2.2.25.) Dk e U ]Dt-i-2f,Dt_i+2f[
Maintenant, si R4j etR4t_2 sont tels que bR4k -^R4k-2 alors la relation (2.2.25.) restreint
jà un ensemble aléatoire Aj. formé de la réunion de (k-1) intervalles aléatoires de longueurs inférieures ou égales à 16 f/b et par conséquent l'ensemble des aj. dans Aj,- a im f-voisinage de mesure de Lebesgue ne dépassant pas (k-l)a6f/b + 2f).
D'après (iii),
(2.2.26.) #{t:at «Ak } ^--{ônC-(k-lX16f/b+ 2f)>
= ~-(k-l)(l + 8/b).
Notons Pg la probabilité conditionnelle sachant R3 jRy, ...,R4i._i et Rj, R5,..., R4(k_i)+i (indices déjà choisis ou fixés).
Pc(^R4k+i ^ Pc(^R4k+i ^^k^|^R4k ~^R4k-2
><Pc(l^R4k -^R4k-2 1^4^
an/2-(k-l)(l + 8/b)-(r+k-l) 2Ôin(5i n-r-k+ 1)
^ n-(r + k-l) (n-r-k+ l)(n-r-k)
^(^_I(3 + -S}{2ôi(di- —)}
2 n b n
^ÔôJ/4.
(cf. formule (2.2.23.)).
Comme aR4k+i ^^k iinpüque que 2f s'ajoute à la k^*^^ étape, on voit que 7(U
i,D2 ,...,Dj-;f)/2f est stochastiquement supérieur ou égal à une variable binomiale de paramètres r et ôô j ^4 (notée B( r, ôsJ/4)).
Maintenant, comme
y(Dl,D2> -5 I^n3 >f) ^ 7(Di,1^2>-if)’
d'après le corollaire 2.2.2 on a
P( y(Di,D2,..., D„3 ;0 > Ô2nf) ^ P( y(Di,D2,...,;f)/2f ^ «2 «/2)
^ P(B(r, 66j /4) ^ Ô2 n/2)
r68? , rSÔ? 55?
roOi O / roo< oo<
rô5, j^5_
Et puisque rxôôj = Ô2n (cf. formule (2.2.23.)), il existe C2 >0et «2 que
P(y(Di, Ü2 ; f ) ^ Ô2N O ^ 1 - C2e-’^2N
□
LEMME 2.2.9.
Scms l'hypothèse H, si les conditions (i), (ii), et (iv) du théorème 2.1.1 sont vérifiées, il existe Ô4, C3 et x 3 des réels strictement positifs, tels que
(2.2.27.) P( |D^ I ^ -- pour au moins [Ô4n] indices t ) ^ 1 - C3e~’'^3J^_
Preuve.
D'après le lemme 2.2.7 il existe ô] > 0 et deux ensembles Ij et I2 de la forme
11 =ir^{l,2,...,[ôin]*}
12 = n '{n-[ôin] +l,n-[ôin] +2,...,n}, tels que, si R41 el2 et R4t-2
^R4t ■“®R4t-2 ^4 *’R4t ~^R4t-2 ^4’
D reste donc à estimer l'ordre de grandeur de aR4i_j,i j et
^R4t-i -*’R4t-3-
Remarquons d'abord que
n ni n
Zat = Zat +
t-i t=l t=:ni4l (2.2.28.)
n ni n
Zbt = ZW + j;bt ^bn t=l t=l t=ni + l où 0| = [n/2].
Quatre cas sont possibles
an *^1. bn
(a) Zat et M
IVJ
1t=l 2 t=l ^
an n bn
(b) Z»t et Z bt
t=l 2 t=ni+l ^
an bn
(c) Z at > — et Zbt^—,
t=ni+l ^ t=l 2
J' an n , bn
(d) Zat^ — et Z bt
t=ni+l t=ni+l ^
Pour r = [830/8] avec Ô3 donné par
(2.2.29.) Ô3 ôi 1 . , ; min (
4 4 64A 64B ),
sous H
qet sachant Rj,... ,R4^t_i), on calcule la probabilité conditionnelle pour qu'on ait ^ --- dans chacun des quatre cas précédents. 2lt)
cas Supposons que (a) est vrai, c'est à dire
an bn
et
t=l ^ t=l ^
D'près (i) on a aussi
ni , ni
X aj An et ^Bn .
t=l t=l
Encore, d'après le lemmc 2.2.7, il existe deux sous ensembles de {1, 2, ..., n}
Il 1 et Ij 2 i à savoir
lu =Il'Ml,2,...,[Ô3nf},
Il 2 =n~^{ni -[Ô 3 n]* +l,ni -[ 630 ] + 2 ,...,ni>.
de cardinaax
(2.2.30.)
11 I #
= [Ô3n] , et tek que: si tj elj j et t2 el| 2, alors
at2 ~^ti “^ti
g t2 8
n suffit donc de prendre
Il3 = {n-[Ô3n] +I,n-[ô3n] +2,...,n}
pourquesi R4t_3 elii R4t_ieli2 et R4t+ieli3,
on ait ®R4t+l ^R-4t-l ^R4t-1 *’R4t-3 ^ 8
deuxième inégalité provient de la formule (2.2.30.), cependant la première peut être justifiée comme suit:
R4l_f^l elj3 et R4^_j el| 2 impliquent, qu'il existe tj, t2 tie{n-[ô3n] +l,n-[Ô3n] +2,...,n}, t2 e{ni -[Ô3n] +l,ni -[Ô3n] +2,...,ni>
tels que R4t+i = rr"*(ti) et R4t_j = Il“^(t2), et par conséquent
aR4t+i -»R4t-l ^^(tl)“^(l2)
Ainsi, on obtient ^ ^ probabilité (conditionnelle) supérieure ou égale à
[ôinf[ôinf[Ô3n]*([Ô3n]*-l)([g3nf-l-^(t-^)) n^ -4(t-l)
2 28^
car 4(t -1)< 630 / 2 .
2®me cas Supposons que (b) est vrai, c'est à dire
an n bn
et .
t=l
^t=riiil
^D'après (i) on a
ni ™ 7
2; < An et 2 b[ ^Bn.
t=l t=ni ^ 1
Dans le cas précédent, on avait si tj elj j et Î
2elj 2> alors
^t2 ~^ti ■
n suffit de prendre dans le cas présent I2 1 ,122 et I2 3 de la forme suivante:
121 =rr>{l,2,...,[Ô3n/2]*},
1 22 = rr'{[ 630 / 2 ]*+ 1 ,..., [ 630 ]*},
^23=^^ ^{O]-[ 030 ] + 1 , ...,ni}
pour que si R4t_3 el2 1 ^41-1 ^^2 2 ^41 i l ^^2 3 ’
l)
Ainsi, on obtient ^ ^ probabilité (conditionnelle) au moins égale à
[8,n]‘[S,n]*[S3n/2]“([«311/2]*-IX [«3"]' "4(1 -1» ^ ,,5
- — ^ ZO^ .
n^-4(t-l)
IvCS deux cas restant (c) et (d) se traitent de façon analogue.
De là, pour 1 < t < r = [630/8] , on obtient ab
Po(^t ^22 / ^1’■■■’^(4t-l) 3 I)
Donc le nombre d'indices t < r pour lesquels [D^ | ^ — est stochastiqucment supérieur, sous , à une variable aléatoire de distribution binomiale de paramètres r et 26^.
Et puisque 2 rÔ 2 ^ 2640 ,
avec 6 4 de la forme
(2.2.31.) Ô4=Ô^/8,
en utilisant le corollaire 2.2.2, un raistmnement analogue à celui qui a permis d'achever la démonstration du lemme précédent montre qu'ü existe C3 et
ac3, des réels strictement positifs, tels que
Po(]Dt I ^ — P®***" moins [640] indices t ) ^ 1- C3 e“'^3 La démonstration de ce lemme s'achève en utilisant le lemme 2.2.6.
□
Preuve du théorème.
Dans cette démonstration, nous allons adapter la méthode que VAN ZwET (1982) a utilisé pour établir le même résultat dans le cas des statistiques non sérielles.
Pour n ^ 6, on pose
Ô 5 = jmin(^|,Ô 4 ), Ô-= 02 / 100 ,
D = {(A+B)/Ô5 }\ d = e(l -e)(ab)22-^Ô4 , (2.2.32.) J={teIN/l<t^n3 et
m = IJI (cardinal de J), nj =[([n/2]-l)/2].
Pour 1 < t < n3, d'après la relation (2.2.7.), on a
l^tl = l(34t “^4t-2)0’4t-l “t*4t-3)+ (®4t + l “®4t-lX^4t ~^4t-2)|
^(»4t -a)^+(a4t_2 -a)^+(a4t+i -a)^+(a4t_i -af+
+ 0>4t-l -b)^+(^4t-3 -b)^+0’4t -b)^+(b4t_2 -b)^
Donc
f‘3, z|i)t
t=l
^ 2(at -a)^+ 2(bt -b)^
t=l t=l
^(A+B) n.
D'autres part, on a
#{t^J}xD^/'* ^ Z|Dt|^ 2|l^tl^(A+B)n,
tgJ t=l
n3 - m ^(A + B)n
- d V^ = Ô5n.
Ainsi, on obtient
(2.2.33.) n3-Ô5n^m^n3.
Maintenant si n ^ 6, on a
(2.2.34.) ^Sn5=[([n/2]-l)/2]£Î
et comme on peut voir facilement que ^5 ^ ^ (2-2.29.), (2.2.31.) et (2.2.32.)], on obtient aussi
(2.2.35.) n n
— < m ^ -
20 4
Pour 0<£<-etf = n ^^^Logn définissons l'événement F comme suit:
2 ^
1
*(2.2.36.) F-{£^pt<l-£ pour au moins [(--Ô5)n] mdicest}
n{7(Di,D2 ,-,Dn3 ;f)^ Ô2n f>
dl) itc
n{|Dt I ^ ™ pour au moins [Ô4 n] indices t }.
Alors, par application du Icmme 2.2.5 en prenant 7] = — - Ô5 et des lemmes 2.2.8 et 2.2.9, on obtient
(2.2.37.) P(F)>1-C4e“’^4n
ou C4 = Cj-I-C2+C3 et /C4 = min(K],K2,«3 )
sont des réels strictement positifs ne dépendant que des constantes a. A, b. B, ô, et de la suite (£„).
Par ailleurs, dans le sous ensemble F de notre espace échantillon, le nombre d'indices t e|l,2,..., n3} pour lesquels £:^Pt^l-£ et l^t|^~ moins égal à (Ô4 - Ô5)n, puisque le nombre d'indices t ne vérifiant pas l'une au moins de ces deux conditions est au plus égal à
«3 -[^4^]* +«3 -[(7-d5)n]*^n3 “(^4 -^5)n.
De plus la relation (2.2.33.) assure qu'au moins (Ô4 -2Ô5)n de ces indices sont dans J.
En outre (2.2.32.) (2.2.34.) et (2.2.35.) permettent d'obtenir, pour n'importe quel échantillon dans F, la relation suivante:
(2.2.38.) X Pt(l-pt)Dj ^e(l-e)(|^)2(Ô4-2Ô5)n>md.
teJ
De façon analogue, d'après les relations (2.2.33.) et (2.2.36.), on peut voir que dans F le nombre d'indices t vérifiant
t «J ou Pt ^[e,l-£]
est au plus égal à 2050.
Ainsi, la mesiare de Lebesgue X du f-voisinage de l'ensemble de ces D^ pour lesquels le p^ coirespondant vérifie £^Pt ^1 — £ avec tel vérifie
(2.2.39.) y(Dt, teJ;Pt, tel; t, £) ^ (Ô2 -4Ô5)nf
> Ô2mf
O
puisque ^ ^ et -^m^— (cf. (2.2.32.) et (2.2.35.)).
^ 8 20 4
Maintenant, si on prend f ' = m~^^^Logm et si m ^ 2, alors on a
100 r
Et comme y = y ( f ) est ime fonction non décroisante en f on a aussi y(Dt,t eJ; Pt,t e J; f', e) ^ y(Dt,t eJ; p^,t
gJ; f, e)
2--- 100
(2.2.40.) = ô'mr
cf relation (2.2.32), et puisque cette relation est aussi vraie pour m = 1 [cf.
(2.2.39.)] elle l'est pour n'importe quel échantillon dans F.
Enfin, d'après la définition de l'ensemble J [cf. (2.2.32.)], on a
(2.2.41.) X D? ^ Dm.
teJ
Nous avons montré que dans l'ensemble F les suites (D| ) et (pt ), t eJ, satisfont aux conditions du lemmc 2.2.4 avec les valeurs d, D, ô' et e qui ne dépendent que des constantes a, A, b. B, et ô et la suite (fin)-
Par application du lemme 2.2.4 avec Cj 1
2 on prouve qu'il existe des nombres réels positifs C2, C5 et K5 ne dépendant que de d, D, ô' et s tels que dans l'ensemble F
îl{l - 2pt(l - PtXl - cos((n - t=l
4 n {l-2p,(l-p,Xl-œs(m-'/2(.3^)i/2„d,))(‘/^
tel n-1
pour ~I_x)gm < ^ C2 m^/^.
De là, en utilisant la relation (2.2.35.), on voit facilement qu'il existe des nombres réels positifs C(5 et Kg ne dépendant que de C5 et K5 tels que dans l'ensemble F
(2.2.42.) îl{l - 2pt(l - PtXl - cos((n -< Cg t=l
pour Logn ^ |u| ^ cn^^^ avec c = C2 /20.
Maintenant, les relations (2.2.37.), (2.2.42.) et le lemme 2.2.3 permettent de conclure que pour n ^ 6 et Ix)gn < |u| ^ cn^'^^ on a
(2.2.43.) |(p„(u)| ^ Cg n-’^é Logn ^ C4 n-^^4 Logn
avec Cg=C4+Cg et Kg = min(K4 ,Kg).
Pour achever la démonstration du théorème, remarquons que pour 2 < n ^ 5, on peut choisir et pour que la relation (2.1.3.) soit satisfaite; et il suffit donc de prendre C = Ci+C2+C3+C4+C5+C6 et
k=/
c}+
a:2+«3+/C4+/(5+/C6 pour que celle-ci soit vérifiée pour tout n ^ 2.
□
Preuve du coroümre 2.1.2.
Si le délai k est impair, on pose nj = [ (n -k)/4].
La statistique de rangs sérielle de délai k définie en (2.1.11.) peut être factorisée comme suit :
où nll’ nl2’ n21’ n22 ^nl et sont données par ^
(2.2.44.)
'(k) 1
^nll ~ ■^^R4t+k-3^^ ^R4t-1 '^^«-41-3^
^
t=l
(k) 1
\l2 ~2 Z (aR 4 t_^j._i -»R4t+k-3^^ ^^4t-l ~^k-4t-3^
(2.2.45.)
(2.2.46.)
1
1 ni
^n22 " 2 ~ “ ^R4t-2 ^
= (n - k)*/^T^^
■r(k)^nll
•r(k) _ -yCk) _ ■y(k)
^nl2 ^n21 %22 ’
Remarque. est nul si (n-k) est un multiple de quatre, sinon il est au plus
composé des trois derniers termes de la somme
Deux cas se présentent
1. si k = 4p +1 avec P e N*, les statistiques qui apparaissent dans la décomposition ci-dessus peuvent s'écrire sotis la forme
fk) 1
\ll ^ ^®R4(t + p) ■^^R-4(t+p)-2^^ *’R4t-l ■^^R4t-3^
(2.2.47.)
• (k) 1
^nl2 “ ~^^4(t+p)-2^^ ^^41-1 ~^R-4t-3^
1
^!Î21 ~7 ^ ^^R4(t+p) + l‘‘’®R4(t+p)-l^^^R4t''’^^4t-2^
(2.2.48.)
1 ni
D'autre part, si on pose n2 =nj -p, encore décomposé de la manière suivante:
1 P
(2.2.49.)
T^22 ~2 ^/^R4(t+p>fl 2R4^^^p)_i)(bR4^ bR4^_2)
n22 2t=i
1 "2
t = l
■^2.?/^^4(t+2p)+l ^R4(t+2p)~l^^*’R4(t+p) ^R4(t + p)-2^- Ainsi, on obtient
(2.2.50.) T® . —Av xD®
nl2 n22 ~
7Z, t-J -2-^t "^^
02’
où, D^^ et Q^2’ 1 ^ t < n2, sont donnés par
“^®R4(t+p) ®R4(t+p)-2^^^R4t-l ^R4t-3^
+ (aR4(t+2p) Il “®R4(t+2p)-l^^’’R4(t + p) ”^J^4(t+p)-2 ^
(2.2.51.)
oO^) -T^) xT<^> _i V
^n 2 “ nl 2 ^n 22 9 '
^
t=l
Comme dans le cas d'un délai d’ordre 1 , on pose
~ (^4(t+p)’^4(t+p)-2)’
(2.2.52.)
= max(R4^(^p^ ,R4(-{_(_P^_2)- Maintenant, conditionnellement
à la statistique d'ordreX|.j^ ,X2 n aux rangs impairs 9îj,
rk") fk)
aux rangs qui apparaissent dans les expressions des restes Q^j et Q^2’
et aux couples ),1 < t < n2,
les termes T®, Qnl^ Qn2 (conditionnellement) constants (cf. preuve du lemme 2.2.3).
De plus, les ^ t ^ U2 peuvent s'écrire comme suit:
={(aR^^^ "^jK.41-3^
(2.2.53.) ^ ^
■^(^R4(t+2p)+i “^R4(t+2p>-l)^Ry(k) .(k) t
où (w^^),l$t<n2 sont des variables aléatoires indépendantes et identiquement distribuées vérifiant
P(w® =1)=1-P(w5‘^^ =-l) = pJ^> ,
(k)
Pt =
f4(t t p) - 2( ^y(k) ) ^4(1 + p)( ^.^^.(k) )
% f P)
-2( X^j(k) )f4(t+p)(X^(k) ) + %+p)-2( X^(k) )f4(t+p)( X, ^(k) ) ■
V U)
Kn procédant comme dans la formule (2.2.10.), le reste de la démonstration du
coroUaire est similaire à celui du théorème 2.1.1.
2. si k = 4p+3 avec P eN*, les statistiques qui apparaissent dans la décomposition (2.2.44.) et (2.2.45.) peuvent s'écrire sous la forme suivante:
(2.2.54.)
(k) 1
^nll ~ 2 ■‘■^R4(t+p)^^^R4t-l
nl2 2^Jj^^*^4(t+p)+2 -1^ ^R-4(t+p)^^R4l-l ^R-4t-3^’
(2.2.55.)
1 "1
^n21 1
^^22 2 ®R4(t+p)+l^^^R4t-I ^R4t-3^‘
Si on pose n2 = Uj -p-1 , peut encore s'écrire
^k) 1
nl2 2 t^j^^^4(t+p)+2 ^R4(t + p) ^^^R4t—1 ^R4t-3^
(2.2.56.)
1 n2
■‘’2j^j^^^4(t4 2p+l)+2 ^R4(t+2p+l)^R4(t+p)+3 ^R4(t+p>4l) Dans ce cas , pour 1 < t < U2, on pose
.(k)
(2 2 57) ^^R4(t+p)+3 ^R4(t4 p) + l ^R4t ^R4t—2^
■*■ ^®R4(t+2p+l) + 2 “^R4(t+2pfl)^ ^R4(t+p) + 3 “^R4(t+p)+1
q
O^) _
tO^)
J.T Cl') _J: r)C^^
^n2 “ nl2 ^n22
^ t 'Comme dans le cas précédent, pour 1 t ^ n2 on pose
(2.2.58.)
(k)
C^4(t+p) + l i^4(t+p) + 3X
C^4(t + p) + l î^4(t+p) + 3)-
Maintenant, conditionnellement
à la statistique d'ordreXi ^ ,X2 n aux rangs pairs 3îp ,
aux rangs qui apparaissent dans les expressions des restes et , et aux couples ),1 < t ^ n2,
les termes et Q® sont (conditionnellement) constants.
De plus, les D^\l < t < n2 peuvent s'écrire
~^(^R (k) ^R4t ”^R4t-2^
(2.2.59.) t t
^^R4(t+2p+l) + 2 ~®R4(t+2p+l)^ ^R^(k) ^Ry(k) ^^'^t
OÙ (w^^),l<t^n2 sont des variables aléatoires indépendantes et identiquement distribuées vérifiant
P(wf^ =1)=1-P(wf'^ =-l)=p®
où P (k)
t est donné par
Pt - (k)
f4(t+p) 11( (k) ^^4(t+pp 3( ^.^(k) )
^ 4(t+ p)+1 ( ^ y (k) ) f4(t 4 pp 3( ^ .^^(k) ) + ^4(14 p>41( ^ ^^(k) ) f4(t+p)4 3( ^, (k) )
V, V> U
En procédant comme dans la formule (2.2.10), le reste de la démonstration du corollaire est similaire à celui du théorème 2.1.1.
Pour un délai k pair, la démonstration se fait de façon analogue en distinguant encore les cas k=4p etk=4p + 2etse ramène aussi à celle du théorème 2.1.1.
□
I*reuve du corollaire 2.1.3.
Soit la statistique de rangs sérielle, linaire et simple de delai k (entier ^ 1), définie dans (2.1.14.) sous la forme suivante:
•j'(k)
n = (n-k)“‘/^ n
t=k ( 1 Rt-1
a(k-l) a(k)
Rt-k+1 Rt-koù (aj^^),(a^j^^),..., (a^^); j =1, 2, ..., n, sont (k
l1) fonctions scores satisfaisant les conditions (i), (ii), (iii) et (iv) du corollaire 2.1.2.
En s'inspirant des démonstrations précédentes, nous construLsons une décomposition de la statistique en somme de statistiques intermédiaires (D^^), ensuite nous procédons par conditionnement pour obtenir une formule analogue à (2.2.10.), le reste de la démonstration se fait de manière similaire aux précédentes.
Si ni = [(n-k)/2(k +1)], on pose
(2.2.60.) X i; (a® )x
2t=ii
= 0
*^2t(k4l)R(2t-l)(kil)
R2t(k+l)fiR2t(k+1)+1 R2t(kfl) r" R21(k4l>hi-k
( 0 )
+ a^ ^ a(j + 0 )
R(2t-)Xk i ])4i R(2t-l)(k i ])fl R(2t-l)(k I 1> 1 R2(t-l)(k+l)+lfi
(2.2.61.) 1 ^'1
- X D
2 Al (k)
toù D
(k)t
, 1 < t < ni, est de la forme suivante:
(2.2.62.) = Z (a® - ) x
^ i=0 ^2t(k+l) R(2t-lXk+l)
...a^^
R2t(k + l)+i"' R2t(k+l>Hl R2t(k+l)-r” R2t(k+l>fi-k
.( 0 ) .(i- 1 ) .(i + 1 ) ,oo
^R(2t-l)(k+l)+i ”'^R(2t-l)(k+l)4l ^ R(2t-l)(k+l)-l ^ R2(t-l)(k+l)+l+i
Pour 1 ^ l ^ H], on pose aussi
= f(2t-l)(k+l)(X(2t-lXk+l))^2t(k+l)(^2t(k+l))/
(2.2.63.) {f(2t-l)(k+l)(X(2t-lXk+l))f2t(k+l)(^2t(k+l)) + f(2t-lXk+l)(^2t(k+l))f2t(k+l)(X(2t-l)(k+l))}>
fk) = min (R2t(k+1) >K-(2t-l)(k+l)).
(2.2.64.)
=max(R2t(k+l)>R(2t-l)(k+l))-
Maintenant, si = (n-décomposition précédente, alors conditionnellement
à la statistique d'ordreXi-^,X2;n > —
aux rangs qui ne sont pas multiples de (k +1), notés 9îk, aux rangs qui apparaissent dans l'expression du reste \ /k*)
et aux couples ),1 ^ t < nj,
les deux termes et sont (conditionnellement) constants.
De plus, les D^\l ^ t < nj peuvent s'écrire
(2.2.65.) I: (a® - a® )x
t t
R2t(k+])+i'” R2t(k+1)+1 K-2t(k+l>-l "’ R2t(k+l>fi-k
_a( 0 ) ...a^‘“^^ a^'+*^ ...a® )
R(2t~l)(k+l>fi "’ R(2t-l)(kfl)fl R(2t-l)(k+l> 1 "’ R-2(t-l)(k+1)+1+i
où (w^),l<t<ni sont des variables aléatoires indépendantes et identiquement distribuées vérifiant
P(wf^^ =1)=1-P(wj*'^ =-l)=pJ^)
Pour ] < t ^ nj, on pose aussi
P®=f(21-l»Hl)(uf^)f2t(k,l)(V®)/
(2.2.66.) {f(2t-l»tl)(Uf*)f2tO:+l)(V®)
+ f(2MXk+l)(V,®)f21(k+l)(uf».
En procédant comme dans la formule (2.2.10.), le reste de la démonstration du corollaire est similaire à celui du théorème 2.1.1.
Remarque Les démonstrations de ces deux corollaires sont deux généralisations différentes de la démonstration du théorème 2.1.1. Si on fait k =1 dans la démonstration du corollaire 2.1.3 on revient à la preuve du théorème; Cependant, si on fait
(k- 1 )
=
1 pour j =1, 2, ..., n, on obtient une nouvelle démonstration du corollaire 2.1.2.
□
Preuve du théorème 2.1.4.
Nous avons vu que, sous l'hypothèse nulle, la démonstration du corollaire 2.1.4 ci- dessus se ramène facilement à celle du théorème 2.1.1, il en est de même pour celle- ci. Démontrons donc le théorème 2.1.1 sous l'hypothèse nulle H
qen supposant que seules les conditions (II.l) et (IL2) sont satisfaites pour les deux vecteurs scores
?n “ (®nl’^n2’-">®nn ) !?n “ (^nl’^n2»-"’^nn )
Pour n ^ 6, on pose
(2.2.67.)
D = {(A+B)/Ô5>^
J = {t eIN /l^t^n3 et m = IJI (cardinal de J)
■>3 =[([n/2]-l)/2]-
(cf (2.2.28.) et (2.2.30.))
d=(ab)^2“"ô4
Remarquons que la relation (2.2.35.) qui est basée sur le lemme 2.2.7 ne nécessite que les conditions (H. 1) et (II.2) et encore on a
( 2 . 2 . 68 .) — ^ m ^ — n n
20 4
Définissons l'événement F cette fois-ci par
(2.2.69.) F = {|Dt I ^ - - pour au moins [Ô4 n] indices t }.
Rappelons que le lemme 2.2.9 a été proirver d'abord sous l'hypothèse nulle H
qet les conditions (II.l) et (H.2), il existe donc des réels positifs C4 et /c 4 tels que
(2.2.70.) P(F)^1-C4e“’^4n
D'autres part, d'après la relation (2.2.32.) dans l'espace échantillon F, le nombre d'indices t n'appartenant pas à J est au plus égale à Ô5 n. par conséquent, en utilisant (2.2.67.) on obtient
(2.2.71.) Z D? ^ ( ab)^2"*' Ô4 n = nd.
teJ
Les relations (2.2.67.) et (2.2.68.) entraînent
(2.2.72.) X ^ ml3 i nD/4.
teJ
Maintenant puisque les variables aléatoires X], X2 X^ sont indépendantes et équidistribuées, les p^ définies dans (2.2.9.) sont constants, p( = 1/2 pour 1 < t < n3, et d'après le lemmc 2.2.3 on a, pour tout u elR
(2.2.73.) |^n(u)| < E f ] {(1 + cos((n -
t=l
n{(l + cos((n-l)-l/2jjDt))/2)}V2 leJ
;^Eexp{- ]_
2 U
n-1 2
dJ +
t e J
U
96(n-l)2 teJ
<Eexp{-d— + U D u^
2^x3 n f
JU .
^exp{-d y },
si |u| ^ cn^/^ avec c = 4(d/D)^^^.
n existe donc, des réels strictement positifs c, C et x tels que, pour Logn ^ |u| ^ cn'^^
I.a démionstration du théorème s'achève en remarquant que l'inégaKté ci-dessus est
évidente pour 2 < n ^ 5.
CHAPITRE III
BORNE DE BERRY-ESSEEN
POUR DES STATISTIQUES DE RANGS SERIELLES,
LINEAIRES ET SIMPLES.
3.1. INTRODUCTION
Dans C6 chapitre, on se limite à ITiypothèse nulle; cas où les variables aléatoires sont indépendantes, identiquement distribuées et de fonction de distribution de probabilité continue F.
Soient Xi-n < X2;n <... < n et respectivement les statistiques d'ordre et de rangs associées à la suite Xj, X2,... ,X„. Celles-ci sont liées par la relation suivante:
Pour t = 1,2,...,n Xt=X
Une statistique de rangs linéaire (non sérielle) s'écrit sous la forme
(3.1.1.) Tn =n-‘/2
t=l
où an(.):{l,2,...,n}-^ R est une fonction (score), et Ci,C2,...,Cj^ sont des constantes (de régression) données.
H ajek et SiDAK (1967), PURI et S en (1971) et (1985) ont étudié la distribution asymptotique de la statistique de rangs linéaire (non sérielle) Tn et ont donné des conditions sufiOsantes pour avoir la normalité asymptotique. VoN B ahr (1976), H us KOVA (1977) et (1979) et IIo et C hen (1978) ont établi des bornes de Beny- Esseen d'ordre 0(n“^/^) dans le cas de fonctions scores bornées, sous l'hypothèse nulle et sous des conditions supplémentaires sur les constantes de régression. Le résultat le plus important dans cette série est due à DOES (1982) qui, en se servant des résultats de A
ebers, B
ickelet VAN ZWET (1976) et VAN ZWET Ô 982) sur l'ordre de grandeur du module de la fonction caractéristique de la statistique pour de grandes valeurs de l'argument, a établi de telles bornes sous des conditions moins restreignantes englobants des fonctions génératrices de scores non bornées et comprenant le cas particulier important de la fonction quantité de la distribution normale (scores de Vander Waerden).
Une statistique de rangs sérielle linéaire d'ordre k (entier positif) a la forme suivante pour n > k + 1
(3.1.2.) T^=(n-k)-^/2 I a„(R<">,R(%...,R("^j.) t=k+l
où a^(.) est une fonction score dépendant de k + 1 valeurs successives de rangs.
H
allinet Al. (1985) ont prouvé la normalité asymptotique de ces statistiques sous l'hypothèse nulle et sous des hypothèses alternatives (en utilisant la notion de contigui'té de L
eC
am, 1960 et 1986).
EXEMI^LE 3.1.1.
(a) La statistique des séquences (runs) par rapport à la médiane est donnée par
=(n-l)“*/2 X I{(2R{''^-n-l)(2Rj"^j-n-1) <0}.
" t=2
(b) Le coefficient d'autocorrélation des f-rangs d'ordre k
n R R
=(n-k)“‘/^ X (p(F“^(-^))F~’(—
où f, f, <p = - f /f, et F désignent respectivement la fonction densité, sa dérivée en moyenne quadratique, la fonction score et la fonction de distribution de probabilité associées.
Les coefficients d'autocorrélation de Van der Waerden, de Wilcoxon et de I^place s'obtiennent en prenant respectivement les cas particuliers où la fonction de densité f est normale, logistique et double exponentielle (cf. H
allinet Al., 1987 et
etlhiri, 1991).
I>a plupart des statistiques sérielles d'intérêt pratique peuvent s'écrire sous forme d'une combinaison linéaire de statistiques simples définies comme suit:
(3.1.3.) =(n-k)-*/2 Y aJ^*>(R;"))af(Rf>j^)
t=k+l
où a*^^\.) et a*^^^(.) sont deux fonctions scores.
Par exemple la statistique des séquences par rapport à la médiane peut s'écrire comme la somme de deux statistiques simples de la forme (3.1.3.) et dont les fonctions scores sont données pour tout i],i2 e{l,...,n) par
a^*\il)ajf\i2) = l{2ii <n + l}l{2i2 >n + l),
an\il)a^f^(i2) = I{2ii >n + l}l{2i2 <n + l}.
Une statistique de la forme (3.1.3.) est appelée statistique de rangs sérielle, linéaire et simple d'ordre (ou de délai) k.
Le coefiBcient d'autocorrélation de Wald-Wolfowitz (voir définition dans (2.1.6.)) et les coefficients de la f-rangs autocorrélation sont aussi des statistiques de rangs simple.
Notons qu'une généralisation de la statistique ci-dessus en une statistique comprenant une fonction score a„(.,...,.) formée d'un produit d'au plus k+1 fonctions scores a^°\.),a^\.),... ,a®(.), peut s'écrire comme suit:
(3.1.4.)
T»= (n
'•k) -1/2 £ af(R(">)a<J>(R(^>j)...a®(Rj^)j^
t=k+l
)■