HAL Id: tel-00006453
https://tel.archives-ouvertes.fr/tel-00006453
Submitted on 13 Jul 2004
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
non-paramétrique
Stéphane Girard
To cite this version:
Stéphane Girard. Contributions à l’inférence statistique semi- et non-paramétrique. Mathématiques
[math]. Université Joseph-Fourier - Grenoble I, 2004. �tel-00006453�
UNIVERSITE JOSEPH FOURIER - GRENOBLE I
U.F.R. D'INFORMATIQUE
ET DE MATH
EMATIQUES APPLIQU
EES
Memoired'habilitation
presente par
Stephane GIRARD
en vuede l'obtention du dipl^omed'Habilitationa Dirigerdes Re her hes del'
Universit
e Joseph Fourier
Spe ialiteInformatiqueetMathematiquesAppliquees
Contributions a l'inferen e statistique
semi- et non-parametrique
Soutenan e le6 juillet2004 devant le jury omp osede
Jean-NoelBACRO Professeur, Universite Montp ellier 2 Examinateur
Philipp e BESSE Professeur, Universite Universite PaulSabatier Rapp orteur
GillesCELEUX Dire teur de Re her hes, INRIA futurs Examinateur
Irene GIJBELS Professeur, Universite Catholique de Louvain Rapp orteur
IvetteGOMES Professeur, Universite deLisb onne Rapp orteur
AnatoliIOUDITSKI Professeur, Universite Joseph Fourier Examinateur
Jetiens a remer ierPhilipp e Besse,IreneGijb els etIvette Gomesp our avoirbienvoulu
onsa- rerunpartdeleurtempsalale ture ritiquede ememoireetalareda tiondeleurrapp ort.Mes
remer iements s'adressent aussi a Jean-Noel Ba ro, Gilles Celeux et Anatoli Iouditski qui m'ont
fait l'honneurde parti ip er au jury de ettehabilitation.
J'aimeraisremer ier i i les membres desequip es de re her he qui m'ont a ueilli depuis 1993:
le departement Systemesdu LETI/CEA, le departement Image de l'ENST Paris, le projetis2 de
l'INRIARh^one-Alp es, leLab oratoiredeProbabilitesetStatistiquedel'UniversiteMontp ellier2et
leLab oratoiredeMo delisationetCal uldel'UniversiteGrenoble1.Plusparti ulierement,j'adresse
masin erere onnaissan e a mes o-auteurs itestout au longde e memoire.
Enn,je voudrais exprimer ma gratitudea Fabri e Bellet p our m'avoirfourni l'equip ement et
Table des matieres
Intro du tion 3
1 Estimation de quantiles extr^emes 5
1.1 La theorie desvaleurs extr^emes . . . 5
1.1.1 Le theoremedes valeurs extr^emes. . . 6
1.1.2 Le theoremede Pi kands . . . 6
1.1.3 Des ription desdomaines d'attra tion . . . 7
1.1.4 Metho dedesex esp our l'estimationdes quantiles extr^emes . . . 7
1.1.5 Estimation des parametresde laloi GPD . . . 8
1.2 Estimation dansDA(Gumb el) . . . 8
1.2.1 Proprietesasymptotiques del'estimateurET . . . 8
1.2.1.1 Etudedu termedeterministe . . . 9
1.2.1.2 Etudedu termesto hastique . . . 10
1.2.2 Cas deslois aqueue de typ e Weibull . . . 10
1.2.2.1 Estimation del'indi e de queue deWeibull . . . 11
1.2.2.2 Estimation desquantiles extr^emes . . . 12
1.3 Estimation dansDA(Fre het) . . . 12
1.3.1 Estimation bayesienne des parametresde laloi GPD . . . 12
1.3.2 Appli ation a l'estimationdesquantiles extr^emes . . . 14
1.4 Estimation dansDA(Weibull) . . . 14
1.4.1 Estimation de l'indi e desvaleurs extr^emes . . . 15
1.4.1.1 Unestimateura double seuil expli ite . . . 15
1.4.1.2 Unestimateura double seuil impli ite . . . 15
1.4.2 Estimation des quantiles extr^emes . . . 16
1.5 Testsdequeues de distribution . . . 16
1.5.1 Prin ip e destests dequeue de distribution . . . 17
1.5.2 Le testET . . . 17
1.5.3 Le testGPD . . . 18
1.6 Le logi iel Extremes . . . 18
1.7 Persp e tives . . . 18
2 Estimation de frontiere 21 2.1 Nos p oints de depart . . . 21
2.2 Estimation a partirde partitions . . . 24
2.2.1 Estimation par proje tion . . . 24
2.2.1.1 Proje tionsur une baseorthogonale . . . 24
2.2.1.2 Casd'une basenon-orthogonale . . . 26
2.2.2 Estimation par lametho dedu noyau . . . 26
2.2.3 Estimation par lametho dedu noyau generalise . . . 27
2.2.3.1 Cadrede l'etude . . . 28
2.2.3.2 Comp ortementasymptotique . . . 28
2.2.3.3 Exemples . . . 29
2.2.4 Illustration sursimulations . . . 31
2.3 Estimation parprogrammationlineaire . . . 31
2.3.1 Constru tion de l'estimateur . . . 31
2.3.2 Lien ave d'autresmetho des. . . 33
2.3.3 Proprietesasymptotiques . . . 34
2.4 Persp e tives . . . 34
3 Redu tion de dimension et analyse d'images 37 3.1 Lesmo deles auto-asso iatifs . . . 37
3.1.1 Exemple de l'analyse en omp osantes prin ipales . . . 38
3.1.2 Denition desmo delesauto-asso iatifs . . . 39
3.1.3 Constru tion etproprietes . . . 41
3.1.4 Deux mo deles parti uliers . . . 41
3.1.4.1 Lesmo delesauto-asso iatifs lineaires . . . 42
3.1.4.2 Lesmo delesauto-asso iatifs de regression . . . 42
3.1.5 Mise en uvre . . . 43
3.1.5.1 Estimation dela fon tionde regression . . . 43
3.1.5.2 Determinationdesdire tionsrevelatri es . . . 43
3.2 Appli ation en analysed'images. . . 44
3.2.1 Re onstru tion apartir d'uneseule proje tionradiographique . . . 45
3.2.2 Representationde bases d'images . . . 46
3.3 Persp e tives . . . 49
4 Estimation de ourb es de referen e 51 4.1 Covariableunidimensionnel le . . . 51
4.1.1 Quantiles onditionnels et ourb es de referen e . . . 52
4.1.2 Metho desnon parametriquesd'estimation desquantiles onditionnels . . . . 53
4.1.3 Comparaison sursimulations des troismetho desnon parametriques . . . 54
4.1.4 Appli ation a desdonneesreelles . . . 55
4.1.4.1 Lesmetho desd'estimation . . . 55
4.1.4.2 Resultats . . . 57
4.2 Covariablemultidimensionnell e . . . 58
4.2.1 Asp e ts theoriquesdelaredu tion de dimension en regression. . . 59
4.2.2 Pro edure d'estimation . . . 61
4.2.5 Appli ation a desdonneesreelles . . . 65
4.3 Persp e tives . . . 65
5 Persp e tives 67
5.1 Constru tion etestimationde opules . . . 67
5.2 Domaines d'appli ation . . . 68
Introdu tion
Cememoireestune synthesede mona tivite dere her he depuis mathesedebuteeen o tobre
1993.Lestravauxpresentess'ins rivent dansle adrede l'inferen e statistique au sens large. Plus
pre isement,ils s'arti ulent autourdes themessuivants:
{estimationde quantilesextr^emes,
{estimationde frontiere,
{redu tion de dimension en analyse d'images,
{estimationde ourb es dereferen e.
Mes ontributions a es quatredomaines sont de rites en autant de hapitres, numerotesde 1 a4,
p ouvant ^etre lus indep endamment.
Le Chapitre 1 est onsa re a l'estimation de quantiles extr^emes. Le quantile x
pn
d'ordre p
n
d'une variable aleatoire X est le nombrequi a probabilite p
n d'^etre depassee:P(X >x pn )= p n : Dansle aso up n
<1=n, equantileestditextr^eme arilest\engeneral"superieural'observation
maximale.L'estimationdetelsquantilesne essitedesmetho dessemi-parametriquesd'extrap olation
au-dela de l'observation maximale faisant leminimumd'hyp otheses surlaloi de X.
Le probleme ab orde dans le Chapitre 2 est l'estimation d'un ensemble D a partir de p oints
disp osesaleatoirement dans elui- i. Le problemen'estpas traitei i dans toute sageneralitemais
on serestreint au as d'ensembles de laforme D=f(x;y):x2 E ; 0 y f(x)g;E etant un
sous-ensemblede R
d
onnu,et f une fon tionde E dansR
+
in onnue, sibien quel'estimation de
Dse ramene a elle de lafon tionfrontieref.
Lesmetho des deredu tion de dimension non-lineaires intro duites Chapitre3 ont ete motivees
pardes appli ations al'analyse d'images.Une imagep eut en eet^etre representeeparun ve teur
degrandedimensionetlesmetho desderedu tiondedimension lineairessontsouventmaladaptees
a representerles deformationsm^emesimples d'une image.
Dansle Chapitre4 denouvellesmetho dologiesp our l'estimation de ourb esde referen essont
presentees.Cesappro hessontbaseessuruneestimationnon-parametriquede quantiles
ondition-nels pre edeesi b esoinest d'uneetap ede redu tion de dimension de la ovariable.
Enn, je montre dans le dernier hapitre de e do ument omment la onfrontation de es
domaines de re her he ave d'autresthematiques fait naitrede nouvelles p ersp e tives. Avant ela
j'aimeraissouligner les liens qui unissent esre her hes.
Toutd'ab ord, les problematiques des hapitres 1,3 et 4 sont issues de ollab orations ave des
industriels,resp e tivementEDF(ele tri itedeFran e),leCEA( ommissariatal'energieatomique)
statistiqueaudevelopp ementd'outilslogi ielsl'implementant.Dansle asdel'estimationde
quan-tiles extr^emesetde ourb es de referen e,les logi iels sont mis a ladisp osition de tous [32,50℄.
Ensuite, les quatre domaines de re her he ab ordes font app el a des themes ommuns. Ainsi,
l'estimationde frontiere,de ourb es de referen eetlaredu tion dedimension enanalyse d'images
releventtoutestroisdel'estimationfon tionnelle,etestimationdequantilesextr^emesoude ourb es
dereferen esfontapp eladesmetho dessemi-parametriques.Notonsque esdeuxdernieresprobl
e-matiquesasso ieesal'estimationdefrontierep euvent^etre onsiderees ommedierentsasp e ts de
l'estimationde quantiles, onditionnels ounon.D'autrepart lesou i de laredu tionde dimension
seretrouve a lafoisen analyse d'imagesetdans le adre del'estimation de ourb es de referen e.
Conventions
Les notationssuivantes seront utiliseesdans e memoire:
{Si (A
n
) et(B
n
) sontdeux suitesreelles p ositives, one ritA
n B n lorsque 0< lim n!1 infA n =B n lim n!1 supA n =B n <+1: A n
0 s'interpreteparA
n !0. Onnote A n B n si A n =B n !1 quandn!1:
{La onvergen een loi est notee
d
! etla onvergen eenprobabilite est notee
P
! .
Enn,dansles hapitres suivants,lesresultatssontparfoisenon essousdeshyp othesessimpliees
Chapitre 1
Estimation de quantiles extr^emes
Supp osons que l'on disp ose de n observations x
1 ;:::;x
n
d'une grandeur physique mo delisee
par une variable aleatoire X.Le quantile x
pn
d'ordrep
n
de X est la quantite qui a la probabilite
p n d'^etre depassee: P(X > x p n ) = p n : Dans le as o u p n
< 1=n, e quantile est dit extr^eme
ar il est \en general" superieur a l'observation maximale. Plus pre isement, si X
n;n
designe la
maximum de n variables aleatoires indep endantes et de m^eme loi que X,alors np
n !0 implique P(x p n >X n;n )!1 quandn!1.
Lesproblemesd'estimationde quantilesextr^emessetrouvent typiquement en hydrologie:a partir
de mesures x
1
;:::;x
n
de debit d'une riviere sur 50ans, estimer le debit de la rue du sie le. Les
problemesab ordesdans e hapitretrouvent ep endant leurmotivationdansundomainedierent,
laabilite.A l'ex eption duparagraphe1.4,lesresultatsobtenus i iont eneetetea quisdansle
adre d'une ollab oration de 7 annees entre le projetis2 de l'INRIA Rh^one-Alp es et la dire tion
desetudes etre her he de EDF.La on lusion de ette ollab oration aeteledevelopp ement d'un
logi iel d'etudedesqueuesde distribution.
Nous presentons au paragraphe 1.1 la theorie desvaleurs extr^emes, etla notion de domaine
d'at-tra tion, quisont ala basedes metho desdeveloppees i i.Lesparagraphes1.2 a 1.4presentent les
metho des d'estimation des quantiles extr^emes, lassees par domaine d'attra tion,que nousavons
prop osees.Un testd'adequationdedieauxqueuesde distribution etutilisantlanotion de quantile
extr^eme est intro duit paragraphe 1.5. Le logi iel Extremeso u sont implantees quelques unes de
es metho desest brievement presenteparagraphe 1.6.Enn,quelques p ersp e tives sont prop osees
paragraphe 1.7.
1.1 La theorie des valeurs extr^emes
SoitX unevariablealeatoirereelledefon tionderepartitionF etdefon tiondesurvie
F =1 F.
On note x
F
= supfx 2R;F(x) < 1gle p oint terminal de F. On intro duit egalement u x
F un
reelapp ele seuil.L'ex esY deX au deladu seuil u estlavariable aleatoiredenieparY =X u
quandX>u.SoitfX
1
;:::;X
n
gune hantillondenvariables aleatoiresindep endantes etdem^eme
loi queX et soitX
1;n
X
n;n
lesstatistiques d'ordreasso iees.
La theoriedes valeurs extr^emesetablit deuxtyp esde omp ortement asymptotique.D'une part,le
theoreme des valeurs extr^emes donne la loi asymptotique de X
n;n
theoreme de Pi kands donne la loi asymptotique de l'ex es Y quand le seuil u tend vers le p oint
terminal x
F
.Ce resultatest presentedansleparagraphe 1.1.2.
1.1.1 Le theoreme des valeurs extr^emes
Theoreme 1.1.1 Sous ertaines onditions de regularite sur F, il existe 2 Ret deux suites
reelles( n ) n1 et ( n ) n1 ( n >0) tels que 8x2R; lim n!1 P( 1 n (X n;n n )x)= lim n!1 F n ( n + n x)=H (x); o u H
est lafon tion de repartitionde la loidesvaleurs extr^emes (EVD):
H (x)= ( exp h (1+x) 1= + i si 6=0; o u y + =max(0;y): exp( exp( x)) si =0: (1.1)
Les onditions de regularite sur F sont de rites dans [19℄, page 108 et [46℄, page 54. Elles sont
veriees p our la plupart des lois usuelles. La loi de fon tion de repartition H
est app elee loi
des valeurs extr^emes, et le parametre est app ele indi e des valeurs extr^emes. Si F verie le
Theoreme1.1.1,on dit que F appartient au domained'attra tion de H
.On distingue alors trois
as:
{ si <0,F appartient au domained'attra tionde Weibull, etl'on noteF 2DA(Weibull) ,
{ si =0,F appartient au domained'attra tionde Gumb el, etl'on noteF 2DA(Gumb el),
{ si >0,F appartient au domained'attra tionde Fre het, etl'on noteF 2DA(Fre het).
Des des riptions de estrois domainesd'attra tion sont prop oseesdansle paragraphe1.1.3.
1.1.2 Le theoreme de Pi kands
Lafon tionderepartitiondel'ex esY au-deladuseuil uestnoteeF
u
,lafon tiondesurvieasso iee
s'e ritp our x0: F u (x)=P(X u>xjX>u)= F(u+x)= F(u):
Le theoremede Pi kands [107℄ donne une approximation de ettefon tion de survie (ou de fa on
equivalentede lafon tionde repartition)lorsque le seuil u estpro he du p oint terminal x
F .
Theoreme 1.1.2 F appartient au domaine d'attra tion de H
si et seulement si il existe une
fon tion telleque
lim u!x F sup 0<x<x F u F u (x) F GPD ; (u) (x) =0; (1.2) o u F GPD ;
estlafon tion desurvie de la loide Pareto generalisee(GPD):
F GPD ; (x)= (1+x=) 1= si 6=0; exp ( x=) si =0; (1.3)
denie pour x0 si 0 et 0x = sinon.
RemarquonsquesiF 2DA(Gumb el),alors
F
GPD
0;
,lafon tiondesurvieasso ieeparletheoremede
Pi kands,estlafon tiondesurvied'uneloiexp onentielled'esperan e.Deplus,siF estelle-m^eme
1.1.3 Des ription des domaines d'attra tion
Nousrapp elons les onditions ne essairesetsuÆsantessur unefon tionderepartitionp ourqu'elle
appartienne a un domaine d'attra tion.Ces ara terisations font app el aux lasses de fon tions a
variations regulieres RV
et de fon tions a variations regulieres lisses SR
[11℄, paragraphes1.4,
1.5,1.8,2.3et2.4.Danslesdeux as,2Restapp eleindi edevariationsregulieres,etsi=0,on
parle de variations lentes (lisses).Lesdomaines d'attra tionde Fre hetetWeibull se ara terisent
alorsaisement a partirde RV
0 .
Theoreme 1.1.3
(i) F appartienta DA(Fre het)ave unindi edevaleursextr^emes >0sietseulement
si(a) x F =+1 et(b) il existe `2RV 0 tel que F(x)=x 1= `(x):
(ii) F appartienta DA(Weibull)ave unindi edevaleursextr^emes <0sietseulement
si(a) x F <+1 et(b) il existe `2RV 0 tel que F(x)=(x F x) 1= `((x F x) 1 ).
Le domaine d'attra tion de Gumb el p eut, quant a lui, ^etre de rit a partir des fon tions de typ e
Von-Mises [42℄, Theoreme 3.3.26. Cep endant, il n'en existe pas de ara terisation simple. Nous
prop osons i-dessousunexemplede lassedeloisrepresentatifdeladiversitedesloisde edomaine
d'attra tion.Cedernier ontientdesfon tionsde repartitionF de p ointterminal niou inni. I i,
nousnouslimitonsause ond as.Pluspre isement,nousdenissonslafamillesuivantedefon tions
de repartition,intro duite dans[37℄.
Denition 1.1.1 Une fon tion derepartition F appartient a C DA(Gumbel)si
(i) F estinversible.
(ii) La fon tion V :x2R + !V(x) = F 1
(exp ( x))2R(fon tion de hasard umulee
inverse)appartient a C 1 [C 2 [C 3 ave C 1 =SR ,>0, 6=1; C 1 1 =C 1 1;1 [C 1 1; =fV 2SR 1 : V 00 =0g[fV 2SR 1 : jV 00 j2SR 1 g, 0, C 2 =fV 2SR 0 ;V 0 2SR 1 g; C 3 =fV =expg;g2SR ;0<<1g:
Pour on lure eparagraphelesdomainesd'attra tionasso iesaquelquesloisusuellessontpre ises.
Exemple 1.1.1
{ Domaine d'attra tion de Fre het ( > 0): Loi de Burr, loi de Fre het, loi de Pareto, loi de
Student.
{ Domaine d'attra tion de Weibull (<0): Loi uniforme (= 1),loi inversede Burr.
{ Domaine d'attra tion de Gumbel ( = 0): Loi exponentielle (C
1 1;1 ), loi gamma (C 1 1;1 ), loi normale(C 1 1=2 ), loide Weibull (C 1 1=
, etantle parametredeforme), loidouble-exponentielle
(C 2
) de fon tion desurvie
F(x)=exp( exp(x)),loi lognormale(C
3
1=2 ).
1.1.4 Methode des ex es pour l'estimationdes quantiles extr^emes
Nous donnons i i les grandes lignes de la metho de des ex es, denie dans [15℄ et basee sur le
theoreme de Pi kands. Rapp elons que l'on her he a estimer le quantile extr^eme x
pn deni par F(x p ) =p n ave 0<p n
<1=n. Pour ela, on intro duit un se ond quantile u
n
deni par F(u n ) = n , ave 1=n n
< 1.L'heuristique de lametho de desex es onsiste alors a
appliquer l'approximation(1.2)ave u=u
n etx=x p n u n
p ourobtenirl'approximation ~x
GPD pn de x p n : ~ x GPD pn =u n +( F GPD ; (u n ) ) 1 (p n = n )=u n (u n ) 1 ( n =p n ) : (1.4)
L'estimateur orresp ondant estobtenuenestimantu
n parX n k n +1;n o uk n =n n etenrempla ant (u n
) et par des estimateurs appropries ^
n et
^
n
onstruits sur la base des ex es ordonnes
fX n i+1;n X n kn+1;n ; i = 1;:::;k n
1g. Des exemples sont donnes au paragraphe 1.1.5. On
obtient alors: ^ x GPD p n =X n kn+1;n ^ n ^ n 1 ( n =p n ) ^ n : (1.5)
Un as parti ulier imp ortant de et estimateur est l'estimateur ET (Exp onential Tail) intro duit
dans [15℄. Il onsiste a supp oser que lafon tion de repartitionF estdans le domained'attra tion
deGumb el.Deslors,ilsuÆtdep oser
^ n
=0dans(1.5)etd'estimer(u
n
)parlamoyenneempirique
desex es,
^ n = 1 k n 1 kn 1 X i=1 (X n i+1;n X n kn+1;n ); (1.6)
p our obtenirl'estimateurETde x
pn : ^ x ET pn =X n k n +1;n +^ n log ( n =p n ): (1.7)
1.1.5 Estimation des parametres de la loi GPD
L'estimationdesparametres etde laloi GPDapartird'une hantillond'ex esestunprobleme
deli at en pratique. La prin ipale diÆ ulte provient du fait que,sur un e hantillon de n
observa-tions,onnep eutdisp oserquedek
n
ex esp ourrealiserl'estimation(le hoix dunombrek
n
d'ex es
estegalement unproblemeen lui-m^eme).Dans e ontexte,l'estimateurdu maximumde
vraisem-blan e[115℄estp euutilise ard'unepart,ilp osedesproblemesnumeriquesetd'autrepartilestp eu
p erformant p our desnombres d'ex esinferieurs a 500[28,81℄. Parmi les nombreuses prop ositions
existantes p ourpallier eslimitations itonsles estimateursdes momentsp onderes[87℄.
1.2 Estimation dans DA(Gumbel)
Notre ontribution a l'estimationdes quantiles extr^emesdansle domaine d'attra tionde Gumb el
p orte sur deux p oints. Dans un premier temps, nous avons etudie les proprietes asymptotiques
de l'estimateur ET denien (1.7).Dans un se ond temps,nous avons prop ose un estimateurdes
quantilesextr^emesdedie ala lasse C
1
,>0.
1.2.1 Proprietes asymptotiquesde l'estimateur ET
Cetravailaeterealiseen ollab orationave Jean Dieb olt(CNRS,Universite de Marne-la-Vallee).
L'etude des proprietes asymptotiques de l'estimateur ET a ete negligee dans la litterature. On
trouve ep endant dans[29℄un resultatdonnantlaloiasymptotiquedeladieren ex^
ET
pn x
pn
etudiele omp ortement dutermedeterministex~
ET
p n
x pn
puis dutermesto hastique x^
ET p n ~ x ET p n ,o u ~ x ET pn
estl'approximation duquantile extr^emedenieparanalogie ave (1.4)par
~ x ET p n =u n +( F GPD 0; (un) ) 1 (p n = n )=u n +(u n )log( n =p n ): (1.8)
1.2.1.1 Etude du terme deterministe
Lesdetailsde etteetudesontparus dans[72℄.Nousavonsmontreque,dansla lasse C,
l'approxi-mation(1.8) estun asparti ulier de
~ x ET;k pn =u n + k X i=1 [i℄ n i! log i ( n =p n ); o u [i℄ n = V (i) ( log n
), app elee approximation d'ordre k du quantile x
pn
.On verie en eet que
~ x ET;1 p n =x~ ET pn .Onnote" app;k n =(x p n ~ x ET ;k p n )=x p n
,l'erreurd'approximationd'ordreketonintro duitla
suite de fon tions K k (x)=x k V (k )
(x)=V(x);x>0;k0:On supp oseque les ordresdesquantiles
p euvent s'e rire p n =1=n q +n , n =1=n q 0 + 0 n ave 0<q 0 1q, n !0, 0 n !0 et n 0 n .De plus, si q =q 0
=1 alors on supp ose que
0 n < 0< n . Enn, on note N k =f1;:::;k g. Le resultat
suivant donne des onditions ne essairesetsuÆsantesp our quel'erreurd'approximationd'ordrek
onverge vers 0.
Theoreme 1.2.1 Soit F 2C.
(i) Si V 2C 1 1= et 2N k alors " app;k n !0 pour tout0<q 0 1q. De plus,si q6=q 0 alors" app ;k n K k +1 (logn). (ii) Si V 2C 1 1= et 2= N k alors [" app;k n !0 , q=q 0 =1 ℄. De plus,si q=q 0 =1 alors" app;k n ( 1):::( k ) (k+1)! ( n 0 n ) k +1 . (iii) Si V 2C 2 alors" app;k n !0 pour tout 0<q 0 1q. De plus,si q6=q 0 alors" app ;k n K k +1 (logn). (iv) Si V 2C 3 alors[" app;k n !0 ) q =q 0 =1 ℄. Inversement,si q =q 0
=1 et s'il existe s>0 tel que
n log +s (n)!0 alors " app;k n !0 et " app;k n ( n 0 n ) k +1 K k +1 (logn).
Ce resultat etablit le lien entre les ordres p
n
et
n
des quantiles a estimer et la lasse a laquelle
la loi appartient. Dans les as (ii) et (iv) la onvergen e de l'erreur d'approximation vers 0
im-p ose de hoisir p = p
0
= 1, e qui implique log(1=p
n
)=log(n) ! 1. Dans de telles situations, les
approximations x~
ET;k
p n
ne sont pro hes de x
pn
que p our des quantiles \p eu" extr^emes, 'est a dire
pro hesde l'observation maximale. Considerons le as k=1, orresp ondant a lametho deET.Le
Theoreme 1.2.1 montre que l'approximation ET est de b onne qualite p our les lois dont la
fon -tion de survie de roit tresvite vers 0 ( lasse C
2
),le quantile extr^emex
pn
p eut ^etre appro he sans
onditionsursonordrep
n
.Al'inverse,lesloisdontlafon tiondesurviede roitrelativement
lente-mentvers0( lasse C
3
)demandent defortes onditionssurl'ordre duquantile p
n
and'obtenirdes
approximations a eptables. La lasse C
1
, 6= 1 represente un as intermediaire. Enn, la lasse
C 1
1
Il estinteressantde remarquer quela onvergen e ounon vers0 de l'erreurd'approximation " app;k
n
ne dep endpas de l'ordre de l'approximation k dans les lasses C
1 1= , 2= N,C 2 etC 3 .Parexemple
l'erreur orresp ondantal'approximationnavex~
ET;0
p n
=u
n
onvergevers0souslesm^emes onditions
que l'erreur asso iee a l'approximation ET: x~
ET;1
pn
= x~
ET
pn
. De e p oint de vue, l'approximation de
Pi kandsne mo die paslanature de la onvergen e.
1.2.1.2 Etude du terme sto hastique
Les details de etteetudesont publiesdans [37℄. Lesresultatssont obtenus i i p ourune lasse de
fon tionsde repartition plusgenerale quelapre edente.
Denition 1.2.1 Une fon tion derepartition F appartient a DDA(Gumbel)si
(i) F estinversibleet deux fois derivable.
(ii) La fon tion deniepar A:x2R
+ !A(x)=V 00 =V 0 (logx)2R, o u V(x)= F 1
(exp( x)) verie les onditionssuivantes:
A(x)!0 quand x!+1,
A est asymptotiquement de signe onstant,
Il existe0 tel quejAj2RV
.
Ona ommeannon eCDDA(Gumb el),etleresultatest lesuivant:
Theoreme 1.2.2 Soit F 2 D et soit a: x 2 R! V
00 =V 0 (V 1 (x)) 2 R.Si k n ! +1, n ! 0, p n = n !0 et k 1=2 n a(u n )!0 alors k 1=2 n (u n )log( n =p n ) ^ x ET pn ~ x ET pn d !N(0;1) quandn!1:
L'appli ation e theoremeaux lois de la lasse C p ermet d'obtenir desformes plus expli ites p our
la ondition k 1=2 n a(u n )!0. Corollaire 1.2.1 SoitF 2C. Si k n !+1 et p n = n
!0 alorsdansles assuivants:
(i) V 2C 1 [C 2 , 6=1 et k n =o((logn) 2 ), (ii) V 2C 1 1;1 et k n =o(n), (iii) V 2C 1 1; etk n =O ((logn) 2(1+) Æ ) 8Æ>0 arbitrairement petit, (iv) V 2C 3 et k n =O ((logn) 2(1 ) Æ ) 8Æ>0 arbitrairement petit, ona, k 1=2 n (u n )log( n =p n ) ^ x ET pn ~ x ET pn d !N(0;1) quandn!1:
1.2.2 Cas des lois a queue de type Weibull
Parmi les familles de lois de C, la lasse C
1
est la plus interessante dans le sens o u elle englob e
la majoritedes lois de DA(Gumb el):Weibull, gamma,normale ...De e fait, des estimateurs des
quantilesextr^emesdediesa ettefamille de lois onteteintro duits,parexemple [9,5,16, 94℄.Plus
pre isemment, es estimateurs s'adressent aux lois dont la fon tion de survie satisfait l'hyp othese
suivante: (A.1) : F(x)=exp( H(x)), ave V(t)=H 1 (t)=t `(t)et`2RV .
De telles lois sont app elees lois a queue de typ e Weibull. Ce sont essentiellement les lois de la
lasse C
1
dont les onditions de regularite sur V, l'inverse de lafon tion de hasard umulee, sont
assouplies. Le parametre est app ele indi e de queue de typ e Weibull. L'estimation desquantiles
extr^emesp ourles lois a queue de typ eWeibull passe alors parl'estimationde .
1.2.2.1 Estimation de l'indi e de queue de Weibull
Dans [67℄,nous prop osonsl'estimateursuivant du parametre:
^ n = kn 1 X i=1 (log(X n i+1;n ) log (X n kn+1;n )) , kn 1 X i=1 (log 2 (n=i) log 2 (n=k n )) ; (1.9) o u log 2 (t)=log(log (t)), t>1 et (k n
) est une suite d'entiers tels que 1 k
n
<n. Cetestimateur
appara^t naturellement sil'on onsidere lafon tionquantile dene par
q(t)= F 1 (t)=V(log (1=t))=(log (1=t)) `(log(1=t)); (1.10)
etsi l'onremarque quep our settpro hes de0 que
log (q(t)) log (q(s)) = (log
2 (1=t) log 2 (1=s))+log `(log (1=t)) `(log(1=s)) ' (log 2 (1=t) log 2 (1=s)): (1.11)
Cette derniere approximation est justiee par le fait que ` est une fon tion a variations lentes. Il
estimp ortant deremarquerque(1.11)estexa tedansle asdesloisdeWeibull o u`est onstante.
Cette propriete n'est en general pas veriee p our les autres estimateurs de (par exemple [16℄
ou [5℄) e qui se revele penalisant dans la pratique, voir [67℄p our une omparaison des dierents
estimateurssur simulations. La onsistan e de
^ n
yestetablie:
Theoreme 1.2.3 Sous (A1), sik
n !1 etk n =n!0 alors ^ n P ! .
La normalite asymptotique requiert l'hyp othese de se ond ordre habituelle sur la fon tion a v
a-riations lentes `: il existe 0 et b(x)! 0 tels que, uniformement lo alement en 1 quand
x!1, (A.2) :log `(x) `(x) b(x)K (), o uK ()= R 1 u 1
du.Leparametre0 ontr^olelavitessede onvergen edurapp ort`(x)=`(x)
vers 1. La ondition (A2) est la le de voute des preuves de normalite asymptotique p our les
estimateurs basessur les valeurs extr^emes. Nous renvoyonsa [85℄ou [7℄p our d'autresutilisations
dansdes ontextes identiques.Notreresultat estalorsle suivant:
Theoreme 1.2.4 Sous (A1) et(A2), k
1=2 n ( ^ n ) d !N(0; 2
),pour toute suite (k
n ) telleque k n !1;k 1=2 b(log(n=k n ))!0et k 1=2 =log(n=k n )!0: (1.12)
1.2.2.2 Estimation des quantiles extr^emes
Disp osant d'unestimateur
^ n
del'indi e dequeuedeWeibull ,nousprop osonsdans[57℄d'estimer
lequantile x
p n
par l'estimateurWT(Weibull Tail):
^ x WT pn =X n k n +1;n log (1=p n ) log (1= n ) ^ n ; (1.13)
o u, ommepre edemment,
n
=k
n
=n.Laen ore, et estimateurbene ie d'unejusti ation
intui-tive.Poursett pro hesde 0,lafon tionquantile denieen (1.10)verie
q(t) q(s) = V(log (1=t)) V(log(1=s)) ' log (1=t) log (1=s) ;
e qui p ermet, de fa on similaire a l'appro he des ex es de rite paragraphe 1.1.4, de rempla er
l'estimationd'une quantile extr^emeparl'estimationd'unquantile lassique.
En intro duisant n =log (1=p n )=log(1= n
),on a lestheoremesasymptotiquessuivants.
Theoreme 1.2.5 Sous (A1), sik
n !1, k n =n!0 et n 1 alors x^ WT pn =x p n P !1 quand n!1.
Theoreme 1.2.6 Sous (A1) et(A2), si (1.12)est veriee et si
n !1 alors, log (1= n )k 1=2 n log ( n =p n ) ^ x WT p n x pn 1 d !N(0; 2 ):
L'etude du omp ortement de et estimateur sur simulations est basee sur la notion de p ouvoir
d'extrap olationintro duite dans[41℄.
1.3 Estimation dans DA(Fre het)
L'estimation des quantiles extr^emesdans le domaine d'attra tion de Fre het par la metho de des
ex es (1.5) ne essite l'estimation des deux parametres et de la loi GPD. Les diÆ ultes liees
a ette estimation ont ete evo quees dans le paragraphe 1.1.5. Nous prop osons i i une metho de
d'inferen e bayesienne p our tenter de depasser es diÆ ultes.
Cetravailaeterealiseen ollab orationave Jean Dieb olt(CNRS,Universite de Marne-la-Vallee),
Mhamed-Ali El-Aroui (ISG de Tunis) et MyriamGarrido (ENAC,Universite Toulouse 3) dansle
adre de la these de ette derniere ([58℄, Chapitre 3). Une synthese de la metho de est presentee
dans[33℄.
1.3.1 Estimation bayesienne des parametres de la loi GPD
Reparametrisation de la loi GPD. La parametrisation standard de la fon tion de survie
F
GPD
;
de loi GPDde rite en (1.3) est rempla ee par une nouvelle parametrisation mieux adaptee
dans le as > 0 qui nous interesse i i. Deux nouveaux parametresp ositifs = 1= et = =
sont intro duitsetleur oupleestnote=(;).La fon tiondesurvie ainsireparametreeestnotee
F GPD (:j )ets'e rit F GPD (yj )= 1 + y ; y0; (1.14)
etladensite asso ieeest f GPD (yj )= 1 + y 1 ; y0: (1.15)
Nous supp osons disp oser de realisations y = (y
1 ;:::;y
k
) de variables aleatoires indep endantes
et identiquement distribuees Y
1
;:::;Y
k
selon (1.14){(1.15). En pratique, il s'agit d'ex es au-dela
d'un seuil u de variables aleatoires X
1
;:::;X
n
indep endantes et identiquement distribuees selon
une loi appartenant a DA(Fre het). Le p oint de depart de etteetude est la representation de la
densite(1.15) parun melangeintro duite dans[110℄, page157:
f GPD
(yj )=
Z
p(yjz)g(zj )dz; (1.16)
o u p(:jz) est la densite de la loi exp onentielle d'esperan e 1=z denie par p(yjz) = ze
y z I
fy >0g
p our tout z > 0 et o u g(:j ) est la densite de la loi gamma de ouple de parametres = (;):
g(zj ) = ( ()) 1 z 1 e z I fz >0g
: La representation sous forme de melange (1.16) p ermet de
pallier l'absen e de lasse onjuguee p our la loi GPD en onstruisant une lasse quasi- onjuguee
p our laloi GPDapartirde la lasse onjuguee p our laloi gamma.
Classe onjuguee p ourla loi gamma. Ladenitiondela lasse onjugueep ourlaloigamma
rep osesurlaloi Gam ondetyp eI I[27℄.Elle estnoteeGam onI I( ;d)o u >1etd>0sontdeux
parametres.Sa densites'e rit:
;d (x)=I 1 ;d (dx + 1)( (x)) d ( d) dx I fx>0g ; (1.17) o u I ;d
est un o eÆ ient de normalisation. Soit z = (z
1
;:::;z
k
) un ensemble de k realisations de
variables aleatoiresZ
1
;:::;Z
k
indep endantes et de m^eme loi gammade ouple de parametres=
(;).D'apres[27℄,Theoreme2,la densite apriori onjuguee sur ave omme hyp er-parametres
Æ >0 et > >0 est donnee par( )=()(j)o u () est ladensite de la loi Gam on I I
de parametres ==etd=Æ et(j)estladensite de laloi gammade ouple de parametres
(Æ+1;Æ).Les densitesap osteriori orresp ondantes sont alors
(jz)=(jz)(j;z) (1.18)
ave (jz)ladensite dela loiGam on I I de parametres
0 = 0 = 0 etd 0 =Æ 0 ,o u Æ 0 =Æ+k; 0 = Æ + P k i=1 z i Æ + k et 0 = Æ =(Æ+k ) k Y i=1 z i ! 1=(Æ+k ) ; (1.19)
et(j;z)ladensite de laloi gammade ouple de parametres(Æ
0 +1;Æ 0 0 ).
Appli ation a la loi GPD. Nous avons remarque[33℄, paragraphe 2.1,que laloi a p osteriori
de sa hant ys'e rit omme un melangedont ladensite est
(jy ) =
Z
o u q
(:jy )est ladensite denie par
q (zjy ) = p(yjz)g (z) R p(yjz 0 )g (z 0 )dz 0 etg (z)= Z g(zj 0 )( 0 )d 0 ;
ave les notations
g(zj )= k Y i=1 g(z i j )etp(yjz)= k Y i=1 p(y i jz i ):
Il appara^t que la densite (1.20) ne p eut ^etre al ulee expli itement. On a ep endant a es aux
densites onditionnelles (jy ;z)par(1.18) et(zjy ; )en remarquantque
(zjy ; )/p(yjz)g(zj )= k Y i=1 z i e (+y i )z i I fz i >0g ;
et don que p our i = 1;:::;k , onditionnellement a et y
i
, Z
i
suit une loi gamma de ouple de
parametres (+1; +y
i
). Il est alors p ossible (voir par exemple [111℄, Chapitre 5) de simuler
desrealisations a p osterioride sa hant y gr^a ea une hantillonneur de Gibbs. Le prin ip e de la
(m+1)emeiterationest lesuivant:
1. Simulation des z (m+1) i de loi Gamma( (m) +1; (m) +y i ); 2. Simulation de (m+1)
de loi Gam on II(
0 = 0 ;Æ 0 ), ave Æ 0 = Æ+k , 0 et 0 al ules a partir des z (m+1) par l'equation (1.19); 3. Simulation de (m+1) de loi Gamma(Æ 0 (m+1) + 1;Æ 0 0 ).
Les nombreux problemes de mise en uvre de et algorithme sont ab ordes dans [33℄: simulation
d'une loiGam on I I, hoix deshyp erparametresÆ, et , dete tiondu regimestationnaire...
Soit(
j
;
j
),j=1;:::;K une hantillonde K ouples simulesparl'algorithme pre edent,une fois
leregimestationnaireatteint.Ilestalorsp ossibled'estimerle ouple(;)parlamoyenne,lemo de
ou lamedianeempirique de ladistribution pre edente.
1.3.2 Appli ation a l'estimation des quantiles extr^emes
A partir de l'e hantillon (
j
;
j
), j = 1;:::;K pre edent,on al ule K estimations de x
p n
sur la
basede lametho dedes ex es(1.5):
^ x GPD ;j pn =X n kn+1;n j 1 ( n =p n ) 1= j :
Dem^eme,de nombreuxestimateursp euvent^etre al ulesapartirde etensemble devaleurs[33℄.
1.4 Estimation dans DA(Weibull)
Lestravauxpresentesi i sontissusdelathesedeLaurentGardes[55℄ o-en adreeparPierreJa ob
(UniversitedeMontp ellier2)etmoi-m^eme.L'estimationdesquantilesextr^emesdansDA(Weibull)est
basee sur la ara terisation du Theoreme 1.1.3.En remarquant que
F
est approximativement
lineaire au voisinage du p oint terminal x
F ,on endeduit l'approximation F (a) F (b) ' a b ; (1.21)
valable p our a, b, et pro hes de x F
. En donnant des valeurs bien hoisies a es parametres, il
est alors p ossible d'estimer l'indi e des valeurs extr^emes (paragraphe 1.4.1)puis des quantiles
extr^emes(paragraphe1.4.2).
1.4.1 Estimation de l'indi edes valeurs extr^emes
Nousdonnonsdans e paragraphedeuxexemples d'estimateursde qu'ilestp ossible d'obtenirsur
labasedel'approximation(1.21).Danslesdeux as,onp osea=u
n X n;n ,b=X n;n et =v n X n;n o u (u n ) et(v n
) sontdeux suitesde l'intervalle ℄0;1[.Onappro he alors
F(u
n
)parlavariablealeatoire
u n =nave un =IfX n;n >0g n X i=1 IfX i u n X n;n g:
De m^eme, on appro he
F(v n ) par vn =n o u vn
est deni similairement. Nous prop osons deux
approximations p ossibles de
F(X
n;n
) donnant lieu adeux estimateursde .
1.4.1.1 Un estimateur a double seuil expli ite
Dans e paragraphe,on appro he
F(X
n;n
) par0.La validite de l'approximation deduite de (1.21)
qui en resulteestgarantie par[55℄,Theoreme3.2.Sous ertaines onditions sur(u
n ) et(v n ), on a en eet 1 v n 1 u n u n vn P !1:
L'estimateur quien resulteest lesuivant:
^ 1;n = log (1 u n ) log (1 v n ) log ( un ) log ( vn ) :
Sesproprietestheoriquessont etablies dans[55℄, Chapitre3. Enparti ulier, il est montreque
^
1;n
onverge en probabilite vers p our tout <0 et onverge en loi si < 1=2.Le resultat (publie
dans[54℄, Theoreme2.2)estle suivant:
(n F(u n x F )) 1=2 ( ^ 1;n ) d !N 0; (1 1= ) 4 log 2 ( ) ! ; (1.22)
o u estune onstanteappartenantal'intervalle ℄0;1[.Ceresultatestobtenuauprix d'une ondition
de se ond ordre de typ e (A2) et de ontraintes sur les suites (u
n
) et (v
n
). Cep endant, il est
remarquableque lavitessede la onvergen e(1.22)soiten puissan e den. Deplus la onvergen e
presque s ^ure est etablie p our < 1. Neanmoins, l'inter^etde et estimateur est prin ipalement
theorique ar ses p erforman es sur simulations sont medio res. L'estimateur
^
1;n
soure en eet
d'unimp ortantbiais systematiqued ^u sans doutea l'approximation grossierede
F(X
n;n ).
1.4.1.2 Un estimateur a double seuil impli ite
Cettelimitationpratiqueestsurmonteeenappro hant
F(X
n;n
l'approxima-sur(u n ) et(v n ), ona en eet 1 v n 1 u n un 1 v n 1 ! P !1: L'estimateur ^ 3;n
resultantde etteapproximationest deni ommelara ine en de l'equation:
1 v n 1 u n un 1 v n 1 ! =1: (1.23)
Il n'est pasp ossible de tirer de etteequation une formulationexpli ite p our
^
3;n
. Neanmoins, on
prouveque,sous ertaines onditions surlessuites(u
n
)et(v
n
),l'equation(1.23)admetuneunique
solution ave une probabilite qui tend vers 1 quand n tend vers l'inni. La onsistan e faible de
^
3;n
est egalement etablie, voir [55℄,Theoreme 3.7.L'obtention d'autresproprietesasymptotiques
p our etestimateuresta tuellement a l'etude.Son omp ortement sur simulations estsatisfaisant.
1.4.2 Estimation des quantiles extr^emes
Laurent Gardes [55℄, paragraphe 4.2, montre que sur la base de l'approximation (1.21) et d'un
estimateur ^
n
onsistant de ,il est p ossible de onstruire unestimateur duquantile extr^emex
pn .
Pour ela,en onsiderant =
^ n ,a=u n X n;n ,b=x pn et =v n X n;n
dans(1.21),on disp ose d'une
nouvelle approximation impliquant le quantile re her he. La validite de ette approximation est
prouvee dans[55℄,Lemme 4.1ave la onvergen e
x p n v n X n;n x p n u n X n;n ^ n un (np n ) ^ n ^ n vn (np n ) ^ n ! P !1:
Ondeduitalorsde etteapproximationl'estimateursuivant de x
pn : ^ x DAW p n ( ^ n )=u n X n;n n ( ^ n ) ^ n 1 ( un =np n ) ^ n ; o u l'on adeni n ( ^ n )= ^ n X n;n u n v n ^ n un ^ n vn :
L'estimateur du quantile extr^eme ainsi deni est similaire a l'estimateur GPD (1.5). Il fait
in-tervenir un seuil aleatoire u
n X
n;n
et le p our entage de p oints
un
=n depassant e seuil. Notons
qu'i i ep our entageestaleatoirealorsqu'ilestdeterministe(
n
)dans(1.5).Onmontredans[55℄,
Theoreme4.2,quex^
DAW pn ( ^ n
)est onsistantdesque
^
n
estunestimateur onsistantde.Ilappara^t
sursimulations que l'estimateurx^
DAW p n ( ^ 3;n
) bene ie de b onnes p erforman es.
1.5 Tests de queues de distribution
La theoriedesvaleursextr^emes, tellequ'elle est exp oseedans leparagraphe1.1.1,p ermet,gr^a ea
qui en de oulent n'utilisent qu'une p etite partie de l'information presente dans l'e hantillon (par
exemple les k
n
ex es) et sont p eu eÆ a es lorsque le nombre de donnees est p etit ou mo dere.
Pour ette raison, dans des situations on retes, issues de la abilite par exemple, il est plus
interessant de disp oser d'un mo dele parametrique onstruit sur l'ensemble des donnees. Un tel
mo delepresentede plus l'inter^etd'^etre interpretable p our les ingenieurs etd'^etre disp onible dans
la majoritedes logi iels de abilite. Les tests d'adequation lassiques (Cramer von Mises,
Ander-son Darling, ...) p ermettent de sele tionner un tel mo dele. Cep endant, es pro edures testent
essentiellement l'adequation d'un mo dele a la partie entrale des donnees.Les dangers ausespar
l'extrap olation desresultats de es tests aux queues de distribution sont de rits dans [38℄et [82℄.
Pour ela, nous avons developpe une pro edure p ermettant de verier l'adequation d'un mo dele
parametriqueauxvaleursextr^emesdel'e hantillon.Sonprin ip egeneralestde ritparagraphe1.5.1
etplusieurs variantes en sontpresenteesparagraphes1.5.2et1.5.3.
1.5.1 Prin ipe des tests de queue de distribution
Supp osons qu'un testd'adequationusuel ne rejette pas l'hyp othese nulle H
0
selon laquelle F
ap-partient a la famille de mo deles parametriques fF
: 2 g . Le but du test est de ontr^oler
l'adequationdelaqueuede F
b n ,o u b n
estparexemplel'estimateurdumaximumdevraisemblan e
de , aux plus grandesdonneeset de verier si ettequeue de distribution p ermet des extrap
ola-tionsraisonnablesau-deladel'observationmaximale.Ils'agitdon detesterH
0 :F 2fF : 2g ontre H 1 :F 2= fF
: 2g en queue de distribution. Le prin ip e du test estde omparerdeux
estimateursduquantileextr^emex
pn
sousH
0
.Lepremierestl'estimateurparametriqueduquantile
^ x param pn = F 1 b n (p n
).Le se ond est l'estimateurGPDintro duit en (1.5):
^ x GPD pn =X n k n +1;n ^ n ^ n 1 ( n =p n ) ^ n :
Plus pre isement, nous onstruisons sous H
0
un intervalle de onan e IC
de niveau p our la
dieren eentrelesdeuxquantilesestimesetnousrejetonsl'hyp othesenullesix^
GPD p n ^ x param p n = 2IC .
Plusieurs versions du test p euvent ^etre de linees selon le prin ip e de onstru tion de l'intervalle
IC etlesestimateurs ^ n et ^ n
utilisesp our al uler x^
GPD
pn .
1.5.2 Le test ET
Dansle as o uleslois F
onsidereesdansl'hyp othesenulle appartiennent aDA(Gumb el),ilsuÆt
de hoisir ^ n = 0 et ^ n
deni par (1.6). On a alors x^
GPD
pn
= x^
ET
pn
(voir equation (1.7)), et le test
obtenu est app ele test ET. Chronologiquement, il s'agit du premier test que nous avons mis en
uvre.Sonprin ip e aetedenien ollab oration ave Jean Dieb olt[36℄etdesdevelopp ementsont
ete prop oses dans la these de Myriam Garrido [58℄,Chapitre 1.En parti ulier, plusieurs versions
du testET onteteintro duites.
Le test ET asymptotique. Sur labase duTheoreme1.2.2,nousavons onstruitunintervalle
de onan eIC
asymptotique.Le omp ortementasymptotique duniveau etdelapuissan ede e
testaeteetabli[35℄dansle asd'hyp othesessimplesetdeloisappartenantala lasseC.Neanmoins,
l'inter^etde etteversiondu testest uniquement theorique. En eet,la onvergen een loienon ee
Le test ET \b o otstrap" parametrique. Pourpallier ette limitation, nousavonsdeveloppe
une version du test ET basee sur une evaluation par b o otstrap parametrique de l'intervalle IC
.
Nous avonsverie sur simulations que letestainsi onstruitbene ie d'une b onne puissan e [34℄.
En ontrepartie, ette version du test est tres o ^uteuse en temps de al ul. Pour ette raison,
nous avons egalement prop ose une version \b o otstrap" parametrique simpliee. Constatant que
les u tuations de x^ ET pn sont de l'ordre de k 1=2 n et elles de x^ param pn de l'ordre de n 1=2 , nousavons
neglige es dernieres en ne \b o otstrappant" pas l'estimateur parametrique. Le gain de temps est
appre iablelorsque l'estimateurdumaximumdevraisemblan e
^ n
est lourd a al uler, etlap erte
de puissan e p euimp ortante.
1.5.3 Le test GPD
Leprin ip edutestGPDest eluide ritdansleparagraphe1.5.1.Le hoixdesestimateurs
^ n et^ n p ourle al uldex^ GPD pn
aeteetudiedansle adredustagedeDEAdeAb delhakImoussaten[89℄.Pour
desraisonsaussibientheoriques(invarian edesestimateursparrapp ortauxparametresdep osition
etd'e helle)que pratiques (b onne puissan e experimentale), ilest apparu que les estimateurs des
momentsp onderes(de ritsauparagraphe1.1.5)etaientbienadaptes.Nousavonsegalement hoisi
denepasdevelopp erdeversionasymptotiquedutestGPD,toujoursp ourdesraisonsdepuissan e.
Seules les versions b o otstrap etb o ostrapsimpliee onteteprop osees.
1.6 Le logi iel Extremes
Le logi iel Extremesa etee rit parJer^ome E arnot,sous ladire tion onjointede Jean Dieb olt
etmoi-m^emeetdansle adred'un ontratentreEDFetleprojetis2del'INRIA Rh^one-Alp es. Ce
logi iel regroup e quelques unesdesdierentes metho desdemo delisationde queuesdedistribution
etd'estimationdequantilesextr^emesde ritesdans e hapitre.Parexemple, onytrouveplusieurs
fon tions p our estimer l'indi e des valeurs extr^emes ou les parametresde la loi GPD (voir
pa-ragraphe 1.1.5). Les pro edures developpees dans le adre de la these de MyriamGarrido y sont
egalementpresentes.Parexemple,lestestsde queuededistribution de ritsau paragraphe1.5sont
implementes. Ce logi iel, e rit en C++ ave une interfa e Matlab se veut un outil onvivial p our
experimentergraphiquementles pro edures destatistiquedesextr^emes.Il estdisp onible librement
al'adressesuivante:http://www.inrialpes.fr/is2/pub/software/EXTREMESa ompagned'une
do umentation omplete.Un des riptif resumedu logi iel estegalement disp onible [32℄.
1.7 Perspe tives
Je travaille a tuellement a l'extension a tous les domaines d'attra tion de l'estimateur a double
seuil impli ite
^
3;n
, dedie au DA(Weibull) . Le travail mene en ollab oration ave Laurent Gardes
onsiste a rempla er les seuils deterministes u
n
et v
n
par des seuils aleatoires X
n k 0 n +1;n =X n;n et X n k n +1;n =X n;n o u (k n ) et (k 0 n
) sont des suites deterministes tendant vers l'inni moins vite que
n. Le nouvel estimateurde est obtenu enresolvant en l'equation similaire a (1.23):
X n;n X n kn+1;n X n;n X n k 0 +1;n k 0 n 1 k n 1 ! =1:
La onsistan e faible de et estimateur est etablie dans [56℄, Theoreme 1, quel que soit le signe
de , 'est a dire quel que soit le domaine d'attra tion de la loi des observations. Nous avons
egalementmontresous ertaines onditions (voir[56℄,Theoreme2)quelaloilimite del'estimateur
onvenablementrenormaliseestgaussiennesi< 1=2etuneloidesvaleursextr^emessi > 1=2.
Ceresultatlaisse ap enserquelalimitation duresultat(1.22)a < 1=2estbien unene essiteet
non une fa ilite de al ul.
A ourtterme, nousprojetonsde onstruire un nouvelestimateurdesquantiles extr^emesbasesur
etestimateurde .
D'autrepart,le testGPD presenteparagraphe 1.5.3merited'^etre ameliore.Il est en eet
souhai-table d'adapter l'estimateur de utilise suivant le domaine d'attra tion o u se situent les lois F
onsidereesdans l'hyp othese nulle. Par exemple, si F
est un ensemble de lois de typ e Weibull, il
semblepreferable d'utiliser l'estimateurad ho presenteparagraphe 1.2.2plut^otqu'un estimateur
\generaliste".Cette intuition doit ^etre validee sursimulations et,p our ela, lelogi iel Extremes
est unoutil pre ieux.
A plus long terme, je souhaite developp er une orre tion du biais p our les estimateurs prop oses
dans e hapitre. Sous une hyp othese de se ond ordre de typ e (A2) , le terme dominant du biais
desestimateurs estd ^u alafon tionb.Cette fon tionp eutalors^etreestimee [7,102℄dans le adre
d'unemo delederegressionp our orrigerl'estimateur.Cettedemar hedoitp ermettreegalementde
simplier lasele tion du parametre k
n
optimal. Il s'agitd'une se onde dire tion de re her he que
je souhaitedevelopp er enm'appuyant surles travaux existantsp our l'estimateurde Hill [39,80℄.
Enn, l'estimation de frontiere presentee au hapitre suivant est un prolongement naturel de la
Chapitre 2
Estimation de frontiere
Le probleme ab orde dans e hapitreest l'estimation d'un ensemble D b orne de R
d+1
,d1,
a partir d'un ensemble N
n
de p oints disp oses aleatoirement dans elui- i. Nous ne traitons pas
i i le probleme dans toute sa generalite mais nous nous pla ons dans le as parti ulier o u D est
de la forme D = f(x;y) : x 2 E ; 0 y f(x)g; E etant un sous-ensemble de R
d
onnu,
et f une fon tion de E dans R
+
.L'estimation de D se ramene don a l'estimation de f app elee
fon tion frontiere. Le probleme ainsi p ose a ete intro duit initialement par Geroy [59℄. Depuis,
des appli ations se sont developpees en traitement d'images [96, 101℄ et en e onometrie. Dans e
dernier as,f estapp elee lafrontierede pro du tion optimale. Desestimateurssontprop osesselon
que f est supp osee roissante (estimateur FDH, Free Disp osal Hull [31℄)ou on ave et roissante
(estimateurDEA, DataEnvelopment Analysis [43,63℄).Lesestimateurs etudiesi i ne ne essitent
pasd'hyp othesedemono ite surf.Nousetudionsleurs proprietesdansles deux adressuivants:
(a) N
n
est une hantillon dep oints(X
i ;Y
i
)2ER
+
,i=1;:::;n indep endants etidentiquement
distribues surD selonune densite .
(b) N
n
estunpro essusde Poissondemesuremoyennen I
D
, estune onstantestri tement
p ositive, designe la mesure de Leb esgue sur R,et une mesure absolument ontinue par
rapp ort a la mesure de Leb esgue sur R
d
. On note dans e as f(X
i ;Y
i
); i 1g ER
+
l'ensemble desp ointsasso ies.
Nousnous fo alisonsi i surlades riptionde laloi asymptotique d'estimateursnon-parametriques
de f lorsque n tend vers l'inni. Par ommo dite, nous onsiderons parfois les as parti uliers
E =[0;1℄, onstantesur Ddansle as(a)etE =[0;1℄, =dans le as(b).
Nous presentons dans le paragraphe 2.1 les estimateurs de la litterature qui ont inspires nos
tra-vaux. Le paragraphe 2.2 est dedide a la presentation des estimateurs que nous avons prop oses
demandant une partition de D .Cette partition prealable est abandonnee dans le paragraphe 2.3
ave l'intro du tion desestimateursparprogrammationlineaire.Les p ersp e tivessontevo queesau
paragraphe 2.4.
2.1 Nos points de depart
Nostravauxsesont appuyessur deux ontributions a l'estimationde frontiere.Outrele faitde se
pla er dansle asE =[0;1℄,leurp oint ommunestl'intro du tiond'une partitiondu supp ortDen
deE =[0;1℄.Lasuite (k n
),supp oseetendreversl'inniave n,estunparametre ommunauxdeux
metho des d'estimation. La premiere d'entre elles, qui est aussi la premiere a notre onnaissan e
dans le domaine, est due a Geroy[59℄. L'estimateur prop ose est onstruit a partir desk
n p oints
lesplus hautsdans haque elluleD
n;r
.Sesproprietes,detailleesdansleparagraphe2.1.1,relevent
de la theorie desvaleurs extr^emes.La se onde metho deque nous avons onsideree aete prop osee
par Ja ob & Suquet [90℄. La fon tion f in onnue est de omp osee en series orthogonales dont les
o eÆ ients sont estimesa partirdes nombres de p oints dans haque ellule (paragraphe2.1.2).
2.1.1 L'estimateurde Geroy
Ce paragraphe entre dans le adre (a) ave E =[0;1℄, l'ensemble N
n
onsidere est un e hantillon
de p oints (X
i ;Y
i
), i = 1;:::;n indep endants et identiquement distribues selon une densite . Les
valeurs extr^emesde l'e hantillon sont denies par Y
n;r = maxfY i ;(X i ;Y i ) 2 D n;r g, o u l'on a p ose
maxf;g=0.L'estimateur de Geroy[59℄est alorslafon tion onstanteparmor eauxdeniepar
^ f G n (x)= kn X r =1 Ifx2I n;r gY n;r : (2.1)
Dans e m^emearti le,ilest montresous diverseshyp othesessurles fon tionsf etet surlasuite
(k n ) que ladistan e L 1 deniepar d 1 ( ^ f G n ;f)= sup x2[0;1℄ ^ f G n (x) f(x) (2.2)
onvenablement normalisee onverge en loi vers une loi de Gumb el de fon tion de repartitionH
0
denie en (1.1).Plus re emment,Korostelev & Tsybakov[96℄ ont in lu l'estimateur (2.1) dansla
famille plus generale desestimateursp olyn^omiaux parmor eaux
^ f KT n (x; )= kn X r =1 Ifx2I n;r gP n;r (x; ); (2.3)
o u,sur haqueintervalleI
n;r
,P
n;r
(:; )estlep olyn^omededegreenglobanttouslesp ointsetd'aire
minimum. En d'autres termes, il s'agit de resoudre le probleme d'optimisation sous ontraintes
suivant: min Z In;r P n;r (x; )dx s. . P n;r (X i ; )Y i ; X i 2I n;r : (2.4) En parti ulier,on a ^ f G n (x)= ^ f KT n
(x;0).On remarquealorsqued'apres[96℄, Theoreme4.1.1,
l'esti-mateur ^ f
G
n
estminimax si est onstanteetsif est 1-lips hitzienne dansles adressuivants
(i) k n =(n=logn) 1=2 etp our ladistan e L 1 denieen (2.2), (ii) k n =n 1=2 etp ourla distan e L 1 deniepar d 1 ( ^ f G n ;f)= Z 1 0 ^ f G n (x) f(x) dx: (2.5)
Ande ompleter esresultats,nousavonsmontre[61℄ave PierreJa ob(UniversiteMontp ellier2)
etJean Geroylanormaliteasymptotique de l'erreurL
1
onvenablement normalisee:
Theoreme 2.1.1 Si est onstante et si f est -lips hitzienne (0 < 1), k
n = o(n=logn), n=o(k 1+ n ),alors n k 1=2 d 1 ( ^ f G n ;f) E h d 1 ( ^ f G n ;f) i d !N(0;1): (2.6)
Pourprouver(2.6),nousavonsdejaetabli e resultatlorsque N n
estun pro essusde Poisson[77℄,
puis nousavonsutiliselate hnique deGeroy[60℄p our etendreleresultatau as del'e hantillon.
En renfor ant les onditions sur la suite (k
n
), la onvergen e (2.6) est onservee si on rempla e
l'esperan e E[d
1 ( ^ f G n ;f)℄ par k n
=(n ), voir [61℄, Corollaire 2. De m^eme, la onstante p eut ^etre
rempla eeparl'estimateur
^ G n =k n , k n X r =1 Y n;r ;
sans p erturb erla onvergen een loi,[61℄, Corollaire3.
2.1.2 L'estimateurde Ja ob & Suquet
Ja ob & Suquet [90℄ ontadapte lametho dede proje tionsur seriesorthogonales, deja onnue en
estimation de ladensite ou en regression, au as de l'estimation de frontiere.Ces travauxentrent
dans le adre (b) simplie o u E = [0;1℄ et = de sorte que N
n
est un pro essus de Poisson
homogene de mesure moyenne n
2 I
D
, etant une onstantestri tement p ositive et
2
designant
lamesuredeLeb esgue surR
2
.Le prin ip e estlesuivant.Soit(b
n
)une suite d'entiersqui tendvers
l'inni etsoit(e
` )
`2N
unebase orthonormeede L
2
.Le developp ement de f surlabaseest tronque
au (b
n
+1)emetermeet haque o eÆ ient
a ` = Z 1 0 f(t)e ` (t)dt= kn X r =1 Z I n;r f(t)e ` (t)dt (2.7)
est appro he par
a `;k n = k n X r =1 e ` (x r ) Z In;r f(t)dt= k n X r =1 e ` (x n;r ) 2 (D n;r ); (2.8) o u x n;r est le entre de I n;r . En intro duisant N n;r = ℄fY i ;(X i ;Y i ) 2 D n;r g; et en remarquant que E[N n;r ℄=n 2 (D n;r
), lesauteurs prop osent d'estimera
`;kn par ^ a JS `;kn = kn X r =1 e ` (x n;r ) N n;r n : (2.9)
L'estimateur de lafrontieres'e ritdon
^ f JS n (x)= k n X r =1 K n (x;x n;r ) N n;r n ; (2.10) ave K n
designant lenoyaude Diri hlet d'ordre b
n
asso ie a labase(e
` ) deni par K n (x;y)= bn X `=0 e ` (x)e ` (y);(x;y)2[0;1℄ 2 :
Lesauteursetudientalorsdierentstyp esde onvergen ede
^ f
JS
n
versfsousdeshyp othesesgenerales
sur le noyau de Diri hlet asso ie a une base C
1
.La normalite asymptotique p on tuelle de
l'esti-mateur entre sur son esperan e
^ f JS (x) E[ ^ f JS
etablie. Cesresultatssontillustressurl'exemple delabasetrigonometrique.Notonsquelesauteurs
etablissent en parallele les m^emesresultats p our la base de Haar. Neanmoins, les estimateurs de
typ e (2.10) presentent l'in onvenient de ne essiter la onnaissan e du o eÆ ient p our leur mise
en uvre, e qui n'estpasle asde l'estimateur de Geroy(2.1).Cette onstatationest a labase
destravauxde rits dansleparagraphe suivant.
2.2 Estimation a partir de partitions
L'ensemble eparagraphesesitue dansle adre(b), 'estadirequeN
n
estunpro essusdePoisson.
2.2.1 Estimation par proje tion
Les travaux de rits dans e paragraphe ont ete menes en ollab oration ave Pierre Ja ob. Nous
montrons tout d'ab ord dans le paragraphe 2.2.1.1 omment adapter l'estimateur
^ f
JS
n
au as
in onnu en utilisant les valeurs extr^emes du pro essus de fa on similaire a
^ f
G
n
. Le as des bases
non orthogonales estab orde ave l'exemple de la basede Fab er-Shauderdans le adre de la these
de Laurent Gardes, leprin ip e d'estimation etant de riti i paragraphe2.2.1.2.L'ensemble de es
travaux supp oseE =[0;1℄et=.
2.2.1.1 Proje tion sur unebase orthogonale
Leprin ip ed'estimationdes o eÆ ients(a
`
) onsisteareprendrel'approximation(2.8)danslaquelle
2
(D n;r
) estestimeeparl'aire d'un re tangle de baseI
n;r etde hauteur[0;Y n;r ℄: ^ a GJ `;k n = kn X r =1 e ` (x n;r ) Y n;r k n : (2.11)
L'estimateur de lafrontieres'e ritdon
^ f Pr n (x)= kn X r =1 K n (x;x n;r ) Y n;r k n ; (2.12)
et ne ne essite pas la onnaissan e de .L'in onvenient de e typ e d'estimateurs provient du fait
queY n;r =k n estunestimateurde 2 (D n;r
)biaiseinferieurement ommelemontreledevelopp ement
suivant: E Y n;r k n = 2 (D n;r ) 1 n +o n k 4 n ;
etablidans[76℄,Lemme2,dansle aso uf estune fon tionC
1
,etsousles onditions n=o(k
2
n
)et
k n
=o(n=logn). Il est ep endant p ossible de reduire e biais en mo diant l'estimateur (2.11) de
fa on a eliminer lefa teur1=(n ):
^ a GJ;2 `;k n = k n X e ` (x n;r ) Y n;r +Z n k n ; (2.13)
o u Z n
estlavariable aleatoiredeniepar
Z n = 1 k n kn X r =1 Z n;r ; (2.14) ave Z n;r =minfY i ;(X i ;Y i )2D n;r
g.Cette orre tionde biais estjustieeparlefaitqueZ
n;r =k
n a
un omp ortement symetrique aY
n;r =k
n
.L'estimateur de lafrontiere orresp ondant estalors
^ f Pr ;2 n (x)= kn X r =1 K n (x;x n;r ) Y n;r +Z n k n : (2.15)
Lesestimateurs(2.12)et(2.15)s'e rivent ommedes ombinaisonslineairesdesvaleursextr^emesde
N n
.Leurs proprietesasymptotiques dep endent en grande partiedu omp ortement des o eÆ ients
de ette ombinaison lineaire et don du noyau de Diri hlet de la base utilisee. Deux as tres
dierentsonteteenvisages:les bases C
1
etlabasede Haar.Dans esdeux situations onp ose
Pr n (x)= k 1=2 n n K 1=2 n (x;x): (2.16) Bases C 1
. Cettesituationestetudieeen detailsdans [76℄.En parti ulier,lanormalite
asympto-tiquede( Pr n (x)) 1 ( ^ f Pr n (x) E [ ^ f P r n (x)℄)et( Pr n (x)) 1 ( ^ f Pr;2 n
(x) f(x))estetablieax2[0;1℄xesous
diverses onditions sur le noyau de Diri hlet ([76℄, theoremes2 & 3). Cette situation est illustree
ave labase trigonometriquedont lenoyaude Diri hlet est donne par
K n (x;y)= sin(1+b n )(x y) sin(x y) six6=y; 1+b n sinon :
Les onditions de onvergen eseree riventalors simplement en fon tiondes suites(k
n
)et(b
n ).
BasedeHaar. Ce asestpresentedans[75℄.LabasedeHaarestdenieapartird'unesub division
dyadique fJ
` g
`1
de[0;1℄.Pour haque entier naturel`,l'intervalle J
`
est deni par
J ` = p ` 2 q ` 1 ; p ` +1 2 q ` 1 ; o u p ` etq `
sont les entiersdeterminesde maniere unique par `=2
q ` 1 +p ` et0p ` <2 q ` 1 . La
basede Haar estdeniepar:
e 0 =If[0;1℄g; e ` =2 q ` 1 2 (IfJ 2` g IfJ 2`+1 g);`1:
Le nombrede termesdansledevelopp ement de f surla baseest ne essairementune puissan e de
deux:h n +1=2 b 0 n ,b 0 n
2N,etonimp ose deplusk
n = n (b n +1), n 2N
desortequelapartition
denie parlesfI
n;r
g soitunraÆnement de elle asso ieeaux fJ
`
g.Ainsi, p our tout`h
n
,J
` est
et on a ardR(n;`) = n
. Sous es onditions et si x 2 J
`
, les o eÆ ients p onderant les valeurs
extr^emesdansles estimateurs(2.12) et(2.15)sont donnes par
K n (x;x n;r ) = b n +1 sir2R n;` ; 0 sinon: L'estimateur ^ f Pr n
estalorstoutsimplementlamoyennearithmetiquede
n
valeursextr^emes.Lorsque
n = 1, l'estimateur ^ f Pr n
se reduit a l'estimateur de Geroy
^ f
G
n
rapp ele (2.1). Dans e adre,
et sous ertaines onditions sur la suite (k
n
), nous avons montre [75℄, Theoreme 4 que
^ f
Pr
n (x)
onvenablement normalise onverge en loi a x 2 [0;1℄ xe vers une loi de Weibull des valeurs
extr^emesdefon tion derepartitionH
1
denieen (1.1).Par ontre,lorsque
n
!1,on retrouve
une omp ortement analoguea elui apparaissant ave les basesC
1 .La normalite asymptotique de ( Pr n (x)) 1 ( ^ f Pr n (x) E[ ^ f P r n (x)℄) et ( Pr n (x)) 1 ( ^ f Pr ;2 n
(x) f(x))est etablie a x 2[0;1℄xe dans [75℄,
theoremes5&7ave
Pr
n
(x)intro duiten(2.16).Enn,nousavonsmontrelanormaliteasymptotique
de l'erreur L
1
entre l'estimateur de Haar et la vraie frontiered
1 ( ^ f Pr n ;f) dans le as o u N n est un
pro essus dePoisson[68℄:
Theoreme 2.2.1 Supposons f -lips hitzienne(0< 1). Si k
n
=o(n=logn), n=o(h
1+ n ) et k n =o(h 4=3 n ) alors n k 1=2 n d 1 ( ^ f Pr n ;f) E h d 1 ( ^ f Pr n ;f) i d !N(0;1): (2.17)
Notons que e resultat englob e les deux as opp oses
n
= 1 (estimateur de Geroy) et
n
! 1.
En renfor ant les onditions sur la suite (h
n
), la onvergen e (2.17) est onservee si on rempla e
l'esperan e E h d 1 ( ^ f Pr n ;f) i park n
=(n ),voir [68℄, Theoreme1.
2.2.1.2 Cas d'une base non-orthogonale
L'exempledelabasedeFab er-ShauderestetudiedanslathesedeLaurentGardes[55℄,Chapitre1.
LabasedeFab er-Shauderestdenieapartirdelasub division dyadique fJ
` g
`1
de[0;1℄intro duite
dansleparagraphe pre edent.Lesfon tions qui la omp osent sont ontinuesetsont donneespar
e 1 (x)=Ifx2[0;1℄g; e 0 (x)=xIfx2[0;1℄g; etp our `1 par e ` (x)=2 q ` x p ` 2 q ` 1 Ifx2J 2` g x p ` +1 2 q ` 1 Ifx2J 2`+1 g : Les suites (b n ) et (k n
) sontdenies de lam^eme maniereque p our l'estimateurde Haar.
L'estima-teur ^ f
LG
n
obtenu s'e rit en ore sous la forme (2.15) o u l'expression du noyau est donnee par [53℄,
Prop osition 1.Suivant lesordresdegrandeur resp e tifsde (b
n )et(k n ), ladieren e ^ f LG n (x) f(x)
onvenablementnormalisee onvergeenloiversuneloidesvaleursextr^emes(voir[53℄,Theoreme5)
ou vers uneloi normale entree reduite(voir [53℄,Theoreme7).
2.2.2 Estimation par la methodedu noyau
Les travaux de rits dans e paragraphe ont ete menes en ollab oration ave Pierre Ja ob et sont
que E(N n
(D )) = n. Formellement, l'estimateur de la frontiere base sur la metho de du noyau est
semblable a (2.12).Il s'e rit ^ f Ke n (x)= kn X r =1 K n (x x n;r ) Y n;r k n ; (2.18) o u K n
est deni par
K n (t)= 1 h n K t h n ; t2R: (h n
) designe unesuite dereelsp ositifstendantvers0parfoisapp elee fen^etredelissage etK estun
noyau de Parzen-Rosenblatt. Nous avonsegalement intro duit
^ f
Ke;2
n
,une versionde etestimateur
orrigee du biais, ^ f Ke;2 n (x)= kn X r =1 K n (x x n;r ) Y n;r +Z 0 n k n ;
o u, ontrairement a(2.14),la orre tionde biais denie par
Z 0 n = 1 n k n kn X r =1 Y n;r ;
ne faitapp el qu'adesobservations situees auvoisinagede lafrontiere.La normalite asymptotique
a x2℄0;1[ xede ( Ke n ) 1 ( ^ f Ke n (x) E[ ^ f Ke n (x))℄ et( Ke n ) 1 ( ^ f Ke;2 n
(x) f(x))estetabliep our
Ke n = k 1=2 n n h 1=2 n Z R K 2 (t)dt 1=2 ; (2.19)
et sous diverses onditions sur le noyau K, la regularite de la fon tion f et les suites (k
n
) et
(h n
), voir theoremes 3 & 5. La onvergen e en loi n'a lieu i i que sur l'interieur de l'intervalle
[0;1℄. De m^eme,
^ f
Ke
n
ne onverge uniformement vers f que sur les ompa ts de ℄0;1[, voir par
exemple [78℄, Theoreme1 ou Theoreme2.Ce mauvais omp ortement desestimateursa noyau sur
les b ords de l'intervalle d'estimation est bien onnu, il aeteegalement onstatedans la pratique.
Des metho des de symetrisation des donnees ont ete prop osees an de pallier es limitations. Par
exemple, l'appli ation de late hnique de rite dans[25℄a
^ f
Ke;2
n
onduit al'estimateursuivant:
^ f Ke;3 n (x)= kn X r =1 (K n (x x n;r )+K n (x+x n;r )+K n (x+x n;r 2)) Y n;r +Z n k n :
Lesproprietesasymptotiquesde
^ f
Ke;2
n
surles ompa tsde ℄0;1[p euvent alors^etreetenduesa
^ f
Ke;3
n
surl'intervalle [0;1℄.
2.2.3 Estimation par la methodedu noyau generalise
Lestravauxpresentesi isontissusd'une ollab orationave Ludovi Menneteau (Universite
Mont-p ellier 2).La famille d'estimateursprop osee[79℄englob elesestimateurs
^ f Pr n et ^ f Ke n ,touten orant