Contributions à l'inférence statistique semi- et non-paramétrique

(1)

HAL Id: tel-00006453

https://tel.archives-ouvertes.fr/tel-00006453

Submitted on 13 Jul 2004

HAL is a multi-disciplinary open access

archive for the deposit and dissemination of

sci-entific research documents, whether they are

pub-lished or not. The documents may come from

teaching and research institutions in France or

abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est

destinée au dépôt et à la diffusion de documents

scientifiques de niveau recherche, publiés ou non,

émanant des établissements d’enseignement et de

recherche français ou étrangers, des laboratoires

publics ou privés.

non-paramétrique

Stéphane Girard

To cite this version:

Stéphane Girard. Contributions à l’inférence statistique semi- et non-paramétrique. Mathématiques

[math]. Université Joseph-Fourier - Grenoble I, 2004. �tel-00006453�

(2)

UNIVERSITE JOSEPH FOURIER - GRENOBLE I

U.F.R. D'INFORMATIQUE

ET DE MATH

EMATIQUES APPLIQU

EES

Memoired'habilitation

presente par

Stephane GIRARD

en vuede l'obtention du dipl^omed'Habilitationa Dirigerdes Re her hes del'

Universit

e Joseph Fourier

Spe ialiteInformatiqueetMathematiquesAppliquees

Contributions a l'inferen e statistique

semi- et non-parametrique

Soutenan e le6 juillet2004 devant le jury omp osede

Jean-NoelBACRO Professeur, Universite Montp ellier 2 Examinateur

Philipp e BESSE Professeur, Universite Universite PaulSabatier Rapp orteur

GillesCELEUX Dire teur de Re her hes, INRIA futurs Examinateur

Irene GIJBELS Professeur, Universite Catholique de Louvain Rapp orteur

IvetteGOMES Professeur, Universite deLisb onne Rapp orteur

AnatoliIOUDITSKI Professeur, Universite Joseph Fourier Examinateur

(3)

(4)

Jetiens a remer ierPhilipp e Besse,IreneGijb els etIvette Gomesp our avoirbienvoulu

onsa- rerunpartdeleurtempsalale ture ritiquede ememoireetalareda tiondeleurrapp ort.Mes

remer iements s'adressent aussi a Jean-Noel Ba ro, Gilles Celeux et Anatoli Iouditski qui m'ont

fait l'honneurde parti ip er au jury de ettehabilitation.

J'aimeraisremer ier i i les membres desequip es de re her he qui m'ont a ueilli depuis 1993:

le departement Systemesdu LETI/CEA, le departement Image de l'ENST Paris, le projetis2 de

l'INRIARh^one-Alp es, leLab oratoiredeProbabilitesetStatistiquedel'UniversiteMontp ellier2et

leLab oratoiredeMo delisationetCal uldel'UniversiteGrenoble1.Plusparti ulierement,j'adresse

masin erere onnaissan e a mes o-auteurs itestout au longde e memoire.

Enn,je voudrais exprimer ma gratitudea Fabri e Bellet p our m'avoirfourni l'equip ement et

(5)

(6)

Table des matieres

Intro du tion 3

1 Estimation de quantiles extr^emes 5

1.1 La theorie desvaleurs extr^emes . . . 5

1.1.1 Le theoremedes valeurs extr^emes. . . 6

1.1.2 Le theoremede Pi kands . . . 6

1.1.3 Des ription desdomaines d'attra tion . . . 7

1.1.4 Metho dedesex esp our l'estimationdes quantiles extr^emes . . . 7

1.1.5 Estimation des parametresde laloi GPD . . . 8

1.2 Estimation dansDA(Gumb el) . . . 8

1.2.1 Proprietesasymptotiques del'estimateurET . . . 8

1.2.1.1 Etudedu termedeterministe . . . 9

1.2.1.2 Etudedu termesto hastique . . . 10

1.2.2 Cas deslois aqueue de typ e Weibull . . . 10

1.2.2.1 Estimation del'indi e de queue deWeibull . . . 11

1.2.2.2 Estimation desquantiles extr^emes . . . 12

1.3 Estimation dansDA(Fre het) . . . 12

1.3.1 Estimation bayesienne des parametresde laloi GPD . . . 12

1.3.2 Appli ation a l'estimationdesquantiles extr^emes . . . 14

1.4 Estimation dansDA(Weibull) . . . 14

1.4.1 Estimation de l'indi e desvaleurs extr^emes . . . 15

1.4.1.1 Unestimateura double seuil expli ite . . . 15

1.4.1.2 Unestimateura double seuil impli ite . . . 15

1.4.2 Estimation des quantiles extr^emes . . . 16

1.5 Testsdequeues de distribution . . . 16

1.5.1 Prin ip e destests dequeue de distribution . . . 17

1.5.2 Le testET . . . 17

1.5.3 Le testGPD . . . 18

1.6 Le logi iel Extremes . . . 18

1.7 Persp e tives . . . 18

2 Estimation de frontiere 21 2.1 Nos p oints de depart . . . 21

(7)

2.2 Estimation a partirde partitions . . . 24

2.2.1 Estimation par proje tion . . . 24

2.2.1.1 Proje tionsur une baseorthogonale . . . 24

2.2.1.2 Casd'une basenon-orthogonale . . . 26

2.2.2 Estimation par lametho dedu noyau . . . 26

2.2.3 Estimation par lametho dedu noyau generalise . . . 27

2.2.3.1 Cadrede l'etude . . . 28

2.2.3.2 Comp ortementasymptotique . . . 28

2.2.3.3 Exemples . . . 29

2.2.4 Illustration sursimulations . . . 31

2.3 Estimation parprogrammationlineaire . . . 31

2.3.1 Constru tion de l'estimateur . . . 31

2.3.2 Lien ave d'autresmetho des. . . 33

2.3.3 Proprietesasymptotiques . . . 34

3 Redu tion de dimension et analyse d'images 37 3.1 Lesmo deles auto-asso iatifs . . . 37

3.1.1 Exemple de l'analyse en omp osantes prin ipales . . . 38

3.1.2 Denition desmo delesauto-asso iatifs . . . 39

3.1.3 Constru tion etproprietes . . . 41

3.1.4 Deux mo deles parti uliers . . . 41

3.1.4.1 Lesmo delesauto-asso iatifs lineaires . . . 42

3.1.4.2 Lesmo delesauto-asso iatifs de regression . . . 42

3.1.5 Mise en uvre . . . 43

3.1.5.1 Estimation dela fon tionde regression . . . 43

3.1.5.2 Determinationdesdire tionsrevelatri es . . . 43

3.2 Appli ation en analysed'images. . . 44

3.2.1 Re onstru tion apartir d'uneseule proje tionradiographique . . . 45

3.2.2 Representationde bases d'images . . . 46

4 Estimation de ourb es de referen e 51 4.1 Covariableunidimensionnel le . . . 51

4.1.1 Quantiles onditionnels et ourb es de referen e . . . 52

4.1.2 Metho desnon parametriquesd'estimation desquantiles onditionnels . . . . 53

4.1.3 Comparaison sursimulations des troismetho desnon parametriques . . . 54

4.1.4 Appli ation a desdonneesreelles . . . 55

4.1.4.1 Lesmetho desd'estimation . . . 55

4.1.4.2 Resultats . . . 57

4.2 Covariablemultidimensionnell e . . . 58

4.2.1 Asp e ts theoriquesdelaredu tion de dimension en regression. . . 59

4.2.2 Pro edure d'estimation . . . 61

(8)

4.2.5 Appli ation a desdonneesreelles . . . 65

5 Persp e tives 67

5.1 Constru tion etestimationde opules . . . 67

5.2 Domaines d'appli ation . . . 68

(9)

(10)

Introdu tion

Cememoireestune synthesede mona tivite dere her he depuis mathesedebuteeen o tobre

1993.Lestravauxpresentess'ins rivent dansle adrede l'inferen e statistique au sens large. Plus

pre isement,ils s'arti ulent autourdes themessuivants:

{estimationde quantilesextr^emes,

{estimationde frontiere,

{redu tion de dimension en analyse d'images,

{estimationde ourb es dereferen e.

Mes ontributions a es quatredomaines sont de rites en autant de hapitres, numerotesde 1 a4,

p ouvant ^etre lus indep endamment.

Le Chapitre 1 est onsa re a l'estimation de quantiles extr^emes. Le quantile x

pn

d'ordre p

n

d'une variable aleatoire X est le nombrequi a probabilite p

n d'^etre depassee:P(X >x pn )= p n : Dansle aso up n

<1=n, equantileestditextr^eme arilest\engeneral"superieural'observation

maximale.L'estimationdetelsquantilesne essitedesmetho dessemi-parametriquesd'extrap olation

au-dela de l'observation maximale faisant leminimumd'hyp otheses surlaloi de X.

Le probleme ab orde dans le Chapitre 2 est l'estimation d'un ensemble D a partir de p oints

disp osesaleatoirement dans elui- i. Le problemen'estpas traitei i dans toute sageneralitemais

on serestreint au as d'ensembles de laforme D=f(x;y):x2 E ; 0 y f(x)g;E etant un

sous-ensemblede R

d

onnu,et f une fon tionde E dansR

+

in onnue, sibien quel'estimation de

Dse ramene a elle de lafon tionfrontieref.

Lesmetho des deredu tion de dimension non-lineaires intro duites Chapitre3 ont ete motivees

pardes appli ations al'analyse d'images.Une imagep eut en eet^etre representeeparun ve teur

degrandedimensionetlesmetho desderedu tiondedimension lineairessontsouventmaladaptees

a representerles deformationsm^emesimples d'une image.

Dansle Chapitre4 denouvellesmetho dologiesp our l'estimation de ourb esde referen essont

presentees.Cesappro hessontbaseessuruneestimationnon-parametriquede quantiles

ondition-nels pre edeesi b esoinest d'uneetap ede redu tion de dimension de la ovariable.

Enn, je montre dans le dernier hapitre de e do ument omment la onfrontation de es

domaines de re her he ave d'autresthematiques fait naitrede nouvelles p ersp e tives. Avant ela

j'aimeraissouligner les liens qui unissent esre her hes.

Toutd'ab ord, les problematiques des hapitres 1,3 et 4 sont issues de ollab orations ave des

industriels,resp e tivementEDF(ele tri itedeFran e),leCEA( ommissariatal'energieatomique)

(11)

statistiqueaudevelopp ementd'outilslogi ielsl'implementant.Dansle asdel'estimationde

quan-tiles extr^emesetde ourb es de referen e,les logi iels sont mis a ladisp osition de tous [32,50℄.

Ensuite, les quatre domaines de re her he ab ordes font app el a des themes ommuns. Ainsi,

l'estimationde frontiere,de ourb es de referen eetlaredu tion dedimension enanalyse d'images

releventtoutestroisdel'estimationfon tionnelle,etestimationdequantilesextr^emesoude ourb es

dereferen esfontapp eladesmetho dessemi-parametriques.Notonsque esdeuxdernieresprobl

e-matiquesasso ieesal'estimationdefrontierep euvent^etre onsiderees ommedierentsasp e ts de

l'estimationde quantiles, onditionnels ounon.D'autrepart lesou i de laredu tionde dimension

seretrouve a lafoisen analyse d'imagesetdans le adre del'estimation de ourb es de referen e.

Conventions

Les notationssuivantes seront utiliseesdans e memoire:

{Si (A

n

) et(B

n

) sontdeux suitesreelles p ositives, one ritA

n B n lorsque 0< lim n!1 infA n =B n lim n!1 supA n =B n <+1: A n

0 s'interpreteparA

n !0. Onnote A n B n si A n =B n !1 quandn!1:

{La onvergen een loi est notee

d

! etla onvergen eenprobabilite est notee

P

! .

Enn,dansles hapitres suivants,lesresultatssontparfoisenon essousdeshyp othesessimpliees

(12)

Chapitre 1

Estimation de quantiles extr^emes

Supp osons que l'on disp ose de n observations x

1 ;:::;x

n

d'une grandeur physique mo delisee

par une variable aleatoire X.Le quantile x

pn

d'ordrep

n

de X est la quantite qui a la probabilite

p n d'^etre depassee: P(X > x p n ) = p n : Dans le as o u p n

< 1=n, e quantile est dit extr^eme

ar il est \en general" superieur a l'observation maximale. Plus pre isement, si X

n;n

designe la

maximum de n variables aleatoires indep endantes et de m^eme loi que X,alors np

n !0 implique P(x p n >X n;n )!1 quandn!1.

Lesproblemesd'estimationde quantilesextr^emessetrouvent typiquement en hydrologie:a partir

de mesures x

1

;:::;x

n

de debit d'une riviere sur 50ans, estimer le debit de la rue du sie le. Les

problemesab ordesdans e hapitretrouvent ep endant leurmotivationdansundomainedierent,

laabilite.A l'ex eption duparagraphe1.4,lesresultatsobtenus i iont eneetetea quisdansle

adre d'une ollab oration de 7 annees entre le projetis2 de l'INRIA Rh^one-Alp es et la dire tion

desetudes etre her he de EDF.La on lusion de ette ollab oration aeteledevelopp ement d'un

logi iel d'etudedesqueuesde distribution.

Nous presentons au paragraphe 1.1 la theorie desvaleurs extr^emes, etla notion de domaine

d'at-tra tion, quisont ala basedes metho desdeveloppees i i.Lesparagraphes1.2 a 1.4presentent les

metho des d'estimation des quantiles extr^emes, lassees par domaine d'attra tion,que nousavons

prop osees.Un testd'adequationdedieauxqueuesde distribution etutilisantlanotion de quantile

extr^eme est intro duit paragraphe 1.5. Le logi iel Extremeso u sont implantees quelques unes de

es metho desest brievement presenteparagraphe 1.6.Enn,quelques p ersp e tives sont prop osees

paragraphe 1.7.

1.1 La theorie des valeurs extr^emes

SoitX unevariablealeatoirereelledefon tionderepartitionF etdefon tiondesurvie

F =1 F.

On note x

F

= supfx 2R;F(x) < 1gle p oint terminal de F. On intro duit egalement u x

F un

reelapp ele seuil.L'ex esY deX au deladu seuil u estlavariable aleatoiredenieparY =X u

quandX>u.SoitfX

1

;:::;X

n

gune hantillondenvariables aleatoiresindep endantes etdem^eme

loi queX et soitX

1;n

X

n;n

lesstatistiques d'ordreasso iees.

La theoriedes valeurs extr^emesetablit deuxtyp esde omp ortement asymptotique.D'une part,le

theoreme des valeurs extr^emes donne la loi asymptotique de X

n;n

(13)

theoreme de Pi kands donne la loi asymptotique de l'ex es Y quand le seuil u tend vers le p oint

terminal x

F

.Ce resultatest presentedansleparagraphe 1.1.2.

1.1.1 Le theoreme des valeurs extr^emes

Theoreme 1.1.1 Sous ertaines onditions de regularite sur F, il existe 2 Ret deux suites

reelles( n ) n1 et ( n ) n1 ( n >0) tels que 8x2R; lim n!1 P( 1 n (X n;n n )x)= lim n!1 F n ( n + n x)=H (x); o u H

est lafon tion de repartitionde la loidesvaleurs extr^emes (EVD):

H (x)= ( exp h (1+x) 1= + i si 6=0; o u y + =max(0;y): exp( exp( x)) si =0: (1.1)

Les onditions de regularite sur F sont de rites dans [19℄, page 108 et [46℄, page 54. Elles sont

veriees p our la plupart des lois usuelles. La loi de fon tion de repartition H

est app elee loi

des valeurs extr^emes, et le parametre est app ele indi e des valeurs extr^emes. Si F verie le

Theoreme1.1.1,on dit que F appartient au domained'attra tion de H

.On distingue alors trois

as:

{ si <0,F appartient au domained'attra tionde Weibull, etl'on noteF 2DA(Weibull) ,

{ si =0,F appartient au domained'attra tionde Gumb el, etl'on noteF 2DA(Gumb el),

{ si >0,F appartient au domained'attra tionde Fre het, etl'on noteF 2DA(Fre het).

Des des riptions de estrois domainesd'attra tion sont prop oseesdansle paragraphe1.1.3.

1.1.2 Le theoreme de Pi kands

Lafon tionderepartitiondel'ex esY au-deladuseuil uestnoteeF

u

,lafon tiondesurvieasso iee

s'e ritp our x0: F u (x)=P(X u>xjX>u)= F(u+x)= F(u):

Le theoremede Pi kands [107℄ donne une approximation de ettefon tion de survie (ou de fa on

equivalentede lafon tionde repartition)lorsque le seuil u estpro he du p oint terminal x

F .

Theoreme 1.1.2 F appartient au domaine d'attra tion de H

si et seulement si il existe une

fon tion telleque

lim u!x F sup 0<x<x F u F u (x) F GPD ; (u) (x) =0; (1.2) o u F GPD ;

estlafon tion desurvie de la loide Pareto generalisee(GPD):

F GPD ; (x)= (1+x=) 1= si 6=0; exp ( x=) si =0; (1.3)

denie pour x0 si 0 et 0x = sinon.

RemarquonsquesiF 2DA(Gumb el),alors

F

GPD

0;

,lafon tiondesurvieasso ieeparletheoremede

Pi kands,estlafon tiondesurvied'uneloiexp onentielled'esperan e.Deplus,siF estelle-m^eme

(14)

1.1.3 Des ription des domaines d'attra tion

Nousrapp elons les onditions ne essairesetsuÆsantessur unefon tionderepartitionp ourqu'elle

appartienne a un domaine d'attra tion.Ces ara terisations font app el aux lasses de fon tions a

variations regulieres RV

et de fon tions a variations regulieres lisses SR

[11℄, paragraphes1.4,

1.5,1.8,2.3et2.4.Danslesdeux as,2Restapp eleindi edevariationsregulieres,etsi=0,on

parle de variations lentes (lisses).Lesdomaines d'attra tionde Fre hetetWeibull se ara terisent

alorsaisement a partirde RV

0 .

Theoreme 1.1.3

(i) F appartienta DA(Fre het)ave unindi edevaleursextr^emes >0sietseulement

si(a) x F =+1 et(b) il existe `2RV 0 tel que F(x)=x 1= `(x):

(ii) F appartienta DA(Weibull)ave unindi edevaleursextr^emes <0sietseulement

si(a) x F <+1 et(b) il existe `2RV 0 tel que F(x)=(x F x) 1= `((x F x) 1 ).

Le domaine d'attra tion de Gumb el p eut, quant a lui, ^etre de rit a partir des fon tions de typ e

Von-Mises [42℄, Theoreme 3.3.26. Cep endant, il n'en existe pas de ara terisation simple. Nous

prop osons i-dessousunexemplede lassedeloisrepresentatifdeladiversitedesloisde edomaine

d'attra tion.Cedernier ontientdesfon tionsde repartitionF de p ointterminal niou inni. I i,

nousnouslimitonsause ond as.Pluspre isement,nousdenissonslafamillesuivantedefon tions

de repartition,intro duite dans[37℄.

Denition 1.1.1 Une fon tion derepartition F appartient a C DA(Gumbel)si

(i) F estinversible.

(ii) La fon tion V :x2R + !V(x) = F 1

(exp ( x))2R(fon tion de hasard umulee

inverse)appartient a C 1 [C 2 [C 3 ave C 1 =SR ,>0, 6=1; C 1 1 =C 1 1;1 [C 1 1; =fV 2SR 1 : V 00 =0g[fV 2SR 1 : jV 00 j2SR 1 g, 0, C 2 =fV 2SR 0 ;V 0 2SR 1 g; C 3 =fV =expg;g2SR ;0<<1g:

Pour on lure eparagraphelesdomainesd'attra tionasso iesaquelquesloisusuellessontpre ises.

Exemple 1.1.1

{ Domaine d'attra tion de Fre het ( > 0): Loi de Burr, loi de Fre het, loi de Pareto, loi de

Student.

{ Domaine d'attra tion de Weibull (<0): Loi uniforme (= 1),loi inversede Burr.

{ Domaine d'attra tion de Gumbel ( = 0): Loi exponentielle (C

1 1;1 ), loi gamma (C 1 1;1 ), loi normale(C 1 1=2 ), loide Weibull (C 1 1=

, etantle parametredeforme), loidouble-exponentielle

(C 2

) de fon tion desurvie

F(x)=exp( exp(x)),loi lognormale(C

3

1=2 ).

1.1.4 Methode des ex es pour l'estimationdes quantiles extr^emes

Nous donnons i i les grandes lignes de la metho de des ex es, denie dans [15℄ et basee sur le

theoreme de Pi kands. Rapp elons que l'on her he a estimer le quantile extr^eme x

pn deni par F(x p ) =p n ave 0<p n

<1=n. Pour ela, on intro duit un se ond quantile u

n

(15)

deni par F(u n ) = n , ave 1=n n

< 1.L'heuristique de lametho de desex es onsiste alors a

appliquer l'approximation(1.2)ave u=u

n etx=x p n u n

p ourobtenirl'approximation ~x

GPD pn de x p n : ~ x GPD pn =u n +( F GPD ; (u n ) ) 1 (p n = n )=u n (u n ) 1 ( n =p n ) : (1.4)

L'estimateur orresp ondant estobtenuenestimantu

n parX n k n +1;n o uk n =n n etenrempla ant (u n

) et par des estimateurs appropries ^

n et

^

n

onstruits sur la base des ex es ordonnes

fX n i+1;n X n kn+1;n ; i = 1;:::;k n

1g. Des exemples sont donnes au paragraphe 1.1.5. On

obtient alors: ^ x GPD p n =X n kn+1;n ^ n ^ n 1 ( n =p n ) ^ n : (1.5)

Un as parti ulier imp ortant de et estimateur est l'estimateur ET (Exp onential Tail) intro duit

dans [15℄. Il onsiste a supp oser que lafon tion de repartitionF estdans le domained'attra tion

deGumb el.Deslors,ilsuÆtdep oser

^ n

=0dans(1.5)etd'estimer(u

n

)parlamoyenneempirique

desex es,

^ n = 1 k n 1 kn 1 X i=1 (X n i+1;n X n kn+1;n ); (1.6)

p our obtenirl'estimateurETde x

pn : ^ x ET pn =X n k n +1;n +^ n log ( n =p n ): (1.7)

1.1.5 Estimation des parametres de la loi GPD

L'estimationdesparametres etde laloi GPDapartird'une hantillond'ex esestunprobleme

deli at en pratique. La prin ipale diÆ ulte provient du fait que,sur un e hantillon de n

observa-tions,onnep eutdisp oserquedek

n

ex esp ourrealiserl'estimation(le hoix dunombrek

n

d'ex es

estegalement unproblemeen lui-m^eme).Dans e ontexte,l'estimateurdu maximumde

vraisem-blan e[115℄estp euutilise ard'unepart,ilp osedesproblemesnumeriquesetd'autrepartilestp eu

p erformant p our desnombres d'ex esinferieurs a 500[28,81℄. Parmi les nombreuses prop ositions

existantes p ourpallier eslimitations itonsles estimateursdes momentsp onderes[87℄.

1.2 Estimation dans DA(Gumbel)

Notre ontribution a l'estimationdes quantiles extr^emesdansle domaine d'attra tionde Gumb el

p orte sur deux p oints. Dans un premier temps, nous avons etudie les proprietes asymptotiques

de l'estimateur ET denien (1.7).Dans un se ond temps,nous avons prop ose un estimateurdes

quantilesextr^emesdedie ala lasse C

1

,>0.

1.2.1 Proprietes asymptotiquesde l'estimateur ET

Cetravailaeterealiseen ollab orationave Jean Dieb olt(CNRS,Universite de Marne-la-Vallee).

L'etude des proprietes asymptotiques de l'estimateur ET a ete negligee dans la litterature. On

trouve ep endant dans[29℄un resultatdonnantlaloiasymptotiquedeladieren ex^

ET

pn x

pn

(16)

etudiele omp ortement dutermedeterministex~

ET

p n

x pn

puis dutermesto hastique x^

ET p n ~ x ET p n ,o u ~ x ET pn

estl'approximation duquantile extr^emedenieparanalogie ave (1.4)par

~ x ET p n =u n +( F GPD 0; (un) ) 1 (p n = n )=u n +(u n )log( n =p n ): (1.8)

1.2.1.1 Etude du terme deterministe

Lesdetailsde etteetudesontparus dans[72℄.Nousavonsmontreque,dansla lasse C,

l'approxi-mation(1.8) estun asparti ulier de

~ x ET;k pn =u n + k X i=1 [i℄ n i! log i ( n =p n ); o u [i℄ n = V (i) ( log n

), app elee approximation d'ordre k du quantile x

pn

.On verie en eet que

~ x ET;1 p n =x~ ET pn .Onnote" app;k n =(x p n ~ x ET ;k p n )=x p n

,l'erreurd'approximationd'ordreketonintro duitla

suite de fon tions K k (x)=x k V (k )

(x)=V(x);x>0;k0:On supp oseque les ordresdesquantiles

p euvent s'e rire p n =1=n q +n , n =1=n q 0 + 0 n ave 0<q 0 1q, n !0, 0 n !0 et n 0 n .De plus, si q =q 0

=1 alors on supp ose que

0 n < 0< n . Enn, on note N k =f1;:::;k g. Le resultat

suivant donne des onditions ne essairesetsuÆsantesp our quel'erreurd'approximationd'ordrek

onverge vers 0.

Theoreme 1.2.1 Soit F 2C.

(i) Si V 2C 1 1= et 2N k alors " app;k n !0 pour tout0<q 0 1q. De plus,si q6=q 0 alors" app ;k n K k +1 (logn). (ii) Si V 2C 1 1= et 2= N k alors [" app;k n !0 , q=q 0 =1 ℄. De plus,si q=q 0 =1 alors" app;k n ( 1):::( k ) (k+1)! ( n 0 n ) k +1 . (iii) Si V 2C 2 alors" app;k n !0 pour tout 0<q 0 1q. De plus,si q6=q 0 alors" app ;k n K k +1 (logn). (iv) Si V 2C 3 alors[" app;k n !0 ) q =q 0 =1 ℄. Inversement,si q =q 0

=1 et s'il existe s>0 tel que

n log +s (n)!0 alors " app;k n !0 et " app;k n ( n 0 n ) k +1 K k +1 (logn).

Ce resultat etablit le lien entre les ordres p

n

et

n

des quantiles a estimer et la lasse a laquelle

la loi appartient. Dans les as (ii) et (iv) la onvergen e de l'erreur d'approximation vers 0

im-p ose de hoisir p = p

0

= 1, e qui implique log(1=p

n

)=log(n) ! 1. Dans de telles situations, les

approximations x~

ET;k

p n

ne sont pro hes de x

pn

que p our des quantiles \p eu" extr^emes, 'est a dire

pro hesde l'observation maximale. Considerons le as k=1, orresp ondant a lametho deET.Le

Theoreme 1.2.1 montre que l'approximation ET est de b onne qualite p our les lois dont la

fon -tion de survie de roit tresvite vers 0 ( lasse C

2

),le quantile extr^emex

pn

p eut ^etre appro he sans

onditionsursonordrep

n

.Al'inverse,lesloisdontlafon tiondesurviede roitrelativement

lente-mentvers0( lasse C

3

)demandent defortes onditionssurl'ordre duquantile p

n

and'obtenirdes

approximations a eptables. La lasse C

1

, 6= 1 represente un as intermediaire. Enn, la lasse

C 1

1

(17)

Il estinteressantde remarquer quela onvergen e ounon vers0 de l'erreurd'approximation " app;k

n

ne dep endpas de l'ordre de l'approximation k dans les lasses C

1 1= , 2= N,C 2 etC 3 .Parexemple

l'erreur orresp ondantal'approximationnavex~

ET;0

p n

=u

n

onvergevers0souslesm^emes onditions

que l'erreur asso iee a l'approximation ET: x~

ET;1

pn

= x~

ET

pn

. De e p oint de vue, l'approximation de

Pi kandsne mo die paslanature de la onvergen e.

1.2.1.2 Etude du terme sto hastique

Les details de etteetudesont publiesdans [37℄. Lesresultatssont obtenus i i p ourune lasse de

fon tionsde repartition plusgenerale quelapre edente.

Denition 1.2.1 Une fon tion derepartition F appartient a DDA(Gumbel)si

(i) F estinversibleet deux fois derivable.

(ii) La fon tion deniepar A:x2R

+ !A(x)=V 00 =V 0 (logx)2R, o u V(x)= F 1

(exp( x)) verie les onditionssuivantes:

A(x)!0 quand x!+1,

A est asymptotiquement de signe onstant,

Il existe0 tel quejAj2RV

.

Ona ommeannon eCDDA(Gumb el),etleresultatest lesuivant:

Theoreme 1.2.2 Soit F 2 D et soit a: x 2 R! V

00 =V 0 (V 1 (x)) 2 R.Si k n ! +1, n ! 0, p n = n !0 et k 1=2 n a(u n )!0 alors k 1=2 n (u n )log( n =p n ) ^ x ET pn ~ x ET pn d !N(0;1) quandn!1:

L'appli ation e theoremeaux lois de la lasse C p ermet d'obtenir desformes plus expli ites p our

la ondition k 1=2 n a(u n )!0. Corollaire 1.2.1 SoitF 2C. Si k n !+1 et p n = n

!0 alorsdansles assuivants:

(i) V 2C 1 [C 2 , 6=1 et k n =o((logn) 2 ), (ii) V 2C 1 1;1 et k n =o(n), (iii) V 2C 1 1; etk n =O ((logn) 2(1+) Æ ) 8Æ>0 arbitrairement petit, (iv) V 2C 3 et k n =O ((logn) 2(1 ) Æ ) 8Æ>0 arbitrairement petit, ona, k 1=2 n (u n )log( n =p n ) ^ x ET pn ~ x ET pn d !N(0;1) quandn!1:

1.2.2 Cas des lois a queue de type Weibull

Parmi les familles de lois de C, la lasse C

1

est la plus interessante dans le sens o u elle englob e

la majoritedes lois de DA(Gumb el):Weibull, gamma,normale ...De e fait, des estimateurs des

quantilesextr^emesdediesa ettefamille de lois onteteintro duits,parexemple [9,5,16, 94℄.Plus

pre isemment, es estimateurs s'adressent aux lois dont la fon tion de survie satisfait l'hyp othese

suivante: (A.1) : F(x)=exp( H(x)), ave V(t)=H 1 (t)=t `(t)et`2RV .

(18)

De telles lois sont app elees lois a queue de typ e Weibull. Ce sont essentiellement les lois de la

lasse C

1

dont les onditions de regularite sur V, l'inverse de lafon tion de hasard umulee, sont

assouplies. Le parametre est app ele indi e de queue de typ e Weibull. L'estimation desquantiles

extr^emesp ourles lois a queue de typ eWeibull passe alors parl'estimationde .

1.2.2.1 Estimation de l'indi e de queue de Weibull

Dans [67℄,nous prop osonsl'estimateursuivant du parametre:

^ n = kn 1 X i=1 (log(X n i+1;n ) log (X n kn+1;n )) , kn 1 X i=1 (log 2 (n=i) log 2 (n=k n )) ; (1.9) o u log 2 (t)=log(log (t)), t>1 et (k n

) est une suite d'entiers tels que 1 k

n

<n. Cetestimateur

appara^t naturellement sil'on onsidere lafon tionquantile dene par

q(t)= F 1 (t)=V(log (1=t))=(log (1=t)) `(log(1=t)); (1.10)

etsi l'onremarque quep our settpro hes de0 que

log (q(t)) log (q(s)) = (log

2 (1=t) log 2 (1=s))+log `(log (1=t)) `(log(1=s)) ' (log 2 (1=t) log 2 (1=s)): (1.11)

Cette derniere approximation est justiee par le fait que ` est une fon tion a variations lentes. Il

estimp ortant deremarquerque(1.11)estexa tedansle asdesloisdeWeibull o u`est onstante.

Cette propriete n'est en general pas veriee p our les autres estimateurs de (par exemple [16℄

ou [5℄) e qui se revele penalisant dans la pratique, voir [67℄p our une omparaison des dierents

estimateurssur simulations. La onsistan e de

^ n

yestetablie:

Theoreme 1.2.3 Sous (A1), sik

n !1 etk n =n!0 alors ^ n P ! .

La normalite asymptotique requiert l'hyp othese de se ond ordre habituelle sur la fon tion a v

a-riations lentes `: il existe 0 et b(x)! 0 tels que, uniformement lo alement en 1 quand

x!1, (A.2) :log `(x) `(x) b(x)K (), o uK ()= R 1 u 1

du.Leparametre0 ontr^olelavitessede onvergen edurapp ort`(x)=`(x)

vers 1. La ondition (A2) est la le de voute des preuves de normalite asymptotique p our les

estimateurs basessur les valeurs extr^emes. Nous renvoyonsa [85℄ou [7℄p our d'autresutilisations

dansdes ontextes identiques.Notreresultat estalorsle suivant:

Theoreme 1.2.4 Sous (A1) et(A2), k

1=2 n ( ^ n ) d !N(0; 2

),pour toute suite (k

n ) telleque k n !1;k 1=2 b(log(n=k n ))!0et k 1=2 =log(n=k n )!0: (1.12)

(19)

1.2.2.2 Estimation des quantiles extr^emes

Disp osant d'unestimateur

^ n

del'indi e dequeuedeWeibull ,nousprop osonsdans[57℄d'estimer

lequantile x

p n

par l'estimateurWT(Weibull Tail):

^ x WT pn =X n k n +1;n log (1=p n ) log (1= n ) ^ n ; (1.13)

o u, ommepre edemment,

n

=k

n

=n.Laen ore, et estimateurbene ie d'unejusti ation

intui-tive.Poursett pro hesde 0,lafon tionquantile denieen (1.10)verie

q(t) q(s) = V(log (1=t)) V(log(1=s)) ' log (1=t) log (1=s) ;

e qui p ermet, de fa on similaire a l'appro he des ex es de rite paragraphe 1.1.4, de rempla er

l'estimationd'une quantile extr^emeparl'estimationd'unquantile lassique.

En intro duisant n =log (1=p n )=log(1= n

),on a lestheoremesasymptotiquessuivants.

Theoreme 1.2.5 Sous (A1), sik

n !1, k n =n!0 et n 1 alors x^ WT pn =x p n P !1 quand n!1.

Theoreme 1.2.6 Sous (A1) et(A2), si (1.12)est veriee et si

n !1 alors, log (1= n )k 1=2 n log ( n =p n ) ^ x WT p n x pn 1 d !N(0; 2 ):

L'etude du omp ortement de et estimateur sur simulations est basee sur la notion de p ouvoir

d'extrap olationintro duite dans[41℄.

1.3 Estimation dans DA(Fre het)

L'estimation des quantiles extr^emesdans le domaine d'attra tion de Fre het par la metho de des

ex es (1.5) ne essite l'estimation des deux parametres et de la loi GPD. Les diÆ ultes liees

a ette estimation ont ete evo quees dans le paragraphe 1.1.5. Nous prop osons i i une metho de

d'inferen e bayesienne p our tenter de depasser es diÆ ultes.

Cetravailaeterealiseen ollab orationave Jean Dieb olt(CNRS,Universite de Marne-la-Vallee),

Mhamed-Ali El-Aroui (ISG de Tunis) et MyriamGarrido (ENAC,Universite Toulouse 3) dansle

adre de la these de ette derniere ([58℄, Chapitre 3). Une synthese de la metho de est presentee

dans[33℄.

1.3.1 Estimation bayesienne des parametres de la loi GPD

Reparametrisation de la loi GPD. La parametrisation standard de la fon tion de survie

F

GPD

;

de loi GPDde rite en (1.3) est rempla ee par une nouvelle parametrisation mieux adaptee

dans le as > 0 qui nous interesse i i. Deux nouveaux parametresp ositifs = 1= et = =

sont intro duitsetleur oupleestnote=(;).La fon tiondesurvie ainsireparametreeestnotee

F GPD (:j )ets'e rit F GPD (yj )= 1 + y ; y0; (1.14)

(20)

etladensite asso ieeest f GPD (yj )= 1 + y 1 ; y0: (1.15)

Nous supp osons disp oser de realisations y = (y

1 ;:::;y

k

) de variables aleatoires indep endantes

et identiquement distribuees Y

1

;:::;Y

k

selon (1.14){(1.15). En pratique, il s'agit d'ex es au-dela

d'un seuil u de variables aleatoires X

1

;:::;X

n

indep endantes et identiquement distribuees selon

une loi appartenant a DA(Fre het). Le p oint de depart de etteetude est la representation de la

densite(1.15) parun melangeintro duite dans[110℄, page157:

f GPD

(yj )=

Z

p(yjz)g(zj )dz; (1.16)

o u p(:jz) est la densite de la loi exp onentielle d'esperan e 1=z denie par p(yjz) = ze

y z I

fy >0g

p our tout z > 0 et o u g(:j ) est la densite de la loi gamma de ouple de parametres = (;):

g(zj ) = ( ()) 1 z 1 e z I fz >0g

: La representation sous forme de melange (1.16) p ermet de

pallier l'absen e de lasse onjuguee p our la loi GPD en onstruisant une lasse quasi- onjuguee

p our laloi GPDapartirde la lasse onjuguee p our laloi gamma.

Classe onjuguee p ourla loi gamma. Ladenitiondela lasse onjugueep ourlaloigamma

rep osesurlaloi Gam ondetyp eI I[27℄.Elle estnoteeGam onI I( ;d)o u >1etd>0sontdeux

parametres.Sa densites'e rit:

;d (x)=I 1 ;d (dx + 1)( (x)) d ( d) dx I fx>0g ; (1.17) o u I ;d

est un o eÆ ient de normalisation. Soit z = (z

1

;:::;z

k

) un ensemble de k realisations de

variables aleatoiresZ

1

;:::;Z

k

indep endantes et de m^eme loi gammade ouple de parametres=

(;).D'apres[27℄,Theoreme2,la densite apriori onjuguee sur ave omme hyp er-parametres

Æ >0 et > >0 est donnee par( )=()(j)o u () est ladensite de la loi Gam on I I

de parametres ==etd=Æ et(j)estladensite de laloi gammade ouple de parametres

(Æ+1;Æ).Les densitesap osteriori orresp ondantes sont alors

(jz)=(jz)(j;z) (1.18)

ave (jz)ladensite dela loiGam on I I de parametres

0 = 0 = 0 etd 0 =Æ 0 ,o u Æ 0 =Æ+k; 0 = Æ + P k i=1 z i Æ + k et 0 = Æ =(Æ+k ) k Y i=1 z i ! 1=(Æ+k ) ; (1.19)

et(j;z)ladensite de laloi gammade ouple de parametres(Æ

0 +1;Æ 0 0 ).

Appli ation a la loi GPD. Nous avons remarque[33℄, paragraphe 2.1,que laloi a p osteriori

de sa hant ys'e rit omme un melangedont ladensite est

(jy ) =

Z

(21)

o u q

(:jy )est ladensite denie par

q (zjy ) = p(yjz)g (z) R p(yjz 0 )g (z 0 )dz 0 etg (z)= Z g(zj 0 )( 0 )d 0 ;

ave les notations

g(zj )= k Y i=1 g(z i j )etp(yjz)= k Y i=1 p(y i jz i ):

Il appara^t que la densite (1.20) ne p eut ^etre al ulee expli itement. On a ep endant a es aux

densites onditionnelles (jy ;z)par(1.18) et(zjy ; )en remarquantque

(zjy ; )/p(yjz)g(zj )= k Y i=1 z i e (+y i )z i I fz i >0g ;

et don que p our i = 1;:::;k , onditionnellement a et y

i

, Z

i

suit une loi gamma de ouple de

parametres (+1; +y

i

). Il est alors p ossible (voir par exemple [111℄, Chapitre 5) de simuler

desrealisations a p osterioride sa hant y gr^a ea une hantillonneur de Gibbs. Le prin ip e de la

(m+1)emeiterationest lesuivant:

1. Simulation des z (m+1) i de loi Gamma( (m) +1; (m) +y i ); 2. Simulation de (m+1)

de loi Gam on II(

0 = 0 ;Æ 0 ), ave Æ 0 = Æ+k , 0 et 0 al ules a partir des z (m+1) par l'equation (1.19); 3. Simulation de (m+1) de loi Gamma(Æ 0 (m+1) + 1;Æ 0 0 ).

Les nombreux problemes de mise en uvre de et algorithme sont ab ordes dans [33℄: simulation

d'une loiGam on I I, hoix deshyp erparametresÆ, et , dete tiondu regimestationnaire...

Soit(

j

;

j

),j=1;:::;K une hantillonde K ouples simulesparl'algorithme pre edent,une fois

leregimestationnaireatteint.Ilestalorsp ossibled'estimerle ouple(;)parlamoyenne,lemo de

ou lamedianeempirique de ladistribution pre edente.

1.3.2 Appli ation a l'estimation des quantiles extr^emes

A partir de l'e hantillon (

j

;

j

), j = 1;:::;K pre edent,on al ule K estimations de x

p n

sur la

basede lametho dedes ex es(1.5):

^ x GPD ;j pn =X n kn+1;n j 1 ( n =p n ) 1= j :

Dem^eme,de nombreuxestimateursp euvent^etre al ulesapartirde etensemble devaleurs[33℄.

1.4 Estimation dans DA(Weibull)

Lestravauxpresentesi i sontissusdelathesedeLaurentGardes[55℄ o-en adreeparPierreJa ob

(UniversitedeMontp ellier2)etmoi-m^eme.L'estimationdesquantilesextr^emesdansDA(Weibull)est

basee sur la ara terisation du Theoreme 1.1.3.En remarquant que

F

est approximativement

lineaire au voisinage du p oint terminal x

F ,on endeduit l'approximation F (a) F (b) ' a b ; (1.21)

(22)

valable p our a, b, et pro hes de x F

. En donnant des valeurs bien hoisies a es parametres, il

est alors p ossible d'estimer l'indi e des valeurs extr^emes (paragraphe 1.4.1)puis des quantiles

extr^emes(paragraphe1.4.2).

1.4.1 Estimation de l'indi edes valeurs extr^emes

Nousdonnonsdans e paragraphedeuxexemples d'estimateursde qu'ilestp ossible d'obtenirsur

labasedel'approximation(1.21).Danslesdeux as,onp osea=u

n X n;n ,b=X n;n et =v n X n;n o u (u n ) et(v n

) sontdeux suitesde l'intervalle ℄0;1[.Onappro he alors

F(u

n

)parlavariablealeatoire

u n =nave un =IfX n;n >0g n X i=1 IfX i u n X n;n g:

De m^eme, on appro he

F(v n ) par vn =n o u vn

est deni similairement. Nous prop osons deux

approximations p ossibles de

F(X

n;n

) donnant lieu adeux estimateursde .

1.4.1.1 Un estimateur a double seuil expli ite

Dans e paragraphe,on appro he

F(X

n;n

) par0.La validite de l'approximation deduite de (1.21)

qui en resulteestgarantie par[55℄,Theoreme3.2.Sous ertaines onditions sur(u

n ) et(v n ), on a en eet 1 v n 1 u n u n vn P !1:

L'estimateur quien resulteest lesuivant:

^ 1;n = log (1 u n ) log (1 v n ) log ( un ) log ( vn ) :

Sesproprietestheoriquessont etablies dans[55℄, Chapitre3. Enparti ulier, il est montreque

^

1;n

onverge en probabilite vers p our tout <0 et onverge en loi si < 1=2.Le resultat (publie

dans[54℄, Theoreme2.2)estle suivant:

(n F(u n x F )) 1=2 ( ^ 1;n ) d !N 0; (1 1= ) 4 log 2 ( ) ! ; (1.22)

o u estune onstanteappartenantal'intervalle ℄0;1[.Ceresultatestobtenuauprix d'une ondition

de se ond ordre de typ e (A2) et de ontraintes sur les suites (u

n

) et (v

n

). Cep endant, il est

remarquableque lavitessede la onvergen e(1.22)soiten puissan e den. Deplus la onvergen e

presque s ^ure est etablie p our < 1. Neanmoins, l'inter^etde et estimateur est prin ipalement

theorique ar ses p erforman es sur simulations sont medio res. L'estimateur

^

1;n

soure en eet

d'unimp ortantbiais systematiqued ^u sans doutea l'approximation grossierede

F(X

n;n ).

1.4.1.2 Un estimateur a double seuil impli ite

Cettelimitationpratiqueestsurmonteeenappro hant

F(X

n;n

(23)

l'approxima-sur(u n ) et(v n ), ona en eet 1 v n 1 u n un 1 v n 1 ! P !1: L'estimateur ^ 3;n

resultantde etteapproximationest deni ommelara ine en de l'equation:

1 v n 1 u n un 1 v n 1 ! =1: (1.23)

Il n'est pasp ossible de tirer de etteequation une formulationexpli ite p our

^

3;n

. Neanmoins, on

prouveque,sous ertaines onditions surlessuites(u

n

)et(v

n

),l'equation(1.23)admetuneunique

solution ave une probabilite qui tend vers 1 quand n tend vers l'inni. La onsistan e faible de

^

3;n

est egalement etablie, voir [55℄,Theoreme 3.7.L'obtention d'autresproprietesasymptotiques

p our etestimateuresta tuellement a l'etude.Son omp ortement sur simulations estsatisfaisant.

1.4.2 Estimation des quantiles extr^emes

Laurent Gardes [55℄, paragraphe 4.2, montre que sur la base de l'approximation (1.21) et d'un

estimateur ^

n

onsistant de ,il est p ossible de onstruire unestimateur duquantile extr^emex

pn .

Pour ela,en onsiderant =

^ n ,a=u n X n;n ,b=x pn et =v n X n;n

dans(1.21),on disp ose d'une

nouvelle approximation impliquant le quantile re her he. La validite de ette approximation est

prouvee dans[55℄,Lemme 4.1ave la onvergen e

x p n v n X n;n x p n u n X n;n ^ n un (np n ) ^ n ^ n vn (np n ) ^ n ! P !1:

Ondeduitalorsde etteapproximationl'estimateursuivant de x

pn : ^ x DAW p n ( ^ n )=u n X n;n n ( ^ n ) ^ n 1 ( un =np n ) ^ n ; o u l'on adeni n ( ^ n )= ^ n X n;n u n v n ^ n un ^ n vn :

L'estimateur du quantile extr^eme ainsi deni est similaire a l'estimateur GPD (1.5). Il fait

in-tervenir un seuil aleatoire u

n X

n;n

et le p our entage de p oints

un

=n depassant e seuil. Notons

qu'i i ep our entageestaleatoirealorsqu'ilestdeterministe(

n

)dans(1.5).Onmontredans[55℄,

Theoreme4.2,quex^

DAW pn ( ^ n

)est onsistantdesque

^

n

estunestimateur onsistantde.Ilappara^t

sursimulations que l'estimateurx^

DAW p n ( ^ 3;n

) bene ie de b onnes p erforman es.

1.5 Tests de queues de distribution

La theoriedesvaleursextr^emes, tellequ'elle est exp oseedans leparagraphe1.1.1,p ermet,gr^a ea

(24)

qui en de oulent n'utilisent qu'une p etite partie de l'information presente dans l'e hantillon (par

exemple les k

n

ex es) et sont p eu eÆ a es lorsque le nombre de donnees est p etit ou mo dere.

Pour ette raison, dans des situations on retes, issues de la abilite par exemple, il est plus

interessant de disp oser d'un mo dele parametrique onstruit sur l'ensemble des donnees. Un tel

mo delepresentede plus l'interêtd'être interpretable p our les ingenieurs etd'être disp onible dans

la majoritedes logi iels de abilite. Les tests d'adequation lassiques (Cramer von Mises,

Ander-son Darling, ...) p ermettent de sele tionner un tel mo dele. Cep endant, es pro edures testent

essentiellement l'adequation d'un mo dele a la partie entrale des donnees.Les dangers ausespar

l'extrap olation desresultats de es tests aux queues de distribution sont de rits dans [38℄et [82℄.

Pour ela, nous avons developpe une pro edure p ermettant de verier l'adequation d'un mo dele

parametriqueauxvaleursextr^emesdel'e hantillon.Sonprin ip egeneralestde ritparagraphe1.5.1

etplusieurs variantes en sontpresenteesparagraphes1.5.2et1.5.3.

1.5.1 Prin ipe des tests de queue de distribution

Supp osons qu'un testd'adequationusuel ne rejette pas l'hyp othese nulle H

0

selon laquelle F

ap-partient a la famille de mo deles parametriques fF

: 2 g . Le but du test est de ontr^oler

l'adequationdelaqueuede F

b n ,o u b n

estparexemplel'estimateurdumaximumdevraisemblan e

de , aux plus grandesdonneeset de verier si ettequeue de distribution p ermet des extrap

ola-tionsraisonnablesau-deladel'observationmaximale.Ils'agitdon detesterH

0 :F 2fF : 2g ontre H 1 :F 2= fF

: 2g en queue de distribution. Le prin ip e du test estde omparerdeux

estimateursduquantileextr^emex

pn

sousH

0

.Lepremierestl'estimateurparametriqueduquantile

^ x param pn = F 1 b n (p n

).Le se ond est l'estimateurGPDintro duit en (1.5):

^ x GPD pn =X n k n +1;n ^ n ^ n 1 ( n =p n ) ^ n :

Plus pre isement, nous onstruisons sous H

0

un intervalle de onan e IC

de niveau p our la

dieren eentrelesdeuxquantilesestimesetnousrejetonsl'hyp othesenullesix^

GPD p n ^ x param p n = 2IC .

Plusieurs versions du test p euvent ^etre de linees selon le prin ip e de onstru tion de l'intervalle

IC etlesestimateurs ^ n et ^ n

utilisesp our al uler x^

GPD

pn .

1.5.2 Le test ET

Dansle as o uleslois F

onsidereesdansl'hyp othesenulle appartiennent aDA(Gumb el),ilsuÆt

de hoisir ^ n = 0 et ^ n

deni par (1.6). On a alors x^

GPD

pn

= x^

ET

pn

(voir equation (1.7)), et le test

obtenu est app ele test ET. Chronologiquement, il s'agit du premier test que nous avons mis en

uvre.Sonprin ip e aetedenien ollab oration ave Jean Dieb olt[36℄etdesdevelopp ementsont

ete prop oses dans la these de Myriam Garrido [58℄,Chapitre 1.En parti ulier, plusieurs versions

du testET onteteintro duites.

Le test ET asymptotique. Sur labase duTheoreme1.2.2,nousavons onstruitunintervalle

de onan eIC

asymptotique.Le omp ortementasymptotique duniveau etdelapuissan ede e

testaeteetabli[35℄dansle asd'hyp othesessimplesetdeloisappartenantala lasseC.Neanmoins,

l'inter^etde etteversiondu testest uniquement theorique. En eet,la onvergen een loienon ee

(25)

Le test ET \b o otstrap" parametrique. Pourpallier ette limitation, nousavonsdeveloppe

une version du test ET basee sur une evaluation par b o otstrap parametrique de l'intervalle IC

.

Nous avonsverie sur simulations que letestainsi onstruitbene ie d'une b onne puissan e [34℄.

En ontrepartie, ette version du test est tres o ^uteuse en temps de al ul. Pour ette raison,

nous avons egalement prop ose une version \b o otstrap" parametrique simpliee. Constatant que

les u tuations de x^ ET pn sont de l'ordre de k 1=2 n et elles de x^ param pn de l'ordre de n 1=2 , nousavons

neglige es dernieres en ne \b o otstrappant" pas l'estimateur parametrique. Le gain de temps est

appre iablelorsque l'estimateurdumaximumdevraisemblan e

^ n

est lourd a al uler, etlap erte

de puissan e p euimp ortante.

1.5.3 Le test GPD

Leprin ip edutestGPDest eluide ritdansleparagraphe1.5.1.Le hoixdesestimateurs

^ n et^ n p ourle al uldex^ GPD pn

aeteetudiedansle adredustagedeDEAdeAb delhakImoussaten[89℄.Pour

desraisonsaussibientheoriques(invarian edesestimateursparrapp ortauxparametresdep osition

etd'e helle)que pratiques (b onne puissan e experimentale), ilest apparu que les estimateurs des

momentsp onderes(de ritsauparagraphe1.1.5)etaientbienadaptes.Nousavonsegalement hoisi

denepasdevelopp erdeversionasymptotiquedutestGPD,toujoursp ourdesraisonsdepuissan e.

Seules les versions b o otstrap etb o ostrapsimpliee onteteprop osees.

1.6 Le logi iel Extremes

Le logi iel Extremesa etee rit parJer^ome E arnot,sous ladire tion onjointede Jean Dieb olt

etmoi-m^emeetdansle adred'un ontratentreEDFetleprojetis2del'INRIA Rh^one-Alp es. Ce

logi iel regroup e quelques unesdesdierentes metho desdemo delisationde queuesdedistribution

etd'estimationdequantilesextr^emesde ritesdans e hapitre.Parexemple, onytrouveplusieurs

fon tions p our estimer l'indi e des valeurs extr^emes ou les parametresde la loi GPD (voir

pa-ragraphe 1.1.5). Les pro edures developpees dans le adre de la these de MyriamGarrido y sont

egalementpresentes.Parexemple,lestestsde queuededistribution de ritsau paragraphe1.5sont

implementes. Ce logi iel, e rit en C++ ave une interfa e Matlab se veut un outil onvivial p our

experimentergraphiquementles pro edures destatistiquedesextr^emes.Il estdisp onible librement

al'adressesuivante:http://www.inrialpes.fr/is2/pub/software/EXTREMESa ompagned'une

do umentation omplete.Un des riptif resumedu logi iel estegalement disp onible [32℄.

1.7 Perspe tives

Je travaille a tuellement a l'extension a tous les domaines d'attra tion de l'estimateur a double

seuil impli ite

^

3;n

, dedie au DA(Weibull) . Le travail mene en ollab oration ave Laurent Gardes

onsiste a rempla er les seuils deterministes u

n

et v

n

par des seuils aleatoires X

n k 0 n +1;n =X n;n et X n k n +1;n =X n;n o u (k n ) et (k 0 n

) sont des suites deterministes tendant vers l'inni moins vite que

n. Le nouvel estimateurde est obtenu enresolvant en l'equation similaire a (1.23):

X n;n X n kn+1;n X n;n X n k 0 +1;n k 0 n 1 k n 1 ! =1:

(26)

La onsistan e faible de et estimateur est etablie dans [56℄, Theoreme 1, quel que soit le signe

de , 'est a dire quel que soit le domaine d'attra tion de la loi des observations. Nous avons

egalementmontresous ertaines onditions (voir[56℄,Theoreme2)quelaloilimite del'estimateur

onvenablementrenormaliseestgaussiennesi< 1=2etuneloidesvaleursextr^emessi > 1=2.

Ceresultatlaisse ap enserquelalimitation duresultat(1.22)a < 1=2estbien unene essiteet

non une fa ilite de al ul.

A ourtterme, nousprojetonsde onstruire un nouvelestimateurdesquantiles extr^emesbasesur

etestimateurde .

D'autrepart,le testGPD presenteparagraphe 1.5.3merited'^etre ameliore.Il est en eet

souhai-table d'adapter l'estimateur de utilise suivant le domaine d'attra tion o u se situent les lois F

onsidereesdans l'hyp othese nulle. Par exemple, si F

est un ensemble de lois de typ e Weibull, il

semblepreferable d'utiliser l'estimateurad ho presenteparagraphe 1.2.2plut^otqu'un estimateur

\generaliste".Cette intuition doit ^etre validee sursimulations et,p our ela, lelogi iel Extremes

est unoutil pre ieux.

A plus long terme, je souhaite developp er une orre tion du biais p our les estimateurs prop oses

dans e hapitre. Sous une hyp othese de se ond ordre de typ e (A2) , le terme dominant du biais

desestimateurs estd ^u alafon tionb.Cette fon tionp eutalors^etreestimee [7,102℄dans le adre

d'unemo delederegressionp our orrigerl'estimateur.Cettedemar hedoitp ermettreegalementde

simplier lasele tion du parametre k

n

optimal. Il s'agitd'une se onde dire tion de re her he que

je souhaitedevelopp er enm'appuyant surles travaux existantsp our l'estimateurde Hill [39,80℄.

Enn, l'estimation de frontiere presentee au hapitre suivant est un prolongement naturel de la

(27)

(28)

Chapitre 2

Estimation de frontiere

Le probleme ab orde dans e hapitreest l'estimation d'un ensemble D b orne de R

d+1

,d1,

a partir d'un ensemble N

n

de p oints disp oses aleatoirement dans elui- i. Nous ne traitons pas

i i le probleme dans toute sa generalite mais nous nous pla ons dans le as parti ulier o u D est

de la forme D = f(x;y) : x 2 E ; 0 y f(x)g; E etant un sous-ensemble de R

d

onnu,

et f une fon tion de E dans R

+

.L'estimation de D se ramene don a l'estimation de f app elee

fon tion frontiere. Le probleme ainsi p ose a ete intro duit initialement par Geroy [59℄. Depuis,

des appli ations se sont developpees en traitement d'images [96, 101℄ et en e onometrie. Dans e

dernier as,f estapp elee lafrontierede pro du tion optimale. Desestimateurssontprop osesselon

que f est supp osee roissante (estimateur FDH, Free Disp osal Hull [31℄)ou on ave et roissante

(estimateurDEA, DataEnvelopment Analysis [43,63℄).Lesestimateurs etudiesi i ne ne essitent

pasd'hyp othesedemono ite surf.Nousetudionsleurs proprietesdansles deux adressuivants:

(a) N

n

est une hantillon dep oints(X

i ;Y

i

)2ER

+

,i=1;:::;n indep endants etidentiquement

distribues surD selonune densite .

(b) N

n

estunpro essusde Poissondemesuremoyennen I

D

, estune onstantestri tement

p ositive, designe la mesure de Leb esgue sur R,et une mesure absolument ontinue par

rapp ort a la mesure de Leb esgue sur R

d

. On note dans e as f(X

i ;Y

i

); i 1g ER

+

l'ensemble desp ointsasso ies.

Nousnous fo alisonsi i surlades riptionde laloi asymptotique d'estimateursnon-parametriques

de f lorsque n tend vers l'inni. Par ommo dite, nous onsiderons parfois les as parti uliers

E =[0;1℄, onstantesur Ddansle as(a)etE =[0;1℄, =dans le as(b).

Nous presentons dans le paragraphe 2.1 les estimateurs de la litterature qui ont inspires nos

tra-vaux. Le paragraphe 2.2 est dedide a la presentation des estimateurs que nous avons prop oses

demandant une partition de D .Cette partition prealable est abandonnee dans le paragraphe 2.3

ave l'intro du tion desestimateursparprogrammationlineaire.Les p ersp e tivessontevo queesau

paragraphe 2.4.

2.1 Nos points de depart

Nostravauxsesont appuyessur deux ontributions a l'estimationde frontiere.Outrele faitde se

pla er dansle asE =[0;1℄,leurp oint ommunestl'intro du tiond'une partitiondu supp ortDen

(29)

deE =[0;1℄.Lasuite (k n

),supp oseetendreversl'inniave n,estunparametre ommunauxdeux

metho des d'estimation. La premiere d'entre elles, qui est aussi la premiere a notre onnaissan e

dans le domaine, est due a Geroy[59℄. L'estimateur prop ose est onstruit a partir desk

n p oints

lesplus hautsdans haque elluleD

n;r

.Sesproprietes,detailleesdansleparagraphe2.1.1,relevent

de la theorie desvaleurs extr^emes.La se onde metho deque nous avons onsideree aete prop osee

par Ja ob & Suquet [90℄. La fon tion f in onnue est de omp osee en series orthogonales dont les

o eÆ ients sont estimesa partirdes nombres de p oints dans haque ellule (paragraphe2.1.2).

2.1.1 L'estimateurde Geroy

Ce paragraphe entre dans le adre (a) ave E =[0;1℄, l'ensemble N

n

onsidere est un e hantillon

de p oints (X

i ;Y

i

), i = 1;:::;n indep endants et identiquement distribues selon une densite . Les

valeurs extr^emesde l'e hantillon sont denies par Y

n;r = maxfY i ;(X i ;Y i ) 2 D n;r g, o u l'on a p ose

maxf;g=0.L'estimateur de Geroy[59℄est alorslafon tion onstanteparmor eauxdeniepar

^ f G n (x)= kn X r =1 Ifx2I n;r gY n;r : (2.1)

Dans e m^emearti le,ilest montresous diverseshyp othesessurles fon tionsf etet surlasuite

(k n ) que ladistan e L 1 deniepar d 1 ( ^ f G n ;f)= sup x2[0;1℄ ^ f G n (x) f(x) (2.2)

onvenablement normalisee onverge en loi vers une loi de Gumb el de fon tion de repartitionH

0

denie en (1.1).Plus re emment,Korostelev & Tsybakov[96℄ ont in lu l'estimateur (2.1) dansla

famille plus generale desestimateursp olyn^omiaux parmor eaux

^ f KT n (x; )= kn X r =1 Ifx2I n;r gP n;r (x; ); (2.3)

o u,sur haqueintervalleI

n;r

,P

n;r

(:; )estlep olyn^omededegreenglobanttouslesp ointsetd'aire

minimum. En d'autres termes, il s'agit de resoudre le probleme d'optimisation sous ontraintes

suivant: min Z In;r P n;r (x; )dx s. . P n;r (X i ; )Y i ; X i 2I n;r : (2.4) En parti ulier,on a ^ f G n (x)= ^ f KT n

(x;0).On remarquealorsqued'apres[96℄, Theoreme4.1.1,

l'esti-mateur ^ f

G

n

estminimax si est onstanteetsif est 1-lips hitzienne dansles adressuivants

(i) k n =(n=logn) 1=2 etp our ladistan e L 1 denieen (2.2), (ii) k n =n 1=2 etp ourla distan e L 1 deniepar d 1 ( ^ f G n ;f)= Z 1 0 ^ f G n (x) f(x) dx: (2.5)

Ande ompleter esresultats,nousavonsmontre[61℄ave PierreJa ob(UniversiteMontp ellier2)

etJean Geroylanormaliteasymptotique de l'erreurL

1

onvenablement normalisee:

Theoreme 2.1.1 Si est onstante et si f est -lips hitzienne (0 < 1), k

n = o(n=logn), n=o(k 1+ n ),alors n k 1=2 d 1 ( ^ f G n ;f) E h d 1 ( ^ f G n ;f) i d !N(0;1): (2.6)

(30)

Pourprouver(2.6),nousavonsdejaetabli e resultatlorsque N n

estun pro essusde Poisson[77℄,

puis nousavonsutiliselate hnique deGeroy[60℄p our etendreleresultatau as del'e hantillon.

En renfor ant les onditions sur la suite (k

n

), la onvergen e (2.6) est onservee si on rempla e

l'esperan e E[d

1 ( ^ f G n ;f)℄ par k n

=(n ), voir [61℄, Corollaire 2. De m^eme, la onstante p eut ^etre

rempla eeparl'estimateur

^ G n =k n , k n X r =1 Y n;r ;

sans p erturb erla onvergen een loi,[61℄, Corollaire3.

2.1.2 L'estimateurde Ja ob & Suquet

Ja ob & Suquet [90℄ ontadapte lametho dede proje tionsur seriesorthogonales, deja onnue en

estimation de ladensite ou en regression, au as de l'estimation de frontiere.Ces travauxentrent

dans le adre (b) simplie o u E = [0;1℄ et = de sorte que N

n

est un pro essus de Poisson

homogene de mesure moyenne n

2 I

D

, etant une onstantestri tement p ositive et

2

designant

lamesuredeLeb esgue surR

2

.Le prin ip e estlesuivant.Soit(b

n

)une suite d'entiersqui tendvers

l'inni etsoit(e

` )

`2N

unebase orthonormeede L

2

.Le developp ement de f surlabaseest tronque

au (b

n

+1)emetermeet haque o eÆ ient

a ` = Z 1 0 f(t)e ` (t)dt= kn X r =1 Z I n;r f(t)e ` (t)dt (2.7)

est appro he par

a `;k n = k n X r =1 e ` (x r ) Z In;r f(t)dt= k n X r =1 e ` (x n;r ) 2 (D n;r ); (2.8) o u x n;r est le entre de I n;r . En intro duisant N n;r = ℄fY i ;(X i ;Y i ) 2 D n;r g; et en remarquant que E[N n;r ℄=n 2 (D n;r

), lesauteurs prop osent d'estimera

`;kn par ^ a JS `;kn = kn X r =1 e ` (x n;r ) N n;r n : (2.9)

L'estimateur de lafrontieres'e ritdon

^ f JS n (x)= k n X r =1 K n (x;x n;r ) N n;r n ; (2.10) ave K n

designant lenoyaude Diri hlet d'ordre b

n

asso ie a labase(e

` ) deni par K n (x;y)= bn X `=0 e ` (x)e ` (y);(x;y)2[0;1℄ 2 :

Lesauteursetudientalorsdierentstyp esde onvergen ede

^ f

JS

n

versfsousdeshyp othesesgenerales

sur le noyau de Diri hlet asso ie a une base C

1

.La normalite asymptotique p on tuelle de

l'esti-mateur entre sur son esperan e

^ f JS (x) E[ ^ f JS

(31)

etablie. Cesresultatssontillustressurl'exemple delabasetrigonometrique.Notonsquelesauteurs

etablissent en parallele les m^emesresultats p our la base de Haar. Neanmoins, les estimateurs de

typ e (2.10) presentent l'in onvenient de ne essiter la onnaissan e du o eÆ ient p our leur mise

en uvre, e qui n'estpasle asde l'estimateur de Geroy(2.1).Cette onstatationest a labase

destravauxde rits dansleparagraphe suivant.

2.2 Estimation a partir de partitions

L'ensemble eparagraphesesitue dansle adre(b), 'estadirequeN

n

estunpro essusdePoisson.

2.2.1 Estimation par proje tion

Les travaux de rits dans e paragraphe ont ete menes en ollab oration ave Pierre Ja ob. Nous

montrons tout d'ab ord dans le paragraphe 2.2.1.1 omment adapter l'estimateur

^ f

JS

n

au as

in onnu en utilisant les valeurs extr^emes du pro essus de fa on similaire a

^ f

G

n

. Le as des bases

non orthogonales estab orde ave l'exemple de la basede Fab er-Shauderdans le adre de la these

de Laurent Gardes, leprin ip e d'estimation etant de riti i paragraphe2.2.1.2.L'ensemble de es

travaux supp oseE =[0;1℄et=.

2.2.1.1 Proje tion sur unebase orthogonale

Leprin ip ed'estimationdes o eÆ ients(a

`

) onsisteareprendrel'approximation(2.8)danslaquelle

2

(D n;r

) estestimeeparl'aire d'un re tangle de baseI

n;r etde hauteur[0;Y n;r ℄: ^ a GJ `;k n = kn X r =1 e ` (x n;r ) Y n;r k n : (2.11)

L'estimateur de lafrontieres'e ritdon

^ f Pr n (x)= kn X r =1 K n (x;x n;r ) Y n;r k n ; (2.12)

et ne ne essite pas la onnaissan e de .L'in onvenient de e typ e d'estimateurs provient du fait

queY n;r =k n estunestimateurde 2 (D n;r

)biaiseinferieurement ommelemontreledevelopp ement

suivant: E Y n;r k n = 2 (D n;r ) 1 n +o n k 4 n ;

etablidans[76℄,Lemme2,dansle aso uf estune fon tionC

1

,etsousles onditions n=o(k

2

n

)et

k n

=o(n=logn). Il est ep endant p ossible de reduire e biais en mo diant l'estimateur (2.11) de

fa on a eliminer lefa teur1=(n ):

^ a GJ;2 `;k n = k n X e ` (x n;r ) Y n;r +Z n k n ; (2.13)

(32)

o u Z n

estlavariable aleatoiredeniepar

Z n = 1 k n kn X r =1 Z n;r ; (2.14) ave Z n;r =minfY i ;(X i ;Y i )2D n;r

g.Cette orre tionde biais estjustieeparlefaitqueZ

n;r =k

n a

un omp ortement symetrique aY

n;r =k

n

.L'estimateur de lafrontiere orresp ondant estalors

^ f Pr ;2 n (x)= kn X r =1 K n (x;x n;r ) Y n;r +Z n k n : (2.15)

Lesestimateurs(2.12)et(2.15)s'e rivent ommedes ombinaisonslineairesdesvaleursextr^emesde

N n

.Leurs proprietesasymptotiques dep endent en grande partiedu omp ortement des o eÆ ients

de ette ombinaison lineaire et don du noyau de Diri hlet de la base utilisee. Deux as tres

dierentsonteteenvisages:les bases C

1

etlabasede Haar.Dans esdeux situations onp ose

Pr n (x)= k 1=2 n n K 1=2 n (x;x): (2.16) Bases C 1

. Cettesituationestetudieeen detailsdans [76℄.En parti ulier,lanormalite

asympto-tiquede( Pr n (x)) 1 ( ^ f Pr n (x) E [ ^ f P r n (x)℄)et( Pr n (x)) 1 ( ^ f Pr;2 n

(x) f(x))estetablieax2[0;1℄xesous

diverses onditions sur le noyau de Diri hlet ([76℄, theoremes2 & 3). Cette situation est illustree

ave labase trigonometriquedont lenoyaude Diri hlet est donne par

K n (x;y)= sin(1+b n )(x y) sin(x y) six6=y; 1+b n sinon :

Les onditions de onvergen eseree riventalors simplement en fon tiondes suites(k

n

)et(b

n ).

BasedeHaar. Ce asestpresentedans[75℄.LabasedeHaarestdenieapartird'unesub division

dyadique fJ

` g

`1

de[0;1℄.Pour haque entier naturel`,l'intervalle J

`

est deni par

J ` = p ` 2 q ` 1 ; p ` +1 2 q ` 1 ; o u p ` etq `

sont les entiersdeterminesde maniere unique par `=2

q ` 1 +p ` et0p ` <2 q ` 1 . La

basede Haar estdeniepar:

e 0 =If[0;1℄g; e ` =2 q ` 1 2 (IfJ 2` g IfJ 2`+1 g);`1:

Le nombrede termesdansledevelopp ement de f surla baseest ne essairementune puissan e de

deux:h n +1=2 b 0 n ,b 0 n

2N,etonimp ose deplusk

n = n (b n +1), n 2N

desortequelapartition

denie parlesfI

n;r

g soitunraÆnement de elle asso ieeaux fJ

`

g.Ainsi, p our tout`h

n

,J

` est

(33)

et on a ardR(n;`) = n

. Sous es onditions et si x 2 J

`

, les o eÆ ients p onderant les valeurs

extr^emesdansles estimateurs(2.12) et(2.15)sont donnes par

K n (x;x n;r ) = b n +1 sir2R n;` ; 0 sinon: L'estimateur ^ f Pr n

estalorstoutsimplementlamoyennearithmetiquede

n

valeursextr^emes.Lorsque

n = 1, l'estimateur ^ f Pr n

se reduit a l'estimateur de Geroy

^ f

G

n

rapp ele (2.1). Dans e adre,

et sous ertaines onditions sur la suite (k

n

), nous avons montre [75℄, Theoreme 4 que

^ f

Pr

n (x)

onvenablement normalise onverge en loi a x 2 [0;1℄ xe vers une loi de Weibull des valeurs

extr^emesdefon tion derepartitionH

1

denieen (1.1).Par ontre,lorsque

n

!1,on retrouve

une omp ortement analoguea elui apparaissant ave les basesC

1 .La normalite asymptotique de ( Pr n (x)) 1 ( ^ f Pr n (x) E[ ^ f P r n (x)℄) et ( Pr n (x)) 1 ( ^ f Pr ;2 n

(x) f(x))est etablie a x 2[0;1℄xe dans [75℄,

theoremes5&7ave

Pr

n

(x)intro duiten(2.16).Enn,nousavonsmontrelanormaliteasymptotique

de l'erreur L

1

entre l'estimateur de Haar et la vraie frontiered

1 ( ^ f Pr n ;f) dans le as o u N n est un

pro essus dePoisson[68℄:

Theoreme 2.2.1 Supposons f -lips hitzienne(0< 1). Si k

n

=o(n=logn), n=o(h

1+ n ) et k n =o(h 4=3 n ) alors n k 1=2 n d 1 ( ^ f Pr n ;f) E h d 1 ( ^ f Pr n ;f) i d !N(0;1): (2.17)

Notons que e resultat englob e les deux as opp oses

n

= 1 (estimateur de Geroy) et

n

! 1.

En renfor ant les onditions sur la suite (h

n

), la onvergen e (2.17) est onservee si on rempla e

l'esperan e E h d 1 ( ^ f Pr n ;f) i park n

=(n ),voir [68℄, Theoreme1.

2.2.1.2 Cas d'une base non-orthogonale

L'exempledelabasedeFab er-ShauderestetudiedanslathesedeLaurentGardes[55℄,Chapitre1.

LabasedeFab er-Shauderestdenieapartirdelasub division dyadique fJ

` g

`1

de[0;1℄intro duite

dansleparagraphe pre edent.Lesfon tions qui la omp osent sont ontinuesetsont donneespar

e 1 (x)=Ifx2[0;1℄g; e 0 (x)=xIfx2[0;1℄g; etp our `1 par e ` (x)=2 q ` x p ` 2 q ` 1 Ifx2J 2` g x p ` +1 2 q ` 1 Ifx2J 2`+1 g : Les suites (b n ) et (k n

) sontdenies de lam^eme maniereque p our l'estimateurde Haar.

L'estima-teur ^ f

LG

n

obtenu s'e rit en ore sous la forme (2.15) o u l'expression du noyau est donnee par [53℄,

Prop osition 1.Suivant lesordresdegrandeur resp e tifsde (b

n )et(k n ), ladieren e ^ f LG n (x) f(x)

onvenablementnormalisee onvergeenloiversuneloidesvaleursextr^emes(voir[53℄,Theoreme5)

ou vers uneloi normale entree reduite(voir [53℄,Theoreme7).

2.2.2 Estimation par la methodedu noyau

Les travaux de rits dans e paragraphe ont ete menes en ollab oration ave Pierre Ja ob et sont

(34)

que E(N n

(D )) = n. Formellement, l'estimateur de la frontiere base sur la metho de du noyau est

semblable a (2.12).Il s'e rit ^ f Ke n (x)= kn X r =1 K n (x x n;r ) Y n;r k n ; (2.18) o u K n

est deni par

K n (t)= 1 h n K t h n ; t2R: (h n

) designe unesuite dereelsp ositifstendantvers0parfoisapp elee fen^etredelissage etK estun

noyau de Parzen-Rosenblatt. Nous avonsegalement intro duit

^ f

Ke;2

n

,une versionde etestimateur

orrigee du biais, ^ f Ke;2 n (x)= kn X r =1 K n (x x n;r ) Y n;r +Z 0 n k n ;

o u, ontrairement a(2.14),la orre tionde biais denie par

Z 0 n = 1 n k n kn X r =1 Y n;r ;

ne faitapp el qu'adesobservations situees auvoisinagede lafrontiere.La normalite asymptotique

a x2℄0;1[ xede ( Ke n ) 1 ( ^ f Ke n (x) E[ ^ f Ke n (x))℄ et( Ke n ) 1 ( ^ f Ke;2 n

(x) f(x))estetabliep our

Ke n = k 1=2 n n h 1=2 n Z R K 2 (t)dt 1=2 ; (2.19)

et sous diverses onditions sur le noyau K, la regularite de la fon tion f et les suites (k

n

) et

(h n

), voir theoremes 3 & 5. La onvergen e en loi n'a lieu i i que sur l'interieur de l'intervalle

[0;1℄. De m^eme,

^ f

Ke

n

ne onverge uniformement vers f que sur les ompa ts de ℄0;1[, voir par

exemple [78℄, Theoreme1 ou Theoreme2.Ce mauvais omp ortement desestimateursa noyau sur

les b ords de l'intervalle d'estimation est bien onnu, il aeteegalement onstatedans la pratique.

Des metho des de symetrisation des donnees ont ete prop osees an de pallier es limitations. Par

exemple, l'appli ation de late hnique de rite dans[25℄a

^ f

Ke;2

n

onduit al'estimateursuivant:

^ f Ke;3 n (x)= kn X r =1 (K n (x x n;r )+K n (x+x n;r )+K n (x+x n;r 2)) Y n;r +Z n k n :

Lesproprietesasymptotiquesde

^ f

Ke;2

n

surles ompa tsde ℄0;1[p euvent alors^etreetenduesa

^ f

Ke;3

n

surl'intervalle [0;1℄.

2.2.3 Estimation par la methodedu noyau generalise

Lestravauxpresentesi isontissusd'une ollab orationave Ludovi Menneteau (Universite

Mont-p ellier 2).La famille d'estimateursprop osee[79℄englob elesestimateurs

^ f Pr n et ^ f Ke n ,touten orant