• Aucun résultat trouvé

PBMR : Param`etres al´eatoires

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 160-0)

Chapitre 4 : Application au combustible HTR 113

A.5 Conclusion : dans la pratique

4.4.3 PBMR : Param`etres al´eatoires

0.0 0.2 0.4 0.6 0.8 1.0

−300−200−1000100200

temps adimensionné

contraintes orthoradiales (MPa)

SiC IPyC OPyC

Fig. 4.4.6 – Evolution des contraintes orthoradiales moyennes dans les couches d’IPyC, SiC´ et OPyC en fonction du temps

probabilit´e ´ecart-type estim´e ´ecart-typ estim´e

de rupture par bootstrap

estimateur sans recyclage (2.3.1.1) 1.0116 107 4.17756 108 4.1812 108 estimateur avec recyclage (2.3.1.2) 5.4925 107 3.49 107 3.492 107 estimateur mixte (§ 2.4.3.4) 4.063 107 1.0491 107

Tab.4.4.4 –PBMR - Probabilit´e de rupture , premier essai (n1= 200, n2= 200et n3 = 400)

l’ordre de 40% pour l’estimateur sans recyclage), il serait int´eressant d’utiliser un nombre de simulations plus importants.

Nous optons encore pour une strat´egie `a trois ´etapes : n1 = 200, n2 = 200 et n3 = 1000.

Les r´esultats sont d´ecrits dans le tableau 4.4.5 et illustr´es sur la figure 4.4.8. L’estimation de la probabilit´e de rupture gagne un peu en pr´ecision (coefficient de variation de l’ordre de 30%).

a)

probabilité de rupture

histogramme

0.0e+00 5.0e−08 1.0e−07 1.5e−07 2.0e−07 2.5e−07 3.0e−07 3.5e−07

0e+002e+064e+066e+068e+06

log10(probabilité de rupture)

histogramme

−8.5 −8.0 −7.5 −7.0 −6.5

0.00.51.01.52.0

b)

probabilité de rupture

histogramme

0.0e+00 5.0e−07 1.0e−06 1.5e−06 2.0e−06 2.5e−06 3.0e−06 3.5e−06

05e+0510e+0515e+05

log10(probabilité de rupture)

histogramme

−7.0 −6.5 −6.0 −5.5

0.00.51.01.52.02.5

c)

probabilité de rupture

histogramme

2e−07 4e−07 6e−07 8e−07

0e+001e+062e+063e+06

probabilité de rupture

histogramme

−7.0 −6.8 −6.6 −6.4 −6.2 −6.0

0.00.51.01.52.02.53.03.5

Fig.4.4.7 –Histogramme de la probabilit´e de rupture estim´ee obtenu par bootstrap sur 5OOOO r´e-echantillonnages - PBMR, premier essai (n1 = 200, n2 = 200 et n3 = 400). a) estimateur sans recyclage (2.3.1.1), b) estimateur avec recyclage (2.3.1.2), c) estimateur mixte (§ 2.4.3.4)

probabilit´e ´ecart-type estim´e ´ecart-typ estim´e

de rupture par bootstrap

estimateur sans recyclage (2.3.1.1) 1.17485 107 3.6971 108 3.6922 108

Tab.4.4.5 –PBMR - Probabilit´e de rupture, deuxi`eme essai (n1= 200,n2= 200etn3 = 1000)

4.4.3 GT-MHR

Les conditions d’irradiation d’un r´eacteur de type GT-MHR (ou ANTARES pour ce qui concerne le reacteur de AREVA-NP), n’´etant pas publi´ees, nous allons beaucoup utiliser la description du r´eacteur PBMR vue au paragraphe pr´ec´edent. Les performances du combustible

probabilité de rupture

histogramme

0.0e+00 5.0e−08 1.0e−07 1.5e−07 2.0e−07 2.5e−07 3.0e−07 3.5e−07

0e+002e+064e+066e+068e+061e+07

probabilité de rupture

histogramme

−7.8 −7.6 −7.4 −7.2 −7.0 −6.8 −6.6 −6.4

0.00.51.01.52.02.5

Fig.4.4.8 –Histogramme de la probabilit´e de rupture estim´ee obtenu par bootstrap sur 5OOOO r´e-echantillonnages - PBMR, deuxi`eme essai (n1 = 200, n2 = 200 et n3 = 1000). Estimateur sans recyclage (2.3.1.1)

ne seront donc pas forc´ement repr´esentatives.

4.4.3.1 Gestion du combustible

Dans ce type de r´eacteur, l’´el´ement combustible est un compact et a une place fixe durant un cycle d’irradiation. Parmi les gestions possibles un combustible, nous consid´erons que le combustible sera irradi´e en deux cycles avant d’ˆetre mis au rebut. Entre ses deux passages, le combustible vera sa position verticale modifi´ee et sa position radiale conserv´ee.

Comme la vitesse de combustion varie n´egativement beaucoup en fonction de la tempera-ture, nous utilisons la gestion suivante : le combustible est plac´e en partie basse chaude lorsqu’il est neuf, puis en position haute plus froide pour son deuxi`eme cycle. Sur les sch´emas indus-triels, les combustibles vont plutˆot, neuf, aux extr´emit´es puis, usag´es, au centre, mais ce que nous consid´erons convient mieux pour les conditions simples que nous prenons. La diff´erence vient peut ˆetre de l’influence des barres de contrˆole.

la premi`ere position verticale (distance au sommet) est al´eatoire et suit une loi uniforme U(5.5,11). Lors du second passage, les ´el´ements sont rapproch´es du haut d’une mi-hauteur.

Bien que le cœur soit form´e d’assemblages hexagonaux, nous l’approchons par un cylindre trou´e. La position de l’´el´ement combustible est prise al´eatoirement dans le r´eacteur avec un rayon au carr´e de densit´e uniformeU(1,3.4225).

4.4.3.2 Conditions en r´eacteur

Nous supposons que le r´eacteur a une puissance totale, une vitesse de fission moyenne et une g´eom´etrie similaire `a celle du r´eacteur PBMR. De par la g´eom´etrie et la disposition, tr`es diff´erentes, la densit´e en combustible est diff´erente dans le coeur et donc tous ces paramˆetres ne

peuvent ˆetre conserv´es. Cependant, nous supposerons que pour une puissance totale identique, c’est la taille du coeur qui sera differente, mais que les param`etres concernant les particules restent corrects moyennant un changement de variable sur les param`etres de position.

Dans un r´eacteur de type GT-MHR, il est possible de disposer le combustible avec un enrichissement variable en fonction de la position et la quantit´e de graphite dans le coeur est plus importante. Cela permet d’obtenir une vitesse de fission `a peu pr`es identique pour tout rayon. La position de certains objets dans le coeur (barres de contrˆole par exemple), et le nombre r´eduit d’enrichissements diff´erents utilis´es font qu’il reste une variation, mais celle ci est plus faible et suppos´ee d´ecoupl´ee des autres param`etres. Pour le facteur correctif de la vitesse de fission en fonction du rayon, nous prendrons alors une gaussienneN(1,0.1) tronqu´ee

`

a [0.5,1.5].

Nous n´egligeons l’effet de la gestion du combustible sur l’´evolution verticale de la fluence rapide et de la vitesse de fission et nous conservons les mˆemes profils que pour le reacteur PBMR (les mˆemes facteurs correctifs). En absence de donn´ees sur ce sujet, nous gardons aussi le mˆeme profil radial de la fluence rapide. Nous modifions le facteur correctif de la vitesse de fission en fonction du nombre de nombre de passages pour ne prendre en compte que deux

´etats : 1.6−0.4io`u iest le nombre de passages. Enfin, nous supposerons que le caloporteur a une temp´erature identique au PBMR en entr´ee et en sortie, ceci n’´etant pas fix´e par le coeur.

Comme nous avons le mˆeme profil vertical de densit´e de fission, nous conservons la mˆeme

´evolution verticale moyenne de la temp´erature du caloporteur que pour le r´eacteur PBMR.

Comme les ´el´ements sont souvent verticaux et traversant le r´eacteur, la fluctuation radiale de la densit´e de fission sera prise en compte pour la temp´erature du caloporteur, celui-ci ne subissant aucun «rem´elange». La particule est positionn´ee al´eatoirement dans le compact dont la temp´erature a une forme parabolique. Il y a ensuite des gradients entre le bord du compact et le bloc en graphite dˆu `a un jeu gazeux et `a un gradient dans le bloc graphite.

Finalement, nous consid´erons la temp´erature d’une particule suivante :

Tpart=THe+Q

(rext2 −r2)

4.V.λcompact + lgas

S.λgas + lgraphite S.λgraphite

, (4.4.2)

o`u :

THe la temp´erature du caloporteur : THe = 34.3587

0.000686

5 Z+0.023688 4

Z0.274258 3

Z + 1.026548

2

Z+ 0.600642

ZcorF1+ 773,

o`u CorV1 facteur correctifs de la vitesse de fission en fonction du rayon ;

S= 1.92 103 (m2) surface lat´erale du compact ; V = 6.01 10−6 (m3) le volume du compact ; rext= 6.25 103 (m) le rayon du compact ; r la position de la particule dans le compact ; λgraphitecompact= 20 (W/m/K) ;

lgas = 25.10−6 (m) ;

lgraphite = 2.2 103 (m), c’est un chemin ´equivalent ; Qla puissance totale du compact.

Apr`es les deux cycles, nous ´elevons la temp´erature `a 1873 K pour repr´esenter une situation accidentelle, c’est `a ce moment l`a que nous ´evaluons la fiabilit´e. Le taux de combustion final est en moyenne 9.56% FIMA.

4.4.3.3 R´esultats

Le tableau 4.4.6 r´ecapitule les param`etres al´eatoires en entr´ee du code ATLAS.

Param`etres al´eatoires Lois

Diam`etre du noyau N(251 106,5.4 106)

Epaisseur du buffer´ N(94.9 106,14.3 106) tronqu´e `a [5.106,200.106] Epaisseur de IPyC´ N(41.0 106,3.4 106)

Epaisseur du SiC´ N(35.4 106,1.9 106) Epaisseur de OPyC´ N(40.0 10−6,3.8 10−6)

Position radiale du compact U(1,3.4225)

Position verticale du compact en d´ebut de vie U(5.5,11) Carr´e de la position radiale de la particule dans le compact U(1,3.4225

facteur correctif vitesse de fission N(1,0.1) tronqu´ee [0.5,1.5]

Tab.4.4.6 –GT-MHR : Param`etres al´eatoires (pour les gaussiennes, c’est l’´ecart-type qui est indiqu´e et non la variance)

La figure 4.4.9 illustre l’´evolution des contraintes orthoradiales dans les couches d’IPyC, de SiC et d’OPyc au cours du temps ; ces r´esultats ont ´et´e obtenu avec ATLAS.

Pour estimer la probabilit´e de rupture nous avons utilis´e le tirage d’importance adaptatif pr´esent´e dans le chapitre 2. Nous avons choisi une strat´egie `a trois ´etapes :n1= 200, n2= 200 etn3= 200. Les r´esultats sont d´ecrits dans le tableau 4.4.7)

L’estimation de la probabilit´e de rupture est pr´ecise (coefficient de variation de l’ordre de 7% pour l’estimateur sans recyclage).

Remarque :Bien que la probabilit´e de rupture soit plus ´elev´ee ici que sur la concept pr´ec´edent,

0.0 0.2 0.4 0.6 0.8 1.0

−300−200−1000100200

temps adimensionné

contraintes orthoradiales (MPa)

SiC IPyC OPyC

Fig.4.4.9 –Evolution des contraintes orthoradiales dans les couches d’IPyC, SiC et OPyC en´ fonction du temps. Les pics sont obtenus lors de l’inter-cycle.

probabilit´e ´ecart-type estim´e ´ecart-typ estim´e

de rupture par bootstrap

estimateur sans recyclage (2.3.1.1) 1.11558 10−5 7.7893 10−7 7.8214 10−7 estimateur avec recyclage (2.3.1.2) 1.28455 10−5 3.1464 10−6 3.11887 10−6 estimateur mixte (§ 2.4.3.4) 1.159 105 1.0491 9.27

Tab.4.4.7 – GT-MHR - Probabilit´e de rupture

nous ne pouvons en d´eduire la comparaison entre les deux concepts, les conditions n’´etant pas encore repr´esentative et le taux de combustion final moyen sensiblement diff´erent (8.33% FIMA pour PBMR et 9.56% FIMA pour GT-MHR).

a)

probabilité de rupture

histogramme

8.0e−06 9.0e−06 1.0e−05 1.1e−05 1.2e−05 1.3e−05 1.4e−05 1.5e−05

0e+001e+052e+053e+054e+055e+05

log10(probabilité de rupture)

histogramme

−5.10 −5.05 −5.00 −4.95 −4.90 −4.85

024681012

b)

probabilité de rupture

histogramme

5.0e−06 1.0e−05 1.5e−05 2.0e−05 2.5e−05 3.0e−05

03e+046e+049e+0412e+04

log10(probabilité de rupture)

histogramme

−5.2 −5.0 −4.8 −4.6

0123

c)

probabilité de rupture

histogramme

8.0e−06 1.0e−05 1.2e−05 1.4e−05 1.6e−05

0e+001e+052e+053e+054e+05

probabilité de rupture

histogramme

−5.10 −5.05 −5.00 −4.95 −4.90 −4.85 −4.80

0246810

Fig.4.4.10 –Histogramme de la probabilit´e de rupture estim´ee obtenu par bootstrap sur 5OOOO r´e-echantillonnages - GT-MHR. a) estimateur sans recyclage (2.3.1.1), b) estimateur avec recyclage (2.3.1.2), c) estimateur mixte (§ 2.4.3.4)

Chapitre 5

ESTIMATION DE QUANTILES ET APPLICATION

5.1 Introduction

L’estimation de quantiles est un des probl`emes fondamentaux en statistique, et repr´esente un enjeu important pour les applications [LWDK 91]. Dans des situations complexes, par exemple dans le cas o`u l’on recherche le quantile d’une quantit´e qui est une sortie d’un gros code num´erique, le nombre d’appels au code peut ˆetre limit´e et rendre difficile l’application de m´ethodes de type Monte Carlo. Des techniques de r´eduction de variance ont ´et´e mises au point et impl´ement´ees pour r´epondre `a ce genre de probl`emes. Ces techniques sont en g´en´eral bas´ees sur des m´ethodes d’´echantillonnage pr´ef´erentiel [Gly 96], des m´ethodes de corr´elation-induction [AW 88], et des m´ethodes de variables de contrˆole [HeN 98]. Dans ce chapitre, nous allons nous concentrer sur les techniques de r´eduction de variance utilisant un mod`ele r´eduit.

La configuration que nous avons en tˆete est celle o`u nous disposons, en plus du gros code num´erique, d’un code simplifi´e qui fournit une r´eponse approch´ee, mais qui est beaucoup moins ch`ere en termes de coˆut de calcul. Nous allons voir comment exploiter au mieux l’existence d’un tel mod`ele r´eduit.

L’estimation du quantile d’une variable al´eatoire r´eelle Y a pour but de d´eterminer le niveauy∈Rtelle que la probabilit´e queY soit plus petite queyait une valeur prescrite. Nous supposerons dans ce chapitre queY est une v.a. `a densit´e et que la densit´e deY est strictement positive sur R (ou sur l’intervalle I supportant la densit´e). On recherche une estimation du α-quantile deY, c’est-`a-dire du r´eelyα tel queP(Y ≤yα) =α.

Dans ce chapitre, on consid´erera plus particuli`erement le cas o`u Y est la (une) sortie r´eelle d’un gros code num´eriquef, dont les param`etres d’entr´ee sont al´eatoires et mod´elis´es par le vecteur al´eatoire X ∈ Rd, dont la loi est connue. Notre motivation vient des progr`es r´ecents en calcul scientifique et en m´ethodes num´eriques, qui ont permis la mise au point de codes de calculs num´eriques mod´elisant des ph´enom`enes de plus en plus complexes [SMW 89, FLS 06].

Le probl`eme de l’estimation de quantiles peut ˆetre r´esolu par des techniques d’´echantillonnage classique de type Monte Carlo, ou par des m´ethodes de quasi Monte Carlo (du type hypercube latin ou autres). Lorsque les simulations num´eriques sont trop coˆuteuses pour obtenir une estimation du quantile recherch´e avec une pr´ecision suffisante, des m´ethodes bas´ees sur des

r´esultats de statistique d’ordre sont possibles [Dav 81, NeWGB 04]. Une alternative consiste

`

a remplacer le gros code num´erique par un mod`ele r´eduit, du type m´etamod`ele ou surface de r´eponse [LWDK 91, FLS 06].

Cependant, il faut prendre garde que l’estimation d’un quantile `a partir d’un m´etamod`ele ou d’une surface de r´eponse peut conduire `a des erreurs importantes, car ces mod`eles r´eduits sont en g´en´eral construits par lissage de r´esultats issus du gros code num´erique. R´ecemment, certains auteurs ont exploit´e les avantages d’un type particulier de m´etamod`ele, `a base de processus gaussien [SMW 89], qui donne non seulement un pr´edicteur (la moyenne) d’une simulation num´erique, mais aussi un indicateur local sur la pr´ecision de la pr´ediction (la variance). Dans ce cadre, les auteurs de [Oak 04] et [VPM ] ont d´evelopp´e des proc´edures s´equentielles pour choisir des points de conception et pour construire des m´etamod`eles gaussiens pr´ecis pr`es des zones d’importance, dont d´epend la valeur du quantile. Rutherford [Rut 06] a aussi propos´e d’utiliser des techniques de simulation conditionnelle, utilis´ees surtout en g´eostatistique, pour obtenir plusieurs r´ealisations possibles du processus gaussien, et pour en en d´eduire un estimateur du quantile non-biais´e. Toutes ces techniques sont bas´ees sur la construction d’un mod`ele `a base de processus gaussien, ce qui peut s’av´erer difficile en grande dimension (d > 10) ou pour des ph´enom`enes discontinus. De plus, il apparaˆıt en pratique tr`es souvent qu’un m´etamod`ele est souvent disponible dans les applications industrielles, ce mod`ele provenant d’une version ant´erieure du code principal ou d’un mod`ele physique simplifi´e.

Dans ce chapitre, nous supposerons donc que nous disposons d’un code complet f, dont chaque appel est coˆuteux, et d’un mod`ele r´eduit fr beaucoup plus l´eger mais approximatif.

Nous ne chercherons pas `a construire un m´etamod`ele plus ´elabor´e, mais nous chercherons `a utiliser au mieux le mod`ele r´eduitZ =fr(X) pour mettre au point une m´ethode de r´eduction de variance pour l’estimation d’un quantile deY =f(X).

5.2 Estimation de quantile sur un n-´echantillon

On dispose d’un n-´echantillon (Y1, ..., Yn) de variables al´eatoires ind´ependantes identique-ment distribu´ees (v.a. i.i.d.) selon une loi inconnue `a densit´e p(y). On cherche un estimateur duα-quantileyα d´efini par :

P(Y ≤yα) =α

Un estimateur est bˆati sur une fonction Θn:Rn→ R`a d´efinir, qui doit ˆetre telle que ˆYα,n :=

Θn(Y1, ..., Yn) est “proche” de la valeuryα.

Pour quantifier cette notion de proximit´e, on utilise classiquement la notion de risque

quadratique moyen, somme du carr´e du biais : E[ ˆYα,n]−yα et de la variance :

Var( ˆYα,n)

On peut r´eclamer que l’estimateur soit sˆur au niveauβ au sens o`u

P( ˆYα,n≥yα)≥β (5.2.1)

Bien sˆur, si ˆYα,n est un estimateur sˆur au niveauβ au sens (5.2.1), alors tout autre estimateur Yˆα,n tel que ˆYα,n ≥ Yˆα,n le sera aussi. On cherche donc, parmi tous les estimateurs sˆurs au niveau β, ceux qui sont les plus petits.

Les estimateurs qui suivent sont bas´es sur des notions de statistique d’ordre. En clair, on associe `a l’´echantillon (Y1, ..., Yn) l’´echantillon ordonn´e (Y(1), ...Y(n)) tel queY(1)< ... < Y(n). 5.2.1 Quantile empirique

L’estimateur classique duα-quantile est le quantile empirique

α,n =Y(αn+1) (5.2.2)

o`u ⌊x⌋ est la partie enti`ere de x. La version la plus raffin´ee de ce r´esultat est bas´ee sur une formule d’interpolation qu’on ne d´eveloppera pas ici. On supposera dans la suite que αn est un entier.

Le r´esultat asymptotique (n→ ∞) est le suivant (dans le cas o`u la densit´ep(y) est d´erivable en yα), donn´e par exemple dans [Dav 81].

α,n est un estimateur biais´e et asymptotiquement normal : E[ ˆYα,n] = yα−α(1−α)p(yα)

2(n+ 2)p3(yα) +O( 1

n2) (5.2.3)

Var( ˆYα,n) = α(1−α)

(n+ 2)p2(yα) +O( 1

n2) (5.2.4)

Le biais est donc asymptotiquement n´egligeable (compar´e `a l’´ecart-type), et la variance est d’autant plus grande que l’on cherche `a ´evaluer un quantile extrˆeme (la densit´e au point yα est alors petite).

Construire un estimateur sˆur au niveau β en utilisant le r´esultat pr´ec´edent n’est pas une bonne id´ee. En effet, on pourrait proposer

α,n+tβ

pα(1−α)

√n+ 2p(yα)

avectβ = Φ1(β) et Φ la fonction de r´epartition de la loi normale centr´ee r´eduite. Cependant, on voit qu’il faudrait alors estimer p(yα). L’estimation d’une densit´e, surtout dans la queue d’une distribution, n’est pas commode.

5.2.2 Quantile de Wilks

Le quantile empirique (5.2.2) v´erifiant

√n( ˆYα,n−yα)n−→ N→∞

0,α(1−α) p2(yα)

on peut en d´eduire que, asymptotiquement, il v´erifie P( ˆYα,n ≥ yα) ≃ 1/2. Pour augmenter cette probabilit´e, on peut penser `a prendre une certaine marge et `a proposer un estimateur de la forme

α,n=Y(nα+r)

La question est de savoir quelle marge il faut prendre, c’est-`a-dire quel entierr il faut choisir pour queP(Y(αn+r)≥yα)≥β.

Il est possible de choisir le r de mani`ere optimale, grˆace au r´esultat suivant qui tire sa puissance de sa grande simplicit´e. Il stipule que le nombre de d´epassements d’un seuily par la suite de v.a. i.i.d. (Y1, ..., Yn) suit une loi binomiale de param`etres (n, q), avecq=P(Y > y).

Quels que soient 0≤j ≤n,

P(j des Yi sont > y) =Cnj(1−F(y))jF(y)nj o`uF(y) =P(Y ≤y) est la fonction de r´epartition des Yi.

En prenanty=yα on obtient :

P(j desYi sont> yα) =Cnj(1−α)jαnj

Or l’´ev´enement{Y(k) > yα}se produit si et seulement si au moins n−k+ 1 des Yi sont> yα. Par cons´equent

P(Y(αn+r) > yα) =

Xn j=n(1−α)−r+1

P(j desYi sont > yα)

=

Xn j=n(1α)r+1

Cnj(1−α)jαn−j

= 1−Cα(n, r) avec

Cα(n, r) =

n(1Xα)r j=0

Cnj(1−α)jαnj (5.2.5)

Conclusion : Si on noter le plus petit entier tel que

Cα(n, r)≤1−β (5.2.6)

alors P(Y(αn+r)> yα)≥β, c’est-`a-dire que l’estimateurY(αn+r) est sˆur au niveau β.

En fait, en suivant les parties enti`eres, on voit qu’il est pr´ef´erable d’utiliser la formule d’interpolation

α,n =a1Y(αn+r)+a2Y(αn+r−1) (5.2.7) avec

a2 = 1−β−Cα(n, r) Cα(n, r−1)−Cα(n, r) a1=− 1−β−Cα(n, r−1)

Cα(n, r−1)−Cα(n, r)

Application : Si n= 200, α=β = 0.95, alorsαn+r= 196, a1 = 0.34,a2 = 0.66.

L’estimateur de Wilks est valable mˆeme pournpetit, tout au moins pourn≥nco`uncest la taille critique de l’´echantillon `a partir duquel l’estimateur de Wilks est bien d´efini. L’existence d’un tel n critique est naturel : en effet on ne peut pas ˆetre certain que le maximum absolu d’un ´echantillon de taille 10 soit au dessus du quantile `a 99%. La taille critique nc est le plus petitn tel queP(Y(n) > yα)≥β, c’est-`a-dire

nc =

ln(1−β) ln(α)

+ 1 Application : Si α=β = 0.95, alors nc = 59.

On peut d´ecrire le comportement asymptotique de l’indice r de l’estimateur de Wilks lorsquen→ ∞. On trouve que

r∼tβp

α(1−α)n (5.2.8)

avec tβ = Φ−1(β).

Application : pour β = 0.95, on a tβ ≃ 1.645. Si de plus α = 0.95 et n = 200, on trouve tβp

α(1−α)n≃5.07, ce qui correspond `a la vraie valeur 6 (en prenant l’entier sup´erieur).

D´emonstration : On donne ci-dessous la preuve de (5.2.8).

On prend r =r

n et on ´ecrit Cα(n, r) =

n(1α)r

X n j=0

Cnj(1−α)jαnj

On va calculer l’asymptotique de cette expression quandn→ ∞. On utilise pour cela la formule de Stirling, et on change d’indicek=j−n(1−α) :

Cα(n, r)≃ 1 p2πnα(1−α)

r

Xn k=n(1α)

1 + k

n(1−α)

n(1α)k 1− k

nα+k

On prend ensuite la forme exponentielle, et on d´eveloppe le logarithme `a l’ordre deux :

On reconnaˆıt une somme de Riemann Cα(n, r)≃ 1

Concluons ce paragraphe en fournissant quelques comparaisons entre estimateur empirique et estimateur de Wilks pour diff´erentes lois (figure 5.2.1).

5.2.3 Quantile empirique avec bootstrap

La m´ethode bootstrap consiste `a r´e-´echantillonner dans l’´echantillon lui-mˆeme pour exa-miner les fluctuations des estimateurs empiriques [Efr 79].

A partir de l’´echantillon (Y1, ..., Yn), on tire une s´erie tr`es grande d’´echantillons de mˆeme taille ( ˜Y1l, ...,Y˜nl),l= 1, ..., M,M ≫1, de la mani`ere suivante. Conditionnellement `a (Y1, ..., Yn), sont identiquement distribu´ees. Le r´esultat asymptotique (n → ∞) est le suivant [BF 81, Fre 81].

√n( ˜Y(αn)−yα) a la mˆeme distribution que√

n(Y(αn)−yα) quand n→ ∞.

a) 1 1.5 2 2.5

0 0.5 1 1.5 2 2.5 3 3.5 4

y

histogramme

quantile empirique quantile Wilks beta =0.95 vrai quantile

b) 0 5 10 15 20 25 30

0 0.05 0.1 0.15 0.2 0.25

y

histogramme

quantile empirique quantile Wilks beta =0.95 vrai quantile

c) 0.85 0.9 0.95 1

0 10 20 30 40 50

y

histogramme

quantile empirique quantile Wilks beta =0.95 vrai quantile

d) 4 6 8 10 12

0 0.1 0.2 0.3 0.4 0.5 0.6

y

histogramme

quantile empirique quantile Wilks beta =0.95 vrai quantile

Fig. 5.2.1 – Comparaisons entre l’estimateur empirique et l’estimateur de Wilks au niveau β pour le α-quantile d’une v.a. Y. Ici α = β = 0.95 et l’´echantillon a pour taille n = 200.

Les histogrammes des estimateurs sont trac´es `a partir de106 exp´eriences. La loi de Y est une gaussienneN(0,1)(figure a), une Cauchy (figure b), une loi uniforme sur[0,1](figure c) et une log-normale (figure d). Comme pr´edit par la th´eorie, l’estimateur de Wilks donne une valeur inf´erieure au vrai quantile dans 5% des simulations (zones hachur´ees). Cette pr´ecision a un prix : la dispersion de l’estimateur de Wilks est sup´erieure `a celle de l’estimateur empirique.

La distribution conditionnelle duα-quantile empirique avec bootstrap ˜Y(nα), conditionnel-lement `a (Y1, ..., Yn), se calcule de mani`ere similaire `a la formule de Wilks. On a en effet

P(j des ˜Yi sont> y|(Y1, ..., Yn)) =Cnj(1−Fn(y))jFn(y)nj

o`u Fn(y) est la fonction de r´epartition de ˜Y conditionnellement `a (Y1, ..., Yn) :

Fn(y) =P( ˜Y ≤y|(Y1, ..., Yn)) = k

n siy∈[Y(k), Y(k+1)[

avec la convention Y(0) =−∞ etY(n+1) = +∞. Par cons´equent, la loi de ˜Y(nα),

conditionnel-lement `a (Y1, ..., Yn), est donn´ee par : P( ˜Y(nα)> y|(Y1, ..., Yn)) =

Xn j=n(1α)+1

P(j des ˜Yi sont> y|(Y1, ..., Yn))

= 1−

n(1Xα) j=0

Cnj(1−Fn(y))jFn(y)nj

et donc

P( ˜Y(nα)> y|(Y1, ..., Yn)) = 1−

n(1−α)X

j=0

Cnj

1−k n

j k n

n−j

(5.2.9) pour touty∈[Y(k), Y(k+1)[.

On observe le ˆyα,n tel que une fraction 1−β des ´echantillons bootstrap ˜Y(nα)l ,l= 1, ..., M, sont au del`a de ˆyα,n. Le r´esultat sur le comportement asymptotique des estimateurs bootstrap

´enonc´e ci-dessus nous dit que ˆyα,nest un estimateur deyαsˆur au niveauβ, dans l’asymptotique n→ ∞. En fait, on peut d´eterminer cet estimateur de mani`ere pr´ecise ici. En effet, supposons queM soit suffisamment grand pour qu’on puisse consid´erer qu’on estime parfaitement la loi de ˜Y(nα) conditionnellement `a (Y1, ..., Yn). Alors, d’apr`es (5.2.9), on a simplement

ˆ

yα,n=Y(n−k) aveck le plus grand entier tel que

n(1−α)X

j=0

Cnj k

n j

1− k n

n−j

≥β (5.2.10)

Le ˆyα,n ainsi obtenu est tr`es proche de l’estimateur de Wilks. En fait, dans l’asymptotique n→ ∞, on trouve que

n−k≃αn+tβp

α(1−α)n

Le preuve est tr`es similaire `a celle de (5.2.8) : On calcule l’asymptotique de (5.2.10) avec k=n(1−α) +r

navec la formule de Stirling, on reconnaˆıt une somme de Riemann et on la calcule par son approximation sous forme d’int´egrale continue.

L’indice du quantile empirique avec bootstrap a exactement le mˆeme comportement asymp-totique que l’indice de l’estimateur de Wilks obtenu dans la section pr´ec´edente. Donc le quan-tile empirique avec bootstrap est asymptotiquement ´equivalent au quanquan-tile de Wilks quand n→ ∞. Pour nfini, l’estimateur de Wilks est cependant `a pr´ef´erer car on est toujours assur´e qu’il r´epond `a la sp´ecification d’ˆetre sˆur au niveau β. De plus, il est beaucoup plus simple `a

L’indice du quantile empirique avec bootstrap a exactement le mˆeme comportement asymp-totique que l’indice de l’estimateur de Wilks obtenu dans la section pr´ec´edente. Donc le quan-tile empirique avec bootstrap est asymptotiquement ´equivalent au quanquan-tile de Wilks quand n→ ∞. Pour nfini, l’estimateur de Wilks est cependant `a pr´ef´erer car on est toujours assur´e qu’il r´epond `a la sp´ecification d’ˆetre sˆur au niveau β. De plus, il est beaucoup plus simple `a

Dans le document Universit´e Denis Diderot Paris VII Th`ese (Page 160-0)