HAL Id: hal-00256148
https://hal-supelec.archives-ouvertes.fr/hal-00256148
Submitted on 15 Feb 2008
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of sci-
entific research documents, whether they are pub-
lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Estimation du volume des ensembles d’excursion d’un
processus Gaussien par Krigeage intrinsèque
Emmanuel Vazquez, Miguel Piera-Martinez
To cite this version:
Emmanuel Vazquez, Miguel Piera-Martinez. Estimation du volume des ensembles d’excursion d’un
processus Gaussien par Krigeage intrinsèque. Conférence Journée de Statistiques, Jun 2007, Angers,
France. pp.CD-ROM Proceedings. �hal-00256148�
pro essus gaussien par krigeage intrinsèque
Emmanuel Vazquez &Miguel Piera-Martinez
Supéle , Département Signaux et Systèmes Éle troniques, 91192 Gif-sur-Yvette, Fran e
Résumé Estimeruneprobabilitédedéfaillan ed'unsystèmeentrée-sortieàpartird'obser-
vationspon tuellesde elui- iestunproblèmeimportantpourlemondeindustriel.Uneappro he
possible onsiste àmodéliserlesystème ommelaréalisationd'unpro essusaléatoireetde s'in-
téresser auvolume d'ex ursionde e pro essus.Soit
ξ
unpro essusaléatoiregaussien et|A u (ξ)|
levolumedel'ensembled'ex ursionde
ξ
audessusd'unseuilu
sousunemesuredeprobabilitéµ
.L'obje tifde etarti leestd'estimerlevolumed'ex ursionàpartirde
n
observationspon tuelles dupro essus.Nousproposonsd'approximer levolumed'ex ursiondeξ
par elui d'unprédi teurξ n
obtenu par krigeage intrinsèqueà partir desn
observations. Nous étudions les propriétés de onvergen e de ette approximation. Dans un deuxième temps, nous proposons un algorithmevisant à hoisir lespointsd'observationpour a élérer la onvergen e del'estimateur.
Abstra t Theestimationofthevolumeofanex ursionsetisahighlyrelevantproblemfor
theindustrial worldsin e it orrespondsto theestimation ofthefailureprobability ofa system
thatisknownonlythroughsampledobservations.AssumethataGaussianpro ess
ξ
ispredi tedfrom
n
pointwise observations byintrinsi Kriging and thatthe volume of the ex ursion set ofξ
above a given thresholdu
is approximated by the volume of the predi tor. The rst part of this papergivesa bound onthe onvergen e rate oftheapproximated volume. These ond partdes ribes an algorithm that onstru ts a sequen e of points to yield a fast onvergen e of the
approximation.
Mots- lés prin ipaux:Plans d'expérien e,Statistique despro essus
Mots- lés se ondaires:Quantiles, Qualité -abilité
1 Introdu tion
Considéronsunpro essusaléatoire gaussien
ξ
àvaleursréellesdénisurunensembleX
munid'une probabilité
µ
.Dénissonsl'ensemble d'ex ursiondeξ
audessusd'unniveauu
parA u (ξ) := {x ∈ X : ξ(x) ≥ u} .
(1)Le volume
µ(A u (ξ))
sera par la suite noté|A u (ξ)|
. En ingénierie,|A u (ξ)|
peut orrespondre à la probabilité de défaillan e d'unsystème (la probabilité que la sortie du système dépasse unevaleur ritique lorsqu'ilestsoumis àdesentrées aléatoires).
Notons
ξ n
l'estimateurdeξ
parkrigeageintrinsèque(Matheron,1973)àpartir d'unensemble den
observations dis rètesξ(x i )
,1 ≤ i ≤ n
.Lase tion 2étudie la onvergen e de|A u (ξ n )|
versde points
(x i )
quiminimise à haqueétapelamoyenne quadratique del'erreur d'approximation|A u (ξ)| − |A u (ξ n )|
onditionnée par les variables aléatoiresξ(x i )
,i ≤ n
. L'obje tif de et algo-rithmeestd'a élérerla onvergen ede
|A u (ξ n )|
vers|A u (ξ)|
.Lase tion4illustre etalgorithme.2 Estimation du volume d'ex ursion par krigeage intrinsèque
Une première façon d'estimer le volume d'ex ursion
|A u (ξ)|
est d'utiliser un estimateur detype Monte Carlo, tel quepar exemple
|A u (ξ)| l := 1
l
l
X
i=1
1 {ξ(X i )≥u} → l |A u (ξ)|
p.s. (2)où les
X i
sont des variables aléatoires indépendantes de loiµ
(en pratique, il est préférabled'utiliser desestimateurs ave é hantillonage d'importan e).
Dans et arti le, nous proposons d'estimer
|A u (ξ)|
en utilisant un prédi teurξ n
deξ
et enapproximant
|A u (ξ)|
par|A u (ξ n )| l
,avel
grand.Ce iaunintérêt pratiquelorsquel'observation du pro essusξ
est oûteuse. Ons'attend en eet à e queξ n
onverge susamment vite versξ
(quand
n → ∞
) pour que l'approximation proposée soit satisfaisante pour desn
relativement petits.Dans lesparagraphes suivants, nousnousintéresserons àla onvergen e de|A u (ξ n )|
vers|A u (ξ)|
.Nous utilisons le krigeage intrinsèque (Matheron, 1973) pour obtenir un prédi teur linéaire
de
ξ
à partir d'un ensemble ni d'observationsξ(x i )
,1 ≤ i ≤ n
. Rappelons que le krigeageintrinsèqueétendle on eptdeprédi tionlinéaire nonbiaiséed'unpro essusaléatoireau asoù
lamoyenne dupro essusest in onnue.
Lathéoriedel'approximationdefon tions(voirpar exempleWuand S haba k, 1993;Light
and Wayne, 1998 ; Nar owi h et al., 2003 ; Wendland, 2005) permet d'établir la vitesse de
dé roissan e de la varian e
σ 2 n (x)
de l'erreur de prédi tion par krigeage intrinsèque lorsque la densitédesobservations dupro essusau voisinagedex
augmente. Pluspré isément, siξ
estunpro essusstationnairede ovarian e
k(h)
,h ∈ R d
,X
undomainebornédeR d
,etsilatransformée de Fourier dek(h)
satisfaitc 1 (1 + kωk 2 2 ) −ν ≤ ˜ k(ω) ≤ c 2 (1 + kωk 2 2 ) −ν .
ave
ν > d/2
,alorskσ n (.)k ∞ ≤ Ch ν−d/2 n ,
(3)où
h n = sup y∈X min i ky − x i k 2
mesureladensitéde(x 1 , . . . , x n )
dansX
.La proposition suivante permet d'établir un résultat similaire pour le pro essus seuillé au
niveau
u
.Proposition 1. Soit
ξ n (x)
le prédi teur deξ
par krigeage intrinsèque onstruit à partir des observationsξ(x i )
,i = 1, . . . , n
.Posonsσ n (x) := var [ξ(x) − ξ n (x)] 1/2
. Alors,E h
(1 ξ(x)≥u − 1 ξ n (x)≥u ) 2 i
= O(σ n (x)|log(σ n (x))| 1/2 )
quandσ n (x) → 0 .
Par onséquent, pour un domaine
X
borné:E h
(|A u (ξ)| − |A u (ξ n )|) 2 i
= E
Z
X
1 ξ(x)≥u − 1 ξ n (x)≥u dµ
2
≤
Z
X
E (1 ξ(x)≥u − 1 ξ n (x)≥u ) 2 dµ
≤ Ckσ n (.)k ∞ |logkσ n (.)k ∞ | 1/2
(4)quand
n → ∞
etkσ n (.)k ∞ → 0
.Ce résultat simple montre que la vitesse de onvergen e de
|A u (ξ n )|
vers|A u (ξ)|
est liéeà la vitesse de onvergen e de
ξ n
versξ
, et don à la régularité de la ovarian e, f. (3). En hoisissant lespointsx i
surunegrille régulière,onobtienth n = O(n −1/d )
,oùd
estladimensionde
X
. Supposons que les pointsx i
remplissentX
selon une telle grille. Dans e as, la vitessede onvergen e de
|A u (ξ n )|
vers|A u (ξ)|
sera plus rapide que elle de l'estimateur (2) dès queν > 3d/2
(voirVazquez and Piera-Martinez,2006).3 A élération de onvergen e
3.1 Contrle de la onvergen e
Soit
f : X → R
une traje toire deξ
,observée en une suite de points(x n ) n∈N
.Cette se tionpropose un algorithme de onstru tion de la suite
(x n )
en vue d'optimiser la dé roissan e de l'erreur d'approximation|A u (ξ)| − |A u (ξ n )|
onditionnée par les observationsξ(x i ) = f (x i )
,i = 1, . . . , n
.Nousproposonsunestratégiede ontrleàunpas onsistantà hoisiritérativement lesx n
tels quex n = argmin
x n ∈X
Υ n (x n ) := E (|A u (ξ)| − |A u (ξ n )|) 2 | Z n−1 ,
(5)où pour tout
n
,Z n = (ξ(x 1 ), . . . , ξ(x n ))
.Notons queΥ n (x n )
peutseréé rireΥ n (x n ) = E E (|A u (ξ)| − |A u (ξ n )|) 2 | Z n | Z n−1 .
(6)La loi de
|A u (ξ)|
onditionnée par les observations est généralement in onnue (voir Adler, 2000, se tion 4.4) et par onséquent,E (|A u (ξ)| − |A u (ξ n )|) 2 | Z n
ne peut pas être déterminé
analytiquement. Une première solution serait d'utiliser une approximation MonteCarlo de (5),
en simulant le pro essus
ξ
onditionnellement aux observations. Formellement, il s'agirait de résoudrex n = argmin
x n ∈X
Υ n,m (x n ) :=
E
m −1
m
X
i=1
(|A u (ξ n + ζ n i )| − |A u (ξ n )|) 2
Z n−1 , {ζ n i , i ≤ m}
,
(7)
oùles pro essusaléatoires
ζ n i
sontm
opies indépendantes deξ
onditionnéparZ n = (0, . . . , 0)
.|A u (·)| l
. S'il est en prin ipe possible de simuler les pro essus onditionnésζ n i
(voir Chilès andDelner,1999, hap.7), essimulationssontnéanmoins oûteuses(lenombred'opérationsestde
l'ordrede
O(l 3 )
poursimulerξ
auxpointsx 1 , . . . , x l
).Commel
doitêtregrandand'obteniruneestimation susamment pré ise duvolume d'ex ursion, l'utilisation de simulationsest àéviter.
Nous proposons l'appro he alternative suivante. Tout d'abord, appro hons
E (|A u (ξ)| −
|A u (ξ n )|) 2 | Z n
par
E (|A u (ξ)| l − |A u (ξ n )| l ) 2 | Z n , {X i , i ≤ l}
, ave
l
susamment grand.D'après l'inégalité de Minkowski,nousobtenons lamajoration
E (|A u (ξ)| l −|A u (ξ n )| l ) 2 | Z n , {X i , i ≤ l} 1/2
≤ 1
l
l
X
i=1
E (1 ξ(X i )>u − 1 ξ n (X i )>u ) 2 | Z n , {X i , i ≤ l} 1/2
.
(8)
3.2 Algorithme proposé
Soit
S = {y 1 , . . . , y l }
un ensemble del
pointsdeX
générés indépendamment selon la loiµ
.Étantdonnéunesuitenie
(x i ) 1≤i≤n−1
depointsd'observation, her honslepointd'observationx n
qui minimise labornede l'erreur d'approximationdu volume obtenue dans(8):x n = argmin
x n ∈S
Υ ′ n (x n ) := 1
l
l
X
i=1
E (1 ξ(y i )>u − 1 ξ n (y i )>u ) 2 | B n−1 1/2
,
(9)où
B n
estl'évènement{ξ(x 1 ) = f (x 1 ), . . . , ξ(x n ) = f (x n )}
,n > 0
.Quelquesétapessonten orené essairespourmettreen÷uvrenumériquementleprogramme(9).
Notons d'abord que
E (1 ξ(y i )>u −1 ξ n (y i )>u ) 2 | B n−1
=
Z
z∈R
E (1 ξ(y i )>u − 1 ξ n (y i )>u ) 2 | ξ(x n ) = z, B n−1
× p ξ(x n )|B n −1 (z)dz , ∀i ∈ {1, . . . , l},
(10)
où
p ξ(x)|B n
−1
est la densitéde
ξ(x)
onditionné parB n−1
. Le krigeage intrinsèque suppose que lamoyenne deξ
est in onnue etpar onséquent,pourx ∈ X
,E (1 ξ(x)>u − 1 ξ n (x)>u ) 2 | ξ(x n ) =
z, B n−1
ne peut pas être déterminé exa tement. Cependant, on peut é rire l'approximation
suivante(voirVazquez and Piera-Martinez,2006):
E (1 ξ(x)>u − 1 ξ n (x)>u ) 2 | ξ n (x) ≈ υ n (x) := Ψ
u − ξ n (x)
σ n (x)
,
(11)où
Ψ
estlaqueue de distributiongaussienne.Ensuite,soit l'opérateur dequanti ationdéni par
∀h ∈ R , ∆ Q h = z 1 +
Q
X
i=2
(z i − z i−1 )1 ]z i ,+∞[ (h)
ave
z 1 < z 2 < · · · < z Q
.Onpeutalors réé rire (9)souslaforme :x n = argmin
x n ∈S
Υ ′′ n (x n ) :=
1
l
l
X
i=1
Q
X
j=1
P{∆ Q ξ(x n ) = z j | B n−1 } E υ n (y i ) | ξ(x n ) = z j , B n−1
1/2
.
(12)Le programme (12)est dire tement transposable en langage informatique.
4 Exemple
Cette se tion illustre l'algorithme proposé (voir la gure 1). Considérons une fon tion
f
dénie sur
R
et prenonsµ = N (0, σ 2 )
.Modélisonsf
omme une traje toire deξ
et her honsà déterminer le volume d'ex ursion
|A u (f )|
. Dans et exemple, la ovarian e deξ
est estiméeà haque étape par maximumde vraisemblan e (voir par exemple Stein, 1999). Après quelques
itérations,on onstatequelafon tion
f
aétéé hantillonnéedefaçonàdéterminerave unebonne pré ision l'ensemble d'ex ursion def
au dessus du seuil hoisi, dans larégion où la densité deprobabilitéest élevée.
Référen es
R.J.Adler. Onex ursionsets,tubeformulasandmaximaofrandomelds. Ann.Appl.Probab.,
10(1) :174, 2000.
J.-P. Chilès and P. Delner. Geostatisti s : Modeling Spatial Un ertainty. Wiley, New York,
1999.
W. Light and H. Wayne. On power fun tions and error estimates for radial basis fun tions
interpolation. J. Approx. Theory, 92(2):245266,1998.
G. Matheron. The intrinsi random fun tions, and their appli ations. Adv. Appl. Prob., 5 :
439468, 1973.
F.J.Nar owi h,J.D.Ward,andH.Wendland. Rened errorestimatesforradial basisfun tion
interpolation. Constr. Approx., 19(4):541564, 2003.
M.L.Stein. InterpolationofSpatialData :SomeTheoryforKriging. Springer,NewYork,1999.
E. Vazquez and M.Piera-Martinez. Estimation of thevolume ofan ex ursion setof aGaussian
pro ess using intrinsi kriging,2006. URL http://arxiv.org/abs/math.ST/0611273.
H. Wendland. S attered Data Approximation. Monographs on Applied and Computational
Mathemati s. Cambridge Univ.Press, Cambridge, 2005.
Z.WuandR.S haba k. Lo alerrorestimatesforradial basisfun tioninterpolationofs attered
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
1.4
−2 0 −1.5 −1 −0.5 0 0.5 1 1.5 2
0.5
1
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
0.06
0.07
0.08
Fig. 1. Haut : Seuil
u
(ligne horizontale), fon tionf
(en trait n), n=10 évaluations def
onstruites d'aprèsl'algorithme proposé en utilisant
l = 800
etQ = 20
( arrés), approximationf n
parkrigeageintrinsèque(entraitépais),intervallesde onan esà95% al ulésenutilisantla varian e de l'erreur deprédi tion du krigeageintrinsèque (entrait interrompu). Milieu:Proba-bilitéd'ex ursion
E[1 ξ(x)>u | B n ]
(entrait plein),densitéde probabilitédeµ
(entrait pointillé).Bas :Graphe de
Υ ′′ n (y i )
,i = 1, . . . , l = 800
.Le minimum de e grapheindique laposition de lapro haineévaluation de