R EVUE DE STATISTIQUE APPLIQUÉE
A. J OURDAN
Approches statistiques des expériences simulées
Revue de statistique appliquée, tome 50, n
o1 (2002), p. 49-64
<http://www.numdam.org/item?id=RSA_2002__50_1_49_0>
© Société française de statistique, 2002, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
APPROCHES STATISTIQUES
DES EXPÉRIENCES SIMULÉES
A. JOURDAN
Institut
Français
du Pétrole, 92852 Rueil-Malmaison, Franceastrid. jourdan
@ifpfr
RÉSUMÉ
De nombreux
phénomènes physiques
sont étudiés à l’aide de simulateurs très coûteux.L’intérêt des
approches statistiques présentées
dans ce travail est alors deprédire
laréponse
dusimulateur à
partir
dequelques
simulations. Il existe essentiellement deux méthodesstatistiques
pour aborder les
expériences
simulées.Après
unerapide présentation
etanalyse
de chacune d’elles, nous proposons une nouvelleapproche statistique intégrant
lespoints
forts des deuxapproches déjà
existantes etqui
a pourobjectif
d’en atténuer les inconvénients.Mots-clés : Expériences simulées,
Krigeage,
DACE, Plansd’échantillonnage.
ABSTRACT
Many
Scientificphenomena
areinvestigated by expensive
computer models. The interest of the statisticsapproaches presented
in this work is topredict
the response of the computer model from a few runs of the code. The two main statisticsapproaches
for computerexperiments
are reviewed. We propose our own
approach
for computerexperiments
which includes theadvantages
offerby
the twoexisting
methods and fill their gaps.Keywords : Computer
experiments, Kriging, DACE,Sampling designs.
1. Introduction
Cet article traite des
expériences simulées,
c’est-à-dire menées à l’aide d’un codeinformatique,
etplus particulièrement
de laprédiction
de laréponse
d’unsimulateur à
partir
d’unpetit
nombre de simulations. Cesujet
devient d’unegrande importance pratique
dans toutes lesdisciplines
où il est faitappel
à des modèles déterministescomplexes.
Lesphénomènes physiques
ainsi modélisés sont ensuite étudiés à l’aide de simulateursdont,
d’une part, la fiabilité est mise enquestion
dufait même de la
complexité
desmodèles,
et dont d’autrepart,
lestemps
de calcul sontsouvent
prohibitifs.
L’utilisateur souhaite alorsdisposer
d’un modèlesimple
etrapide
pour résumer la
réponse
du simulateur.Koehler et Owen
(1996) présentent
les outilsstatistiques
utilisés pourl’analyse
et la
planification
desexpériences
simulées. Ilsopposent
notamment deux typesd’approches statistiques.
Lapremière
utilise destechniques
deprédiction
linéairesans
biais,
i. e. lekrigeage
desgéostatisticiens (puis
deprédiction bayésienne).
Ladeuxième
quant
àelle,
consiste àadapter
à laprédiction
destechniques d’intégration numérique
de fonctions simulées par méthodes de Monte Carlo ouQuasi-Monte
Carlo. Ces deux
types d’approches
s’articulent autour desquestions
suivantes.Quel
modèle peut-on proposer pour la
réponse
du simulateurqui
tiennecompte
du caractère déterministe desexpériences
simulées? Où effectuer les simulations afin de récolterun maximum d’information pour un coût minimal?
La
première partie (sections
2 et3) présente
brièvement ces deuxapproches classiques
desexpériences
simulées.L’objectif
ici est de mettre enévidence,
àpartir d’arguments empiriques,
lesavantages
de chacune d’elles tout enprécisant
certainesde leurs limites. Cette
première partie
nous amène tout naturellement à proposerune nouvelle
approche statistique
desexpériences
simulées(section 4) qui permet d’intégrer
lespoints
forts des deuxapproches classiques,
avec pourbut,
d’atténuerles faiblesses de chacune d’elles et ainsi repousser certaines de leurs limites.
2.
Approche
par résidu aléatoireCette
première approche statistique
desexpériences
simulées est laplus
couramment utilisée. Elle a été
proposée
parSacks, Welch,
Mitchell etWynn (1989)
et
Sacks,
Schiller et Welch(1989).
2.1. Modélisation
et prédiction
Supposons
que les dparamètres
d’entrée du simulateur varient entre 0 et 1. Alors pour tout x E[0,1]d,
laréponse
déterministe dusimulateur, y(x),
est considéréecomme la réalisation d’une fonction
aléatoire, Y(x), qui
sedécompose
en deuxparties :
2022
x (x) f3
=E [Y (x)] est
lapartie
déterministe du modèle. Ils’agit
en fait d’unerégression
linéaireclassique,
oùX (x)
est le vecteur formé des m fonctions de larégression et f3
est le vecteur inconnu desparamètres
dumodèle,
2022
r (x)
est lapartie
aléatoire du modèle. La méthodestatistique
traditionnelleconsiste à considérer
r (x)
comme un bruit blanccorrespondant
à une erreur demesure.
Cependant,
dans le cas d’un simulateurdéterministe,
lesexpériences
sontnécessairement sans erreur,
r (x) représente
alors l’écartsystématique
entre laréponse
du code et la
régression
linéaireprésumée (cf. figure 1). r(x)
estappelé
le processus résiduel. Il est choisi tel quee[0393(x)]
= 0 etcov(r(x), 0393(u)) = 03C32R(x, u)
Vx E[0,1]d,
VU E[0,1]d
où03C32
est la variance et R estla fonction
de corrélation du processus.Pour
analyser
un telmodèle,
unepossibilité
consiste à utiliser une méthode dekrigeage (Matheron (1963)).
Soit D ={Xl, ...,xN}
unplan d’échantillonnage,
oùN
représente
le nombre de simulations à effectuer et les xi l’endroit du cube unité oùon effectue ces simulations. On suppose que l’on
dispose
desréponses
du simulateuraux
points
duplan
que l’on note dans un vecteur Y(N 1).
On peut alors construirele meilleur
prédicteur
linéaire sans biais(BLUP) (Sacks Welch,
Mitchell etWynn (1989))
2022 X
= (X(xi))i=1,...,N:
N x m matrice du modèle auxpoints
duplan
2022 R
= (R(xi,xj))i,j=1,...,N:
N x N matrice decorrélation, cov(Y) = 03C32R,
supposée régulière
e
r(x) = t[R(x1,x),...,R(xN,x)] :
N x 1 vecteur decorrélation,
cov(Y(x), Y) = 03C32r(x).
où
=(tX R-1 X )-1 t XR-1Y,
l’estimateur de Gauss-Markovde (3,
existe si etseulement si les colonnes de la matrice du modèle sont
indépendantes.
Le
prédicteur
minimise donc l’erreurquadratique
moyennequi
estégale à,
Vx E[0,1]d
La matrice de corrélation R et le vecteur de corrélation
r(x) permettent
deprendre
encompte
le fait queplus
lepoint
x(où
l’on cherche àprédire
laréponse
du
simulateur)
est loin despoints
de simulation xi, etplus
l’erreur deprédiction
estgrande.
La
caractéristique première
duprédicteur
vient du faitqu’il interpole
lesréponses
du simulateur auxpoints
duplan :
Ce
comportement
est essentiellement dû au processus résiduel. Eneffet,
onpeut
remarquer que leprédicteur (2)
sedécompose
en deuxparties :
unajustement
enmoyenne
classique plus
un terme de correction danslequel
interviennent la matrice et le vecteur de corrélation. Comme onpeut
le constater sur lafigure 1,
c’est ce termequi
permet decorriger l’ajustement
en moyenne defaçon
à atteindrel’interpolation.
Cette
caractéristique
duprédicteur
semble apriori
intéressantepuisqu’il
est
légitime
de vouloirinterpoler
les observations dans le cas d’unphénomène
déterministe. Il est
cependant
à noter que cette contrainted’interpolation
devienttrès forte
lorsque
le nombre d’observationsaugmente,
et entraîne notamment desproblèmes d’irrégularités
duprédicteur.
Dans le modèle
(1) plusieurs
fonctions sont à fixées apriori :
larégression
linéaire et la fonction de corrélation. Il semble clair
d’après
cequi précède,
que le processus résidueljoue
un rôleprépondérant
dans le modèle alors que lapartie
déterministe n’a
qu’une
contribution mineure. Enconséquence,
larégression
linéaireest souvent en
pratique
fixée constante afin desimplifier
les calculs(Welch et
al.(1992)),
alors que la fonction de corrélation est choisie defaçon
à refléter au mieux la natureprésumée
dusimulateur, parmi
différentes familles defonctions,
chacuneFIGURE 1
Prédicteur et
ajustement
en moyenne construits àpartir
de 10 observationscorrespondant
à 10réponses présumées
d’un simulateur à 1paramètre
d’entrée. Larégression
linéaireest fixée
parX (x) =
1(d’où
unajustement
en moyenneconstant)
et le processus résiduel estgaussien.
ayant ses
particularités (Sacks, Welch,
Mitchell etWynn (1989),
Christensen(1990)
ou Koehler et Owen
(1996)).
Dans cet article on suppose que le processus résiduelest stationnaire
gaussien
et que sa fonction de corrélationdépend
d’unparamètre
decorrélation 03B8:
Cette fonction de corrélation permet de
prendre
en compte le fait que si deuxpoints
du domained’échantillonnage
sontproches,
alors nécessairement lesréponses
du simulateur en ces deux
points
sont fortement corrélées et acontrario,
si deuxpoints
sont trèséloignés
lesréponses
sont considérées commequasi indépendantes.
Les
paramètres
de la fonction de corrélation(ici e)
sont bien souvent estimés par maximum de vraisemblance(Koehler
et Owen(1996)).
Cette estimation s’obtientgrâce
à des outilsnumériques (Mardia
et Marshall(1984)) qui
malheureusement coûtent très chers et aboutissentparfois
à un maximum local de vraisemblance. Or lafigure
2 montre que lecomportement
duprédicteur
est très différent suivant la valeur duparamètre
de corrélation. Il semble donc que laprédiction
ne soit pas très robusteaux variations de 03B8.
FIGURE 2
Evolution de la
prédiction
d’un simulateur à 2paramètres
d’entréeen fonction
de 03B8.Le
prédicteur
est construit àpartir
d’unerégression
constante(X (x)
=1)
et d’unprocessus résiduel de
fonction
de corrélation(3).
Lespoints représentent
les 9simulations
effectuées.
2.2. Les
plans d’échantillonnage
Les
plans d’échantillonnage
couramment utilisés dans cetteapproche statistique n’ont,
engénéral,
pas de structureparticulière.
Ils sont construits defaçon
àoptimiser
des critères de
qualité
tels que :2022 L’erreur
quadratique
moyenneintégrée (Sacks
et al.(1989
a etb)) qui
va, enquelque
sorte, sélectionner leplan qui
minimise l’écart entre laréponse
dusimulateur et sa
prédiction,
e Le critère
d’entropie (Schwery
etWynn (1987)
ou Currin et al.(1991)) qui
permet
de mesurer laquantité
d’information fournie par lasimulation,
e La distance maximin
(Johnson et
al.(1990)) qui
vise à choisir leplan qui
maximise la distance minimale entre deux
points
duplan
où d est la distance
qui
intervient dans la fonction de corrélation R.Les
plans optimaux
construits à l’aide de ces critères coûtent très cherspuisqu’ils
nécessitentl’optimisation numérique
d’une fonction à N x d variables(Sacks et
al.(1989a
etb)).
Il estpossible
de diminuer letemps
de calcul en limitant la recherche à certaines classes deplans
tels que leshypercubes
latins(Park (1994)),
les tableaux
orthogonaux (Tang (1994)),
ou les suites de faiblediscrépance (Bates
et al.
(1996)).
On peut deplus
noter que les trois critères ci-dessusdépendent
dela modélisation choisie. Les
plans
sélectionnés ne sont doncoptimaux
que pour unparamètre
de corrélation fixé.2.3. Bilan
La modélisation de cette
première approche statistique
estparticulièrement
bienadaptée
auxexpériences
simuléesgrâce
au processus résiduelqui
permet à la fois decorriger l’ajustement
en moyenne et d’introduire une corrélationspatiale
entre lesparamètres
du simulateur.Cependant,
le faitd’imposer
auprédicteur
de passer par tous lespoints
d’observation entraîne desproblèmes d’irrégularité.
Deplus,
nouspouvons émettre
quelques inquiétudes
sur le fait que laprédiction
repose entièrementsur l’ a
priori
fait sur la fonction decorrélation,
étant donné que leprédicteur
n’est pas robuste aux variations duparamètre
de corrélation. Les deux inconvénientsmajeurs
de cette modélisation viennent du rôle
prépondérant
du processus résiduel. Il serait alors intéressant de proposer un nouveau modèlepermettant d’équilibrer l’importance
des
parties
déterministe et aléatoire.Les
plans
utilisés pour cetteapproche
sontefficaces, puisque
construits suivantun critère de
qualité,
maisuniquement
pour un modèle fixé. Cequi entraîne,
outre desproblèmes
de robustesse duplan,
une mauvaiserépartition spatiale
despoints
dansle domaine de simulation. Les
points d’échantillonnage
ont en effet tendance à se concentrer aux bord du cube unité et laissent le centre du domaine non testé par les simulations(cf.
Koehler et Owen(1996)).
3.
Approche
par échantillon aléatoireCette
approche statistique
estproposée
par Koehler et Owen(1996).
Ellerepose essentiellement sur les
techniques d’échantillonnage
utilisées enintégration numérique.
3.1. Modélisation et estimation
On considère ici que la
réponse
du simulateurpeut
sedécomposer
sur une basede fonctions et que seuls les termes
prédominants
de ladécomposition
suffisent à lamodéliser.
où
X (x)
est le vecteur des fonctions de la base retenues pour la modélisationet {3
estle vecteur inconnu des
paramètres
du modèle.Il existe
plusieurs
méthodes pour déterminer le meilleur vecteur deparamètres /3,
mais laplus
naturelle est d’utiliser le critère moindres carrés parrapport
à une distribution F sur[0, 1]d.
Afin desimplifier
lesnotations,
supposons que F soit la distribution uniforme sur le cubeunité,
on a alorsOn remarque que le
premier
terme de l’estimateurdisparaît
si on choisit une baseorthonormée de fonctions. Autrement
dit, estimer (3
revient àintégrer
simultanémentplusieurs
fonctions définies partX(x)Y(x).
Laréponse
du simulateurY (x)
n’étantpas connue
analytiquement,
cesintégrales
sont évaluéesnumériquement
àpartir
dequelques
simulations.La
technique
la moins coûteuse pour évaluerl’intégrale
I d’une fonctionf
sur[0, 1] d
est la méthode de Monte Carlo. Elle consiste à estimer sans biaisl’intégrale
Ipar la somme
où les xi, i =
1" N
sont despoints
choisis au hasard dans le cube unité. Onpeut
noter que contrairement à
l’approche précédente
l’aléa n’est pas introduit au niveau du modèle mais de l’échantillon.On sait de
façon classique
que cet estimateur converge et que pour toute fonction de carréintégrable,
sa vitesse de convergence estégale
à03C3N-1/2
et sa variance à03C32N-1 (où 03C32
est la variance def (xi)).
Si on
applique
cette méthode aumodèle,
on obtient alors l’ estimateur de{3
Il existe différentes
techniques
pour améliorer la méthode de Monte Carlo.La
plupart agissent
surl’échantillonnage
defaçon
à contraindre lespoints
xi àbien
représenter
toutes lesparties
du cube unité(space filling designs).
On trouveessentiellement deux types de
techniques :
les méthodesquasi-Monte
Carlo baséessur des suites de faible
discrépance (Sloan
et Joe(1994), Fang et
al.(2000)) qui permettent
unerépartition
uniforme despoints (suivant
une mesuredonnée),
et lesméthodes de réduction de la variance basées sur des
techniques d’échantillonnage
à2
degrés
et que nousprésentons
maintenant.3.2.
Echantillonnage
à 2degrés
Chaque
arête du domaine de simulation[0, 1]d
estdécoupée
en un nombre fini desegments
de mêmelongueur
que l’on numérote de 0à qi -
1 où idésigne
laième
arête. On munit
chaque ensemble {0, ... ,qi - 1}
de la loi d’addition modulo qi. On obtient ainsi unepartition
du cube unité en q1 x ... X qdcellules,
indexées par les éléments du groupe abélien fini G ==(Z/qi)
x ... x(Z/qd) (Figure 3).
FIGURE 3
Découpage
de[0,1]3
avec G --(Z/2)
x(Z/3)
x(Z/2)
L’échantillonnage
à deuxdegrés
consiste alors à1 er
degré :
choisir les cellules du cube unitéreprésentées
par leplan
2ème degré :
tirer au hasard unpoint
danschaque
cellule sélectionnée au 1 erdegré.
Un
point d’échantillonnage = (1, .... ,d),
est alors la réalisation d’unvecteur aléatoire de la forme j = (xj+03B5j)/qj,j = 1, ... , d, où x = (x1, ...,Xd) E
Greprésente
la cellule danslaquelle
se trouve lepoint ,
et C =(03B51,..., cd)
est un vecteuraléatoire de distribution uniforme sur
[0, 1]d, qui désigne
àquel
endroit lepoint
setrouve dans la cellule. Dans cette
technique d’échantillonnage
seul lepremier degré
estcontrôlable.
L’objectif
est alors de choisir les cellulesreprésentées
par leplan,
defaçon
à s’assurer que toutes les
parties
de[0,1]d
soient bien testées bien par les simulations.On utilise pour cela des sous-ensembles de G
appelés
tableauxorthogonaux
de forcet,
1 t d, qui
ont laparticularité
d’avoir unerépartition
uniforme de leurspoints
en
projection
sur t faces du cube unité. Parexemple
sur lafigure
4 sontreprésentés
en
projection
deux tableauxorthogonaux
de(Z/3)3
à 9points.
Celui de droite est deFIGURE 4
Projection
de tableauxorthogonaux
sur une arête etune face
du cube unité force 2 et celui degauche
est de force 1(lorsque t
=1,
onparle
aussid’hypercube latin).
On constate sur la
figure 4,
que lespoints
du tableau de force 2 recouvrent defaçon plus
uniforme le domaine de simulation que ceux du tableau de force 1. Eten
effet,
McKay et
al.(1979),
Owen(1992)
etTang (1993)
ont montré queplus
laforce du tableau
orthogonal
estélevée, plus
la variance de l’estimateur I(5)
diminue.Ce
qui
confirme bien que larépartition
uniforme despoints d’échantillonnage
dansle domaine de simulation est un critère de
qualité
desplans,
et ceciquel
que soit le modèle choisi.Remarque :
Lespropriétés
de l’ estimateur auxpoints
d’unéchantillonnage
à2
degrés,
notamment le faitqu’il
soit sansbiais,
ont été démontrées dans le cas où le tableauorthogonal ( 1 er degré)
est randomisé(Owen (1992-1995)).
La randomisation n’intervientcependant
pas dans le fait que lespoints
duplan
sont uniformémentrépartis
dans le cube unité. Elle ne semble donc pas nécessairelorsqu’on
sort ducadre de
l’intégration numérique,
parexemple
pourajuster
un modèle dekrigeage.
3.3. Bilan
Contrairement à
l’approche
par résidualéatoire,
la modélisation ici est assezpeu réaliste à moins d’avoir des informations
précises
sur lephénomène
simulé. Enrevanche les
plans
de cette deuxièmeapproche
sont construits defaçon indépendante
du modèle
puisqu’ils
visent àreprésenter
au mieux tout le domaine de simulation. On peut donc supposerqu’un plan
de bonnequalité
le seraquel
que soit le modèlechoisi,
et notamment
qu’il
sera robuste aux variations duparamètre
de corrélation dans lecas d’une modélisation du
type (1).
4. Nouvelle
approche statistique
desexpériences
simuléesL’idée pour définir une nouvelle
approche statistique
desexpériences
simuléess’inspire
directement des bilans des deuxapproches précédentes
et consiste à :2022 conserver le processus résiduel en ce
qui
concerne lapartie
modélisationpour tenir
compte
de l’écartsystématique
entre laréponse
du simulateur et larégression
linéaireprésumée,
2022 utiliser les méthodes
d’échantillonnage
à 2degrés
avec un 1 erdegré qui permet
de s’assurer que toutes les
parties
du domained’échantillonnage
sont bientestées par les simulations.
4.1. Le modèle
Pour définir un nouveau
modèle,
il est nécessaire de tenircompte
des deuxremarques suivantes.
Premièrement,
nous avons vu dans leparagraphe 2,
que le rôleprépondérant
tenu par le processus résiduel dans le modèle entraîne desproblèmes d’irrégularité
et de non robustesse duprédicteur.
Il est doncindispensable
de contre-balancer
l’importance
du processus résiduel afin que toute laprédiction
ne repose pas entièrement sur lui.Deuxièmement,
dans unéchantillonnage
à 2degrés,
seul le 1 erdegré
est contrôlable. Le modèle doit doncprendre
encompte
l’effetproduit
par le 2edegré.
Notons
C x
toute cellule dupremier degré,
où x est lepoint
de[0, 1] d représentant
la cellule
(par exemple
soncentre),
et x le vecteur aléatoireappartenant
àCx,
obtenuau deuxième
degré (cf. figure 3).
Nous proposons alors de modéliser laréponse
dusimulateur au
point x
ECx,
par un processus indexé par lereprésentant
de la cellule x :e
X (x)03B2
=E[Y(x)] est
lapartie
déterministe dumodèle, précisant l’approxi-
mation retenue pour la
prédiction
en moyenne.e
r(x)
est un processusaléatoire,
introduit pour tenircompte
du résidu del’approximation.
De même que dans leparagraphe 2,
il sert àcorriger
laprédiction
en moyenne.
.
e (x )
est un terme d’erreur introduit pourprendre
encompte
l’effet du deuxièmedegré
del’échantillonnage.
Il estindépendant
der(x),
tel que Vx E[0, 1] d,
Vu E
[0,1]d.
C’est donc un modèle avec terme d’erreur
qui
intervient ici. Celui-ci n’est pas nouveau,puisqu’il
estdéjà
utilisé dans le cadre desexpériences simulées,
notammentpar
Sacks,
Schiller et Welch(1989).
Seulement leur motivation est tout autre que la notre,puisqu’elle
vient de la nature de ce que l’on cherche àprédire.
Unprédicteur
sansterme d’erreur
interpole
lesobservations,
il va doncprédire
laréponse
du simulateur et non pas lephénomène
simulé. Or onpeut
tout à fait considérer que cetteréponse
estentachée d’une erreur par
rapport
auphénomène simulé, due,
d’une part aux arrondismachine,
et d’autre part auxsimplifications
de la modélisation. Ils introduisent en faitune erreur de mesure pour
prédire
lephénomène
simulé.De notre
côté,
le terme d’erreurreprésente
l’effet du deuxièmedegré
del’échantillonnage (même
si onpeut imaginer qu’il englobe
aussi une erreur demesure).
On raisonne en fait ici comme si onprocédait
à un«recalage»
desobservations,
c’est-à-dire en considérant laréponse
du simulateury(x),
aupoint
x E
Cx,
comme la réalisation deY(x)
bienque x -1
x presque sûrement. Ceci sejustifie
par le fait que leplan d’échantillonnage
consiste ici en un sous-ensemble decellules, représentées
par despoints
choisis apriori,
maisqui
ne fixe pas lesparamètres
des simulations àréaliser, puisque
le deuxièmedegré
n’est pas contrôlable.Il les contraint
uniquement
àappartenir
à certaines cellules. Audemeurant,
il est tout à faitpossible d’envisager
que seules soient connues pour laprédiction
les cellulesCx
et lesréponses
du simulateurs aupoint x
ECx,
mais pas lesparamètres
dessimulations. Par
exemple,
dans le cas où les valeurs de certainsparamètres
nepeuvent
pas être fixées avec
précision.
On cherche en fait àprendre
encompte
l’influence sur laréponse
observée de l’incertitude sur les niveaux desparamètres
de simulation.On dit
qu’il
y a transmission des erreurs(sur
les niveaux desfacteurs).
Certainstravaux sur l’étude des effets des erreurs sur les niveaux des facteurs dans les
plans d’expériences
ontdéjà
étépubliés (Box (1963), Draper
etBeggs (1971)).
Dans lecas
particulier
del’échantillonnage
à 2degrés
desexpériences simulées,
les erreurssur les niveaux des facteurs ont une distribution connue, par
exemple
ici une loiuniforme sur la cellule concernée. Il est alors
possible
de faire leparallèle
avec lesproblèmes
rencontrés enqualité industrielle, lorsqu’on
cherche àprédire
laréponse
d’une
caractéristique
de laqualité
d’unproduit quand
les niveaux des facteurs sont incertains mais sont auvoisinage
de valeurs nominalesdonnées,
cesvoisinages
étantdéfinis par des tolérances fixées a
priori. Quelques
résultats(Vuchkov
et al.(1983- 1987-1998)
concernant l’estimation del’espérance
de laréponse
et sur laplanification
des essais
lorsqu’il
y a des erreurs sur les niveaux desfacteurs,
ont été établis dans lecas
particulier
où :1)
soit lacaractéristique
est connue, soit elle est estimée par unerégression polynomiale; 2)
les résidus sont de même variance et non corrélés. Ces travaux offrent unepiste
intéressante etprometteuse,
tant dupoint
de vuethéorique
quepratique
pourl’approche
que nousenvisageons. L’adaptation
de ces résultats à notre cas, à savoir desrégressions
autres quepolynomiales (par exemple trigonométriques)
et surtout des résidus corrélés
(par exemple gaussien),
restecependant
unequestion
ouverte.
4.2.
Comportement
du nouveauprédicteur Proposition (Christensen (1990))
Soit le
paramètre ri2
=03C32/03C32e,
ondéfinit
alorsla fonction
de covarianceSi le vecteur des
paramètres
estestimable,
alors le meilleurprédicteur
linéaire sansbiais de
Y(x)
est dela forme
avec ,û : (tXV-1X)-1tXV-1Y l’estimateur
de Gauss-Markov de0,
où V est lamatrice carrée d’ordre N à éléments
V(xi, xj).
L’erreur
quadratique
moyenne deT(x)
estégale
àAvec ce nouveau
modèle,
la covariance entreY(x)
etY(u)
nedépend plus
entièrement de la fonction de corrélation R du processus
résiduel,
mais aussi d’un termeT/2 que
l’onappelle paramètre
de contribution relative de la corrélation. C’estce dernier
qui
permet de modérerl’importance
du processus résiduel dans lemodèle,
ainsi que de s’affranchir de la contrainte
d’interpolation.
La
figure
5permet
d’illustrer lerôle joué
par leparamètre
de contribution relative de la corrélation. Nous avonsreprésenté
leprédicteur (9)
obtenu pour différentes valeurs duparamètre ~2, ainsi
que leprédicteur (2)
del’approche
par résidu aléatoire(§ 2).
Ilapparaît
d’unepart
queplus ~2
estpetit, plus
leprédicteur
est loin desobservations,
et pour lesgrandes
valeurs de~2, il
atteint presquel’interpolation.
Ceci confirme que le terme d’erreur introduit dans ce nouveau modèle
permet
de contrôler le rôle du processusrésiduel,
et de lever la contrainted’interpolation,
cequi
entraîne un
lissage
duprédicteur.
D’autre part, on peut remarquer que le2nd degré
del’échantillonnage
estpris
en compte par le modèle. Eneffet,
dans le cas où 2points
desimulation sont très
proches,
on peut noter que cela entraîne une très forte variation pour leprédicteur
sans terme d’erreur(2),
alors que les deux nouveauxprédicteurs (9)
restent à peuprès
lisses.Avec ce
modèle,
le processus résiduel a une contribution moindre dans laprédiction,
donc afortiori,
le rôle del’ajustement
en moyenne se trouve renforcée.Il faut donc maintenant choisir la
régression
linéaire avecsoin,
et nonplus
la fixerconstante
(X (x) =1)
comme cela estpréconisé
par certains auteurs tels que Welchet al.
(1992).
Onpeut
donc supposerqu’un ajustement
en moyenne de bonnequalité
permet d’obtenir un
prédicteur plus
robuste aux variations duparamètre
de corrélation 03B8. Lafigure
6 illustre bien cettehypothèse.
Nous avonsreprésenté
l’évolution de deuxprédicteurs
en fonction deo,
l’un construit àpartir
d’unerégression
linéaire constante, l’autre àpartir
d’unerégression
linéairetrigonométrique
prenant encompte
l’effet moyen, les effetssimples
et l’interaction des deux facteurs(cf.
Collombier et Jourdan(2001)).
4.3. Les
plans d’échantillonnage
Les
plans
utilisés pour déterminer le 1 erdegré
del’échantillonnage
sont bienentendu ceux de
l’approche
par échantillon aléatoire(§3).
Le but recherché étantFIGURE 5
Evolution du
prédicteur (7)
pourdifférentes
valeurs de~2.
Leprédicteur
estconstruit à
partir
de 30 observationscorrespondant
à 30réponses présumées
d’unsimulateur à 1
paramètre
d’entrée. Larégression
linéaireest fixée
constante et le processus résiduel estgaussien
qu’ils représentent
au mieux le domaine de simulation. Une étudeempirique
sur laqualité
de cesplans (dans
le cadre d’unerégression trigonométrique)
a été effectuée par Collombier et Jourdan(2001).
Il ressort de cetteanalyse
deuxpoints importants.
Premièrement,
les tableauxorthogonaux
sont desplans
efficacesquel
que soit leparamètre
de corrélation choisi. Cequi
n’était pas le cas desplans (§ 2.2)
utilisés dansl’approche
par résidualéatoire,
etposait
unproblème
étant donné que leparamètre 03B8
n’est pas connu a
priori.
Deuxièmement,
pour un coûtfixé,
tous les tableauxorthogonaux
ne sont pas de mêmequalité.
On utilise alors le ou les tableauxorthogonaux qui optimisent
l’un des critères de
qualité
définis auparagraphe
2.2. On remarque que lesplans d’échantillonnage
ainsi sélectionnés sont extrêmement efficaces parrapport
aux meilleursplans (i. e.
ceuxqui
minimisent laIMSE),
et ceciquel
que soit leparamètre
de corrélation 03B8
(contrairement
aux meilleursplans qui dépendent
entièrement de la modélisationchoisie).
Pour
plus
dedétail,
on pourra donc se référer à Collombier et Jourdan(2001),
notamment en ce
qui
concerne l’influence de la force du tableauorthogonal (lien
avecles critères
d’entropie
et distance maximin -compromis
entre finesse dedécoupage
du cube unité et force du
tableau).
5. Conclusion
Cette nouvelle
approche statistique
desexpériences
simulées semble être intéressante. Eneffet,
en cequi
concerne lemodèle,
nous obtenons unprédicteur
FIGURE 6
Evolution de la
prédiction
d’un simulateur à 2paramètres
d’entréeen fonction
de 03B8.Le
prédicteur
est construit àpartir
d’un processus résiduelgaussien
et duparamètre
q = 2. Lespoints représentent
les 9 simulationseffectuées plus
lisse et robuste aux variations duparamètre
de corrélation. Et pour cequi
est desplans,
latechnique d’échantillonnage proposée permet
d’utiliser desplans
de bonnequalité quel
que soit le modèlefixé,
et notamment O.Cet article est un
premier
travailexploratoire qui permet
de faire unrapide
étatdes lieux des différentes
techniques statistiques
utilisées pour traiter lesexpériences
simulées et de proposer
quelques
idées nouvelles.Remerciements
Je remercie les
rapporteurs
pour leurs remarquesconstructives,
notamment celle concernant la transmission des erreurs sur les niveaux des facteursqui
ouvre desperspectives
intéressantes.Références
BATES
R.A.,
BUCKR.J.,
RICCOMAGNOE.,
WYNN H.P.(1996), Experimental design
and observation forlarge systems.
J. R. Statist. Soc. B58,
77-94.BOX G.E.P.
(1963),
The effects errors in the factor levels andexperimental designs.
Technometrics
5,
247-262.CHRISTENSEN R.
(1990),
Linearmodels for multivariate,
time series, andspatial
data.
Springer-Verlag.
COLLOMBIER
D.,
JOURDAN A.(2001), Régression trigonométrique
etplans d’échantillonnage
pourexpériences
simulées. Revue deStatistique Appliquée,
49
(2),
5-25.CURRIN
C.T.,
MITCHELLM.,
MORRISM.,
YLVISAKER D.(1991), Bayesian prediction
of deterministicfunctions,
withapplications
to thedesign
and theanalysis
ofcomputer experiments.
J. Amer. Statist.Assoc., 86,
953-963.DRAPER
N.R.,
BEGGS W.J.(1971),
Errors in factor levels andexperimental designs.
Ann.
of Math. Statist., 41,
46-58.FANG
K-T.,
LIND.K.J.,
WINKERP.,
ZHANG Y.(2000),
Uniformdesign : theory
and
application.
Technometrics42,
237-248.JOHNSON
M.E.,
MOOREL.M.,
YLVISAKER D.(1990),
Minimax and maximin distancedesigns.
J.of Statist. Planning
andInference, 26,
131-148.JOURDAN A.
(2000), Analyse statistique
etéchantillonnage d’expériences
simulées.Thèse,
Université de Pau et desPays
de l’AdourKOEHLER
JR.,
OWEN A.B.(1996), Computer experiments.
In Ghosh S. and RaoC.R., editors,
Handbookof statistics,
13 :Design
andanalysis of experiments, North-Holland, Amsterdam,
261-308.MARDIA
K.V.,
MARSHALL R.J.(1984),
Maximum likelihood estimation of models for residual covariance inspatial regression. Biometrika, 71,
135-146.MATHERON G.
(1963), Principles
ofgeostatistics.
EconomicGeology, 58,
1246- 1266.MC KAY
M.D.,
BECKMANR.J.,
CONOVER W.J.(1979), Comparison
of threemethods for
selecting
values ofinput
variables in theanalysis
ofoutput
from a computer code.Technometrics, 21, 239-245.
OWEN A.B.
(1992), Orthogonal
arrays forcomputer experiments, integration
andvisualization. Statist.
Sinica, 2,
439-452.OWEN A.B.
(1995), Randomly permuted (t,m,s)-nets
and(t,s)-sequences.
In Nieder-reiter H. and Shuie P.J.S.
eds,
Monte Carlo andquasi-Monte
Carlo Methods inScientific Computing, Springer,
New York.PARK J.S.
(1994), Optimal
Latinhypercube designs
forcomputer experiments.
J.of
Statist.
Planning
andInference, 39,
95-111.SACKS
J.,
SCHILLERS.B.,
WELCH W.J.(1989a), Designs
forcomputer experi-
ments.
Technometrics, 31,
41-47.SACKS
J.,
WELCHW.J.,
MITCHELLT.J.,
WYNN H.P.( 1989b), Design
andanalysis
of
computer experiments.
Statist.Science, 4,
409-435.SCHWERY
M.C.,
WYNN H.P.(1987),
Maximumentropy sampling.
J.of Appl.
Statist., 14,
165-170.SLOAN
I.H.,
JOE S.(1994),
Latticemethods for multiple integration.
Oxford science Publications.TANG B.
(1993), Orthogonal array-based
Latinhypercubes.
J. Amer. Statist. Assoc.,88, 1392-1397.
TANG B.
(1994),
A theorem forselecting
OA-based latinhypercubes using
a distancecriterion. Comm.
Statist.-Theory Meth., 23, 2047-2058.
VUCHKOV, I.N.,
BOYADJIEVA L.N.(1983),
The robustness ofexperimental
de-signs against
errors in the factor levels. J. StatisticalComputation & Simulation, 17, 31-41.
VUCHKOV, I.N.,
BOYADJIEVAL.N.,
DAMYANOV P.S.(1987),
Off-linequality
control without
replicates. Paper presented
at the SatelliteConference
on Math-ematics
of Design of Experiments,
17thEuropeean Meeting of Statisticians, Thessaloniki,
Greece.VUCHKOV, I.N.,
BOYADJIEVAL.N.,
TZENKOVA(1998), Quality mprovement through
mechanistic models. In AtkinsonA.C.,
PronzatoL., Wynn
W.P.editors,
MODA 5 - Advances in Model Oriented Data
Analysis
andExperimental Design (Proceedings
of the 5th InternationalWorshop, Marseille, France, june
22-26
1998), Physica-Verlag.
WELCH