R EVUE DE STATISTIQUE APPLIQUÉE
A. J OURDAN
D. C OLLOMBIER
Régression trigonométrique et plans d’échantillonnage pour expériences simulées
Revue de statistique appliquée, tome 49, n
o2 (2001), p. 5-25
<http://www.numdam.org/item?id=RSA_2001__49_2_5_0>
© Société française de statistique, 2001, tous droits réservés.
L’accès aux archives de la revue « Revue de statistique appliquée » (http://www.sfds.asso.fr/publicat/rsa.htm) implique l’accord avec les condi- tions générales d’utilisation (http://www.numdam.org/conditions). Toute uti- lisation commerciale ou impression systématique est constitutive d’une in- fraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright.
Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques
http://www.numdam.org/
RÉGRESSION TRIGONOMÉTRIQUE
ET PLANS D’ÉCHANTILLONNAGE
POUR EXPÉRIENCES SIMULÉES
A. Jourdan* et D. Collombier**
* Université de Pau et des
Pays
de l’Adour, laboratoire deMathématiques Appliquées,
64000 Pauastrid.jourdan @ univ-pau fr
* * Université Louis Pasteur, IRMA, 67084
Strasbourg collombier@math.u-strasbg.fr
RÉSUMÉ
Un
grand
nombre dephénomènes physiques
sont modéliséspuis
étudiés à l’aidede
simulateurs. Ces derniers sont souvent très coûteux et donc difficilement
exploitables. L’objectif
de la
planification
desexpériences
simulées estd’ajuster
à moindre coût unprédicteur
pour laréponse
du simulateur. On se limite ici aux simulateurs déterministes (laréponse
du code nedépend
que desparamètres
d’entrée et est doncreproductible).
Pour résumer la
réponse
du simulateur, on utilise ici un modèle de typegéostatistique qui
permet d’introduire une corrélationspatiale
entre lesréponses
du simulateur. Les deuxparticularités
de ce travail sont : l’utilisation d’unerégression
linéairetrigonométrique
(ou de Fourier) -l’adaptation
deplans d’expériences classiques
tels que les tableauxorthogonaux
linéaires pour
l’échantillonnage d’expériences
simulées et la construction deplans optimaux
avec validation
numérique.
Mots-clés : Plans
d’échantillonnage, Régression trigonométrique,
Expériences simulées,Krigeage,
Tableauorthogonal
linéaire.ABSTRACT
Many
scientificphenomena
are nowinvestigated by complex
computer models or codes.A computer
experiments
is a number of runs of the code with variousinputs.
In this work the output of computerexperiments
is deterministic(rerunning
the code with the sameinputs give
identical observation). The aim of computer
experiments
is to fit apredictor
of the output to the data.In order to resume the response of the code, we
adopt
here ageo-statistic
model whichpermit
to introducespatial
correlation between the responses of the code. The twoparticularities
of this work are : the use of a
trigonometric
(or Fourier)regression -
theadaptation
of basicexperimental designs
to this kind of model and the construction ofoptimal designs
withnumerical validation.
Keywords : Sampling designs,
Trigonometric regression, Computer experiments,Kriging,
Linear
orthogonal
arrays.1. Introduction
L’expérimentation
de nombreuxphénomènes physiques
est souvent très onéreuse ou, dans certains cas,impossible
à mettre enplace.
Enrevanche,
certains deces
phénomènes
peuvent être modélisés par deséquations mathématiques.
Il est alorspossible
de trouver une solutionnumérique
auproblème
à l’aide d’un simulateur.Malgré
lesperformances
sans cesse croissantes desordinateurs,
ces simulateurs res-tent souvent difficiles à
exploiter
car très coûteux entemps.
Cela est essentiellement dû au faitqu’ils
prennent en compte ungrand
nombre deparamètres
d’entrée. L’uti-lisateur souhaite bien souvent
disposer
d’un modèlesimple
etrapide
pour résumer laréponse
du code de calcul. Dans cet article letype
de simulateur étudié est détermi-niste,
c’est-à-dire que laréponse
du simulateur estreproductible,
i.e est entièrement déterminée par lesparamètres
de simulation. Paropposition
àl’expérimentation phy- sique,
uneexpérience
menée à l’aide d’un code de calcul est dite simulée.La deuxième
partie
de l’article est consacrée à la mise enplace
d’un modèlede
type géostatistique adapté
àl’analyse
lesexpériences
simulées. Laréponse
déterministe du
simulateur, Y(x),
est considérée comme la réalisation d’une fonction aléatoire formée d’unerégression
linéairetrigonométrique (ou
deFourier)
et d’unprocessus
gaussien
permettant d’introduire une corrélationspatiale
entre lesréponses
du simulateur.
L’originalité
de ce travail réside dans la troisièmepartie qui
consiste àadapter
des outils
spécifiques
auxplans d’expériences classiques
dans le contexte desexpériences
simulées.La
quatrième partie
étudie de manièreempirique
àpartir
d’unexemple simple,
l’efficacité et la robustesse des
plans d’échantillonnage
définis dans lapartie
3.2. Modélisation et Prédiction 2.1. Le modèle
Sacks et al.
(1989) proposent
d’utiliser un modèlequi
traite laréponse
déterministe du simulateur au
point x
E[0, l]d,
comme la réalisation d’une fonctionaléatoire, Y(x),
somme d’unerégression
linéaire et d’un processusgaussien,
2. 1. 1. Le processus résiduel
r (x)
est un processusstochastique appelé
processusrésiduel, qui
estsupposé
stationnaire
gaussien d’espérance
nulle et de matrice de covarianceoù
u2
est la variance du processus etR(x, w)
sa fonction de corrélation. Cette fonction est choisie stationnaire de la forme laplus classique,
où e est le
paramètre
de corrélation(plus
il estgrand,
moins il y a de corrélation etvice-versa), et 11 - 11
est la norme euclidienne deRd.
La fonction de corrélationdépend
de la distance entre les
points,
cequi permet
d’introduire une forte corrélation entre lesréponses
du simulateur si les simulations sont effectuées en despoints
trèsproches
et a contrario une
quasi-indépendance
pour despoints éloignés.
2.1.2. La
régression
linéairetrigonométrique
Reprenons
les notations de Bates et al.(1996)
etRiccomagno
et al.(1997)
pour définir lapartie
déterministe dumodèle,
Vx E[0, 1] d,
où
(,1,) le produit
scalaire usuel deIRd.
Il
s’agit
donc d’unerégression trigonométrique (ou
deFourier)
définie par un ensembleA+
de vecteurs non nuls d’entiers telque h
EA+ ~ -h ~ A+, appelé
ensemble des
fréquences
du modèle. Nous utilisons ici laterminologie suivante,
Effetssimples : A+ C 1 (hl, 0,..., 0),..., (0,..., 0, ho)
Interactions de deux facteurs :
A+
C{(h1, h2, 0,...,0),...,(0,...,hk,...,hj,...,0)}, etc..., où hi ~ 0, représente
l’ordre duième
facteur.Exemple
1. - Un modèle à 3 facteursprenant
encompte
des effetssimples
des 2
premiers
facteurs et une interaction dupremier
facteur avec letroisième,
définis par lesfréquences
s’écrit,
Vx =(x1,x2,x3) ~ [0,1]3
f (x) = 03B20+2(03B2(1,0,0)sin(203C0x1)+03B2(0,1,0)sin(203C0x2)+03B2(1,0,0)sin(203C0(x1+x3))
+~(1,0,0)cos(203C0x1)
+~(0,1,0)cos(203C0x2)
+~(1,0,1)cos(203C0(x1
+x3)) .
La
régression trigonométrique peut
encore s’écrire sous une formecomplexe f(x) ==
03B10 +L
cxhexp[27ri(hlx)] +ah exp [ - 203C0i(h|x)] (2)
hEA+
Les formes
complexes
et réelles des vecteurs du modèle et desparamètres,
sont liées par les relations
Z(x) = X(x)H-1
et a =H (3 (d’où l’hypothèse
h E
A+
====?-h ~ A+)
où H est une matrice unitaire(H*H
= I où H* =tH)
La
régression
s’écrit indifféremment sous l’une des deux formesce
qui permet
de travailler defaçon théorique
avec la formecomplexe
du modèle derégression
afin depouvoir
utiliser des notionsalgébriques (caractères
desreprésen-
tations irréductibles des groupes finis
(Kobilinsky (1990» puis
de passer à la formetrigonométrique
pour les testsnumériques.
2.2. La
prédiction
La méthode utilisée
classiquement
pouranalyser
un tel modèle est connue engéostatistique
sous le nom dekrigeage.
Elle a été introduite par Matheron(1963)
etparallèlement
etindépendamment
par Henderson(1950).
Soient un
plan
de Npoints
de[0,1]d,
D ={x1,...,xN},
et le vecteur desobservations aux
points
duplan, YD
=t[Y(x1),..., Y(xN)].
On utilise ici commeprédicteur
de laréponse Y (x)
C’est une combinaison linéaire
spatiale
des observationsqui
permet deprendre
en
compte
le fait queplus
lepoint
x où l’on cherche àprédire
laréponse
du simulateurest loin des simulations
effectuées, plus
l’erreur deprédiction
seragrande.
Plusprécisément,
on utilise leprédicteur
sans biaisqui
minimise l’erreurquadratique
moyenne
(BLUP) (cf.
Sacks et al.(1989),
Christensen(1990)
et Robinson(1991))
où 03B2 = (tXR-1X)-1 tXR-1YD
est l’estimateur de Gauss-Markovde,3,
avec. X =
t[X(x1),..., X(XN)]
matrice d’ordre N x m du modèle auxpoints
du
plan,
e R ==
(R(xi, xj))i,j
matrice d’ordre N x N decorrélation,
a
r(x)
=t[R(x1, x),..., R(XN, X)]
vecteur des corrélations entre lespoints
du
plan
et x.Il
peut
encore s’écrire avec la notationcomplexe
en utilisant la relationX =
ZH,
où =
(Z*R-1Z)-1Z*R-1YD.
La
surface
deréponse
ainsiprédite interpole
les aléasobservés,
c’est-à-direqu’en
toutpoint
duplan
Deux
questions
seposent
alors : le choix duparamètre
e de la fonction decorrélation
(cf. 2.1.1)
et le choix duplan
D.3. Tableaux
orthogonaux
linéairesDans cette
partie,
seule lapartie régression
linéaire du modèle estprise
encompte.
Soit un modèle défini par son ensemble defréquences A+.
Le choix des
points
duplan d’échantillonnage
se fait de lafaçon
suivante.Chaque
arrête du domaineexpérimental [0, l]d
estdécoupée
en un nombrepremier p
de
segments
de mêmelongueur
que l’on numérote de 0à p -
1. Nous obtenons ainsiune
partition
du cube unité enpd
cellules(Fig. 1).
On munit l’ensemble des entiers
{0,...
p -1}
de la loi d’addition modulo p.Le domaine
d’échantillonnage
s’identifie alors àGF(p)d,
oùGF(p)
est le corps deGalois d’ordre p, en associant à tout vecteur g de
GF(p)d,
unpoint d’échantillonnage
x e
[0,1]d
tel que x =g/p.
A toutpoint
d’observation construit de la sorte, larégression
linéairetrigonométrique (2)
est de la formeoù
(hl g)
est leproduit
scalaire surGF (p) d .
Les
plans d’échantillonnage
utilisés dans cet articlecorrespondent
à des sous-ensembles de
GF(p)d particuliers appelés
tableauxorthogonaux
linéaires.Définition 2. - Soient T un tableau d’ordre N x d à éléments dans
GF(p),
et t un entier tel que 1 t d.
FIGURE 1
Schéma du cube unité avec
GF(3)3
T est un tableau
orthogonal de force
t et d’index03BB,
si et seulement si dans toutbloc formé
de t colonnes deT,
tous les éléments deGF(p)t figurent
un même nombrede fois 03BB
chacun.T est un tableau
orthogonal
linéaire si deplus
seslignes
sont toutes distincteset constituent un sous-espace vectoriel de
GF(p)d.
Remarque
3 : Le coût de simulation N estégal
àÀpt,
il est doncpréférable
d’utiliserdes tableaux d’index À = 1.
L’ensemble S constitué des
lignes
de T est par définition un sous-espace vectoriel deGF(p)d.
Il est donc entièrementdéterminé,
. soit par une matrice B d’ ordre t x d formée de t vecteurs linéairement
indépendants générateurs
deS,
e soit
par P
une matrice d’ordre(d - t)
xd,
de rang d - t,génératrice
du dualde S,
i.e l’ensembleS = {h
EGF(p)d, (s 1 h) -
0 Vs ES}.
La matrice P étant de rang
d - t,
ellepeut toujours
s’écrire sous la formeP =
(Id- t 1 Q)
oùQ
est une matrice d’ordre(d - t)
E t. On a alors B =(- ’Q 1 It).
Exemple
4. - Soit un domained’échantillonnage
à 3 facteurspartitionné
en33
cellules. Soit T le tableauorthogonal
linéaire à éléments dansGF(3) engendré
par la matrice
Si on note
S1
le dual de l’ensemble S constitué deslignes
de T et P la matricegénératrice
deS 1 alors
Les tableaux
orthogonaux
linéaires utilisés pour les testsnumériques (§ 4)
ont été construits àpartir
de la matricegénératrice
du dualP,
car celle-ciprésente
deuxpropriétés
essentielles comme nous le verrons dans le deuxparagraphes
suivants. Ellepermet, premièrement
de s’assurer que lespoints d’échantillonnage représentent
bientoutes les
parties
du cubeunité,
et deuxièmement de vérifier que lesplans
définis par Ppermettent
de construire le BLUP.3.1.
Répartition
despoints d’échantillonnage
dans le cube unitéLes
plans
habituellement utilisés pourajuster
le modèle(1)
sont construitsde
façon
àoptimiser
des critères dequalité (IMSE, entropie,
distancemaximin,...
cf.
Sack et al.(1989».
Ilsdépendent
donc entièrement du modèlechoisi,
notammentdu
paramètre
de corrélation 03B8. Pour éviter cetinconvénient,
nous utilisons ici desplans
construits
indépendamment
du modèlequi
visent à ce que lespoints d’échantillonnage
«
remplissent »
bien le cube unité(space filling designs),
afin que toutes lesparties
de
[0,1]d
soient testées par les simulations. Les tableauxorthogonaux
linéaires de force t entrent tout à fait dans ce cadrepuisque
par définition ilspossèdent
une bonnerépartition
de leurspoints lorsqu’on
lesprojette
en dimension t(restreints
à tfacteurs).
Prenons
l’exemple
de deux tableaux d’ordre 9 x 3(3
facteurs et 9points).
Ces tableauxsont
représentés
sur lafigure
2projetés
sur 2 facteurspuis
sur 1. Celui de droite est de force 2 d’index 1 et celui degauche
est de force 1 d’index 3.Si on
replace
lespoints
des deux tableaux en dimensiontrois,
onpeut
facilementimaginer
que le tableau de force 2représente
uniformément le domained’échantillonnage
alors que le tableau de force 1 laisse certainesparties
du cubeunité non
représentées,
donc non testées par les simulations. Onpeut
supposer queplus
la force du tableau estélevée,
mieux lespoints d’échantillonnage
sontrépartis
dans le
domaine,
et ainsi améliorer laqualité
de laprédiction.
Cettehypothèse
seraconfirmée avec les tests
numériques (§4).
Les résultats suivantspermettent
de vérifierrapidement
àpartir
de la matriceP,
si un tableauorthogonal
linéaire est de force t(cf. Bailey (1985».
Définition 5. - On
appelle poids
d’un vecteur à éléments dansGF(p),
lenombre de coordonnées non nulles et
poids
d’une matrice, leplus petit poids
descombinaisons linéaires de ses
lignes.
Tableaux
orthogonal
de force 1 Tableauxorthogonal
de force 2sur une face du cube unité sur une face du cube unité
FIGURE 2
Proposition
6. - Un tableauorthogonal
linéaire de matricegénératrice
dudual P est
de force t
- 1 si et seulement si P est depoids supérieur
ouégal
à t.Lemme 7. - La matrice P =
(Id- t 1 Q)
ci-dessus est depoids supérieur
ouégal
à t si et seulement si ~k =1,
...,min(d - t, t)
toute combinaison linéaire de klignes
deQ
est depoids supérieur
ouégal
à t - k.Exemple
4(suite).
- Dansl’exemple
4 le tableauorthogonal
linéaire T àéléments dans
GF (3)
est défini par sa matricegénératrice
du dual P =(111 1).
D’après
laproposition
6 et le lemme7,
il est clair que le tableau T est de force 2puisque
P est depoids
3.Pour p et la force t
fixés,
les tableauxorthogonaux
linéaires utilisés dans les testsnumériques
ont été construits à l’aide de cesrésultats,
notamment du lemme 7qui permet
d’établir unalgorithme
de constructionsimple
et moins coûteux.3.2. Estimabilité et
optimalité
Le meilleur
prédicteur
linéaire sans biais(3)
n’existe pas pour tous lesplans d’échantillonnage.
Eneffet,
il faut(et
ilsuffit)
que les colonnes de la matrice du modèle Z soientindépendantes (condition
d’estimabilité de ce parS).
Nous allonsmaintenant voir que dans le cas d’une
régression
linéairetrigonométrique
et d’untableau
orthogonal
linéaire la condition d’existence duprédicteur (3) s’exprime
iciaussi à l’aide de la matrice
P,
etplus précisément grâce
au dualS 1 engendré
par P.Les
propriétés
suivantes sont des résultatsclassiques
que l’on peut retrouver parexemple
dans les ouvrages de Collombier(1996)
ou Christensen(1990).
Proposition
8. - Pour un tableauorthogonal
linéaire et unerégression
linéairetrigonométrique,
les colonnes de la matrice du modèle sont, soit 2 à 2identiques,
soit2 à 2
orthogonales (pour
leproduit
scalaire usuel deCd).
Le
prédicteur
linéaire sans biais deY(x)
existeVx,
si et seulement si lescolonnes de la matrice du modèle sont 2 à 2
orthogonales.
La matrice d’information Z* Z
représente
lesproduits
scalaires de toutes les colonnes de la matrice du modèle. Pour que leprédicteur
linéaire sans biaisexiste,
il faut doncqu’elle
soitmultiple
de la matrice identité. Leplan
est alors universellementoptimal
pour le modèle enespérance (i. e.
en l’absence decorrélation).
Le lemmesuivant est établi à
partir
de larégression trigonométrique (4),
et donne la forme dela matrice d’information.
Lemme 9. - Soient un modèle
défini
par son ensemble defréquences A+,
et
S = {s1,...,sN}
l’ensemble constitué deslignes
de T un tableauorthogonal
linéaire à éléments dans
GF(p)
de taille N. La matriced’information
s’écritoù pour h
EA+
et n EA+
Donc le
prédicteur
deY(x)
existe pour tout x si et seulement si ah =0, Bhn
= 0h ~
n etChn
-- 0. Le résultatqui
suit s’obtient facilement en utilisant les caractères dereprésentations
linéaires des groupesfinis,
etpermet
de vérifier si cesconditions sont satisfaites.
Lemme 10. - Soit S =
{s1,..., SNI
l’ensemble constitué deslignes
de T untableau
orthogonal
linéaire à éléments dansGF(p)
de taille N. Alors Vh ~GF(p)d,
Ces deux lemmes permettent d’établir une condition nécessaire et suffisante pour l’existence du
prédicteur, qui
lie le dual du tableauS
et l’ensemble A+ desfréquences
du modèle.Définition 11. - Soient h et m
deux fréquences
non nulles du modèle. On ditque
les fréquences
sont mutuellementorthogonales
par rapport àS,
siRemarques
12 :1) h tt S
estéquivalent
à(-h) ~ S’
carS
est un sous-espace vectoriel deGF(p) d.
2)
Si p > 2 alors la condition(h
+m) tt S
n’est à vérifier que pourm ~
h.Théorème 13. - Soient un modèle
défini
par son ensemblede fréquences
A+et S un ensemble
formé
deslignes
d’un tableauorthogonal
linéaire. Leprédicteur
linéaire sans biais de
Y (x)
existe pour tout x, si et seulement si toutesles fréquences
de
A+
sont mutuellementorthogonales
par rapport S.Remarque
14 : Ce résultatpeut
s’étendre à une classeplus large
deplans
d’échantil-lonnage,
notamment aux fractionsrégulières (cf.
Collombier( 1996)
pour ladéfinition) qui permettent
d’avoir undécoupage
du cube unitéasymétrique,
et avec un nombrede
segments
nonplus premier
maispuissance
d’un nombrepremier.
Exemple
4(suite).
- Dansl’exemple
4 le tableauorthogonal
linéaire T àéléments dans
GF(3)
est défini par sa matricegénératrice
du dual P =(1111)
et sondual est
égal
àS = {(0,0,0), (1,1,1), (2, 2, 2)}.
Onpeut
alors vérifier facilementqu’il
estpossible d’analyser
avec ce tableau les effetssimples
des 3 facteurs avecles
fréquences A+ = {(1,0,0), (0,1,0), (0,0,1)}.
Enrevanche,
iln’est pas possible d’ajouter
l’interaction(0,1,1)
des 2 derniers facteurs car alors lesfréquences ( 1,0,0)
et(0,1,1)
ne sont pas mutuellementorthogonales.
Si on veut introduire une interaction des 2 derniers facteurs dans lemodèle,
il faut utiliser lafréquence (0,1,2)
ou(0,2,1),
mais cela ne fait pas intervenir les deux facteurs de la même
façon.
Là encore on remarque que la condition d’existence du
prédicteur qui
lie larégression
linéairetrigonométrique
et leplan d’échantillonnage
se fait au travers lamatrice
génératrice
du dual P. Apartir
du théorème13,
de laproposition
6 et dulemme
7,
un programme Matlab a été conçu afin de construire tous les tableauxorthogonaux
linéaires existants pour desparamètres
p et tfixés,
et de sélectionnerceux
qui
vontpermettre d’ajuster
unerégression trigonométrique
définie par son ensemble defréquences A+.
Laquestion qui
se pose maintenant est le choix du oudes meilleurs
plans parmi
ceux sélectionnés et suivantquel
critère. Nous allons tenterd’apporter
des éléments deréponse
dans lapartie
suivante.4. Tests
numériques
A
partir
d’unexemple simple,
nous allons étudier l’efficacité desplans
d’échan-tillonnage.
On se fixe une fonction connue,et une
régression trigonométrique
définie par l’ensemble desfréquences, A+ = {(1,0,...,0),...,(0,...,0,1)}.
Ce choix a été fait de
façon
à s’assurer que le modèle enespérance
estapproprié
à la
prédiction
def puisque
là n’est pas notre propos.Afin de mesurer la différence entre la fonction et le
prédicteur,
nous allonsutiliser l’erreur
quadratique
moyenneintégrée empirique (EISE)
sur unegrille de 10d points
de[0, l]d (Sacks et
al.(1989))
pour unparamètre
de corrélation 03B8fixé,
Pour p et t
fixés,
le ou les meilleursplans
sont alors ceuxqui
minimisent cette erreur dans la classe des tableauxorthogonaux
linéaires.4.1. Robustesse des meilleurs
plans
parrapport
aux variations de 03B8 Despremiers
tests ont montré que, saufexception,
il n’existe pas deplan qui
minimisent l’erreur
quel
que soit e. Enfait,
on constatequ’il
existe 3types
deplans,
ceux
qui
minimisent l’erreur pour lesfaibles,
les moyennes et les fortes corrélations(Fig. 3).
La force de la corrélationcorrespond
à des valeurs de equi dépendent
deN -
pt
et d. On noteDé
leplan qui
minimiseEISEe
où 03B8représente
l’une des3
catégories, faibles,
moyennes ou fortes corrélations. Pour certainsparamètres
p et t, on a seulement détecté que deuxcatégories
de corrélation faibles etfortes,
voire même dans certains cas une seulecatégorie,
cequi signifie
alors que le meilleurplan Dé
minimise l’erreurquel
que soit B.Notre but n’est pas de déterminer
quel paramètre
de corrélationchoisir,
il existe destechniques
d’estimation pour cela(Mardia
et Marshall(1984),
Christensen(1990».
Onpeut
toutefois constater sur cetexemple (Fig. 3),
que l’erreur diminuelorsque
les corrélationsaugmentent (B diminue),
avec un seuil inférieurpour 03B8 (en général 1)
en dessousduquel
la matrice R estnumériquement instable,
et unseuil
supérieur (en général 100)
au-dessusduquel
R devientproche
de la matriceidentité,
doncplus
de corrélation. Nous avons choisi ici d’étudier la robustesse des meilleursplans
des 3catégories lorsque e
varie. Ceci est unepropriété
nonnégligeable
N = 25 et d = 3
N = 49 et d = 5
FIGURE 3Évolution
de l’erreur enfonction
de 03B8étant donné les
problèmes qu’engendre
l’estimation duparamètre
de corrélation enpratique.
Pour cela on calcule le coefficient d’efficacité(Sacks et
al.(1989)) (Tab. 1),
où 03B8i appartient
à une des 2 autrescatégories
que 03B8.TABLEAU 1
Tableaux
d’efficacité
des meilleursplans lorsque 03B8i
varieN = 25 et d = 3
N = 49 et d = 4
On remarque alors que
D*03B8,
le meilleurplan
pour une forte ou moyennecorrélation,
est très robuste auxchangements
de 0. A contrario, l’efficacité deDé,
le meilleurplan
pour une faiblecorrélation,
devientcatastrophique
si on utiliseune
petite
valeur de O. Doncquand
on ne connaît pas la valeur de 0 apriori,
il estpréférable
d’utiliser les meilleursplans
des fortes et des moyennes corrélations. Les matricesgénératrices
de ces tableauxorthogonaux
linéaires sont données dans lestableaux
2,
3 et 4 pour d =3,4
et 5. Il suffit alors demultiplier
cette matrice par la matrice d’ordrepd
x d formée des vecteurs deGF (p) d
pour obtenir le tableauorthogonal
linéaire.Dans les tableaux 2 à
4, Cr
=N/ (2d+ 1) représente
le coûtrelatif,
i. e la taille duplan
divisée par le nombre deparamètres
à estimer dans larégression trigonométrique.
TABLEAU 2
Matrices
génératrices
des meilleursplans
à 3facteurs
pour
les fortes et
moyennes corrélations(*) Pour ces paramètres on ne détecte qu’une seule catégorie, i.e que
D*
minimise l’erreur quel que soit 03B8. On ne peut donc pas calculer le coefficient d’efficacité (5).TABLEAU 3
Matrices
génératrices
des meilleursplans
à 4facteurs
pour lesfortes
et moyennes corrélations
TABLEAU 4
Matrices
génératrices
des meilleursplans
à 5facteurs
pour lesfortes
et moyennes corrélations
4.2.
Influence
duparamètre
p et dela force
du tableau sur l’erreur A l’issue de ces tests, on remarque queglobalement
l’erreur diminuelorsque
le nombre de
points
duplan augmente,
mais surtout que cette diminutiondépend
dela valeur de p. En
effet, plus
ledécoupage
du domaineexpérimental
est fin(p grand), plus
l’erreur estpetite
et ceci à moindre coût. Prenons parexemple
le casdes
plans
à 5 facteurs(Fig. 4).
Pour N =
25,
27 et81,
nous avons lesplus petites
erreurs que l’onpuisse
trouver
quel
que soit03B8,
cequi
veut direqu’avec
unplan
de 27points
et p =3,
oncommet une erreur
6,3
foisplus grande
que pour unplan pratiquement
de mêmetaille,
N =
25,
mais avec p = 5. Pour N = 49 il se peut que l’erreur soit inférieure à0,0243
avec un e
plus petit,
mais cela nechange
rien au faitqu’il
estpréférable
d’utiliser ceplan
que celui 2 foisplus grand,
de taille 81 avec p = 3.FIGURE 4
Évolution
de l’erreur enfonction
de p pour lesplans
à 5facteurs.
Une fois que p est
fixé,
il reste à choisir t, la force du tableauorthogonal
linéaire.On remarque alors que, pour une taille
fixée, N,
lesplans qui
minimisent l’erreur sonttoujours
de force maximale et ceciquel
que soit e. Attentiontoutefois,
un tableau de force maximale n’est pas nécessairement d’erreur minimale. Ces résultats confirment l’intuition que nous avions eu dans leparagraphe § 3.2,
c’est-à-direqu’une
bonne
répartition marginale
despoints
duplan
est un critère dequalité.
La taille du
plan
estégale
à N =pt,
il faut donc trouver un boncompromis
entre les deux
paramètres
defaçon
àgarder
un coût de simulation raisonnable. Nous conseillons alors deprivilégier
la finesse dedécoupage
du cube unité(p grand)
àla force du tableau
orthogonal
t. Eneffet,
comme on peut le voir sur lafigure
4 etle tableau
4,
il estpréférable
d’utiliser le tableau de taille49,
de force2,
au tableaude taille 81 et de force 4.
4.3. Test des critères de sélection des
plans
En
pratique
il estimpossible
de sélectionner unplan
à l’aide de la EISEpuisque
l’on ne connaît pas la
réponse
du simulateur auxpoints
de lagrille.
Même avecl’exemple
que noustraitons,
calculer l’erreur sur10d points
devient trèslong quand
d > 5. Dans la
bibliographie
on trouve des critères pour sélectionner lesplans
bienplus simples
àcalculer,
et surtoutqui
nedépendent
pas du modèle enespérance.
Le critère
d’entropie (Schewry
etWynn (1987),
Currin et al.(1991)) qui permet
de mesurer la
quantité
d’information fournie par la simulation. Defaçon simplifiée,
cecritère se réduit à la recherche du
plus grand
déterminant de la matrice de corrélation.Le critère de distance est basé sur la distance entre les
points
duplan (maximin distance) (Johnson et
al.(1990»
defaçon
à trouver la meilleurerépartition spatiale.
Soit 1 lx 11 la
norme euclidienne.Nous avons testé l’efficacité et la
particularité
de ces critères avec les tableauxorthogonaux
linéaires à3,
4 et 5 facteurs.On remarque 2 choses.
Premièrement,
il existe un lien évident entre la force du tableau et les critères.Pour les
plans
de taillefixée, plus
t estimportant
etplus
la distance ou le déterminant estgrand (Fig. 5, 6,
7 et8).
Distance FIGURE 5
Force
en fonction
de la distance pour lesplans
de taille 49 à 3facteurs
Distance FIGURE 6
Force en
fonction
de la distance pour lesplans
de taille 27 à 4facteurs
Déterminant
FIGURE 7
Force en
fonction
du déterminant pour lesplans
de taille 25 à 3facteurs
Déterminant FIGURE 8
Force en
fonction
du déterminant pour lesplans
de taille 25 à 5facteurs
De
plus,
pour les tableaux de même taille et de forcemaximale,
unplan
dedéterminant maximal est
toujours
de distance maximale(Fig.
9 et10).
Deuxièmement,
lesplans
sélectionnés par ces critères ne minimisent pas l’erreur EISE. On est donc en droit de se demander s’ils sont tout de même efficaces parDéterminant FIGURE 9
Distance en
fonction
du déterminant pour lesplans
de taille 25 à 4facteurs
Déterminant FIGURE 10
Distance
en fonction
du déterminant pour lesplans
de taille 27 à5 facteurs
rapport aux meilleurs
plans.
Les tableaux5, 6
et 7 donnent les matricesgénératrices
des tableaux
orthogonaux
linéaires de force maximale et de déterminantmaximal,
notésD*det,
ainsi que leurs coefficients d’efficacité parrapport
aux meilleursplans
des 3
catégories.
TAB LEAU 5
Tableau
d’efficacité
desplans
à 3facteurs
de déterminant maximal(**) Il n’y a qu’une seule catégorie de corrélation pour N = 9 et d = 3
(cf.
Tab. 2)TABLEAU 6
Tableau
d’efficacité
desplans
à 4facteurs
de déterminant maximalTAB LEAU 7
Tableau
d’efficacité
desplans
à5 facteurs
de déterminant maximalOn constate que même si le critère
d’entropie
ne donne pas les meilleursplans,
ilest tout de même intéressant
puisque
lesplans
sélectionnés sont souvent trèsefficaces,
et surtout, ils ne
dépendent
pas de larégression trigonométrique
choisie. Onpeut
doncespérer qu’ils
seront aussi efficaces pourn’importe quel
modèle enespérance
En
conclusion,
nous avons mis àjour
unecatégorie
deplans,
les tableauxorthogonaux linéaires,
trèsintéressante,
car très robustes aux variations de 03B8. Nousavons vu de
plus
que larépartition marginale
despoints
duplan
est un critère dequalité
de ces tableaux. Il nous reste à étendre cette étude à une classeplus large
deplans
telle que les fractionsrégulières,
defaçon
àpermettre
undécoupage
du cubeunité
asymétrique
et en un nombre desegments,
nonplus premier,
maispuissance
d’un nombre
premier.
La
stratégie préconisée
est donc decoupler
le critère derépartition marginale
et
d’entropie,
cequi permet
de sélectionner(parmi
les tableaux de mêmetaille)
desplans
de bonnequalité
et efficacesquel
que soit le modèle.Références
BAILEY R.A.
(1985).
Factorialdesign
and abelian groups. LinearAlgebra Appl. 70,
349-368.BATES
R.A.,
BUCKR.J.,
RICCOMAGNOE.,
WYNN H.P.(1996). Experimental design
and observation forlarge
systems. J.Roy.
Statist. Soc. B58,
77-94.BATES R.A., RICCOMAGNO
E.,
SCHWABER.,
WYNN H.P.(1998).
Lattice and dual lattice inoptimal experimental design
for Fourier models.Comp.
Statist.Data and
Analysis
28N°3,
283-296.CHRISTENSEN R.
(1990).
Linear modelsfor multivariate,
time series, andspatial
data.
Springer-Verlag.
COLLOMBIER D.
(1996).
Plansd’expérience factoriels. Springer-Verlag,
Berlin.CURRIN
C.T.,
MITCHELLM.,
MORRISM.,
YLVISAKER D.(1991). Bayesian prediction
of deterministicfunctions,
withapplications
to thedesign
andanalysis of computer experiments.
J. Amer. Statist. Assoc.86,
953-963.HENDERSON C.R.
(1950).
Estimation ofgenetic
parameters. Ann. Math. Statist.21, 309-310 (abstract).
JOHNSON
M.E.,
MOOREL.M,
YLVISAKER D.(1990).
Minimax and maximindistance
designs.
J. Statist.Planning
andInference 26,
131-148.KOBILINSKY A.
(1990). Complex
linear models andcyclic designs. LinearAlgebra Appl., 127,
227-282.KOEHLER J.
R.,
OWEN A.B.(1996). Computer experiments.
Dans Ghosh S. et Rao C.R. : Handbookof
statistics, 13 :Design
andanalysis of experiments.
North-Holland,
261-308.MARDIA
K.V.,
MARSHALL R.J.( 1984).
Maximum likelihood estimation of models for reidual covariance inspatial regression.
Biometrika71,
135-146.MATHERON G.
(1963). Principles
ofgeostatistics.
EconomicGeology 58,
1246- 1266.PARK J.-S.
(1994). Optimal
latinhypercube designs
for computerexperimnts.
J.Statist.
Planning
andInference 39,
95-111.RICCOMAGNO E., SCHWABE
R.,
WYNN H.P.(1997).
Lattice-basedD-optimum design
for Fourierregression.
Annalsof Statist. 24,
2313-2327.ROBINSON G.K.
(1991).
That BLUP is agood thing :
the estimation of random effects. Statist. Science.6,
15-51.SACKS
J.,
SCHILLERS.B.,
WELCH W.J.(1989). Designs
for computerexperi-
ments. Technometrics
31,
41-47.SACKS
J.,
WELCHW.J.,
MITCHELLT.J.,
WYNN H.P.(1989). Design
andanalysis
of computer
experiments.
Statist. Science4,
409-435.SERRES J.P.
(1967). Représentations
linéaires des groupesfinis. Herman,
Paris.SHEWRY
M.C.,
WYNN H.P.(1987).
Maximumentropy sampling.
J.Appl.
Statist.14, 165-170.
TANG B.
(1994).
A theorem forselecting
OA-based latinhypercubes using
a distancecriterion. Comm. Statist. -