• Aucun résultat trouvé

Planification d’expériences séquentielle dans un contexte de méta-modélisation multi-fidélité.

N/A
N/A
Protected

Academic year: 2022

Partager "Planification d’expériences séquentielle dans un contexte de méta-modélisation multi-fidélité."

Copied!
7
0
0

Texte intégral

(1)

HAL Id: hal-00702409

https://hal.archives-ouvertes.fr/hal-00702409

Submitted on 30 May 2012

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de

Planification d’expériences séquentielle dans un contexte de méta-modélisation multi-fidélité.

Loic Le Gratiet

To cite this version:

Loic Le Gratiet. Planification d’expériences séquentielle dans un contexte de méta-modélisation multi- fidélité.. Les 44 Journées de Statistique, May 2012, Bruxelles, Belgium. �hal-00702409�

(2)

Planification d’exp´ eriences s´ equentielle dans un contexte de m´ eta-mod´ elisation multi-fid´ elit´ e.

Sequential experimental design in a multi-fidelity computer experiment framework.

Loic Le Gratiet1,2 & Claire Cannam´ela2 & Josselin Garnier1

1 Universit´e Paris Diderot- Paris VII 75205 Paris Cedex 13 ; loic.le-gratiet@cea.fr

2 CEA, DAM, DIF, F-91297 Arpajon, France ; claire.cannamela@cea.fr

R´esum´e. Les gros codes de calcul sont souvent utilis´es en ing´enierie pour ´etudier des syst`emes physiques. Cependant, les simulations peuvent parfois ˆetre coˆuteuses en temps de calcul. Dans ce cas, une approximation de la relation entr´ee/sortie du code est souvent faite `a l’aide d’un m´eta-mod`ele. En fait, un code de calcul peut souvent ˆetre lanc´e `a diff´erents niveaux de complexit´e et une hi´erarchie de niveaux de code peut donc ˆetre obtenue. Il peut s’agir par exemple d’un mod`ele ´el´ements finis ayant un maillage plus ou moins fin. L’objectif de nos travaux est d’´etudier l’utilisation de plusieurs niveaux de code pour pr´edire la sortie d’un code coˆuteux. Le m´eta-mod`ele multi-niveaux pr´esent´e ici est un cas particulier du co-krigeage. Apr`es avoir d´etaill´e le mod`ele de co-krigeage utilis´e et sa mise en place, nous concentrerons notre pr´esentation sur les strat´egies de planification d’exp´eriences s´equentielles. En effet, un avantage du co-krigeage est qu’il fournit, au travers de la variance de co-krigeage, une estimation de l’erreur de mod`ele en chaque point de l’espace des param`etres d’entr´ee. Ainsi, pour am´eliorer la pr´ecision du m´eta-mod`ele on peut enrichir s´equentiellement notre base d’apprentissage aux points o`u la variance est la plus grande. Cependant, dans un cadre de multi-fid´elit´e, il faut

´egalement choisir sur quel niveau de code on veut connaˆıtre la r´eponse. Nous pr´esenterons ici diff´erentes strat´egies pour choisir ce niveau bas´ees sur un r´esultat original qui donne la contribution de chaque code `a la variance de pr´ediction du mod`ele.

Mots-cl´es.co-krigeage, m´eta-mod´elisation multi-fid´elit´e, plan d’exp´eriences, strat´egie s´equentielle.

Abstract.Large computer codes are widely used in engineering to study physical systems. Nevertheless, simulations can sometimes be time-consuming. In this case, an approximation of the code input/output relation is made using a metamodel. Actually, a computer code can often be run at different levels of complexity and a hierarchy of levels of code can hence be obtained. For example, it can be a finite element model with a more or less fine mesh. The aim of our research is to study the use of several levels of a code to predict the output of a costly computer code. The presented multi-stage metamodel is a particular case of co-kriging which is a well-known geostatistical method. We first describe the construction of the co-kriging model and we focus then on a sequential experimental

(3)

design strategy. Indeed, one of the strengths of co-kriging is that it provides through the predictive co-kriging variance an estimation of the model error at each point of the input space parameter. Therefore, to improve the surrogate model we can sequentially add points in the training set at locations where the predictive variances are the largest ones. Nonetheless, in a multi-fidelity framework, we also have to choose which level of code we have to run. We present here different strategies to choose this level. They are based on an original result which gives the contribution of each code on the co-kriging variance.

Keywords.surrogate models, co-kriging, multi-fidelity computer experiment, experi- mental design, sequential strategy.

1 Introduction

Le krigeage est une classe particuli`ere de m´eta-mod`ele qui fait l’hypoth`ese a priori que la sortie que l’on essaye d’approcher est une r´ealisation d’un processus Gaussien. On se concentre ici sur ce mod`ele et son extension pour les sorties `a r´eponses multiples. Le lecteur pourra se r´ef´erer aux livres de Santner, Williams et Notz (2003) et Rasmussen et Williams (2006) pour plus de d´etails sur le krigeage. Dans le cadre des simulateurs multi- fid´elit´es, nous poss´edons un code qui peut ˆetre lanc´e `a plusieurs niveaux de pr´ecision.

Ces niveaux pouvant par exemple correspondre `a diff´erentes tailles de mailles pour un code ´el´ements finis. L’objectif de la m´eta-mod´elisation sera de construire une surface de r´eponse du code en utilisant une ou plusieurs de ses versions d´egrad´ees.

Un premier m´eta-mod`ele multi-niveaux a ´et´e mis en place par Kennedy et O’Hagan (2000) en utilisant une relation autor´egressive d’ordre 1 entre deux niveaux successifs. Ce mod`ele est un cas particulier du co-krigeage qui est une m´ethode commun´ement utilis´ee en g´eostatistique. Ensuite, Qian et Wu (2008) ont propos´e une approche Bay´esienne du mod`ele sugg´er´e par Kennedy et O’Hagan (2000) et Forrester, Sobester et Keane (2007) ont pr´esent´e l’utilisation du co-krigeage dans un cadre d’optimisation (bas´ee sur l’algorithme EGO : Efficient Global Optimization). Enfin, certains points limitant de la m´ethode ont

´et´e r´esolus dans le papier Le Gratiet (2011) qui pr´esente entre autres une proc´edure d’estimation efficace des param`etres, une r´eduction de la complexit´e du mod`ele et une nouvelle approche Bay´esienne ´evitant une impl´ementation prohibitive. Dans les papiers ci-dessus, diff´erentes m´ethodes de planification d’exp´eriences ont ´et´e propos´ees mais aucun auteur ne s’est int´eress´e `a la planification d’exp´eriences s´equentielle. Pourtant la hi´erarchie de codes disponible peut nous permettre de mettre en place des strat´egies int´eressantes de planification s´equentielle. La question sera la suivante : si nous voulons lancer une simulation en un nouveau point, sur quel niveau de code allons-nous la lancer ? Il va donc falloir trouver le meilleur compromis coˆut / pr´ecision et nous allons pour cela utiliser un r´esultat utile d´eduit de Le Gratiet (2011).

(4)

2 Construction du m´ eta-mod` ele multi-fid´ elit´ e.

Nous pr´esentons ici une nouvelle mod´elisation multi-niveaux qui est ´equivalente `a celle propos´ee par Kennedy et O’Hagan (2000) et qui se construit de mani`ere r´ecursive.

2.1 Rappels des ´ equations du mod` ele AR(1) ´ etendues au cas s niveaux.

Supposons que nous ayons s niveaux de code mod´elis´es par des processus Gaussiens (Zt(x))t=1,...,s, x∈Q, class´es par ordre croissant de pr´ecision et tels que :

Zt(x) =ρt−1(x)Zt−1(x) +δt(x) Zt−1(x)⊥δt(x)

ρt−1(x) =gtT−1(x)βρt−1

(1) o`u l’on d´efinit ∀t= 2, . . . , s:

δt(x)∼ PG(ftT(x)βt, σt2rt(x, x)) (2) et :

Z1(x)∼ PG(f1T(x)β1, σ12r1(x, x)) (3) On fait donc ici l’hypoth`ese a priori que les sorties des codes sont des r´ealisations de processus Gaussiens. Le m´eta-mod`ele sera construit en conditionnant ces r´ealisations par les sorties connues des codes.

La mod`elisation pr´ec´edente issue de l’article de Kennedy et O’Hagan (2000) d´efinit la relation entre les niveaux de codes. Elle est d´eduite de l’hypoth`ese suivante : ∀x, si on se donne la valeur de Zt−1(x), on ne peut rien apprendre de plus sur Zt(x) `a partir des autres r´esultats Zt−1(x) pour x6=x.

SoitZ = (Z1T, . . . ,ZsT)T le vecteur Gaussien contenant le valeurs des processus (Zt(x))t=1,...,s aux points des plans d’exp´eriences (Dt)t=1,...,s avec Ds ⊆ Ds−1 ⊆ · · · ⊆ D1. Si on note β = (β1T, . . . , βsT)T, βρ = (βρT1, . . . , βρTs−1)T, σ2 = (σ12, . . . , σs2) et z = (z1, . . . , zs) les r´eponses connues des codes, on a :

∀x∈Q [Zs(x)|Z =z, β, βρ, σ2]∼ N mZs(x), s2Zs(x) o`u :

mZs(x) =hs(x)Tβ+ts(x)TVs−1(z−Hsβ) (4) et :

s2Zs(x) =σ2Zs(x)−ts(x)TVs−1ts(x) (5) La moyenne de co-krigeage mZs(x) constituera le m´eta-mod`ele sur le niveau le plus pr´ecis construit `a partir des r´eponses connues sur les s niveaux de code et la variance de

(5)

co-krigeage s2Zs(x) donnera une estimation de l’erreur de mod`ele.

La matrice Vs repr´esente la matrice de covariance du vecteur Gaussien Z, le vecteur ts(x) est le vecteur de covariance entre Zs(x) et Z, Hsβ est la moyenne de Z, hs(x)Tβ est la moyenne deZs(x) et σ2Zs(x) sa variance. Tous ces ´el´ements sont construits `a partir du vecteur d’exp´eriences au niveau t et de la covariance entre Zt(x) et Zt(x) explicit´es ci-dessous :

ht(x)T =

t−1 Y

i=1

ρi(x)

!

f1T(x),

t−1

Y

i=2

ρi(x)

!

f2T(x), . . . , ρt−1(x)ftT−1(x), ftT(x)

! (6) et pour t > t :

cov(Zt(x), Zt(x)|σ2, β, βρ) =

t−1

Y

i=t

ρi(x)

!

cov(Zt(x), Zt(x)|σ2, β, βρ) (7) avec :

cov(Zt(x), Zt(x)|σ2, β, βρ) =

t

X

j=1

σj2

t−1

Y

i=j

ρ2i(x)

!

rj(x, x) (8)

2.2 Ecriture r´ ecursive du mod` ele AR(1)

Nous allons ici pr´esenter une nouvelle mod´elisation multi-niveaux qui est en fait

´equivalente `a la pr´ec´edente. Consid´erons la mod´elisation suivante pour t = 2, . . . , s :

Zt(x) =ρt−1(x)[Zt−1(x)|Zt−1 =zt−1] +δt(x) Zt−1(x)⊥δt(x)

ρt−1(x) =gtT−1(x)βρt−1

(9) avec Ds ⊆ Ds−1 ⊆ · · · ⊆ D1. La seule diff´erence avec la pr´ec´edente mod´elisation est que l’on exprime Zt(x) (le processus Gaussien mod´elisant le code de niveaut) en fonction du processus Zt−1(x) conditionn´e par ses r´eponses connues zt−1 sur le plan Dt−1. Les (δt(x))t=2,...,s sont d´efinis comme pr´ec´edemment et on a pour tout t= 2, . . . , s :

Zt(x)|Zt=zt

∼ N µZt(x), s2Zt(x)

(10) o`u :

µZt(x) =ρt−1(x)µZt−1(x) +ftT(x)βt+rtT(x)R−1t zt−ρt−1(Dt)⊙zt−1(Dt)−Ftβt

(11) et :

s2Zt(x) =ρ2t−1(x)s2Zt−1(x) +σt2 1−rtT(x)R−1t rt(x)

(12) Le symbole ⊙ repr´esente le produit matriciel ´el´ement par ´el´ement. Rt est la matrice de correlation de Dt avec le noyau rt(x, x) et rtT(x) est le vecteur de covariance entre x et Dt avec ce mˆeme noyau. On note ρt(Dt ) le vecteur contenant les valeurs de ρt(x)

(6)

pourx∈Dt−1, zt(Dt−1) celui contenant les sorties connues de Zt(x) sur Dt−1 etFt est la matrice d’exp´eriences contenant les valeurs de ft(x)T sur Dt.

La moyenne µZt(x) constitue le m´eta-mod`ele sur le code de niveau t sachant les r´eponses connues des t premiers niveaux de code et la variance s2Zt(x) repr´esente l’er- reur de ce mod`ele. La moyenne et la variance de co-krigeage sur le niveau t s’exprimant

`a partir de celles du niveau t− 1, on a bien une expression r´ecursive du mod`ele pro- pos´e par [2]. La mod´elisation propos´ee ici est puissante car elle montre que construire un co-krigeage `a s niveaux est ´equivalent `a construire s krigeages ind´ependants.

3 Planification d’exp´ eriences s´ equentielle pour le co- krigeage

La mod´elisation r´ecursive pr´esent´ee pr´ec´edemment va nous permettre de construire une m´ethode simple de planification d’exp´eriences s´equentielle. Nous travaillerons sur un des principaux crit`eres de planification s´equentielle utilis´es dans le krigeage : le MSE (Mean Squarred Error). La strat´egie consiste simplement `a trouver le point maximisant la variance de pr´ediction s’´ecrivant :

s2Zt(x) =ρ2t−1(x)s2Zt−1(x) +σt2 1−rTt(x)R−1t rt(x)

∀t = 2, . . . , s s2Z1(x) =σ12 1−rT1(x)R−11 r1(x)

Soit ˜x= argmaxxs2Zs(x). On a alors ∀t= 1, . . . , s :

s2Zt(˜x) =ρ2t−1(˜x)s2Zt−1(˜x) +σt2 1−rtT(˜x)Rt−1rt(˜x)

Supposons que l’on d´ecide de lancer le code t−1 en ˜x, on a alors s2Zt−1(˜x) = 0 et : s2Zt(˜x) =σt2 1−rTt(˜x)R−1t rt(˜x)

ρ2t−1(˜x)s2Zt−1(˜x) repr´esente donc la part de la variance due au code de niveau t−1 et σ2t 1−rtT(˜x)R−1t rt(˜x)

repr´esente la part de la variance due au code de niveau t. Une strat´egie naturelle de planification d’exp´eriences est alors de trouver le point ˜x maximi- sant la variance, de regarder la part de chaque niveau de code surs2Zs(˜x) et de lancer une simulation sur le niveau de code le plus int´eressant (selon un crit`ere coˆut/pr´ecision qui d´ependra du cas d’application).

Il est donc n´ecessaire de construire un crit`ere qui nous permette de d´eterminer quel niveau de code est le plus int´eressant. Nous illustrons dans ce r´esum´e, une m´ethode pour choisir ce niveau dans le cas s = 2. On introduit pour cela la moyenne de la variance de pr´ediction (o`uµ(x) repr´esente la mesure de la loi des entr´ees) :

imse = Z

Q

s2Z2(x)dµ(x)

(7)

Consid´erons ˜x = argmaxxs2Z2(x), dans le cas `a 2 niveaux nous pouvons lancer soit z1(˜x) soit z2(˜x). Supposons que l’on connaisse z1(˜x), on aura alors :

s2Z2(˜x) =σ22 1−rT2(˜x)R−12 r2(˜x)

Si s2Z2(˜x) < imse cela signifie que l’erreur de mod`ele en ˜x est inf´erieure `a l’erreur de mod`ele moyenne. Il n’est donc pas n´ecessaire de lancer le code de niveau 2 en ce point car cela n’apportera pas en moyenne plus d’information qu’un autre point. En revanche, sis2Z2(˜x)>imse, cela signifie que l’erreur de mod`ele en ˜x est plus importante que l’erreur moyenne et il sera donc avantageux de lancer le code de niveau 2 en ce point.

R´ ef´ erences

[1] Forrester, A. I. J., Sobester, A. & Keane, A. J. (2007), Multi-fidelity optimization via surrogate modelling, Proc. R. Soc. A 463, 3251-3269.

[2] Kennedy, M. C. & O’Hagan, A. (2000), Predicting the output from a complex computer code when fast approximations are available, Biometrika 87, 1-13.

[3] Le Gratiet, L. (2011),Bayesian analysis of hierarchical multi-fidelity codes, Arxiv preprint arXiv :1112.5389, 2011.

[4] Rasmussen, C. E. & Williams, C. K. I.(2006),Gaussian Processes for Machine Learning, the MIT Press.

[5] Santner, T. J., Williams, B. J. & Notz, W. I. (2003), The Design and Analysis of Computer Experiments, New York : Springer.

[6] Qian, Z. & Jeff Wu, C. F.(2008),Bayesian Hierarchical Modeling for Integrating Low-accuracy and High-accuracy Experiments, Technometrics 50, 192-204.

Références

Documents relatifs

consigne: repasse le titre puis essaie de l' repasse le titre puis essaie de l' repasse le titre puis essaie de l' repasse le titre puis essaie de l'éééécrire tout seul dans le

boucle d'or fait des rencontres dans la for boucle d'or fait des rencontres dans la for t, retrouve dans quel ordre.. t, retrouve dans

Parmi les achats en produits ali- mentaires consommés à domicile, les dépenses des ménages les plus importantes sont en viandes (21 %) puis en fruits et légumes (15

Il est particuli`erement rassurant de constater que plusieurs auteurs ont d´ej` a observ´e les r´egulations de cer- tains de ces g`enes par ces mˆemes acides gras (Berger et al., 2002

consigne: trouve deux autres objets ayant la m trouve deux autres objets ayant la m trouve deux autres objets ayant la mêêêême propri trouve deux autres objets ayant la m me

classe les animaux de l'album: ceux qui volent et ceux qui ne volent pas.. classe les animaux de l'album: ceux qui volent et ceux qui ne

En fait, on peut g´en´eraliser ce r´esultat (mais il n’est pas demand´e de le montrer) : il existe des ensembles de clauses insatisfaisables dont aucune preuve de contradiction

Pour r´ epondre aux questions, vous pouvez mener des recherches dans le cours ainsi que sur le web. Exercice 1 :