Plan d’expérience - d’interpolation par POD (Proper Orthogonal Decomposition)

d’interpolation par POD (Proper Orthogonal Decomposition)

3. Plan d’expérience

(5.9) r(x, x0) = exp − d X i=1 θi(xi− x⁰_i)² ! (5.10) avec d la dimension de l’espace des paramètres, xila iecomposante du point x et θ = (θi)i=1..ddes paramètres à déterminer. La fonction µ(x) peut être une constante connue (krigeage simple), une constante β₀ inconnue (krigeage ordinaire) ou une combinaison linéaire de fonctions (fi(x))i=0..m connues dont les poids β = (βi)i=0..m sont inconnus (krigeage universel). En pratique, les valeurs des hyperparamètres σ, θ et β sont estimés numériquement comme étant ceux qui maximisent la vraisemblance des données observées L(σ, θ, β|x), c’est-à-dire la probabilité P (x|σ, θ, β) d’ob-server ces données compte tenu des valeurs des paramètres. A partir de ces hyperparamètres, le processus stochastique Y (x) est conditionné à passer par les points observés. Au point à modéliser x^∗, ce processus suit une loi normale d’espérance µy(x∗) et de variance σ2

y(x∗) :

Y(x∗|(Y (xk) = y(xk))k=1..Ns) ∼ N (µy(x∗), σ²y(x∗)) x ∈ R^d (5.11) La prédiction ˆy de y au point x∗ est alors ˆy(x∗) = µy(x∗), et la variance du modèle au point x∗ vaut σ2

y(x∗). Par exemple, dans le cas du krigeage ordinaire :

(

µ_y(x∗) = β₀+ r(x∗)TR⁻1(y − INs) σ2

y(x∗) = σ2(INs− r(x∗)T R⁻1_r(x∗) ^(5.12) avec r(x∗) = [r(x∗, x1) . . . r(x∗, x_N_s)]T, y = [y(x1) . . . y(xNs)]T et R =

   r(x1, x1) · · · r(x1, xN_s) . . . ^.^.. r(xN_s, x1) · · · r(xN_s, xN_s)   . On peut vérifier que µy(x∗) est effectivement une combinaison linéaire des (y(xk))k=1..Ns, et que l’interpolation est bien linéaire. On remarque également que µy(x∗) se décompose en un terme déterministe β₀égal à l’espérance estimée du phénomène modélisé, et un terme permettant l’interpolation, en prenant en compte la configuration des données. Enfin, comme le processus stochastique est conditionné à passer par les points d’observation, les valeurs prédites par le modèle en ces points seront égales aux valeurs observées.

3. Plan d’expérience

Dans le cadre d’expériences coûteuses en temps, comme les simulations numériques réalisées dans cette thèse, il est nécessaire d’optimiser le plan d’expériences (ou DOE, pour Design Of Experiment) pour s’assurer de capter toute la physique des phénomènes à modéliser tout en réduisant au maximum le nombre d’expériences nécessaires. Les trois critères généralement utilisés

3. Plan d’expérience

pour définir un bon DOE sont le remplissage de l’espace des paramètres d’entrée, la robustesse en sous-projection et la séquentialité. Plusieurs critères mathématiques existent pour définir un bon remplissage d’espace, l’idée principale étant de ne pas laisser de zone de l’espace inexplorée, tout en gardant un nombre d’expériences limité. L’utilisation du krigeage nécessite un DOE qui garantit une bonne couverture de l’espace. La robustesse en sous-projection sert à vérifier que la condition de remplissage optimal est toujours vérifiée sur les sous-espaces de faible dimension, afin de ne pas négliger un paramètre ou un type d’interaction. Enfin, la séquentialité d’un DOE désigne la possibilité de rajouter des points d’observation tout en conservant les qualités de couverture d’espace et de robustesse.

Par exemple, un plan de type One At a Time (OAT) consistant à ne faire varier qu’un paramètre à la fois (figure 5.1 (a)) est un mauvais DOE, car il ne détecte aucune interaction entre les paramètres d’entrée et laisse de grandes zones de l’espace inexplorées. Dans cette thèse, un DOE de type Latin Hypercube Sampling a été choisi (figure 5.1 (b)). Il est construit en découpant chaque dimension en n intervalles, avec n le nombre de points choisis, et à placer un point par intervalle. Cette méthode de construction assure une bonne robustesse en sous-projection le long de chacun des paramètres (indiquée par les pointillés de la figure 5.1), et il existe différents critères supplémentaires pour assurer une bonne couverture de l’espace. La principal faiblesse du LHS est son caractère non-séquentiel, qui ne permet pas de rajouter un ou plusieurs calculs tout en conservant le bon remplissage et la robustesse. Pour contourner ce problème, il est possible de créer un DOE adaptatif, qui utilise la variance du modèle renvoyée par le krigeage : plus la variance en un point est grande, plus l’incertitude sur le résultat en ce point est grande. Une méthode pour construire un DOE adaptatif est donc de réaliser un premier DOE de type LHS, puis de l’enrichir en rajoutant le point où la variance du modèle est maximale. Le krigeage étant un interpolateur exact, la variance du nouveau modèle en ce point sera nulle, et la solution sera localement améliorée. Une autre méthode possible se base sur l’intégrale du Variance Mean Ratio (VMR) sur le domaine d’étude Ω. Cette grandeur est définie comme suit, en s’inspirant de la définition utilisée par Liem et Martins [69] :

VMR(x) = ^σ²^(x) |µ(x)| ^(5.13) IVMR(x) =^Z Ω σx2(s) |µ_x(s)|^ds ^(5.14)

Dans le cas où µx(s) s’annule en un point du domaine, on peut le remplacer par ε + |µx(s)| au dénominateur, pour éviter la divergence. Pour déterminer la valeur IVMR(x), il faut construire un nouveau modèle temporaire à partir des points d’observation (xk)k=1..Ns et du point x, en postulant que y(x) = ˆy(x), la valeur renvoyée par le modèle existant au point x. Il faut ensuite calculer pour ce point l’intégrale sur Ω IVMR(x) du VMR du modèle temporaire. Le nouveau point d’observation pour enrichir le vrai modèle sera celui qui minimise l’intégrale IVMR sur tout le domaine, déterminé à l’aide de l’algorithme d’optimisation SEGO-MOE, développé au DTIS [70]. Cette méthode permet d’estimer, sans nouvelle observation, quel point enrichira le plus le modèle globalement sur le domaine Ω. Des tests ont été réalisés dans l’équipe DTIS/M2CI de l’ONERA pour évaluer l’efficacité de cette méthode de DOE adaptatif, en comparant deux méthodes de conception de modèle. Un premier modèle était créé à partir d’un LHS de 10d points, avec d le nombre de paramètres d’entrée du problème, ce nombre étant généralement considéré comme suffisant pour un bon krigeage. Le deuxième modèle partait d’un LHS de 4d points, et enrichissait progressivement le modèle à l’aide du critère du VMR. Cette étude a montré qu’en règle générale, il suffisait de calculer environ 7d points avec la deuxième méthode pour obtenir le même degré de précision qu’avec la première, soit une réduction de 30 % du nombre d’observations nécessaires.

Dans le cadre de la POD, le krigeage sert à déterminer les coefficients (ai(x))i=1..n dans la base réduite des vecteurs (Φi)i=1..n. Comme les variables aléatoires (Ai(x))i=1..n

correspon-Chapitre 5. Présentation et validation de la méthode d’interpolation par POD (Proper Orthogonal Decomposition)

(a) Plan OAT (b) Plan LHS

Figure 5.1. – Exemples de plan OAT (a) et LHS (b) en dimension 2

dantes suivent des lois gaussiennes de paramètres µi et σ2

i, les composantes du vecteur aléatoire

W(x) =Pn

i=1^Ai(x)Φi correspondant à la grandeur déterministe w(x) suivent également des lois gaussiennes : ∀j ∈[[1; N]] W(x)j = n X i=1 Ai(x) Φi,j∼ N(µΣ, σ2 Σ) (5.15) avec _           µΣ= n X i=1 µ_iΦi,j σ2 Σ = n X i=1 σ2 i Φ2 i,j (5.16) Pour calculer la valeur IVMR(x) pour la grandeur w(x), il est donc possible de la calculer sé-parément pour chaque composante w(x)j, puis de sommer les résultats obtenus. Toutefois, en utilisant cette définition, il est apparu que la fonction IVMR(x) était très peu régulière, et il était difficile d’en trouver le minimum. Pour résoudre ce problème, une autre définition de l’IVMR a été proposée, en faisant une moyenne pondérée des coefficients (ai(x))i=1..npar les valeurs propres (λi)i=1..n des vecteurs propres (Φi)i=1..n

¯a(x) =

i=1

a_i(x) λi (5.17)

Cette moyenne pondérée suit également une loi gaussienne N (µ_Σ, σ2

Σ) avec :            µΣ=Xⁿ i=1 µiλi σ2 Σ= n X i=1 σ2 i λ2 i (5.18)

On peut alors écrire :

IVMR(x) =^Z Ω

σΣ,x²(s)

|µΣ,x(s)|^ds ^(5.19)

Cette fonction est plus régulière que la précédente, et permet d’obtenir le nouveau point qui améliore le plus le modèle global, en tenant compte des poids des différents vecteurs (Φi)i=1..n dans la solution recherchée.

Dans le document Modélisation aérothermodynamique des écoulements hypersoniques d'arrière-corps de débris orbitaux (Page 135-138)