• Aucun résultat trouvé

3.4 Les mesures d'importance δ i de Borgonovo : un état de l'art

3.4.2 δ i vue comme une mesure de dépendance

Dans cette section, on considère la dénition deδi en terme de mesure de dépendance de Csiszár. Eq.(3.13) s'écrit ici

δi = 1

2kfXifY −fXi,YkL1(R2) . (3.32) Cette interprétation ouvre la voie à diverses procédures d'estimation qui n'impliquent plus l'estimation de densités conditionnelles puisque seules la densité de sortie fY et la densité jointefXi,Y doivent être évaluées. Ces méthodes sont décrites dans les sections qui suivent.

3.4.2.1 La méthode simple-boucle

Les méthodes PDF et CDF sont des méthodes dites double-boucle, dans le sens où elles traitent le problème d'estimation de δi comme l'évaluation de deux intégrales. C'est pourquoi elles nécessitent un budget de simulation non raisonnable en pratique. Dans le but de réduire cette charge de calcul, Wei et al. [Wei et al., 2013] proposent une approche dîtes simple-boucle. Les diérentes étapes de cette méthodes sont les suivantes :

(i) Générer {Xn = (X1,. . . , Xdn)}Nn=1 calculées à l'aide de la toolbox développée par Botev et al. [Botev et al., 2010].

(iii) Estimer δi par

Remarques. Cette méthode requiert seulementN appels à la fonction boîte noireM pour estimer l'ensemble des indices de Borgonovo du premier ordre, contre N(1 +dN) pour les méthodes double-boucle. Cependant, l'estimateur soure de certains problèmes théoriques.

Premièrement, on peut noter que l'échantillon {Xn, Yn} est utilisé à la fois pour la simulation Monte-Carlo et pour la procédure d'estimation par noyau. En conséquence, la loi forte des grands nombres ne s'applique plus puisque les variables de la somme donnée par Eq.(3.35) ne sont pas i.i.d.

D'autre part, quand bien même un nouvel échantillon {Uk = (U1k, U2k)}Nk=10 ∼ fXi,Y

La méthode simple-boucle sort donc du cadre classique de l'échantillonnage préférentiel présenté en section 2.2.3.2 et il n'est donc pas clair que l'estimateur δˆiSL soit consistant.

L'introduction de la section 4.2 permettra d'étayer cette armation en appliquant la méthode simple-boucle au modèle jouet (3.17).

3.4.2.2 Méthode basée sur la transformation de Nataf

Cette section détaille les diérentes étapes de la méthode d'estimation introduite par [Zhang et al., 2014].

Estimation de fY. En vertu de la propriété d'invariance de l'indice δi, il peut être supposé sans perte de généralité que Y est positive. La PDF fY est alors estimée en

3.4. Les mesures d'importance δi de Borgonovo : un état de l'art 64

utilisant le principe du maximum d'entropie (cf. section 2.2.2.2) associé à une collection de n moments fractionnaires de Y :

µtY :=E[Yβt] n

t=1 , (3.36)

où β1 < · · · < βn. La distribution de sortie étant inconnue, il en va de même pour les contraintes (3.36). An d'estimer les moments µtY, [Zhang et al., 2014] impose les hypothèses suivantes :

(A.1) Les variables d'entréesXi sont indépendantes.

(A.2) Le modèle M est approché en utilisant la technique de réduction de modèle cut-HDMR (cf. section 2.5.2).

Sous (A.2), la sortie Y peut être approchée par un produit de fonctions unidimen-sionnelles :

Y ≈(M(µX))(1−d)

d

Y

i=1

M(XiX), (3.37)

où µX désigne la moyenne de l'entrée X et où M(XiX) est l'évaluation de M en µX excepté la i-ème composante qui est remplacée par Xi. Grâce à l'hypothèse (A.1), l'esti-mation des moments µtY est alors réduite à l'évaluation d'intégrales unidimensionnelles :

ˆ

µtY := (M(µX))(1−d)βt

d

Y

i=1

Z

M(xiX)βtfXi(xi)dxi

. (3.38)

Dans [Zhang et al., 2014], le calcul de ces intégrales est eectué via une méthode de quadrature de Gauss à Nq points, de sorte que seulement dNq+ 1appels au code Msont nécessaires pour calculer l'ensemble des contraintes (3.36).

Estimation de la densité jointe fXi,Y. La transformation de Nataf de la paire (Xi, Y)est dénie par

Ri = (ri(Xi), ry(Y)) = Φ−1(FXi(Xi)),Φ−1(FY(Y)) ,

où Φest la CDF de la distribution normale centrée réduiteN(0,1). Par construction, les marginalesri(Xi)etry(Y)suivent la loiN(0,1)mais sans hypothèses supplémentaires, Ri

n'est pas nécessairement un vecteur gaussien. En outre, d'après le théorème de changement de variable, la distribution de Ri est donnée par

fRi(ri(x), ry(y)) =fXi,Y(x, y)φ(ri(x))φ(ry(y))

fXi(x)fY(y) , (3.39) où φ désigne la PDF de la distribution N(0,1). Néanmoins, [Zhang et al., 2014] font l'hypothèse suivante :

(A.3) La relation suivante est vériée :

fXi,Y(x, y) = fXi(x)fY(y) φ2(ri(x), ry(y))

φ(ri(x))φ(ry(y)) , (3.40) oùφ2 désigne la PDF de la distributionN2(0R20,i)oùρ0,iest la matrice de corrélation du couple (ri(Xi), ry(Y)). En vertu de l'égalité (3.39), l'hypothèse (A.3) est équivalente au

fait d'exiger que Ri soit un vecteur gaussien de matrice de corrélationρ0,i. Par densité jointe se résume à l'estimation du coecient ρ0,i. Par ailleurs, le théorème de changement de variable permet d'établir un lien entre ρ0,i et le coecient de variationρi de (Xi, Y)

ρi = Cov(Xi, Y) σiσY

= E[XiY]−E[Xi]E[Y]

pE[Y2]−(E[Y])2·σi , (3.41) où σi, σY sont les écarts-type respectifs de Xi et Y. Considérons la décomposition de Cholesky de la matrice dénie positive ρ0,i :

ρ0,i=L0LT0 , re-cherche des zéros d'une fonction (non linéaire), comme la méthode de Newton-Raphson.

Formulation. Sous l'hypothèse (A.3), le théorème de changement de variable permet de réinterpréter l'indice δi comme l'espérance suivante [Zhang et al., 2014]

δi =E

Pour conclure, la procédure complète introduite par [Zhang et al., 2014] peut être résumée comme suit :

(i) Calculer les poids {{zi,k}Nk=1q }di=1 correspondant à la formule de quadrature de Gauss considérée pour estimer les intégrales intervenant dans Eq.(3.38). Ensuite, calculer M(µX) et les d×Nq termes {{M(zi,k, µX)}Nk=1q }di=1.

(ii) Estimation de fY. Considérer n nombres réels β1 < · · · < βn et les moments fractionnaires associés {µtY}. Calculer les contraintes approchées µˆtY données par

3.4. Les mesures d'importance δi de Borgonovo : un état de l'art 66

Eq.(3.38) en utilisant la grille d'intégration établie à l'étape (i). Ensuite, déterminer le minimum (λt) de la fonction suivante : Considérer l'estimateur ME de fY :

Y(y)∝exp −

(iii) Calcul du coecientρi. Calculerρi à partir de Eq.(3.41). Pour cela, calculerE[Y] etE[Y2] en considérant βt= 1 etβt= 2 dans Eq.(3.38). De même, calculerE[XiY] à l'aide de l'approximation de modèle donnée par Eq.(3.37) :

E[XiY]≈(M(µX))(1−d) associés à la méthode de Gauss-Hermite. Déterminer la racine de la fonction suivante (approximation de Eq.(3.42))

−∞Y(u)du etL0 la matrice triangulaire inférieure de la décomposi-tion de Choslesky de la matrice

1 ρ0,i

Remarques. Cette approche d'estimation est très compétitive puisqu'elle fait inter-venir très peu d'appels au modèle M. Ceci est dû au fait que les hypothèses (A.1) et (A.2) permettent de réduire le calcul des contraintes (3.36) à l'évaluation déterministe d'intégrales unidimensionnelles (voir Eq.(3.38)). Le nombre d'appels au codeMest donc égal à dNq+ 1où Nq est l'ordre de la méthode de quadrature de Gauss utilisée pour es-timer ces intégrales. Néanmoins, les hypothèses sur lesquelles repose cette approche sont restrictives.

L'hypothèse (A.3) peut être évitée en appliquant la méthode proposée par [Yun et al., 2018] qui repose sur des techniques similaires. Il s'agit d'une méthode double-boucle basée sur la dénition de δi en terme d'espérance. En outre, la densité de sortie et les PDFs de sortie conditionnelles sont simultanément estimées à l'aide du principe du maximum d'en-tropie. Le calcul des contraintes associées est eectué sous les hypothèses (A.1) et (A.2), ce qui assure un budget de simulation identique à la méthode reposant sur l'utilisation de la transformation de Nataf.

On peut également se soustraire à l'hypothèse d'indépendance (A.1) en calculant diéremment les contraintes

µtY = Z

Rd

M(x)βtfX(x)dx, t= 1, . . . , n

La malédiction de la dimension qui aecte les méthodes de quadratures classiques rend dicile l'évaluation de ces intégrales d-dimensionnelles. Ceci peut être surmonté dans une certaine mesure par la technique d'intégration SGI (acronyme anglais de Sparse Grid integration) qui est basée sur le produit tensoriel de Smolyak [Gerstner and Griebel, 1998, Zhang et al., 2015] et dont le but est de diminuer le nombre de n÷uds d'intégra-tion considérés. Considérant une suite de formules de quadrature unidimensionnelle (non nécessairement imbriquées) pour une fonction g à une dimension

Q1lg =

Nl1

X

i=1

ωi,lg(zi,l) , on dénit la formule de quadrature suivante

1kg := (Q1k−Q1k−1)g avec Q10g := 0 , et le produit tensoriel de d formules de quadrature Q1l

1 ⊗ · · · ⊗Q1l

où f est une fonction à d dimensions. Alors, la formule de Smolyak avec un l niveaux de précision est dénie par

où la somme porte sur le simplexe ( d

L'étude de la convergence et de l'erreur de la méthode SGI est disponible dans [Gerst-ner and Griebel, 1998]. En outre, estimer les moments fractionnaires µtY avec cette ap-proche requiert

X

|k|1≤l+d−1

Nk11· · ·Nk1d , (3.47)

3.4. Les mesures d'importance δi de Borgonovo : un état de l'art 68

appels au code de calculM. À titre d'exemple, pour un modèle comportantd= 6entrées et pour une suite(Q1k)de formules de quadrature imbriquées d'ordresNk1 =k, la technique SGI avecl = 2(respectivementl = 3etl = 4) niveaux de précision nécessite seulement 13 (respectivement 31 and 91) évaluations de la fonctionM. En revanche, cette technique est complexe à implémenter en pratique puisqu'il n'existe pas de formule générale explicite pour calculer les poids d'intégration qui interviennent dans la formule de Smolyak donnée par Eq.(3.46) [Gerstner and Griebel, 1998].