• Aucun résultat trouvé

3.4 Les mesures d'importance δ i de Borgonovo : un état de l'art

3.4.1 δ i vue comme une espérance

Dans cette section, le point de vue adopté est celui de l'article original [Borgonovo, 2007], i.e, l'indice de Borgonovo de l'entrée Xi est déni par l'espérance renormalisée du shift (3.18) :

δi = 1

2E[s(Xi)]. (3.21)

Les premières méthodologies qui ont été proposées pour estimer l'indice δi reposent sur une idée commune, à savoir l'approximation Monte-Carlo de l'espérance (3.21) :

δi ≈ 1 2N

N

X

n=1

s(Xin), {Xin}Nn=1 i.i.d

∼ fXi . (3.22)

La principale diculté réside alors dans l'évaluation des diérentes intégrales (aléa-toires) s(Xin) provenant de la dénition (3.18) du shift. Pour cela, plusieurs approches existent et sont listées dans les sous-sections suivantes.

3.4.1.1 La méthode PDF

Formulation. Dans l'article pionnier [Borgonovo, 2007], il est proposé d'estimer les PDFs qui interviennent dans la somme (3.22) en utilisant la méthode du maximum de vraisemblance couplée à un test de Kolmogorov-Smirnov. [Borgonovo et al., 2011] adopte par la suite une approche non-paramétrique, basée sur la procédure d'estimation par

noyau détaillée en section 2.2.2.1. Cette approche (que l'on désignera par méthode PDF dans la suite de ce manuscrit) peut alors être résumée comme suit :

(i) Générer {Xn = (X1n, . . . , Xdn)}Nn=1

(ii) Considérer les estimateurs à noyau de la densitéfY et desN densités conditionnelles fY|Xi=Xin : où K est un noyau unidimensionnel et h, {h(i),n}Nn=1 les fenêtres respectives.

(iii) Estimer δi par

où les intégrales sont évaluées par intégration numérique.

Remarques. La méthode PDF nécessiteN(1 +dN) appels au modèle de sortie pour obtenir une estimation des indices de Borgonovo d'ordre 1. Elle n'est donc pas adaptée aux systèmes complexes réalistes pour lesquels l'évaluation du code de calcul Mest coûteuse.

D'autre part, lorsque les entrées sont corrélées, l'étape (i) peut être dicile en pratique puisqu'elle requiert d'être capable d'échantillonner selon X|Xi =Xin ce qui peut s'avérer délicat lorsque l'entrée X n'est pas gaussienne. Une variante de la méthode PDF, reposant sur le partitionnement de l'ensemble Ei des valeurs prises par l'entrée Xi, est développée par [Plischke et al., 2013]. Étant donnée une partition FM

m=1E(i),m de Ei, l'idée est de remplacer les densités de Y sachant que Xi prenne une valeur ponctuelle, par les densités fY|E(i),m deY sachant que Xi appartienne à une des classesE(i),m, i.e, [Plischke et al., 2013] obtient alors l'estimateur suivant :

δˆiPseudo:= 1

2Dans le cas où les entrées sont indépendantes, il sut pour cela de xer la i-ème composante de Xn à Xin.

3.4. Les mesures d'importance δi de Borgonovo : un état de l'art 60

où Nm désigne le nombre de réalisations Xin appartenant à la classe E(i),m et où fˆY|E(i),m est l'estimateur à noyau de la densité dénie par Eq.(3.26) :

Y|E(i),m(y) := 1

Nmhm · X

Xin∈E(i),m

K

y−Yn hm

, y ∈R , (3.28)

Cette approche nécessite seulementN évaluations de modèle et des résultats de conver-gence sont discutés dans [Plischke et al., 2013]. En particulier, les auteurs démontrent que l'estimateurδˆiPseudo converge presque sûrement versδi lorsque le nombre d'échantillonsN et la taille de la partition M tendent vers+∞. En revanche, cette convergence peut s'avé-rer très lente. De plus l'application de cette méthode repose sur le choix d'une partition (plusieurs stratégies de partitionnement sont présentées dans [Plischke, 2012]) de Ei ce qui peut être fastidieux.

3.4.1.2 La méthode CDF

Dans [Liu and Homma, 2009], Liu and Homma propose une nouvelle méthode (intitulée méthode CDF dans la suite de cette section) pour estimer la mesure δi dénie par Eq.(3.21). Le principe de la méthode CDF est de réécrire le shift de densité s(Xi) en fonction des CDFs FY et FY|Xi. Pour toute réalisation xi de Xi, le shift s(xi) peut se réécrire comme suit :

s(xi) = Z

Ω(xi)

|fY −fY|Xi=xi|+ Z

Ω(xi)c

|fY −fY|Xi=xi| ,

= Z

Ω(xi)

(fY −fY|Xi=xi)− Z

Ω(xi)c

(fY −fY|Xi=xi) , (3.29) où Ω(xi) désigne l'ensemble

y∈R|fY(y)≥fY|Xi=xi(y) . Pour xer les idées, supposons que Ω(xi) =]− ∞, a], i.e, que fY et fY|Xi=xi s'intersectent en un unique point y = a et que fY −fY|Xi=xi soit positive sur ]− ∞, a]. On obtient alors

s(xi) = Z a

−∞

(fY −fY|Xi=xi)− Z +∞

a

(fY −fY|Xi=xi),

= (FY(a)−FY|Xi=xi(a))−((1−FY(a))−(1−FY|Xi=xi(a))) ,

= 2(FY(a)−FY|Xi=xi(a)) .

Plus généralement, supposons que les densités fY et fY|Xi=xi vérient les hypothèses suivantes :

(A.1) fY etfY|Xi=xi admettent un nombre ni m(xi) de points d'intersection y1(i) <· · ·< y(i)m(x

i) .

(A.2) fY −fY|Xi=xi change de signe en chacun des pointsyk(i) et est positive sur]−∞, y1(i)].

En réinjectant ces hypothèses dans Eq.(3.29) et en procédant comme dans le cas d'un unique point d'intersection, on obtient3

s(xi) = 2

Un point d'intersection entrefY etfY|Xi est une solution de l'équation suivante fY(y)−fY|Xi(y) = 0 ,

qui peut se réécrire comme suit

d(FY −FY|Xi)

dy (y) = 0 .

Ainsi, les points d'intersection de fY et fY|Xi=xi correspondent aux points extrémaux de la fonctionFY −FY|Xi=xi et peuvent donc être déterminés en utilisant les méthodes de dérivation numérique classiques (schéma aux diérences nies etc.). Dans le cas du modèle jouet (3.17), on peut observer sur la gure [3.2] que les PDFsfY etfY|X2=2 présentent deux points d'intersection y(2)1 = 0.63645et y2(2) = 4.1636 tels que fY(y(2)1 )−fY|X2=2(y1(2))≥0. Le shift associé s(2) est donc égal à

s(2) = 2×(0.51615−(−0.029338)) = 1.091 .

(a) Représentation la densité fY (courbe rouge) de la sortie du modèle déni par Eq.(3.17)et la densité conditionnéefYX2=2 (courbe noire).

-10 -8 -6 -4 -2 0 2 4 6 8 10

(b) Représentation de la diérence entre la CDF FY et la CDF conditionnéeFYX2=2.

Figure 3.2. Représentations géométriques du shifts(2) du modèle défini par Eq.(3.17).

Pour résumer, les diérentes étapes de la méthode CDF sont (i) Générer {Xn = (X1,. . . , Xdn)}Nn=1

i.i.d

∼ fX puis évaluer Yn = M(Xn) pour n = 1, . . . , N.

3Si fY fY|Xi=xi est négative sur]− ∞, y(i)1 ], l'égalité (3.30) dière d'un facteur -1.

3.4. Les mesures d'importance δi de Borgonovo : un état de l'art 62

(ii) Considérer les estimateurs à noyau respectifsFˆY etFˆY|Xi=Xin de la CDF FY et des N CDFs conditionnelles FY|Xi=Xni.

(iii) Pourn = 1, . . . , N, déterminer les points extrémaux{y(i)k }m(Xk=1in) de la fonction FˆY − FˆYXi=Xni.

(iv) Considérer l'estimateur suivant : δˆiCDF := 1

N

N

X

n=1

n×

m(Xin)

X

k=1

(−1)k−1×

Y(yk(i))−FˆY|Xi=Xin(y(i)k )

, (3.31) où n est le signe de FˆY(y1(i))−FˆY|Xi=Xn

i(y(i)1 ).

Remarques. La méthode CDF à pour avantage de s'épargner l'estimation des densités fY et fY|Xi=Xin. Néanmoins, elle reste équivalente à la méthode PDF en terme de coût de simulation puisque N(1 +dN) appels au code de calcul M sont requis pour obtenir une estimation des indices δi. De plus, la charge de calcul inhérente à l'estimation des densités est remplacée par la recherche des points extrémaux des fonctions FY −FY|Xi=Xin

qui n'est pas exempt d'erreurs d'approximation. En eet, les applications numériques eectuées dans [Liu and Homma, 2009] illustrent que l'estimateur δCDFi peut présenter une variance plus grande que celle de δPDFi .

Par la suite, le problème d'estimation des mesures d'importanceδi a été abordé dans de nombreux travaux de recherche. En outre, l'objectif est de diminuer le budget de simulation exigé par les méthodes PDF et CDF tout en conservant une estimation su-samment précise des indices pour obtenir le ranking correct, i.e, le classement des entrées en fonction de leur inuence sur la sortieY. La section suivante présente les méthodologies d'estimation basées sur la dénition de δi en terme de mesure de dépendance de Csiszár.