HAL Id: tel-01143779
https://tel.archives-ouvertes.fr/tel-01143779
Submitted on 20 Apr 2015
HAL is a multi-disciplinary open access
archive for the deposit and dissemination of
sci-entific research documents, whether they are
pub-lished or not. The documents may come from
teaching and research institutions in France or
abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est
destinée au dépôt et à la diffusion de documents
scientifiques de niveau recherche, publiés ou non,
émanant des établissements d’enseignement et de
recherche français ou étrangers, des laboratoires
publics ou privés.
Paul Lemaitre
To cite this version:
Paul Lemaitre.
Analyse de sensibilité en fiabilité des structures.
Mécanique des structures
[physics.class-ph]. Université de Bordeaux, 2014. Français. �NNT : 2014BORD0061�. �tel-01143779�
THÈSE PRÉSENTÉE
POUR OBTENIR LE GRADE DE
DOCTEUR DE
L’UNIVERSITÉ DE BORDEAUX
ÉCOLE DOCTORALE DE MATHÉMATIQUES ET INFORMATIQUE
SPÉCIALITÉ : Mathématiques appliquées
Par Paul Lemaître
Analyse de sensibilité en fiabilité des
Structures
Directeur de thèse : M. Pierre Del Moral
Soutenue le 18 mars 2014 devant la commission d'examen composée de :
M. Josselin Garnier
Professeur
Université Paris VII
Rapporteur
M. Bertrand Iooss
Chercheur Senior EDF R& D
Co-encadrant
M. François Legland
Dir. de Recherche INRIA Rennes
Rapporteur
M. Emmanuel Remy
Chercheur Expert EDF R& D
Examinateur
Résumé :
Cette thèse porte sur l'analyse de sensibilité dans le contexte des études de
fiabilité des structures. On considère un modèle numérique déterministe permettant de
représenter des phénomènes physiques complexes.
L'étude de fiabilité a pour objectif d'estimer la probabilité de défaillance du matériel à partir
du modèle numérique et des incertitudes inhérentes aux variables d'entrée de ce modèle.
Dans ce type d'étude, il est intéressant de hiérarchiser l'influence des variables d'entrée et
de déterminer celles qui influencent le plus la sortie, ce qu'on appelle l'analyse de
sensibilité. Ce sujet fait l'objet de nombreux travaux scientifiques mais dans des domaines
d'application différents de celui de la fiabilité. Ce travail de thèse a pour but de tester la
pertinence des méthodes existantes d'analyse de sensibilité et, le cas échéant, de proposer
des solutions originales plus performantes. Plus précisément, une étape bibliographique
sur l'analyse de sensibilité puis sur l'estimation de faibles probabilités de défaillance est
proposée. Cette étape soulève le besoin de développer des techniques adaptées. Deux
méthodes de hiérarchisation de sources d'incertitudes sont explorées. La première est
basée sur la construction de modèle de type classifieurs binaires (forêts aléatoires). La
seconde est basée sur la distance, à chaque étape d'une méthode de type subset, entre les
fonctions de répartition originelle et modifiée. Une méthodologie originale plus globale,
basée sur la quantification de l'impact de perturbations des lois d'entrée sur la probabilité
de défaillance est ensuite explorée. Les méthodes proposées sont ensuite appliquées sur
le cas industriel CWNR, qui motive cette thèse.
Mots clés
: Analyse de sensibilité ; Fiabilité; Incertitudes ; Expériences numériques;
Perturbation des lois
Title : Reliability sensitivity analysis
Abstract :
This thesis' subject is sensitivity analysis in a structural reliability context. The
general framework is the study of a deterministic numerical model that allows to reproduce
a complex physical phenomenon. The aim of a reliability study is to estimate the failure
probability of the system from the numerical model and the uncertainties of the inputs. In
this context, the quantification of the impact of the uncertainty of each input parameter on
the output might be of interest. This step is called sensitivity analysis. Many scientific works
deal with this topic but not in the reliability scope. This thesis' aim is to test existing
sensitivity analysis methods, and to propose more efficient original methods. A
bibliographical step on sensitivity analysis on one hand and on the estimation of small
failure probabilities on the other hand is first proposed. This step raises the need to
develop appropriate techniques. Two variables ranking methods are then explored. The
first one proposes to make use of binary classifiers (random forests). The second one
measures the departure, at each step of a subset method, between each input original
density and the density given the subset reached. A more general and original methodology
reflecting the impact of the input density modification on the failure probability is then
explored.
The proposed methods are then applied on the CWNR case, which motivates this thesis.
Keywords :
Sensitivity Analysis; Reliability; Uncertainties; Computer experiments; Input
perturbations
boîte mailuneproposition destageen analysed'in ertitudesau CEAdeCadara he. Unami,que je
dénon e plustard, m'aaidéà passerle apdu"j'aipas leniveau" etm'apousséà andidater. Bien
m'en a pris, ar e stage fut ledébut d'unefru tueuse ollaboration. C'est le moment de remer ier
toutes les personnes sansqui la thèse n'aurait toutsimplement pasété possible.
Que e soit à Tunis, Cadara he, Chatou ouà Villard de Lans, BertrandIoossa su faire montre
d'une grande humanité et de ompéten es s ientiques très poussées sous ouvert d'une arapa e
punk. Je lui suis très re onnaissant de m'avoir transmis une bonne partie de ses onnaissan es, je
l'espèrepasuniquement statistiques.
Mer i à Fabri e Gamboa pour m'avoir permis de nir ma thèse dans de bonnes onditions, je
lui suis inniment re onnaissant de m'avoir a epté omme obureau ("room servi e") pour les 5
derniers mois.
Jeremer ie Pierre DelMorald'avoir a eptéde m'en adrerau titrede dire teurdethèse. Dela
même façon,jesaisgréàJosselinGarnieretFrançoisLeGland d'avoirpatiemment relu ettethèse
et d'avoir apporté des remarquespertinentes me permettant d'améliorer le résultat. Mer i aussi à
Jérme Sara opour avoir a epté de fairepartie du jury.
UnebonnepartiedemagratitudevaàAurélieArnaudpoursonen adrementorientéappli ations.
De la même façon, je suis parti ulièrement re onnaissant envers Emmanuel "Manu" Remy, pour
m'avoirsupportédansson ouloiràdesheuresquele odedutravailréprouve,pourses onnaissan es
sur laphysique desréa teurs etpour ses (très)patientesrele tures.
Ma re onnaissan e va également à Agnès Lagnoux pour m'avoir en adré lors d'un ourt mais
e a e séjour de re her he à l'UPSn 2012.
C'est l'o asion pour moi de dire la gratitude que j'ai envers Didier Larrauri pour m'avoir
au-torisé à prolonger ma thèse an de la nir dans de bonnes onditions. J'ai pu appré ier pendant
ette thèse d'êtreentouré de ollègues à lafois sympathiqueset e a es, pointusen statistiques et
enappli atif. MeshommagesàtoutMRI,T-55etT-57entête. Enparti ulier, jeremer ie Mathieu
pour son aide sur la partie logi ielle et Mi hael pour son savoir des ar anes du al ul numérique
ainsiqueMerlin pouravoirpatiemmenté outémesélu ubrations,notammentsurlapartie
"pertur-bation desparamètres" desDMBRSI. À mon"on le de thèse" Ni olas, j'adresse mes plus sin ères
remer iements. Mer i de m'avoir rassuré à plusieurs o asions sur l'avenir de ette thèse. Et bien
sûr, salutations sportivespour mes deux ollègues de sallede sportPopi etFafa.
Cettethèse n'aurait pasvule jour sans lefort supportdanstous les momentsdi iles quej'ai
eu delapartdemes amis. Enparti ulierjeremer ie letrioparisienformépar Jean-Phi,Thiernoet
Nessie,pourlesbonsmomentsetlesautres. DespoutouxàMorganeet Diday. Ilmefautégalement
tirer mon hapeau à l'équipe toulousaine, Dra o et Maria en tête. Je remer ie également Bébert
(il sait pourquoi). Bigup àRaphaël, pour m'avoire a ement onseillésur toutl'interfaçageave
l'Université de Bordeaux. Mention spé iale à Petit Paul, Agathe, Alex etMélopour l'anglais. Par
ailleurs,jesuisredevableà euxquiprendrontlapeinedeposerunRTTpourallerjusqu'àBordeaux
lejourdemasoutenan e, Fly,Quentin,Jeb ettontonVip-hopdénon é. Enn, jenepeux on lure
sans unepenséepour Mathieu.
Pour nir, mes sentiments vont vers ma famille, en parti ulier mes parents et mes deux s÷urs
Introdu tion
Analyse d'in ertitudes et expérien es numériques
On présentei i brièvement le adre général de ette thèse : l'exploitation d'un modèle numérique.
Unmodèleesti iunereprésentation mathématique d'unphénomènephysique etsontraitement est
ee tué autravers d'un systèmede al ul.
Ce modèle possède des entrées et des sorties (ou réponses). I i, toutes es quantités seront
onsidéréess alairesmaisd'autrestypespourraientêtreenvisagés,modalesparexemple. Enfon tion
d'unjeudedonnéesd'entrée,le odede al ulvaproduireunjeuderéponsesaprèsun ertaintemps
de al ul. Le adre des odes déterministes estutilisé : un même jeu d'entrée produira toujours le
même jeudesortie. Dans erapport, ilseraparfoisfaitunabusdelangageen assimilant le ode au
modèle, pour desraisonsde lisibilité.
Unenotionessentielleestlaquantitéd'intérêt. Ilesteneetpossibleque enesoitpasunevaleur
de sortie qui intéresse l'expérimentateur, mais plutt une plage de valeurs ou une quantité dénie
àpartirdessorties. Ilestdon primordialavanttouteétudededénirquelleestlaquantitéd'intérêt.
L'analyse de sensibilité est dénie par Saltelli et al. [89℄ omme l'étude de la façon dont
l'in ertitudesurunequantitédesortiedumodèlepeutêtreattribuéeauxdiérentessour esd'in ertitudes
dansles variablesd'entrée.
L'analysedesensibilitéd'unmodèlenumériquepeutserviràdéterminerlesvariablesd'entréequi
ontribuentleplusàun ertain omportementd'unesortie,déterminer ellessansinuen eou elles
quivontinteragiràtraverslemodèle. Lebutpeutêtrede omprendrelemodèle, delesimplier, ou
en ore de prioriserlere ueilde donnéespour mieuxmodéliser unevariabled'entrée. Une appro he
ré ente est l'appro he dite globale. L'ensemble du domaine de variation des variables d'entrée est
alorsétudié. Laplupartdeste hniquessontdéveloppéesdansuneappro heindépendantedumodèle
("model free"), 'est-à-dire sans émettre d'hypothèses sur le omportement du modèle omme par
exemple lalinéarité oulamonotonie.
Fiabilité des stru tures
On her heàrépondreauproblèmeindustrieldesavoirsiunestru tureouun omposantpeutrésister
à des ontraintes qui lui sont appliquées. L'appro he basée sur des essais et mesures est possible,
mais peut s'avérer di ile pour des raisons de oûts ou de risques. Parfois, l'expérimentation est
impossible. Desmodèlesnumériquessontalorsutilisés ommereprésentation appro héedelaréalité
in luant ertains mé anismes ( omme par exemple eux de la dégradation, de la propagation des
ssures...).
An d'exploiter omplètement le modèle, les in ertitudes sur les paramètres d'entrées du ode
représentedon la stru ture,dotée d'une ertaine résistan e, et l'environnement, qui engendre une
solli itation. Le al ul pour un jeu d'entrées xées permet d'obtenir un ritère de défaillan e qui
amène àune réponsebinaire : lastru tureest défaillantepour esentrées ounon défaillante.
Le fait d'in lure les in ertitudes omme des variables aléatoires permet de modéliser le risque
ommeuneprobabilitédedéfaillan e. Cetteappro heestplusnequ'uneappro hedéterministe où
les grandeurs sont xéesàdes valeursnominales.
Soit
X
= (X
1
, ...X
d
)
le ve teur aléatoired
−
dimensionnel (dont la densitéf
X
est onnue) desvariables d'entrée(s alaires) dumodèle numérique. Ons'intéresse à e quelavaleurs alaire
Y
∈ R
renvoyée par lafon tion de défaillan e
G
du modèle(ou fon tion d'état-limite du modèle) soit plusfaiblequ'un ertainseuil
k
(usuellement0
): 'estle ritèrededéfaillan e. Lastru tureestdéfaillantepour un jeu d'entrée
x
siy = G(x)
≤ k
(oùx
= (x
1
, ..., x
d
)
∈ R
d
estune réalisation de
X
etk
unseuil usuellement xé à
0
). L'ensemble de l'espa e sur lequel et évènement se produit est appelédomaine dedéfaillan e
D
f
. Lasurfa edéniepar{x ∈ R
d
, G(x) = k
}
estditesurfa ed'état-limite.
La probabilitéque l'évènement seproduiseest notée
P
f
,probabilité de défaillan e. Ona :P
f
=
P(G(X) ≤ k)
=
D
f
f
X
(x)dx
=
R
d
1
G(x)≤k
f
X
(x)dx
=
E[1
G(X)≤k
]
La omplexitédesmodèlesetlepossiblegrand nombredevariablesd'entréefaitque,dansle as
général, on ne peut pas al uler la valeur exa te de la probabilité de défaillan e. On peut
epen-dant estimer ette quantité (qui est une espéran e mathématique) à l'aide de diverses méthodes
numériques. Labasedelaabilité desstru turesestdefournir uneestimationde
P
f
etunein erti-tude autour de ette estimation. Cetteestimation permetensuitede répondreàlaquestion initiale
de larésistan ede lastru ture.
Obje tifs de la thèse
Le but de ettethèse est ledéveloppement de te hniquesd'analyse desensibilité quandlaquantité
d'intérêtestuneprobabilitédedépassementdeseuil( equiéquivautàuneprobabilité dedéfaillan e
dansle ontextedelaabilitédesstru tures). Les ontraintesdu odeCWNRquiamotivéletravail
de thèsedoivent êtreprisesen ompte. Laprobabilité de défaillan edansle aslemoinspénalisant
(
7
variables) aunordredegrandeurattendude10
−5
. Sipossible,lesméthodesdéveloppéesdoiventêtre en relation ave l'estimation de
P
f
et doivent produire une estimation de l'erreur faite lors del'estimation desindi esde sensibilitéetde
P
f
.Organisation de la thèse
La thèse estdiviséeen quatre hapitres.
Le premier hapitre est une revue des stratégies existantes pour estimer des probabilités de
défaillan e etdeste hniquesd'analysede sensibilité.
Lese ond hapitreest onsa réàladénitiondemesuresdesensibilitéave pourbut la
modi ationde densitéd'entrée surlaprobabilité de défaillan e produite ensortie.
Lequatrième hapitreprésenteuneappli ation desméthodesétudiéessurle asCWNR, asréel
qui amotivé lathèse.
Méthodes de lassement de variables
Le se ond hapitre présente deuxméthodespermettant de lasserles variablesd'entrée enfon tion
deleurinuen esurlasortie(binaire). Deplus, esméthodessontdessous-produits del'estimation
de laprobabilitéde défaillan e
P
f
.En eet la première te hnique propose de faire usage de mesures dérivées de l'ajustement de
forêts aléatoires surun é hantillon de type Monte-Carlo. Un rappel surlesarbres binairespuis sur
les forêts aléatoires est proposé, puis l'étude de deux indi es (Gini Importan e et Mean De rease
A ura y) mesurant l'importan e desvariables surlaquantité d'intérêt binaireestproposé.
La se onde te hnique mesure l'é art, à haque étape d'uneméthode de type subset simulation,
entreles densités d'entrée etlesdensités sa hant quelesous-ensembleestatteint.
La dénition informelle est la suivante : l'indi e de sensibilité est déni pour la variable
i
etl'étapedu subset
k
ommeladistan e entre lafon tion de répartition (f.d.r.) empiriqueet laf.d.r.théorique de lavariable. Considérant
M
étapes desubset avek = 1 . . . M
;eten notant :F
n,i
k
= F
i
(x
|A
k
),
laf.d.r. empirique de la
i
ème
variablesa hant queleseuil
A
k
a étédépassé. L'indi e proposés'é ritommesuit :
δ
i
SS
(A
k
) = d(F
n,i
k
, F
i
),
où
F
i
est la f.d.r. de lai
ème
variable, et
d
est une distan e. Une variable inuente aura un grandé art enf.d.ralors qu'une variablenon-inuente auraunfaibleé art enf.d.r.,don unfaible indi e.
Des travauxsont menés surle hoix dela distan e
d
en fon tiondu besoin de l'analyste.Cesdeuxméthodespeuventdon êtrevues ommedessous-produits dete hniquesd'estimation
de laprobabilitéde défaillan e.
Méthode basée sur une perturbation des densités (DMBRSI)
Dans le troisième hapitre, de nouveaux indi es de sensibilité pour la abilité sont proposés. Cet
indi e de sensibilité est basé sur une modi ation des densités et est adapté aux probabilités de
défaillan e. Une méthode pourestimer de tels indi es estproposée.
Ces indi es reètent l'impa t d'une modi ation d'une densité d'entrée sur la probabilité de
défaillan e
P
f
. Ils sont indépendantsde la perturbation dansle sensoù l'utilisateur peut hoisir laperturbation adaptéeà sonproblème.
Pour des raisons de simpli ité, un s héma d'é hantillonnage Monte-Carlo lassique est
onsid-éré par la suite, bien que le pro essus d'estimation a été étendu aux méthodes subset et tirages
d'importan e. Les indi es de sensibilitépeuvent être estimésen utilisant seulement lejeu de
simu-lations déjà utilisé pour estimer laprobabilité de défaillan e
P
f
. Ce ilimite lenombred'appels auode de al ul, ommementionné dansles ontraintes du asindustrielCWNR.
Le hapitre est organisé de la façon suivante : en premier lieu, les indi es et leurs propriétés
deperturbationdesdensitéssontprésentées. Cesmodi ationspeuventêtre lasséesendeuxgrandes
familles : minimisation de Kullba k-Leibler et perturbation des paramètres. Le omportement des
indi es proposésesttesté surdes astests, puisles avantageset problèmes restantssont nalement
dis utés.
Le hapitre 3 estune versionétendue dupapier par Lemaître et oauteurs[63 ℄.
Indi e DMBRSI
Soit une entrée unidimensionnelle
X
i
de densitéf
i
, on appelleX
iδ
∼ f
iδ
l'entrée perturbéeorre-spondante.
La probabilité dedéfaillan e modiéedevient :
P
iδ
=
1
{G(x)<0}
f
iδ
(x
i
)
f
i
(x
i
)
f (x)dx
oùx
i
estlai
ème omposante du ve teurx
.L'indi eDMBRSI alaforme suivante.
Dénition Ondénit les indi es de sensiblité basés sur une modi ation des lois (Density
Modi- ation Based Reliability SensitivityIndi es - DMBRSI) omme la quantité
S
iδ
:S
iδ
=
P
iδ
P
f
− 1
1
{P
iδ
≥P
f
}
+
1
−
P
f
P
iδ
1
{P
iδ
<P
f
}
=
P
iδ
− P
f
P
f
· 1
{P
iδ
≥P
f
}
+ P
iδ
· 1
{P
iδ
<P
f
}
.
Estimation
Un estimateur
P
ˆ
N
deP
f
peut être al ulé en utilisant un plan d'expérien e deN
points. Par lasuite,
N
est onsidéré omme étant assez grand pour que le ontexte de la théorie asymptotiques'applique. Par ailleurs,uné hantillonnage detypeMonte-Carlostandardestutilisépoursimplier
les al uls. Oné ritalors
ˆ
P
N
=
1
N
N
X
n=1
1
{G(x
n
)<0}
oùx
1
,
· · · , x
N
sont des réalisations indépendantes de
X
. La loi forte des grands nombres et lethéorème limite entrale (TLC) assurent quepour presque toutes lesréalisations,
ˆ
P
N
−−−−→
N →∞
P
f
ets
N
P
f
(1
− P
f
)
( ˆ
P
N
− P
f
)
−−−−→
L
N →∞
N (0, 1).
Le adre Monte-Carlo permetd'estimer
P
iδ
de façon onsistante sans nouvel appel au ode deal ul
G
,grâ e àune te hnique de tirage d'importan e "inverse" (reverse importan e sampling):ˆ
P
iδN
=
1
N
N
X
n=1
1
{G(x
n
)<0}
f
iδ
(x
n
i
)
f
i
(x
n
i
)
.
Ce i est très intéressant quand le ode de al ul
G
est oûteux en temps de al ul ( Be kman andM Key,Hesterberg[8, 45℄).
et les te hniques d'estimation présentées restent validespour toute perturbation tant quedes
on-traintes sur le support sont respe tées. I i on se fo alise sur deux familles de méthodes. Dans la
première, la densitéperturbée est elle minimisant ladivergen e de Kullba k-Leibler sousdes
on-traintes xées par l'utilisateur. Plusieurs ontraintes sont proposées (perturbation de la moyenne,
delavarian eetdesquantiles). L'usage delase onde méthodeest onseilléquandl'utilisateurveut
tester la sensibilité de
P
f
aux paramètres des distributions. Chaque se tion est introduite par unexemple jouet.
Cette se tion illustre la apa ité des DMBRSI à traiter des obje tifs d'analyse de sensibilité
diérents. L'utilisateur est invité à proposer de nouvelles perturbations qui répondraient à ses
obje tifs.
Appli ation au as CWNR
Le quatrième hapitre présente l'appli ation des méthodes développées au as CWNR. Ce as est
présentédans l'organisationde la thèse,page 24. On rappelle que e modèlede type "boîte-noire"
onstitue lamotivation initialede e travail.
Pour estimer
P
f
,laméthode FORM(voir Se tion 1.2.2.2) et unMonte-Carlonaïf(voirSe tion1.2.1.1) ont étéutilisées. Lesrésultatsproduitspar laméthodeMonte-Carlosont onsidérés omme
étant laréféren e dans e hapitre.
Lapartieanalysedesensibilitéest onsa réeàlamiseen÷uvredetroisméthodes: premièrement,
les fa teurs d'importan e FORM(voirSe tion 1.3.2.2). Ensuite, desforêts aléatoires (voir Se tion
2.2) sont onstruitessurl'é hantillon Monte-Carloetdesmesures de sensibilitésont dérivées. Pour
nir, les DMBRSI (voir Chapitre 3) sont utilisés. Plusieurs perturbations (moyenne, quantile et
paramètres) sont testées.
Ce hapitre estdiviséen troisse tions prin ipales,se on entrant ha unesurdes asde
dimen-sion roissante (
3
,5
et7
variables probabilisées), où plus la dimension est petite, plus le as estpénalisant.
Les on lusionsde e hapitre sontles suivantes :
en e qui on erne lapartie estimation de
P
f
, la méthode de Monte-Carlo reste la référen esurun odeindustriel. Le désavantage majeurest bienentendu letemps de al ulné essaire.
En equi on ernelapartieanalysedesensibilité,lesforêtsaléatoiresproduisent desrésultats
ontestables, ar les modèles ajustés sont de mauvaise qualité. La méthode est don peu
on luante pour l'instant.
LesDMBRSIsemblent uneméthodeadaptée pour ee tuerune analysedesensibilitésurune
probabilitéde défaillan e. Plusieurs ajustementset ongurations ont ététestées.
Axes de re her hes futures
Les méthodesprésentées dansleChapitre 2peuventêtre améliorées. Plusspé iquement, ilya un
besoin d'améliorer les lassieurs binaires (forêts aléatoires). Les indi es MDA ouplés à lasubset
simulation doivent être implémentés. Une autre perspe tive d'amélioration, en utilisant les indi es
δ
SS
LesDMBRSIintroduitsdansleChapitre3présententeuxaussiplusieursperspe tivesd'amélioration.
La grandepartie des travauxsera onsa rée àl'amélioration desindi es
S
iδ
entermes de rédu tionde varian e et d'appels au ode de al ul. Le ouplage des estimateurs ave la subset simulation
doitaussiêtreperfe tionné. Uneperturbationbaséesurl'entropiepourraitégalement êtreproposée,
maisdes al ulsplus poussésdoiventêtre menéspour obtenir unesolutiondu problèmede
minimi-sation deladivergen e deKullba k-Leibler. Un autreaxeseraitde hangerlamétrique/divergen e.
Par ailleurs, une autre idée pourraitêtre la prise en ompte des dépendan es entre variables et de
perturber ette dépendan eentre marginalesvia la théoriedes opules.
Des perspe tives plus larges sont à onsidérer, en parti ulier l'utilisation de méthodes
séquen-tielles ouplées ave desméta-modèles (Be tet al. [9℄) està étudier.
Ré emment,Fortetal. [35 ℄ontintroduitdenouveauxindi esdesensibilitépouvantêtre
onsid-érés ommeunegénéralisation desindi esdeSobol'. La notiondefon tion de ontrasteadaptée au
Résumé étendu 5
Contents 11
List of Figures 14
List of Tables 18
Context, obje tives and outline 21
Onnumeri al simulation . . . 21
Un ertaintyquanti ationand sensitivity analysis . . . 21
Stru tural reliability . . . 23
Context: omponent withinnu lear rea tor (CWNR) . . . 24
Obje tives . . . 24
Outline . . . 25
1 State of the art forreliability and sensitivity analysis 27 1.1 Introdu tion . . . 27
1.2 State ofthe art: reliabilityand failureprobabilityestimation te hniques . . . 27
1.2.1 Monte-Carlo methods . . . 28
1.2.2 Stru tural reliability methods . . . 33
1.2.3 Subsetsimulation . . . 36
1.3 Sensitivity analysis(SA) . . . 39
1.3.1 Globalsensitivityanalysis . . . 39
1.3.2 Reliability basedsensivityanalysis . . . 44
1.4 Fun tionalde ompositionof varian e forreliability . . . 45
1.4.1 Firstappli ations . . . 45
1.4.2 Computational methods . . . 47
1.4.3 Reliability test ases . . . 51
1.4.4 Redu ingthe numberoffun tion alls: useofQMC methods . . . 56
1.4.5 Redu ingthe numberoffun tion alls: useof importan e sampling methods 57 1.4.6 Lo alpolynomialestimation for rst-order Sobol' indi es ina reliability on-text . . . 58
1.4.7 Con lusionon Sobol' indi esfor reliability . . . 66
1.5 Moment independent measures for reliability. . . 67
1.5.1 Appli ation inthereliability ase . . . 67
1.5.2 Crude MCestimationof
δ
i
. . . 671.5.4 Useof subset samplingte hniques . . . 68
1.5.5 Hyperplane 6410 test ase . . . 68
1.5.6 Con lusion . . . 69
1.6 Synthesis . . . 69
1.7 Sensivityanalysisfor failureprobabilities (FPs) . . . 70
2 Variable ranking in the reliability ontext 73 2.1 Introdu tion . . . 73
2.2 Using lassi ation trees and random forestsinSA . . . 73
2.2.1 Stateof theartfor lassi ation trees . . . 73
2.2.2 Stabilisation methods . . . 75
2.2.3 Variableimportan e - Sensitivityanalysis . . . 78
2.2.4 Appli ations . . . 80
2.2.5 Dis ussion . . . 85
2.3 Using input umulative distribution fun tion departure asameasure ofimportan e . 88 2.3.1 Introdu tion and reminders . . . 88
2.3.2 Distan es . . . 89
2.3.3 Appli ations . . . 90
2.3.4 Con lusion . . . 104
2.4 Synthesis . . . 104
3 Density Modi ation Based Reliability Sensitivity Indi es 107 3.1 Introdu tion and overview . . . 107
3.2 The indi es: denition, propertiesand estimation . . . 108
3.2.1 Denition . . . 108
3.2.2 Properties . . . 108
3.2.3 Estimation . . . 108
3.2.4 Framework . . . 110
3.3 Methodologiesof inputperturbation . . . 112
3.3.1 Kullba k-Leibler minimization . . . 112
3.3.2 Parameters perturbation . . . 119
3.3.3 Choi eof theperturbation given theobje tives . . . 125
3.4 Numeri al experiments . . . 126
3.4.1 Testingmethodology . . . 126
3.4.2 Hyperplane 6410 test ase . . . 126
3.4.3 Hyperplane 11111test ase . . . 133
3.4.4 Hyperplane with15 variablestest ase . . . 137
3.4.5 Hyperplane withsame importan e and dierent spreadstest ase . . . 141
3.4.6 Tresholded Ishigamifun tion . . . 146
3.4.7 Flood test ase . . . 155
3.5 Improving the DMBRSIestimation . . . 161
3.5.1 Coupling DMBRSIwithimportan e sampling . . . 161
3.5.2 Coupling DMBRSIwithsubset simulation . . . 163
3.6 Dis ussion and on lusion . . . 165
3.6.1 Con lusionon theDMBRSImethod . . . 165
3.6.2 Equivalent perturbation . . . 165
3.6.3 Support perturbation . . . 166
3.6.5 A knoweldgements . . . 166
4 Appli ation to the CWNR ase 167 4.1 Introdu tion . . . 167
4.2 Three variables ase . . . 167
4.2.1 Estimating
P
f
. . . 1684.2.2 SensitivityAnalysis . . . 168
4.3 Fivevariables ase . . . 175
4.3.1 Estimating
P
f
. . . 1754.3.2 SensitivityAnalysis . . . 175
4.4 Seven variables ase . . . 182
4.4.1 Estimating
P
f
. . . 183 4.4.2 SensitivityAnalysis . . . 183 4.5 Con lusion . . . 189 Con lusion 191 Bibliography 195 A Distributionsformulas 203 B Test ases 205 B.1 Hyperplane test ase . . . 205B.2 TresholdedIshigami fun tion . . . 206
B.3 Flood ase . . . 207
C Isoprobabilisti transformations 209 C.1 Presentation of the opulas . . . 209
C.2 Obje tives, Rosenblatt transformation . . . 210
D Appendi es for Chapter 3 211 D.1 Proofsof asymptoti properties . . . 211
Proof ofLemma 3.2.1 . . . 211
Proof ofProposition 3.2.1 . . . 211
D.2 Computation ofLagrange multipliers . . . 212
D.3 Proofsof the NEFproperties . . . 212
1 Un ertaintystudy referen e framework . . . 22
1.1 Spa elling omparison: Sobol'ssequen e (left)anduniform random sampling (right). 29 1.2 2-dimensional illustrationof dire tionalsampling . . . 32
1.3 Illustration ofFORM/SORM . . . 34
1.4 Conditional expe tations for 2variables . . . 46
1.5 Boxplots ofthe estimatedrst orderSobol' indi eswiththeSobol'method . . . 53
1.6 Boxplots ofthe estimatedrst orderSobol' indi eswiththeSaltellimethod . . . 54
1.7 Comparison ofrst order and total indi es, MC(left) andimportan e sampling (right), with
10
4
points for the hyperplane 6410 test ase . . . 591.8 Comparison ofrst order and total indi es, MC(left) andimportan e sampling (right), with
10
3
points for the hyperplane 6410 test ase . . . 601.9 Boxplotof the estimatedFOSIFDfor the 6410 hyperplane ase . . . 62
1.10 Boxplotof the estimatedFOSIFDfor the 11111 hyperplane ase . . . 62
1.11 Boxplotof the estimatedFOSIFDfor the 15 variables hyperplane ase . . . 63
1.12 Boxplot of the estimated FOSIFDfor thesame importan e dierent spread hyperplane ase . . . 64
1.13 Boxplotof the estimatedFOSIFDfor thresholded Ishigami ase . . . 64
1.14 Boxplotof the estimatedFOSIFDfor the ood ase . . . 65
1.15 Example surfa e . . . 66
2.1 Binarytree . . . 76
2.2 Boxplots ofMDA indi es(left)and GIindi es(right)for thehyperplane 6410 test ase. 81 2.3 Boxplots ofMDA indi es(left)and GIindi es(right)for thehyperplane 11111 test ase 82 2.4 Boxplots ofMDA indi esfor the hyperplane 15variables test ase . . . 82
2.5 Boxplots ofGIindi es forthe hyperplane 15 variablestest ase . . . 83
2.6 BoxplotsofMDAindi es(left)andGIindi es(right)forthehyperplanedierentspreads test ase . . . 84
2.7 Boxplots of MDA indi es (left) and GI indi es (right) for thethresholded Ishigami test ase . . . 84
2.8 Boxplots ofMDA indi es(left)and GIindi es(right)for theood test ase . . . 85
2.9 Several .d.f. . . 91
2.10 Hyperplane 6410 test ase, Kolmogorov distan e . . . 92
2.11 Hyperplane 6410 test ase, Cramer-Von Misesdistan e . . . 92
2.12 Hyperplane 6410 test ase, Anderson-Darlingdistan e . . . 93
2.13 Hyperplane 11111test ase, Kolmogorov distan e . . . 94
2.14 Hyperplane 11111test ase, Cramer-Von Misesdistan e . . . 94
2.16 Hyperplane 15 variablestest ase, Kolmogorov distan e . . . 96
2.17 Hyperplane 15 variablestest ase, Cramer-Von Misesdistan e . . . 96
2.18 Hyperplane 15 variablestest ase, Anderson-Darlingdistan e . . . 97
2.19 Hyperplane dierent spread test ase, Kolmogorov distan e . . . 98
2.20 Hyperplane dierent spread test ase, Cramer-Von Misesdistan e. . . 98
2.21 Hyperplane dierent spread test ase, Anderson-Darlingdistan e . . . 99
2.22 Thresholded Ishigami test ase, Kolmogorovdistan e . . . 100
2.23 Thresholded Ishigami test ase, Cramer-Von Misesdistan e . . . 100
2.24 Thresholded Ishigami test ase, Anderson-Darlingdistan e. . . 101
2.25 Flood test ase, Kolmogorovdistan e. . . 102
2.26 Flood test ase, Cramer-Von Misesdistan e . . . 103
2.27 Flood test ase, Anderson-Darling distan e . . . 103
3.1 General DMBRSIframework . . . 111
3.2 Theoriginal densityof mean
0
(full line)andseveral andidatesdensitiesof mean2
. . 1133.3 Mean shifting (left) and varian e shifting (right) for Gaussian (upper) and Uniform (lower) distributions. The original distribution is plotted in solid line, the perturbed one isplotted indashedline. . . 116
3.4 StandardGaussian andperturbeddensity: quantilein rease(left)andquantilede rease (right) . . . 118
3.5 Uniform, Triangleand Trun ated Gumbelpdf: quantilein rease. . . 119
3.6 Originaland perturbed Weibulls pdfs. . . 120
3.7 DMBRSIwithparameters perturbations . . . 122
3.8 Spe i DMBRSIframeworkfor parameters perturbations . . . 124
3.9 Estimated indi es
S
c
iδ
for the 6410 hyperplanefun tion witha meanshifting . . . 1283.10 Estimated indi es
S
d
i,V
f
for hyperplanefun tion witha varian e shifting . . . 1283.11
5
th per entile perturbation on thehyperplane 6410 test ase . . . 1293.12
1
st quartileperturbation onthehyperplane 6410 test ase. . . 1303.13 Medianperturbation onthehyperplane 6410 test ase . . . 130
3.14
3
rd quartileperturbation on thehyperplane 6410 test ase . . . 1313.15
95
th per entile perturbation on thehyperplane 6410 test ase . . . 1313.16 Parameters perturbation on thehyperplane 6410 test ase. Dotsare for means,triangle for thestandard deviations. Green orrespondsto
X
1
,bla ktoX
2
,red toX
3
and blue toX
4
. . . 1323.17 Estimated indi es
S
c
iδ
for the 11111hyperplane fun tionwitha meanshifting . . . 1353.18 Estimated indi es
S
c
iδ
for the 11111hyperplane fun tionwitha varian e shifting. . . 1353.19 Medianperturbation onthehyperplane 11111 test ase . . . 136
3.20 Parameters perturbationonthehyperplane11111 test ase. Dotsareformeans,triangle for thestandard deviations. A dierent olor isused forea h variable. . . 137
3.21 Estimated indi es
S
c
iδ
for the 15 variables hyperplane fun tionwitha meanshifting . . . 1393.22 Estimated indi es
S
c
iδ
for the 15 variables hyperplane fun tionwitha varian e shifting . 140 3.23 Medianperturbation onthe hyperplane with15 variables test ase . . . 1413.24 Parameters perturbation on the 15 variables hyperplane test ase. Dots are for means, triangle for the standard deviations. Bla k is for the rst group of inuen e, red is for these ondand bluefor the third. . . 142
3.25 Estimated indi es
S
c
iδ
for the hyperplanewith dierent spreads asewitha meanshifting 1433.27 Parameters perturbation on the hyperplane with dierent spreads ase. Dots are for
means,trianglefor thestandard deviations. Bla kisfor
X
1
,redisforX
3
andblueisforX
5
.. . . 1453.28 Estimated indi es
S
c
iδ
for the thresholded Ishigamifun tion witha meanshifting . . . . 1473.29 Estimated indi es
S
d
i,V
per
forthe thresholded Ishigami fun tion withavarian e shifting . 149
3.31
1
st
quartileperturbation onthethresholded Ishigami test ase . . . 149
3.30
5
th
per entile perturbation on the thresholdedIshigami test ase . . . 150
3.32 Medianperturbation onthe thresholded Ishigami test ase . . . 150
3.33
3
rd
quartileperturbation on the thresholded Ishigamitest ase . . . 151
3.34
95
th
per entile perturbation on thethresholded Ishigamitest ase . . . 152
3.35 Parameters perturbationonthethresholdedIshigamitest as. Triangles orrespondtoa
minimum bound,dots to a maximum bound.
X
1
is plotted in red,X
2
in bla kandX
3
inblue. . . 153
3.36 Parameters perturbation on thethresholded Ishigami test ase. Triangles orrespond to
aminimumbound,dotstoa maximumbound.
X
1
isplotted inred,X
2
inbla kandX
3
inblue. . . 154
3.37 Estimated indi es
S
c
iδ
for the ood asewitha meanperturbation. . . 1563.38
5
th
per entile perturbation on theood ase . . . 157
3.39
1
st
quartileperturbation on the ood ase . . . 157
3.40 Medianperturbation onthe ood ase . . . 158
3.41
3
rd
quartileperturbation ontheood ase . . . 158
3.42
95
th
per entile perturbation on theood ase . . . 159
3.43 Parameters perturbation on the ood test ase. The indi es orresponding to
Q
areplotted in green: dark green for the lo ation parameter and light green for the s ale
parameter. Theindi es orresponding to
K
s
are plotted asfollows: bla kfor the mean,dark grey for the standard deviation. The indi es of the mode of
Z
v
areplotted in redwhilethe ones orrespondingto themode of
Z
m
areplotted inblue. . . 1604.1 Estimated indi es
S
c
iδ
for the CWNR asewith ameanperturbation - 3variables . . . . 1704.2
5
th
per entile perturbation on theCWNR ase- 3 variables . . . 170
4.3
1
st
quartileperturbation on the CWNR ase- 3 variables . . . 171
4.4 Medianperturbation ontheCWNR ase - 3variables . . . 172
4.5
3
rd
quartileperturbation on theCWNR ase- 3 variables . . . 172
4.6
95
th
per entile perturbation on theCWNR ase- 3 variables . . . 173
4.7 Parameters perturbation on the CNWR ase- 3 variables . . . 174
4.8 Estimated indi es
S
c
iδ
for the CWNR asewith ameanperturbation - 5variables . . . . 1774.9
5
th
per entile perturbation on theCWNR ase- 5 variables . . . 178
4.10
1
st
quartileperturbation on the CWNR ase- 5 variables . . . 178
4.11 Medianperturbation ontheCWNR ase- 5 variables . . . 179
4.12
3
rd
quartileperturbation on theCWNR ase- 5 variables . . . 180
4.13
95
th
per entile perturbation on theCWNR ase- 5 variables . . . 180
4.14 Parameters perturbation on the CNWR ase- 5 variables . . . 182
4.15 Estimated indi es
S
c
iδ
for the CWNR asewith ameanperturbation - 7variables . . . . 1844.16
5
th
per entile perturbation on theCWNR ase- 7 variables . . . 185
4.17
1
st
quartileperturbation on the CWNR ase- 7 variables . . . 185
4.18 Medianperturbation ontheCWNR ase- 7 variables . . . 186
4.19
3
rd
quartileperturbation on theCWNR ase- 7 variables . . . 186
4.20
95
th
4.21 Parameters perturbation on theCNWR ase- 7 variables . . . 188
1 Distributionsof the random physi al variables oftheCWNRmodel. . . 24
1.1 Sobolindi esfor therstfailure re tangle . . . 46
1.2 Sobolindi esfor these ond failurere tangle. . . 47
1.3 First orderSobol'indi es for the hyperplane 6410 ase . . . 53
1.4 Estimated Sobol'indi es for thehyperplane 6410 ase . . . 53
1.5 Estimated Sobol'indi es for the hyperplane 11111 ase . . . 54
1.6 Estimated Sobol'indi es for thehyperplane 15 variables ase . . . 55
1.7 Estimated Sobol'indi es for thehyperplane dierent spreads ase . . . 55
1.8 Sobol'indi es estimationfor thethresholded Ishigami fun tion . . . 55
1.9 Estimated Sobol'indi es for the ood ase . . . 56
1.10
4
dimensionalpointsgenerated through Sobol' sequen e . . . 571.11 Estimationof Sobolindi esusing QMCfor the6410 hyperplane test ase . . . 57
1.12 True values of
δ
i
for thehyperplane 6410 ase . . . 691.13 Synthesison thetested SA methods . . . 70
1.14 Corresponden ebetween the general SA obje tivesand theengineers' motivations. . . . 71
2.1 Dataset . . . 75
2.2 Confusionmatrix of theforest withdefaultparameters . . . 85
2.3 MDAindi es ofthe forest withdefault parameters . . . 86
2.4 Confusionmatrix of theforest withdierent weights . . . 86
2.5 MDAindi es oftheforest withdierent weights. . . 86
2.6 Confusionmatrix of the forest with
2000
trees . . . 862.7 MDAindi es ofthe forest with
2000
trees . . . 872.8 Confusionmatrix of the forest built onan ISsample . . . 87
2.9 MDAindi es oftheforest built on anIS sample. . . 87
2.10 Synthesison thepresentedSA methods . . . 105
3.1 Hellingerdistan einfun tion of theparameterperturbation . . . 122
3.2 Type ofperturbation re ommended giventheobje tive orthe motivation . . . 126
3.3 Importan e fa torsfor hyperplane 6410 fun tion . . . 127
3.4 Estimated Sobol'indi es for thehyperplane 6410 ase . . . 127
3.5 Hellingerdistan einfun tionoftheparameterperturbation. Therstvalueisanin rease of the parameter (right hand of the graph) whereas the se ond is a de rease of the parameter (lefthand of thegraph). Both perturbationlead to thesame
H
2
departure. . 1323.6 Importan e fa torsfor hyperplane 11111 fun tion . . . 133
3.7 Estimated Sobol'indi es for thehyperplane 11111 ase . . . 134
3.8 Importan e fa torsfor thehyperplane 15 variables . . . 138
3.10 Importan e fa torsfor hyperplane withdierent spreads fun tion . . . 142
3.11 Estimated Sobol'indi es for the hyperplane withdierent spreads ase . . . 143
3.12 Hellingerdistan einfun tion of theparameterperturbation . . . 145
3.13 Importan e fa torsfor Ishigamifun tion . . . 146
3.14 Sobol'indi es estimationfor thethresholded Ishigami fun tion . . . 146
3.15 Hellingerdistan einfun tion of theparameterperturbation . . . 154
3.16 Importan e fa torsfor theood ase . . . 155
3.17 Estimated Sobol'indi es for theood ase . . . 155
3.18 Hellingerdistan einfun tion of theparameterperturbation . . . 161
4.1 Distributionsof therandom physi al variables oftheCWNRmodel -3 variables . . . . 168
4.2 MDAindex - 3 variables . . . 168
4.3 Giniimportan e -3 variables . . . 169
4.4 Confusion matrixof theforest -3 variables . . . 169
4.5 Distributionsof the random physi al variables oftheCWNRmodel -5 variables . . . . 175
4.6 MDAindex - 5 variables . . . 176
4.7 Giniimportan e -5 variables . . . 176
4.8 Confusionmatrix of the forest -5 variables . . . 176
4.9 Distributionsof therandom physi al variables oftheCWNRmodel -7 variables . . . . 182
A.1 Distributionsof therandom physi al variables taken for theCWNRmodels. . . 203
On omputer experiments
Numeri alsimulationisthepro essthatallowstoreprodu eaphysi alphenomenonwitha omputer.
This phenomenon is represented via a mathemati al model, and this model is solved during a
omputation time.
Thenumeri al simulation an be ostly, due to the timeneeded to prepare theset of inputs or
to the possibly large number of al ulations needed. Moreover, the result of the simulation may
be un ertain, thus this s ienti topi is often referred to as numeri al experiments. The use of
simulationin on eptionand safetyofanindustrial systemequipment - twoappli ativedomains of
interest inthisthesis - hasgrownoverthelast de ades.
Un ertainty quanti ation and sensitivity analysis
Webrieypresentthegeneralframeworkofourwork: thestudyofadeterministi numeri almodel.
Asexplained before,a modelis amathemati al representation ofa omplex physi al phenomenon.
Thismodelre eivesinputs andprodu esoutputs(orresponses). Forthesakeofsimpli ity,these
quantities will be onsidered ass alar and ontinuous but other types ould be onsidered, modal
for instan e. Given a ertain input value, the modelprodu es a ertain output after omputation.
Thedeterministi frameworkis onsideredhere,thatistosaythatagivensetofinputvaluesalways
produ es thesameoutput values.
Consider the quantity of interest. It might be possible that theexperimenter is interested in a
quantity dened from one or several outputs. It is therefore of outmost importan e to rst dene
aboveall study the quantityof interest.
Someparameters (su h asphysi al values) arenot pre isely hara terized due to a la kof data
or variability for instan e, therefore these parameters an be seen as random variables. Some
other inputs will be onsidered as known and modelled by deterministi values. Let us denote
X
= (X
1
, ...X
d
)
thed
−
dimensional random ve tor (with known densityf
X
) of random (s alar)input variables of the numeri al model. Let us also denote by
t
thep
-dimensional ve tor ofde-terministi input. Let us onsider without loss of generality, a single output
Y
∈ R
dened asY = G(X, t)
whereG
is the deterministi model. The quantity of interest isZ
or a fun tion ofit. In the following, we will denote
Y = G(X)
. Also, it is important to noti e that in the wholethesis, independent inputs will be onsidered, althoughthe study ofmodels with dependent inputs
is amajor eldofresear h.
Figure 1 summarizes the referen e framework for un ertainty treatment (de Ro quigny et al.
Figure1: Un ertainty studyreferen e framework
Step A, problem spe i ation: the obje tives are dened, as well as the model used, the
quantityof interestand the inputvariables (someofwhi h are onsidered un ertain).
Step B, quanti ation of un ertainty sour es: the input variables onsidered un ertain are
modelled byrandomdistributions. Thisstepisdone ollaborating withexpertsand olle ting
datapoints.
StepC, propagation ofun ertainty sour es: thequantity ofinterest isevaluated a ordingto
theun ertainty ontheinput variables dened instepB.
StepC',sensitivityanalysis: therelativeun ertainty ontributionofea hinputontheoutput's
un ertaintyis evaluated.
The generi ness allows this framework to address numerous problems. This thesis will mainly
fo- uses on StepC',even ifthis step annoteasily beseparated fromStepC.
Sensitivityanalysis(SA)isdened bySaltelliet al. [89℄asthestudy ofhowtheun ertaintyin
theoutputofamodel anbeapportionedtodierent sour esofun ertainty inthemodelinput. It
maybe usedto determinethemost ontributing inputvariables toanoutputbehaviour. It analso
be usedto determine non-inuential inputs,or as ertain some intera tion ee tswithin themodel.
The obje tives of SA are numerous; one an mention model understanding, model simplifying or
fa tor prioritisation.
There are many appli ation examples, for instan e Makowski et al. [67 ℄ analyse, for a rop
In nu lear engineering eld, Auder et al. [5 ℄ study the inuential inputs on thermohydrauli al
phenomena o urringduring an a idental s enario, whileIoosset al. [50 ℄ andVolkova et al. [100℄
onsider theenvironmental assessment of industrialfa ilities.
Thersthistori alapproa htosensitivityanalysisisknownasthelo alapproa h. Theimpa tof
small perturbationsoftheinputs ontheoutput isstudied. Thesesmallperturbationso uraround
nominal values (the mean of a random variable for instan e). This is a ounterpart to the partial
derivativesof the modelin ertainpointsoftheinput spa e. Mostof these methods (someof them
will be itemized in se tion 1.3.2) make strong assumptions on the modeland/or on theinputs (in
terms oflinearity,normality, ...).
A se ond approa h, more re ent due to the development of omputational power is known as
theglobal approa h. Thewhole variation range oftheinputs istherein onsidered. An appli ative
introdu tion an be found in Iooss [49 ℄. Most te hniques (someof them will be dened in se tion
1.3.1 and tested in se tions 1.4 and 1.5) are developed in an independent approa h (model free),
without makingassumptions su h aslinearity or monotony.
Stru tural reliability
Consider theindustrial problemof knowing ifa stru ture,subje tto physi al loads or onstraints,
goes undamaged or goes to a state of failure. This will be referred as stru tural reliability. A
trial and measures approa h might be possible, but an be di ult to manage for safety or osts
reason. Within this ontext, omputer models are used in order to assess the safety of omplex
systems. These models are then used as an approximate representation of the reality, in luding
some me hanisms su h asaw propagation, fri tionlaws...
In order to ompletely use the model, un ertainties on the model inputs (essentially physi al
values)aremodelled byrandom variables. Themodel isthereforerepresentingthe stru turegifted
with a ertain toughness and the environment providing a load. Computation for a xed set of
inputs allows to obtain a failure riterion leading to a binary response: for this set of inputs, the
stru ture failsor behaves soundly.
Thefa tthatun ertainties aremodelledbyrandom variablesenables riskmodellingasafailure
probability. This approa h is more subtle than a deterministi approa h where inputs arexed to
nominal values (generally penalized).
Oneisinterestedinthefa tthatthe value
Y
∈ R
givenbythefailurefun tionG
issmallerthana given threshold
k
(usually0): it isthefailure riterion. Thestru ture is failingfor agiven set ofinput
x
ify = G(x)
≤ 0
,wherex
= (x
1
, ..., x
d
)
∈ R
d
isarealizationof
X
. Thepartofspa einwhi hthis event o urs is alledfailure domain,denoted
D
f
. Thesurfa e dened by{x ∈ R
d
, G(x) = 0
}
is alledlimit-statesurfa e. Theprobabilityforthe eventtoo urisdenoted
P
f
,failureprobability.One has:
P
f
=
P(G(X) ≤ 0)
(1)=
D
f
f
X
(x)dx
(2)=
R
d
1
G(x)≤0
f
X
(x)dx
(3)=
E[1
G(X)≤0
]
(4)The omplexity of models and the possible great number of inputs make di ult, in a general
ase, to ompute the exa tvalueof
P
f
.
However, it an beestimated(sin ewritten under theformofamathemati alexpe tation)withthehelpofseveralmethods thatwillbeitemized inse tion1.2.
Theprimer ofstru tural safetyisto provide anestimationof
P
f
andsome un ertainty surroundingthisestimation. It anbeusedtoanswertheoriginalquestionofthestru turesupporting theloads.
Context: omponent within nu lear rea tor (CWNR)
This ase-study provided the initial motivation for this work. It fo uses on the reliability and risk
analysisof anu lear powerplant omponent. Howevertheresults ofthis thesismustbe onsidered
as textbook exer ises, whi h an not be used to draw on lusions about the integrity or safety
assessmentof nu lear powerplants.
During the normal operation of a nu lear power plant, the omponent within nu lear rea tor
(CWNR) isexposedtoageingme hanisms. Inorderto assesstheintegrityofthe omponent,ithas
been demonstrated thata postulated manufa turingaw an withstand severeme hani al loads.
The CWNR me hani al model in ludes three parts. Firstly, a simplied representation of the
loading event,whi hanalyti allydes ribesasfun tionsofthetime,thetemperature
T
,thepressureand theheattransfer oe ient between theenvironment and thesurfa e oftheCWNR. Se ondly,
a thermo-me hani al model ofthe CWNRthi kness, in orporating theCWNRmaterial properties
depending on the temperature. Lastly, an integrity model allowing to evaluate the no ivity of a
manufa turing aw, in luding dierent variables: (a) a variable,
h
, summarizing the dimension ofthe aw, (b) a stress intensity fa tor, ( ) the toughnessdepending on the temperature at theaw
andthelevelofdeterioration,whosedis repan ywithoperationtimeisevaluatedwithsome odied
fore astingformulas. Inpra ti e, themodellingofthe CWNRmayassignprobabilisti distributions
tosomephysi alsour esofun ertainty. Inthismanus ript,amaximumof7inputphysi alvariables
will be onsidered as random. Table 1 summarizes the distributions of the independent physi al
random inputs ofthe CWNRmodel. Table A.1isa reminder oftheinputs' densities.
Randomvar. Distribution Parameters
Thi kness (m) Uniform
a = 0.0075
,b = 0.009
h
(m) Weibulla = 0.02
, s ale= 0.00309
, shape= 1.8
Ratioheight/length Lognormal
a = 0.02
,ln (µ) =
−1.53
,ln (σ) = 0.55
Azimuth aw (°) Uniform
a = 0
,b = 360
Altitude (mm) Uniform
a =
−5096
,b =
−1438
σ∆T T
Gaussianµ = 0
,σ = 1
σRes
Gaussianµ = 0
,σ = 1
Table1: Distributionsof the random physi al variables oftheCWNRmodel.
Also,forthe numeri alappli ationsovertheCWNRmodel,therandominputwillbe onsidered
as 3, 5 or 7 dimensional and will respe tively orrespond to the 3, 5 and 7 rst random variables
presentedinTable 1.
Obje tives
Theaimofthisdissertationisthedevelopmentofsensitivityanalysiste hniqueswhenthequantityof
berelatedtotheestimationof
P
f
andmustprovideanestimationoftheerrormadewhenestimatingsensitivityindi esaswell asan estimationof theerror madewhen estimating
P
f
.Outline
The following thesis isorganised infour hapters.
Therst hapterisanoverviewofbothexistingstrategiesforestimatingfailureprobabilities and
methodsofsensitivityanalysis. Inthis hapter,statesoftheartforreliabilityandsensitivityanalysis
(SA) te hniques will be separately developed. More pre isely, three main families of reliability
te hniques will be studied: Monte-Carlo methods, stru tural reliability methods and sequential
Monte-Carlomethods. Finally,twofamiliesofwell-knownsensitivityanalysiste hniqueswillbeput
to the proof on reliability test ases (whi h are itemized in Appendix B). These te hniques show
some limitations, onrming the need to develop SA methods fo used on failure probabilities. A
table(Table1.13)summarizingthepresentedmethodsisproposed,andadis ussiononthemeaning
of sensitivityanalysis inthe reliability ontext is ondu ted.
The se ond hapter fo uses on dening measures of sensitivity in order to produ e a variable
ranking. More spe i ally, theuse of random forests on a Monte-Carlo sample is proposed in the
rst pla e. Two importan e measures derivedfrom the random forests predi tors aretested on the
usual ases. In the se ond pla e, a te hnique using a sample produ ed bysequential Monte-Carlo
methods is eli ited. This last method isbased on the departure between themarginal distribution
of aninput andits equivalent given thestepof the subset method.
The third hapter presents an original method to estimate theimportan e of ea h variable on
a failureprobability. Thismethod fo uses on the impa t of perturbations upon theoriginal input
densities
f
i
. A general framework deningappropriate perturbationsiselaborated, thensensitivityindi es are presented. An estimation te hnique of these indi es that makes no further allsto the
modelisgiven. Themethodology isthentested on the usual ases.
Thefourth hapterpresentstheappli ationofthedevelopedmethodstotheCWNR ase. Several
tuningswillbestudiedtoassessorinrmtheabilityofthedierentSAmethodstoidentifyinuential
State of the art for reliability and
sensitivity analysis
1.1 Introdu tion
Theoutlineofthe hapteristhefollowing: inSe tion1.2,astateoftheartforreliabilityisproposed.
Several te hniques for estimating failure probabilities arepresented. Then inSe tion 1.3, a review
of Sensitivity Analysis (SA) is given. The appli ation of a well-known SA method, Sobol' indi es
(1.3.1.3) ona failureprobability, istested onnumerousappli ation ases inSe tion 1.4. InSe tion
1.5, theso- alled momentindependent sensitivity measures (presentedinSe tion 1.3.1.4)aretested
within the reliability ontext. Next, Se tion 1.6 proposes a synthesis of these states of the art.
Finally, Se tion 1.7 dis usses themeaning and obje tives of sensitivityanalysis when dealing with
failureprobabilities.
1.2 State of the art: reliability and failure probability estimation
te hniques
This state of the art for reliability is widelyinspired by the PhD thesis of Gille-Genest [41℄,
Can-naméla [22 ℄ (in Fren h) and Dubourg[33℄ (in English). Inaddition, monographsbyMadsen et al.
[66℄ andLemaire[60℄havebeen used. Inthisse tion,astateoftheartfortheestimationte hniques
of failureprobabilities is detailed. Choi e issetto present 3families ofmethods.
Monte-Carlo(MC) simulation methods: these te hniques are standard instatisti s. The MC
methods are used to estimate an expe tation. These are based upon an appli ation of the
Strong Law of Large Numbers for estimation and on the Limit Central Theorem for error
ontrol. Severalvarian e-redu tion te hniquesareavailableintheliterature. Themost
appro-priate of themwill beitemised in1.2.1.
Reliability methods: histori ally these methods ome from me hani al engineering. They
provide answers based upon a linear (FORM) or quadrati (SORM) approximation of the
failuresurfa e. Thisapproximation isthenused to estimatethefailure probability. Asfar as
we know, error ontrol isnot easily made. Thesemethods arepresentedin1.2.2.
Subset simulation methods: sometimes also referred as parti le methods, sequential MC or
splittingte hniques, these methodshave been more re ently developed. Theyarebasedupon
are easier to estimate. These estimations are made running a large number of Monte-Carlo
MarkovChains (MCMC). Somete hniques willbe presentedin1.2.3.
However, thepartition must be qualied. Inpra ti e, methods an be asso iated; for instan eone
an rst useFORMnumeri al approximation, then perform some importan e sampling aroundthe
most probable failingpoint. In the same way,most ofMunoz-Zuniga's works[72 ℄ are devotedto a
stratiedsamplingte hnique(MCvarian e-redu tionmethod) ombinedwithdire tionalsimulation.
1.2.1 Monte-Carlo methods
Thesemethods allowthe estimation ofan expe tation ofform:
I =
E[ϕ(X)]
(1.1)or on theintegralform:
I =
E
ϕ(x)f
X
(x)dx
(1.2)where
ϕ(.)
is a fun tion fromE
⊂ R
d
→ R
and
X
is ad
−
dimensional random ve tor (with knowndensity
f
X
). In areliabilityframework,the fun tionϕ(.)
is writtenasan indi ator,1
G(X)≤k
.1.2.1.1 Crude Monde-Carlo method
Presentation of the estimator The main ideaof this methodis to generate a large number of
i.i.d. ve tors with density
f
X
, then to estimateI
with the empiri al mean of theN
values. TheStrong Law ofLarge Numbersallowsto getan unbiased estimator of
I
.ˆ
I =
1
N
N
X
i=1
ϕ(x
i
)
(1.3)withgiven
N
andwherex
i
arei.i.d with
f
X
. Inthereliability ase, anunbiased estimatorofP
f
is:b
P =
1
N
N
X
i=1
1
{G(x
i
)≤k}
(1.4)The varian e of the estimatorof
E[ϕ(X)]
is:Var
[ ˆ
I] =
1
N
Var[ϕ(X)]
(1.5)and it an beestimatedby:
d
Var[ ˆ
I] =
1
N
− 1
"
1
N
N
X
i=1
ϕ
2
(x
i
)
− ˆ
I
2
#
(1.6)When
ϕ(.)
is anindi ator fun tion,asusual instru tural reliabilitystudies, asimplied expressionan beobtained:
Var
[ ˆ
P ] =
1
N
P
f
(1
− P
f
).
(1.7)Its lassi al estimatoris:
d
Var
[ ˆ
P ] =
1
N
P (1
b
− b
P )
(1.8)Figure1.1: Spa elling omparison: Sobol'ssequen e(left)and uniformrandomsampling (right).
Advantages and drawba ks of the MC method This method makes no hypothesis on the
regularity of
ϕ(.)
. The produ ed estimator is unbiased. Conden e intervals an be obtain aroundthe estimator, whi h are useful to quantify the pre ision of the latter. Furthermore, quality of the
estimation onlydependsonthesamplesize. ThismeansthattheMCmethodisindependent ofthe
dimension of the problem, unlikeother integration methods.
However, this te hnique needs a fair number of fun tion alls to rea h su ient pre ision.
A - ording to therule ofthumb, to obtaina variation oe ient of
10%
on a10
−k
failure probability,
N = 10
k+2
simulations are needed. This an be unrealisti in some appli ations when dealing
with very low failureprobabilities (
< 10
−6
). Furthermore, omputer models an be omplex and
time- onsuming.
Varian e-redu tion The varian e ofthe estimator de reases inVar
[ϕ(X)]/N
. Therefore alargesample is needed to get a good estimation. Varian e-redu tion te hniques onsist in redu ing the
un ertainty involved by the numeri al integration te hnique, thus diminishing u tuations of
esti-mations aroundthe sear hed value.
In the referen e books (see Rubinstein [85℄), numerous varian e-redu tion te hniques an be
found. In a reliability ontext, su h methods are based on fo using the exploration of the sample
spa earoundthelimitstate(ie,thefailure)surfa e. Inthefollowing,wepresentthreemainmethods.
1.2.1.2 Quasi Monte-Carlo Methods
Presentation ofthe method TheideabeneathQuasiMonte-Carlo(QMC)methodistorepla e
the random sampling by quasi-random sequen es. These are deterministi sequen es having good
equirepartition properties. Thesesequen es are alled low-dis repan y sequen es, or quasi-random
sequen es. Loosely speaking, dis repan y isa measure of departure from the uniform distribution.
Thereexistanumberofdierentdenitions(
L
∞
, L
2
,
modied
L
2
, . . .
). Examplesofpseudo-random
sequen es as well as theoreti al developments are given in Niederreiter [75 ℄. Figure 1.1 displays a
two-dimensional example ofbetter spa e llingbyalow-dis repan ysequen e(Sobol'ssequen e),
QMCestimationofthedesiredquantityisobtainedsubstitutingintheMCestimatortherandom
samplesbythepseudo-randomsamples. However,itisnotpossibletoobtainavarian eestimationof
theQMC estimator. Koksma-Hlakwa's inequalityallowsto bound theerror madewhenintegrating
withQMC method,dependingon the hosen sequen eand on
ϕ(.)
's regularity.Reliability ase QMC methods are not well adapted for stru tural reliability. The main issue
whenestimatingsmallfailureprobabilitiesbyMCistogetextreme samples(withinthedistribution
tail) leading to the failure event, rather than getting evenly distributed samples. However, these
methods will be applied in Se tion 1.4 to de rease the number of fun tion alls when estimating
Sobol' indi es(whi h aredened inSe tion 1.3.1.3).
1.2.1.3 Importan e sampling
Presentation of the method Thebasi idea ofimportan e samplingis to modifythesampling
density. Theestimatoris thenobtained by in ludinga densityratio. Theaim isto foster sampling
insigni antregions. Inareliability ontext,thisissimplyin reasingthenumberoffailuresamples.
Let us denote
f
˜
X
a density sele ted by the pra titioner. It will be referred to as the instrumentaldensity. The problemrewrites asfollows:
I =
E
ϕ(x)f
X
(x)dx
(1.9)=
E
ϕ(x)
f
X
(x)
f
X
˜
(x)
f
X
˜
(x)dx
(1.10)=
E
X
˜
ϕ (X)
f
X
(x)
f
X
˜
(x)
(1.11) whereE
˜
X
is the expe tation whenX
isof densityf
˜
X
. The estimationis thenmadeby:ˆ
I
IS
=
1
N
N
X
i=1
ϕ(x
i
)
f
X
(x
i
)
f
X
˜
(x
i
)
(1.12) wherex
i
arei.i.dwith density
f
˜
X
. One analso getthevarian e oftheestimator:Var
( ˆ
I
IS
) =
1
N
Var˜
X
ϕ(X)
f
X
(X)
f
X
˜
(X)
(1.13) where Var˜
X
isthe varian ewhenX
follows densityf
˜
X
. Itshould be noti edthatthesupportoff
˜
X
must be in luded withinthe support ofthe initial density
f
X
. Otherwise,theestimator isbiased.Thiste hniquedoesnot onsistentlyprovide avarian eredu tion. Agiveninstrumentaldensity
f
X
˜
usefulonly if:Var
˜
X
ϕ(X)
f
X
(X)
f
X
˜
(X)
<
VarX
[ϕ(X)]
(1.14)Minimal varian e isobtained withthe following optimaldensity:
f
X
∗
(x) =
|ϕ(x)|f
X
(x)
|ϕ(y)|f
X
(y)dy
(1.15)
However,thedenominator onthe latterisdi ult to estimateasit boilsdownto
I
inthe aseof apositivefun tion