• Aucun résultat trouvé

Exploration du modèle du métabolisme cellulaire par une analyse de sensibilité globale

N/A
N/A
Protected

Academic year: 2021

Partager "Exploration du modèle du métabolisme cellulaire par une analyse de sensibilité globale"

Copied!
61
0
0

Texte intégral

(1)

HAL Id: hal-01210649

https://hal.archives-ouvertes.fr/hal-01210649

Submitted on 5 Jun 2020

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

une analyse de sensibilité globale

Marie Cazenave

To cite this version:

Marie Cazenave. Exploration du modèle du métabolisme cellulaire par une analyse de sensibilité globale. 2014, pp.57. �hal-01210649�

(2)

INRA de Saint-Gilles (35)

Marie CAZENAVE

Université de Rennes 1 - M1 Modélisation - CSA 2013 / 2014

Exploration du modèle du métabolisme

cellulaire par une Analyse de Sensibilité globale

Objectifs du stage :

+ Étude analytique du modèle

+ Analyse de Sensibilité globale du modèle

Stage du 22 Avril au 21 Juillet 2014

Maître de stage : Mme Masoomeh TAGHIPOOR Tuteurs : M. Eric DARRIGRAND

M. Fabrice MAHE

(3)
(4)

Remerciements

Je tiens tout d’abord à remercier l’ensemble des personnes qui m’ont permis d’avoir les bases essentielles pour réaliser ce stage.

Je remercie Monsieur Patrick HERPIN de m’avoir accueillie au sein de l’Institut National de Recherche Agronomique de Saint-Gilles afin que je puisse réaliser mon stage de fin d’année de trois mois.

Je souhaite remercier Monsieur Jaap VANMILGEN, responsable de l’unité Physiologie, Environnement et Génétique pour l’Animal et les Systèmes d’Élevage ainsi que Madame Florence GONDRET, responsable de l’équipe physiologie et métabolisme de la croissance, pour m’avoir fait confiance.

Je tiens également à adresser mes remerciements à Madame Masoomeh TAGHIPOOR, ma maître de stage, pour son aide, son soutien et l’intérêt qu’elle a porté à mon stage.

Je tiens à dire un grand MERCI à tous mes collègues du bureau des stagiaires, Clémence, Thomas, Sa- muel et Maude pour leur accueil chaleureux, leur gentillesse et leurs précieux conseils.

Sans oublier, Monsieur Fabrice MAHÉ et Monsieur Éric DARRIGRAND qui ont répondu à toutes mes questions durant ces trois mois de stage.

(5)

Table des matières

1 Introduction 2

2 Description du modèle 4

3 Étude des points d’équilibre 5

3.1 Matrice stœchiométrique . . . . 5

3.2 Flux à l’état d’équilibre . . . . 7

3.3 Étude de la stabilité des points d’équilibres . . . . 10

4 Analyse de sensibilité 12 4.1 Plan d’expériences et d’échantillonnage . . . . 12

4.1.1 Notations et vocabulaire . . . . 13

4.1.2 Plans multifactoriels . . . . 13

4.1.3 Critères de remplissage de l’espace et optimisation . . . . 14

4.2 Analyse de sensibilité quantitative : quelles approches ? . . . . 15

4.3 Étapes de l’analyse de sensibilité . . . . 16

4.4 Calcul des indices de sensibilité . . . . 17

4.4.1 Analyse de la variance (ANOVA) . . . . 17

4.4.2 Indices de Sobol . . . . 18

4.5 Application au modèle . . . . 18

4.5.1 Étape 1 : Définitions des gammes . . . . 18

4.5.2 Étape 2.a : Choix de la méthode pour le plan d’échantillonnage . . . . 19

4.5.3 Étape 2.b : Méthode de Sobol-Saltelli pour le plan d’expérience . . . . 19

4.5.4 Étape 3 : Sortie du modèle . . . . 20

4.5.5 Étape 4 : Calcul des indices de sensibilité . . . . 20

4.6 Résultats . . . . 21

4.6.1 Glycogène . . . . 21

4.6.2 Glucose-6-Phosphate (G6P) . . . . 22

4.6.3 Citrate . . . . 23

4.6.4 Palmitate . . . . 24

4.6.5 Énergie . . . . 25

5 Analyse de sensibilité dynamique 26 5.1 Glycogène . . . . 26

5.2 Glucose-6-Phosphate . . . . 30

5.3 Citrate . . . . 34

5.4 Palmitate . . . . 38

5.5 Énergie . . . . 42

6 Conclusion 46 A Équations des réactions biochimiques 47 B Équations du modèle 49 C Équations des flux 50 D Conditions Initiales 51 E Liste de tous les paramètres du modèle 51 F Fonctions simplificatrices utilisées dans ce modèle 52 F.1 Fonctions indic.m et periodic.m . . . . 52

F.2 Fonction deMichaelis-Menten . . . . 53

F.3 Fonction de régulation A . . . . 53

F.4 Fonction de régulation B . . . . 54

G Gammes des paramètres 55

(6)

1 Introduction

A l’issue de la première année de Master Modélisation spécialité Calcul scientifique et applications de l’Université de Rennes 1, un stage de validation de deux mois ou plus doit être effectué afin de mettre en pratique l’enseignement reçu au cours de cette période. Affectionnant tout particulièrement l’application des mathématiques en biologie, j’ai choisi de réaliser ce stage au sein de l’unité Physiologie, Environne- ment et Génétique pour l’Animal et les Systèmes d’Élevage (PEGASE) de l’INRA de Saint-Gilles. Mes attentes, en intégrant cette unité, étaient de pouvoir mettre en pratique la théorie acquise lors mon cursus universitaire, avec la volonté de rassembler le maximum de mes connaissances acquises durant la totalité de mes études afin d’en faire profiter l’unité. Et enfin, je souhaitais participer à un projet collectif afin d’en- richir mes connaissances et développer mes compétences en puisant dans la culture professionnelle de chacun.

La composition biochimique et les métabolismes tissulaires sont des éléments clés dans l’adaptation in- dividuelle et participent à l’efficience des productions animales (échelle macroscopique). En effet, l’énergie apportée par l’aliment peut être utilisée par la cellule (échelle microscopique) pour son fonctionnement quo- tidien mais peut être aussi (transitoirement ou pas) mise en réserve, notamment sous forme de glycogène ou de lipides. Ces réserves permettent à l’animal de gérer la discontinuité dans l’apport de nutriments par rapport aux besoins énergétiques. Néanmoins, le coût métabolique associé est non négligeable.

L’objectif est de comprendre la plasticité des réserves énergétiques chez l’animal en croissance, et en parti- culier les équilibres complexes entre stocks de glycogène et de lipides tissulaires.

Dans ce but, un modèle du métabolisme de la cellule a été réalisé après un long travail de mise en commun des connaissances et compétences des scientifiques dans plusieurs domaines. Une cellule ou un tissu (ensemble plus ou moins hétérogène de cellules) peut être considéré(e) comme un système dont le fonctionnement concerté dépend des entités en présence et des interactions qui les lient. Il a été proposé de développer un modèle dynamique générique visant à intégrer les connaissances stœchiométriques et les régulations sur les voies biochimiques cellulaires.

Le modèle est constitué d’un système d’équations différentielles ordinaires de production et de consommation de nutriments afin d’illustrer le métabolisme cellulaire. Chaque équation représente une réaction biochimique unique ou rassemble les transformations successives de plusieurs métabolites intermédiaires lorsque chacune d’entre elles n’est pas soumise à une régulation essentielle pour le phénomène modélisé. La vitesse de ces réactions est régulée principalement par l’activité de l’enzyme impliquée dans la réaction.

Afin d’étudier le comportement ce modèle dynamique, nous procéderons en deux temps. Tout d’abord une étude analytique sera réalisée. Cette étude théorique aura pour objectif de trouver les points d’équilibre du modèle ainsi qu’étudier leur stabilité. En effet, tout être vivant ne peut vivre que provisoirement dans un état instable. L’organisme a besoin d’être dans un état stable pour évoluer et fonctionner correctement. Ainsi, par exemple, chaque prise de nourriture constitue un état instable faisant intervenir nombre de réactions afin de stabiliser l’organisme.

Les équations utilisées dans le modèle mettent en jeu de nombreux paramètres (vitesses de réaction, constantes d’affinité, valeurs seuils, conditions initiales...). C’est pourquoi, dans un second temps, une analyse de sensi- bilité statique globale puis dynamique sera effectuée afin d’explorer le modèle. Elle permettra de comprendre l’influence des différents facteurs étudiés sur la variance des sorties du modèle. Grâce à cette analyse, une hiérarchisation des paramètres sera possible. Le but à terme, qui dépasse le cadre de ce stage, est une esti- mation de ces paramètres qui pourra conduire par la suite à l’obtention d’un modèle prédictif. Afin de mieux comprendre l’enjeu de mon stage, le schéma suivant récapitule les objectifs de l’étude du modèle dynamique et précise comment les atteindre.

(7)

Figure 1 – Schéma descriptif des étapes à suivre pour faire un modèle mathématique - La boîte en pointillée montre l’objectif de ce stage

(8)

2 Description du modèle

Les cellules sont de "petites usines" dans lesquelles se déroulent de nombreuses réactions chimiques. Des molécules sont fabriquées et d’autres sont dégradées. Ces réactions chimiques permettent la reproduction et la croissance des êtres vivants. On appelle métabolisme l’ensemble de ces réactions chimiques. Il consiste à fabriquer des molécules organiques à partir d’autres molécules organiques prélevées dans l’environnement (i.e. alimentation). Les molécules de départ peuvent aussi avoir été, auparavant, fabriquées par la cellule.

Le métabolisme cellulaire est donc caractérisé par un réseau complexe d’interactions entre les flux biochi- miques, les composés métaboliques et les interactions régulatrices. Il est associé au phénomène de respiration cellulaire. Cette dernière se déroule dans les mitochondries et permet aux cellules de produire l’énergie indis- pensable à la synthèse des molécules organiques. La première phase de la respiration cellulaire correspond à la destruction de molécules de glucose (i.e. glucides provenant de l’alimentation) en molécules plus simples, sous l’action de multiples enzymes. C’est ce qu’on appelle la Glycolyse. Le modèle étudié est notamment l’illustration de ce phénomène. Il décrit la flexibilité métabolique à l’échelle d’une cellule générique.

Il s’agit d’un modèle adimensionné : le système a été divisé par le paramètre maximum de masse dans la cellule, noté Mass et vaut 100 ng. Ainsi, toutes les variables et tous les paramètres du modèle sont adimen- sionnés. Sixune variable adimensionnée du modèle, alors x0 =x·Mass est la variable non adimensionnée et représente la quantité de substat dans la cellule.

Le modèle est constitué de quinze équations composées de nombreux paramètres. Les réactions biochimiques ainsi que les équations du modèle sont répertoriées respectivement en Annexe A et B. La liste de tous les paramètres est également disponible en Annexe E. Les inconnues du problème sont les quantités adimen- sionnées des 14 substrats répertoriés dans le tableau 1 plus l’ATP (Adénosine TriPhosphate) qui fournit par hydrolyse l’énergie nécessaire aux réactions biochimiques du métabolisme. L’apport alimentaire est simulé grâce au paramètre GLCentryc (entrée de glucose en continu). In vivo, il est indispensable pour la survie et le bon fonctionnement de l’organisme que les quantités d’ATP et de NADPH ne soient jamais nulles.

L’évolution du modèle est possible grâce à l’apport nutritionnel ainsi que des quantités d’ATP (0.33) et de NADPH (0.2) initiales non nulles. Les conditions initiales sont données en Annexe D.

Symboles Noms Symboles Noms

GLC Glucose OAAe Oxaloacétate extérieur

G6P Glucose-6-Phosphate OAAm Oxaloacétate mitochondrial

GLYC Glycogène alpha-KG alpha-cétoglutarate

F6P Fructose-6-Phosphate CIT Citrate

G3P Glucose-3-Phosphate OAAc Oxaloacétate cytosolique

PYR Pyruvate ACAc Acétyl Coenzyme A cytosolique

ACAm Acétyl Coenzyme A mitochondrial PALM Palmitate

Tableau 1 – Abréviations et Noms des substrats présents dans le modèle

(9)

Figure2 – Schéma récapitulatif du modèle du métabolisme étudié

3 Étude des points d’équilibre

L’exploration du modèle dynamique du métabolisme cellulaire débute par une étude analytique. Cette étude théorique doit permettre l’obtention des points d’équilibre du modèle ainsi que leur stabilité. Cet ob- jectif n’a pas pu être complètement atteint puisque des problèmes de résolution analytique sont survenus. En effet, ce type d’étude est souvent décrit, dans la littérature, pour des systèmes de quatre équations maximum.

Les calculs engendrés par de tels systèmes sont souvent très fastidieux. Dans notre cas, le modèle étudié com- porte quinze équations et quasiment trois fois plus de paramètres (cf. Annexes B et E). Ainsi, réaliser les calculs théoriques permettant de déterminer les points d’équilibre et leur stabilité n’était, décemment, pas concevable. Cependant, les flux à l’état stable ont tout de même pu être déterminés analytiquement. Leur obtention est décrite par la suite.

3.1 Matrice stœchiométrique

La matrice stœchiométrique permet d’établir une relation linéaire, donc mathématiquement simple, entre :

les flux des réactions enzymatiques (définies Annexe C)

la variation de la concentration des substrats en fonction du temps Par convention :

les lignes de la matrice correspondent aux métabolites impliqués dans chacune des réactions : une ligne pour chaque métabolite

les colonnes correspondent aux réactions du système : une colonne pour chaque réaction

les coefficients stœchiométriques sont négatifs s’il s’agit d’un substrat

(10)

Afin de résoudre le modèle, on va écrire ce dernier sous forme matricielle. On aura donc : S = A·V

avec

S : vecteur15×1 des variations des substrats : dSubstrat dt .

V : vecteur 19×1des flux : νenz

A : matrice stœchiométrique15×19du système.

Ainsi, on peut écrire :

d dt

GLC G6P F6P G3P P Y R ACAm

CIT AKG OAAm GLY C OAAc

ACAc

P ALM N ADP H

AT P

15×1

= A15,19 ·

νT νHK νP GI

νP F K

νP K

νP DH

νP C

νentryOAA

νCS νICDH

νKDH νGS

νGP

νP P

νCL

νM E

νLipG

νLipL νE

19×1

(11)

A=

1 −1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 1 −1 0 0 0 0 0 0 0 0 −1 1 −1 0 0 0 0 0

0 0 1 −1 0 0 0 0 0 0 0 0 0 2

3 0 0 0 0 0

0 0 0 2 −1 0 0 0 0 0 0 0 0 1

3 0 0 0 0 0

0 0 0 0 1 −1 −1 0 0 0 0 0 0 0 0 1 0 0 0

0 0 0 0 0 1 0 0 −1 0 0 0 0 0 0 0 0 8 0

0 0 0 0 0 0 0 0 1 −1 0 0 0 0 −1 0 0 0 0

0 0 0 0 0 0 0 0 0 1 −1 0 0 0 0 0 0 0 0

0 0 0 0 0 0 1 1 −1 0 1 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 1 −1 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 −1 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 −1 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1

8 −1 0

0 0 0 0 0 0 0 0 0 0 0 0 0 2 0 1 14

8 0 0

0 −1 0 −1 2 +n n −1 0 0 n 2·n+m+ 1 −1 0 0 −1 −n 7

8 33 −1

Trouver les points d’équilibre équivaut à trouver le vecteurS0tel que : A· V|S0 = 0

V|S0 est le vecteur des flux à l’état d’équilibre.

La première étape consiste tout d’abord à chercher les flux à l’état d’équilibre.

3.2 Flux à l’état d’équilibre

Afin de déterminer les flux à l’état d’équilibre, on doit rechercher la base du noyau de A. Le noyau (également appelé noyau droit) deAvérifie la relation suivante :

A·K = 0

Les colonneski deKsont linéairement indépendantes et leur nombre est défini par la formule : cK = cArang(A)

avec

cA : nombre de colonnes deA.

cK : nombre de colonnes deK.

(12)

On a donc :

cA = 19

rang(A) = 15

cK = 1915 = 4

Par conséquent, dans notre modèle,Kest une matrice19×4. Tous les vecteursν0des flux à l’état d’équilibre peuvent s’écrire comme la combinaison linéaire des colonnes deKtel que :

ν0 =

cK

X

i=1

ki·αi = K·α avecαi∈ Rdisposés dans le vecteur colonneα.

En utilisant la fonction NullSpacedu logiciel Maple, la matriceKest :

(13)

K=

1 2n

9n10 2n

1

2n m+ 4n+ 2 2n 1

2n

9n10 2n

1

2n m+ 4n+ 2 2n 1

2n

3n10 2n

1

2n m+ 4n+ 2 2n 1

2n

7n10 2n

1

2n m+ 4n+ 2 2n 1

n

2·(4n5) n

1

n m+ 4n+ 2 n

0 0 0 1

1 n

2·(8n5) n

1

n m+ 5n+ 2 n

1

n 2·(4n5)

n 1

n

m+ 5n+ 2 n

0 8 0 1

0 0 0 1

0 0 0 1

0 0 1 0

0 0 1 0

0 3 0 0

0 8 0 0

0 8 0 0

0 8 0 0

0 1 0 0

1 0 0 0

| {z }

k1 | {z }

k2 | {z }

k3 | {z }

k4

netm représentent :

N ADH −→ n·AT P (n : Quantité de NADH transformé en ATP) F ADH −→ m·AT P (m : Quantité de FADH transformé en ATP)

Ainsi, les vecteursν0 des flux à l’état d’équilibre peuvent s’écrire de la façon suivante : ν0 = k1·α1 + k2·α2 + k3·α3 + k4·α4

(14)

3.3 Étude de la stabilité des points d’équilibres

Lorsqu’un système atteint un état d’équilibre, il y reste jusqu’à ce qu’une perturbation externe se pro- duise. Selon le comportement du système après une perturbation, les états d’équilibre sont :

stable: le système retourne à cet état d’équilibre

instable: le système quitte cet état d’équilibre

Un état d’équilibre est asymptotiquement stable s’il est stable et que des conditions initiales proches tendent à cet état lorsquet→ ∞. La stabilité locale décrit le comportement du système après une petite perturbation et la stabilité globale après une perturbation quelconque.

Afin de déterminer si un état d’équilibre d’un système d’équations différentielles ordinaires est asympto- tiquement stable, il faut étudier les valeurs propres de la matrice Jacobienne du système. L’état d’équilibre est asymptotiquement stable si la matrice Jacobienne possèdenvaleurs propres dont les parties réelles sont strictement négatives. L’état d’équilibre est instable si la matrice Jacobienne possède au moins une valeur propre dont la partie réelle est positive.

Pour notre système d’équations dans un état d’équilibre positif S0, les équations différentielles du modèle peuvent être approximées par un développement limité de Taylor :

dS

dt = Aν(S0)

| {z }

= 0

+ A∂ν

∂S S0

| {z }

=J

(SS0) + ...

(1)

Jest la matrice Jacobienne du système etν(S0), le vecteur des flux à l’état stable. Elle est définie comme le produit de la matrice stœchiométriqueAet des dérivées partielles des flux à l’étatS0.

∂ν

∂S S0

=

∂νT

∂GLC

∂νT

∂G6P

∂νT

∂F6P . . . . ∂νT

∂AT P

∂νHK

∂GLC . . . . . . . . . . ∂νHK

∂AT P ... . . . . . . . . . . ... ... . . . . . . . . . . ... ... . . . . . . . . . . ...

∂νLipL

∂GLC . . . . . . . . . . ∂νLipL

∂AT P

∂νE

∂GLC

∂νE

∂G6P

∂νE

∂F6P . . . . ∂νE

∂AT P

S0

(15)

Le critère deRouth-Hurwitzpermet de déterminer la stabilité asymptotique locale d’un point d’équi- libre d’un système d’équations différentielles non linéaire.

Critère de Routh-Hurwitz : Soit l’équation de degrén:

λn + a1λn−1 + ... + an−1λ + an = 0 (2)

où les coefficientsai,i[1, n]sont des constantes réelles. Lesnmatrices de Hurwitz utilisent les coefficients ai du polynôme caractéristique et sont définies de la façon suivante :

H1= (a1), H2=

a1 1 a3 a2

, H3=

a1 1 0 a3 a2 a1 a5 a4 a3

et

Hn=

a1 1 0 0 . . . 0 a3 a2 a1 1 . . . 0 a5 a4 a3 a2 . . . 0 ... ... ... ... . . . ... 0 0 0 0 . . . an

aj= 0 sij > n.

Toutes les racines du polynôme de l’équation 2 sont négatives ou ont une partie réelle négative (i.e. le point d’équilibre est stable) si et seulement si les déterminants de toutes les matrices de Hurwitz sont positifs :

detHj >0, j= 1,2, ..., n

Bien souvent, l’équation 2 ne peut pas être résolue analytiquement pour le calcul des valeurs propres, dès quen >4. Le polynôme caractéristique du modèle étudié est de degrén= 15. C’est pourquoi, le critère de Routh-Hurwitzn’a pas pu donner de solutions. Il est donc impossible de résoudre cette équation analyti- quement pour obtenir les points d’équilibre ainsi que leur stabilité. Par ailleurs, même si les calculs avaient pu être effectués, l’intérêt biologique aurait été perdu. En effet, au vu du grand nombre de paramètres du modèle, l’interprétation biologique sous-jacente n’aurait pas pu aboutir. Face à l’impossibilité d’étudier théo- riquement notre modèle, des méthodes numériques, telle que la méthode de Newton, pourront être mises en place.

(16)

4 Analyse de sensibilité

Les modèles mathématiques utilisés en biologie, en écologie ou en agronomie sont des outils d’aide à la décision. Il en existe une grande diversité mais tous sont composés de quatre éléments :

les variables d’entrée

les variables de sortie

les valeurs des paramètres

les équations

La volonté de reproduire au plus juste le système étudié engendre souvent des modèles complexes. De ce fait, ils peuvent être à l’origine d’erreurs de prédictions importantes et conduire à des décisions erronées. Ces dernières peuvent être dûes à des incertitudes sur les valeurs des paramètres, sur les valeurs des variables d’entrée et sur les équations. Ces incertitudes ont diverses origines :

manque de connaissance

erreur de mesures et/ou d’échantillonnage

variabilité des caractéristiques du système

erreur dans la modélisation du phénomène

Afin de mieux appréhender le modèle d’étude, de le simplifier voire de le vérifier pour conserver une cohérence avec la réalité, des méthodes comme les analyses de sensibilité sont utilisées. Elles permettent d’identifier les paramètres et les variables d’entrée qui ont une forte influence sur les sorties du modèle et, inversement, ceux dont l’influence est moindre. Autrement dit, l’analyse de sensibilité a pour rôle de hiérarchiser l’importance des différents facteurs incertains d’un modèle. Cette hiérarchisation est possible grâce à l’aspect quantitatif de l’analyse de sensibilité par le calcul d’indices de sensibilité (cf. section 4.4).

4.1 Plan d’expériences et d’échantillonnage

Afin de bien comprendre le fonctionnement de l’analyse de sensibilité, il est nécessaire de définir les termes utilisés par la suite.

Plan d’expérience numérique : C’est une suite ordonnée d’essais d’une expérimentation, obtenue en contrôlant un ou plusieurs paramètres d’entrée pour obtenir des résultats sur un phénomène avec un coût de calcul optimal (nombre d’essais le plus faible possible, par exemple). Il peut être décomposé en trois notions fondamentales :

les facteurs, ce sont les composantesX1, ..., Xd du modèle (variables d’entrée et/ou paramètres) que l’on fait varier durant les simulations.

le plan d’expérience, c’est le choix des N combinaisons de n niveaux des facteurs (m1, ..., mn)i=1...d

retenus pour les simulations.

l’expérience numérique, c’est l’ensemble desN simulations.

Plan d’échantillonnage : C’est le protocole de sélection d’une partie dans un tout. Lorsqu’on ne peut pas saisir un événement dans son ensemble, il faut effectuer des mesures en nombre fini, afin de représenter l’événement.

Plan factoriel complet : C’est un plan où chaque facteurX1, ..., Xd a un nombre fini de modalités (ou niveaux)m1, ..., mn et toutes les combinaisons de modalités (soitm1× · · · ×mn) des facteurs sont présentes.

Plan factoriel complet orthogonal :C’est un plan factoriel complet où toutes les combinaisons de modalités des facteurs sont présentes un même nombre de fois.

Plan factoriel fractionnaire : C’est un plan d’échantillonnage où un budget de N simulations est fixé, inférieur à toutes les combinaisons de modalités. Il s’agit de sélectionnerN combinaisons d’entrée parmi les m1× · · · ×mn possibles.

(17)

4.1.1 Notations et vocabulaire

X1, ..., Xd : variables d’entrée correspondant aux facteurs du plan d’expérience c’est-à-dire les paramètres étudiés de l’analyse de sensibilité.

x= (X1, ..., Xd): jeu d’entrées, échantillon élémentaire.

: domaine du plan(xΩ).

P ={x1, ...,xN} ⊂: plan d’expérience, échantillon.

Y =M(x): variable réponse c’est-à-dire la sortie du modèle pour les entréesx.

Prenons un exemple simple : Ω = [0,1]2

x1= (0,0)

P ={(0,0); (0,1); (1,0); (1,1); (0.5,0.5)}

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

X1

X2

Figure3 – Exemple de plan d’expérience

4.1.2 Plans multifactoriels

Il existe deux types de plan factoriel, ceux pour les variables discrètes et ceux pour les variables continues.

Nous ne développerons ici, que les plans pour les facteurs continus car ce sont ceux qui nous intéressent dans notre modèle.

Lorsque l’on doit échantillonner beaucoup de facteurs dans un domaine assez étendu c’est-à-dire en grande dimension, il est nécessaire de vérifier certaines conditions. En effet, l’échantillonnage des intervalles de va- leurs des facteurs est primordial pour la suite de l’analyse de sensibilité. Les simulations à partir du modèle puis le calcul des indices sont basées sur ces valeurs. Bien souvent, l’utilisateur n’a pas de connaissances sur les paramètres influents et non influents de son modèle. Il est donc judicieux de disposer les points de manière à bien recouvrir l’espace. C’est à dire ne pas sous ou sur-échantillonner une zone. Si la méthode du hasard était employée pour placer les quelques points dans un espace de grande dimension, cela conduirait à une mauvaise couverture de certaines dimensions. On appelle plans à bon remplissage de l’espace (space filling design) les plans vérifiant une bonne disposition des points dans l’espace.

Des plans multifactoriels obtenus à partir de différentes méthodes d’échantillonnage sont représentés sur la Figure 4 ci-dessous. La méthode de Sobol est basée sur des suites construites à partir de récurrences linéaires en arithmétique modulo 2 sur le corps fini Z2={0,1} et de polynômes primitifs. Elles sont assez robustes à l’augmentation de la dimension mais des anomalies peuvent apparaître comme on peut le re- marquer sur les figures 4(a) et 4(b). La méthode de Monte-Carlo génère aléatoirement et indépendamment chaque colonne de la matrice d’expérience (correspondant à unN-échantillon) pour chacune desKvariables

(18)

d’entrée. Le biais principal de cette méthode étant une mauvaise couverture du domaine des facteurs (cf. Fi- gure 4(c)). Enfin la Figure 4(d) utilise la méthode des hypercubes latins (LHS : Latin Hypercube Sampling).

C’est cette dernière que nous détaillerons et utiliserons pour notre modèle.

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

Echantillonnage par Sobol

Facteur 1

Facteur 2

(a) Échantillonnage par Sobol - 2 facteurs considérés

0.0 0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

Echantillonnage par Sobol

Facteur 1

Facteur 2

(b) Échantillonnage par Sobol - 2 autres facteurs considérés

0.2 0.4 0.6 0.8 1.0

0.00.20.40.60.81.0

Echantillonnage par Monte−Carlo

Facteur 1

Facteur 2

(c) Échantillonnage par Monte Carlo

6 8 10 12 14

0.60.81.01.21.4

Echantillonnage LHS optimisé par critère de discrépance

Facteur 1

Facteur 2

(d) Échantillonnage LHS optimisé

Figure4 – Exemples d’échantillonnage par différentes méthodes

4.1.3 Critères de remplissage de l’espace et optimisation

Les méthodes d’échantillonnage vues précédemment garantissent une couverture uniforme du domaine de chaque entrée évitant de sous-échantillonner certains segments et à l’inverse d’en sur-échantillonner d’autres.

Néanmoins, elles ne contrôlent pas la qualité de la répartition conjointe des échantillons lorsque l’on considère deux variables ou plus. Pour contrecarrer ce problème, des critères d’optimisation du remplissage de l’es- pace ont été développés. Il en existe plusieurs, notamment ceux basés sur la distance entre les points (plans mini-max et maxi-min) et ceux basés sur la discrépance. Cela permet d’éviter les situations indésirables, tels que des dessins avec des points proches comme on peut l’observer sur la Figure 4(c). Par la suite, nous nous focaliserons sur le critère d’optimisation par discrépance.

La discrépance consiste à juger l’uniformité de la qualité du dessin (i.e. représentation graphique des points comme dans les exemples ci-dessus, Figure 4). La discrépance d’une suite(x(i))i=1,...,N, notéeD(x), est définie par :

Références

Documents relatifs

La transmission acoustique à travers une plaque sandwich infinie peut être calculée connaissant la plane d'extension infinie la transparence acoustique est définie

L’objectif de cette communication est de pr´ esenter les premiers r´ esultats issus de l’application d’une analyse de sensibilit´ e globale au domaine de la propagation d’ondes

Les figures 34 et 35 montrent des résultats différents de la vue de dessus, le paramètre aLAD est négligeable pour la moyenne des deux températures, toutefois la variance indique que

Analyse de sensibilité globale d’un modèle simulant les résultats technico-économiques et les impacts environnementaux de l’atelier d’engraissement porcin.. Journées

Variable d’entrée: arc (n’appartenant pas à l’arbre partiel) qui contribue le plus, par unité, à la diminution de l’objectif. Variable de sortie: arc (appartenant au cycle

Le principe est de construire un mod`ele de transport de sensibilit´e, `a partir de l’´equation de transfert radiatif, et d’en d´eterminer les conditions aux limites corres-

[r]

Diverses formes de l'enzyme existent dans les populations (tableau 1) : depuis la forme très active (100%) à une forme quasiment inactive (3%) Dans ce dernier cas, de l'eau