• Aucun résultat trouvé

Identification des paramètres du modèle

II.2. I. Estimation paramétrique

La dynamique du système est représentée par un jeu d’équations différentielles ordinaires (ODEs), où l’évolution de la concentration du iième composé du milieu (Yi) est fonction des vitesses des réactions (vj) dans lesquelles il est impliqué (équation .2.1.1) selon les équations de bilan matière pour un fonctionnement batch (ni alimentation, ni sortie).

𝑑𝑌𝑖(𝑡)

𝑑𝑡 = ∑𝑛𝑟 𝜁𝑗𝑖𝑣𝑗(

𝑗=1 𝜃, 𝑌(𝑡), 𝑡) pour i = 1 … nc (.2.1.1)

Où, nr représente le nombre de mécanismes (réactionnels, thermodynamiques ou de transfert), nc le nombre de composés, 𝜁𝑗𝑖 est le coefficient stœchiométrique du iième composé Yi dans le jième mécanisme, et θ est le vecteur des paramètres du modèle.

II.2.I.1. Critère d’optimisation

L’estimation des paramètres du modèle est basée sur la méthode des moindres carrés qui minimise l’écart absolu au carré entre les renormalisations des prédictions du modèle (Y̅) et les données expérimentales (Yexp)pour l’ensemble des points expérimentaux(nmes) de chaque expérience (φ), ne

étant le nombre d’expériences. Les paramètres (θ) sont identifiés en minimisant le critère d’optimisation, définit par l’équation .2.1.2.

1 𝜎𝑅𝑒𝑙,𝑖2 𝑛𝑐 𝑖=1 ∑ ∑ |𝑙𝑜𝑔10(𝑌𝑒𝑥𝑝,𝑖(𝜑𝑗, 𝑡) + 𝜎𝐴𝑏𝑠,𝑖 𝜎𝑅𝑒𝑙,𝑖 ) − 𝑙𝑜𝑔10(𝑌̅𝑖(𝜃, 𝜑𝑗, 𝑡) + 𝜎𝐴𝑏𝑠,𝑖 𝜎𝑅𝑒𝑙,𝑖 )|2 𝑛𝑚𝑒𝑠 𝑡=1 𝑛𝑒 𝑗=1 (.2.1.2)

L’identificateur prend en compte, lors de l’estimation, l’incertitude sur les mesures due aux limites des méthodes analytiques utilisées pour le dosage des composés du milieu. Ici, σAbs,i et σRel,i

représente respectivement l’écart-type absolu et relatif sur la mesure du iième composé. Les valeurs des écarts-types utilisées sont présentées dans le tableau .2.11.

Tableau .2.1 : Ecart-type relatif et absolu sur les différents composés du fermenteur

Composé Ecart-type relatif

Rel) en % Ecart-type absolu Abs) en mmol/L Biomasse 3,06 0,0952 Acides aminés 8,56 0,2018 Glucose 2,16 0,0856 Ions ammonium 3,90 0,0528 Thiolutine 3,00 0,0231 Dioxyde de carbone 10,00 0,0347 Ammonium gazeux 5,00 0,0201

Les valeurs des écart-types présentés sont fixées en fonction, d’une part, de la précision des méthodes analytiques (cf. chapitre .2) et d’autre part, des tolérances relative (RelTol = 3.10-4) et absolue (AbsTol = 1.10-4 mmol/L) de l’intégrateur numérique (« Radau5 », Hairer and Wanner, 1996). Il est nécessaire de prendre en compte ces tolérances pour éviter que l’identificateur essaye de réconcilier une concentration avec un intervalle de confiance petit. En effet, en début de fermentation, l’identificateur prédit des concentrations en thiolutine très petites de l’ordre du µM. Or, au même moment, la concentration en glucose est pour certaines expériences de 83,3 mmol/L (soit 15 g/L). Une précision de 3,1 µmol/L sur la thiolutine (tableau .2.11) nécessiterait des dizaines de milliers de pas d’intégration ce qui rend son exécution informatique impossible. Ainsi, les écarts-types absolus sont modifiés de manière à ce que l’impact de la valeur de la concentration en glucose sur les autres composés soit fixé à 20 µmol/L, soit une erreur de 0,024% (tableau .2.11).

L’écart-type absolu des acides aminés a été augmenté au vu de la partie chaotique de l’évolution des concentrations expérimentales. Ces valeurs ont été validées par l’analyse des intervalles de confiance à 95% et à 50% sur les mesures expérimentales. Les intervalles de confiance à 95% des données expérimentales (ε95%,i) sont calculés à l’aide des écarts-types relatifs et absolus pour chaque méthode analytique utilisée selon l’équation .2.1.3.

𝜀95%,𝑖= ±3 × (𝜎𝐴𝑏𝑠,𝑖+ 𝜎𝑅𝑒𝑙,𝑖× 𝑌𝑒𝑥𝑝,𝑖) pour i = 1 … nc (.2.1.3)

De même, les intervalles de confiance à 50% des données expérimentales (ε50%,i) sont calculés selon l’équation .2.1.4.

𝜀50%,𝑖= ±(𝜎𝐴𝑏𝑠,𝑖+ 𝜎𝑅𝑒𝑙,𝑖× 𝑌𝑒𝑥𝑝,𝑖) pour i = 1 … nc (.2.1.4)

La courbe d’une cinétique prédite par un modèle épousant parfaitement les données est localisée parmi 95% des barres d’erreurs calculées par l’équation .2.1.3 (seul 5% des points sont à coté). Lorsque les barres d’erreurs sur les points expérimentaux sont calculées par l’équation .2.1.4, la courbe se situe dans 50%de ces barres. Ainsi, la valeur de l’écart-type absolu des acides aminés a été augmenté afin d’obtenir une cinétique cohérente (tableau .2.11). En effet, lorsque aucune cinétique ne peut manifestement passer par le jeu de barres d’erreurs déterminé par les équations .2.1.3 et

.2.1.4, cela signifie que la précision relative ou la précision absolue (initialement déterminés au

chapitre .2) sont en-dessous de la réalité.

II.2.I.2. Méthode d’optimisation

Le problème d’estimation est résolu en associant la méthode du simplexe de Nelder-Mead (Lagarias et al., 1998) et celle de Levenberg-Marquardt (Marquardt, 1963; Moré, 1978). Pour pallier aux inconvénients de ces méthodes locales, l’estimation s’appuie sur une initialisation multiple à tirage aléatoire. Initialement, dix vecteurs de paramètres sont tirés au hasard à l’aide d’un générateur de nombre aléatoire par congruence. Ces vecteurs sont optimisés dans un premier temps par la méthode de Levenberg-Marquardt avec un maximum de 4000 itérations. Ces dix vecteurs de paramètres sont ensuite optimisés par la méthode de Nelder-Mead avec 1000 itérations. Chaque étape d’optimisation s’arrête avant d’atteindre ces nombres maximaux d’itérations dès que tous les coefficients du vecteur des paramètres (reconditionnés) varient de moins de respectivement 10-6 et 10-4, pour chaque étape d’optimisation, ou si ces pas entrainent une variation du critère d’optimisation de moins de 10-6 et 10-4, respectivement pour chaque étape d’optimisation.

Le tableau .2.2 résume, pour chaque étape d’optimisation, la méthode, le nombre maximal d’itérations ainsi que les conditions d’arrêt prématuré.

Tableau .2.2 : Récapitulatif des étapes de la méthode d'optimisation

Etape Méthode

d’optimisation

Nombre maximal d’itération

Variation minimale des paramètres reconditionnés Variation minimale du critère d’optimisation entre 2 pas 1 Levenberg-Marquardt 4000 10-6 10-6 2 Nelder-Mead 1000 10-4 10-4

Pour chacune des équations du modèle, les dérivées sont calculées en utilisant la « direct differentiation method », basée sur le calcul des dérivées analytiques. Cette méthode permet de limiter le biais introduit dans le système de résolution.

II.2.I.3. Intervalle de confiance des paramètres

La région de confiance est définie comme l’espace où il est probable, à un certain niveau de confiance, de trouver les vraies valeurs des paramètres. Cette région est calculée à partir de la matrice d’information de Fisher (MFisher) qui est elle-même calculée à partir de la matrice de sensibilité (également appelée Jacobien) (MJacobien) et de la matrice de variance-covariance des données mesurées (Σ) d’après l’équation .2.1.5.

𝑀𝑓𝑖𝑠ℎ𝑒𝑟 = 𝑀𝐽𝑎𝑐𝑜𝑏𝑖𝑒𝑛𝑇 × Σ−1× 𝑀𝐽𝑎𝑐𝑜𝑏𝑖𝑒𝑛 (.2.1.5)

Le Jacobien permet d’évaluer la sensibilité des prédictions du modèle par rapport aux paramètres (θ). Le coefficient de la iième ligne et jième colonne de cette matrice rectangulaire représente la dérivé de la prédiction de la iième mesure expérimentale par rapport au jième paramètre du modèle. En notant np le nombre de paramètres du modèle, on obtient l’équation .2.1.6.

𝑀𝐽𝑎𝑐𝑜𝑏𝑖𝑎𝑛= ( 𝑑𝑌̅ 𝑑𝜃1(𝜃, 𝜑1, 1) ⋯ 𝑑𝜃𝑑𝑌̅ 𝑛𝑝(𝜃, 𝜑1, 1) ⋮ ⋱ ⋮ 𝑑𝑌̅ 𝑑𝜃1(𝜃, 𝜑1, 𝑛𝑚𝑒𝑠) 𝑑𝑌̅ 𝑑𝜃1(𝜃, 𝜑2, 1) ⋮ 𝑑𝑌̅ 𝑑𝜃1(𝜃, 𝜑𝑛𝑒, 𝑛𝑚𝑒𝑠) ⋯ 𝑑𝑌̅ 𝑑𝜃𝑛𝑝(𝜃, 𝜑1, 𝑛𝑚𝑒𝑠) 𝑑𝑌̅ 𝑑𝜃𝑛𝑝(𝜃, 𝜑2, 1) ⋮ 𝑑𝑌̅ 𝑑𝜃𝑛𝑝(𝜃, 𝜑𝑛𝑒, 𝑛𝑚𝑒𝑠) ) (.2.1.6)

La matrice de variance-covariance est une matrice diagonale dont le coefficient diagonal de la iième ligne et iième colonne représente la variance de la iième mesure, avec i entre 1 et nmes x ne x nc

(équation .2.1.7). Σ−1= ( 1 𝜎1,12

0

⋮ ⋱ 1 𝜎𝑛𝑐,121 𝜎1,22 ⋱ ⋮

0

2 1 ) (.2.1.7)

La région de confiance des paramètres est un hyper-ellipsoïde centré sur le vecteur des paramètres estimés. La figure .2.2 représente la région de confiance pour un vecteur de 3 paramètres. Les directions des demi-axes de cet ellipsoïde sont les vecteurs propres de la matrice d’information de Fisher et la longueur de ces demi-axes est proportionnelle à la racine carrée de l’inverse de la valeur propre (λ) correspondante. Lorsque le coefficient de proportionnalité est égal à 2√χ2(𝑛𝑝, 95%), l’ellipsoïde est une région de confiance vraie à 95%.

Figure .2.2 : Représentation géométrique de la région de confiance des paramètres estimés pour un vecteur de 3

paramètres, CP : composante principale

La région de confiance détermine la forme et la dimension d’une région de l’espace paramétrique contenant, avec 95% de chance, les valeurs vraies des paramètres alors que l’intervalle de confiance des paramètres localise la valeur vraie de chaque paramètre. En effet, l’intervalle de confiance est un sous-segment de la projection de la région de confiance sur les axes principaux. La taille de cet intervalle pour chacun des paramètres estimés est proportionnelle à la racine carrée de l’inverse du coefficient diagonal de la matrice d’information de Fisher correspondant. Le coefficient de proportionnalité est égal à 2√χ2(1, 95%).

Documents relatifs