II. Analyse de l’ajustement - Identification des paramètres du modèle

Identification des paramètres du modèle

II.2. II. Analyse de l’ajustement

L’objectif de la modélisation est de pouvoir prédire le comportement du système pour des conditions initiales et opératoires données, il est donc important d’évaluer l’ajustement des prédictions du modèle aux données expérimentales réelles. L’ajustement des prédictions du modèle aux données expérimentales est calculé pour chaque composé en utilisant le critère présenté par l’équation

_.2.2.1. 𝐶𝑡 = ¹ 𝑛_𝑚𝑒𝑠∑ |^𝑌𝑒𝑥𝑝(𝑡)−𝑌̅(𝜃,𝑡) max(𝑌_𝑒𝑥𝑝(𝑡))|² 𝑛_𝑚𝑒𝑠 𝑡=1 (_.2.2.1)

Le critère d’ajustement global sur l’ensemble de l’expérience correspond à la somme des critères d’ajustement de chaque composé.

θ CP₂ CP₁ Vecteur propre de MFisher: v₂ Vecteur propre de MFisher: v₁ CP₃ Vecteur propre de MFisher: v₃

II.2.III. Spécificités de la toolbox ExOptim

II.2.III.1. Prise en compte de l’erreur sur les concentrations initiales

Une des spécificités de la toolbox ExOptim est la possibilité de prendre en compte les erreurs de mesure sur les différents composés dès la première mesure au temps initial alors que les méthodes classiques supposent des données initiales sans incertitudes. En effet, dans le cas de données de fermentation, la stérilisation du milieu de culture par autoclavage entraine une incertitude non quantifiable sur la composition initiale du milieu de culture. De plus, le fermenteur est inoculé avec une certaine quantité de biomasse issue d’une préculture effectuée en Erlenmeyer. Le caractère filamenteux de la bactérie étudiée ne permet pas de standardiser totalement l’inoculation et donc la concentration en biomasse ajoutée initialement. Ainsi, la concentration initiale de chaque composé est mesurée au même titre que les autres points de la fermentation et est sujette aux erreurs de mesure des méthodes analytiques employées.

Les erreurs relatives entre les concentrations initiales mesurées et les concentrations initiales vraies sont implémentées comme des paramètres du modèle et sont identifiées. Les bornes de ces paramètres correspondent à l’intervalle de confiance à 95% sur les mesures expérimentales (ε95%,i) calculées à l’aide des écarts-types relatifs et absolus présentés dans le tableau .2.3, selon l’équation

.2.1.3. Dans le cas de la valeur des concentrations initiales des composés, les écarts-types absolus ne prennent pas en compte les tolérances de l’intégrateur numérique. Seules les quantités initiales en dioxyde de carbone et en ammonium gazeux sont supposées être connues exactement et sont égales à zéro.

Tableau _{.2.3 : Ecart-type relatif et absolu avant prise en compte des tolérances de l’intégrateur sur les différents}

composés du fermenteur

Composé Ecart-type relatif

(σRel) en % Ecart-type absolu (σAbs) en mmol/L Biomasse 3,06 0,0752 Acides aminés 8,56 0,1818 Glucose 2,16 0,0656 Ions ammonium 3,90 0,0328 Thiolutine 3,00 0,0031 Dioxyde de carbone 10,00 0,0147 Ammonium gazeux 5,00 0,0001

II.2.III.2. Reparamétrisation du modèle cinétique

Afin d’assurer une stabilité à la méthode numérique d’optimisation et éviter les problèmes d’identifiabilité, les paramètres doivent être choisis de manière à limiter les corrélations avec les prédictions du modèle tout en gardant une influence significatrice sur ces prédictions. Or les paramètres du modèle de Monod sont hautement corrélés entre eux. De plus, le vecteur des paramètres du modèle doit être reparamétré de manière à ce que le domaine de variation de chaque paramètre soit de l’ordre de l’unité. En effet, si la valeur vraie d’un paramètre est très faible, les variations de la valeur de son estimation pendant l’optimisation seront du même ordre de grandeur que la valeur du paramètre lui-même, ce qui peut autoriser un bassin de convergence de l’extrema global si petit qu’il est peu probable que l’optimiseur le teste. Si de petites variations autour d’un paramètre vrai ont une grande influence sur les prédictions, on peut similairement passer à coté du bassin de convergence de l’extrema global. A contrario, si les valeurs des paramètres sont très grandes, l’optimiseur manipulant préférentiellement des variations de l’ordre de l’unité, certaines zones risquent alors de ne jamais être testées.

La reparamétrisation à définir doit donc permettre de réduire les corrélations entre les paramètres des différentes équations cinétiques et assurer une évolution de chaque paramètre de l’ordre de l’unité. La Toolbox permet de reparamétrer le vecteur des paramètres de façon indépendante de l’écriture des équations différentielles (ODEs), afin de limiter les erreurs de programmation. L’écriture des équations du modèle reste ainsi inchangée, le vecteur des paramètres (θ) est reparamétré en un vecteur (p) dans une fonction distincte « theta2p ». Après l’identification, à chaque changement du vecteur (p) suggéré par l’optimiseur, les paramètres du vecteur (θ) sont recalculés à partir du vecteur des paramètres reparamétrés estimés (p) dans une fonction indépendante « p2theta ».

La reparamétrisation utilisée propose d’identifier les paramètres du modèle à partir de coordonnées définies. En considérant l’exemple simple d’une équation affine .2.3.1.

𝑦 = 𝑎. 𝑥 + 𝑏 ₍.2.3.1)

Où a et b sont les paramètres à identifier et x la concentration expérimentale. On se propose de reparamétrer le vecteur θ = a, b en vecteur p = y1, y2 tel que :

{_𝑦^𝑦¹^{= 𝑎. 𝑥}¹^{+ 𝑏}

2= 𝑎. 𝑥₂+ 𝑏 ⁽.2.3.2)

D’après la théorie des barycentres, tous les points de coordonnées (xn, yn) peuvent être définis comme une combinaison linéaire des points (x1, y1) et (x2, y2) affectés respectivement des masses (xn -x2) et (x1-xn) qui sont alors les coordonnées barycentriques du point (xn, yn).

Avec : 𝑦_𝑛 =^(𝑥𝑛−𝑥₂)𝑦₁+(𝑥₁−𝑥_𝑛)𝑦₂

𝑥₁−𝑥₂ (_.2.3.3)

Après l’estimation du vecteur des paramètres p, la résolution du système .2.3.3 permet de recalculer les valeurs estimées des paramètres a et b.

Suivant ce principe, les paramètres θ du modèle stœchio-cinétique sont donc reparamétrés en un vecteur p comprenant un jeu de vitesses nominales calculées à partir des équations du modèle pour des concentrations données en substrats et en produits. Deux concentrations nominales sont choisies pour chaque composé impliqué dans le calcul des vitesses de réaction. La première valeur, dite « nominale 1 », correspond à une concentration représentative des données expérimentales pour laquelle les vitesses de réaction sont importantes, la deuxième valeur, dite « nominale 2 », est une concentration représentative des données expérimentales la plus éloignée possible de la première valeur. Pour chacune des vitesses de réaction, le nombre de vitesses nominales calculées correspond au nombre de paramètres à identifier dans l’équation de la vitesse, à l’exception de la vitesse de la réaction de production de thiolutine (v4). En effet, le paramètre KThio,4 représente la concentration maximale de thiolutine dans le fermenteur. Ce paramètre dépend de l’expérience sur laquelle il est identifié. Il est donc reparamétré indépendamment en log (KThio,4).

Les vitesses dites « nominales 1 » sont calculées pour chacune des réactions à partir des concentrations nominales 1. De manière à assurer une variation des paramètres (p) de l’ordre de l’unité pendant l’identification, l’unité des vitesses nominales 1 est modifiée en mmol/(L.h) puis le logarithme des vitesses nominales 1 est calculé et ajouté au vecteur des paramètres (p). Les vitesses dites « nominales 2 » sont calculées à partir de la concentration nominale 2 pour un des composés impliqués dans l’équation de la vitesse et des concentrations nominales 1 pour les autres composés

Par exemple, la vitesse de la réaction de maintenance sur glucose (R2) est définie par l’équation

.2.3.4.

𝑣₂(𝑡) = 𝐶₂[𝑋]_{[𝐺𝑙𝑢]+𝐾}^{[𝐺𝑙𝑢]}

𝐺𝑙𝑢,2 (.2.3.4)

La vitesse nominale 1 (v2N1) est calculée à partir des concentrations nominales 1 en biomasse (_X1) et en glucose (Glu1), d’après l’équation .2.3.5.

𝑣_2𝑁1(𝑡) = 𝐶₂[𝑋]₁ ^{[𝐺𝑙𝑢]}1

[𝐺𝑙𝑢]1+𝐾_{𝐺𝑙𝑢,2} (.2.3.5) La vitesse nominale 2 (v2N2) est calculée à partir de la concentration nominale 1 en biomasse (X1) et de la concentration nominale 2 en glucose (Glu2), d’après l’équation .2.3.6.

𝑣_2𝑁2(𝑡) = 𝐶₂[𝑋]₁ ^{[𝐺𝑙𝑢]}2

[𝐺𝑙𝑢]2+𝐾𝐺𝑙𝑢,2 (.2.3.6) Ceci facilitera le calcul de la valeur du paramètre 𝐾_{𝐺𝑙𝑢,2} après l’identification. Afin d’assurer une variation des paramètres (p) de l’ordre de l’unité pendant l’identification, mais également de contraindre les constantes de saturation (K) à avoir une valeur positive, le rapport entre les vitesses nominales 2 et les vitesses nominales 1 (𝑣_𝑁1

𝑣_𝑁2

⁄ _{) est ajouté au vecteur des paramètres (p).}

Les autres paramètres du modèle (seuil, durée de phase et erreur relative sur la mesure initiale) sont également reparamétrés dans le but d’assurer une variation des paramètres du vecteur (p) de l’ordre de l’unité. Ainsi, les seuils sont reparamétrés en logarithme de leur valeur et les erreurs relatives initiales sont multipliées par 10 dans le vecteur des paramètres (p). Les durées de la phase de latence et de la phase 2 de fermentation ne sont pas reparamétrées car leur domaine de variation (en jour) est déjà de l’ordre de l’unité.

II.2.III.3. Normalisation des données expérimentales

Pour les même raisons que celles énoncées dans le paragraphe précédent, il est nécessaire de normaliser la matrice des données expérimentales utilisées pour l’estimation des paramètres. Les données sont donc normalisées selon l’équation .2.3.7.

𝑌_{𝑛𝑜𝑟𝑚,𝑖}(𝜑_𝑗, 𝑡) =^𝑙𝑜𝑔¹⁰^(𝑌^{𝑒𝑥𝑝,𝑖}^(𝜑^𝑗^,𝑡)+

𝜎𝐴𝑏𝑠,𝑖 𝜎𝑅𝑒𝑙,𝑖 ⁾

𝜎𝑅𝑒𝑙,𝑖 pour i = 1 … nc et j = 1 …ne (_.2.3.7)

L’influence du premier prélèvement dans le résidu est augmentée de manière à le faire correspondre au mieux aux données expérimentales. En effet, l’erreur d’ajustement due à l’approximation du modèle est supposée quatre fois plus importante que celle due aux erreurs de mesure. Pour le premier point expérimental (à t=0h), seule l’erreur de mesure est prise en compte car les réactions du modèle n’influent pas sur les données initiales. Ce point est, par conséquent, plus fiable que les autres points expérimentaux, ce qui se traduit par une modification de la valeur de 𝑌_{𝑛𝑜𝑟𝑚,𝑖}(𝜑_𝑗, 0) (équation .2.3.8).

𝑌_{𝑛𝑜𝑟𝑚,𝑖}(𝜑_𝑗, 0) =^{5 ×𝑙𝑜𝑔}¹⁰^(𝑌^{𝑒𝑥𝑝,𝑖}^(𝜑^𝑗^,0)+

𝜎𝐴𝑏𝑠,𝑖 𝜎𝑅𝑒𝑙,𝑖 ⁾

𝜎_{𝑅𝑒𝑙,𝑖} pour i = 1 … nc et j = 1 …ne (.2.3.8) Le coefficient multiplicateur de 5 a été fixé par rapport aux résultats des premières identifications réalisées. Il correspond aux premières valeurs obtenues pour le résidu final qui traduit de l’erreur

Pour certaines expériences de la base de données, on observe une dégradation de la thiolutine qui n’a pas été modélisée. Afin de limiter la perturbation de l’identification des paramètres du modèle, les données expérimentales en thiolutine sont modifiées une fois la concentration maximale atteinte selon l’équation _{.2.3.9. Cette modification permet de diminuer le poids des données de thiolutine}

pendant la phase de dégradation.

𝑌_{𝑛𝑜𝑟𝑚,5}(𝜑_𝑗, 𝑡) = 𝐾_{𝑇ℎ𝑖𝑜,4} pour t > tf,prod et j = 1 …ne (.2.3.9)

Où, i = 5 car la thiolutine est le cinquième composés et tf,prod représente le temps pour lequel la thiolutine atteint sa valeur maximale (KThio,4).

II.2.IV. Conclusion

La toolbox ExOptim dispose d’une méthode d’identification robuste présentant plusieurs caractéristiques, résumées dans le tableau .2.4, la distinguant des méthodes classiques. Tout d’abord, l’initialisation multiple à tirage aléatoire des vecteurs de paramètres initiaux multiplie les chances de converger vers un optimum global tout en utilisant des méthodes locales (Nelder-Mead et Levenberg-Marquardt), ce qui permet un juste compromis entre la robustesse de l’optimisation et le temps de calcul. De plus, l’utilisation de dérivées analytiques permet d’éviter l’ajout d’un biais dans le système de résolution. La toolbox permet également de prendre en compte l’erreur sur les mesures des composés dès la mesure initiale, ce qui est particulièrement adapté au traitement des données de fermentation pour lesquelles les concentrations initiales ne sont pas connues avec précision. Parallèlement, lors de la normalisation des données expérimentales un poids plus important est associé aux mesures initiales car l’erreur d’approximation du modèle n’impacte pas ces mesures initiales. Un autre avantage est lié à la construction de la toolbox, qui permet de reparamétrer le vecteur des paramètres et les données expérimentales de façon indépendante afin de limiter les erreurs lors de l’implémentation du modèle.

Tableau .2.4 : Rappel des caractéristiques de la toolbox ExOptim et des avantages associés

Spécificité Avantage

Initialisation multiple

Méthode robuste et limitation du temps de calcul Association de 2 méthodes d’optimisation

(Nelder-Mead et Levenberg-Marquardt) Calcul des dérivées analytiques

Prise en compte de l’erreur sur la mesure initiale

Approprié aux données de fermentation (les données initiales ne sont pas connues précisément)

Chapitre 3 :

Dans le document Modélisation de la croissance et de la production de thiolutine par <em>Saccharothrix algeriensis</em> en fermenteur batch (Page 149-155)