Introduction aux problèmes inverses - Démarche de calibration du modèle

Chapitre 4 Construction et calibration des modèles numériques

4.3 Démarche de calibration du modèle

4.3.1 Introduction aux problèmes inverses

La résolution du problème direct consiste à simuler les variables d’état d’un système, telle que la concentration en contaminants dans la nappe dans le cas d’un modèle de transport réactif, ceci en

résolvant les équations physiques régissant le système à partir des propriétés supposées connues du milieu (Marsily et al., 1999). Cependant il est souvent difficile de définir précisément les propriétés du système aquifère qui permettent d’obtenir une situation idéale où les données simulées coïncident parfaitement avec les données mesurées aux points d’observations.

Généralement, les quantités simulées par le modèle numérique sont plus facilement mesurables que ne le sont les propriétés du système. C’est sur la base de cette observation, qu’a été introduit le concept de problème inverse, qui consiste à estimer les valeurs des paramètres d’entrée du système en se basant sur les variables d’état du système (Neuman, 1973). Les méthodes inverses indirectes tentent, en modifiant les paramètres du système, de minimiser un critère basé sur la différence entre variables simulées par le modèle et variables mesurées aux divers points d’observation (les résidus). Les paramètres ainsi estimés fournissent le meilleur ajustement des valeurs des variables d’état pour le modèle conceptuel considéré. La Figure 4-1, présente l’approche générale utilisée par les méthodes inverses indirectes.

Figure 4-1 : Approche générale utilisée pour l'estimation des paramètres par les méthodes inverses indirectes.

Dans le cas des modèles non linéaires, l’estimation des paramètres est réalisée de façon itérative, jusqu’à ce que la différence entre variables d’état mesurées et calculées soit minimale. Outre le choix des paramètres, dont les valeurs sont ajustées, la mise en œuvre de l’estimation des paramètres par une méthode inverse indirecte nécessite le choix d’une fonction objectif, vérifiant l’adéquation entre les valeurs simulées et observées, et de l’algorithme mathématique qui sera utilisé pour l’optimisation.

4.3.1.1 Définition de la fonction objectif

Il existe deux points de vue pour la définition d’une fonction objectif, selon qu’elle est directement dérivée de l’approche statistique ou non. Dans le cas où aucune théorie statistique n’est prise en compte pour les résidus, le modélisateur définit une relation mathématique qui reflète l’ajustement entre les simulations et les observations de manière conforme à ses objectifs. Parmi ces relations, dont les plus communes ont été présentées au chapitre 2, on retrouve par exemple l’erreur quadratique moyenne normalisée.

Le point de vue statistique consiste à assigner des propriétés statistiques aux résidus. Le jeu optimal de paramètres est ensuite défini comme celui qui maximise la vraisemblance des résidus. La vraisemblance, « likelihood » en anglais, représente la probabilité d'observer le jeu de données dont on dispose, avec le modèle que l'on utilise, sous l’hypothèse que la structure supposée des résidus est vraie.

Il existe différentes formes de la fonction de vraisemblance suivant les hypothèses faites sur les caractéristiques des résidus (Shi et al., 2014; Vrugt et al., 2008). Lorsque l’on fait l’hypothèse que la distribution des résidus suit une loi normale centrée sur zéro, alors la fonction de vraisemblance est équivalente à une fonction pondérée au sens des moindres carrés (weighted least square function). Actuellement, l’approche statistique est, dans la majorité des cas, appliquée sous ces hypothèses (Shi et al., 2014).

4.3.1.2 Algorithmes de calage

L’algorithme de calage est défini comme la procédure qui consiste à rechercher les valeurs du jeu de paramètres optimisant (maximisation ou minimisation) la fonction objectif retenue. Cette dernière peut être considérée comme une fonction des paramètres du modèle, à savoir une surface dont la dimension est égale au nombre de paramètres. L’objectif est de déterminer les valeurs des paramètres correspondants à l’optimum de cette surface. Cette approche, qui tente de déterminer le jeu de paramètres optimal compte tenu des données disponibles, est une approche déterministe dérivée de l’approche du maximum de vraisemblance (Carrera and Neuman, 1986; Marsily et al., 1999; McLaughlin and Townley, 1996).

Les différents algorithmes d’optimisation permettant l’estimation du maximum de vraisemblance ont été présentés au chapitre 2. Dans ce travail, le problème d’optimisation est traité à l’aide de l’algorithme de Gauss-Marquart-Levemberg implémenté dans les logiciels de résolution du problème inverse PEST (Doherty, 2014a, 2010b) et PEST++ (Welter et al., 2015) qui sont des logiciels au code source ouvert. Les développements mathématiques relatifs à l’approche utilisée sont présentés dans les paragraphes suivants.

NB : Le logiciel PEST (Doherty, 2014a, 2010b) a d’abord été utilisé dans les travaux de thèse ; il présente l’avantage d’être largement utilisé pour l'estimation automatisée des paramètres dans des contextes de modèles non linéaires, d’être bien documenté et disponible sous les systèmes d’exploitation Linux et Windows. Nous nous sommes ensuite tournés vers le logiciel PEST ++ (Welter et al., 2015) qui présente plusieurs avantages :

 _{Facilité d’implantation et performance des calculs en parallèle sur un ordinateur multi-cœurs.} Cette caractéristique devenant la norme sur les ordinateurs classiques (qui présentent au minimum deux cœurs, et plus largement quatre cœurs de nos jours), cet avantage nous a paru important dans la perspective d’une utilisation opérationnelle de la méthodologie de modélisation développée ici.

 Simplicité d’implémentation d’une méthodologie de régularisation (présentée au paragraphe 4.3.5.3), permettant de rendre plus robuste et plus rapide la résolution des problèmes inverses.

 _{Compatibilité complète avec le logiciel PEST. Tous les fichiers d’entrées et utilitaires}14 de ce dernier sont compatibles avec le logiciel PEST++.

Le choix de l’utilisation de PEST++ est apparu tardivement dans la thèse, car il résulte d’une réflexion menée avec une équipe de recherche australienne en fin d’année 2014 (Henning Prommer et Adam Siade) et de l’amélioration de notre connaissance des outils et méthodes informatiques. De plus, la partie du logiciel PEST++ utilisée est disponible dans sa dernière version¹⁵ uniquement depuis octobre 2014 sous Windows et depuis l’été 2015 sous Linux.

Dans le document Procédés de traitement biologiques in situ : la modélisation numérique comme outil d'aide à la décision (Page 123-126)