• Aucun résultat trouvé

Chapitre 4 Construction et calibration des modèles numériques

4.3 Démarche de calibration du modèle

4.3.7 Données de conditionnement du problème inverse

Avant de présenter le rôle des données de conditionnement dans la résolution du problème inverse, nous nous attarderons sur les différentes approches envisageables pour l’estimation des paramètres

27

d’un modèle de transport réactif des eaux souterraines. De ces approches découlent les suggestions concernant l’utilisation des observations utilisées dans la résolution du problème inverse.

4.3.7.1 Transformation de la fonction objectif

Il est possible de caler les modèles sur une forme transformée des données d’observation afin de ramener les résidus à une forme plus homogène. Une transformation logarithmique (Doherty, 2010b), racine carrée, ou puissance (Yin, 2009), permet, par exemple, de rendre plus «visibles» les mesures de faibles valeurs de concentrations en contaminants dans la fonction objectif. Ces dernières, situées en limite du panache, contiennent des informations sur l’hétérogénéité locale. Par ailleurs, dans le cas de modèle de gestion, les prédictions d'intérêt requises se situent souvent dans les faibles valeurs de concentrations. A contrario, lorsqu’il est question de réaliser un bilan de masse de la contamination, alors une transformation logarithmique peut ne pas être adaptée, car les concentrations les plus fortes peuvent être sous évaluées par le modèle lorsqu’une telle approche est adoptée (Carniato, 2014).

4.3.7.2 Différentes approches d’estimations des paramètres

Dans le cas d’un modèle de transport réactif des eaux souterraines, les données de conditionnement du problème inverse sont communément de deux types, à savoir les observations de charge hydraulique et les concentrations en contaminants. Comme le précise (Doherty and Hunt, 2010), l’utilisation de ces deux types de données fournit des informations particulièrement efficaces pour décrire l’hétérogénéité géologique du milieu poreux étudié. Cependant, il est important de noter, que les données sur les concentrations en contaminants devront aussi permettre de déterminer les valeurs de paramètres définissant le terme source (quantité de contaminants et cinétique de dissolution) et les réactions de biodégradation (dans le cadre de l’atténuation naturelle et du traitement). Par conséquent, l’estimation simultanée de paramètres définissant l’écoulement des eaux souterraines, le terme source et le transport réactif, sous des données de conditionnement de type concentrations en contaminants peut avoir un impact négatif sur la stabilité globale du problème inverse (Hosseini et al., 2011).

Trois approches sont généralement admises par la communauté scientifique :

 La première consiste à estimer tout d’abord les valeurs et la répartition de la conductivité hydraulique de l’aquifère en utilisant les mesures de charge hydraulique comme données de conditionnement. Par la suite, sur la base des résultats obtenus dans la phase précédente, les concentrations en contaminants sont utilisées pour estimer les paramètres du modèle réactif. Dans cette approche, la calibration du modèle d’écoulement et de transport réactif est découplée. A noter qu’il est aussi possible de rajouter une étape intermédiaire qui consiste à estimer les paramètres de transport en calibrant le modèle de transport non-réactif à partir de données de conditionnement de type traceur des eaux souterraines. Cette démarche est communément utilisée lorsque la calibration du modèle est faite par essai - erreur, ou lorsque seul le modèle d’écoulement est calibré par une méthode inverse (D’Affonseca et al., 2011; Herold et al., 2011; Hosseini et al., 2011; Rinaldi et al., 2014).  La deuxième approche consiste à coupler les paramètres de transport réactif et les

paramètres de conductivité hydraulique pour la résolution simultanée du problème inverse du modèle d’écoulement et du modèle de transport réactif (Datta et al., 2011, 2009; Dokou and Pinder, 2011; He et al., 2010).

 Une troisième approche, de type hybride, repose sur les deux premières. Les paramètres estimés lors de la résolution du problème inverse du modèle d’écoulement sont utilisés

comme paramètres initiaux pour résoudre le problème inverse tel qu’il est formulé dans la deuxième approche (Carniato et al., 2015).

Comme les mesures de concentrations en contaminants contiennent des informations sur le champ d’écoulement, influencé par l’arrangement du milieu poreux souvent complexe et hétérogène, alors les approches deux et trois seront privilégiées dans notre contexte d’étude.

4.3.7.3 Type et groupe des données d’observation

Il est préférable d’affecter les mesures du niveau piézométrique et de concentrations en contaminants à des groupes d’observations distincts (Doherty and Hunt, 2010). Cela permet d’affecter des poids différents à chacun des groupes, et facilite le suivi des progrès du processus d’estimation des paramètres.

Une approche potentiellement utile pour définir un panache de contaminants consiste à affecter la valeur égale à la limite de quantification lorsque la concentration observée est inférieure au seuil de détection. Cette stratégie assure la stabilité du calcul des dérivés, lequel serait mis à mal si une concentration à zéro était affectée (Doherty and Hunt, 2010).

4.3.7.4 Le rôle des poids

Il n’existe pas de prescription universelle sur la manière dont les observations doivent être pondérées pour le calibrage du modèle. Cependant, nous discuterons ici du rôle des poids à l’intérieur d’un groupe et entre les différents groupes d’observation, à partir des recommandations fournies par Doherty and Hunt (2010), en les transposant à notre contexte d’étude.

Pondération entre les différents groupes

Parmi les groupes d’observations, la pondération doit être appliquée de manière à assurer que la valeur de la fonction objectif de chaque groupe soit significative dans la fonction objectif globale au début du processus de calibration. Cela garantit qu'aucun groupe ne soit ignoré durant le processus d’optimisation.

Cependant, lorsque le modèle d’écoulement a préalablement été calibré, la part relative des données de charge hydraulique dans la fonction objectif est normalement faible. L’objectif n’est, dans ce cas, pas de diminuer davantage la part de la fonction objectif correspondant aux mesures de charge hydraulique, mais de garantir un niveau suffisamment bas. Par conséquent, la visibilité du groupe d’observation des charges hydrauliques pourra alors être plus faible que celle du groupe d’observation des concentrations en contaminants dans la fonction objectif initiale.

Pondération à l’intérieur d’un groupe d’observation

A l’intérieur d’un groupe d’observation, un poids est attribué à chaque observation. L'une des approches consiste à attribuer un poids plus fort à une observation fiable, de manière à ce que sa contribution dans la fonction objectif soit plus importante. Un poids inversement proportionnel à l'écart-type de chaque observation est considéré comme le plus approprié. Afin d'estimer le poids des observations, il est nécessaire de réaliser une analyse de l'incertitude des observations, afin d’identifier toutes les sources d'incertitudes présentes dans l'ensemble des données de conditionnement.

Une autre solution consiste à appliquer un poids inversement proportionnel à la magnitude de chaque mesure de concentration. Dans ce cas, la pondération joue un rôle similaire à celui d’une transformation logarithmique de la fonction objectif (Doherty, 2010a).

4.3.7.5 Valeur cible de la fonction objectif

Lorsque la régularisation de Tikhonov est employée dans le processus d’estimation des paramètres, le poids du terme de régularisation dans la fonction objectif est ajusté de façon à atteindre un ajustement spécifié par une valeur cible de la fonction objectif. Plusieurs études ont montré que cette dernière a une forte influence sur l'estimation finale des paramètres, et doit par conséquent être choisie avec soin (Carniato et al., 2015; Fienen et al., 2009).

Le processus d’optimisation est stoppé lorsque la fonction objectif atteint la valeur spécifiée par l’utilisateur de manière à garantir que l’écart entre les données simulées et observée soit en accord avec les incertitudes provenant d’une part des erreurs de mesures des données d’observation et d’autre part des erreurs structurelles du modèle. En partant du principe que l’ensemble des incertitudes ait été correctement estimé, alors cette stratégie permet d’éviter le sur-ajustement (en anglais « overfitting ») des paramètres.

Comme indiqué au paragraphe précédent, il est essentiel d’identifier et de quantifier les sources d’incertitudes provenant des erreurs de mesures. Cependant, l’inadéquation entre les données simulées et observées, est généralement dominée par les incertitudes structurelles plutôt que par les erreurs de mesures (Gupta et al., 2012; Renard et al., 2010; Wellmann et al., 2014). Plusieurs études ont montré que l’erreur structurelle se caractérise par un degré élevé de corrélation des erreurs de chaque observation (Cooley, 2004; Cooley and Christensen, 2006; Doherty and Welter, 2010). Toutefois, la structure de la covariance des erreurs n’est jamais connue, et en utilisant un système de pondération représentant une erreur de mesure spatialement indépendante (tel que décrit aux paragraphes précédent), alors aucun bruit structurel n’est pris en compte dans le modèle.

Dans ce cas, il apparait que le choix d’une valeur cible de la fonction objectif prenant en compte l’erreur structurelle inévitablement présente dans le modèle mais non quantifiable, sera par principe subjectif, et dépendra de l’ajustement attendue par le modélisateur (Carniato et al., 2015; Doherty, 2010a; Yin, 2009). Deux « bonnes pratiques » peuvent être mises en œuvre afin de guider ce choix :

 Utiliser en première approche une valeur cible de la fonction objectif calculée sur la base des erreurs de mesures. Cette valeur correspond à la valeur minimale de fonction objectif à laquelle on peut prétendre.

 Vérifier les valeurs du jeu de paramètres calibrés. Une structure spatiale ou des valeurs de paramètre irréalistes sont le signe d’un sur-ajustement ou d'une tentative de compensation de l'erreur structurelle. Dans ce cas la valeur cible de la fonction objectif a été sous-estimée et doit être revue à la hausse.