• Aucun résultat trouvé

2 Méthodologie globale

2.6 Procédure de calibration – Validation

La calibration d’un modèle consiste à trouver le jeu de paramètres représentant le mieux les données observées. Une fois calibré, un modèle doit être validé sur un jeu de données indépendant. Cette validation viendra confirmer que les paramètres trouvés correspondent au cas d’étude et ne sont pas un coup de chance mathématique.

2.6.1 Critères d’évaluation des modèles

Différents critères numériques permettent de quantifier la représentation des données par un modèle (Hauduc et al., 2011). Ainsi, le critère de la racine de l’erreur moyenne au carré (REMC, « Root mean square error » en anglais) est calculé par la somme suivante :

𝑅𝐸𝑀𝐶 = √∑(𝑥𝑜𝑠𝑏− 𝑥𝑠𝑖𝑚) 2 𝑛 [128] Où : - 𝑥𝑜𝑏𝑠 Observations de la variable 𝑥 - 𝑥𝑠𝑖𝑚 Simulation de la variable 𝑥 - 𝑛 Nombre d’observation

Le REMC calcule donc une erreur dont les unités sont les mêmes que celles des observations. De plus, les grandes erreurs sont très pénalisées par la puissance 2 de la formule.

Pour réduire l’influence des plus grands écarts entre la simulation et l’observation, il est possible de calculer l’erreur moyenne absolue (EMA, « Mean absolute error » en anglais).

𝐸𝑀𝐴 = ∑|𝑥𝑜𝑏𝑠− 𝑥𝑠𝑖𝑚|

𝑛 [129]

Dans le cas de l’EMA, les grandes erreurs ont moins de poids et les biais ressortent plus dans le critère. Le coefficient de corrélation de Pearson 𝑟 est également un critère couramment utilisé pour décrire la capacité d’une simulation à reproduire les tendances des observations.

𝑟 = 𝜎𝑜𝑏𝑠,𝑠𝑖𝑚

𝜎𝑜𝑏𝑠𝜎𝑠𝑖𝑚 [130]

Un coefficient 𝑟 de 1 ou de -1 signifie une corrélation parfaite entre les observations et les simulations. Le signe négatif signifie une corrélation inverse entre observations et simulations.

Finalement, un critère largement utilisé en hydrologie est le critère de Nash-Sutcliffe. Ce dernier compare la performance du modèle à la performance d’un modèle statistique simple : la moyenne des observations. L’équation [131] résume le calcul du critère de Nash-Sutcliffe.

𝑁𝑆 = 1 −∑(𝑥𝑜𝑏𝑠− 𝑥𝑠𝑖𝑚)

2

∑(𝑥𝑜𝑏𝑠− 𝑥̅̅̅̅̅̅)𝑜𝑏𝑠 2

[131] Si la simulation représente exactement les observations, le numérateur de l’équation [131] est nul et le NS est de 1. Il s’agit de la valeur optimale. À l’inverse, si la simulation représente moins bien la simulation que la moyenne des observations, le NS est négatif. Dans ce cas, la moyenne des

observations est une meilleure estimation des observations que le modèle. Le point de bascule du NS est à 0, c’est-à-dire lorsque le modèle est un prédicteur aussi performant que la moyenne des observations.

Le choix du critère dépend donc de l’optimisation qui est souhaitée. Par exemple, en hydrologie, si le débit des crues est l’information requise, le critère le plus adapté est le NS ou le REMC. À l’inverse, si les débits de base doivent être modélisés avec précision, l’EMA offrira de meilleurs résultats.

2.6.2 Algorithme d’optimisation

Il est possible de manipuler les paramètres d’un modèle manuellement jusqu’à ce que les résultats semblent optimaux à l’utilisateur. Cependant, en pratique, cette technique se révèle la plus lente et la moins précise. Dans le cadre de ces travaux, un seul algorithme d’optimisation a été utilisé : le Shuffled Complex Evolution (SCE-UA) développé par Duan et al. (1993). Cet algorithme utilise la méthode du Simplex de Nelder et Meade (1965) pour résoudre un problème d’optimisation globale en présence de nombreuses zones d’attraction et ayant une réponse fortement non-linéaire.

Le SCE-UA utilise la notion de complexe, c’est-à-dire un ensemble de 𝑛 + 1 jeux de paramètres du modèle capables d’évoluer à l’aide de la méthode du Simplex où 𝑛 est le nombre de paramètres du modèle.

1. Générer 𝑚 × (𝑛 + 1) jeux de paramètres et évaluer le score de chaque jeu de paramètre 2. Trier les jeux de paramètres en fonction de leur score

3. Construire 𝑚 complexes. Le premier complexe contient les jeux de paramètres 1, 𝑚 + 1, 2𝑚 + 1, …, le second contient les jeux 2, 𝑚 + 2, 2𝑚 + 2, …, et ainsi de suite.

4. Faire évoluer les complexes à l’aide de la méthode du Simplex durant un nombre prédéterminé d’itérations.

5. Rassembler tous les complexes, les trier et vérifier si un optimum a été atteint. Si ce n’est pas le cas, l’algorithme retourne à l’étape 3.

La méthode du SCE-UA est une méthode dite globale. Ainsi, l’ensemble de l’espace des paramètres peut être exploré et le véritable optimum peut être retrouvé. La méthode est donc lente, nécessitant l’évaluation de plusieurs centaines de jeux de paramètres pour des modèles simples, mais elle converge habituellement vers une solution globale.

Dans le cadre de ces travaux, les temps de calculs nécessaires pour la simulation ont été suffisamment courts pour permettre l’utilisation de la méthode SCE-UA dans tous les problèmes d’optimisation. 2.6.3 Optimisation séquentielle des différents modules hydrodynamiques

L’optimisation des paramètres du modèle hydrodynamique est réalisée séquentiellement. Quatre processus sont donc calibrés sur quatre jeux de données différents :

1. L’hydrodynamique

2. Le transport des espèces en suspension 3. L’érosion – sédimentation

4. Le transport des ETMs

Chacun de ces quatre processus dépend de tous les processus précédents et est indépendant des processus suivants.

1. Le module hydraulique (voir section 2.1.1) requiert la calibration du paramètre de Manning. Les données nécessaires à la calibration sont les débits entrant la rivière et les débits sortant. La comparaison entre les débits simulés sortants et les observations permet l’ajustement du paramètre de Manning.

2. Le module de transport des espèces en suspension (voir section 2.1.1) requiert la calibration de 3 paramètres : La dispersion D, l’aire de stockage transitoire 𝐴𝑠 et le taux d’échange entre

la rivière et la zone de stockage transitoire 𝛼 . Ce module peut être calibré à l’aide d’expériences de traçage sur le tronçon considéré.

3. Le module d’érosion – déposition (voir section 2.1.2) nécessite quatre paramètres par classe de particule : la vitesse de chute 𝑊𝑐, la constante d’érosion 𝑒, la contrainte de cisaillement

critique de sédimentation 𝜏𝑠𝑒𝑑 et la contrainte de cisaillement critique d’érosion 𝜏𝑒𝑟𝑜. Le

développement d’un modèle de rivière soumise à une hydrologie variable requiert au moins deux classes de particules pour pouvoir décrire les MES apportées par le bassin versant présentant un fort taux de sédimentation et celles, beaucoup plus fines ou légères, qui sédimentent très peu. L’utilisation de deux classes de MES implique donc la calibration de huit paramètres. Des mesures de MES récupérées dans des conditions très contrastées sont nécessaires pour espérer obtenir une calibration satisfaisante.

4. Le module de sorption – désorption ne requiert qu’un seul paramètre si le modèle de Kd fixe est utilisé. Ce paramètre, le Kd, peut être estimé à partir de la littérature ou calculé à partir des concentrations dissoutes et particulaires observées des ETMs. Si le modèle WHAM est utilisé, il est possible de l’utiliser avec le jeu de paramètres par défaut puisque le modèle est mécanistique et se veut une représentation chimique de la réalité (plutôt que conceptuelle ou statistique). Cependant, la physico-chimie de l’eau doit être mesurée précisément (ions majeurs, pH, température) de même que la nature des MES (teneur en acides humiques et fulviques, en oxydes de fer, de manganèse, d’aluminium et en argiles).