• Aucun résultat trouvé

L’estimation des caractéristiques de la qualité de l’eau aux sites non jaugés

4. Méthodologie

4.4 L’estimation des caractéristiques de la qualité de l’eau aux sites non jaugés

À notre connaissance, aucun travail n’a été fait auparavant pour l’estimation des caractéristiques de la qualité de l’eau des sites non jaugés. Nous présentons deux modèles pour l’estimation des valeurs moyennes de la qualité de l’eau aux sites non jaugés. Le premier modèle est fondé sur les réseaux de neurones artificiels (RNAs) et le deuxième modèle est basé sur l’analyse de corrélation canonique (ACC) et les RNAs. Un modèle d’ensemble de RNAs est développé pour établir la relation fonctionnelle entre la valeur moyenne de la qualité d’eau et les attributs du bassin. Dans le modèle basé sur l’ACC et les RNA, l’ACC forme un espace d’attributs canonique avec des données de sites jaugés. Ensuite, une analyse de RNA est appliquée pour identifier les relations fonctionnelles entre les valeurs moyennes de qualité de l’eau et les attributs dans l’espace de l’ACC. Les deux modèles sont appliqués à 50 sous-bassins versants dans le delta du Nil en Égypte. Une procédure de validation par ré-échantillonnage « jackknife » est utilisée pour évaluer la performance des deux modèles.

32 Identification des USs

Répéter pour chaque variable Identification des caractéristiques des

USs

Conception Échantillonnage stratifié optimal

Identification des variables

(ACP)

Pour chaque site de surveillance

Reconfiguration

Identification des sous-régions (Analyse Cluster)

Pour chaque variable, identifier la meilleure

variable auxiliaire

Minimum (Var

( )

µˆ )

Calcul de l’indice de performance pour chaque combinaison (Ia)

Identifier les combinaisons des sites )! ( ! ! k w k w Cwk − =

Triage des sites base sur Ia

Figure 3. Schéma de l’approche proposée pour la reconfiguration des sites d’échantillonnage

D’abord, on divise le delta du Nil en sous-bassins versants qui sont des zones représentant des USs; ces zones sont chacune drainées par un seul point sur le système de drainage. La qualité de l’eau à chacun de ces points décrit l’effet des attributs naturels et anthropiques de l’US sur l’état de la qualité de l’eau. La préparation des données se compose de deux étapes principales. Dans la première étape, neuf des attributs qui expliquent les différents effets naturels et anthropiques sont identifiés pour chaque US. Dans la seconde étape, l’ACP est utilisée pour choisir quatre

33

indicateurs de la qualité de l’eau à partir des 33 variables mesurées. Les quatre variables de qualité de l’eau sélectionnées sont la demande biochimique en oxygène (BOD), les solides volatiles totaux (TVS), l’azote total (TN) et les solides dissous totaux (TDS).

Les modèles proposés dans cette étude sont basés sur la relation fonctionnelle entre les attributs de l’US et les variables choisies pour la qualité de l’eau à chaque US jaugée. Le premier modèle est basé principalement sur les réseaux de neurones artificiels, tandis que le second modèle utilise l’ACC et les RNA. Dans le premier modèle, on emploie un ensemble de RNAs (« ERNA ») avec une couche d’entrée, une couche cachée et une couche de sortie pour chacune des composantes de l’ERNA. Les entrées sont les attributs de l’US et les sorties sont les valeurs moyennes des indicateurs sélectionnés pour la qualité de l’eau. Une fonction de transfert de type tangente-sigmoïde est utilisée pour les nœuds de la couche cachée, tandis que pour les nœuds de sortie, la fonction de transfert est linéaire. Dans cette étude, une analyse de sensibilité est effectuée afin de déterminer le nombre optimal de nœuds cachés. En faisant varier le nombre de neurones cachés de trois à quinze, on remarque que les RNA avec sept neurones cachés fournissent l’estimation la plus précise quand ils sont appliqués pour estimer les valeurs moyennes pour les indicateurs sélectionnés pour la qualité de l’eau. Différentes tailles d’ensemble, variant de 5 à 20, ont été appliquées dans cette étude. Les résultats indiquent que l’erreur d’estimation diminue progressivement lorsque la taille d’ensemble augmente jusqu’à 15. Au-delà d’une taille de 15, il n’y a aucune amélioration de l’erreur d’estimation. Ainsi, un ensemble de taille 15 est utilisé dans le présent document. La procédure « bagging » est choisie pour générer des réseaux individuels qui comprennent les RNA et la moyenne simple est utilisée pour combiner les résultats de chaque RNA.

34

Dans le second modèle, le modèle ERNA dans l’espace ACC est utilisé pour établir la relation fonctionnelle entre les valeurs moyennes de la qualité de l’eau et les attributs des USs. L’ACC est utilisée pour former un espace canonique des attributs en utilisant les attributs aux les USs jaugées. Les modèles d’ensemble de RNA sont ensuite utilisés pour identifier les relations fonctionnelles entre les valeurs moyennes de la qualité de l’eau et les attributs de l’US dans l’espace d’ACC. Les modèles ERNA dans l’espace ACC ont la même structure, la même fonction de transfert, le même nombre de neurones dans la couche cachée et le même nombre de composants RNA que ceux définis pour le modèle ERNA. Les réseaux des composants dans les modèles ERNA-ACC sont produits avec l’approche « bagging », et les réseaux qui en résultent sont combinés par moyenne simple.

Une procédure de ré-échantillonnage « jackknife » est utilisée pour comparer les performances relatives des modèles ERNA et ERNA-ACC. Dans cette procédure, les valeurs moyennes de la qualité de l’eau à chaque US jaugée sont temporairement supprimées; ainsi l’US est considérée comme étant non jaugée. Ensuite, chaque modèle est calibré avec les données mesurées des autres USs. Une estimation de la moyenne de chaque variable de la qualité de l’eau est obtenue pour l’US temporairement supprimée en utilisant des modèles calibrés, puis les estimations sont comparées par rapport aux valeurs moyennes calculées à partir des enregistrements observés. Les évaluations sont réalisées en utilisant les cinq indices suivants: le critère de Nash (NASH), la racine carrée de l’erreur (RMSE), la racine carrée de l’erreur relative (RMSEr), le biais moyen (BIAS) et le biais relatif moyen (BIASr). Les détails concernant les deux modèles et les résultats

35

Documents relatifs