• Aucun résultat trouvé

4. Interprétation hydrogéochimique

4.3. Statistiques multivariées (SOMs)

Afin d’explorer un peu plus le jeu de données et particulièrement de mettre en évidence les relations entre les paramètres analysés, des statistiques multivariées ont été appliquées. Plus précisément, la méthode appliquée, appelée méthode des matrices auto-organisantes ou ‘self organizing maps - SOMs’ en anglais, est une méthode de statistiques multivariées non-linéaire et non-hiérarchique (Kohonen, 2001). La méthode est décrite de manière plus détaillée à l’annexe 2. Cette méthode permet dans un premier temps de dégager, si elles existent, des relations multivariées (potentiellement non linéaires) entre les données explorées, à savoir ici des analyses chimiques et isotopiques (Peeters et al., 2007, Gamble & Babber-Sebbens 2011). Dans un deuxième temps, la méthode permet de regrouper les échantillons en fonction de caractéristiques communes, par exemple ici l’origine de l’eau souterraine et des polluants qu’elle véhicule et des processus géochimiques qui influencent sa composition. Des caractéristiques chimiques communes à chaque groupe d’échantillons peuvent ainsi être déterminées. Ces caractéristiques sont ensuite interprétées en vue de mettre en évidence l’origine du nitrate et les principaux processus ayant le plus influencé la composition chimique pour chacun des groupes. La méthode a été appliquée en utilisant le « package » ‘SOMtoolbox’ (Vesanto et al., 2000) disponible sous MatLab. Ce package comporte une série de procédure d’analyse statistiques des données et d’interprétation des résultats obtenus. L’expérience de l’utilisation des SOMs sur des données hydrochimiques nous a démontré qu’il est inutile de vouloir traiter dans sa globalité le jeu de données hydrochimiques disponibles. En effet, si des corrélations fortes et évidentes lient certains paramètres entre eux (ex : Ca et HCO3), ces

corrélations vont masquer les autres relations éventuelles entre les données. Il vaut donc mieux prédéfinir un set de paramètres qui cible ce que l’on cherche à mettre en évidence. Dans cette étude, l’objectif est de discriminer les sources de contamination en nitrate. Les paramètres considérés qui ont été choisis sont le nitrate (paramètre à discriminer), le potassium, le sodium et le chlore (indicateur de contamination anthropique), le sulfate (indicateur de condition redox et de dénitrification), le bore et l’isotope 11B du bore (indicateur de contamination urbaine). La Figure 22

ayant montré que les isotopes du nitrate (15N et 18O) n’étaient pas très discriminant en matière de

source de pollution, ils n’ont pas été retenus dans les paramètres à utiliser. Cette combinaison d’isotopes trouverait son intérêt dans une analyse qui tourne autour des processus de dénitrification. La ‘matrice par composant’ permet de mettre en évidence les corrélations entre paramètres (Figure 25). La même matrice est représentée une fois pour chaque paramètre, donc 7 fois. Elle correspond ici à 15x11 échantillons « fictifs », semblables aux échantillons du jeu de données. Pour chaque matrice, les zones rouges correspondent aux teneurs les plus élevées du paramètre correspondant, tandis que les zones bleues correspondent aux teneurs les plus basses du même paramètre. Sur base d’algorithmes intégrés dans la procédure d’application des SOMs, quatre groupes ont été déterminés au sein de la matrice sur base de la ressemblance entre les échantillons fictifs qui la constituent. Sur cette matrice, chaque échantillon du jeu de données est projeté et associé à l’échantillon fictif qui lui ressemble le plus.

42 Figure 25 : Matrice par composant et groupes définis au sein de la matrice par la méthode des SOMs

Cette division en groupes est appliquée à la ‘matrice par composant’ (Figure 26) et délimitent ainsi les caractéristiques de chaque groupe (reprises au Tableau 5). Les symboles utilisés sont les suivants : ++ : concentrations ou rapports isotopiques les plus élevés du jeu de données

+ : concentrations ou rapports isotopiques élevés dans le jeu de données

o : concentration ou rapports isotopique moyens par rapport au jeu de données - : concentrations ou rapports isotopiques bas dans le jeu de données

-- : concentrations ou rapports isotopiques les moins élevés du jeu de données x : concentrations ou rapports isotopiques variés (des plus élevés aux plus bas).

43 Figure 26 : Matrice SOMs par composant et délimitation des groupes définis sur base de la ressemblance entre les échantillons fictifs

qui la constituent

Tableau 5 : Caractéristique par paramètres de chaque groupe délimité par la méthode SOMs

Groupe K Na Cl NO3 SO4 B 11B

1 + + ++ ++ o o ++

2 ++ ++ ++ - + ++ --

3 - - o x x -- +-

4 + -- -- -- - - -

Le groupe 1 inclut 15 échantillons dont la majorité est située en contexte agricole. Les concentrations sont élevées pour l’ensemble des paramètres à l’exception du sulfate et du bore qui présentent des concentrations relativement moyennes. Le rapport isotopique élevé du 11B ainsi que la

contamination importante en nitrate et l’occupation du sol aux abords des ouvrages amènent à penser que ce groupe 1 peut être associé à des contextes où l’origine du nitrate est essentiellement agricole.

Le groupe 2 inclut 24 échantillons essentiellement situés en contexte urbain ou péri-urbain (écoulement des eaux souterraines en provenance d’un contexte urbain). Les concentrations sont élevées pour l’ensemble des paramètres à l’exception du nitrate et du 11B qui présentent des

44 retrouvent dans ce groupe. Ces informations amènent à penser que ce groupe 2 peut être associé à des contextes où l’origine du nitrate est essentiellement urbaine.

Le groupe 3 inclut 30 échantillons issus de contextes variés. Il présente des concentrations faibles en potassium, sodium et bore, faible à moyenne en chlore et élevées en 11B. Les concentrations en

nitrate et sulfates sont assez variables. Les ouvrages sont situés tant dans un contexte agricole que péri-urbain, ce groupe correspond donc plutôt à une origine mixte du nitrate.

Le groupe 4 inclut 14 points et regroupe la quasi-totalité des eaux de surface ainsi que des ouvrages situés en contexte forestier et de prairies. Les valeurs sont faibles pour l’ensemble des paramètres à l’exception du potassium qui présentent des concentrations assez élevées. Les concentrations en nitrate sont les plus basses du jeu de données. Ce groupe correspond donc probablement à un contexte où les eaux (de surface et souterraines) sont relativement protégées par rapport à des contaminations directes par les sources de nitrate d’origine agricole ou urbaine.

La répartition spatiale des points en fonction des groupes définis par les SOMs est présentée à la Figure 27.

La relation groupe/occupation du sol/contexte n’est pas parfaite mais fonctionne relativement bien pour la majorité des ouvrages. Cependant, quelques points ne correspondent pas au contexte décrit. Pour la plupart d’entre eux, il s’agit d’ouvrages pour lesquels les analyses disponibles ne sont pas complètes (éléments majeurs et/ou isotopes). Ce manque d’information biaise peut-être le traitement statistique qui leur est appliqué et montre clairement l’importance d’avoir un jeu de données complet.

45 Figure 27 : Répartition spatiale des ouvrages en fonction du groupe d’appartenance défini par la méthode des SOMs

46

Documents relatifs