• Aucun résultat trouvé

5. Résultats et discussion

5.3 Fluorescence Modélisation PARAFAC

5.3.2 Détermination du nombre de composantes

Lors de l’analyse exploratoire des modèles comportant de 2 à 7 composantes ont été comparés et analysés. Cela a été fait à l’aide d’un programme Matlab (voir la méthodologie à la section 4.5) sur les échantillons des campagnes 2009-2010 et 2011 de l’UTE de Québec et ce pour l’eau

Type d’eau Campagne visée Nombre

d’échantillons Période d’échantillonnage

Eau brute 2009-2010 et 2011 44 15 éch. du 27 janvier au 28 juin 2010* 29 éch. du 9 mai au 23 novembre 2011 Eau décantée 2009-2010 et 2011 43 13 éch. du 27 janvier au 28 juin 2010 30 éch. du 9 mai au 23 novembre 2011 Eau ozonée 2009-2010 (laboratoire) 2011 (usine) 42 13 éch. du 27 janvier au 28 juin 2010 30 éch. du 9 mai au 23 novembre 2011

79 brute (n=44), décantée (n=43), ozonée (n=42) et filtrée (n=28) (voir Tableau 5-7). Un résumé de l’analyse exploratoire pour les échantillons d’eau brute est présenté dans cette section. Le même type d’analyse a été fait pour les autres groupes d’échantillons et a abouti aux mêmes conclusions (voir Annexe H). Il est à noter qu’une contrainte de non-négativité fut appliquée à tous les modèles. Cette contrainte de non-négativité exclut les valeurs négatives inférieures à zéro des algorithmes du programme pour les régressions linéaires.

Eau brute – UTE Québec

Les premiers tests faits suivant la méthode PARAFAC consistent à explorer les données pour identifier les échantillons aberrants, des artéfacts ou d'autres problèmes potentiels avec les données qui ne sont pas forcément identifiés lors d’une analyse visuelle des MEE. Les échantillons considérés comme des valeurs aberrantes au modèle sont retirées de l’ensemble des données.

Dans le cas de l’eau brute, seulement l’échantillon du 29 août 2011 (n°32) a été enlevé. L’échantillon du 29 août obtient les valeurs maximales en termes d’absorbance UV et de COD. La Figure 5-19 présente un spectre 2D typique de l’eau brute (28 janvier 2010, n°1) et l’échantillon du 29 août 2011 (n°32) qui a été écarté. Les deux pics identifiés sont le pic A et le pic C associés respectivement aux acides humiques et fulviques.

28 janvier 2010 Spectre typique

29 août 2011 Spectre exclut Figure 5-19: Spectre 2D individuel d’eau brute

Visuellement les spectres ne sont pas distincts, mais au point de vue de l’intensité de la fluorescence une différence est notable. L’échantillon du 29 août est décelé par PARAFAC comme un échantillon aberrant comme cela est montré à la Figure 5-20.

Ex. (nm) E m . (n m ) sample nr 1 250 300 350 400 200 250 300 350 400 450 500 550 600 R .U . 0 1 2 3 4 5 6 7 8 9 10 11 Ex. (nm) E m . (n m ) sample nr 32 250 300 350 400 200 250 300 350 400 450 500 550 600 R .U . 0 2 4 6 8 10 12 14 16 18

80

Figure 5-20: PARAFAC: Recherche des valeurs aberrantes

Ensuite, plusieurs tests statistiques ont été effectués pour évaluer des modèles de 2 à 7 composantes. Tel que mentionné à la section 4.5.5, dans la littérature, un maximum de 8 composantes a été noté. Dans notre cas, la prémisse de base fut une analyse entre 2 et 7 composantes, c’est ce qui est proposé dans Stedmon et Bro (2008). Il faut savoir que plus le nombre de composantes est élevé, plus le temps d’analyse est long, cela peut représenter jusqu’à une trentaine de minutes pour 7 composantes. La Figure 5-21 présente la somme des carrés des résidus pour un modèle avec 2 à 7 composantes. Il est possible d’observer que le modèle à 5 composantes offre peu d’amélioration comparativement au modèle à 4 composantes; d’ailleurs les sommes des carrés des résidus pour les modèles de 4 à 7 composantes sont très proches les unes des autres. De plus, le modèle à 5 composantes n’est pas validé que ce soit du point de vue des propriétés spectrales des composantes (voir Figure 5-22), du test d’initialisation aléatoire ou encore de celui de Tucker (voir section 4.5.5). Quant au modèle à 2 composantes, la somme des carrés est très variable. Le modèle à 3 composantes est définitivement plus stable.

81 Figure 5-21: Somme des carrés des résidus pour les modèles de 2 à 7 composantes – Eau brute

Figure 5-22: Spectres 1D des émissions et excitations pour les modèles à 5 composantes (à gauche) et à 3 composantes (à droite) – Eau brute

L’analyse des deux sous-ensembles, où la base de données est séparée en deux et comparées. (voir section 4.5.5), a permis de démontrer que, pour les modèles à 3 et 4 composantes, les profils d’émission et d’excitation sont similaires (considérés comme étant robustes). De plus, le test basé sur le coefficient de congruence de Tucker valide le modèle à 3 et 4 composantes. La variance pour le modèle à trois composantes est de 99,78% et de 99,85% pour celui à 4 composantes (voir section 4.5.5). La Figure 5-23 présente les résultats en 2D de la modélisation pour trois et quatre composantes.

82

Figure 5-23: Modèle à

Les composantes C1 et C2 des modèles ne sont pas présentées car elles sont les mêmes pour les deux modélisations. Le modèle à trois composantes (en vert) présente la composante C3 et celui à quatre composantes (en bleu) présente la composante C3 et C4. Sur

(modèle à trois composantes), pour l’émission, il est possible d’observer un épaulement à droite du pic situé à 400 nm. Sur le modèle à

ce tant pour la composante C3 que C4. De plus, les pics du modèle à quatre composantes sont relativement près l’un de l’autre, à 395 nm (C4) et 425 nm (C3). La composante C3 a un second pic à 475 nm et un troisième pic à 520 nm. La composante C4 a un deuxième épaulement en émission commençant à des longueurs d’onde supérieures à 475 nm. La décomposition du modèle en quatre composantes induit plus d’épaulements que celui à trois composantes, ce modèle fait l’hypothèse que jusqu’à quatre composantes pourraient être identifiées ayant

> 400 nm. Concrètement, une seule substance a été identifiée pour

: Modèle à trois (C3) et à quatre composantes (C3 et C4) – Eau brute

Les composantes C1 et C2 des modèles ne sont pas présentées car elles sont les mêmes pour les deux modélisations. Le modèle à trois composantes (en vert) présente la composante C3 et celui à quatre composantes (en bleu) présente la composante C3 et C4. Sur la

, pour l’émission, il est possible d’observer un épaulement à droite du pic situé à 400 nm. Sur le modèle à quatre composantes, l’épaulement est toujours présent et ce tant pour la composante C3 que C4. De plus, les pics du modèle à quatre composantes sont relativement près l’un de l’autre, à 395 nm (C4) et 425 nm (C3). La composante C3 a un second et un troisième pic à 520 nm. La composante C4 a un deuxième épaulement en émission commençant à des longueurs d’onde supérieures à 475 nm. La décomposition du modèle en quatre composantes induit plus d’épaulements que celui à trois composantes, ce

jusqu’à quatre composantes pourraient être identifiées ayant > 400 nm. Concrètement, une seule substance a été identifiée pour λémission > 400 nm et

Eau brute

Les composantes C1 et C2 des modèles ne sont pas présentées car elles sont les mêmes pour les deux modélisations. Le modèle à trois composantes (en vert) présente la composante C3 et la Figure 5-23 , pour l’émission, il est possible d’observer un épaulement à droite quatre composantes, l’épaulement est toujours présent et ce tant pour la composante C3 que C4. De plus, les pics du modèle à quatre composantes sont relativement près l’un de l’autre, à 395 nm (C4) et 425 nm (C3). La composante C3 a un second et un troisième pic à 520 nm. La composante C4 a un deuxième épaulement en émission commençant à des longueurs d’onde supérieures à 475 nm. La décomposition du modèle en quatre composantes induit plus d’épaulements que celui à trois composantes, ce jusqu’à quatre composantes pourraient être identifiées ayant λémission

83 275 nm qui est un mélange entre les substances humiques marines (pic M) et le tryptophane (pic T) (voir le Tableau 3-1). C’est seulement le modèle à cinq composantes qui permet d’identifier plus clairement le tryptophane (λÉm = 340 nm et λEx = 280 nm). Par contre, le modèle à cinq composantes, tout comme le modèle à 6 et 7 composantes, n’est pas validé contrairement au modèle à 3 et 4 composantes. La Figure 5-24 montre le modèle à cinq composantes pour l’eau brute de l’UTE de Québec. Il ressort que le tryptophane (pic T) n’apparait clairement qu’avec le modèle à 5 composantes.

Figure 5-24: Modèle à cinq composantes (C5) – Eau brute

Les analyses détaillées de l’eau décantée, ozonée et filtrée sont présentées à l’Annexe H. Finalement, des modèles à 3 composantes ont été produits pour tous les types d’eau puisque pour les eaux traitées, les modèles avec plus de 3 composantes n’étaient pas validés. Dans la littérature, le choix du nombre de composantes n’est pas documenté, il n’est donc pas possible de savoir comment les auteurs ont fait le choix du modèle. Sur tous les spectres individuels d’eau brute, aucune quatrième substance n’est perceptible. De plus, l’une des trois substances, le pic T associé au tryptophane), n’est pas facilement identifiable puisqu’il est positionné dans l’enchevêtrement au bas de la pente du pic A et du pic C tel qu’il a été expliqué à la section 5.2 et la Figure 5-11.

En résumé, un modèle à 3 composantes a été sélectionné puisqu’il s’agit du modèle avec le plus de composantes, ayant la plus grande variance, le plus robuste (test des sous-ensembles), et ce, autant pour l’eau brute que pour les eaux traitées.