• Aucun résultat trouvé

4.2.1. Identification des groupes de phytoplancton à partir des données in situ

Afin d’identifier les groupes de phytoplancton dans les inventaires pigmentaires, l’approche basée sur les seuils de la concentration relative en pigments biomarqueurs (Alvain et al., 2005 et 2008), décrite dans le chapitre 2, a été appliquée aux données précédemment présentées. Selon les seuils sur les pigments utilisés, 759 inventaires parmi les 1068 mesures

in situ (soit 71 % du total des données coïncidentes à une mesure satellite) ont pu être associés à 4 groupes de phytoplancton dominants (tableau 4.2). Le reste des échantillons (309) correspondent soit à des compositions mixtes, soit à des inventaires non identifiés avec les critères utilisés. Dans le cadre de cette thèse, on a uniquement considéré les cas de dominance afin d’être le plus proche possible des hypothèses de développement de la méthode PHYSAT

originale de façon à simplifier la comparaison des résultats. Parmi les 759 inventaires identifiés, 20 % des échantillons ont été sélectionnés d’une manière aléatoire et séparément pour chacun des 4 groupes de phytoplancton, ces derniers seront utilisés pour l’étape de validation des cartes journalières de distribution des groupes phytoplanctoniques produites par PHYSAT-SOM. Les 609 échantillons restant (correspondant à 609 spectres de Ra coïncidents) ont été utilisés pour affecter un groupe de phytoplancton aux différents neurones.

Tableau 4.2. Nombre d’échantillons associés à chaque groupe de phytoplancton identifié à partir des inventaires de pigments

Groupe Nombre d'échantillons/Total Nanoeucaryotes 216 / 759 (28,45 %) Prochlorococcus 213 / 759 (28,06 %) SLC 278 / 759 (36,62 %) Diatomées 52 / 759 (6,87 %) 4.2.2. Procédure de labellisation des spectres de Ra classés avec SOM

La procédure de labellisation (ou étiquetage) des anomalies spectrales est basée sur la projection des spectres de Ra, associés empiriquement à des groupes dominants, sur la carte auto-organisatrice entrainée. Cette projection est réalisée par l’intermédiaire de la fonction d’affectation de SOM (voir chapitre 3). Puisque chaque spectre est associé à un groupe de phytoplancton particulier, cette procédure va nous permettre d’associer chaque groupe à un ou plusieurs neurones (neurones gagnants ou BMU), dont les vecteurs référents sont les plus proches de ce spectre au sens de la distance euclidienne, tel que ça a été expliqué dans le chapitre 3. Une fois cette projection effectuée, les spectres de Ra se trouvent distribués sur les 100 neurones de la carte auto-organisatrice. Chaque neurone capte une quantité d’information spécifique et peut donc être associé à :

- Un ou plusieurs spectres ayant le même label (cas 1), - Plusieurs spectres associés à différents labels (cas 2), - Aucun spectre (cas 3).

Pour chaque neurone de SOM, on calcule ensuite la fréquence relative des spectres de Ra affectés lors de la projection de la base de données in situ. Cette fréquence donne une information sur la proportion de données in situ associée à chaque unité de la carte

auto-organisatrice. Elle est calculée séparément pour chaque groupe de phytoplancton en divisant, pour chaque neurone, le nombre de spectres relatifs à un groupe donné et affectés à ce neurone par le nombre total de spectres correspondant à ce groupe de phytoplancton :

. ( )

groupe groupe

N Neurone

F R Neurone

N Total

(Eq. 4.1)

Ce choix de calcul a été fait dans le but de tenir compte du label plutôt que du nombre de spectres qui diffère d’un groupe à un autre, pouvant introduire un biais dans la labellisation des neurones (Les SLC sont par exemples associés à 37 % des mesures in situ contre seulement 7 % pour les diatomées en raison de la dominance relative des cyanobactéries sur de larges échelles spatiales, contrairement aux diatomées qui représentent un groupe aux floraisons intenses mais plutôt locales).

Dans le premier cas (un ou plusieurs spectres ayant le même label), le neurone prend le label du spectre affecté. Pour le deuxième cas (plusieurs spectres associés à différents labels), une étape supplémentaire est nécessaire pour labelliser ce type de neurones : si, au moins 50 % de la fréquence relative des spectres de Ra captés ont le même label, le neurone prend ce label ; sinon il prend l’étiquette « pas de dominance spécifique ». Pour le cas 3 (aucun spectre), les vecteurs référents de ces neurones ne sont associés à aucun spectre de Ra. Ces vecteurs référents correspondent à des spectres de Ra qui ne sont pas représentés dans ce jeu de données in situ. Les neurones correspondant ne sont, par conséquent, pas labellisés mais pourraient l’être si des données in situ supplémentaires sont disponibles à l’avenir. Par ailleurs, seuls les neurones ayant une fréquence relative de spectres affectés supérieure à 0,025 (ce qui représente 3 spectres en moyenne, tous groupes confondus) ont été pris en compte dans le but de garder uniquement les vecteurs référents associés à une part significative de données in situ.

Les fréquences relatives des spectres labellisés associés aux 100 neurones de SOM sont représentées sur la figure 4.2. Notons que tous les spectres coïncidents pris en compte pour la labellisation de la carte auto-organisatrice (609) ont été capturés par au moins un neurone. Tous les spectres de la base de données in situ projetés sur la carte auto-organisatrice ont une erreur de quantification vectorielle inférieure à l’erreur maximale associée au neurone gagnant (Q.E maximale calculée d’après les données d’apprentissage). De ce fait, aucun seuil

sur l’écart-type n’a été appliqué pour cette phase de labellisation. Toute l’information in situ disponible pour l’étiquetage des neurones a donc été conservée.

Tel que le montre la figure 4.2, 14 neurones n’ont été affectés à aucun spectre (cas 3). Les spectres associés à un seul groupe phytoplanctonique (1er cas) ont été affectés à 12 neurones. Enfin, les neurones dont le vecteur référent a capté des spectres associés à différents groupes de phytoplancton (2ème cas) sont les plus fréquents (74 %).

Figure 4.2. Fréquence relative des labels associés aux spectres de Ra répartis sur les 100 neurones de la carte auto-organisatrice

Une fois que tous les critères de labellisation décrits précédemment sont appliqués, 44 neurones sont affectés à l’un des 4 groupes de phytoplancton ou à l’étiquette « pas de dominance spécifique », les 56 neurones restants ayant une fréquence relative de spectres associés inférieure à 0,025 ou appartenant au troisième cas. Ces neurones n’ont pas été affectés à un groupe phytoplanctonique dans le cadre de cette étude, cependant, ils représentent une information spectrale potentiellement exploitable dès lors que des données in

situ supplémentaires seraient disponibles ou lors d’études non focalisés sur les cas de dominances seuls. En outre, tel que précisé dans le chapitre 3, le choix d’un grand nombre de neurones vise en premier lieu à avoir une discrétisation très fine des spectres d’anomalies. Leur labellisation dépendra des données in situ utilisées. D’après la figure 4.2, cinq neurones

sont associés aux diatomées et neuf aux nanoeucaryotes. Les SLC se retrouvent plus souvent affectés à des neurones sans dominance spécifique, mélangés avec les Prochlorococcus. Ceci est à mettre en relation avec le fait que ces deux groupes soient associés à des environnements bio-optiques proches (Alvain et al., 2012) et dominent souvent les mêmes zones géographiques. Les assemblages dominants de SLC ont été affectés à six neurones.

La figure 4.3 représente la carte bidimensionnelle des spectres référents avec les fréquences relatives des groupes de phytoplancton pour les neurones portant un label de dominance (les compositions mixtes ne sont pas représentées par un camembert). L’ordre topologique sur la forme et l’amplitude des spectres de Ra induit par l’algorithme SOM est en concordance avec la position des différents labels sur la carte bidimensionnelle. En effet, les groupes de phytoplancton occupent une zone particulière de la carte et se retrouvent affectés à des neurones adjacents (qui sont donc similaires en termes de forme et d’amplitude), à l’exception des diatomées qui se retrouvent affectés à des zones différentes de la carte, avec, par conséquent, des signatures spectrales différentes pour un même groupe phytoplanctonique, ce qui représente une nouveauté par rapport aux résultats de la méthode PHYSAT dans sa version de 2008.

Figure 4.3. Représentation des fréquences relatives des groupes de phytoplancton dominants sur la carte bidimensionnelle des spectres référents. Sont représentés en bleu les nanoeucaryotes, en vert les Prochlorococcus, en jaune les SLC et en rouge les diatomées(les labels des neurones portant l’étiquette « pas

de dominance spécifique » ne sont pas représentés sur cette figure). On note la concordance entre l’ordre topologique des spectres et les labels affectés.

D’après l’étude théorique d’Alvain et al. (2012), il est possible que des mêmes groupes de phytoplancton soient associés à des spectres de Ra différents. La forme et l’amplitude de ces spectres étant sous l’influence de plusieurs paramètres optiques (voir chapitre 2), ces différentes signatures ne correspondraient nécessairement pas à différentes espèces, mais pourraient être associées à des environnements optiquement différents. Les différentes signatures spectrales associées aux diatomées seront analysées plus en détails dans le prochain chapitre.

En plus des quatre groupes de phytoplancton identifiés à partir des inventaires pigmentaires, les cartes précédemment produites par la méthode PHYSAT (Alvain et al., 2008) ont permis de détecter un groupe supplémentaire, appelé Phaeocystis-like, en raison de sa labellisation basée sur des études bibliographique et non pas à partir de mesures in situ. Les spectres de Ra correspondant aux pixels appartenant à ce groupe dans la version de PHYSAT-2008 (principalement le mois de Janvier au niveau de l’Océan Austral) ont été projetés sur les vecteurs référents de la carte auto-organisatrice entrainée. Ces spectres ont été « captés » par deux neurones adjacents, labellisés à leur tour « Phaeocystis-like ».

4.3. Analyse des formes et amplitudes des spectres associés aux groupes