• Aucun résultat trouvé

La validation des cartes journalières de distribution globale des quatre groupes de phytoplancton identifiés à partir des inventaires pigmentaires a été faite en utilisant les 20 % des échantillons qui ont été sélectionnés aléatoirement avant l’étape de labellisation, séparément pour chacun des 4 groupes de phytoplancton. Ce jeu de données de validation comprend 42 échantillons dominés par les nanoeucaryotes, 44 par Prochlorococcus, 54 par SLC et 10 par les diatomées (figure 4.7). Les mesures in situ relatives à chaque groupe ont été reliées aux pixels des cartes satellite journalières produites par PHYSAT-SOM (procédure de match-up) en les faisant correspondre à travers une fenêtre carrée de 3x3 pixels autour du pixel concerné. Précisons que chaque mesure coïncidente n’a été prise en compte pour la validation que si, au moins, 60 % des pixels valides de la fenêtre prise en compte portent le même label (c’est à dire, au moins 2/3, 3/4, 3/5, 4/6, 5/7, 5/8, ou 6/9 pixels portant le même label). Ce critère d’homogénéité des labels permet d’assurer une comparaison stricte entre les mesures in situ et les mesures satellite et, surtout, d’éviter les cas de bordures des structures (ou la présence de nuages), donnant une fiabilité aux résultats de l’exercice de validation. En

définitive, 40 échantillons dominés par les nanoeucaryotes, 43 par Prochlorococcus, 52 par SLC et 10 par les diatomées ont été gardés.

Figure 4.7. Distribution géographique des échantillons gardés pour la validation des résultats (en bleu les nanoeucaryotes, en vert Prochlorococcus, en Jaune SLC et en rouge les diatomées)

Le tableau 4.3, appelé matrice de confusion, montre le pourcentage de bonnes classifications pour chaque groupe de phytoplancton. On note que cette validation ne prend pas en compte les pixels caractérisés par une dominance de Phaeocystis-like puisqu’ils ont été identifiés en se basant sur la littérature, tel que fait par Alvain et al., (2008). Le tableau 4.3 montre que 66,7 % des inventaires pigmentaires dominés par les nanoeucaryotes sont associés à ce même groupe dans les cartes journalières produites par PHYSAT-SOM. Les identifications erronées de ce groupe sont principalement associées à des échantillons prélevés dans l’hémisphère Nord et le Pacifique Equatorial. Dans ces cas-là, les nanoeucaryotes sont associés de façon erronée à des spectres Prochlorococcus (19,05 %) et SLC (9,52 %).

Prochlorococcus et SLC sont correctement identifiés dans, respectivement, 58,07 % et 66,67 % des mesures in situ dominées par ces groupes. Il est intéressant de noter que la majeure partie des identifications erronées de Prochlorococcus soient associées à des échantillons dominées par SLC (dans 22,58% des mesures associées à Prochlorococcus). Ce

résultat n’est pas surprenant compte tenu des caractéristiques proches de ces cyanobactéries en termes de distribution géographique, taille et forme des cellules (Partensky et al., 1999 ; Zubkhov et al., 2000 ; Dandonneau et al., 2004 ; Longhurst et al., 2007 ; Flombaum et al., 2013) ainsi que l’amplitude et la forme de leurs signatures spectrales respectives (voir figure 4.5 et Alvain et al., 2012).

Une partie significative des inventaires pigmentaires dominés par les diatomées est correctement identifiée dans les cartes journalières de PHYSAT-SOM à 9 km de résolution (83 %). Les indentifications erronées des diatomées sont associées aux nanoeucaryotes. Ces échantillons sont localisés dans des eaux alternativement dominés par les diatomées et les nanoeucaryotes, essentiellement dans l’Atlantique Nord.

Tableau 4.3. Résultats de l’exercice de validation de la méthode PHYSAT-SOM. Pour chaque groupe de phytoplancton, le pourcentage des identifications valides (en rouge) et erronées (en noir) est indiqué. Les identifications erronées sont séparées par groupe (le nombre d’échantillons pris en compte pour chaque

groupe est indiqué entre parenthèses)

PHYSAT-SOM / IN SITU Nanoeucaryotes (40) Prochlorococcus (43) SLC (52) Diatomées (10)

Nanoeucaryotes 66,67 19,05 9,52 4,76

Prochlorococcus 19,35 58,07 22,58 0

SLC 20 13,33 66,67 0

Diatomées 16,67 0 0 83,33

Les résultats de la dernière validation de PHYSAT version 2008 (Alvain et al., 2008 et Alvain et al., 2012) sont affichés dans la tableau 4.4 pour comparaison. Notons que nous comparons ici les résultats de validation des deux méthodes uniquement à titre indicatif car la méthode développée dans ce manuscrit est basée sur un apprentissage à partir d’une plus large base de données de spectres (chapitre 3). Par ailleurs, la base de données in situ utilisée pour labelliser les neurones de la carte auto-organisatrice est également plus fournie que celle exploitée pour développer la méthode de 2008.

En comparant les tableaux 4.3 et 4.4, on constate que les nanoeucaryotes sont associés à plus d’identifications correctes avec la version 2008 de PHYSAT (82%) qu’avec la méthode développée durant cette thèse (PHYSAT-SOM) (66,67 %). Ceci dit, en comparant en détail

les résultats pour ce groupe, on observe que, pour les deux méthodes, les identifications erronées de nanoeucaryotes sont majoritairement associées à Prochlorococcus (19,05 % et 10 % respectivement pour PHYSAT-SOM et PHYSAT) et SLC (9,52 % et 5 % respectivement pour PHYSAT-SOM et PHYSAT). Ces mesures correspondent à des échantillons prélevés dans l’hémisphère Nord et le Pacifique Equatorial (Dans ce cas, les nanoeucaryotes sont identifiés SLC par les deux méthodes) (Alvain et al., 2008). Par ailleurs, les mesures correctement identifiées comme nanoeucaryotes par PHYSAT-SOM (par exemple autour des côtes australiennes de même que quelques points dans l’Atlantique Nord) sont associées au même groupe au niveau de ces zones avec la version 2008 de PHYSAT.

La plus grande partie des identifications erronées de Prochlorococcus et SLC est majoritairement associée à l’un ou l’autre groupe par les deux méthodes. De même, pour les diatomées, les fausses détections sont majoritairement associées aux nanoeucaryotes par les deux méthodes (dans respectivement 16,67 % et 24 % des cas avec PHYSAT-SOM et PHYSAT version 2008). Pour les deux approches, ces classifications erronées trouvent dans des zones alternativement dominées par les diatomées et les nanoeucaryotes (e.g. Atlantique Nord).

Tableau 4.4. Résultats de l’exercice de validation de la méthode PHYSAT version 2008 (en pourcentages)

PHYSAT / IN SITU Nanoeucaryotes Prochlorococcus SLC Diatomées

Nanoeucaryotes 82 10 5 3

Prochlorococcus 14 61 25 0

SLC 20 23 57 0

Diatomées 24 0 3 73