• Aucun résultat trouvé

2 -ANALYSE STATISTIQUE DES DONNÉES

MATERIELS ET METHODES

2 -ANALYSE STATISTIQUE DES DONNÉES

Le développement d’une méthode d’analyse automatisée des données, et plus particulièrement la détermination des groupes phytoplanctoniques, constitue un travail fondamental car destiné à traiter le grand nombre de fichiers générés par la haute fréquence d’analyse (1 analyse par heure). Afin d’adapter les méthodes de clustering aux signatures optiques, les trois caractéristiques essentielles que sont la forme, l'intensité et la longueur de chaque fonction sont prises en compte. Le schéma général de la méthode appliquée (Figure 3) repose sur le calcul de matrices de distance, effectué en séparant les descripteurs en plusieurs blocs. Une fois normalisés et pondérés ces derniers sont couplés pour former la matrice de distance globale. Les individus sont ensuite projetés dans un espace à dimension réduite grâce à une technique de multidimensional scaling (Kruskal et Wish, 1978)

qui permet de déterminer les coordonnées des individus à partir d’une matrice de distance. Les méthodes de partitionnement telles que les K-medoids, la Fuzzy analysis (Kaufman et Rousseeuw, 2005) ou encore le Model based clustering (Fraley et Raftery, 2002) sont alors appliquées.

Le trop grand nombre de particules composant chaque échantillon (plusieurs dizaines de milliers) ne permet pas d’appliquer la méthode de classification automatisée sur la globalité des données. Le calcul de matrices de distances pour un nombre d’individus aussi grand s’avère être très long. De plus, les méthodes de partitionnement sont beaucoup moins efficaces quand l’abondance des différents groupes de particules est hétérogène (Malkassian et al., 2011). C’est en général le cas pour les données de cytométrie en flux. Pour pallier ces différents problèmes nous proposons donc d’appliquer une méthode semi-automatique faisant intervenir dans la phase initiale l’opérateur/expert en cytométrie afin de choisir le nombre de groupes présents et de les détourer manuellement. L’analyse automatisée appliquée sur ces zones prédéfinies manuellement a l’avantage d’être plus efficace.

Figure 3: Schéma de la méthode d’analyse de données. A partir d’un ensemble de données acquis sous forme de profils, des méthodes successives de réduction de dimension et de classification permettent de discriminer et de représenter de manière simplifiée les populations de phytoplancton qui apparaissent et disparaissent dans le temps.

Elle vise à tester l’homogénéité de ces zones, c'est-à-dire déterminer s’il existe un seul groupe ou plusieurs en prenant cette fois en compte l’ensemble des descripteurs de forme, de longueur et d’intensité du signal. Le nombre de groupes est déterminé à l’aide d’un critère d’optimisation nommé BIC (Fraley et Raftery 2002). Lorsque l’ensemble des zones a été étudié l’étape suivante consiste à calculer des zones (ellipsoïdes) de confiance associées à chaque groupe précédemment déterminé. La construction d’ellipsoïdes de confiance nous permet de classer de nouveaux individus issus de jeux de données différents. Par exemple dans le cas d’un suivi temporel, il est possible de suivre la dynamique associée à chacun des groupes en se basant sur l’appartenance à ces ellipsoïdes. Les individus exclus sont eux placés dans un groupe externe ou groupe résidu. Grâce à la création d’un tel groupe et l’analyse de sa structure, l’apparition de nouveaux groupes est prise en compte. D’autre part, il est primordial de pouvoir adapter les zones de confiance à chaque étape au vu de nouvelles entrées, pour prendre en compte l’évolution des populations par divisions cellulaires qui se traduisent au niveau des nuages de points par un « glissement ». Les paramètres de la zone de confiance peuvent être ainsi recalculés à chaque étape du processus.

RESULTATS

Le résultat majeur de ce travail est la mise en place, avec le soutien du GIPREB et des services à la mer du MIO (ex-COM), d’un système entièrement automatisé, depuis le prélèvement de l’eau jusqu’à l’analyse des données, dans le but d’étudier la dynamique des assemblages phytoplanctoniques sur une station fixe. Nous présentons, à titre d’exemple, les résultats d’une analyse effectuée sur la période du 26/09/2011 17:00 h au 28/09/2011 05:00 h, soit durant 36 heures. La mesure haute fréquence des sels nutritifs (NO2, NO3, NH4, PO4), des variables physico-chimiques (température, salinité, pH, Chlorophylle a) est réalisée de manière automatisée au pas horaire (Figure 4). Il en est de même pour l’analyse des assemblages phytoplanctoniques effectuée par cytométrie en flux. L’oxygène dissous a également été mesuré. Cependant les données obtenues sont non exploitables car le dispositif expérimental (la pompe) crée une turbulence et une oxygénation de l’eau échantillonnée.

La Figure 5 présente un exemple de cytogramme sur lequel apparaissent les individus du dinoflagellé Akashiwo sanguinea tels que mis en évidence par le cytomètre Cytosense et son module de prise d’images. L’analyse automatisée de ce groupe a été appliquée sur tous les échantillons, ce qui permet de suivre la dynamique de la population d’A. sanguinea au cours du temps (Figure 6).

Figure 4: Suivi des sels nutritifs et des variables environnementales sur la période du 26/09/2011 17:00 au 28/09/2011 05:00.

Figure 5: Exemple d’analyse d’un échantillon de l’étang de Berre : sur ce cytogramme (figure de gauche) la région bleue indique l’emplacement des cellules d’Akashiwo sanguinea identifiées à partir des images prises par le module « Image in flow » (photo de droite).

CONCLUSION

L’étang de Berre est une des plus grandes lagunes de Méditerranée. Proche de l’agglomération Marseillaise, il communique avec la mer (passe de Caronte) et est soumis à de fortes pressions d’origine anthropique (rejets d’eau douce de la centrale EDF, activités industrielles, forte population sur son bassin versant, etc.). La volonté collective de réhabilitation environnementale de cette lagune a conduit à la mise en place d’un suivi écologique. Différents compartiments écologiques tels que la macrofaune benthique, les peuplements de moules, de macrophytes marins et de téléostéens sont ainsi étudiés. Des capteurs (types CTD) ont également été implantés sur plusieurs stations fixes, et à différentes profondeurs pour suivre à haute fréquence l’hydrologie de l’étang de Berre.

L’objectif général de ce travail est de développer une méthodologie qui permet de caractériser la structure et la dynamique des assemblages phytoplanctoniques de l’étang de Berre grâce à une analyse in situ automatisée et à haute fréquence.

Malgré les difficultés rencontrées liées à l’automatisation des différentes analyses

Figure 6: Dynamique d’Akashiwo sanguinea sur la période du 26/09/2011 17:00 au 28/09/2011 05:00.

(phytoplancton, sels nutritifs et variables physico-chimiques), et à la synchronisation des mesures, un tel suivi a pu être mis en place. Les données sont en cours de traitement et de validation. Grâce au couplage des données biologiques et des variables physico-chimiques (hydrologie, sels nutritifs), il est possible d’étudier à des échelles de temps et d’espace adéquates les relations entre les assemblages phytoplantoniques et leur environnement, quelles que soient les conditions météorologiques. La base de données générée est donc relativement complète. De plus, l’approche automatisée in situ permet de réaliser des mesures lors d’évènements sporadiques soudain (vent, orage, etc.) difficilement échantillonnables par des méthodes plus classiques (prélèvements ponctuels à partir d’un navire).

Dans une démarche de compréhension et de protection de cet écosystème un tel dispositif peut également s’avérer utile pour la détection précoce d’espèces potentiellement toxiques, bien avant leur efflorescence. Le ciblage de ce suivi haute fréquence à des périodes clés devrait également permettre de mieux comprendre les étapes menant à l’eutrophisation du milieu puis à l’anoxie, deux dystrophies majeures que connaît l’étang de Berre.

Remerciements

Nous tenons à remercier le Service d’Observation, la plateforme d’analyse des paramètres de base du MIO ainsi que le service plongée de l’OSU Pytheas et le GIPREB pour leur soutien logistique. Anthony Malkassian est le bénéficiaire d’une bourse doctorale financée Europe – Région BDR 2009-2012. Ce travail a bénéficié du soutien d’Aix Marseille Université, du Conseil régional Provence-Alpes-Côte d'Azur et du CNRS-INSU (Projet EC2CO-PNEC « Mise »).

Références bibliographiques

Antoine, D., (1998). Apports de la télédétection spatiale de la "couleur de l'Océan" à l'océanographie. Océanis, 24: 81-150.

Dubelaar, G.B.J. Jonker, R.R., 2000. Flow cytometry as a tool for the study of phytoplankton.Scientia Marina, 64: 135-156.

Fraley, C. Raftery, A. E., 2002. ‘Model-based clustering, discriminant analysis,and density estimation’, JASA, 97(458), 611–612.

Kaufman, J., Rousseeuw, P.J., 2005. Finding groups in data : an introduction to cluster analysis. Wiley series in probability and statistics publ., New York : 342pp.

Kruskal, J.B., Wish, M., 1978. Multidimensional Scaling, Sage University Paper series on Quantitative Application in the Social Sciences, 07-011. Beverly Hills and London : Sage Publications.

Malkassian, A., Nerini, D., Van Dijk, M., Thyssen, M., Mante, C., Gregori, G., 2011.

Functional analysis and classification of phytoplankton based on data from an automated flow cytometer. Cytometry Part A, Volume 79A, Issue 4, 263-275.

1. INTRODUCTION

Jusqu'au début du 20èmesiècle, l'étang de Berre a été un milieu écologiquement riche : la végétation, typique d'un milieu lagunaire méditerranéen, avec son cortège de macrophytes, était "variée et puissante" selon Marion (1887). Chevalier (1916) décrit : "(…) une végétation partout abondante, beaucoup plus que celle de l'étang de Thau. La zone littorale est occupée par des Conferves, des Ulves, des Corallines, des Ceramium et surtout, par une grande Cystoseire associée à une belle forme d'Acetabularia, plus haute et moins encroûtée que celle de la Méditerranée proprement dite (…)". Les courants, favorisant le transport des organismes marins dans l’étang de Berre par le canal de Caronte et le tunnel du Rove, contribuaient à uniformiser la flore et la faune de la mer et de l’étang. Les côtes rocheuses de l’étang (qui s’étendent approximativement de Saint-Chamas à Martigues, le long de la façade ouest de l’étang) présentaient ainsi un étagement de la flore comparable à celui observé sur les côtes du golfe de Marseille (Huvé & Huvé, 1954). Cystoseira barbata était abondamment répandue, jusqu’à 4 m de profondeur, sur tous les points rocheux de l’étang, d’où l’appellation de « barbeno de roco » que lui donnaient les pêcheurs de Saint-Chamas (Huvé et al., 1973). Sur les fonds de substrat meuble, les herbiers de Zostera côtoyaient les peuplements de Potamogeton pectinatus. La plupart des auteurs de l'époque ne mentionnent que la présence du genre Zostera, sans mentionner l'espèce ; Marion (1887), quant à lui, ne signale que Z. marina.

La végétation aquatique