• Aucun résultat trouvé

II. DISPOSITIF ET STRATEGIE DE TERRAIN

II.4 LES REFERENTIELS DE DONNEES

II.4.1 Les données abiotiques

II.4.1.8 Référentiels abiotiques : bilan, résolution des problèmes

Dans un souci de synergie et d’économie globale de moyens, la partie de suivi abiotique de ce programme a été raisonnée en complément de suivis de chimie existants (notamment réseaux de suivi mis en place par les intervenants miniers), l’inconvénient étant qu’il était plus difficile d’adapter une organisation complémentaire qu’une prise en charge systématique des prélèvements et analyses d’eau nécessaires.

Le manque occasionnel d’un résultat analytique pour certains paramètres à une date, ou encore la présence d’informations non-numériques dans certaines cases de résultats analytiques (du type « résultat inférieur au Seuil de Détection de la méthode » (<SD), ou « résultat inférieur au Seuil de Quantification de la méthode » (<SQ) a dû être comblé. En effet, dans notre démarche, beaucoup d’analyses de données utilisées font intervenir des techniques statistiques descriptives visant à mettre en correspondance et/ou en relation une composition d’assemblage diatomique avec les conditions locales de la colonne d’eau dans le même créneau temporel. Cette mise en correspondance est indispensable pour pouvoir décrire l’écologie spécifique de ces espèces et assemblages calédoniens fortement méconnus jusqu’alors, et pour pouvoir repérer les assemblages-

types retrouvés sous l’influence des différents contextes naturels de la Grande

Terre. D’autre part, dans l’optique de créer un nouvel indice diatomique adapté au contexte local, cette mise en correspondance est tout aussi incontournable pour pouvoir repérer la sensibilité ou la tolérance à la pollution des espèces sous l’influence des

gradients d’altération anthropique repérés localement, paramètre par paramètre.

Mais malheureusement, ces analyses de données descriptives ne s’accommodent pas de contenus de cases vides, au risque d’éliminer complètement chaque relevé biologique pour lequel une donnée abiotique à cette même date serait manquante ou non numérique. En effet, compte-tenu du très lourd investissement humain réalisé pour

reconnaître et compter les diatomées à l’espèce dans ce nouveau contexte biogéographique, ce qui constitue la partie la plus innovante et à la plus forte valeur

ajoutée de ce programme, il aurait été inacceptable de perdre chaque doublet de données et chaque relevé biologique concerné par ce type de problème.

Il a donc fallu avoir recours lorsque c’était possible à une expertise spécifique pour compléter une donnée manquante ou non-numérique sur tel site à telle date, en ne biaisant pas le résultat final de l’analyse de données.

50

Cela a été fait en s’appuyant chaque fois que possible sur une autre donnée de l’étude acquise sur ce même site à une date différente mais dans les mêmes conditions saisonnières et hydrologiques, et/ou sur des référentiels externes produits de façon régulière ou à une date la plus proche possible sur le même site par un autre réseau (voir par exemple les réseaux d’exploitants miniers…).

L’absence de données numériques dans une case a pu correspondre à plusieurs cas de figure :

• Certains manques ont pu être liés au fait que l’assortiment de paramètres

analytiques pris en compte dans certains réseaux pouvait être un peu différent selon le réseau, et qu’il était difficile de faire analyser ensuite un seul paramètre manquant au coup par coup, en fonction des listes spécifiques de méthodes analytiques mobilisées par chaque laboratoire et de leur capacité de réalisation analytique du moment (voir opérations de prélèvements sous condition d’autorisation minière ou d’accès à une propriété privée, souvent décidées en contexte temporel tendu dès l’obtention de l’autorisation, et capacité d’anticipation limitée difficilement compatible avec le plan de charge du moment au niveau des laboratoires). De ce fait, certains paramètres complets (ex : azote Kjeldahl, pourtant très intéressant pour rendre compte de la partie azotée de pollutions organiques…) ont été trop souvent manquants pour pouvoir être complétés de façon fiable et n’ont pas pu faire l’objet d’une exploitation directe dans les analyses de données.

• Outre cet abandon complet de paramètres trop lacunaires pour être valablement

complétés, des problèmes plus occasionnels ou ponctuels, comme un problème de disponibilité de laboratoire pour un seul paramètre à une date, la perte d’un échantillon analytique, la casse accidentelle d’un flacon, un problème analytique rencontré sur un paramètre à une date et signalé dans le compte-rendu d’analyse, ou un résultat analytique aberrant (résultant par exemple d’une erreur d’unité, ou donnant un ordre de grandeur impossible sur ce paramètre compte-tenu de l’information donnée par d’autres descripteurs plus globalisants) ont pu conduire à un nombre modéré de manques de données exploitables. Ces lacunes plus ponctuelles ont été résolues par le biais d’une expertise conjointe et consensuelle croisant le point de vue de scientifiques des 2 organismes co-contractants, en s’appuyant chaque fois que possible sur une autre donnée de la même étude acquise sur ce site à une date différente, après s’être assurés de la similitude des conditions saisonnières et hydrologiques, ou à défaut sur des référentiels externes produits de façon régulière au même site par d’autres réseaux (voir par exemple les réseaux d’exploitants miniers…).

• Enfin, un assez grand nombre de résultats analytiques obtenus, notamment pour

les teneurs en nutriments ou la DBO5 en contexte de référence, sont des données non quantifiées exprimés selon le cas en [<SD], c’est-à-dire [inférieur au Seuil de Détection], ce qui signifie que la méthode analytique utilisée ne donne aucun signal de réponse, ou en (< SQ), c’est-à-dire [inférieur au Seuil de Quantification], ce qui signifie que la méthode donne éventuellement un signal, mais trop faible et ne rentrant pas encore dans la gamme où elle a été validée pour garantir une mesure de signal réellement quantitative. Lorsque les 2 seuils peuvent être formulés selon le cas sur un même paramètre, le seuil de détection est inférieur au seuil de quantification.

Les analyses multivariées ne sont pas en mesure d’interpréter de tels contenus non numériques dans des cases de la matrice de données, qui sont assimilés à

51

des données manquantes et feraient ainsi perdre presque tous les relevés biologiques disponibles. De façon conforme à la pratique déployée antérieurement dans des programmes DOM en pareil cas, il a été décidé de résoudre cette difficulté en appliquant, selon le contenu non-numérique de la case de résultat, la valeur [Seuil de Détection/2] ou la valeur [Seuil de Quantification/2], en utilisant les seuils analytiques annoncés par le laboratoire ayant réalisé l’analyse. Cette pratique a l’avantage de résoudre ce problème de données non-numériques tout en respectant un gradient logique de grandeurs croissantes entre SD/2, SQ/2 et les valeurs les plus basses réellement quantifiées (= SQ).

La base de données abiotiques ainsi consolidée a permis de renseigner 210 couples

« relevés chimiques-relevés diatomiques » complets. Elle a ensuite été utilisée pour

réaliser :

• les analyses descriptives permettant d’étudier les données et la structure des

gradients chimiques représentés au plan local,

• la démarche de mise au point du nouvel indice diatomique, l’IDNC.