• Aucun résultat trouvé

incertitudes associées aux macroinvertébrés

Titre 2 Matériel et méthodes

Titre 2 : Matériel et méthodes

Nous présentons ici la méthode virtuelle : les différentes matrices conçues pour réaliser nos différents tests virtuels et le fonctionnement de l’algorithme, le jeu de données utilisé, ainsi que les calculs des différentes métriques et les différentes méthodes statistiques choisies pour mesurer les effets des erreurs testées.

Section 1. Métadonnées

seuils a été menée par substrat pour chacun des deux tests (R et AB) réalisés en fonction de différents critères.

Les seuils attribués pour définir la valeur maximale à partir de laquelle nous ne considérons plus un taxon comme rare ou peu abondant ont été obtenus par le biais de notre expérimentation précédente, fondée sur la répétition d’échantillonnage de substrats. Nous avons, pour chaque substrat, identifié le nombre de taxons présents uniquement sur une seule répétition de substrat. Les valeurs obtenues pouvaient osciller entre 2 et 8 individus en fonction d’un substrat, de ce fait dans un souci d’homogénéisation, nous avons ainsi fixé qu’un taxon pouvait être considéré comme peu abondant ou rare en dessous de 5 individus, quelque soit le substrat considéré. Cette valeur est également le seuil retenu par Nijboer pour identifier les taxons considérés comme très rares (Nijboer & Schmidt-Kloiber, 2004). Ainsi, l’algorithme que nous avons conçu recherche les taxons dont l’abondance est inférieure ou égale à 5 individus et, en fonction de la probabilité d’erreur introduite, supprime tout ou partie des taxons concernés (Tableau 3). Ce test simule les

erreurs pouvant être induites par l’inexpérience d’un opérateur.

Le seuil choisi pour tester l’impact de la variabilité des abondances a été défini en prenant en considération la norme XP T90-388 (AFNOR, 2010). Celle-ci stipule que, si l’identification des taxons au genre ne peut pas être réalisée à l’œil nu lors de l’opération de tri, 40 individus doivent être sortis pour être identifiés afin de réaliser un sous échantillonnage, mais également que, lorsque l’abondance d’un taxon identifié au genre est supérieure à 40, il est possible de réaliser une estimation de l’abondance de ce taxon. Nous avons donc gardé la limite de 40 individus

comme valeur seuil. L’algorithme recherche les taxons dont les abondances sont strictement supérieures à 40 individus et, en fonction de la probabilité d’erreur introduite, réalise une transformation des abondances en les réduisant à 40 individus. Nous avons décidé de réduire les abondances à une valeur fixe car nous sommes partis du postulat que si l’opérateur avait pu

réaliser une estimation de l’abondance des taxons, il était sûr de sa détermination et avait donc compté au moins les individus jusqu’à la valeur prescrite par la norme (Tableau 3). Ce test simule les erreurs produites par les pratiques en laboratoire. Celui-ci sous-estime brutalement les abondances et pourrait permettre de tester la sensibilité des métriques de l’indice I2M2 aux dégradations d’abondance, ainsi que de mesurer l’importance de la précision d’un comptage exhaustif.

Tableau 3 : Extrait de la matrice des seuils utilisés par chaque type d’erreur en fonction des substrats

Tests / Substrats Blocs Bryophytes Galets Graviers Pierres Seuil taxon rare 5 5 5 5 5 Seuil taxon abondant 41 41 41 41 41 Nouvelle valeur des abondances 40 40 40 40 40

Afin de réaliser une modification aléatoire des listes faunistiques sélectionnées, nous avons fixé des probabilités d’erreurs différentes pour chacun des deux types d’erreurs. Ces probabilités d’erreurs ont été définies par le biais de l’étude menée sur la variabilité intra-substrat et, notamment, à l’aide des coefficients de variation (CV) calculés sur les métriques pouvant être reliées aux deux paramètres que nous testons ici. Les coefficients de variation retenus concernent la richesse taxonomique au genre et les abondances. Ainsi, pour déterminer ces valeurs, nous avons choisi de prendre les CV minimaux, moyens et maximaux, tous substrats confondus. Pour l’erreur associée à l’exclusion des taxons (R), nous avons donc obtenu comme valeur minimale 10%, valeur moyenne 20% et valeur maximale 40%. Pour l’erreur associée aux estimations d’abondances (AB) : la valeur minimale était égale à 25%, la valeur moyenne à 50% et la valeur

maximale à 85%. Enfin pour les deux types d’erreurs cumulées (R+AB) nous avons opté pour une combinaison des probabilités d’erreurs ; ainsi il n’y a pas seulement trois séries de tests mais neuf (10% et 25%, 10% et 50%, 10% et 85%, 20 et 25%, 20 et 50%, 20 et 85%, etc.)

Section 2. L’algorithme

Nous avons implanté, à l’aide du langage Ruby, un algorithme qui permet de modifier aléatoirement une liste faunistique complète et validée, composée de douze listes élémentaires associées chacune à un habitat. Nous avons choisi ce type de langage de programmation car il est adapté à la conception de scripts. Il permet une manipulation très facile de fichiers de données sous forme de matrice. En considérant la matrice de seuils (Table 8) et une liste faunistique donnée, l’algorithme peut de façon aléatoire : (1) supprimer les taxons rares ou peu abondants de la liste faunistique en accord avec les seuils définis (2) baisser l’estimation des abondances des taxons en accord avec les seuils définis et (3) combiner les deux types d’erreurs. Nous allons

maintenant présenter un exemple de données fictives consistant en une liste faunistique basée, sur uniquement quatre habitats (Tableau 4) et une matrice de seuils associée (Tableau 3).

Tableau 4 : Exemple de liste faunistique validée L

Graviers Pierres Racines Litières

Hydropsyche 56 23 7 0

Chironomidae 256 4 13 54

Gammarus 153 108 2 23

Baetis 26 41 9 3

Oligochètes 43 20 3 13

Quelque soit l’habitat, nous considérons un taxon comme rare ou peu abondant si son abondance est inférieure ou égale à 5. A l'inverse, un taxon est identifié comme abondant lorsque son abondance est supérieure ou égale à 41. Dans cet exemple, 108 Gammarus ont été comptés dans les pierres et 26 Baetis dans les graviers (Tableau 4).

Pour des raisons de clarté, nous avons décidé de synthétiser dans le Tableau 5 les différentes notations utilisées ci-dessous.

Tableau 5 : Descriptions des notations utilisées pour présenter le fonctionnement de l'algorithme

Notations Descriptions

L Liste faunistique

T ϵ L Un taxon appartenant à la liste faunistique S ϵ L Un substrat appartenant à la liste faunistique Abondance (T,S) Abondance du taxon T dans le substrat S Abondant θ (S) Seuil des taxons abondants pour un substrat S Rare θ (S) Seuil des taxons rare pour un substrat S

PAB Probabilité de modifier l’abondance d’un taxon abondant PR Probabilité de supprimer un taxon rare

En fonction d’une liste faunistique L, un taxon T ϵ L, un substrat S ϵ L et de la matrice des seuils, trois cas sont possibles :

1. Si l’abondance (T,S) ≤ Rare θ (S), le taxon est considéré comme un taxon rare ou peu abondant ;

2. Si l’abondance (T,S) ≥ Abondant θ (S), le taxon est considéré comme un taxon abondant ; 3. Si Rare θ (S) < Abondance (T,S) < abondant θ (S), le taxon est considéré comme un taxon

Nous allons principalement nous focaliser sur les cas 1 et 2. En effet, le but est de modifier les abondances des taxons abondants et de supprimer les taxons rares selon une probabilité (voir Tableau 5). Le type d’erreur et la probabilité sont deux paramètres de l’algorithme fixés par l’utilisateur. Ainsi, pour chaque taxon T dans une liste faunistique L:

1. si nous voulons sous-estimer les abondances des taxons T pour un substrat S, la probabilité de changer l’abondance (T,S) en la valeur arbitraire de 40, est donnée par PAB

qui est égale à 25, 50 ou 85% ;

2. si nous voulons supprimer les taxons T rares pour un substrat S, la probabilité de changer l’abondance (T,S) en 0 est donnée par le paramètre PR qui correspond à 10, 20 ou 40%.

La probabilité d’erreur introduite dans l’algorithme permet de simuler un taux d'erreur moyen

commis par l’opérateur, i.e. celui-ci a un certain pourcentage de chances de se tromper. Ainsi, le

taux d’erreur réel peut varier et être supérieur ou inférieur à la probabilité d’erreur théorique. L’algorithme et la multiplicité des tests permettent de simuler une probabilité d’erreur moyenne. Plus les expérimentations seront répétées, plus la valeur du taux d'erreur réel moyen tendra vers la probabilité d'erreur théorique.

Le Tableau 6 est un exemple de liste faunistique modifiée par les deux erreurs cumulées (R+AB) à partir de la liste faunistique L présentée dans le Tableau 4 et sur les seuils retenus (Tableau 3) et une probabilité d’erreur PR de 10% de PAB de 50%. Les valeurs des abondances modifiées sont sur fond bleu clair. Dans cet exemple, certains taxons abondants ont vu leurs abondances décroître, comme les Chironomidae et les Oligochètes dans les graviers et les Baetis dans les pierres, et un taxon rare a été supprimé : les Baetis dans les litières.

Tableau 6 : Exemple de liste modifiée basée sur la liste faunistique validée L Graviers Pierres Racines Litières

Hydropsyche 56 23 7 0

Chironomidae 40 4 13 54

Gammarus 153 108 2 23

Baetis 26 40 9 0