• Aucun résultat trouvé

Chapitre 1. Présentation des sites et méthodes de traitement des données de flu

6. Remplacement des données manquantes

Le calcul de bilans journaliers, saisonniers ou annuels des différents flux nécessite des jeux de données complets. Cependant, l'ensemble des étapes de filtrage et de vérification de la qualité des données de flux engendre d'importantes pertes de données allant pour notre étude de 26 % à environ 40 % en fonction des différent flux et sites (Tableau 6). Pour vingt huit années de mesures sur dix sites du réseau de mesure Ameriflux, le pourcentage moyen de données manquantes était de 25, 31 et 35 % pour H, LE et NEE, respectivement (Baldocchi et al., 2001) ce qui montre que nos procédures de filtrage et de vérification de la qualité des données sont raisonnablement sélectives en comparaison avec la littérature. Les filtres les plus sélectifs sont ceux sur les gammes de valeur des données, le seuil de u* et la stationnarité. La plus grande proportion de données éliminées par le filtre u* à Lamasquère est cohérente avec la topographie très plane du site qui par ailleurs est à l'abri, entouré de bois et ripisylves. Cela induit de plus fréquentes périodes de faibles turbulences. La somme des différents filtres n'est pas égale au pourcentage total de données manquantes car il peut y avoir des recoupages entre les différents filtres.

Tableau 6 : Pourcentages de données manquantes après l'application des différents filtres et procédures de vérification de la qualité des données (voir section 5) des différents flux entre le 18-mars-2005 et le 10- Oct-2007. Pour les filtres pluie, gammes, u*, footprint, w, ITC et stationnarité, les données correspondent au pourcentage de données éliminées par le filtre moins le pourcentage de problèmes matériels. Pour le filtre statistique, les données correspondent au pourcentage de données éliminées par le filtre moins le pourcentage de problèmes matériels + filtre pluie + filtre gammes.

Auradé Lamasquère H LE NEE H LE NEE Problèmes matériels 4.0 4.0 4.0 5.7 5.7 5.7 Filtre pluie 0.0 7.5 7.5 0.0 6.8 6.8 Filtre gammes 10.7 18.2 16.2 2.3 11.9 11.5 Filtre statistique 1.7 1.8 5.5 1.3 1.8 5.6 Filtre u* 7.0 7.0 7.0 12.7 12.7 12.7 Filtre footprint 2.2 2.2 2.2 4.1 4.1 4.1 Filtre w 7.3 7.3 7.3 0.4 0.4 0.4 Filtre ITC 0.0 0.0 0.0 0.1 0.1 0.1 Filtre stationnarité 2.5 8.3 10.7 1.4 5.0 9.1 Total 26.2 33.5 36.6 26.3 35.0 39.4

Face à ce problème de données manquantes, différentes méthodologies ont été développées pour essayer d'obtenir des jeux de données complets et de bonne qualité. Dans les travaux de Moffat et al. (2007), quinze méthodes différentes de remplacement de données manquantes ont été testées et évaluées. Les auteurs ont conclu que la méthode décrite dans Reichstein et al. (2005), utilisant de façon combinée, des interpolations, des tables de références sur des fenêtres glissantes (MDS pour marginal distribution sampling) et des variations journalières moyennes sur des fenêtres glissantes

(MDV pour mean diurnal variation), donnait de très bons résultats pour effectuer des sommes journalières et annuelles et était en même temps facile à mettre en œuvre. C'est cette méthode, utilisée de façon routinière dans le projet CarboEurope-IP, que nous avons adapté pour nos parcelles expérimentales. Comme pour le filtrage et la vérification des flux, le remplacement des données manquantes a été effectué indépendamment pour chaque CFP.

Pour les trous d'une taille inférieure à 1h30, une interpolation linéaire a été appliquée. Pour les trous d'une taille supérieure à 1h30, la méthodologie des MDS et des MDV a été appliquée. Pour les MDS, la demi-heure de flux manquante est remplacée par la moyenne du flux concerné calculée sur n jours adjacents (Tableau 8), dans des conditions climatiques proches. Les variables météorologiques de sélection ainsi que leurs variations autorisées permettant de définir les conditions climatiques proches de celles de la donnée manquante sont récapitulées dans le Tableau 7.

Tableau 7 : Variables et pas utilisés dans la méthode MDS pour sélectionner des conditions climatiques proches de la donnée de flux (H, LE et NEE) manquante.

H LE NEE PPFD [µmol m-2 s-1] 100 100 100 Ta [°C] 2 2 2 Ts5 [°C] 1.5 Rh [%] 5 5 5 SWC5 [%] 2 2

Pour les MDV, la demi-heure de flux manquante est remplacée par une moyenne du flux concerné des jours adjacents, à la même heure. Cette méthode se base donc uniquement sur l'auto corrélation temporelle des flux et est très utile dans le cas ou les variables météorologiques sont manquantes pour calculer les MDS. Ces deux méthodes nécessitent donc des fenêtres relativement courtes pour ne pas être trop influencées par les variations de l'état du couvert. Pour chaque méthode, le nombre minimum de données de flux sélectionnées devait être de trois afin d'obtenir une moyenne raisonnable. Pour réussir à combler l'ensemble des données manquantes, les méthodes ont été utilisées successivement, en augmentant progressivement la taille de la fenêtre de sélection et en diminuant le nombre de variables de sélection dans le cas des MDS (Tableau 8). Des indices de qualité ont été attribués à chaque donnée remplacée, allant de 1 pour la meilleure qualité à 3 pour la plus mauvaise. Le nombre maximum de variables de sélection a été défini à quatre, car au delà, le nombre de données retenues dans la fenêtre sélectionnée serait trop faible et ainsi les données manquantes ne seraient pas remplacées. Les variables de sélection ont été choisies par rapport à leur impact sur les processus à l'origine des flux. Donc pour NEE, le PPFD est fortement lié à la photosynthèse, Ta et Ts5, aux

respirations des organismes autotrophes (les cultures) et hétérotrophes (les micro-organismes du sol) et Rh au contrôle de l'ouverture des stomates. Pour les flux d'énergie H et LE, le PPFD permet de

représenter l'énergie incidente disponible, Ta et Rh représentent la demande évaporative de l'air et

Tableau 8 : Combinaison des méthodologies, utilisée dans le remplacement des données manquantes allant de la meilleure (qualité 1) à la plus mauvaise (qualité 3) qualité. Pour les méthodes MDS (marginal distribution sampling) et MDV (mean diurnal variation) la taille de la fenêtre est précisée. Le nombre de variables de sélection est aussi rapporté pour la méthode MDS.

Interpolation MDS MDV

fenêtre [jours] nombres de variables fenêtre [jours]

Qualité 1 trous < 1h30 7 4 7 3 14 4 Qualité 2 14 3 7 21 4 21 3 14 Qualité 3 28 4 28 3 21 28