• Aucun résultat trouvé

filtrage de l’information

2. Choix des filtres et méthodologie d’optimisation et de comparaison des filtres

2.1. Définition des besoins

2.1.1.

Objectifs des filtres choisis

La partie précédente a montré que les signaux de turbidité sont affectés par des perturbations dont les caractéristiques ont pu être identifiées par rapport à un signal de référence. Ces perturbations ont un impact notable sur le signal brut qui doit être transformé par l’intermédiaire d’un filtre pour être exploitable.

Ce filtre doit remplir trois objectifs :

- Il doit supprimer les valeurs bruitées du signal ou bien le transformer pour que les bruits n’aient plus d’impact,

- Il doit conserver la dynamique du signal réel,

- Il doit être simple à utiliser et implémenter sur des centrales d’acquisition ou sur un ordinateur et doit agir en temps réel.

Il s’agit donc de trouver un compromis permettant d’éliminer des bruits sans éliminer de signal utile. En effet, il est en général facile de détecter les bruits de très forte amplitude, qui dépassent la gamme des valeurs usuellement rencontrées pour une grandeur mesurée donnée. En revanche, les bruits de plus faible amplitude sont difficiles à distinguer des « vraies » données (Berrada et al., 1996). De plus, les filtres doivent transformer un signal brut acquis à la seconde en un signal

filtré au pas de temps de la minute. Il n’est pas envisageable de stocker les valeurs acquises à la seconde. Il faut donc filtrer le signal à l’avancement et enregistrer les valeurs toutes les minutes.

2.1.2.

Inadéquation des filtres « classiques »

Une partie des systèmes de filtrage s’appuie sur des modèles de prévisions : une valeur est prédite et comparée à la mesure, ce qui permet soit de conserver la mesure, soit de la remplacer si elle s’écarte trop de la valeur renvoyée par le modèle.

Une partie importante de l’analyse des séries temporelle s’appuie sur les modèles linéaires autorégressifs ARMA (Auto-Regressive Moving Average) qui utilisent des modèles aléatoires des bruits. C’est le cas de la méthode de modélisation de Box et Jenkins (Malamoud, 1978).

Dans le cas de mesures de débits, certains systèmes de validation en temps réel comparent une estimation des débits effectuée à partir des mesures à un débit calculé par un modèle, notamment au moyen de filtres de Kalman. C’est le cas d’une étude sur un bassin versant de Seine-Saint- Denis (Piatyszek et al., 2000). Un filtre de Kalman est appliqué aux données mesurées. Ce filtre

permet de faire une prévision à partir des mesures en utilisant un algorithme récursif (Kalman, 1960; Kalman & Bucy, 1961). Toutefois, cela suppose d’être capable de construire un modèle de prévision de la grandeur mesurée, ce qui n’est pas possible à l’heure actuelle pour des mesures de turbidité.

Par ailleurs, les filtres classiques reposent souvent sur des hypothèses de bruits aléatoires, de moyenne nulle et peu fréquents. Nous venons de voir que cela ne s’applique pas à la description des bruits affectant le signal de turbidité. L’une des techniques les plus simples est le lissage par moyenne mobile qui permet d’atténuer le bruit et de supprimer la composante saisonnière (César & Richard, 2006). Il existe de nombreux types de lissages par moyenne mobile en fonction de la largeur de la fenêtre retenue, du centrage ou non de la fenêtre ou encore de l’utilisation de pondérations qui permettent de donner plus d’importance à certaines valeurs de la fenêtre de calcul. Dans le cas le plus simple d’une moyenne mobile d’ordre k, la série des moyennes mobiles est calculée en faisant la moyenne de k termes consécutifs : la première moyenne est ainsi k y y y1+ 2+...+ k puis, k y y y2 + 3+...+ k 1+ jusqu’à k y y ynk + nk+1+...+ n

n est le nombre

total de données. De la même façon, des techniques de lissage par médianes mobiles peuvent être utilisées. L’avantage de la médiane est qu’elle est moins sensible aux valeurs extrêmes du bruit. Par contre, elle ne traite pas très bien les tendances des signaux (Gather & Fried, 2004). On peut également combiner plusieurs techniques de filtrage en fonction des objectifs à atteindre et de la nature du signal (Gather & Fried, 2004).

2.1.3.

Pratiques de filtrage en hydrologie urbaine

Dans le domaine de l’hydrologie urbaine, il existe des références sur le filtrage des signaux en débitmétrie et en pluviométrie mais très peu dans le domaine des données de qualité comme les mesures de turbidité. De plus, peu de références traitent de filtrage de données en temps réel. La plupart du temps, si les systèmes existent, il s’agit de systèmes de validation a posteriori des

mesures. Nous avons toutefois retenu des techniques de filtrage, chacune plus spécifiquement adaptée à un type de bruits donné. Certaines méthodes sont particulièrement adaptées aux bruits de faibles amplitudes ou aléatoires alors que d’autres permettent de détecter des bruits de forte amplitude. C’est le cas de la méthode de Goring et Nikora (2002), appelée méthode de l’espace de phase, qui a été appliquée à des données de mesure de vitesse par effet Doppler. Le principe consiste à tracer les variables (valeurs du signal yt) et leurs dérivées premières et secondes en

trois dimensions. Un ellipsoïde est défini par un critère dit universel selon la méthode des ondelettes (Donoho & Johnstone, 1994). Les points sont projetés en coordonnées sphériques et ceux situés en dehors de l'ellipsoïde sont considérés comme aberrants. Cette méthode est itérative et continue tant qu’il reste des valeurs aberrantes en dehors de l’ellipsoïde (Goring & Nikora, 2002).

En plus de cette méthode très spécifique, nous avons dressé un tableau avec d’autres méthodes de filtrages appliquées à des données d’hydrologie urbaine (Tableau 13). Berrada et al. (1996)

ont dressé un inventaire de méthodes de filtrage permettant de détecter des valeurs aberrantes dans des séries de données de débits et éventuellement de les remplacer. Ces méthodes de filtrage sont dites univariées car elles correspondent au cas où l’on ne dispose que d’un seul capteur pour valider et filtrer les données. Les techniques testées par Berrada et al. (1996) sont

Chapitre 3 : stratégies d’acquisition central d’une population, plus robuste que la moyenne. Le principe de cette méthode est de comparer la valeur brute du signal à une autre valeur filtrée. Pour chaque point Xi des séries de

données, si la différence entre la valeur brute et la valeur filtrée dépasse un seuil, le point sera rejeté selon le principe suivant :

- Construction d’une série Xi(1) de la médiane de 5 points de Xi-2 à Xi+2 ;

- Construction d’une série Xi(2) de la médiane de 3 points de Xi-1(1) à Xi+1(1);

- Construction du filtre de Hanning (3) 4

(

(21) 2 (2) (21)

)

1 + − + + = i i i i X X X X ;

- Construction d’une série deΔi = XiXi(3) et abandon de tous les points pour

lesquels Δi>K*σ, où K est un seuil prédéterminé et σ est l’écart-type des Xi.

Les filtres référencés dans le Tableau 13 s’appliquent pour la plupart à des bruits de moyenne nulle et sont donc sensibles aux bruits de grande amplitude. Ces filtres ne sont donc pas adaptés au filtrage des signaux de turbidité. D’autre part, certains filtres traitent le bruit de grande amplitude mais ont alors tendance à écrêter les pointes. Or, les pics réels de turbidité, en temps de pluie par exemple, peuvent connaître des évolutions rapides et brusques de grande amplitude qui doivent être conservées dans le signal filtré. L’élimination des bruits de grande amplitude suppose souvent que ces bruits ne soient pas trop fréquents alors que dans le cas de la turbidité, les bruits peuvent être très fréquents sur certaines périodes. Le filtre d’espace de phase a été testé sur des données de turbidité et a montré une très bonne efficacité, y compris sur des périodes très fortement bruitées par des pics de grande amplitude (El Hajj, 2005). Toutefois cette méthode est compliquée à mettre en œuvre et ne permet pas de faire du filtrage en temps réel. Nous ne l’avons donc pas étudiée dans le cadre de cette thèse.