• Aucun résultat trouvé

3.2 Contrôle de la détection

3.4.4 Données générées selon une loi à queue lourde

Pour cette nouvelle série de simulations, les distributions s’éloignent du cas gaussien : la probabilité d’observer des valeurs éloignées de la moyenne est plus grande, d’où la pré- sence de valeurs aberrantes dans les séries temporelles. Les tests réalisés pour cette section permettent d’évaluer la robustesse des méthodes à ces valeurs extrêmes. La distribution choisie est la distribution de Student à ν = 3,0 degrés de liberté. Elle est centrée sur µk au kesegment, avec µ1 = 10,0. Pour calculer le rapport signal sur bruit (3.59), la variance est donnée par

σ2 = ν

−5 0 5 10 15 20 SNR (en dB) 0.0 0.2 0.4 0.6 0.8 1.0 rappel UniBD BARD N FL

(a) Rappel moyen en fonction du niveau de bruit. −5 0 5 10 15 20 SNR (en dB) 0.0 0.2 0.4 0.6 0.8 1.0 précision UniBD BARD N FL

(b) Précision moyenne en fonction du niveau de bruit.

Figure 3.13 – Courbes de rappel et de précision en fonction du niveau de bruit, pour des données distribuées normalement. Les séries temporelles comportent n = 100 points, avec une rupture en τ = 50. La courbe en rouge (UniBD) correspond à la méthode du Bernoulli Detector avec α = 0,01, la courbe en vert (BARD N) à la méthode BARD et avec des lois a priori normales, et

la courbe en bleu (FL) au fused LASSO avec λ = 22,3.

−5 0 5 10 15 20 SNR (en dB) 0 5 10 15 20 25 EQM UniBD BARD N FL

(a) EQM en fonction du niveau de bruit.

−5 0 5 10 15 20 SNR (en dB) 0.0 0.2 0.4 0.6 0.8 1.0

Nombre de faux postifs

UniBD BARD N

FL

(b) Nombre moyen de faux positifs en fonction du niveau de bruit.

Figure 3.14 – Courbes de l’erreur quadratique moyenne et du nombre moyen de faux positifs en fonction du niveau de bruit, pour des données distribuées normalement. Les séries temporelles comportentn = 100 points, avec une rupture en τ = 50. La courbe en rouge (UniBD) correspond

à la méthode du Bernoulli Detector avec α = 0,01, la courbe en vert (BARD N) à la méthode

Comme l’hypothèse de normalité n’est plus vérifiée, les méthodes BARD et LASSO doivent être adaptées. La fonction de vraisemblance de la méthode BARD est construite à partir des distributions de Student de paramètres (ν,0) et (ν,µA) pour les segments normaux et anormaux respectivement, l’expression (3.62) devient alors :

PA(t,s|µ) PN(t,s) = t Y i=s 1 + (Xi−µA) 2 ν 1 + Xi2 ν −ν+12 . (3.64)

Le support de la moyenne µAest défini comme dans le cas normal, avec cette fois σ donné par la distribution réelle des données, selon (3.63). La série temporelle est de nouveau recentrée autour de la valeur nulle, par soustraction de µ1. Le fused LASSO est lui aussi modifié, afin de le rendre insensible aux données aberrantes. La fonction β est alors la solution du problème (1.43), présenté dans [Aravkinet al., 2013]4. Ce problème de LASSO robuste introduit une norme `1 dans le terme d’attache aux données. Il est résolu par la méthode ADMM [Boyd et al., 2011], qui introduit un paramètre supplémentaire η. Comme précédemment, les valeurs de ces paramètres sont déterminées rétrospectivement, de manière à atteindre un compromis entre un bon rappel (détection de la vraie rupture) et une bonne précision (peu de fausses ruptures).

Les méthodes BARD avec l’a priori normal et fused LASSO du problème (1.41) avec la norme `2 sont également testées pour comparaison, avec les mêmes paramètres que pour les tests précédents (partie 3.4.3). La figure 3.15 donne les courbes de rappel et de pré- cision pour toutes ces méthodes. Globalement, les courbes de rappel se ressemblent, Les méthodes testées parviennent donc toutes à détecter la rupture à la position τ = 50 avec les performances comparables. En revanche les courbes de précision sont disparates. À partir de 0,0 dB, le Bernoulli Detector fournit les meilleurs résultats. L’algorithme BARD avec l’a priori adapté aux données (courbe BARD T) parvient également à une bonne préci- sion quand le rapport signal sur bruit augmente, et se confond avec le Bernoulli Detector. Cependant il se dégrade fortement quand le bruit augmente, et n’est pas applicable sous 0,0 dB. Il est toutefois sensiblement meilleur qu’avec un a priori normal (courbe BARD N), perturbé par les valeurs aberrantes qui entraînent la détections de segments anormaux supplémentaires. Le LASSO robuste (courbe L1L1) est légèrement meilleur que les autres méthodes sous 0,0 dB, mais ne parvient pas à une aussi bonne précision que le Bernoulli

Detector pour un SNR plus grand. Le choix des paramètres λ et η n’est pas évident, la

méthode ayant tendance à introduire plusieurs ruptures successives au niveau d’un impor- tant saut de moyennes entre µ1 et µ2 quand la parcimonie de la solution est renforcée, ce qui créé des faux positifs autour de la vraie détection. Enfin, le fused LASSO (courbe FL) est très perturbé par les valeurs aberrantes, ce qui explique que sa courbe de précision ne dépasse pas 0,4.

L’erreur quadratique moyenne et le nombre de faux positifs sont tracés à la figure 3.16. D’après les courbes de l’erreur quadratique moyenne, les méthodes BARD produisent les moins bons résultats. Les méthodes basées sur un approche de type LASSO donnent les

distances les plus faibles entre la rupture réelle et la rupture estimée, le LASSO robuste n’ayant qu’une erreur inférieure à 6 avec un bruit de −5,0 dB. En terme de faux positifs, le LASSO est moins bon, comme nous l’avons constaté avec la courbe de précision, avec un nombre de faux positif proche de 2 dès 5,0 dB. L’introduction de la norme `1 permet de réduire le nombre de fausses détections, puisque le modèle n’est plus sensible aux valeurs extrêmes. La méthode BARD avec un a priori normal n’est pas du tout adaptée à ces don- nées, avec une forte erreur quadratique moyenne et un grand nombre de fausses détections. Les algorithmes BARD T et UniBD détectent très peu de faux positifs, ces modèles sont bien robustes aux valeurs extrêmes de la distribution.

Ce test illustre l’efficacité du modèle du Bernoulli Detector sur des données normales comme sur des données non gaussiennes, où la moyenne est perturbée par des valeurs ex- trêmes. D’autre part notre approche présente l’avantage de s’adapter à des observations de nature différente sans requérir de modifications du modèle ni de prétraitement des données comme un centrage des valeurs autour de 0, son caractère généraliste est mis en valeur. D’autres méthodes peuvent être choisies pour traiter les données non normales à queues lourdes, en particulier la méthode BARD avec un a priori adéquat, mais elle nécessite des connaissances sur les données suffisantes pour construire une fonction de vraisemblance adaptée. Pour obtenir les résultats de la figure 3.15a, les vraies distributions des données ont été inclues dans le modèle, ainsi que les vrais paramètres : le degré de liberté, les moyennes µ1 et µ2, et la déviation standard pour fixer le support de la moyenne µA des segments anormaux. L’adaptation du fused LASSO, sensible aux valeurs aberrantes, en LASSO robuste introduit un paramètre supplémentaire η, qui rend la sélection de mo- dèle plus difficile. De plus, parmi les jeux de paramètres (λ,η) testés, aucun n’a permis d’atteindre une aussi bonne précision que celle du Bernoulli Detector.