• Aucun résultat trouvé

Partie 2 Résumés linguistiques de périodicité 63

7.2 Étude expérimentale de la pertinence de la méthode DPE et de ses variantes139

7.2.3 Méthodes de regroupement

L’efficacité des différentes méthodes de regroupement est testée au travers des scéna-rios S1 comparant γBL avec γes et S2 intégrant de plus γW.

Le paragraphe suivant présente les résultats obtenus avec l’ensemble des méthodes tandis que les trois suivants détaillent les particularités de chacune d’entre elles.

Résultats communs à toutes les méthodes de regroupement

De manière générale, les résultats du scénario S2 illustrés sur la figure 7.3 p. 142 montrent que le type de bruit (taille ou valeurs) est le paramètre qui a le plus d’influence sur les résultats obtenus, suivi par la forme des séries (Rectangle ou Sinus). La taille des groupes ou l’utilisation simultanée des deux types de bruit n’induisent pas de comporte-ment qualitativecomporte-ment différent.

Nous détaillons désormais les résultats au regard des cinq critères définis dans la sec-tion 7.2.1 p. 140. Tout d’abord, le critère C1 est vérifié par toutes les méthodes, i.e. la périodicité est toujours égale à 1 lorsque le bruit est nul. Ce résultat est explicable par la méthode de génération des données qui créé des séries constituées de motifs exactement répétés simplement détectables par des méthodes à seuil global ou local lorsqu’aucun bruit ne les perturbe. Lorsque les groupes de même taille sont correctement identifiés, la disper-sion de leur taille est nulle et la périodicité vaut donc 1.

De manière peut-être plus surprenante, le critère C4 de bonne identification des éti-quettes est également vérifié pour toutes les méthodes. Cela est dû au fait que Acc est calculé à partir du nombre de données bien classées sans tenir compte de leur ordre. Supposons par exemple une série strictement périodique composée de 5 groupes H et 5 groupes L de 20 points chacun pour laquelle la méthode de regroupement détecte par erreur un point L au milieu de chaque groupe H. En ce cas, seules 5 erreurs d’étiquetage sont réalisées sur 200 points, et Acc = 97, 5%. Au niveau des groupes en revanche, la méthode en identifie 10 de types H, de taille 9 ou 10, et 10 de type L dont 5 de taille 20 et 5 de taille 1. La régularité ρH des groupes L, et par conséquent la périodicité renvoyée,

est donc faible, alors que la série initiale est strictement périodique. Ainsi, même si Acc est élevé le calcul de la périodicité peut-être faussé. En ce sens, Acc n’est pas pertinent pour juger de la qualité d’une méthode de regroupement.

De plus, le bruit νs sur les tailles de groupes est peu discriminant pour les méthodes de regroupement. Comme illustré sur la figure 7.1 p. 135, ses effets sont limités et les groupes restent simplement identifiables par l’ensemble des méthodes de regroupement. Même pour des valeurs élevés de νs, les cinq critères sont globalement vérifiés. Seule la méthode γW réalise des erreurs d’évaluation de la période pour νs>0, 7 avec des rectangles (cf. figure 7.3 p. 142 (e)) pour des raisons expliquées plus bas dans le paragraphe dédié à cette méthode.

Concernant les effet du bruit en valeurs νv, le critère C2 est vérifié pour les méthodes γW

et γes : π décroît lorsque le bruit augmente. Il est également vérifié pour γBL, dans tous les cas pour le scénario S1 et uniquement pour les valeurs de bruits inférieures à 0,5 dans le cas de Rectangles et 0,2 dans le cas de Sinus pour le scénario S2. Ces résultats sont justifiés dans le paragraphe suivant.

Le critère C3 est approximativement respecté quand νv <0, 4 : l’erreur d’estimation de la période ∆p reste très faible dans ce cas. A partir de ce seuil néanmoins, les méthodes renvoient des estimations erronées.

Enfin, le critère C5 sur l’écart-type des valeurs renvoyées pour un même niveau de bruit est étudié dans les paragraphes suivants car les résultats des différentes méthodes sont variables pour ce critère.

Méthode de référence γBL

La méthode γBL est la plus sensible au bruit conformément à nos attentes. Il est intéressant de voir cependant que cette sensibilité est nettement diminuée dans le scéna-rio S1 grâce l’utilisation du paramètre de fusion des groupes adjacents (cf. section 5.2.3 p. 103) : les résultats de la méthode γBL (légende B) sont alors comparables à ceux de la méthode γes. Comme illustré sur la figure 7.2 p. 141 (a), le comportement de γBL (lé-gende B) est comparable à la méthode γes(légende M). Le paramètre de fusion a toutefois été fixé afin de bien fonctionner sur les jeux de données générés, mais les expériences de S2 sans ce paramètre montrent que γBL est inefficace. D’autre part, comme discuté plus bas avec l’utilisation de la moyenne mobile pour la méthode γW, les paramètres utilisés sont sensibles et diminuent considérablement la robustesse de ces approches.

La suite de l’analyse porte sur le scénario S2, plus complet pour la comparaison des méthodes de regroupement. Dans ce scénario, la méthode γBL est la moins robuste. En effet, avec la forme rectangle (figure 7.3 p. 142 (a), (b)), π décroît rapidement et ∆p augmente subitement dès que νvatteint 0,5. Ces changements brusques sont liés au fait que le paramètre de seuil tv est fixé à 0,5 : tant que le bruit en valeurs νv est inférieur à 0,5, les valeurs générées pour les groupes H sont dans ]0,5 ;1] et celles des groupes L dans [0 ;0,5[, donc γBL les détecte exactement si bien que le degré de périodicité vaut 1 et ∆p est nul. Cette absence d’écart est intéressante, mais la constance du degré de périodicité est

7.2. Étude expérimentale de la pertinence de la méthode DPE et de ses variantes 147

problématique car elle signifie que la méthode ne fait aucune différence entre un jeu de données sans bruit et un jeu bruité.

De plus, dès lors que νv est supérieur ou égal à 0,5, les courbes changent brusquement car γBLidentifie des groupes H et L de petites tailles au milieu de groupes de type opposé, augmentant ainsi la dispersion des tailles de groupes et réduisant nettement la valeur de π. Il est intéressant de constater que pour des valeurs de νv>0, 5, π augmente jusqu’à atteindre 0,5 lorsque νv = 1. Pour ce niveau de bruit en effet et pour la forme Rectangle, la valeur d’un élément est purement aléatoire et suit une loi U (0; 1) d’espérance µ =1/2. Concernant son écart moyen, il est calculé par :

E [|X − µ|] = 1 ˆ 0 |x − µ| dx= 0,5 ˆ 0(x − 0, 5) dx + 1 ˆ 0,5 (x − 0, 5) dx = 14 Donc ρH = ρL= 1−1/4

1/2 =1/2d’où π =1/2, conformément à ce qu’indique le graphique.

Comparaison de γes et γW

D’une manière générale, γes est plus souple que γW car elle varie de manière moins abrupte du fait de l’utilisation d’un seuil local déterminé à partir des données. De plus, toujours dans le cadre du scénario S2, elle est généralement plus précise dans l’évaluation de la période (11 cas sur 16) et dans le taux de bonne classification (12 cas sur 16). Enfin, elle est plus robuste car ses valeurs d’écart-types sont plus faibles.

Concernant l’estimation de la période avec l’augmentation du bruit en taille, il est intéressant de noter que lorsque νs>0, 7, γW est la seule à faire des erreurs assez impor-tantes (figure 7.3 p. 142 (e)). Ce phénomène est lié à l’utilisation d’une moyenne mobile en prétraitement (cf. section 5.2.3 p. 103) qui peut réduire de manière drastique les groupes très fins qui apparaissent lorsque le bruit en taille est important et/ou lorsque la taille de la fenêtre est mal choisie. Ainsi, lorsqu’un groupe H ou un groupe L n’est pas identifié durant le regroupement, un groupe H ou un groupe L particulièrement grand est identifié, entraînant un biais considérable dans l’évaluation de la taille des groupes et donc dans celle de la période. La figure 7.6 illustre ce phénomène : pour γW, le seuil est mal placé suite à la diminution de pics par application de la moyenne mobile et seuls deux groupes H sont détectés.

Le point faible de γW réside donc dans l’utilisation d’un seuil global qui biaise toute l’évaluation lorsqu’il est mal déterminé. γespeut commettre des erreurs de regroupement, mais son seuil local permet de ne pas les propager. Ainsi, les évaluations de la période sont meilleures en moyenne avec γes qu’avec γW pour les données très bruitées en valeur (figure 7.3 p. 142 (b), (h)). La figure 7.7 illustre un tel jeu de données : γes identifie mal certains groupes mais γW les manque tous.

0 0,2 0,4 0,6 0,8 1 Données 0 0,2 0,4 0,6 0,8 1 γW 0 0,2 0,4 0,6 0,8 1 γes

Figure 7.6 – Comportement de γW et γes avec de petits groupes. Sur fond clair (resp. sombre), les groupes identifiés comme H (resp. L). Pour γW, le trait plein est obtenu par passage d’une moyenne mobile sur les données et le trait rouge représente le seuil retenu. Pour γes, le trait plein est le score d’érosion de X et le trait en pointillés celui de X.

0 0,2 0,4 0,6 0,8 1 Données 0 0,2 0,4 0,6 0,8 1 γW 0 0,2 0,4 0,6 0,8 1 γes

Figure 7.7 – Comportement de γW et γes avec des données sinusoïdales très bruitées en valeurs, légende similaire à celle de la figure 7.6

Méthode γes

La figure 7.7 montre également un des biais de γesdans le cas de données très bruitées, particulièrement en forme de Sinus. Les scores d’érosion de X et X qui servent de base au regroupement ne se croisent pas au moment où ils l’auraient dû, comme dans la partie droite du graphe où des groupes H sont ignorés. Cependant, le score de X croît et celui de X décroît aux endroits où un groupe H aurait dû être détecté, et inversement aux endroits où un groupe L aurait dû être détecté.

Ceci est dû au fait que le score d’érosion est très sensible au contraste des données initiales, i.e. au fait ce que les valeurs hautes atteignent 1 et que les valeurs basses redes-cendent en 0 à chaque cycle. Même si ces dernières sont normalisées avant calcul du score, il est possible qu’une seule valeur atteigne 0 et que les valeurs basses suivantes ne redes-cendent pas assez bas, en 0,1 par exemple. En ce cas, il faut de multiples érosions pour qu’elles atteignent finalement 0 (voir la section 6.1.2 p. 114). Comme à chaque nouvelle érosion la valeur de l’érodé est ajoutée aux valeurs précédentes, le score d’érosion en ce point est artificiellement élevé. Lorsque le score d’érosion est normalisé en fin de calcul, seule une valeur est égale à 0 et les autres sont élevées en rapport. Ce phénomène pour les valeurs basses se retrouve aussi pour les valeurs hautes lors du calcul du score d’érosion de X. Des solutions à ce problème sont discutées en perspective de cette thèse.