• Aucun résultat trouvé

109II D Tests sur des signaux réellement acquis à bord d’un train

II. 3 ' Bilan et discussion des résultats

Une première base de référence a été créée à partir de différents scénarios construits à l’aide de modèles de transitoires caractéristiques des signaux issus du contact caténaireDpantographe. Après élimination des éléments constituant des sources d’erreur, celleDci a été enrichie de nouveaux éléments provenant de scénarios similaires construits à partir de signaux acquis en situation réelle à bord d’un train. Ce qui a conduit à l’obtention de notre base de référence complète. Cette base de référence complète comporte l’ensemble des éléments qui ont servi à estimer la classe des éléments d’une base de test, construite à partir de transitoires réels. Le taux de bonne classification est supérieur à 99% pour la classe "bon". Ce taux atteint 75% pour la classe "mauv" et peut donc être amélioré.

II.3.a. Augmentation du nombre de voisins

Comme énoncé au paragraphe I.3, l’évaluation présentée précédemment a été obtenue avec la règle des trois plus proches voisins. C’est, en effet, la règle qui nous semblait la plus appropriée dans le cas d’un problème à deux dimensions qui plus est très linéaire.

A titre comparatif, nous avons également appliqué les règles des cinq et sept plus proches voisins pour évaluer si cela permettait d’améliorer ou non les taux de bonne classification. Il s’est avéré que l’augmentation du nombre de voisins conduit à un taux de bonne classification de 100% pour les éléments de la classe "bon". En revanche, quel que soit le nombre de voisins considérés, le taux de bonne classification sur la classe "mauv" diminue légèrement (73.68% au lieu de 75.4%). Cela est dû au fait que les éléments de la base de référence complète appartenant à la classe "bon" sont plus nombreux que ceux de la classe "mauv". Ainsi, les éléments pour lesquels il est plus difficile de trouver plus de trois voisins de la même classe sont plus nombreux parmi les "mauv". De ce fait un élément "mauv" peut être faussement classé comme "bon" car ayant moins de cinq voisins appartenant à la classe "mauv" et cinq (ou plus) parmi les autres plus proches (même si plus éloignés que les quelques voisins "mauv") de la classe "bon".

Bon

Bon

Mauv

Mauv

(Estimé)

(R

é

e

l)

240/242 0.992 86/114 0.754 28/114 0.246 2/242 0.008

115

II.3.b. Compensation de la perte de dynamique liée au sous'échantillonnage lors de la

collecte des fichiers à l’oscilloscope

Comme précédemment expliqué dans la section II.2.a, les fichiers de mesures utilisés pour construire les bases de développement et de test ont été sousDéchantillonnés lors de leur enregistrement à l’oscilloscope. Ce sousDéchantillonnage est la raison d’une perte de dynamique des signaux correspondants. Ainsi les valeurs des minima et leur somme sont surestimées, ce qui provoque un "décalage" des éléments des bases de développement et de test sur le diagramme de dispersion de référence.

Pour compenser cette perte de dynamique et ainsi corriger les valeurs des sommes des minima, nous proposons d’appliquer un gain ε à la somme des minima pour chaque couple (nombre de minima, somme des minima). Le tableau de la figure 5.14 montre les résultats de classification obtenus en appliquant la règle des trois plus proches voisins aux éléments de la base de développement pour différentes valeur de ε.

Figure 5.14.Compensation de la perte de dynamique sur la base de développement

Nous constatons que c’est en appliquant un coefficient multiplicateur ε=0.85 que nous obtenons les meilleures performances globales. En effet, avec cette valeur, nous diminuons nettement le taux d’erreur de la classe "mauv", tout en conservant un bon taux de bonne classification pour la classe "bon". Nous conservons donc cette valeur de ε=0.85 et l’appliquons aux éléments de la base de test. Les résultats ainsi obtenus sont présentés sur la figure 5.15.

Figure 5.15.Compensation de la perte de dynamique sur la base de test "Bon" correctement identifiés "Mauv" correctement identifiés Erreurs "bon" en "mauv" Erreurs "mauv" en "bon" 238/243 84/115 5/243 31/115 0.979 0.73 0.021 0.27 234/243 102/115 9/243 13/115 0.963 0.887 0.037 0.113 228/243 106/115 15/243 9/115 0.938 0.922 0.062 0.078 216/243 110/115 27/243 5/115 0.889 0.957 0.111 0.043 188/243 113/115 55/243 2/115 0.774 0.983 0.226 0.017 BASE DE DEVELOPPEMENT Résultats initiaux ε = 0.9 ε = 0.85 ε = 0.8 ε = 0.7 "Bon" correctement identifiés "Mauv" correctement identifiés Erreurs "bon" en "mauv" Erreurs "mauv" en "bon" 240/242 86/114 2/242 28/114 0.992 0.754 0.008 0.246 217/242 106/114 25/242 8/114 0.897 0.93 0.103 0.07 BASE DE TEST Résultats initiaux ε = 0.85

116

A nouveau, nous observons une augmentation du taux de bonne classification de la classe "mauv" qui passe de 75.4% à 93%. Dans le même temps celui de la classe "bon" diminue, un peu plus fortement que dans le cas de la base de développement puisqu’il passe de 98.8% à 89.7%.

Ce résultat est acceptable pour deux raisons :

D un taux de bonne classification de 90% est très satisfaisant,

D le taux de bonne classification des éléments de la classe "mauv" est supérieur à 90%. Pour l’application à bord des trains, il nous semble plus utile d’être capable d’identifier au mieux les situations critiques pour le GSMDR. D’où la nécessité d’avoir un taux de bonne classification élevé sur les éléments de la classe "mauv". Ainsi, en favorisant légèrement la reconnaissance des éléments "mauv", on anticipe sur la façon dont notre méthode de classification pourrait être appliquée à bord des trains et sur ce qu’elle pourrait apporter en termes de détection de situations critiques pour la qualité des transmissions GSMDR.

Utiliser un gain est une solution à l’utilisation de différentes fréquences d’échantillonnage. A l’avenir, cette différence devra être proscrite car la compensation ne sera pas réalisable sur les fichiers "inconnus". Les fichiers devront tous être collectés à l’oscilloscope avec une fréquence de 2.5 GHz de manière à :

D se voir appliquer le même postDtraitement que celui appliqué pour construire la base de référence (largeur de la fenêtre de Gabor, facteur de recouvrement…),

D fournir des couples (nombre de minima, somme des minima) qui peuvent être placés (sans qu’il y ait de "décalage") sur le diagramme de référence.

117