• Aucun résultat trouvé

7.5 Résultats et discussion

7.5.2 CDL contre la distance euclidienne et la SSIM

L'objectif de cette partie est de comparer les performances de la CDL avec celles de la distance euclidienne et la SSIM. Les trois mesures sont utilisées comme distances pour le classieur k-PPV. Une seule coupe avec des seuils non régulièrement espacés est utilisée pour la CDL. Les distances sont dénies par :

1 2 3 4 5 6 7 8 9 10 Nombre de coupes 80 82 84 86 88 90 92 94 96 98 100 Précision (%) 20 40 60 80 100 120 140 160 180 200 Durée de simulation (s) Précision Durée de simulation

Figure 7.6  Précision et durée de la simulation en fonction de nombre de coupes de la CDL. Seuils non régulièrement espacée. Performances évaluées par le classieur k-PPV.

dEuclidienne(A, B) = ||A − B||2 (7.9)

dSSIM(A, B) = 1 − SSIM(A, B) (7.10)

Deux types de comparions sont étudiées. La première consiste à comparer les performances des trois distances en fonction de nombre de classes de la base de données d'apprentissage. La deuxième comporte sur la comparaison des mêmes distances en fonction de nombre d'individus dans la base de données d'apprentissage. La base de données MNIST est utilisée comme application. Les performances du classieur k-PPV sont mesurées par la précision.

a) Premier type de comparaison

Pour réaliser cette comparaison, deux bases de données constituées de 10 classes sont utilisées pour l'apprentissage et le test. Les classes de la base d'apprentissage contiennent 100 individus et ceux de la base de test 10 individus. La méthode de k-PPV est évaluée pour chaque distance en fait varié le nombre de classes dans la base d'apprentissage et de test de 2 à 10 avec un pas de 1. En eet, le problème à deux classes contient les chires (1 et 2), celui à trois classes les chires (1, 2 et 3) et ainsi de suite. Les gures 7.7 et 7.8

représentent les résultats obtenus par les trois distances. Les courbes de ces gures représentent les précisions et la durée de la simulation en fonction de nombre de classes, respectivement.

À partir de la gure 7.7, on remarque que, pour les trois courbes, la précision est une fonction décroissante du nombre de classes. La pente de décroissance de la courbe obtenue par la CDL est beaucoup moins importante à celles obtenues par la distance euclidienne et la SSIM. Les performances du classieur k-PPV basée sur la CDL commencent à se dégrader pour un nombre de classes supérieur à 6. Par contre la dégradation des performances du même classieur basé sur la distance euclidienne et la SSIM débute pour un nombre de classes supérieur à 2 et supérieur à 1, respectivement. Les précisions obtenues par le classieur k-PPV basé sur la CDL, la distance euclidienne et la SSIM variées en fonction de nombre de classes dans les intervalles [98 ; 100], [85 ; 100] et [85 ; 100], respectivement. Pour un problème de classication à 2 classes, une précision de 100% est obtenue par le classieur pour les trois distances. À partir de 3 classes, les meilleures précisions du classeur sont obtenues avec la CDL comme distance.

À partir de la gure 7.8, on constate que pour les trois courbes, la durée de la simulation est une fonction croissante du nombre de classes. La courbe obtenue par la SSIM est une fonction exponentielle. Les courbes obtenues par la CDL et la distance euclidienne sont des fonctions linéaires. Par contre, la pente de la courbe obtenue par la CDL est très importante par rapport à celle de la distance euclidienne. Cette diérence entre les trois méthodes est due à leurs complexités.

2 3 4 5 6 7 8 9 10 Nombre de classes 70 75 80 85 90 95 100 Précsion (%) CDL Euclidienne MSSIM

Figure 7.7  Précision en fonction de nombre de classes obtenus par les trois distances (CDL, Euclidienne et SSIM). Performances évaluées par le classieur k-PPV.

2 3 4 5 6 7 8 9 10 Nombre de classes 0 50 100 150 200 250 Durée de la simulation CDL Euclidienne MSSIM

Figure 7.8  Durée de la simulation en fonction de nombre de classes obtenus par les trois distances (CDL, Euclidienne et SSIM). Performances évaluées par le classieur k-PPV.

b) Second type de comparaison

Pour eectuer cette comparaison, deux bases de données constituées de 10 classes sont utilisées pour l'apprentissage et le test. Pour mesurer les performances des trois distances, le classieur k-PPV est évalué en fonction de nombre d'individus dans la base de données d'apprentissage (10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400 et 500 individus dans chaque classe) pour une base de données de test xe (10 individus dans chaque classe). Les gures 7.9 et 7.10 représentent les résultats obtenus par les trois distances. Les courbes de ces gures représentent les précisions et la durée de la simulation en fonction de nombre d'individus.

D'après la gure 7.9, on constate que les précisions obtenues par le classieur sont des fonctions croissantes du nombre d'individus. Donc, l'enrichissement de la base d'apprentissage permet d'améliorer les capacités discriminatives du classifeur. On remarque que la courbe de la précision obtenue par le classieur en utili-sant la CDL comme distance, convergent rapidement par rapport à la distance euclidienne et la SSIM. En utilisant la CDL, le classifeur k-PPV atteint sa précision maximale de 99% pour seulement 90 individus dans chaque classe de la base d'apprentissage. Par contre, en utilisant la distance euclidienne et la SSIM, le même classieur atteint ses précisions maximales (90% et 94%) pour 300 individus dans chaque classe de la base d'apprentissage.

À partir de la gure 7.10, on constate que pour les trois courbes, la durée de la simulation est une fonction linéaire et croissante du nombre d'individus. La pente de la courbe obtenue par la SSIM est très importante par rapport à celles de la distance euclidienne et la CDL. Cette diérence entre les trois méthodes est due à leurs complexités.

0 100 200 300 400 500

Nombre d'individus dans les classes

65 70 75 80 85 90 95 100 Précision (%) CDL Euclidienne MSSIM

Figure 7.9  Précision en fonction de nombre d'individus obtenus par les trois distances (CDL, Euclidienne et SSIM). Performances évaluées par le classieur k-PPV.

0 100 200 300 400 500

Nombre d'individus dans les classes

0 200 400 600 800 1000 1200 Durée de simulation CDL Euclidienne MSSIM

Figure 7.10  Durée de la simulation en fonction de nombre d'individus obtenus par les trois distances (CDL, Euclidienne et SSIM). Performances évaluées par le classieur kPP.

c) Synthèse :

L'augmentation du nombre de classes de la base d'apprentissage n'a pas beaucoup d'inuence sur les capacités discriminatives de la CDL. Les meilleures précisions du classieur k-PPV sont obtenues avec la CDL comme distance. L'enrichissement de la base d'apprentissage en termes de nombre d'individus permet d'améliorer les capacités discriminative du classieur k-PPV. En utilisant la CDL comme distance, le clas-sieur k-PPV convergent rapidement. La complexité de la CDL augmente la durée de la simulation d'une manière linéaire en fonction de nombre de classe et d'individus dans la base d'apprentissage.