Nous commençons par étudier l'inuence de la taille du jeu de données de référence, que
nous dénotons parn
ref, sur la performance de nos modèles dynamiques. Pour cela nous
avons testé en temps réel les modèles 1-SVM.MAD
eet 1-SVM.RFE sur les deux jeux de
données, suivant les deux scénarios et pour des valeurs den
refégales à 400 et 600 (resp.
300 et 400) pour le dataset 1 (resp. dataset 2).
Le Tableau 5.1 représente une illustration numérique pour certaines valeurs de ν de
la comparaison de performance de détection réalisée sur le dataset 1 avec le modèle
1-SVM.MAD
esuivant le scénario 1. En augmentantn
refde 400 à 600, les taux de détection
restent les mêmes alors que les taux de fausses alarmes sont légérement inférieurs.
Dans la Figure 5.4, des courbes FAR-DR de la détection en temps réel sur le dataset
2 avec le modèle 1-SVM.MAD
esuivant le scénario 1 et pour les deux valeurs de n
refsont obtenues en faisant varier ν (ν ∈ {0.01,0.02, . . . ,0.19,0.2}). Malgré les légères
améliorations en terme de taux de détection et de fausses alarmes obtenues pour quelques
valeurs deν, les deux courbes sont similaires.
Ensuite, des illustrations numériques pour certaines valeurs de ν de la comparaison de
performance de détection réalisée sur le dataset 1 et le dataset 2 avec le modèle
1-SVM.RFE suivant le scénario 1 sont données respectivement dans les Tableaux5.2et5.3
. D'après ces tableaux, l'augmentation den
refaboutit aux mêmes résultats observés avec
le modèle 1-SVM.MAD
eappliqué avec le même scénario (scénario 1). En eet, les taux
de détection sont constants, avec des petites réductions en fausses alarmes (sauf pour
ν = 0.04 dans le dataset 2, le taux de fausses alarmes était supérieur). Nous pouvons
donc constater que l'augmentation de la taille du jeu de données de référence n'aecte pas
ν n
ref= 400 n
ref= 600
DR FAR DR FAR
0.03 70 5.66 70 4.40
0.04 80 6.79 80 6.50
0.05 80 8.54 80 6.61
0.09 90 15.38 90 14.21
Table 5.1 Dataset 1 : illustration numérique comparant la détection en temps réel
avec le modèle 1-SVM.MAD
esuivant le scénario 1 pour n
ref= 400 et n
ref= 600, en
faisant variant ν et pour q= 0.75.
0 5 10 15 20
40
50
60
70
80
90
100
Taux de Fausses Alarmes
T
aux de Détection
Figure 5.4 Dataset 2 : courbes FAR-DR de la détection en temps réel avec le modèle
1-SVM.MAD
esuivant le scénario 1 pour n
ref= 300 etn
ref= 400, en faisant variant ν
et pourq = 0.75.
signicativement la performance de détection de 1-SVM.MAD
eet 1-SVM.RFE appliqués
suivant le scénario 1. Ceci est dû à la taille croissante de la fenêtre mobile du scénario
1 qui permet l'augmentation au fur et à mesure de la taille des données d'apprentissage
puisque chaque lot testé rejoint l'échantillon d'apprentissage mis à jour à chaque fenêtre
sans éliminer le lot le plus ancien de cet échantillon. La taille croissante de la fenêtre
mobile du scénario 1 aboutit donc à une détection pertinente sans nécessiter une taille
n
refassez élevée. Cependant, la taille du jeu de données de référence joue un rôle
im-portant en eectuant une détection suivant le scénario 2 avec le modèle 1-SVM.MAD
e.
Ceci est illustré dans le Tableau 5.4 et la Figure 5.5. Les résultats obtenus dans le
Ta-bleau5.4sur le dataset 1 montrent que l'augmentation de la taille du jeu de données de
ν n
ref= 300 n
ref= 400
DR FAR DR FAR
0.03 80 4.12 80 4.03
0.04 80 6.32 80 6.21
0.05 80 8.40 90 6.53
0.09 90 15.91 90 12.04
Table 5.2 Dataset 1 : illustration numérique comparant la détection en temps réel
avec le modèle 1-SVM.RFE suivant le scénario 1 pour n
ref= 400 et n
ref= 600, en
faisant variant ν et pour q= 0.75.
ν n
ref= 300 n
ref= 400
DR FAR DR FAR
0.04 70.59 4.12 70.59 6.03
0.05 82.35 6.32 82.35 6.21
0.06 88.24 8.40 88.24 6.53
0.12 94.12 15.91 94.12 12.04
Table 5.3 Dataset 2 : illustration numérique comparant la détection en temps réel
avec le modèle 1-SVM.RFE suivant le scénario 1 pour n
ref= 300 et n
ref= 400, en
faisant variant ν et pour q= 0.75.
ν n
ref= 400 n
ref= 600
DR FAR DR FAR
0.03 70 9.66 80 5.65
0.04 70 11.03 80 6.31
0.05 80 13.81 90 9.29
0.09 90 22.56 90 15.22
Table 5.4 Dataset 1 : illustration numérique comparant la détection en temps réel
avec le modèle 1-SVM.MAD
esuivant le scénario 2 pour n
ref= 400 et n
ref= 600, en
faisant variant ν et pour q= 0.75.
référence aboutit à une amélioration signicative dans la détection : les taux de détection
augmentent (sauf pour ν = 0.09 où ce taux est le même dans les deux cas, sachant que
c'est le taux maximum qu'on peut obtenir sur le dataset 1), suivis de réductions
impor-tantes en terme de fausses alarmes. Les améliorations signicatives des deux mesures de
performance sont observées également pour toutes les valeurs de ν dans la Figure 5.5,
où nous avons tracé les courbes FAR-DR de la détection en temps réel sur le dataset
2 avec le modèle 1-SVM.MAD
esuivant le scénario 2 et avec les deux valeurs de n
ref.
Comme la taille de la fenêtre mobile dans le scénario 2 est constante, augmenter la taille
du jeu de données de référence aboutit à l'amélioration de la performance de détection
du modèle 1-SVM.MAD
e. En eet, la méthode 1-SVM nécessite de nombreuses données
d'apprentissage pour donner une frontière de décision de bonne précision parce que ses
vecteurs supports ne proviennent essentiellement que des données de la classe positive
0 5 10 15 20
40
50
60
70
80
90
100
Taux de Fausses Alarmes
T
aux de Détection
Figure 5.5 Dataset 2 : courbes FAR-DR de la détection en temps réel avec le modèle
1-SVM.MAD
esuivant le scénario 2 pour n
ref= 300 etn
ref= 400, en faisant variant ν
et pourq = 0.75.
(wafers normaux).
L'inuence de la taille du jeu de données de référence sur la performance du modèle
1-SVM.RFE appliqué suivant le scénario 2 a été aussi étudié sur les deux jeux de
don-nées. Des illustrations numériques de cette étude sont présentées respectivement dans les
Tableaux5.5et5.6, où sont présentés les résultats de comparaison pour certaines valeurs
deν. Des améliorations importantes des deux mesures de performance sont observées en
augmentant la taille n
refdans le dataset 1 (cf Tableau5.5). Dans le Tableau 5.6, nous
remarquons que les taux de détection n'ont pas évolué avec l'augmentation de n
ref, vu
que ces taux sont déjà trés élevés dès les premières valeurs deν, et pour les deux valeurs
de n
ref. Concernant les fausses alarmes, nous avons observé de légères réductions au
niveau des quatre premières valeurs de ν, puis des réductions signicatives pour ν égal
à 0.12 et0.16.
Pour conclure, la taille du jeu de données de référence est un facteur important pour
une détection pertinente avec le scénario 2. Nous avons vu que généralement les taux
de détection augmentent et les taux de fausses alarmes diminuent en augmentant cette
taille. Contrairement au scénario 2, le scénario 1 ne dépend pas visiblement de ce facteur.
ν n
ref= 300 n
ref= 400
DR FAR DR FAR
0.03 80 6.89 80 4.91
0.04 80 8.14 90 5.62
0.05 80 12.71 90 8.64
0.09 90 21.16 90 14.05
Table 5.5 Dataset 1 : illustration numérique comparant la détection en temps réel
avec le modèle 1-SVM.RFE suivant le scénario 2 pour n
ref= 400 et n
ref= 600, en
faisant variant ν et pour q= 0.75.
ν n
ref= 300 n
ref= 400
DR FAR DR FAR
0.04 88.24 7.98 88.24 7.34
0.05 94.12 9.14 94.12 8.48
0.06 94.12 10.90 94.12 10.42
0.12 94.12 20.66 94.12 16.47
Table 5.6 Dataset 2 : illustration numérique comparant la détection en temps réel
avec le modèle 1-SVM.RFE suivant le scénario 2 pour n
ref= 300 et n
ref= 400, en
faisant variant ν et pour q= 0.75.
5.3 Exemples de performance des systèmes de détection en
Dans le document
Détection multidimensionnelle au test paramétrique avec recherche automatique des causes
(Page 118-122)