• Aucun résultat trouvé

5.2 Classification à l’aide de l’arbre de décision

5.2.1 Arbre induit à partir des CSI temporels noté Tt

L’analyse du pouvoir discriminant des CSI a montré que les CSI temporels sont plus performants, au moins pour discriminer N et P. Pour cette raison, le premier classifieur présenté dans cette section ne prend en compte que les CSI temporels pour sa construction. L’arbre de décision induit, noté Tt, est structuré par 6 feuilles et 5 divisions comme le montre la figure 5.7.

Une division correspond à un CSI et une valeur seuil correspondant. Le même résultat a été obtenu pour les 3 bases d’apprentissage. L’algorithme CART a sélectionné 3 CSI seulement : ADA, DDSL et MinMax. Ce sont des CSI ayant un ASC élevé par rapport aux autres CSI temporels (cf. tableau 5.1). Pour rappel, l’ADA est le CSI le plus performant au sens de la valeur ASC des CSI temporels avec un ASC = 0,92. DDSL quant à lui possède une ASC = 0,90.

Une projection des données en deux dimensions, DDSL en fonction de ADA, est présentée dans la figue 5.8. Elle permet de visualiser graphiquement les divisions proposées par CART, les partitions formées par les différentes divisions et la répartition des trames d’apprentissage dans les différentes partitions. Ce graphe permet de mieux comprendre la structure de l’arbre Tt. En effet, il est clairement visible que δ1 avec l’ADA et δ3 avec DDSL permet de créer une partition ne contenant majoritairement que des trames N, ce qui est cohérent avec l’ob-servation des boites à moustaches. ADA et DDSL donnent tous deux une information sur

ADA >−9, 232 × 10−7V ?

ADA >−1.624 × 10−5 V ? DDSL > 3, 152× 10−3V ?

Non perturbé (N) Interférence (I) Interférence (I) DDSL > 1, 094× 10−2 V ?

M inM ax > 2, 416× 10−2 V ? Interférence (I)

Interférence (I) Mobilité (M)

non oui non oui non oui non oui non oui 1

Figure 5.7 – Arbre de décision Tt induit à partir des CSI temporels.

l’intensité de la perturbation, et obtiennent des valeurs faibles en valeur absolue en absence de perturbations sur le canal. Les divisions δ1, δ2, et δ4 permettent de créer une partition contenant majoritairement des trames M. Le reste des partitions créées contient en majorité des interférences I. Les trames M sont distinguées des trames I grâce au MinMax qui est plus élevé sur les trames M. Cela met en évidence le fait que les phénomènes d’évanouissement sont beaucoup plus perturbateurs que les interférences.

Les performances de Tt sont évaluées à partir de la base de validation, comprenant 570 N, de 106 M et de 4364 I. Les performances de Tt sont présentées sous forme d’une matrice de confusion par le tableau 5.2, qui confronte la vérité de terrain, en ligne, avec la décision auto-matique, en colonne. Les pourcentages sont exprimés en fonction du nombre d’éléments dans une classe. Ainsi, le pourcentage dans la case située sur la première ligne et la première colonne représente le pourcentage d’exemples N correctement classés en N. Celui sur la deuxième ligne et la première colonne représente le pourcentage d’exemples M classés à tort en N.

Afin de prendre en compte le déséquilibre de représentation des classes dans la base de validation, le pourcentage de bien classés global est calculé comme la moyenne des pourcentages de bien classés dans chaque classe et nommé taux de classification moyen dans la suite. Dans la suite, les taux de classification présentés seront associés à leur intervalle de confiance à 95%, noté entre crochet.

L’intervalle de confiance à 95% d’un taux de calssification R est calculé avec les exemples de la base de validation de manière suivante :

5.2. Classification à l’aide de l’arbre de décision 129

Figure 5.8 – Projection des données en deux dimensions, DDSL en fonction de ADA avec les quatre premières divisions notées δ1, δ2, δ3 et δ4.

CI95% = [R− 95%; R + 95%] (5.1)

où 95% est donné par :

95%=√ 2erf−1 (0.95) v u u u t Nbc Nc  1−Nbc Nc  Nc (5.2)

où Nbc est le nombre d’exemples qui sont bien classés et Nc est le nombre d’exemples qui portent le label de la classe.

Classe prédite

Non perturbé (N) Mobilité (M) Interférence (I)

Classe

réelle

Non perturbé (N) 83% 14% 3%

Mobilité (M) 1% 94% 5%

Interférence (I) 5% 14% 81%

Tt obtient un taux de classification moyen de 86% (cf. tableau 5.2). Le classifieur a tendance à favoriser la classe M, avec 94% ([89-99%]) de bonnes classifications. La classe N obtient un taux de bonnes classifications de 83% ([80-86%]), ce qui signifie que la reconfiguration pourra être réalisée 83% du temps. Elle est principalement confondue avec de la mobilité (14%) et assez peu avec de l’interférence (3%). La classe I obtient un taux de bonnes classifications de 81% ([80-82%]). La matrice de confusion montre plusieurs cas d’erreurs qui peuvent engendrer des prises de décisions et de risques différents :

• 1% des trames labellisées comme M sont classées à tort dans la classe N, cette confusion peut mener à une reconfiguration malgré la présence de mobilité dans le canal, reconfigu-ration qui risque de faire perdre la trame nécessitant sa retransmission. Ce qui provoque une sur-consommation d’énergie.

• 5% des trames labellisées comme I sont reconnues comme N. Cette erreur peut amener une reconfiguration à tort. Cependant, le risque de perdre la trame peut être négli-geable si les trames I classées comme N sont des interférences de faible intensité. Nous le vérifierons plus tard dans ce chapitre.

• 5% des trames M sont identifiées comme I. Ce cas peut mener à une reconfiguration de la radio qui convient à un canal perturbé par une source d’interférence. On peut envisager par exemple un changement de canal , c’est-à-dire une modification de fréquence de la porteuse. Dans ce cas de figure, sachant que la mobilité perturbe une large bande de fréquences, changer de fréquence de communication s’avérera inutile, mais ne fera pas courir le risque de perdre la trame transmise.

• 14% des trames I sont identifiées comme M à tort. Dans ce cas, aucune reconfiguration de la radio ne sera réalisée, car les perturbations provoquées par de l’évanouissement sont des perturbations potentiellement sévères et une reconfiguration dont le but est d’éco-nomiser de l’énergie pourrait faire perdre des trames. Ce type de confusion diminue les possibilités de reconfiguration de la radio, et par conséquent, les possibilités d’économie d’énergie.

Avec une structure simple, formée par 6 feuilles et 5 divisions par seuil, ne nécessitant que 3 CSI temporels de faible complexité de calcul, et avec un taux de classification moyen qui atteint 86%, Tt est un classifieur 3 classes performant. Les taux d’erreur sont faibles et engendrent des prises de décision conservatrices, c’est-à-dire des décisions de reconfiguration qui n’engendrent pas de risque de perdre l’information transmise et donc la retransmission des données.