• Aucun résultat trouvé

Sélection des descripteurs

Les descripteurs extraits du visage sont souvent volumineux, nécessitent un grand temps de calcul et beaucoup de mémoire. Pour résoudre ces problèmes, une étape de sélection devient alors indispensable dans le système de reconnaissance des

Descripteurs Sélection Descripteurs sélectionnées Apprentissage Modèle

Figure2.16 – Schémas des trois classes de sélection. (a) approches de type "filter", (b) approches de type "embedded", (c) approches de type "wrapper"

émotions. Les approches de sélection cherchent à extraire de manière optimale un sous-ensemble de descripteurs, qui obéissent à certains critères dont la définition change selon l’approche utilisée. La sélection des descripteurs réduit les bruits dus aux conditions d’acquisition et aux mouvements de la tête dans les séquences d’émotions naturelles et spontanées [98]. L’étape de sélection réduit également la redondance des descripteurs et améliore dans certains cas la classification.

Les méthodes de sélection sont souvent classées en trois groupes :

• Approches dites "filter" : ces techniques sont appliquées avant l’étape de classification. Leur critère de sélection est complètement indépendant des résultats de classification (voir figure 2.16 (a)).

• Approches dites "embedded" : ces techniques sélectionnent les descripteurs durant l’étape d’apprentissage (voir figure 2.16 (b)). Elles combinent ainsi l’estimation du modèle et le choix des descripteurs les plus performants [99].

• Approches dites "wrapper" : ces approches sélectionnent les descripteurs de façon itérative en évaluant leur pertinence par la méthode de classification [99] (voir figure 2.16 (c)).

Les méthodes de reconnaissance des émotions basées sur les approches "filter" sont nombreuses. Elles présentent une étape de sélection indépendante, qui prend en entrée tous les descripteurs extraits du visage et donne en sortie seulement les descripteurs choisis. Les critères de sélection des descripteurs dépendent de la mé-thode choisie.

L’étude de la corrélation des descripteurs est un critère important pour le choix

de ceux-ci. La technique de sélection des caractéristiques par corrélation (Corre-lation Feature Selection (CFS)), adoptée dans [74] choisit les descripteurs les plus corrélés avec la vérité terrain et les moins corrélés avec les autres classes. L’analyse par composantes principales [66] [100] exploite également la notion de corrélation.

Elle transforme les descripteurs de départ en composantes principales non corré-lées. Ainsi, le choix d’un sous-ensemble de composantes, ayant assez de variance pour représenter les données, réduit le nombre de descripteurs de départ. Pour substituer la variance dans le choix des composantes principales retenues, Soyel et al [101] utilisent le critère de Fisher. Une sélection itérative des composantes optimales est alors appliquée. L’analyse des composantes principales 2D [102] est également utilisée pour la réduction des descripteurs. Elle réduit les images filtrées par les filtres de Gabor en opérant directement sur les images sans les convertir en vecteurs.

Enfin l’information mutuelle est un critère utilisé dans la sélection des descripteurs.

Contrairement à la sélection basée sur la corrélation, la sélection basée sur l’in-formation mutuelle est indépendante des relations de linéarité qui peuvent exister entre les descripteurs [103]. L’information mutuelle mesure les dépendances entre les descripteurs et les classes. Elle est utilisée dans [69] pour la sélection des des-cripteurs extraits par les filtres de Gabor logarithmique sur les régions hybrides locales et globales. Lajevardi et al [103] montrent que la sélection par information mutuelle donne de meilleurs résultats que la sélection par l’analyse des compo-santes principales et la sélection par filtres optimaux.

Les méthodes de type "embedded " sélectionnent en général les descripteurs les plus importants au fur et à mesure de l’apprentissage. Ces méthodes ne sont pas très utilisées dans les systèmes de reconnaissance des émotions. Cependant, celle qui revient le plus souvent est la technique Adaboost. Adaboost est une méthode performante permettant de constituer à partir d’un ensemble de faibles classi-fieurs un classifieur fort. Souvent dans le cas de sélection les arbres de décision utilisée comme faibles classifieurs dans Adaboost sont constitués d’un seul niveau (Decision stump). Ces faibles classifieurs présentent les descripteurs choisis par Adaboost. Shan et al [9] et Bartlett et al [52] appliquent Adaboost pour réduire respectivement les descripteurs issus de motifs binaires locaux et les réponses de filtres de Gabor.

Les méthodes de type "wrapper" sélectionnent de façon itérative les descripteurs

après leur évaluation par la méthode de classification. Les algorithmes génétiques sont souvent utilisés dans le but de sélectionner les caractéristiques. Dans la recon-naissance des expressions émotionnelles, une extension des algorithmes génétiques, appelée programmation génétique est utilisée. Yu et Bhanu [104] présentent une approche de reconnaissance des expressions utilisant celle-ci. Une extraction des caractéristiques est d’abord effectuée par les ondelettes de Gabor. Ces caractéris-tiques considérées comme primitives alimentent la programmation génétique pour constituer des vecteurs composés. Ces derniers sont évalués par les séparateurs à vaste marge. L’ensemble des vecteurs composés retenus sont fixés après un ajuste-ment itératif de la fonction de fitness qui se base sur les résultats des séparateurs à vaste marge. Testé sur la base JAFEE, la méthode atteint un taux de reconnais-sance de 80.9%.

Li et al [105] proposent une technique de sélection de type "wrapper" pour choisir l’ensemble de descripteurs saillants parmi les descripteurs d’apparence du visage.

L’ensemble de descripteurs choisi est d’abord initialisé par le descripteur ayant le taux maximal de séparation entre les classes. Ce taux est calculé pour tous les des-cripteurs. Les descripteurs intégrés de façon itérative dans l’ensemble choisi sont les descripteurs qui maximisent le taux de reconnaissance et minimisent le score d’information mutuelle.