• Aucun résultat trouvé

Comme nous l’avons vu précédemment, l’apparence globale du visage est modifiée par les changements d’illumination, d’expression ou de pose. Les méthodes holistiques ne permettent donc pas une reconnaissance ro-buste à ces variations. Au contraire, les représentations locales des visages proposent de les caractériser par un ensemble de vecteurs caractéristiques extraits dans des zones précises du visage. Ce type de représentation per-met d’obtenir des systèmes plus robustes aux variations intra-classes. En effet, l’utilisation d’une multitude de caractéristiques locales en différents points du visage permet de limiter l’impact des changements d’apparence variations d’apparence intra-identité.

Ces méthodes locales de reconnaissance de visage peuvent être clas-sées en deux catégories : celles utilisant une approche géométrique et celles basées sur l’apparence locale.

2.2.1 Méthodes basées sur une approche géométrique

Ce type de méthode est considéré comme l’un des fondements de la reconnaissance biométrique. En effet, le premier système de reconnais-sance d’individu proposé par Bertillon en 1870 était basé sur la mesure de différents paramètres du corps humain. Dans son ouvrage présentant son système, Bertillon [11] précise que la probabilité que deux personnes partagent les mêmes caractéristiques anthropométriques est de 1/286000.

Les premières méthodes automatiques de reconnaissance de visage, proposées au début des années 1970 (Kanade [39]), sont également ba-sées sur cette approche. L’étude d’un ensemble de mesures géométriques (distance ou angle entre certains points du visage) permet de caractériser le visage. Ces points sont choisis de telle sorte à pouvoir être aisément détectés (Centre des yeux, coins de la bouche, pointe du nez, . . . ). Le visage est alors représenté par un vecteur de distances et d’angles.

Plus récemment, d’autres méthodes de reconnaissance faciale basées sur la position d’un plus grand nombre de points caractéristiques ont été proposées. Brunelli et Poggio [19] ont ainsi décrit un système de

reconnaissance de visage basé sur l’extraction automatique de 35 carac-téristiques physiques du visage. Celui-ci est ensuite caractérisé par leur position ou bien par l’angle formé par certains de ces points.

De nombreux travaux ont ensuite proposé une extension de cette méthode. Ils utilisent une représentation des visages par déformation de graphes [42] [69] [61].

Dans ces méthodes, les noeuds des graphes sont définis à partir d’un certain nombre de points caractéristiques et de vecteurs caractéristiques calculés au voisinage de ces points. La distance euclidienne séparant deux de ces points permet de définir la topologie du graphe. La comparaison des deux images I1et I2se fait en comparant les graphes G1et G2associés à ces deux images. Cette comparaison est faite à la fois sur la topologie des graphes (distance entre les différents noeuds) et sur les noeuds (similarité entre les vecteurs caractéristiques associés aux noeuds).

En plus d’une meilleure robustesse aux changements d’apparence, ces méthodes nécessitent un coût de stockage négligeable en comparaison aux méthodes holistiques. La qualité de l’extraction de ces caractéristiques géométriques peut toutefois être altérée en cas de fortes variations d’illu-mination ou de pose.

2.2.2 Méthodes basées sur l’apparence locale

L’ensemble de ces méthodes proposent de caractériser les visages par une collection de descripteurs locaux d’apparence. Ces descripteurs sont calculés sur différentes parties du visage. Celles-ci peuvent être définies par des patchs (avec ou sans chevauchement) ou par des régions infor-matives. Les caractéristiques locales sont ensuite extraites sur chacune d’elles grâce à des descripteurs standards. Une fois ces caractéristiques extraites, seules les plus informatives sont conservées grâce à l’utilisation d’une ACP ou d’une LDA.

Nous présenterons, dans cette section, deux méthodes d’extraction des caractéristiques couramment utilisées en vision par ordinateur : Les filtres de Gabor et le descripteur Local Binary Pattern.

Filtres de Gabor

De nombreuses méthodes de caractérisation d’images basées sur des filtres de Gabor ont été proposées par la communauté de vision par or-dinateur. Ces filtres, dont le fonctionnement peut être rapproché de celui du système visuel humain [35], autorise un paramétrage en fréquence et en orientation.

La première application des filtres de Gabor à la biométrie a été pro-posé par Daugman en 1993 [25] pour la reconnaissance d’iris. Appliqués à la reconnaissance de visages, ils permettent une extraction efficace des caractéristiques faciales en minimisant l’effet des variations de pose et

d’illumination [76].

Une ondelette de Gabor est définie par :

ψu,v(z) = kκu,vk2 σ2 ekκu,vk 2kzk2 2σ2  eu,vz−eσ22  (2.11)

L’orientation du filtre est définie par u et l’échelle donnée par v. κu,v est le vecteur d’onde. Il est défini ainsi :

κu,v= fmax

√ 2ve

iπu

8 (2.12)

La représentation d’une image I(x, y) = I(z) en ondelettes de Gabor est obtenue par la convolution de cette image avec le filtre de Gabor cor-respondant :

Gu,v = I(z) ∗ψu,v(z) (2.13) L’image est généralement transformée par un ensemble d’ondelettes. Shen et al. [56] proposent ainsi d’utiliser 40 ondelettes (Figure 2.3) cor-respondant à cinq paramètres d’échelles v différents et huit paramètres d’orientations u différentes.

Figure 2.3 – Collection d’ondelettes de Gabor : (a) Intensité à cinq échelles différentes (b) Partie réelle à cinq échelles et huit orientations [56]

La figure 2.4 montre la réponse en amplitude et en phase de ce banc de Gabor sur une image de visage.

Figure 2.4 – Représentation d’une image de visage dans le domaine de Gabor. Réponse en amplitude (a) et Réponse en phase (b) [56]

Local Binary Pattern (LBP)

L’opérateur LBP a été proposé en 1996 par Ojala et al. [51]. Cet opé-rateur propose de représenter chaque pixel par un code binaire calculé à partir des 8 pixels voisins. Chacun des pixels voisins se verra représenter par un 1 si sa valeur est supérieure au pixel courant. Dans le cas contraire, ce pixel sera représenté par un 0.

128 255 117 119 134 96 143 137 120 0 1 0 0 0 1 1 0 01000110

Seuil Code binaire

Figure 2.5 – Descripteur LBP : Codage d’un pixel en fonction de la valeur de ses 8 pixels voisins

et al. [52] ont notamment proposé une nouvelle définition de voisinage circulaire pour calculer le descripteur des pixels.

Figure 2.6 – Exemples de voisinages circulaires proposés par Oujala et al. [52] Les travaux de Ahonen et al. [1] ont montré que l’utilisation de descrip-teurs LBP permettait d’obtenir de bonnes performances en reconnaissance de visage. Dans ces travaux, il est proposé de calculer un certain nombre de descripteurs locaux puis de les combiner pour obtenir un vecteur de description du visage. L’image originale est découpée en différentes ré-gions. Les descripteurs associés à chacune de ces régions sont ensuite concaténés pour former un unique vecteur décrivant l’image.

Figure 2.7 – Découpage de l’image originale en 7×7, 5×5 et 3×3 régions [1] Ici encore, l’utilisation de descripteurs locaux permet de robustifier la reconnaissance faciale aux variations modérées de pose ou d’illumination.