• Aucun résultat trouvé

Chapitre 4. Contribution à la sélection de variables pour la reconnaissance faciale

4.2 La reconnaissance faciale

Le problème de la reconnaissance faciale, appelé aussi reconnaissance de visages, peut être formulé comme suit : étant données une ou plusieurs images d'un visage, la tâche est de trouver ou de vérifier l'identité d'une personne par comparaison de son visage à l'ensemble des images de visage stockées dans une base de données.

4.2.1 Dimensionnalité de l'espace visage

Une image du visage est un signal à 2 dimensions, acquis par un capteur digital (caméra numérique, scanner...). Ce capteur codera la couleur ou l'intensité des différents points de l'image dans une matrice de pixels à deux dimensions.

Après une normalisation de l'image et une mise à l'échelle vers une taille fixe (ex : m*n), l'image du visage peut être considérée comme un vecteur dans un espace multi-

dimensionnel . Ce vecteur est obtenu en mettant, simplement, dans un ordre fixe les

éléments de la matrice des pixels. Afin de définir une image (ou un point) dans l'espace des images, nous devons spécifier une valeur pour chaque pixel de cette image. Le nombre de points constituant cet espace devient rapidement très grand, même pour les images de petite dimension. Cette dimensionnalité pose un certain nombre de problèmes pour les algorithmes de reconnaissance, qui se basent sur cette représentation de l'image, à savoir :

 dans un contexte de la reconnaissance, travailler dans un grand espace pose un

problème de complexité de calcul ;

 pour les méthodes paramétriques, le nombre de paramètres à estimer peut

rapidement dépasser le nombre d'échantillons d'apprentissage, ce qui pénalise l'estimation ;

 pour les méthodes non paramétriques, le nombre d'exemples nécessaires afin de

Le cas du visage est assez particulier. Le visage est formé par des surfaces lisses et une texture régulière. Il possède une forte symétrie (dans le cas des images frontales) et il est formé à partir de mêmes objets (yeux, nez et bouche), qui ont les mêmes positions pour tous les visages. Ces spécificités donnent lieu à plusieurs constatations :

 les différents pixels de l'image du visage sont fortement corrélés ;

 les images des différents visages sont aussi corrélées ;

 un important nombre de points dans l'espace des images ne représentent pas des

visages.

En résumé, la dimensionnalité élevée de l’espace de représentation du visage et la forte corrélation des caractéristiques du visage ainsi que la présentation de plusieurs caractéristiques non pertinentes pose un certain nombre de problèmes pour les algorithmes de reconnaissance ce qui nécessite d’effectuer une sélection adéquate des caractéristiques représentatives du visage avant la phase de reconnaissance ou de classification.

4.2.2 Principe de fonctionnement d’un système de

reconnaissance de visage

En général, un système de reconnaissance faciale est constitué de deux modules : un module de détection ou localisation de visage, et un module de reconnaissance qui se déroule en trois étapes : normalisation ou prétraitement, extraction de caractéristiques faciales, classification (Tan, et al., 2006) ; (Zhao, et al., 2000).

Figure 4-1 : Schéma général de reconnaissance de visage

La détection des visages est la première étape importante de tous les systèmes de reconnaissance faciale. Étant donnée une image ou une séquence d'images, l'objectif de cette étape est de déterminer la présence ou non d'un visage dans l'image ainsi que sa localisation. Après la détection, le visage est normalisé. La normalisation implique généralement une normalisation géométrique des visages dans un but d'alignement et une normalisation d'éclairement dans un but de compensation des variations d'illumination. Les

Détection du visage Normalisation du visage Extraction de caractéristiques Classification

zones de visages normalisées sont ensuite utilisées pour l'extraction des caractéristiques faciales. Les caractéristiques extraites sont les informations utiles à la phase de reconnaissance et elles doivent être, dans la mesure du possible, discriminantes et robustes aux changements extérieurs, tels que la pose, l'expression, etc. Les caractéristiques faciales sont modélisées pour fournir la signature biométrique du visage qui est ensuite utilisée dans la phase de classification. Lors de cette dernière étape, on distingue deux tâches : l'identification et la vérification. En mode identification de visage, l'image à l'entrée du système est l'image d'un inconnu et le système doit rechercher l'identité de cet inconnu par comparaison de ses caractéristiques faciales à l'ensemble des caractéristiques faciales des visages de la base de données d'individus connus. En mode vérification, la personne à l'entrée du système déclare son identité et le rôle du système est de confirmer ou de rejeter l'identité revendiquée par comparaison de ses caractéristiques faciales uniquement avec celles de l'identité revendiquée.

4.2.3 Méthodes de reconnaissance faciale

De nombreuses méthodes de reconnaissance de visages ont été proposées au cours des 30 dernières années. La reconnaissance faciale automatique est un challenge tel qu'il a suscité de nombreuses recherches dans des disciplines différentes : psychologie, neurologie, mathématiques, physique, et informatique (reconnaissance des formes, réseaux de neurones, vision par ordinateur). C'est la raison pour laquelle la littérature sur la

reconnaissance de visages est vaste et diversifiée (Tan, et al., 2006) ; (Zhao, et al., 2000).

Les systèmes de reconnaissance de visages sont très souvent classés à partir des conclusions d'études psychologiques sur la façon dont les hommes utilisent les caractéristiques faciales pour reconnaitre les autres. De ce point de vue, on distingue les trois catégories suivantes :

 Les méthodes de correspondance globales : ces méthodes utilisent la région entière

du visage comme entrée du système de reconnaissance. L'une des méthodes la plus largement utilisée pour la représentation du visage dans son ensemble est la

représentation à partir de l'image de visages propres (Turk & Pentland, 1991) basée

sur une analyse en composantes principales (ACP).

 Les méthodes de correspondance locales : typiquement, ces méthodes extraient

géométrie et/ou l'apparence) comme donnée d'entrée du classificateur. Les méthodes locales peuvent être classées en deux catégories, les méthodes basées sur les points d'intérêt et celles basées sur l'apparence du visage. Dans le premier cas, on détecte tout d'abord les points d'intérêt et ensuite on extrait des caractéristiques localisées sur ces points d'intérêt. Dans le second cas, on divise le visage en petites régions (ou patchs) sur lesquelles les caractéristiques locales sont extraites directement. En comparaison avec les approches globales, les méthodes locales présentent certains avantages. Tout d'abord, elles peuvent fournir des informations supplémentaires basées sur les parties locales. De plus, pour chaque type de caractéristiques locales, on peut choisir le classificateur le plus adapté.

 Les méthodes hybrides : ces méthodes combinent les deux types de caractéristiques

locales et globales.

L’approche qu’on propose dans ce chapitre est une méthode de correspondance globale basée sur l’apparence du visage. Ce type d’approches comportent, en générale, quatre étapes : le découpage en régions de la zone du visage, l'extraction des caractéristiques, la sélection des caractéristiques et la classification.

 Découpage en régions : les deux facteurs qui définissent une région locale sont sa

forme et sa taille. La forme peut être rectangulaire, elliptique, etc., mais ce qui est le plus largement utilisé est le découpage rectangulaire. Les fenêtres peuvent être superposées ou non. La taille de la région a une influence directe sur le nombre de caractéristiques et la robustesse de la méthode.

 Extraction des caractéristiques locales : une fois que les régions locales ont été

définies, il s’agit de choisir la meilleure manière de représenter les informations de chaque région. Cette étape est critique pour les performances du système de reconnaissance. Les caractéristiques couramment utilisées sont les valeurs de gris, les coefficients de Gabor (Brunelli & Poggio, 1993) ; (Wiskott, et al., 1997), les

ondelettes de Harr (Viola & Jones, 2004), les transformées de Fourier, les

caractéristiques basées sur les indices LBP (Local Binary Pattern) (Ahonen, et al.,

2004), SIFT (Scale Invariant Feature Transform) (Lowe, 2004) ou DCT. Cette dernière méthode a été adoptée dans notre travail et sera détaillée dans la section suivante.

 Sélection des caractéristiques : il est possible de calculer de nombreuses caractéristiques faciales a priori. De ce fait, une étape de sélection des caractéristiques les plus pertinentes peut s'avérer nécessaire pour des questions de

rapidité de traitement. L'ACP (Turk & Pentland, 1991) est une méthode

couramment utilisée pour sélectionner des caractéristiques en garantissant une perte minimum d'informations. L’analyse discriminante peut être utilisée pour

sélectionner les caractéristiques les plus discdiminante (Belhumeur, et al., 1997)

(Martinez & Kak, 2001), d'autres techniques comme l'Adaboost (Viola & Jones, 2004) sont également possibles pour cette tâche.

 Classification : La dernière étape est bien entendu l'identification de visage.

Plusieurs travaux ont été publié concernant l’utilisation des différentes algorithmes et techniques de classification. L’objectif étant d’améliorer le taux de reconnaissance des visages.

Documents relatifs