Descripteur local binaire (LBP) - Transformée de Fourier discrète

3.5 Transformée de Fourier discrète

3.7.3 Descripteur local binaire (LBP)

LBP (Local binary pattern) a été introduit par Ojala et al. [129] pour extraire des caractéristiques locales binaires. Son principe consiste à construire un code binaire, appelé code LBP, qui décrit la texture locale d’une région. Ce code binaire est calculé par seuillage d’un voisinage avec le niveau de gris du pixel central. tous les voisins prendront alors une valeur 1 si leur valeur est supérieure ou égale au pixel courant et 0 sinon. On aura alors un code binaire qui, une fois converti en valeur décimale, donne un motif LBP dont l’intensité du pixel se situe entre 0 et 255 comme dans une image 8 bits ordinaire. La figure 3.13 décrit ce principe.

Pour calculer un code LBP dans un voisinage de 8 pixels on compte simplement les valeurs de niveaux de gris plus grands que la valeur centrale :

LBP (xc, yc) = 7

p=0

S(I(xp, yp) − I(xc, yc))2p, (3.18)

avec S() est la fonction signe :

S(A) = (

1 si A ≥ 0; 0 si A < 0

FIGURE3.13 – Calcul du code LBP d’un pixel donné

où I(xp, yp)et I(xc, yc) sont respectivement les niveaux de gris d’un pixel voisin et du

pixel central. Le descripteur(code) LBP ainsi généré est invariant par une variation monotone de la valeur des pixels ce qui est intéressant pour résister aux variations d’illumination.

Par ailleurs, deux variantes de la méthode LBP ont été présentées dans [123] ; la première définit des LBP pour des voisinages de différentes tailles, la seconde définit ce que l’on appelle des LBP uniformes.

On définit un code LBP uniforme comme étant un motif possédant exactement 0 ou 2 transitions (01 ou 10). Par exemple, dans un parcours circulaire les codes 10000001 ou 00011000 sont uniformes, mais pas le code 00101010.

Les LBP sont appliqués avec succès dans de très nombreux domaines comme la reconnaissance de visages et la segmentation d’images. Ils sont utilisés soit pour décrire l’image comme suite de motifs LBP, soit en découpant l’image en une grille régulière de cellules puis l’histogramme est calculé sur chacune de ces petites régions, pour enfin concaténer tous les histogrammes dans un vecteur de caractéristiques.

Ainsi, Ahonen et al. [1] ont été les premiers à utiliser LBP pour la reconnaissance de visages. A cet effet, la zone du visage est d’abord divisée en petites régions à partir de laquelle les histogrammes des LBP uniformes sont extraites et sont concaténées en un seul vecteur de caractéristiques pour représenter efficacement l’image du visage.

Tan et triggs et al. [148] ont fusionné les caractéristiques LBP avec ceux qui sont don- nés par les filtres de Gabor pour la reconnaissance de visages. Ils ont constaté une nette amélioration du pourcentage de reconnaissance par rapport à l’utilisation individuelle de LBP.

3.8 Conclusion

Dans ce chapitre, nous avons passé en revue les principales techniques d’extraction de caractéristiques couramment utilisées en traitement d’images.

Ainsi, nous avons commencé par présenter le célèbre filtre de Gabor qui permet de filtrer les images dans une direction et à une fréquence donnée. Les filtres de Gabor sont relativement utilisés dans la reconnaissance de visages, notamment du fait de leurs caractéristiques similaires à celles du système visuel humain. Cependant, une limitation provient du choix non trivial des paramètres du filtre de Gabor. De plus, les caractéristiques obtenues par filtrage de Gabor sont redondantes et ont une grande taille, ce qui nécessite plus de mémoire pour les stocker et plus de temps pour les calculer.

Ensuite, nous avons passé en revue une classe plus générale de méthodes de descrip- tion espace-fréquence à savoir les analyses multirésolution par ondelettes. Néanmoins, les représentations en ondelettes sont limitées dans la prise en compte de l’informa- tion directionnelle présente dans les images. Afin d’élargir l’ensemble des directions (diagonale, verticale et horizontale) des ondelettes, les contourlets ont été développées. Cette nouvelle technique de représentation espace-échelle combine successivement une décomposition multi échelle suivie d’une décomposition directionnelle. Ceci permet de trouver une représentation compacte de traits caractéristiques d’une image.

D’autre part, nous avons aussi décrit la transformée DCT qui est une transformée linéaire permettant de représenter le contenu fréquentiel d’un signal en termes d’am- plitude ou d’énergie. Puis, nous avons décrit l’utilisation des moments géométriques invariants par rapport à la translation, à la rotation et à la réflexion, afin de caractéri- ser une image. Les moments géométriques sont redondants, c’est pourquoi Zernike a développé des moments orthogonaux non redondants.

A la fin nous avons présenté la méthode LBP qui permet de décrire une texture dans un voisinage local.

Développement d’une nouvelle méthode d’analyse

discriminante pondérée

4.1 Introduction

La méthode LDA classique n’est pas optimale pour minimiser le taux d’erreur de classification dans l’espace de faible dimension. Cette méthode a tendance de chevau- cher les classes qui sont déjà bien séparées dans l’espace de caractéristiques de départ. Ce qui en résulte une possibilité de fausse classification des classes.

Pour corriger ce problème, Loog et al. [104] ont proposé d’introduire une fonction de pondération dans le critère de discrimination dans lequel une matrice de dispersion inter-classe pondérée a été définie pour remplacer la matrice de dispersion inter-classe conventionnelle.

Ainsi, avec cette nouvelle matrice pondérée, les classes qui sont plus proches les unes des autres dans l’espace de sortie, et qui peuvent potentiellement nuire aux perfor- mances de la classification, devrait être plus fortement pondérées dans l’espace d’entrée. Toutefois, la fonction de pondération proposée est difficile à calculer en raison de la singularité de la matrice de dispersion intra-classe. Lotlikar Kothari et al. [105] ont proposé une idée intéressante qui permet la réduction de dimensionnalité au cours d’étapes itératives fractionnées. Ils ont proposé une fonction de pondération, basée sur

la distance Euclidienne entre les centres de classes pour estimer la matrice de dispersion inter-classe.

Plus récemment, Tang et al. [149] ont introduit les relations entre classes comme poids de pertinence (relevance weights) pour estimer la matrice de dispersion intra- classe. Ils ont présenté une amélioration de l’algorithme LDA, appelé LDA pondérée pertinente (RW-LDA), en remplaçant les matrices de dispersion non pondérée par des matrices pondérées en y ajoutant un coefficient de pondération appelé relevance weight. Toutefois, cet algorithme ne peut être directement appliqué pour la reconnaissance du visage en raison de la singularité de la matrice de dispersion intra-classe proposée. Afin de résoudre ce problème nous proposons une solution par l’introduction de la décomposition QR [58], sur RW-LDA et ainsi rendre cet algorithme applicable à la reconnaissance du visage. L’algorithme proposé sera appelé RWLDA/QR.

Dans le document Conception de nouveaux algorithmes pour la reconnaissance des visages (Page 71-75)