Reconnaissance des visages

In document Reconnaissance et suivi de visages et implémentation en robotique temps-réel (Page 42-47)

3.3 Architecture prototype et cycle de fonctionnement standard

3.3.3 Reconnaissance des visages

Ce stage re¸coit en entr´ee un visage candidat et trouve son identit´e si il est d´ej`a enregistr´e dans la base de donn´ees. Dans le cas contraire, c’est l’identit´e de l’´el´ement le plus proche de la base de donn´ees qui est renvoy´ee. Ce traitement de l’information se fait en plusieurs phases d´ecrites ci-dessous et illustr´ees `a la figure 3.7 p.37 :

1. Le traitement de l’illumination. En conditions r´eelles, l’´eclairage peut varier et causer une d´egradation des performances de reconnaissance. Cette phase de pr´eparation de l’image prend ce probl`eme en charge.

2. La conversion LBP. L’image est d´ecrite en termes de ’Local binary patterns’ intro-duits `a la section 2.3p.19. L’interpr´etation de cette description en termes d’arˆetes et de coins sera donn´ee `a la section3.3.3 p.38.

3. La division en sous-r´egions. Il s’agit d’une phase cl´e qui a fait l’objet d’une param´etrisation complexe d´ecrite `a la section 4.3 p.47. En s´eparant l’image en plusieurs petites images trait´ees s´epar´ement, cette phase permet de tenir compte d’informations spatiales pr´ecieuses pour la classification.

Figure 3.7: Illustration du stage de reconnaissance. L’entr´ee est un visage dans sa zone rectangulaire de d´elimitation. Il subit d’abord un traitement d’illumination avant d’ˆetre converti au format LBP. Il est ensuite divis´e en sous-r´egions qui seront trait´ees s´epar´ement durant le reste du processus. Un histogramme par r´egion est calcul´e et ensuite compar´e avec ses homologues chez chacun des ´el´ements de la base de donn´ees pour obtenir l’identit´e ponctuelle. Un vote sur l’historique a enfin lieu pour d´eterminer l’identit´e divulgu´ee. L’ajout de l’identit´e ponctuelle `a l’historique n’a pas ´et´e dessin´ee pour simplifier la lecture du sch´ema.

4. La construction des histogrammes pour chaque sous-r´egion. Ensemble ils forment unset d’histogrammes associ´e au candidat.

5. La comparaison avec les ´el´ements de la base de donn´ees. Le set d’histogrammes du candidat est compar´e avec tous les personnages de la base de donn´ee qui eux aussi poss`edent leur propre set d’histogrammes. Le membre le plus proche est ensuite s´electionn´e comme identit´e ponctuelle du candidat et ajout´e `a un historique.

6. Enfin, l’identit´e divulgu´ee est obtenue par le vote sur plusieurs cycles, rendu

pos-sible par le stage de poursuite et la tenue de l’historique.

Le traitement de l’illumination

Cette phase du stage de reconnaissance emploie la m´ethode utilis´ee par Tan et al. [33]

et qui est pr´esent´ee `a la section 2.3.1.

La conversion en ’local binary Patterns’

Cette phase de conversion re¸coit en entr´ee une image d´ecrite en niveaux de gris et rend une image d´ecrite en ’local binary patterns’. La description th´eorique de cette technique a ´et´e pr´esent´ee `a la section2.3p.19et fait l’objet dans cette section d’une interpr´etation en termes de coins et arˆetes (voir figure 3.8 p.39).

Pour rappel, la conversion basique d’un pixel en un ’local binary pattern’ se fait en deux ´etapes `a partir des relations ’plus petit’ ’plus grand’ qu’entretient sa valeur et avec celles des 8 pixels p´eriph´eriques qui l’entourent. Tout d’abord l’association d’un label binaire `a chacun des pixels p´eriph´eriques est faite en leur associant le label ’1’ si leur valeur est sup´erieure `a celle du pixel `a convertir et le label ’0’ dans le cas contraire.

Ensuite, les huits labels sont lus dans le sens des aiguilles d’une montre pour former un nombre binaire appel´e ’local binary pattern’ (lbp). L’endroit o`u commence la lecture n’a pas d’importance et a ´et´e choisi comme ´etant le pixel p´eriph´erique situ´e au dessus du pixel `a convertir.

Finalement, seuls les lbp ’uniformes’ sont conserv´es pour la construction de l’image convertie. Un lbp est qualifi´e d’uniforme lorsque la lecture cyclique de ses labels com-prend moins de trois transitions 0-1 ou 1-0. Ainsi 11000011 et 00100010 sont respective-ment uniforme et non-uniforme.

L’interpr´etation des lbp est faite sur base de l’emplacement des transitions 0-1 1-0 dans le nombre binaire. Ainsi les nombres binaires 11000001, 01110000 et 01000000 correspondent respectivement `a une arˆete verticale, une arˆete horizontale et un coin inf´erieur gauche. Plusieurs exemples de ce type sont pr´esent´es `a la figure 3.8.

La description lbp d´ecrit donc les contours des objets pr´esents dans l’image et dans le cas de la reconnaissance faciale cela peut ˆetre interpr´et´e comme une description des silhouettes des ´el´ements cl´es du visage tel que le nez ou la bouche.

Figure 3.8: Interpr´etation de la description en ’local binary patterns’. L’image `a convertir en LBP est ici le trap`eze. Les arrangements de 8 pixels en carr´es correspondent cha-cun aux pixels p´eriph´eriques d’un pixel `a convertir. Lorsqu’un pixel p´eriph´erique est associ´e au label ’1’ il est colori´e en gris et dans le cas contraire en bleu. En commen¸cant en haut `a gauche et en continuant dans le sens des aiguilles d’une montre, les conversions LBP des arrangements repr´esent´es donnent respective-ment 16, 12, 14 et 112.

La division en sous-r´egions et la contruction des histogrammes

Cette phase incarne l’utilisation d’informations spatiales dans le stage de reconnaissance en d´ecoupant l’image en sous-r´egions qui seront trait´ees et compar´ees s´epar´ement. Les tailles et les positions des sous-r´egions ont fait l’objet d’une optimisation pr´esent´ee `a la section 4.3 p.47.

Des histogrammes sont ensuite construits pour chacune des sous-r´egions et rassembl´es dans un set d’histogrammes associ´e au visage `a reconnaˆıtre. Ce rassemblement en set d’histogrammes est le format sous lequel les personnages connus de Nao sont stock´es dans la base de donn´ees.

L’antagonisme de ces deux op´erations, la division en sous-r´egions et la construction des histogrammes, m´erite d’ˆetre soulign´e et est expliqu´e ci-dessous.

Dans l’´evolution du contenu informatif tout au long du traitement, l’op´eration de mettre les donn´ees sous forme d’un histogramme efface toute information concernant la distribution g´eographique des ´el´ements au sein de l’image. Cette op´eration permet donc de diminuer la sensibilit´e de la reconnaissance face aux d´eformations rigides locales ou globales que peut subir une personne entre deux clich´es mais interdit aussi `a toute ´etape ult´erieure d’appliquer un traitement diff´erent `a des r´egions dont le contenu discriminatif

serait diff´erent, telles qu’une r´egion `a contours marqu´es et une r´egion de peau continue3. La division en sous-r´egions en amont agit dans le sens contraire de la g´en´eration des histogrammes car elle permet de diff´erencier le traitement de r´egions en fonction de leur emplacement dans la fenˆetre de d´elimination du visage.

La divisions en sous-r´egions et la g´en´eration des histogrammes peut donc ˆetre

in-terpr´et´ee comme deux processus qui permettent ensemble de moduler la quantit´e d’informations spatiales qui sera prise en compte lors de la classification.

La comparaison avec les ´el´ements de la base de donn´ees

Cette phase re¸coit en entr´ee le set d’histogrammes du candidat assembl´es lors de la phase pr´ec´edente et d´etermine quel set d’histogrammes de la base de donn´ees lui est le plus proche. La proximit´e de deux sets est donn´ee par la distance qui les s´eparent.

Celle-ci est une combinaison lin´eaire des distances entre leurs histogrammes homologues.

Ainsi pour deux histogrammes de la premi`ere sous-r´egion H~1 = (H11, H12, ..., H1n),H~2 = (H21, H22, ..., H2n) etHxi la valeur du binide l’histogramme Hx, la distance qui les s´epare est

D1(H~1, ~H2) = ||H~1 −H~2||

||H~1|| · ||H~2|| (3.1) La similarit´e entre deux visages est donc mesur´ee par la combinaison lin´eaire des distances qui s´eparent leurs histogrammes homologues. Les coefficients de cette combi-naison ont fait l’objet d’une optimisation pr´esent´ee `a la section 4.3.

Le vote

Cette phase utilise les multiples exemplaires4du visage `a reconnaitre pour voter l’identit´e divulgu´ee. Celle-ci est obtenue en moyennant les rangs de proximit´e des ´el´ements de la base de donn´eess avec les exemplaires.

3Vu l’utilisation des lbp, un simple changement du sens d’un d´egrad´e provoqu´e par une source lu-mineuse sur une zone de peau plane pourra provoquer la g´en´eration de deux histogrammes compl`etement diff´erents

4Ces multiples exemplaires sont les occurences du visages `a reconnaˆıtre dans les cycles pr´ec´edents

In document Reconnaissance et suivi de visages et implémentation en robotique temps-réel (Page 42-47)