• Aucun résultat trouvé

La conception de l’application en tenant compte des contraintes mat´erielles et de l’exigence d’une ex´ecution en temps r´eel est maintenant termin´ee. Elle a sollicit´e une r´eflexion sur les concepts de temps de rafraˆıchissement et de temps r´eaction et a finalement abouti `a l’organisation pr´esent´ee ci-dessous.

La capture du champ de vision de Nao est directement envoy´ee par wifi `a un or-dinateur puissant charg´e, en fonction de la personne avec qui ´etablir un contact, de commander un mouvement de tˆete qui centrera le visage de l’interlocuteur au centre du champ de vision de Nao. La station distante effectue pour cela deux stages majeurs5 de traitement: une localisation des visages dans le champ de vision de Nao et une re-connaissance faciale pour chacun d’eux6. La d´etection utilise le fameux algorithme de localisation en temps r´eel de Viola et Jones et la reconnaissance est bas´ee principalement sur une division de l’image en sous-r´egions suivie de la g´en´eration pour chacune d’elles d’histogrammes de ’local binary patterns’.

Les interpr´etations de deux phases importantes du stage de reconnaissance ont ´et´e faites: celle de la conversion en ’local binary patterns’ comme description en termes d’arˆetes et de coins, et celle de la division en sous-r´egions suivie de la g´en´eration d’histogrammes comme moyen de modulation de la quantit´e d’informations spatiales prise en compte lors de la classification.

D’autre part, deux am´eliorations ont ´et´e propos´ees: une concernant la prise en compte d’informations spatiales au sein des sous-r´egions et l’autre concernant la col-laboration des syst`emes de reconnaissance et de poursuite de visages `a travers plusieurs champs visuels successifs.

Apr`es cette conception, la param´etrisation qui doit n´ecessairement avoir lieu est faite au chapitre suivant et d´eterminera premi`erement la taille des fenˆetres de d´elimitation qui seront utilis´ees et deuxi`emement la mani`ere de diviser l’image en sous-r´egions pour obtenir le meilleur taux de bonnes classifications.

5Pour rappel, c’est ainsi que les macro ´etapes de traitement sont nomm´ees pour ´eviter la confusion avec des ´etapes de traitement d’ordre inf´erieur

6Si la personne avec qui ´etablir un contact est connue d’avance, une v´erification d’identit´e aurait suffi. La reconnaissance est ici utilis´ee pour donner `a Nao la conscience permanente de l’identit´e des gens qui l’entourent et ainsi lui permettre d’ajuster son comportement en fonction des personnes pr´esentes ou non. Cela permet aussi de rester dans un cas g´en´eral et d’offrir un maximum d’informations `a tout logiciel d’ordre sup´erieur telle que pourrait constituer une application charg´ee de rendre un accueil personnalis´e `a l’entr´ee d’une institution

Chapitre 4

Entraˆınement sous MatLab du stage de reconnaissance

Ce chapitre est destin´e `a param´etrer l’application pens´ee au chapitre pr´ec´edent. Pour cela, le stage de reconnaissance de visage a ´et´e enti`erement impl´ement´e `a l’aide du Logiciel Matlab.

Les ´el´ements `a param´etrer sont:

1. La taille de fenˆetre qui sera utilis´ee. Tous les visages d’entr´ee, qu’ils soient destin´es

`

a la sauvegarde dans la base de donn´ees o`u `a l’identification, devront pr´esenter les mˆemes dimensions. En effet, la reconnaissance est bas´ee sur la g´en´eration d’histogrammes de ’local binary patterns’ (lbp) et par cons´equent l’utilisation de visages de r´esolutions diff´erentes poserait deux probl`emes : celui des lbp qui d´etectent la pr´esence d’arˆetes et coins pour des environnements de 9 pixels quelque soit la r´esolution de l’image et celui des histogrammes qui, s’ils sont g´en´er´es sur des r´egions de tailles diff´erentes, ne pourront pas ˆetre compar´es. La solution la plus simple est de redimensionner l’image d`es le d´ebut. La principale critique `a l’encontre de cette solution est que l’interpolation qui devra n´ecessairement avoir lieu d´egrade la qualit´e de l’information contenue dans l’image originale.

2. Les dimensions, les positions et les poids des sous-r´egions utilis´ees pour la re-connaissance. Pour rappel, l’application comprend une phase de d´ecoupage de l’image en sous-r´egions trait´ees s´epar´ement pour apporter des informations con-cernant l’organisation spatiale `a la classification. Cette m´ethode, comme cela sera vu au chapitre6, augmente de mani`ere significative les r´esultats et m´erite donc de s’y attarder.

Ce chapitre d´ecrit la param´etrisation de ces ´el´ements aux sections 4.2 et 4.3. Une conclusion `a la section 4.4 p.51 reprend les ´el´ements `a retenir et donne un avis critique

accompagn´e des ´el´ements qui conduiront au chapitre 5.

Avant de commencer la param´etrisation, les ensembles d’entraˆınement et de validation qui seront utilis´es sont introduits `a la section4.1.

4.1 Ensembles d’entraˆınement, de validation et bases de visages

Figure 4.1: M´ethode de d´etection de Viola et Jones impl´ement´ee par OpenCV appliqu´ee `a un

´

echantillon de la base de donn´ees FERRET gray. Cette extraction qui forme les ensembles d’apprentissage et de validation pour l’application de param´etrisation en Matlab a ´et´e effectu´ee avec le mˆeme code c++ que celui qui est utilis´e pour l’application avec Nao.

Le contenu des ensembles d’entraˆınement et de validation se veut le plus proche pos-sible des visages auxquels le stage de reconnaissance aura affaire. Par cons´equent leurs cadrages dans leurs fenˆetres de d´elimitation seront faits en utilisant l’impl´ementation OpenCV de l’algorithme de Viola et Jones [38] tel que c’est le cas pour les visages d´etect´es dans le champ visuel de nao. Les images d’entr´ees sont issues de la base de donn´ees FERRET gray [27,28](voir figure4.1pour un ´echantillon cadr´e avec OpenCV).

L’ensemble d’apprentissage compte 60 visages diff´erents et celui de validation compte 100 prises de vue des 60 personnes de l’ensemble d’apprentissage. Un test standard comprend l’apprentissage des 60 visages diff´erents suivi du calcul du taux de bonnes classifications sur l’ensemble de validation.

La base de donn´ees FERRET est largement utilis´ee `a travers la litt´erature pour mesurer les performances d’un classifieur [4,47,6,16] et n’est pas disponible en t´el´echargement libre. J’ai pu la t´el´echarger enti`erement apr`es avoir suivi les proc´edures qui sont de-mand´ees sur le site web du projet [3].

Documents relatifs