• Aucun résultat trouvé

Les probl`emes li´es aux variations d’illumination sont tr`es pr´esents dans le domaine de la reconnaissance et de la d´etection faciale. L’importance li´ee `a ce domaine pour am´eliorer les performances des reconnaisseurs de visage se manifeste par le nombre d’articles sur le sujet rien que pour les 5 premiers mois de 2010 [12, 6, 21, 40]. Un inventaire des techniques existantes en deux cat´egories actives et passives est fait par Zou dans [56].

Les techniques passives s’occupent de l’illumination `a partir des donn´ees en niveaux de gris ou en couleur re¸cues par l’appareil de capture. De l’autre cˆot´e, les techniques actives obtiennent des donn´ees suppl´ementaires telles que la profondeur ou le profil infrarouge pour arriver `a leurs fins.

Plus r´ecemment est parue une ´etude comparative des diff´erentes techniques de pr´eprocessing dans le domaine de la reconnaissance bas´ee sur les espaces de vecteurs propres [15], c’est

`

a dire les m´ethodes holistiques ou de projections. Un point important de cette ´etude est qu’elle rend compte de la simplicit´e de la m´ethode, de sa rapidit´e et sa robustesse.

Il est par contre dommage que les comparaisons en termes de performances ne soient faites que sur base de la reconnaissance par des m´ethodes de projections. N´eanmoins Ruiz-del-Solar donne ainsi un bon aper¸cu objectif des techniques existantes et de leurs performances ainsi qu’un relev´e de leurs temps d’execution sur une mˆeme machine pour le mˆeme boulot, ce qui peut s’av´erer tr`es utile pour le design d’application en temps r´eel.

La m´ethode qui ressort comme ´etant l’´etat de l’art pour la reconnaissance par m´ethode de projection est la combinaison de SQI [41] et du LBP modifi´e [17]. N´eanmoins cette m´ethode est surpass´ee en terme de performance par une m´ethode contemporaine

`

a l’´etude comparative : le pr´etraitement de Tan et Triggs [33] pr´esent´ee plus haut.

Partie II

Application

Chapitre 3

Conception de l’application

Ce troisi`eme chapitre est consacr´e `a la conception de l’application qui permettra `a Nao d’´etablir des relations avec les personnes qui l’entourent. Tout d’abord, dans la premi`ere section ’Mise en situation’, je pr´eciserai l’´enonc´e du probl`eme et identifierai les limitations mat´erielles qui guideront le d´eveloppement de l’application. Je consacrerai ensuite la section 3.2 au probl`eme du temps r´eel en g´en´eral et appliqu´e `a l’application de ce m´emoire. Puis, j’expliquerai le fonctionnement complet de l’application finale `a la section3.3 ’Architecture prototype et cycle de fonctionnement standard’. Je terminerai par apporter quelques pistes qui permettraient d’am´eliorer les performances g´en´erales `a la section 3.4 et par conclure `a la section 3.5.

3.1 Mise en situation

3.1.1 D´ efinition de l’objectif et ´ enum´ eration de ses cons´ equences

L’objectif de l’application est de permettre `a Nao de reconnaˆıtre les personnes qui l’entourent, de m´emoriser sur demande l’identit´e d’un nouveau personnage et d’´etablir une relation avec quelqu’un en le suivant du regard. Un sc´enario type de l’utilisation de ces capacit´es se d´eroule en deux phases. Premi`erement Nao fait la connaissance d’un personnage (Paul), sauvegarde ses informations visuelles et les associe `a un label.

La deuxi`eme phase se produit lorsque Paul revient voir Nao, ce dernier le reconnaˆıt et tourne le visage vers lui en le saluant. Cette deuxi`eme phase est illustr´ee `a la figure3.1 p.28.

Un tel comportement implique en cons´equence que Nao soit capable d’effectuer en temps r´eel

1. la localisation de tous les visages dans son champ visuel,

Figure 3.1: Situation typique que Nao doit ˆetre capable d’effectuer. Paul est un personnage que Nao a rencontr´e auparavant. Lors d’une seconde rencontre, Paul rentre dans le champ visuel de Nao et ce dernier le reconnaˆıt, se tourne vers lui et le salue par son pr´enom.

2. la poursuite des visages d’une capture du champ visuel `a l’autre, 3. la reconnaissance faciale,

4. une sauvegarde de nouveaux visages dans une base de donn´ees et

5. la construction de l’ordre de mouvement de la tˆete pour fixer une personne en particulier.

3.1.2 Importance du temps r´ eel et des performances

Cette application est une routine `a la base de toute une s´erie d’applications d’interaction homme-machine d’ordre sup´erieur telles qu’une conversation ou la poursuite `a travers la foule d’une personne en particulier. Elle doit par cons´equent (1) utiliser un minimum de ressources et (2) ˆetre la plus robuste possible, un dysfonctionnement `a cet ´etage se propagerait de mani`ere d´esastreuse en aval. Si le robot pr´esente ces deux caract´eristique de temps r´eel et de performance, on pourra dire qu’il s’int`egre dans son milieu de mani`ere limpide, ce qui s’av`ere ˆetre pr´ecieux pour toutes les applications potentielles. Prenons l’exemple d’un syst`eme charg´e de transmettre des informations confidentielles `a un trader internationnal press´e. Il sera malvenu que (1) le syst`eme transmette les informations `a la mauvaise personne ou (2) le syst`eme prenne 15 secondes pour reconnaˆıtre le trader.

La conception devra donc s’orienter d`es le d´ebut vers des choix qui permettront au syst`eme d’ˆetre rapide et robuste. La tˆache sera d’autant plus ardue qu’il s’agit l`a de deux ´el´ements antagonistes o`u l’am´elioration de l’un se fait souvent au d´etriment de l’autre.

3.1.3 Mat´ eriel disponible et limitations

Figure 3.2: Mat´eriel disponible pour l’application d´evelopp´ee dans le cadre de ce m´emoire.

Une unit´e de traitement embarqu´ee sur Nao et une unit´e de traitement `a distance puissante communiquant entre-elles par wifi.

Le mat´eriel disponible (voir fig. 3.2 p.29) est constitu´e de

• L’ordinateur Zosma AMD Athlon 64 X2 Dual 3800+ (2.01 GHz) 2 Go de RAM (ressources distantes).

• Le robot Nao fourni par Ald´ebaran Robotics [1]. Ce dernier est ´equip´e d’un pro-cesseur AMD X86 GEODE 500MHz et de 256 Mo de SDRAM (ressources em-barqu´ees). Une cam´era est plac´ee sur le haut de sa tˆete et fonctionne en trois modes : 640x480, 320x240 et 180x120 pixels. Une transmission sans fil est disponible en-tre Nao et l’ordinateur distant. Une seconde connection par fil est aussi disponible mais s’oppose `a l’id´ee d’autonomie du robot.

Avec fil Sans fil R´esolution N&B Couleur N&B Couleur

160×120 47 47 58 95

320×240 94 141 150 270

640×480 333 510 555 1000

Table 3.1: Relev´e en ms des temps de transmission avec et sans fil entre le robot Nao et l’ordinateur distant pour diff´erentes r´esolutions. La transmission d’images de couleur implique le transfert de 3 chaˆınes de couleur.

Ce mat´eriel a pour principaux d´efauts des ressources embarqu´ees faibles et un temps de transmission ´elev´e comme le montre le relev´e des temps de transmission dans diff´erentes conditions `a la table 3.1 p.30.

3.1.4 Le challenge

Le challenge `a relever est donc de choisir l’architecture et les m´ethodes pour obtenir le meilleur compromis entre temps r´eel et performance en s’arrangeant avec des ressources embarqu´ees faibles et un temps de transmission ´elev´e.

Documents relatifs