Les systèmes automatiques de re onnaissan e de visages doivent rester invariants à tout
fa teur indépendant del'identité duvisage,même si e fa teur engendredes hangements
d'ap-paren e du visage. Or, de nombreux fa teurs, extérieurs au visage ou en lien ave sa nature
intrinsèque, peuvent inuer sur elle- i. Les onditions de prise de vue, notamment l'anglesous
lequel levisage est observé et la puissan e dessour es de luminosité,inuent onsidérablement
sur l'apparen e d'un visage. Nouspouvons iter les propos de Moses et al. dans [MAU94℄
(tra-duit de l'anglais): Les variations entre des images d'un même visage duesà l'illumination et
à l'angle de vision sont presque toujours plus importantes que les variations entre images dues
à un hangement de l'identité du visage. L'expression fa iale arborée par le sujet à l'instant
où l'image est olle tée, ainsique d'éventuelles o ultations partielles (une partie du visage est
a héeparunautreobjet,parexempledeslunettes)ainsiquelevieillissementpeuventégalement
engendrer des hangementsd'aspe timportants. Des fa teursindividuels relatifs auxpersonnes
àre onnaître,telsqueleursexeouleurâge,ainsiquelatailledelabasede onnaissan e,peuvent
également avoir unimpa tsur lesperforman es dusystème.
Dans ettese tion,nouspasseronsenrevue esprin ipauxfa teursetétudieronsleurimpa t.
L'analyse des résultats expérimentaux obtenus dans le adre des FRVT 2000 et 2002 [BBP01,
PGM
+
03℄etparGrossetal. dans[GSC01℄ nouspermettradetirerun ertainnombrede
on lu-sions.Le proto oleFRVT,quisera détailléense tion1.7.3,a permisessentiellement de
ara té-riser l'impa t de lapose, des onditions d'illumination, du délai entre diérentes prises de vue,
defa teursindividuelsetdelatailledelabase.Dans[GSC01℄,Grossetal.fournissentuneétude
systématique de l'impa t de diérents paramètres sur les performan es du système, variés de
manièreisolée ou onjointe.Lessixfa teurs onsidérés sont: laposedelatête, les hangements
d'illumination,l'expressionfa iale,leso ultations,l'intervalledetempsentredeuxprisesdevue
1.5.1 Les variations de pose
Un hangement de l'angle d'in linaison du visageengendre de nombreux hangements
d'ap-paren e dansl'image olle tée, (pour une position xe du apteur). Nousnous intéresserons i i
aux rotations du visage en profondeur (mouvement de type ho hement de tête ou négation).
En eet, on suppose quela phase préliminaire de normalisation du visage qui sera détaillée en
se tion 1.6 permet de orriger d'éventuelles rotations dansle plan de l'image. Les rotations en
profondeur engendrent deuxtypesde di ultés. Tout d'abord, elles amènent desdiéren es de
profondeurqui,projetées surleplan2Ddel'image, résultent en desdéformations(étirement de
ertainesparties duvisageet ompa tage d'autresrégions). La formedu visage,et don les
dis-tan es entre ara téristiques fa iales, varient. Se ondement , elles peuvent mener à l'o ultation
de ertaines parties du visage(par exemple, dansune vue de troisquarts, une partie du visage
est a hée).
Si lapose duvisage-requête dièresigni ativement de elle desvisages enregistrés,les
per-forman esdessystèmes dere onnaissan edevisages sontae tées etlestauxde re onnaissan e
baissent sensiblement, omme l'a mis en éviden e le FRVT [BBP01℄. En eet, selon le FRVT
2000, la rotation de la tête n'entraîne pas de baisse des taux de re onnaissan e signi ative
jusqu'à
±
25◦
, alors qu'àpartir de
±
40◦
on onstate une hute desperforman es.
Dans [GSC01℄, Gross et al. ont montré que, si le seul fa teur de variation entre l'image
enregistréeet l'image-requêt eestune rotationenprofondeur delatêteinférieure à30
◦
,les taux
dere onnaissan e dessystèmes (statistiques) a tuelssont de l'ordre de90%. Des rotations plus
importantes engendrent une forte baisse desperforman es. Pour beau oup d'appli atio ns telles
quelabiométrie,lesanglesderotationsontgénéralementinférieursà30
◦
etdon lesperforman es
desalgorithmes a tuelssont très intéressantes. Par ontre, pour d'autres appli ationstelles que
lavidéosurveillan e,iln'estpassusant degarantird'ex ellentesperforman esave unanglede
rotationinférieur à 30
◦
. Eneet, les amérasde surveillan e sont souvent lo alisées en hauteur
et,siellessontenintérieur,pro hesdes oinsdespiè es, equiimpliquenaturelleme ntdesangles
deprisede vueendehorsde eslimites.Grosset al. ont également misen éviden elefaitqu'un
modèle onstruit à partir de poses frontalesprésente une meilleure apa ité de généralisation à
d'autresposes qu'un modèle onstruit à partir de poses nonfrontales.
Il est parfois né essaire, pour ertains types de te hniques et dans le ontexte de ertaines
appli ations,de onstruireplusieurs modèles dere onnaissan e (unpar typedepose).Enphase
dere onnaissan e, ilfaudraalors utiliser un lassieur depose
3
en amont delare onnaissan e,
demanière à e quetout visage-requête nesoit omparé qu'au modèle desapose.
1.5.2 Les hangements d'illumination
L'intensité et la dire tion d'illuminati on lors de la prise de vue inuent toutes deux
énor-mément sur l'apparen e du visage dans l'image. Dans la plupart des appli ations réelles, des
hangements dansles onditions d'illumination sont néanmoins inévitables, notamment lorsque
les vues sont olle tées à desdates diérentes, en intérieur ou en extérieur. Étant donné qu'un
visagehumainestunobjetintrinsèquement3D,des hangementsd'illuminationpeuventfaire
ap-paraîtresurlevisagedesombresa entuantou,au ontraire,masquant ertaines ara téristiques
fa iales( f.gure 1.2).
L'évaluationduFRVT[BBP01℄ on lutquedes hangementsimportantsdansles onditions
d'illumination peuvent mener à des baisses onsidérables dans les taux de re onnaissan e. En
3.Modulepermettantde ara tériserl'angledeprisedevueduvisage,àpartirparexempledespositionsdes
Fig. 1.2 Extrait de [MAU94℄. Eets de variations dans les dire tions d'illumination sur
l'ap-paren e d'un visage.
eet, si la plupart des systèmes de re onnaissan e de visages sont stables à des hangements
raisonnables des onditions d'illumination en intérieur, en extérieur on note des dé its de
re- onnaissan e del'ordre de40%ave lesmeilleurs outilstestéspar leFRVT. Cesbaisses detaux
de re onnaissan e peuvent être dues à des variations de la somme de luminosité réé hie par
lapeau et/ouà desréglages ee tués automatiquement par la améra pour garantir unebonne
qualité d'image(par exemplela orre tiongamma, le ontrasteet les propriétés d'exposition).
Grossetal. [GSC01℄ont étudiédemanièreisoléel'impa tdufa teurderéexiondelapeau,
grâ eàuneétudemenéesurlabasePIE,dé riteenannexeA.Lesrésultatsobtenusmontrentque
les algorithmes de re onnaissan e de visages a tuelssont en fait robustes aux eetsde
hange-mentsd'illumination purs(déjàenpartie orrigéspar l'égalisationd'histogrammeappliquéelors
delaphasedenormalisation) .Ceseraientdon lesajustementsnonlinéairesdes amérasqui
en-gendreraienten grandepartie lesbaisses deperforman e deste hniqueslinéairesobservéesdans
le adreduFRVT, et imputéesà tortdansunpremier tempsà des hangementsd'illumination.
Par onséquent, lorsque l'on peut ontrlerles onditions de prise de vue (biométrie, sé urité),
l'onnesauraittropre ommanderde ontrlerlesréglagesdela améra.Par ontre,puisqu'ilest
di ile de orriger les eetsdesréglages automatiques, ilnousfaudra faire ave lorsque l'on ne
peut les ontrler (appli ation s d'indexation par exemple). Gross et al. remarquent également
quelesperforman esdesalgorithmes baissent sensiblement lorsqueles onditions d'illumination
extrêmes engendrent une o ultation d'une partie du visage. Par onséquent, le ouplage de
variations d'illumination et devariations de pose onstitue une di ulté importante.
1.5.3 Les expressions fa iales
Les visages sont des objets non rigides. L'expression fa iale de l'émotion, surtout ombinée
ave laparole, peut produire des hangements d'apparen e importants des visages. Le nombre
de onguratio ns possiblesse ompte enmilliers. L'inuen edel'expressionfa ialesurla
re on-naissan e est don di ile à évaluer. Puisque l'expression fa iale ae te la forme géométrique
et les positions des ara téristiquesfa iales,il semblelogique queles te hniquesglobales ou
hy-brides y soient plusrobustes que laplupart des te hniquesgéométriques. Grosset al. [GSC01℄
ont étudié l'impa tde hangementsd'expressions fa iales surlare onnaissan e, grâ eà la base
les algorithmes sont relativement robustes aux hangements d'expression fa iale, à l'ex eption
des as extrêmes engendrant d'importantes déformations de la bou he (telles que le ri) et le
rétré issement ou lafermeture omplète desyeux.
Il peut don être utile de repérer en amont de la re onnaissan e es expressions
probléma-tiques.Si l'on est apable de atégoriser l'expression fa iale du visage-requête, deux appro hes
sont possibles. Soit plusieurs modèles de visages ont été appris (un par atégorie d'expression
fa iale), et l'onpeut alors omparerdire tement levisage de testà labasedes visagesarborant
lamême expression. Soit on utilise une te hnique générative qui,grâ e à l'utilisation d'un
mo-dèle de visages susamment pré is, nous permet de transformer le visage-requête de manière
à e qu'il se présente dans des onditions moins di iles. Il existe de nombreux systèmes de
re onnaissan edesexpressionsfa iales.Pourdesétudesbibliographique srelativement omplètes
et ré entes, se reporter à [PR00, FL03a℄. Certaines appro hes [BLFM03℄ onsistent à lasser
les émotions en sept expressions basiques: neutre, olère, dégoût, peur, joie, tristesse, surprise.
D'autres, onstatant que e genred'émotions basiques n'estque rarement observé dansle adre
d'appli ations réelles, ont mis en pla e des systèmes apables de re onnaître des hangements
plussubtils d'expression [TKC02℄.
1.5.4 Les o ultations partielles
Le visage peut être partielleme nt masqué par des objets dans las ène, ou par leport
d'a - essoires tels que des lunettes de soleil. Les o ultations peuvent don être intentionnel les ou
non. Dans ertains as, il peut s'agir d'une volonté délibérée de ontre arrer la re onnaissan e
(dansle ontextedelavidéosurveillan e par exemple).Ex eptédansle ontextedelabiométrie
oududivertissement,les systèmesproposés doivent êtrenon intrusifs, .-à-d. qu'onne peut pas
omptersurune oopération dusujet.Par onséquent,ilestimportant desavoirre onnaîtredes
visagespartielleme nto ultés.Grossetal. ontévaluédans[GSC01℄ l'impa tduportdelunettes
de soleil, et d'un a he-nez o ultant la partie inférieure du visage, par le biais de l'utilisation
delabaseAR ( f.annexe A).Leursrésultatsexpérimentaux montrent quelesperforman es des
algorithmestestéssont engénéral faiblesdans es onditions.Deplus, lesdiérents algorithmes
présentent un omportement diérent vis-à-vis des o ultations. Nous reviendrons sur e point
ense tion 2.4.
1.5.5 Le vieillissement et les hangements d'aspe t
Les visages hangent d'apparen e au l du temps. Les modi atio ns on ernent la tension
desmus les, l'apparen e de lapeau (apparition de rides), le portde lunettes, éventuellement le
maquillageou laprésen ed'une frangeo ultant une partie dufront.
Gross et al. [GSC01℄ utilisent la base AR ( f. annexe A) pour déterminer l'impa t de es
fa teurs.SurlabaseAR,où ledélai entredeuxprisesdevueestseulement dedeuxsemaines,la
baissedestauxde re onnaissan e estestimée à 20%.
DansleFRVT2000,leseetsdutempsontétémesurésàl'aidedesvuesdupli ate delabase
FERET: elles- isont omparéesauxvuesFA, equipermetd'établiruntauxdere onnaissan e
( f.annexeA).Lestauxfournisparlesmeilleursalgorithmessontde63%surlesvuesdupli ateI,
et64%pourles vuesdupli ateII, ontre58%et 52%pour l'évaluationde1996.Ré emment,les
systèmes de re onnaissan e ont don réalisé d'énormes progrès pour gérer au mieux le délai de
temps entredeux prises de vue. Néanmoins, bienque l'intervalle de temps entre lesvues FA et
es dernières. Cela provient ertainement des hangements dansles onditions de prise de vue,
et non d'un vieillissement desvisages.
Dans le adre de l'évaluation FRVT 2002 [PGM
+
03℄, la baisse des taux de re onnaissan e
(desmeilleursalgorithmestestés)aétéestiméeà5%parannée d'é artentrel'image deréféren e
et l'image à re onnaître.
À notre onnaissan e,leseetsdudéveloppement delapersonne(parexemple lepassage de
l'enfan eà l'adoles en e) restent à e jourinexplorés.
1.5.6 Les fa teurs individuels
Lesexedelapersonneàre onnaître,sonâgeainsiquesongroupeethnique,peuventégalement
inuer surlesperforman es de l'algorithmede re onnaissan e.
Étudions tout d'abord les diéren es d'apparen e du visage en fon tion du sexe [BY98℄.
Outre desdiéren es deforme du visage,lessour ilsdes hommessont généralement plusépais,
et la région basse de leur visage est généralement plus texturée à ause de la barbe. Dans les
visages de femme, la distan e entre les yeux et les sour ils est généraleme nt plus importante,
le nez plus petit, et le menton plus étroit. Intuitivement, les visages de femme devraient être
plus di iles à re onnaître, notamment à ause du maquillage. Les résultats expérimentaux
reportés par Gross et al. viennent ontredire ette hypothèse, puisque les algorithmes évalués
re onnaissent plusfa ilement lesfemmesqueleshommes(danslesbasesARet FERET),et e i
enprésen edediérentessour esdevariationet malgréunereprésentationéquivalentedesdeux
sexesdanslabased'apprentissage.A ontrario, lesexpérimentations reportéesdansle adredu
FRVT2002,plussigni ativesstatistiquement arportant surplusdesujets,ont montréqueles
taux d'identi ation pour les hommes étaient de 6% à 9% meilleurs que eux obtenus pour les
femmes. Cette ontradi tio n entre les deux évaluations met une fois de plus en éviden e lefait
queles performan es des systèmessont très liéesauxbases utilisées pour leur évaluation.
LorsduFRVT2002,l'impa tdel'âgedessujetssurlesperforman esdusystèmeaégalement
étéétudié.Selonles on lusionsreportées,pluslapersonneestâgée,pluslestauxd'identi ation
sont importants, ave unehausse d'environ5%touslesdixans(lapyramidedesâgesde labase
utilisée s'étale de 18 à 77 ans). Cette onstatation pourrait être expliquée par le fait que les
visages des plus an iens sont plus texturés, du fait de la présen e de rides, et présentent don
davantagede signesdistin tifs queles plusjeunes.
1.5.7 L'impa t de la taille de la base
C'estlorsduFRVT2002quel'impa tdelatailledelabasesurlesperforman esdusystèmea
étéétudiépourlapremièrefois,grâ eàlatrèsgrandetailledelabaseHCIntutilisée[PGM
+
03℄.
Les meilleurs systèmes fournissent destaux de re onnaissan e de l'ordre de 85%pour 800
per-sonnes, 83% pour 1600 individus, et 73% pour 37437 personnes. Selon les on lusions de e
rapport,lesperforman esdé roîtraient demanièrelog-linéaireen fon tiondelataillede labase.
1.5.8 Con lusion
Dans ettepartie,nousavonslistélesprin ipalesdi ultésren ontrées dansle ontextedela
re onnaissan eautomatiquedevisages.Nousavonsmontréque,parmilesfa teursinuantleplus
surles performan es du système, on ompte les hangements depose, leso ultationspartielles
desvisages, et l'intervalle de temps entre deuxprises de vue. Lesbaisses desperforman es sont
d'autant plussensibles que es fa teurssont présentssimultanément. D'autres fa teurs, quiont
d'études. On peut relever parmi eux- i la rotation et les variations d'é helle des visages dans
lesimages. Lepro essusdenormalisation desvisages,détaillé ense tionsuivante,viseàréduire
l'amplitudede esvariations.