• Aucun résultat trouvé

S´ election de la combinaison de sous-r´ egions pour la reconnaissance faciale 47

L’objectif de cette param´etrisation est de trouver la combinaison de sous-r´egions qui permettra de distinguer au mieux les personnages. Pour rappel, le stage de reconnais-sance divise le visage en plusieurs sous-r´egions trait´ees s´epar´ement pour tenir compte de la distribution g´eographique des zones utiles `a la discrimination lors de la classification.

L’identification de la difficult´e de cette param´etrisation et la pr´ecision de l’objectif en cons´equence sont d’abord faits `a la section 4.3.1, puis la strat´egie et la combinaison finalement s´electionn´ee sont repris `a la section4.3.2. Enfin, une conclusion comprenant une critique de la strat´egie adopt´ee et des pistes pour la suite est faite `a la section 4.4.

4.3.1 Difficult´ e et objectif

La majeure difficult´e de ce probl`eme est de s´electionner la meilleure combinaison de x sous-r´egions parmi le nombre titanesque qu’il est possible de trouver. Ainsi il y a d´ej`a 6.2597×1018 mani`eres diff´erentes de prendre x= 3 sous-r´egions parmi lesn = 3348900 que compte une fenˆetre de 60 pixels de cˆot´e1 :

n!

(n−x)!x! = 3348900!

(3348897)!3!

= 6.2597×1018

L’objectif de cette section sera donc de d´evelopper et d’ex´ecuter une strat´egie efficace qui permettra de trouver une combinaison performante sans devoir utiliser d’ordinateur quantique.

1Ce nombre a ´et´e obtenu par Matlab en tentant de toute les g´en´erer.

4.3.2 Strat´ egie et r´ esultats

La strat´egie est globalement de faire une pr´e-s´election parmi les 3348900 sous-r´egions rectangulaires que contient une fenˆetre de 60 pixels de cˆot´e pour que le nombre de combinaisons possibles devienne accessible. Il sera possible de toutes les essayer pour trouver la meilleure. Pour obtenir cette pr´e-s´election, il faut tout d’abord trouver le moyen de les comparer entre elles.

Une technique simple serait de comparer les r´esultats que chacune des sous-r´egions parvient `a atteindre sur l’ensemble de validation2. N´eanmoins, l’application directe de cette technique pose plusieurs probl`emes :

• Les premi`eres zones s´electionn´ees sont de grande dimension et correspondent en fait

`

a un simple recadrage du visage (voir fig4.3). Or il est recherch´e des zones de taille moyenne couvrant plusieurs parties diff´erentes pour rendre compte l’organisation spatiale des donn´ees discriminantes.

(a) Meilleur score (b) Score en fonction de la surface

Figure 4.3: (a) La plus petite des sous-r´egions offrant le meilleur score de 67%. (b) Score des sous-r´egions en fonction de leur surface.

Une id´ee pour passer au-del`a de ce probl`eme serait de p´enaliser le score obtenu par les zones de grande taille, mais d´eterminer de quelle mani`ere effectuer cette p´enalisation n’est pas ´evident. Normaliser les scores par la surface ne donne pas

2La m´ethode de test d’une sous-r´egion consiste `a ne consid´erer que les pixels qu’elle inclue pour effectuer la reconnaissance

de bons r´esultats et ne fait que retourner le probl`eme en privil´egiant de mani`ere excessive les sous-fenˆetres de petite taille.

• Cette technique consid`ere que la force d’une combinaison de sous-r´egions se trouve dans les performances individuelles de ses membres, or la richesse de leur combi-naison est aussi recherch´ee: si une zone contient les trois quarts de l’information et une autre un quart, il est aussi important de s´electionner au moins une sous-r´egion issue de chaque zone que de s´electionner la meilleure sous-r´egion de chaque zone.

L’id´ee apport´ee pour r´esoudre ces deux probl`emes est de n’effectuer la comparaison des r´esultats que sur des sous-r´egions de dimensions identiques et de constituer la pr´es´election avec les premiers class´es de chaque cat´egorie. Bien qu’il soit ´evident que cette id´ee r´esolve le premier probl`eme, il est moins manifeste que ce proc´ed´e s´electionne des sous-r´egions d’horizons diff´erents.

Pourtant c’est bien le cas. Comme montr´e dans la figure 4.4 p.49, des zones cl´es du visages telles que le nez et les yeux semblent ˆetre contenues dans des rectangles de dimen-sions diff´erentes assurant ainsi que chacune d’elle a la chance d’ˆetre class´ee premi`ere dans une cat´egorie diff´erente et que les sous-r´egions pr´es´electionn´ees proviendront d’endroits diff´erents de du visage. En compl´ement, les classements au sein de quatre cat´egories de sous-r´egions de dimensions diff´erentes sont pr´esent´es `a la figure 4.5.

Figure 4.4: Trois zones class´ees premi`eres dans leurs cat´egories. Elles correpondent aux deux yeux et le nez. Il est montr´e ainsi que la m´ethode de pr´es´election ne s´electionne pas que des sous-r´egions provenant du mˆeme endroit

A ce stade, la pr´es´election des sous-r´egions class´ees premi`eres dans leurs cat´egories permet de r´eduire le nombre de sous-r´egions `a combiner de 99.89% en passant de 3348900

`

a 3540 (=60 largeurs possibles × 60 hauteurs possibles - 60 r´ep´etitions que constituent les carr´es). N´eanmoins le nombre de possibilit´es de combiner trois d’entre elles reste

Figure 4.5: Classements au sein des cat´egories de sous-r´egions de dimensions 60×9, 60×3, 18×9 et 12×24 pixels2. Les zones rouges fonc´es sont les plus discriminatives sur l’ensemble de validation tandis que les zones bleues sont les moins discriminatives.

´

elev´e (8.0315e+ 009) et le test de chacune de ces combinaisons prendrait 38 ans et une septantaine de jours 3.

Figure 4.6: R´esultat de la param´etrisation des sous-r´egions trait´ees s´epar´ement durant la reconnaissance. Les zones 1 et 2 ont un poids de 5 tandis que les deux autres ont un poids de 1.

Ont alors ´et´e mises sur le cˆot´e les sous-r´egions dont la surface n’´etait ni comprise entre 280 et 420, ni entre 1600 et 1700. Il s’est av´er´e apr`es quelques tests que cette pr´es´election

3Temps obtenu `a partir du temps moyen n´ecessaire au test d’une seule combinaison selon plusieurs combinaisons de poids

semblait mener aux meilleurs r´esultats. Avec ce crit`ere et en prenant seulement les premi`eres sous-r´egions de chaque cat´egorie, 47 sous-r´egions ont ´et´e pr´es´electionn´ee. En-suite les 178365 moyens de prendre 4 de ses 47 sous-r´egions ont ´et´e test´es sur l’ensemble de validation pour 455 configurations de poids diff´erentes4. Cela fait un total de 81 156 075 configurations. Le r´esultat est donn´e `a la figure4.6

Plusieurs remarques sont `a faire `a la d´ecouverte de ce r´esultat. Tout d’abord la pr´esence de deux grandes sous-r´egions (1 et 2) englobant plusieurs ´el´ements cl´es du visage tels que les yeux, le nez et la bouche. Une seule d’entre elles obtient sur l’ensemble de validation un taux de bonnes classifications avoisinnant les 67% tandis que leur combinaison avec les trois autres sous-r´egions permet une diminution de 45% de l’erreur, soit un taux de bonnes classifications obtenu de 82%5. Ensuite les poids tr`es faibles accord´es aux deux sous-r´egions de dimensions moyennes 3 et 4. L’algorithme avait la possibilit´e de leur attribuer un poid nul, le fait qu’il ne l’ait pas fait semble indiquer que dans une combinaison, les sous-r´egions de petites dimensions permettent par des petites influences de mener le reconnaisseur de visage `a la bonne d´ecision. Enfin, le positionnement exclusivement sur la partie gauche du visage des zones 3 et 4. Une hypoth`ese quant `a ce ph´enom`ene serait la sym´etrie du visage diminuant l’int´erˆet d’une sous-r´egion du visage lorsque son homologue sym´etrique est d´ej`a consid´er´e.

Documents relatifs