• Aucun résultat trouvé

5.4 Exploitation de parties non-contigues

5.4.4 M´ ethode (d)

Les motivations qui m’ont pouss´e `a d´evelopper la m´ethode suivante ´emane de l’observation de la carte produite par la m´ethode (c). Cette carte indique que la r´egion situ´ee entre les deux zones de discrimination contient plus d’informations utiles `a la discrimina-tion qu’ailleurs. Ceci s’explique par le fait que prendre une sous-r´egion de dimensions al´eatoires et placer son centre `a mi-chemin des deux zones de discrimination donne le plus de chances de r´eunir les deux zones discriminatives. N´eanmoins, pour un nombre plus ´elev´e de zones discriminatives, cet effet aura tendance `a gommer les contours et diminuer la pr´ecision de la carte des zones les plus utiles `a la discrimination.

J’ai donc d´ecid´e de continuer `a r´efl´echir sur le probl`eme et j’en suis arriv´e `a d´evelopper

la m´ethode (d) qui apporte deux contributions `a la pr´ec´edente. La premi`ere est l’utilisa- Premi`ere

contribu-tion du maximum au lieu de la moyenne des r´esultats. Appliqu´e directement `a la tion

m´ethode (c) cette contribution donne la carte pr´esent´ee `a la figure 5.6.

Bien que cette carte d´etecte exactement les deux zones de discrimination, une critique importante est `a faire : cette carte n’a ´et´e obtenue qu’`a partir des sous-r´egions de

Figure 5.6: Carte obtenue par l’utilisation du maximum `a la place du moyennage dans l’ex´ecution de la m´ethode (c). Les deux zones discriminatives sont parfaitement rep´er´ees.

15× 15 pixels, la plus petite unit´e utilis´ee lors de ces simulations. De ce fait, elle n’utilise absolument pas l’information de plusieurs sous-r´egions non contigues pouvant se chevaucher et donne le mˆeme r´esultat et souffre des mˆemes probl`emes que la m´ethode de division en parties contigues pr´esent´ee `a la section5.2. Ce probl`eme est provoqu´e par la normalisation qui est trop p´enalisante pour les sous-r´egions de moyennes et grandes dimensions et les empˆechent de se manifester dans la carte finale : soit le cas de deux zones 15 × 15 et 30× 15 pixels2 qui contiennent respectivement sur les deux zones discriminatives aucune zone discriminative et 1 zone discriminative, la premi`ere donne un r´esultat observ´e de 25% et la seconde un r´esultat de 50% (donn´ees r´eellement obtenues avec les ensembles artificiels) tandis que leurs r´esultats normalis´es sont respectivement de 25/225 = 0.111 et 50/450 = 0.111. Ces r´esultats normalis´es ´egaux rendent ´equivalentes les participations `a la carte finale d’une sous-r´egion contenant 50% de l’information et d’une autre ne contenant aucune information et montre donc que dans ce cas pr´ecis la carte des zones les plus utiles `a la discrimination n’a ´et´e contruite qu’`a partir des sous-r´egions de 15×15 pixels.

Un autre moyen de se convaincre que la normalisation est trop p´enalisante est de voir que la normalisation par la racine carr´ee de la surface plutˆot que la surface fait resurgir la participation des sous-r´egions de dimensions moyennes `a la carte des zones les plus discriminatives (voir figure 5.7).

Figure 5.7: Carte obtenue par l’utilisation du maximum `a la place du moyennage dans l’ex´ecution de la m´ethode (c) et la diminution de la p´enalit´e im-pos´ee aux sous-r´egions de grande dimension.

La deuxi`eme contribution de cette m´ethode (d) permet de conserver l’utilisation de Deuxi`eme

contribu-la normalisation par contribu-la surface dont le but premier est de permettre de cadrer au mieux tion

les zones les plus utiles `a la discrimination en p´enalisant la participation `a la carte finale des sous-r´egions de surface inutilement trop grande. Une fois la m´ethode (d) au point, il sera mˆeme possible d’utiliser la normalisation par une puissance de la surface comme

un param`etre de pr´ecision de la carte des zones les plus utiles `a la discrimination.

Le coeur de la deuxi`eme contribution est la transformation des r´esultats de taux de bonnes classifications des sous-r´egions sur l’ensemble de validation `a une expression de lafraction d’informations discriminatives contenues dans la sous-r´egion. L’id´ee de base de cette approche vient du fait que si la fraction d’informations discriminatives ´etait utilis´ee au lieu du taux de bonnes classifications, la normalisation lors de l’utilisation du maximum `a la place de la moyenne n’aurait pas l’effet ennuyeux sur la carte finale d´ecrit plus haut : en reprenant l’exemple on obtient des fractions d’informations discriminatives normalis´ees de 0% pour la sous-r´egion de 15 ×15 pixels ne contenant aucune zone discriminative et de 0.111% pour la sous-r´egion de 15×30 pixels contenant une zone discriminative.

La formule pour passer du taux de bonnes classificationsC `a la fraction d’informations discriminativesQI dans le cas des ensembles artificiels est not´ee ci-dessous et son graphe est repr´esent´e `a la figure 5.8 :

QI = 1−log0.25(C) (5.2)

La relation 5.2 a ´et´e obtenue en partant de sa r´eciproque plus intuitive, le taux de bonnes classifications en fonction de la fraction d’informations discriminatives. Celle-ci se construit en raisonnant comme suit sur l’identification des ’personnes’ artificielles : Si aucun bit n’est connu, deux sont devin´es au hasard et cela donne une chance sur 4 de trouver la bonne identit´e; si 1 bit est connu, 1 est devin´e au hasard et cela donne une chance sur 2 de trouver la bonne identit´e; si 2 bits sont connus, aucun n’est devin´e au hasard et cela donne 100% de chance de trouver la bonne identit´e. La g´en´eralisation de ce concept pour N bits ξ-iaire donne la formule5.3.

C = 1

ξ

N(1−QI)

(5.3) o`u N est le nombre total d’´el´ements discriminatifs et N(1− QI) le nombre d’´el´ements discriminatifs ind´etermin´es en fonction de la fraction d’informations discriminatives. La r´eciproque de5.3 donne la fonction g´en´eralis´ee de la fraction d’informations discrimina-tives par rapport au taux de bonnes classifications :

QI = 1−log(1/ξ)N(C) (5.4)

La m´ethode (d) apporte donc deux contributions : la premi`ere est l’utilisation du maximum `a la place de la moyenne qui permet de diminuer la tendance de la m´ethode (c) `a gommer les contours et diminuer la pr´ecision de la carte. La seconde transforme

Figure 5.8: Fonction de conversion de taux de bonnes classifications vers fraction d’informations discriminatives contenue dans la sous-r´egion pour le cas des en-sembles artificiels compos´es de quatre visages. Trois points cl´es sont indiqu´es sur la figure : le point (0.25, 0) qui correspond `a la situation o`u aucune infor-mation n’est disponible et o`u le taux de bonnes classifications correspond `a la chance de d’identifier au hasard la bonne personne. Le point (0.5, 0.5), ce cas repr´esente une r´egion qui contient 50% de l’information discriminative n´ecessaire

`

a une identification correcte, c’est `a dire un bit sur un nombre binaire de 2 bits dans le cas des ensembles artificiels. La chance de trouver au hasard la bonne personne est donc de 50%. Le point (1, 1) o`u toute l’information discriminative est connue et donc o`u le taux de bonnes classifications est maximum.

les r´esultats de taux de bonnes classifications en fraction d’informations discriminatives contenue dans la sous-r´egion consid´er´ee et permet ainsi d’utiliser la normalisation par une puissance de la surface comme un param`etre de pr´ecision de la carte finale des zones les plus utiles `a la discrimination. En effet, lors de l’assignation du score maximal, une puissance ´elev´ee favorisera les grandes sous-r´egions tandis qu’une puissance plus faible augmentera la participation des sous-r´egions de faibles dimensions `a la carte des zones les plus utiles `a la discrimination.

Documents relatifs