• Aucun résultat trouvé

(TD) Méthodes à noyaux

N/A
N/A
Protected

Academic year: 2022

Partager "(TD) Méthodes à noyaux"

Copied!
2
0
0

Texte intégral

(1)

TD 8 : M ´ETHODES `A NOYAUX : APPLICATIONS `A LA RECONNAISSANCE FACIALE

COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, PRINTEMPS 2013

R´emi Lajugie [email protected]

esum´e. Ce TP a pour but de montrer que les m´ethodes `a noyaux peuvent s’appliquer avec succ`es

`

a des donn´ees r´eelles. On apprendra ici divers classifieurs en appliquant les m´ethodes vues en cours et on d´emontrera leur performance sur la classification de visages.

1. Exercice

1) Le noyau d´efini par ∀0< x, y <1 K(x, y) = 1−xy1 est il d´efini positif ?

2) On consid`ere un espace probabilis´e Ω muni d’une loi de probabilit´e Psur l’ensemble de ses par- ties, montrez que le noyau d´efini par∀A, B ∈2, K(A, B) =P(A∩B)−P(A)P(B) est d´efini positif.

2. Probl`eme

3) Commencez par t´el´echarger les donn´ees `a l’adresse http://vis-www.cs.umass.edu/lfw/lfw.

tgz. Explorez le r´epertoire, remettez vous en tˆete comment on affiche des photos `a l’aide de la commande imreadde MATLAB/Octave.

Maintenant, on va choisir deux “personnalit´es” dans la base de donn´ees que l’on gardera pour la suite du TP. Le but sera d’apprendre des classifieurs permettant de discriminer les images des deux personnalit´es choisies . Parmi les nombreux choix possibles, des individus comme David Beckham, Jacques Chirac, George W. Bush ou Tony Blair sont de bons choix car on dispose de suffisamment d’exemples pour travailler dans de bonnes conditions.

Chacune des deux personnalit´es sera encod´ee par une sortie y∈ {−1,1}.

On va d’abord s’int´eresser `a la mani`ere de repr´esenter une image num´eriquement pour la tˆache qui nous int´eresse (on emploie souvent le terme de “features” pour d´esigner de tels attributs.) De mani`ere simple on va consid´erer deux types d’attributs pour ces images. Ils ne sont pas forc´ement les choix les plus adapt´es et on pr´ef`ere souvent en utiliser de plus sophistiqu´es.

4) Commencez par s´eparer les donn´ees que vous avez choisies en deux ´echantillons l’un d’en- traˆınement et l’autre de validation/test.

On consid`ere chaque image comme un ensemble de pixels, chacun ayant un attribut/caract´eristique ou “feature” de couleur ou de lumi`ere.

(2)

2 COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, PRINTEMPS 2013

5) Impl´ementez une r´egression ridge avec un noyau lin´eaire sur les donn´ees en utilisant comme

“features” soit l’intensit´e lumineuse soit les intensit´es de couleurs.

6) Repr´esentez en fonction du param`etre de r´egularisation λ, les erreurs d’entraˆınement et de vali- dation/test. On pourra regarder une plage de valeurs logarithmique entre 10−10 et 1010.

7) Affichez les exemples mal class´es avec le pire fort score ainsi que les exemples bien class´es avec le meilleur score. Regardez ´egalement les exemples qui sont class´es avec une confiance faible en valeur absolue.

D´esormais, on va travailler davec un noyau Gaussien (aussi appel´e RBF pour “Radial Basis Function”). On rappelle qu’un noyau Gaussien de param`etreσ est d´efini par ∀x, y∈Rp, K(x, y) = exp(−kx−yk2 2. Il est possible de d´emontrer que cette fonction est d´efinie positive, on l’admettra pour le TP.

8) Quelle est la fonction de distancedassoci´ee au noyau K?

9) Dans R, en fixant x = a, repr´esentez graphiquement la fonction d(x, y) (ainsi que celle corres- pondant au noyau lin´eaire). Intuitivement quel effet a σ sur cette fonction ?

10) En utilisant les attributs de votre choix (ceux qui vous ont paru les plus adapt´es dans la partie pr´ec´edente), construisez un pr´edicteur fond´e sur le r´esultat de la r´egression ridge. On pourra fixer le param`etre 2σ2 `a 10−4.

11) Repr´esentez l’´evolution en fonction deλ, param`etre de r´egularisation, des erreurs d’entraˆınement et de validation/test.

12) Fixez λet ´etudiez l’effet de la variation du param`etre σ du noyau gaussien.

Références

Documents relatifs

par exemple pour Cholesky, on ne soumettrait plus que la tˆ ache principale avec la matrice ` a calculer, et le support d’ex´ ecution d´ ecouperait le probl` eme tout seul ` a

Ces mod` eles sont alors simul´ es num´ eriquement en temps r´ eel, en utilisant des repr´ esentations d’´ etats ´ etendues, des algo- rithmes d’interpolation bilin´ eaire, et

Remarque importante : Dans le cas lin´eaire qui nous int´eresse, les graphes qui interviennent de mani`ere non triviale (on dira essentiels), sont tels que les sommets de

Dans le contexte de l’´ecole anglo-saxonne pour l’AMCD, la fonction de valeur additive occupe une position dominante dans les mod`eles utilis´es pour repr´esenter les

En restant dans l’exemple du passage d’une repr´esentation r´etinotopique `a une repr´esentation centr´ee sur la tˆete, il est int´eressant d’´etudier la taille de

Schaback (1995b) nomme P D fonction puissance et donne des majorants qui sont fonction d’un crit`ere d’espacement des points dans le plan d’exp´erience D dans le cas de noyaux

(b) L’Acceptant peut reproduire, distribuer, repr´ esenter ou communiquer au pu- blic une œuvre dite D´ eriv´ ee y compris par voie num´ erique uniquement sous les termes de

Comme nous sommes dans un mod`ele markovien nous allons repr´esenter les gains sur les p´eriodes `a l’aide d’un gain moyen potentiel d´ependant uniquement de la production et du