• Aucun résultat trouvé

(TD) Méthodes à noyaux

N/A
N/A
Protected

Academic year: 2022

Partager "(TD) Méthodes à noyaux"

Copied!
2
0
0

Texte intégral

(1)

TD 8 : M ´ETHODES `A NOYAUX : APPLICATIONS `A LA RECONNAISSANCE FACIALE

COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, PRINTEMPS 2013

R´emi Lajugie remi.lajugie@ens.fr

esum´e. Ce TP a pour but de montrer que les m´ethodes `a noyaux peuvent s’appliquer avec succ`es

`

a des donn´ees r´eelles. On apprendra ici divers classifieurs en appliquant les m´ethodes vues en cours et on d´emontrera leur performance sur la classification de visages.

1. Exercice

1) Le noyau d´efini par ∀0< x, y <1 K(x, y) = 1−xy1 est il d´efini positif ?

2) On consid`ere un espace probabilis´e Ω muni d’une loi de probabilit´e Psur l’ensemble de ses par- ties, montrez que le noyau d´efini par∀A, B ∈2, K(A, B) =P(A∩B)−P(A)P(B) est d´efini positif.

2. Probl`eme

3) Commencez par t´el´echarger les donn´ees `a l’adresse http://vis-www.cs.umass.edu/lfw/lfw.

tgz. Explorez le r´epertoire, remettez vous en tˆete comment on affiche des photos `a l’aide de la commande imreadde MATLAB/Octave.

Maintenant, on va choisir deux “personnalit´es” dans la base de donn´ees que l’on gardera pour la suite du TP. Le but sera d’apprendre des classifieurs permettant de discriminer les images des deux personnalit´es choisies . Parmi les nombreux choix possibles, des individus comme David Beckham, Jacques Chirac, George W. Bush ou Tony Blair sont de bons choix car on dispose de suffisamment d’exemples pour travailler dans de bonnes conditions.

Chacune des deux personnalit´es sera encod´ee par une sortie y∈ {−1,1}.

On va d’abord s’int´eresser `a la mani`ere de repr´esenter une image num´eriquement pour la tˆache qui nous int´eresse (on emploie souvent le terme de “features” pour d´esigner de tels attributs.) De mani`ere simple on va consid´erer deux types d’attributs pour ces images. Ils ne sont pas forc´ement les choix les plus adapt´es et on pr´ef`ere souvent en utiliser de plus sophistiqu´es.

4) Commencez par s´eparer les donn´ees que vous avez choisies en deux ´echantillons l’un d’en- traˆınement et l’autre de validation/test.

On consid`ere chaque image comme un ensemble de pixels, chacun ayant un attribut/caract´eristique ou “feature” de couleur ou de lumi`ere.

(2)

2 COURS D’APPRENTISSAGE, ECOLE NORMALE SUP ´ERIEURE, PRINTEMPS 2013

5) Impl´ementez une r´egression ridge avec un noyau lin´eaire sur les donn´ees en utilisant comme

“features” soit l’intensit´e lumineuse soit les intensit´es de couleurs.

6) Repr´esentez en fonction du param`etre de r´egularisation λ, les erreurs d’entraˆınement et de vali- dation/test. On pourra regarder une plage de valeurs logarithmique entre 10−10 et 1010.

7) Affichez les exemples mal class´es avec le pire fort score ainsi que les exemples bien class´es avec le meilleur score. Regardez ´egalement les exemples qui sont class´es avec une confiance faible en valeur absolue.

D´esormais, on va travailler davec un noyau Gaussien (aussi appel´e RBF pour “Radial Basis Function”). On rappelle qu’un noyau Gaussien de param`etreσ est d´efini par ∀x, y∈Rp, K(x, y) = exp(−kx−yk2 2. Il est possible de d´emontrer que cette fonction est d´efinie positive, on l’admettra pour le TP.

8) Quelle est la fonction de distancedassoci´ee au noyau K?

9) Dans R, en fixant x = a, repr´esentez graphiquement la fonction d(x, y) (ainsi que celle corres- pondant au noyau lin´eaire). Intuitivement quel effet a σ sur cette fonction ?

10) En utilisant les attributs de votre choix (ceux qui vous ont paru les plus adapt´es dans la partie pr´ec´edente), construisez un pr´edicteur fond´e sur le r´esultat de la r´egression ridge. On pourra fixer le param`etre 2σ2 `a 10−4.

11) Repr´esentez l’´evolution en fonction deλ, param`etre de r´egularisation, des erreurs d’entraˆınement et de validation/test.

12) Fixez λet ´etudiez l’effet de la variation du param`etre σ du noyau gaussien.

Références

Documents relatifs

Conjecturer ` a partir de combien de voitures fabriqu´ ees et vendues l’entreprise r´ ealisera un b´ en´ efice.. Pour combien de voitures fabriqu´ ees le b´ en´ eficie

Si f est une fonction vectorielle d´ efinie sur un intervalle compact [a, b] de R , on appellera suite associ´ ee ` a f toute suite (ϕ n , θ n ) de couples de fonctions en escalier

Remarque 4.1 Si f, g sont deux fonctions num´ eriques ou vectorielles int´ egrables sur [a, b] et si leurs valeurs ne diff` erent qu’en un nombre fini de points de [a, b], leurs

Faire un programme qui calcule l’int´egrale d’une fonction donn´ee `a l’aide de la m´ethode des rectangles, des trap`ezes, de Simpson et de Gauss `a deux points. Tracer le

Faire un programme qui calcule l’int´egrale d’une fonction donn´ee `a l’aide de la m´ethode des rectangles, des trap`ezes, de Simpson et de Gauss `a deux points.. Tracer

Un nombre entier naturel non nul n est dit parfait si la somme des diviseurs de n qui sont supérieurs ou égaux à 1 est égale au double de n. Par exemple, 6 est un

Soit α un r´ eel

La fonction getErrors doit vous renvoyer un tableau d’erreur d’entraˆınement et d’erreur de test pour diff´ erentes valeurs de λ (lambdas) ´ etant donn´ e des labels Y,