• Aucun résultat trouvé

Exercices d'entrainement

N/A
N/A
Protected

Academic year: 2022

Partager "Exercices d'entrainement"

Copied!
1
0
0

Texte intégral

(1)

Exercices de r´evision - Cours d’Apprentissage Statistique

Aude Genevay - [email protected] 12 janvier 2017

Exercice 1 - Naive Bayes

On consid`ere un probl`eme de classification avec donn´ees d’entr´ee binaires,X ∈ {0,1}d, et une variable de sortie binaireY ∈ {0,1}.

On consid`ere le mod`ele g´en´eratif suivant :

• Y est distribu´ee comme une variable de Bernoulli de param`etreπ∈[0,1],

• sachantY =y avecy ∈ {0,1}, les composantesX1, . . . , Xd deX sont ind´ependantes et chacune distribu´ee comme une loi de Bernoulli avec param`etresµi,y∈[0,1],i= 1, . . . , d.

(a) Ecrire la log-vraisemblance logp(x, y) pour la paire (X, Y), comme fonction “bi-affine” (avec termes constants, lin´eaires et bi-lin´eaires) de x∈ {0,1}d ety∈ {0,1}.

(b) Montrer que logp(Y = 1|x)−logp(Y = 0|x) peut s’exprimer comme fonction affine de x(avec param`etresµet π).

(c) En d´eduire quep(Y = 1|X =x) = σ(a>X+b) en exprimant a et b en fonction de µ et π, o`u σ(u) = (1 + exp(−u))−1.

(d) On consid`erenobservations (x1, y1),· · ·,(xn, yn) ind´ependantes et identiquement distribu´ees de ce mod`ele. Ecrire la vraisemblance des donn´ees logp(x1, y1, . . . , xn, yn) et trouver des estimateurs deµetπen formules analytiques simples.

(e) Ecrire la vraisemblance conditionnelle logp(y1, . . . , yn|x1, . . . , xn). A quel mod`ele vu en cours cela correspond-il ? D´ecrire un algorithme d’estimation.

(f) Quel est le lien avec l’analyse discriminante lin´eaire ?

(g) Ce mod`ele est tr`es utilis´e pour la pr´ediction textuelle, i.e., quandXrepr´esente un document,dle nombre total de mots disponibles, etY une classe quelconque (i.e., article parlant de sport vs.

article parlant de finance). Comment utiliser le mod`ele d´ecrit ?

(h) Dans le cadre d’une application de pr´ediction textuelle, l’hypoth`ese d’ind´ependance deX1, . . . , Xd sachantY est-elle justifi´ee ? Que se passe-t-il si on la retire ?

Exercice 2 - Seuillage doux et projection sur la boule `

Soitz∈Rn etλ∈R+. On consid`ere le probl`eme d’optimisation suivant : minimiser 1

2kx−zk22+λkxk1 par rapport `ax∈Rn, o`u kakp= Pn

i=1|ai|p1/p

pourp∈[1,∞), et kak= max{|a1|,· · ·,|an|}.

(a) Montrer que le minimum estatteint et qu’il est unique.

(b) Exprimer simplement la solution x en fonction de z. On utilisera la s´eparabilit´e par rapport

`

a chacune des composantes de x pour se ramener `a n probl`emes uni-dimensionnels. Conseil : consid´erer le cas o`uxi= 0 est une solution s´epar´ement en premier.

(c) Soit a∈Rn. Calculer infx∈Rna>x+λkxk1.

(d) En introduisant la variableu=x−z∈Rnet des multiplicateurs de Lagrange pour ces contraintes, montrer qu’un probl`eme dual est la projection orthogonale sur une boule pour la normek · k.

Références

Documents relatifs

a 5% apr` es revue des chiffres disponibles. Concernant le couloir d’´ emission, la trajectoire haute repr´ esente un effort retard´ e sur la d´ ecennie 2040 alors que la

L’algorithme g´ en´ etique est utilis´ e pour optimiser le patch composite du probl` eme de renforcement de struc- ture pr´ esent´ e (Fig. La courbe 7 repr´ esente la courbe

En pr´ esence d’externalit´ es strictement positives avec des individus ayant des pr´ ef´ erences qui peuvent ˆ etre repr´ esent´ ees par une fonction d’utilit´ e

Le mod` ele mis en œuvre pr´ esente deux avantages : 1) la possibilit´ e d’int´ egrer simplement une description anatomique locale, notamment les structures vascu- laires. Ce

Pr´ediction de Notes Pour cette tˆache nous avons utilis´e trois mod`eles de r´ef´erence : la factorisation matricielle classique avec termes de biais telle que propos´ee dans

Le voisinage d'une solution peut ^etre de ni de plusieurs manieres di e- rentes. Ici, on retiendra le voisinage le plus connu et le plus utilise: celui qui.. represente

Dans la pr´ esente ´ etude, un mod` ele num´ erique de rupture de barrage a d’abord ´ et´ e valid´ e sur la base de r´ esultats exp´ erimentaux ant´ erieurs, puis utilis´ e

En utilisant une approche comparable `a celle utilis´ee en reconnaissance du locuteur, nous avons adapt´e le GMM g´en´eral qui repr´esente l’ensemble de l’espace acoustique