• Aucun résultat trouvé

Rappel : Classifieur de Bayes

N/A
N/A
Protected

Academic year: 2022

Partager "Rappel : Classifieur de Bayes"

Copied!
5
0
0

Texte intégral

(1)

Classification

Ana Karina Fermin

M2 ISEFAR

http://fermin.perso.math.cnrs.fr/

(2)

Methods:

1 k Nearest-Neighbors X

2 Generative Modeling (Naive Bayes, LDA, QDA)

3 Logistic Modeling

4 SVM

5 Tree Based Methods (M. Zetlaoui course, Apprentissage)

(3)

Binary Classification

Framework

Input measurementX= (X(1),X(2), . . . ,X(d))∈ X Output measurement Y ∈ Y.

(X,Y)∼Pwith Punknown.

Training data : Dn={(X1,Y1), . . . ,(Xn,Yn)} (i.i.d. ∼P) OftenX∈Rd andY ∈ {−1,1}

A classifieris a function in F ={f :X → Y measurable}

Goal

Construct a goodclassifierfbfrom the training data.

(4)

Loss and Probabilistic Framework

Loss function

Loss function : `(f(x),y) measure how wellf(x) “predicts" y.

`(Y,f(X)) =1Y6=f(X)

Risk of a generic classifier

Risk measured as the average loss for a new couple:

R(f) =E[`(Y,f(X))] =P{Y 6=f(X)}

Beware: As bf depends onDn,R(bf) is a random variable!

Goal

Learn a rule to construct a classifier bf ∈ F from the training data Dn s.t. the riskR(fb) issmall on average or with high probability with respect toDn.

(5)

Best Solution

The best solution f (which is independent of Dn) is

f = arg min

f∈FR(f) = arg min

f∈FE[`(Y,f(X))] = arg min

f∈FEX

h

EY|X[`(Y,f(x))]i

Bayes Classifier (explicit solution)

In binary classification with 0−1 loss:

f(X) =

+1 if P{Y = +1|X} ≥P{Y =−1|X}

⇔P{Y = +1|X} ≥1/2

−1 otherwise

Issue: Explicit solution requires toknowE[Y|X]for all values ofX!

Références

Documents relatifs

path courbe de B´ ezier spline cubique r´ esolue (points de contrˆ ole d´ etermin´ es par Asymptote ou vos soins). guide courbe de B´ ezier spline cubique non r´ esolue (points

Pour utiliser une fonction prédéfinie, il suffit de : - Se positionner dans la cellule relative au calcul - Saisir le signe (=) puis le nom de la fonction - Compléter

Par exemple, face à un problème de classification, un classifieur probabiliste permet, pour toutes les instances de la base de données, d'estimer la probabilité

Mettre le nombres complexes a sous forme trigonométrique et représenter ,dans le plan complexe son point image A ainsi que le point B image du nombre complexe i a.. En déduire

– compter les élèves avant l’entrée dans l’eau et à la sortie de l’eau – ne pas laisser les élèves courir sur le bord de la piscine.. – ne pas avoir d’élève

>> Pas de sélection (mise en évidence) des variables pertinentes (sûr, sûr ?) >> Pas de sélection (mise en évidence) des variables pertinentes (sûr, sûr ?)..

(dans la pratique, les règles ne sont pas formées, nous conservons les probas conditionnelles que nous appliquons pour chaque individu à classer pas d’interprétation des

Le poussin vert printemps s'est trompé.
 Le poussin violet avec son banc violet est cinquième.
 Le poussin pas content est sixième. Le poussin rose est dernier ou septième comme