Intelligence Artificielle et Th´ eorie des Jeux - TD 6
Exercice 1 Soit une population Π d’individus qui consiste en un ´echantillon compos´e d’ouvrier, de m´edecins et d’employ´es des t´el´ecoms. On d´ecrit les individus par un attribut logique hautdebitqui vaut vrai si l’individu poss`ede l’internet haut d´ebit et faux sinon. L’espace de description est donc ´egal `a l’ensemble{hautdebit, hautdebit}. On souhaite r´epartir les individus en trois classesouvrier,medecin ettelecom. On dispose des informations suivantes :
classek telecom medecin ouvrier
P(k) 0.2 0.3 0.5
P(hautdebit/k) 1 0.9 0.45
Une premi`ere r`egle possible pour le choix de la fonction de classementCpourraˆıt ˆetre : “attribuer `a chaque description la classe majoritaire”, c’est-`a-dire celle pour laquelleP(k) est maximum; c’est la r`eglemajoritaire.
Une seconde r`egle consiste `a raisonner ainsi : “si j’observed, je choisis la classe pour laquelle cette observation est la plus probable”, c’est-`a-direP(d/k) est maximum. C’est la r`egle dite dumaximum de vraisemblance.
Une troisi`eme r`egle (r`egle de Bayes) consiste `a attribuer `a une descriptiondla classekqui maximise la probabilit´eP(k/d) qu’un ´el´ement ayantdpour description soit de classek. La quantit´eP(k/d) peut ˆetre estim´ee en utilisant la formule de Bayes, il suffit donc de choisir la classekqui maximise le produitP(d/k)P(k).
D´ecrire sur cet exemple les trois fonctionsCmajoritaire,CvraisemblanceetCBayes.
On peut d´efinir la probabilit´e d’erreur d’une fonction de classement de la fa¸con suivante : soitCune fonction de classement, l’erreurE(d) (ou probabilit´e d’erreur) pour une descriptiondest la probabilit´e qu’un ´el´ement de la population Π de description dsoit mal class´e parC, l’erreurE(C) d’une fonction de classement est la moyenne pond´er´ee des erreurs sur les descriptionsd.
Calculer les erreurs pour les trois proc´edures de classification trouv´ees pr´ec´edemment.
Exercice 2 La population Π est un ensemble de champignons. Il y a deux classes{1,2}de champignons, o`u 1 est la classe des champignons v´en´eneux. Le langage de description est constitu´e de l’attribut binaire volve(c’est une membrane qui enveloppe certains champignons). On dispose des informations suivantes :
classek 1 : v´en´eneux 2 : comestible
P(k) 0.05 0.95
P(volve/k) 0.9 0.2
• Je ramasse les champignons si la r`egle de Bayes les classifie dans la classe des comestibles. Donnez la fonctionCBayespour cet exemple. Est-ce-que je ramasse les champignons ayant une volve ? Appliqueriez-vous cette r`egle si vous alliez ramasser des champignons ?
• On d´efinit un coˆut pour tout couple de classes (k, i) not´e cout(k, i). On d´efinit alors le coˆut moyen de l’affectation `a la classekd’une descriptionddeDpar :
cout moyen(k/d) = X
i∈{1,...c}
cout(k, i)×P(i/d).
La r`egle de d´ecision du coˆut minimum est : “ChoisirCcout min qui `a toute descriptiond associe la classek qui minimise cout moyen(k/d)”.
On d´efinit sur notre exemple les coˆuts suivants :
cout(1,1) = cout(2,2) = 0, cout(1,2) = 2, cout(2,1) =∞.
J’utilise la r`egle du coˆut minimal. Est-ce-que je ramasse les champignons ayant une volve ?
Exercice 3 On consid`ere deux attributs pour d´eterminer la nationalit´e d’un individu. L’attribut taille qui peut prendre les valeursgrandoupetit, l’attributcouleurdes cheveux qui peut prendre les valeursbrun oublond. Les nationalit´es possibles sont fran¸caisetallemand.
On suppose que les populations fran¸caises et allemandes se r´epartissent selon le tableau suivant : petit,brun petit,blond grand,brun grand,blond
fran¸cais 25 25 25 25
allemand 10 20 30 40
• Est-ce que les attributstailleetcouleursont ind´ependants connaissant la classe (fran¸cais ou allemand) ?
• Dans une assembl´ee comprenant 60% d’allemands et 40% de fran¸cais, d´ecrire 1. la r`egle de d´ecision majoritaire
2. la r`egle du maximum de vraisemblance 3. la r`egle de Bayes
• Calculer les probabilit´es d’erreur de chacunes des r`egles.
1