Projet d Apprentissage Automatique

(1)

Objectifs p ´edagogiques du projet

• D écouvrir le B.A.BA de l’apprentissage automatique à travers l’exp érience de la classification supervis ée binaire

• P édagogie particuli ère : r éaliser par soi-m ême l’importance des concepts fondamentaux de l’apprentissage (mesure de performances, g én éralisation, importance de l’ échantillon et notion de variance, notion d’hyper-param ètres, repr ésentation vectorielle des donn ées, etc.) La vraie vie

Que voit-on dans des images ?

• On observe: images de drones de qualit ´es diverses

• Dans ces images, quelles sont les zones maritimes ? On le sait :

´etiquetage de chaque image = On y voit la mer (+1) ou pas (-1).

• L’ordi observe apr ès coup une nouvelle image envoy ée par le drone : est-ce une image qui comprend une zone maritime ? Quelle confiance dans cette pr éciction ?

(2)

Sch ´ematiquement

Phase d’apprentissage

(3)

Phase de d ´ecision (mise en production)

(4)

Sch ´ematiquement

Phase de d ´ecision (mise en production)

(5)

Quelles observations ?

• Un échantillon d’images couleurs, de tailles et de r ésolutions diff érentes (r épertoireData)

• Une étiquette (cat égorie) pour ces images : selon le sous-r épertoire dans lequel elle se trouve

• Sous-r ´epertoireMer= +1 = image maritime

• Sous-r ´epertoireAilleurs= -1 = image non maritime

D ´eterminer une fonctionf(image)→ {mer, ailleurs}

Valable pour les images d éj à observ ées, mais aussi de façon g én érale face à n’importe quelle nouvelle image

Remise du projet (pour ´evaluation)

• Un programme Python complet offrant une fonction de pr édiction de la cat égorie d’une nouvelle image pass ée en param ètre (coeff 2)

• Un rapport pr ésentant l’architecture logicielle choisie, le(s) algorithme(s) d’apprentissage d évelopp és (coeff 1), les verrous rencontr és et les solutions apport ées.

• La pr édiction appliqu ée à une s érie de 30 images inconnues : les trois meilleures équipes gagnent un bonus.

(6)

Organisation ce jour

Constitution des groupes et brainstorming

• Quatre à cinq personnes par groupe (tirage au sort des chefs temporaire d’ équipe – ou sur candidature et vote – puis s élection des autres membres par d ésignation du chef d’ équipe, ou par courte paille, aux d és, à Shifumi, etc.)

• Brainstorming de 20 minutes au sein de chaque ´equipe pour envisager les axes majeurs d’une premi `ere solution et les variantes possibles.

Pr ésentations de premi ères solutions et discussions Pour chaque équipe :

• Pr ésentation en 4 minutes de sa solution sch ématis ée, possibilit é de questions/r éponses des autres équipes.

• Distribution des r ôles, chaque membre se voit attribuer un (ou plusieurs) r ôle(s) parmi : Chef, responsable scientifique, responsable technique, rapporteur, concepteur, testeur, d éveloppeur, relation client, etc.

(7)

Quelques points cl ´es

L’essentiel : revenir sur le cours du matin, et laisser aller son imagination. Se fixer assez vite une ´ebauche de solution.

• Importance d’un format homog ène des donn ées. Lequel ? Biblioth èques disponibles pour traiter les images ?

• On peut utiliser Naives Bayes, mais n’y a-t-il pas d’autres algorithmes plus efficaces ? Peut-on cr ´eer son propre algorithme ?

• Peut-on jouer avec l’ ´echantillon ? (l’augmenter par transformation des images existantes, ou par d ´edoublement de certaines, etc.) ?

• Peut-on modifier les images avant qu’elles ne soient en entr ´ee du processus ? Les d ´ecouper, enlever le bleu, les mettre en noir et blanc, etc. ?

• Comment organiser nos donn ées et notre code pour travailler à plusieurs ? (ex. sp écification des fonctions python, ...)

• Comment tester la qualit ´e de ce que l’on fait ?