Objectifs p ´edagogiques du projet
• D ´ecouvrir le B.A.BA de l’apprentissage automatique `a travers l’exp ´erience de la classification supervis ´ee binaire
• P ´edagogie particuli `ere : r ´ealiser par soi-m ˆeme l’importance des concepts fondamentaux de l’apprentissage (mesure de performances, g ´en ´eralisation, importance de l’ ´echantillon et notion de variance, notion d’hyper-param `etres, repr ´esentation vectorielle des donn ´ees, etc.) La vraie vie
Que voit-on dans des images ?
• On observe: images de drones de qualit ´es diverses
• Dans ces images, quelles sont les zones maritimes ? On le sait :
´etiquetage de chaque image = On y voit la mer (+1) ou pas (-1).
• L’ordi observe apr `es coup une nouvelle image envoy ´ee par le drone : est-ce une image qui comprend une zone maritime ? Quelle confiance dans cette pr ´eciction ?
Sch ´ematiquement
Phase d’apprentissagePhase de d ´ecision (mise en production)
Sch ´ematiquement
Phase de d ´ecision (mise en production)Quelles observations ?
• Un ´echantillon d’images couleurs, de tailles et de r ´esolutions diff ´erentes (r ´epertoireData)
• Une ´etiquette (cat ´egorie) pour ces images : selon le sous-r ´epertoire dans lequel elle se trouve
• Sous-r ´epertoireMer= +1 = image maritime
• Sous-r ´epertoireAilleurs= -1 = image non maritime
D ´eterminer une fonctionf(image)→ {mer, ailleurs}
Valable pour les images d ´ej `a observ ´ees, mais aussi de fac¸on g ´en ´erale face `a n’importe quelle nouvelle image
Remise du projet (pour ´evaluation)
• Un programme Python complet offrant une fonction de pr ´ediction de la cat ´egorie d’une nouvelle image pass ´ee en param `etre (coeff 2)
• Un rapport pr ´esentant l’architecture logicielle choisie, le(s) algorithme(s) d’apprentissage d ´evelopp ´es (coeff 1), les verrous rencontr ´es et les solutions apport ´ees.
• La pr ´ediction appliqu ´ee `a une s ´erie de 30 images inconnues : les trois meilleures ´equipes gagnent un bonus.
Organisation ce jour
Constitution des groupes et brainstorming
• Quatre `a cinq personnes par groupe (tirage au sort des chefs temporaire d’ ´equipe – ou sur candidature et vote – puis s ´election des autres membres par d ´esignation du chef d’ ´equipe, ou par courte paille, aux d ´es, `a Shifumi, etc.)
• Brainstorming de 20 minutes au sein de chaque ´equipe pour envisager les axes majeurs d’une premi `ere solution et les variantes possibles.
Pr ´esentations de premi `eres solutions et discussions Pour chaque ´equipe :
• Pr ´esentation en 4 minutes de sa solution sch ´ematis ´ee, possibilit ´e de questions/r ´eponses des autres ´equipes.
• Distribution des r ˆoles, chaque membre se voit attribuer un (ou plusieurs) r ˆole(s) parmi : Chef, responsable scientifique, responsable technique, rapporteur, concepteur, testeur, d ´eveloppeur, relation client, etc.
Quelques points cl ´es
L’essentiel : revenir sur le cours du matin, et laisser aller son imagination. Se fixer assez vite une ´ebauche de solution.
• Importance d’un format homog `ene des donn ´ees. Lequel ? Biblioth `eques disponibles pour traiter les images ?
• On peut utiliser Naives Bayes, mais n’y a-t-il pas d’autres algorithmes plus efficaces ? Peut-on cr ´eer son propre algorithme ?
• Peut-on jouer avec l’ ´echantillon ? (l’augmenter par transformation des images existantes, ou par d ´edoublement de certaines, etc.) ?
• Peut-on modifier les images avant qu’elles ne soient en entr ´ee du processus ? Les d ´ecouper, enlever le bleu, les mettre en noir et blanc, etc. ?
• Comment organiser nos donn ´ees et notre code pour travailler `a plusieurs ? (ex. sp ´ecification des fonctions python, ...)
• Comment tester la qualit ´e de ce que l’on fait ?