• Aucun résultat trouvé

Projet d Apprentissage Automatique

N/A
N/A
Protected

Academic year: 2022

Partager "Projet d Apprentissage Automatique"

Copied!
7
0
0

Texte intégral

(1)

Objectifs p ´edagogiques du projet

D ´ecouvrir le B.A.BA de l’apprentissage automatique `a travers l’exp ´erience de la classification supervis ´ee binaire

P ´edagogie particuli `ere : r ´ealiser par soi-m ˆeme l’importance des concepts fondamentaux de l’apprentissage (mesure de performances, g ´en ´eralisation, importance de l’ ´echantillon et notion de variance, notion d’hyper-param `etres, repr ´esentation vectorielle des donn ´ees, etc.) La vraie vie

Que voit-on dans des images ?

On observe: images de drones de qualit ´es diverses

Dans ces images, quelles sont les zones maritimes ? On le sait :

´etiquetage de chaque image = On y voit la mer (+1) ou pas (-1).

L’ordi observe apr `es coup une nouvelle image envoy ´ee par le drone : est-ce une image qui comprend une zone maritime ? Quelle confiance dans cette pr ´eciction ?

(2)

Sch ´ematiquement

Phase d’apprentissage

(3)

Phase de d ´ecision (mise en production)

(4)

Sch ´ematiquement

Phase de d ´ecision (mise en production)

(5)

Quelles observations ?

Un ´echantillon d’images couleurs, de tailles et de r ´esolutions diff ´erentes (r ´epertoireData)

Une ´etiquette (cat ´egorie) pour ces images : selon le sous-r ´epertoire dans lequel elle se trouve

Sous-r ´epertoireMer= +1 = image maritime

Sous-r ´epertoireAilleurs= -1 = image non maritime

D ´eterminer une fonctionf(image)→ {mer, ailleurs}

Valable pour les images d ´ej `a observ ´ees, mais aussi de fac¸on g ´en ´erale face `a n’importe quelle nouvelle image

Remise du projet (pour ´evaluation)

Un programme Python complet offrant une fonction de pr ´ediction de la cat ´egorie d’une nouvelle image pass ´ee en param `etre (coeff 2)

Un rapport pr ´esentant l’architecture logicielle choisie, le(s) algorithme(s) d’apprentissage d ´evelopp ´es (coeff 1), les verrous rencontr ´es et les solutions apport ´ees.

La pr ´ediction appliqu ´ee `a une s ´erie de 30 images inconnues : les trois meilleures ´equipes gagnent un bonus.

(6)

Organisation ce jour

Constitution des groupes et brainstorming

Quatre `a cinq personnes par groupe (tirage au sort des chefs temporaire d’ ´equipe – ou sur candidature et vote – puis s ´election des autres membres par d ´esignation du chef d’ ´equipe, ou par courte paille, aux d ´es, `a Shifumi, etc.)

Brainstorming de 20 minutes au sein de chaque ´equipe pour envisager les axes majeurs d’une premi `ere solution et les variantes possibles.

Pr ´esentations de premi `eres solutions et discussions Pour chaque ´equipe :

Pr ´esentation en 4 minutes de sa solution sch ´ematis ´ee, possibilit ´e de questions/r ´eponses des autres ´equipes.

Distribution des r ˆoles, chaque membre se voit attribuer un (ou plusieurs) r ˆole(s) parmi : Chef, responsable scientifique, responsable technique, rapporteur, concepteur, testeur, d ´eveloppeur, relation client, etc.

(7)

Quelques points cl ´es

L’essentiel : revenir sur le cours du matin, et laisser aller son imagination. Se fixer assez vite une ´ebauche de solution.

Importance d’un format homog `ene des donn ´ees. Lequel ? Biblioth `eques disponibles pour traiter les images ?

On peut utiliser Naives Bayes, mais n’y a-t-il pas d’autres algorithmes plus efficaces ? Peut-on cr ´eer son propre algorithme ?

Peut-on jouer avec l’ ´echantillon ? (l’augmenter par transformation des images existantes, ou par d ´edoublement de certaines, etc.) ?

Peut-on modifier les images avant qu’elles ne soient en entr ´ee du processus ? Les d ´ecouper, enlever le bleu, les mettre en noir et blanc, etc. ?

Comment organiser nos donn ´ees et notre code pour travailler `a plusieurs ? (ex. sp ´ecification des fonctions python, ...)

Comment tester la qualit ´e de ce que l’on fait ?

Références

Documents relatifs

L’apprentissage automatique (AA) (“Machine Learning - ML”) : croisement de plusieurs

§ Effort sur le coût de conception (ingénierie) des logiciels ñ Degré d’intervention de l’humain dans la conception.

§ Effort sur le coût de conception (ingénierie) des logiciels ñ Degré d’intervention de l’humain dans la conception.

Elle ne peuvent pas décrire une image trop complexe comme une photographie, mais sont tout à fait adaptées au rendu typographique, aux logos et autres formes aux tracés simples....

Pour calculer la matrice de confusion → nous avons besoin d’avoir un ensemble de prédictions afin de les comparer aux labels actuels. On peut faire les prédictions sur le test_set

• biais important: hommes petits et femmes grandes (erreur d'approximation). • variance faible: seuil de taille

a- Une activité sportive qui développe le bien-être chez un individu b- Une discipline scolaire qui développe les capacités chez un individu c- Une activité sportive qui

Il doit être rédigé, avec soin, en PDF et ne doit pas contenir de source ; il doit être rédigé en français et doit expliquer, de la façon la plus claire, la plus simple et la