• Aucun résultat trouvé

Apprentissage automatique

N/A
N/A
Protected

Academic year: 2022

Partager "Apprentissage automatique"

Copied!
13
0
0

Texte intégral

(1)

Apprentissage automatique

(2)

Introduction

Programme informatique Données

Hypothèses/règles Solution

Utilisateur

Exemple:

- Calculer la moyenne des étudiants

- Mettre à jour le nombre de places disponibles sur un parking

Résoudre un problème pour lequel nous avons la solution.

(3)

Introduction

Que faire si nous ne connaissons pas la solution exacte?

Résoudre un problème pour lequel nous avons la solution.

3

Exemple:

- Reconnaître les chiffres saisis à la main à partir d’un scan - Jouer automatiquement aux échecs

- Créer des typologies de clients - Optimisation d’une tâche

- …

3 3

6

6

(4)

L’apprentissage automatique (AA) (“Machine Learning - ML”) : croisement de plusieurs disciplines

- Les statistiques : inférence de modèles en utilisant des données existantes.

- Les probabilités : modélisation du caractère aléatoire/stochastique des sources de données et du problème d’apprentissage

- L’intelligence artificielle : étudier des tâches simples (reconnaissance de formes par les humains) - représentation des connaissances

Introduction

?

senseur

"actionneurs AGEN

perceptio

ENVIRONNEME

"action

Modèle général pour l’IA : « agent intelligent »

L’AA permet la conception et/ou adaptation de l’agent par analyse automatisée (généralement statistique) de son environnement, et/ou du résultat de son action.

(5)

Introduction

Objectif: réduire l’erreur de prédiction

Solution connue?

Moyen: données expérimentales

Démarche: mettre en place un modèle de prédiction f(H,D) Historique

Données externes

prédiction PREDICTEUR

Exemple: Agent prédicteur

f(H,D)

(6)

L’apprentissage automatique (AA) (“Machine Learning - ML”) : croisement de plusieurs disciplines

- L’optimisation : optimiser un critère de performance afin de - estimer des paramètres d’un modèle,

- déterminer la meilleure décision à prendre étant donné une instance d’un problème.

- L’informatique : programmer des algorithmes (complexité, mémoire, ressources, …)

Introduction

(7)

- Supervisé :

Types de problèmes en AA

Objet Label f(H,D) O1 L1

O2 L2

On Ln

… …

On+1 ?

Valeur cible

AS symbolique : méthodes inspirées de l’intelligence artificielle et dont les fondements reposent sur des modèles de logique, une représentation binaire des données (vrai/faux), et sur les méthodes de représentation des connaissances.

AS numérique : méthodes inspirées de la statistique, les données sont en général des vecteurs de réels, et les méthodes font intervenir des outils provenant des probabilités, de l’algèbre linéaire et de l’optimisation.

(8)

- Non supervisé :

Types de problèmes en AA

Objet Label f(H,D)

O1 ?

O2 ?

On ?

On+1 ?

Valeur cible

?

Il faut apprendre un modèle capable d’extraire les régularités présentes au sein des objets pour mieux visualiser ou appréhender la structure de l’ensemble des données.

(9)

- Par renforcement :

Types de problèmes en AA

On dispose d’un ensemble de séquences de décisions Sj (politiques ou stratégiques) dans un environnement dynamique, et pour chaque action ai de chaque séquence une valeur de récompense ri ( ).

Il faut apprendre un modèle capable de prédire la meilleure décision à prendre étant donné un état de l’environnement.

Rj = ∑

i ri

ri: récompense de l’action ai

Rj: récompense de la séquence j

(10)

Types de problèmes en AA

- Semi-supervisé:

Objet Label f(H,D) O1 L1

O2 ?

O3 L3

O4 ?

On ?

… …

On+1 ?

Valeur cible

Il faut tirer profit à la fois des données avec et sans valeurs cibles pour résoudre des tâches d’apprentissage supervisé ou non supervisé.

(11)

Types de problèmes en AA

- Actif:

Objet Label f(H,D) O1 L1

O2 ?

O3 L3

O4 ?

On ?

… …

On+1 ?

Interroger l’utilisateur

On dispose d’un petit ensemble d’objets avec pour chacun une valeur cible associée ; il faut interagir avec l’utilisateur et lui demander de donner la valeur cible d’un nouvel objet afin de mieux apprendre le modèle de

prédiction

(12)

Paradigme d’apprentissage

Chaque paradigme se caractérise par :

Un modèle, le plus souvent paramétrique Une façon d’interagir avec l’environnement +

Une « fonction de coût » à minimiser (sauf exceptions) + Un algorithme pour adapter le modèle, +

en utilisant les données issues de l’environnement, de façon à optimiser la fonction de coût

(13)

Schéma général

Introduction L’apprentissage automatique

Formalisation du probl`eme

Etant donn´e un ensemble d’entraˆınement E, on cherche `a d´eterminer f : X ! Y une fonction mod´elisant la relation entre les X d´ecrits dans l’espace de repr´esentation X et la variable cible Y :

f (X) = Y

En revanche, ne connaissant pas la vraie nature de la relation entre X et Y et les donn´ees observ´ees en {X1, . . . , Xp} ´etant soit bruit´ees, soit incompl`etes ; il n’est pas raisonnable de supposer une relation

d´eterministe. Aussi, il est davantage raisonnable de poser le probl`eme en les termes suivants :

f (X) = Y + ✏ o`u ✏ est l’erreur ou le r´esidu.

Autrement dit, il s’agit d’approximer f en commettant le moins d’erreurs possibles sur E tout en faisant de bonnes pr´edictions pour des valeurs de X non encore observ´ees.

J. Ah-Pine (Univ-Lyon 2) Apprentissage automatique M2 DM 2018/2019 17 / 358

Introduction L’apprentissage automatique

Sch´ema g´en´eral

DATABASE (numerical data, texts,

images, networks, …)

FEATURE MATRIX

NUMERICAL REPRESENTA

TION

PROXIMITY MATRIX

CLASSIFI- -CATION OUTPUT

CLASSIFI- -CATION ASSESSMENT

CLASSIFI- -CATION ALGORITHM

J. Ah-Pine (Univ-Lyon 2) Apprentissage automatique M2 DM 2018/2019 18 / 358

Introduction L’apprentissage automatique

Sch´ema g´en´eral (suite)

Comme pr´ecis´e pr´ec´edemment, nous ne traitons pas dans ce cours du proc´ed´e permettant de repr´esenter num´eriquement les donn´ees

complexes telles que les images, vid´eos, textes. . .

Partant d’objets complexes comme une image par exemple, il s’agit d’extraire des variables de l’ensemble des objets permettant de

repr´esenter ceux-ci au travers d’un vecteur de nombres. On parle d’extraction d’attributs (“features extraction”).

Ces proc´ed´es sont les champs d’expertises d’autres domaines que sont l’analyse d’images et le traitement automatique du langage naturel. . . N´eanmoins, des outils sont disponibles et peuvent ˆetre utilis´es mˆeme par des non experts.

Notre point de d´epart sera n´ecessairement soit une matrice de donn´ees de type table comme pr´esent´e pr´ec´edemment soit une matrice carr´ee de dissimilarit´es ou de similarit´es entre objets (que nous ´etudierons ult´erieurement comme pour le cas des svm).

J. Ah-Pine (Univ-Lyon 2) Apprentissage automatique M2 DM 2018/2019 19 / 358

Introduction L’apprentissage automatique

Sch´ema g´en´eral (suite)

J. Ah-Pine (Univ-Lyon 2) Apprentissage automatique M2 DM 2018/2019 20 / 358

Références

Documents relatifs

Pour calculer la matrice de confusion → nous avons besoin d’avoir un ensemble de prédictions afin de les comparer aux labels actuels. On peut faire les prédictions sur le test_set

Plan prévisionnel du cours d’ « Apprentissage automatique » donné en Master MI, 1ère année, spécialité Informatique, année 2018-2019.. Séance

Le modèle a été identifié pour des points d’apprentissage ; une comparaison des résultats du modèle avec des résultats de mesure au banc d’essais (n’ayant pas servi à

Enfin, nous appliquerons notre vision de l’apprentissage dans une situation concrète de développement d’un nouveau système de dialogue dans le domaine du dialogue Homme-Robot

* Les opérations entreprises par Pôle emploi à partir de juin 2015 pour mieux classer les demandeurs d’emploi dans la catégorie correspondant à leur situation effective ont, à

En ce moment c’est nous qui sommes les enfants spartiates et la Russie l’ilote ivre, et que l’on nous pardonne cette comparaison par laquelle nous ne vou­ lons en

In Azerbaijan, Switzerland aims to strengthen economic and financial policies and improve the quality of selected public services through capacity building in key

Les tâches d’apprentissage automatique sont devenues de plus en plus génériques, mais les algorithmes qui les traitent sont, de leur côté, de plus en plus