Apprentissage automatique

(1)

Apprentissage automatique

(2)

Introduction

Programme informatique Données

Hypothèses/règles Solution

Utilisateur

Exemple:

- Calculer la moyenne des étudiants

- Mettre à jour le nombre de places disponibles sur un parking

Résoudre un problème pour lequel nous avons la solution.

(3)

Introduction

Que faire si nous ne connaissons pas la solution exacte?

Résoudre un problème pour lequel nous avons la solution.

3

Exemple:

- Reconnaître les chiffres saisis à la main à partir d’un scan - Jouer automatiquement aux échecs

- Créer des typologies de clients - Optimisation d’une tâche

- …

3 3

6 … … 6

…

(4)

L’apprentissage automatique (AA) (“Machine Learning - ML”) : croisement de plusieurs disciplines

︎

- Les statistiques : inférence de modèles en utilisant des données existantes.

- Les probabilités : modélisation du caractère aléatoire/stochastique des sources de données et du problème d’apprentissage

- L’intelligence artificielle : étudier des tâches simples (reconnaissance de formes par les humains) - représentation des connaissances

Introduction

?

senseur

"actionneurs AGEN

perceptio

ENVIRONNEME

"action

Modèle général pour l’IA : « agent intelligent »

L’AA permet la conception et/ou adaptation de l’agent par analyse automatisée (généralement statistique) de son environnement, et/ou du résultat de son action.

(5)

Introduction

Objectif: réduire l’erreur de prédiction

Solution connue?

Moyen: données expérimentales

Démarche: mettre en place un modèle de prédiction f(H,D) Historique

Données externes

prédiction PREDICTEUR

Exemple: Agent prédicteur

f(H,D)

(6)

L’apprentissage automatique (AA) (“Machine Learning - ML”) : croisement de plusieurs disciplines

︎

- L’optimisation : optimiser un critère de performance afin de - estimer des paramètres d’un modèle,

- déterminer la meilleure décision à prendre étant donné une instance d’un problème.

- L’informatique : programmer des algorithmes (complexité, mémoire, ressources, …)

Introduction

(7)

- Supervisé :

Types de problèmes en AA

Objet Label f(H,D) O1 L1

O2 L2

On Ln

… …

On+1 ?

Valeur cible

AS symbolique : méthodes inspirées de l’intelligence artificielle et dont les fondements reposent sur des modèles de logique, une représentation binaire des données (vrai/faux), et sur les méthodes de représentation des connaissances.

AS numérique : méthodes inspirées de la statistique, les données sont en général des vecteurs de réels, et les méthodes font intervenir des outils provenant des probabilités, de l’algèbre linéaire et de l’optimisation.

(8)

- Non supervisé :

Types de problèmes en AA

Objet Label f(H,D)

O1 ?

O2 ?

On ?

…

On+1 ?

Valeur cible

?

Il faut apprendre un modèle capable d’extraire les régularités présentes au sein des objets pour mieux visualiser ou appréhender la structure de l’ensemble des données.

(9)

- Par renforcement :

Types de problèmes en AA

On dispose d’un ensemble de séquences de décisions Sj (politiques ou stratégiques) dans un environnement dynamique, et pour chaque action ai de chaque séquence une valeur de récompense ri ( ).

Il faut apprendre un modèle capable de prédire la meilleure décision à prendre étant donné un état de l’environnement.

R_j = ∑

i r_i

ri: récompense de l’action ai

Rj: récompense de la séquence j

(10)

Types de problèmes en AA

- Semi-supervisé:

O2 ?

O3 L3

O4 ?

On ?

… …

On+1 ?

Valeur cible

Il faut tirer profit à la fois des données avec et sans valeurs cibles pour résoudre des tâches d’apprentissage supervisé ou non supervisé.

(11)

Types de problèmes en AA

- Actif:

O2 ?

O3 L3

O4 ?

On ?

… …

On+1 ?

Interroger l’utilisateur

On dispose d’un petit ensemble d’objets avec pour chacun une valeur cible associée ; il faut interagir avec l’utilisateur et lui demander de donner la valeur cible d’un nouvel objet afin de mieux apprendre le modèle de

prédiction

(12)

Paradigme d’apprentissage

Chaque paradigme se caractérise par :

Un modèle, le plus souvent paramétrique Une façon d’interagir avec l’environnement +

Une « fonction de coût » à minimiser (sauf exceptions) + Un algorithme pour adapter le modèle, +

en utilisant les données issues de l’environnement, de façon à optimiser la fonction de coût

(13)

Schéma général

Introduction L’apprentissage automatique

Formalisation du probl`eme

Etant donné un ensemble d’entraˆınement E, on cherche à déterminer f : X ! Y une fonction modélisant la relation entre les X décrits dans l’espace de représentation X et la variable cible Y :

f (X) = Y

En revanche, ne connaissant pas la vraie nature de la relation entre X et Y et les données observées en {X¹, . . . , X^p} étant soit bruitées, soit incomplètes ; il n’est pas raisonnable de supposer une relation

d´eterministe. Aussi, il est davantage raisonnable de poser le probl`eme en les termes suivants :

f (X) = Y + ✏ o`u ✏ est l’erreur ou le r´esidu.

Autrement dit, il s’agit d’approximer f en commettant le moins d’erreurs possibles sur E tout en faisant de bonnes pr´edictions pour des valeurs de X non encore observ´ees.

J. Ah-Pine (Univ-Lyon 2) Apprentissage automatique M2 DM 2018/2019 17 / 358

Schéma général

DATABASE (numerical data, texts,

images, networks, …)

FEATURE MATRIX

NUMERICAL REPRESENTA

TION

PROXIMITY MATRIX

CLASSIFI- -CATION OUTPUT

CLASSIFI- -CATION ASSESSMENT

CLASSIFI- -CATION ALGORITHM

Schéma général (suite)

Comme précisé précédemment, nous ne traitons pas dans ce cours du procédé permettant de représenter numériquement les données

complexes telles que les images, vid´eos, textes. . .

Partant d’objets complexes comme une image par exemple, il s’agit d’extraire des variables de l’ensemble des objets permettant de

repr´esenter ceux-ci au travers d’un vecteur de nombres. On parle d’extraction d’attributs (“features extraction”).

Ces procédés sont les champs d’expertises d’autres domaines que sont l’analyse d’images et le traitement automatique du langage naturel. . . Néanmoins, des outils sont disponibles et peuvent être utilisés même par des non experts.

Notre point de départ sera nécessairement soit une matrice de données de type table comme présenté précédemment soit une matrice carrée de dissimilarités ou de similarités entre objets (que nous étudierons ultérieurement comme pour le cas des svm).