• Aucun résultat trouvé

Apprentissage orienté agent (Master 2)

N/A
N/A
Protected

Academic year: 2022

Partager "Apprentissage orienté agent (Master 2)"

Copied!
1
0
0

Texte intégral

(1)

Apprentissage orienté agent (Master 2)

Bruno Bouzy 3 octobre 2018

Plan du cours d’ « Apprentissage orienté agent » donné en Master MI, 2ème année, spécialité Informatique, UE MMD3E313, année 2018-2019.

Apprentissage par renforcement (3 ou 4 séances)

Multi-Armed Bandit (MAB) problem. Evaluation d'une action.

Processus Décisionnel de Markov (PDM) Programmation dynamique (Value Iteration)

Apprentissage tabulaire en ligne (TD Learning, Q Learning)

Apprentissage en ligne avec approximation de V ou Q par un réseau de neurones.

Apprentissage multi-agent (1 à 2 séances)

Théorie des jeux

Compétition et coopération Jeux matriciels répétés

Apprentissage et recherche arborescente (1 séance)

Minimax - Alfa-béta

Monte-Carlo Tree Search (MCTS)

Références

Bruno Bouzy http://www.math-info.univ-paris5.fr/~bouzy/Doc/AA2/

Richard Sutton, Andrew Barto, Reinforcement Learning, MIT Press, 1998.

A. Cornuéjols, L. Miclet, Apprent. artificiel, Concepts et Algorithmes, Eyrolles, 2002.

Martin Osborne, An Introduction to Game Theory, Oxford University Press, 2003.

Références

Documents relatifs

Pour la régression logistique multinomiale (la variable y plus de 2 modalités), utiliser la fonction multinom du package

Le parcours « Informatique et Droit », de la mention « Droit du numérique » du master « Droit » s'adresse aux candidats titulaires d'une licence de Droit, d'une part,

Le diplôme forme des juristes spécialisés en droit du numérique ayant acquis suffisamment de technicité dans les sciences du numérique pour pouvoir dialoguer efficacement

Je voudrais me réinscrire à un atelier Je vais parler de l’atelier autour de moi J’ai envie de m’impliquer dans le projet de la future Cuisine commune.. Merci beaucoup de

I Combinaison d’entit´ es simples: arbitrairement complexe pourvu que les entit´ es ne soient pas lin´ eaires. I Le r´ eseau est une fonction de redescription des

I Une description trop pauvre ⇒ on ne peut rien faire.. I Une description trop riche ⇒ on doit ´ elaguer les

Objectifs: Apprentissage supervis´ e, non supervis´ e, fouille de donn´

I Combinaison d’entit´ es simples: arbitrairement complexe pourvu que les entit´ es ne soient pas lin´ eaires. I Le r´ eseau est une fonction de redescription des