Récemment recherché

Aucun résultat trouvé

Étiquettes

Aucun résultat trouvé

Document

Aucun résultat trouvé

Accueil Écoles Thèmes

Connexion

Apprentissage orienté agent (Master 2)

Partager "Apprentissage orienté agent (Master 2)"

N/A

N/A

Protected

Année scolaire: 2022

Info

Protected

Academic year: 2022

Partager "Apprentissage orienté agent (Master 2)"

Copied!

1

0

0

1

0

0

Chargement.... (Voir le texte intégral maintenant)

Télécharger maintenant ( 1 Page )

Texte intégral

(1)

Apprentissage orienté agent (Master 2)

Bruno Bouzy 3 octobre 2018

Plan du cours d’ « Apprentissage orienté agent » donné en Master MI, 2ème année, spécialité Informatique, UE MMD3E313, année 2018-2019.

Apprentissage par renforcement (3 ou 4 séances)

Multi-Armed Bandit (MAB) problem. Evaluation d'une action.

Processus Décisionnel de Markov (PDM) Programmation dynamique (Value Iteration)

Apprentissage tabulaire en ligne (TD Learning, Q Learning)

Apprentissage en ligne avec approximation de V ou Q par un réseau de neurones.

Apprentissage multi-agent (1 à 2 séances)

Théorie des jeux

Compétition et coopération Jeux matriciels répétés

Apprentissage et recherche arborescente (1 séance)

Minimax - Alfa-béta

Monte-Carlo Tree Search (MCTS)

Références

Bruno Bouzy http://www.math-info.univ-paris5.fr/~bouzy/Doc/AA2/

Richard Sutton, Andrew Barto, Reinforcement Learning, MIT Press, 1998.

A. Cornuéjols, L. Miclet, Apprent. artificiel, Concepts et Algorithmes, Eyrolles, 2002.

Martin Osborne, An Introduction to Game Theory, Oxford University Press, 2003.

Références

Télécharger maintenant ( PDF - 1 Page - 70.88 KB )

Documents relatifs

Master 2 Ingénierie Mathématique Apprentissage Statistique

Pour la régression logistique multinomiale (la variable y plus de 2 modalités), utiliser la fonction multinom du package

UPEC Master Droit du numérique en apprentissage Parcours Informatique et Droit

Le parcours « Informatique et Droit », de la mention « Droit du numérique » du master « Droit » s'adresse aux candidats titulaires d'une licence de Droit, d'une part,

UPEC Master Droit du numérique en apprentissage Parcours Informatique et Droit

Le diplôme forme des juristes spécialisés en droit du numérique ayant acquis suffisamment de technicité dans les sciences du numérique pour pouvoir dialoguer efficacement

Mémoire de Master 2 APIESS - Année 2018/2019 -

Je voudrais me réinscrire à un atelier Je vais parler de l’atelier autour de moi J’ai envie de m’impliquer dans le projet de la future Cuisine commune.. Merci beaucoup de

Master 2 Recherche Apprentissage Statistique et Optimisation

I Combinaison d’entit´ es simples: arbitrairement complexe pourvu que les entit´ es ne soient pas lin´ eaires. I Le r´ eseau est une fonction de redescription des

Master 2 Recherche Apprentissage Statistique et Optimisation

I Une description trop pauvre ⇒ on ne peut rien faire.. I Une description trop riche ⇒ on doit ´ elaguer les

Master 2 Recherche Apprentissage Statistique et Optimisation

Objectifs: Apprentissage supervis´ e, non supervis´ e, fouille de donn´

Master 2 Recherche Apprentissage Statistique et Optimisation

I Combinaison d’entit´ es simples: arbitrairement complexe pourvu que les entit´ es ne soient pas lin´ eaires. I Le r´ eseau est une fonction de redescription des

Téléchargez tous les documents en téléchargeant vos documents d'étude.

Votre document sera enrichi, partagé sur 123dok FR pour vous aider à étudier.

Documents relatifs

Hodler et l'Allemagne

Hodler et l'Allemagne

1

0

0

Attentes de qualité et structuration des filières alimentaires : la segmentation du marché urbain des huiles de palme rouges en Côte d'Ivoire

Attentes de qualité et structuration des filières alimentaires : la segmentation du marché urbain des huiles de palme rouges en Côte d'Ivoire

7

0

0

Apprentissage par renforcement

Apprentissage par renforcement

67

0

0

Apprentissage par renforcement

Apprentissage par renforcement

96

0

0

Apprentissage automatique M1

Apprentissage automatique M1

1

0

0

Apprentissage par renforcement (1a/3)

Apprentissage par renforcement (1a/3)

6

0

0

Apprentissage par renforcement (3)

Apprentissage par renforcement (3)

15

0

0

Apprentissage par renforcement (3)

Apprentissage par renforcement (3)

11

0

0