• Aucun résultat trouvé

Reinforcement Learning et jeux vidéo

N/A
N/A
Protected

Academic year: 2022

Partager "Reinforcement Learning et jeux vidéo"

Copied!
1
0
0

Texte intégral

(1)

Reinforcement Learning et jeux vidéo

 

Ce projet a pour but de construire une IA logicielle pouvant jouer à des jeux vidéo d’arcade. Il faudra  adapter  une  méthode  d’apprentissage  simple  provenant  d’exemples  existant  vers  un  jeu  de  votre  choix.  

Phase 1 : Nous allons commencer par étudier le jeu Flappy Bird et les nombreux exemples disponibles : 

               

   Démos :  

o https://xviniette.github.io/FlappyLearning/  (Navigateur)  o https://www.youtube.com/watch?v=IYzL0SBp1QY  o https://www.youtube.com/watch?v=aeWmdojEJf0 

   Programmes / sources / algorithmes : 

o Version python : https://github.com/chncyhn/flappybird‐qlearning‐bot  o Version Javascript : https://github.com/xviniette/FlappyLearning   o Algorithmes : https://github.com/ssusnic/Machine‐Learning‐Flappy‐Bird 

 

Phase 2 : Choix d’un jeu / d’une plateforme / d’un objectif  

Le Reinforcement Learning peut s’appliquer à d’autres jeux : de Pong à Pacman mais aussi à d’autres  thématiques : apprentissage du déplacement sur un parcours, animation réaliste de personnages… 

       

Learning Driving      Learning Snooker Game  Le choix de la plateforme et du langage restent libres 

Références

Documents relatifs

Cela veut dire que la plupart des enfants que nous recevons dans le cadre d'une psychothérapie d’inspiration psychanalytique rapportent de plus en plus souvent des histoires qui

E3 promo 2020 Majeur Informatique ANNE-LOUISE Yohan MAVOUNGOU Steven. DRAGHI Léo

Dans le cadre de ce numéro, nous proposions de sortir du prisme de l’addiction – omniprésent dans la littérature scientifique sur les jeux d’argent – pour aborder cette

Il s’agit du jeu Tetris qui, encore aujourd’hui, est considéré comme le meilleur vendeur de tous les temps. Sorti en 1984, il dépasse les 500 millions d’exemplaires vendus,

To properly model the crawling environment as a Markov decision process (MDP), instead of considering each individual page as a state and each individual hyper- link as an action,

We model the execution of queries and updates as a Markov decision process whose states are database configurations, actions are configuration changes, and rewards are functions of

Lots of data sources can be seen as intensional: accessing all the data in the source (in extension) is impossible or very costly, but it is possible to access the data through

The reinforcement learning methods explained in Part II and Part III are categorized into the model-free approach, meaning that policies are learned without explicitly modeling