• Aucun résultat trouvé

CONTENU R´ef´erencessecondaires R´ef´erencesdebase Pr´erequis Objectifsg´en´eraux http://www.iro.umontreal.ca/~lecuyer/ift6521.html IFT-6521PROGRAMMATIONDYNAMIQUE

N/A
N/A
Protected

Academic year: 2022

Partager "CONTENU R´ef´erencessecondaires R´ef´erencesdebase Pr´erequis Objectifsg´en´eraux http://www.iro.umontreal.ca/~lecuyer/ift6521.html IFT-6521PROGRAMMATIONDYNAMIQUE"

Copied!
2
0
0

Texte intégral

(1)

D´epartement d’informatique et de Hiver 2015 recherche op´erationnelle (IRO)

IFT-6521

PROGRAMMATION DYNAMIQUE

http://www.iro.umontreal.ca/~lecuyer/ift6521.html Prof. Pierre L’Ecuyer, bureau AA-3361

Objectifs g´en´eraux

Ce cours vise `a ´etudier les algorithmes et outils math´ematiques servant `a analyser ou `a optimiser des processus de d´ecision s´equentiels, pour lesquels il y a interaction entre les d´ecisions, dans un environnement certain ou incertain. On verra comment implanter les algorithmes de calcul et on

´

etudiera leur performance. Dans plusieurs cas on pourra d´emontrer certaines propri´et´es caract´erisant la forme d’une politique optimale. On examinera aussi des exemples d’applications tir´ees de diff´erents domaines, incluant la gestion et la finance.

Pr´erequis

Connaissances de base en probabilit´es et en optimisation.

R´ef´erences de base

• D. P. Bertsekas, Dynamic Programming and Optimal Control, Vol. 1 et 2, Athena Scientific, Belmont, Mass., 2005 et 2012. Disponible `a la librairie de l’U. de M. au pavillon principal, ou sur Internet.

Site web du livre: http://www.athenasc.com/dpbook.html. On utilisera surtout le volume 1, tr`es peu le volume 2.

R´ef´erences secondaires

• E. V. Denardo,Dynamic Programming: Models and Applications, Prentice-Hall, 1982.

• M. L. Puterman, Markov Decision Processes: Discrete Stochastic Dynamic Programming, Wi- ley, New York, 1994.

• W. B. Powell,Approximate Dynamic Programming, Wiley, New York, 2007.

• P. Glasserman, Monte Carlo Methods in Financial Engineering, Springer-Verlag, 2004.

CONTENU

1. Introduction. Processus de d´ecision s´equentiels. Mod`eles d´eterministes et stochastiques.

D´efinition de l’´etat. ´Equations de r´ecurrence. Horizons finis et infinis, avec et sans actualisation. La mal´ediction des grandes dimensions. Exemples.

2. Mod`eles d´eterministes en temps discret. Prototype: recherche du plus court chemin dans un r´eseau. Mod`ele d´eterministe sur horizon fini. ´Equations de r´ecurrence. Diff´erents algorithmes et comparaisons. Commande optimale en temps continu: aper¸cu.

1

(2)

3. Mod`eles stochastiques sur horizon fini et en temps discret. Processus de d´ecision Markoviens sur horizon fini. ´Equations de r´ecurrence et r´esolution. Mod`eles `a ´etat partiellement observ´e. Approximations et strat´egies sous-optimales. Examples divers.

4. Horizon infini avec actualisation. Mod`eles en temps discret et en temps continu (renouvelle- ment Markovien). Algorithmes de calcul: it´eration des valeurs, it´erations des politiques, m´ethodes hybrides, programmation lin´eaire. Applications contractantes. Conditions de convergence et vitesses de convergence.

5. Horizon infini avec coˆut moyen. Mod`eles et hypoth`eses. Stabilit´e. Conditions d’optimalit´e.

Algorithmes de calcul.

6. Autres aspects (selon le temps disponible). M´ethodes d’aggr´egation adaptatives. Al- gorithmes parall`eles. Discr´etisations et approximations pour les espaces d’´etats ou les espaces de d´ecisions continus. M´ethodes utilisant la simulation. Jeux dynamiques. Etc.

Evaluation´

Examen partiel: 25%

Travail final: 25%

Devoirs individuels: 50%

Horaire

Lundi9:30–11:20 salleZ-300;

mercredi, 11:30–13:20, salleZ-305.

Pavillon McNicol.

D´ebute le mercredi 7 janvier.

2

Références

Documents relatifs

[r]

Déterminer une représentation paramétrique de la droite (AB).. Les droites (AB) et (EF )

La premi`ere loi de Newton d´efinit les r´ef´erentiels d’inertie comme ceux o`u, en l’absence de force, la particule est, soit immobile, soit en MRU ; autrement dit, avec la

On peut le projeter dans

Pour autant, une amplitude d’une dizaine de mètre s’ajoutant ou se retranchant aux 6

Deen, Analysis of transport phenomena, Oxford University Press, New York, 1998.. Roulet, Physique statistique, Hermann,

D’un point A ext´ erieur aux deux cercles et du cˆ ot´ e des x n´ egatifs, on m` ene deux droites D et D 0 tangentes au cercle de centre O qui coupent le cercle de centre O 0 en

• Attention aux autres manuels. La plupart des manuels classiques d´eveloppent le mod`ele de r´egression simple et le mod`ele de r´egression multiple sous les hypoth`eses suivantes: