• Aucun résultat trouvé

IFT-6521: PROGRAMMATION DYNAMIQUE Hiver 2015

N/A
N/A
Protected

Academic year: 2022

Partager "IFT-6521: PROGRAMMATION DYNAMIQUE Hiver 2015"

Copied!
1
0
0

Texte intégral

(1)

IFT-6521: PROGRAMMATION DYNAMIQUE Hiver 2015

Prof. Pierre L’Ecuyer

DEVOIR 1

Devoir ` a remettre le lundi 26 janvier 2012, 9h30, au d´ ebut du cours. Les num´ eros indiqu´ es sont ceux des notes de cours. Les devoirs doivent ˆ etre faits individuellement: un devoir par

´

etudiant. Le plagiat ne sera pas tol´ er´ e.

Dans chaque cas, il est important de bien d´ efinir (math´ ematiquement et clairement) tous les symboles utilis´ es, par exemple pour l’´ etat et les d´ ecisions ` a chaque ´ etape, et les ´ equations de r´ ecurrence de la PD. Dans la correction, les explications claires et d´ etaill´ es comptent davantage que les r´ esultats.

1. Revenons ` a l’exemple de gestion d’inventaire du chapitre 1 de mes transparents, intro- duction, pages 37 ` a 42 (D. Taillant ` a Loinville), pour le cas o` u C = 0. Supposons que le coˆ ut d’achat par unit´ e est une variable al´ eatoire C

k

` a l’´ etape k (au lieu d’une constante c).

Les C

k

’s sont des variables al´ eatoires ind´ ependantes et C

k

n’est connu qu’au moment (juste avant) de faire la commande, au d´ ebut de la p´ eriode k. D´ efinissez l’´ etat et formulez les

´

equations de r´ ecurrence.

2. Pour ce mˆ eme exemple de gestion d’inventaire dans les notes, supposons que les inventaires n´ egatifs ne sont pas permis (si une demande arrive et qu’il n’y a plus de stock, la demande est perdue), et que le niveau d’inventaire ne peut pas d´ epasser B = 20. On suppose que la demande ω

k

` a chaque p´ eriode suit une loi de Poisson de moyenne λ = 3. On a aussi C = 4, c = 2, v = 5, r

k

(x) = max(0, x − 5)/4, −g

N

(x) = 0.8x, et N = 6.

Calculez la valeur optimale J

k

(x) et la politique optimale µ

k

(x) pour k = N, . . . , 0 et 0 ≤ x ≤ 20. Il est important de bien expliquer votre algorithme et vos r´ esultats. Vous pouvez

´

ecrire un programme pour faire les calculs et imprimer les r´ esultats, dans le langage que vous voulez. Envoyez une copie du programme par courriel avant l’heure de remise du devoir (le programme ne sera pas corrig´ e comme tel, mais pourra servir ` a v´ erifier ce que vous avez fait.

3. DPOC (2005), Exercice 1.7. Il faut faire une preuve dans chacun des deux cas.

4. DPOC (2005), Exercice 1.10.

5. DPOC (2005), Exercice 1.26, avec les modifications suivantes. ` A chaque ´ etape, on peut

acheter 1 ou 2 unit´ es, ou vendre 1 ou 2 unit´ es, ou ne rien faire. Le coˆ ut de transaction est

c

1

pour 1 unit´ e et c

2

pour 2 unit´ es, avec c

1

≤ c

2

≤ 2c

1

. En (a), la politique optimale n’aura

plus n´ ecessairement la forme propos´ ee mais aura sans doˆ ute une forme semblable. Trouvez

quelle est cette forme et prouvez-le. R´ epondez seulement aux questions (a) (modifi´ ee), (d)

et (e).

Références

Documents relatifs

méthodes avec return et méthodes de type void - Programmation orientée objet (POO) : niveau simple.. premier concept de la POO

• Ces attributs affectent toutes les cellules de Ces attributs affectent toutes les cellules de la ligne.

– Décrire les fonctions et particularités – Décrire les différents éléments Comment. // le reste de la ligne est ignoré /* un commentaire sur

• Ainsi on pourra définir plusieurs objets d’une classe automobile, comme par exemple l’auto à Paul qui est rouge, possède quatre portes, etc. Définition d’un

[r]

• que le mot de passe comporte au moins 6 caract` eres tels que d´ efinis ci-haut, dont au moins un chiffre, au moins une minuscule et au moins une majuscule. • que l’adresse

/* cette méthode permet de déterminer et de retourner le cercle ayant le rayon le plus grand entre le cercle courant et un autre cercle */. public Cercle plusGrand

Dans object, cette méthode compare selon la référence car les auteurs de cette méthode ne savent rien sur les classes créées plus tard pour comparter le contenu de deux objets.