• Aucun résultat trouvé

1. Ce probl` eme g´ en´ eralise un exemple vu en classe, au Chapitre 4. On a le syst` eme lin´ eaire x

N/A
N/A
Protected

Academic year: 2022

Partager "1. Ce probl` eme g´ en´ eralise un exemple vu en classe, au Chapitre 4. On a le syst` eme lin´ eaire x"

Copied!
2
0
0

Texte intégral

(1)

IFT-6521: PROGRAMMATION DYNAMIQUE Hiver 2015

Prof. Pierre L’Ecuyer

DEVOIR 3

Devoir ` a remettre le lundi 9 mars 2015, au d´ ebut du cours, 9h30. DPOC d´ esigne le livre de Bertsekas, “Dynamic Programming and Optimal Control”. Dans chaque cas, il est impor- tant de bien d´ efinir (math´ ematiquement et clairement) tous les symboles utilis´ es. Dans la correction, les explications claires et d´ etaill´ es comptent davantage que les r´ esultats.

1. Ce probl` eme g´ en´ eralise un exemple vu en classe, au Chapitre 4. On a le syst` eme lin´ eaire x

k+1

= A

k

x

k

+ B

k

u

k

, k = 0, 1, . . . , N − 1,

o` u x

k

et u

k

sont des vecteurs de dimensions n et m, les A

k

sont des matrices n × n connues, et les B

k

sont des matrices al´ eatoires ind´ ependantes n × m de lois de probabilit´ e connues qui ne d´ ependent pas de (x

k

, u

k

). Chaque u

k

peut ˆ etre choisi dans R (aucune contrainte) apr` es avoir observ´ e le vecteur x

k

.

On veut maximiser E [U (c

t

x

N

)] o` u c est un vecteur connu et U est une fonction d’utilit´ e concave et deux fois continument diff´ erentiable, telle que

− U

0

(y)

U

00

(y) = a + by.

Montrez que la d´ ecision u

k

optimale est une fonction lin´ eaire de x

k

pour chaque k (i.e., dans la politique optimale, chaque µ

k

est une fonction lin´ eaire).

Suggestion: R´ eduire le probl` eme ` a un probl` eme en une dimension via un changement de variable de la forme y

k

= c

t

A

N−1

· · · A

k

x

k

pour l’´ etat, et quelque chose de semblable pour la d´ ecision, puis utiliser les r´ esultats de la section 4.3 de DPOC.

2. DPOC (2005), Exercice 4.29. Remplacez 5.1 par 4.5.1 dans la question.

3. DPOC (2005), Exercice 5.14.

4. Vous disposez d’un montant initial x

0

> 0 ` a investir, sur une p´ eriode de N mois. Apr` es k mois, pour k = 0, . . . , N − 1, votre capital est x

k

et vous d´ ecidez d’un montant u

k

` a investir dans des actifs risqu´ es. Ce montant doit satisfaire 0 ≤ u

k

≤ x

k

. Avec probabilit´ e p > 1/2, le montant investi devient (1 + c)u

k

au d´ ebut du moins suivant, et avec probabilit´ e 1 − p il devient (1 − d)u

k

, o` u c et d sont des constantes positives telles que pc > (1 − p)d. Votre objectif est de maximiser E [ln x

N

], votre utilit´ e esp´ er´ ee apr` es N ´ etapes, en supposant que votre fonction d’utilit´ e est logarithmique.

Prouvez (pensez ` a l’induction) que la politique optimale est d´ efinie par u

k

= bx

k

et que la fonction d’utilit´ e esp´ er´ ee optimale ` a partir de l’´ etape k est

J

k

(x

k

) = C

k

+ ln x

k

(2)

o` u

b = (pc − (1 − p)d)

cd et C

k

= (N − k)[p ln(1 + cb) + (1 − p) ln(1 − db)]

pour k = 0, . . . , N − 1. Selon cette politique, on investit toujours une fraction constante de

notre capital, et cette fraction b ne d´ epend pas du num´ ero d’´ etape.

Références

Documents relatifs

(Les deux ´ equations du syst` eme sont repr´ sentables graphiquement ` a l’aide de droites. Comme le syst` eme n’admet pas de solution, il n’y a pas d’intersection entre

Pour des raisons techniques, si, un jour donn´ e, on utilise le hangar H, le lendemain on r´ eutilisera ce mˆ eme hangar avec une probabilit´ e de 0, 5 et si, un jour donn´ e,

Exercice 3 : Sens de variation d’une fonction homographique.. Soient a, b, c, d quatre nombres r´ eels

Obligatoires : copies s´epar´ees pour chaque partie ; num´erotation des copies de 1/n `a n/n ; votre nom sur chaque copie ; num´erotation des questions ; r´esolution dans l’ordre

Toutes les justifications doivent figurer sur votre copie, mais la r´edaction doit rester sobre.. Vous pouvez admettre un r´esultat, `a condition de le signaler

Q6

Pour terminer cet exemple par une synth`ese, observons que nous sommes parvenus `a r´ecrire le probl`eme d’optimisation initial sous la forme d’un syst`eme lin´eaire augment´e

Mˆeme si les m´ethodes pr´esent´ees ci-dessus permettent de ramener de mani`ere syst´ematique n’importe quel probl`eme d’optimisation lin´eaire sous forme g´en´erale en