1
IFT 1575
DEMO 9
Exercice 10.2-4
Déterminer si les affirmations suivantes sur la programmation dynamique sont vraies ou fausses, et justifier.
(a) La méthode de résolution utilise une relation récursive qui permet de trouver la politique optimale à l’étape n+1en utilisant la politique optimale à l’étape n.
(b) Si, a la fin de la procédure de résolution, une décision non optimale a été choisie par erreur, la procédure de résolution devra être réappliquée pour déterminer la nouvelle solution optimale (en partant de la solution non optimale), à partir des étapes suivantes.
(c) Une fois trouvée la politique optimale pour le problème, l’information nécessaire pour déterminer la politique optimale à une étape donnée est l’état à cette étape et la décision prise à l’étape précédente.
Exercice 10.3-2
Une étudiante n’a plus que 7 jours avant les examens dans ses 4 cours et elle veut utiliser son temps au mieux. Elle a besoin d’au moins un jour par cours, et elle ne révise qu’un cours par jour:
elle veut donc allouer 1, 2, 3 ou 4 jours par cours. Comme elle a eu récemment un cours de RO, elle décide d’utiliser la programmation dynamique pour maximiser le nombre de points qu’elle obtiendra à ses 4 cours. Elle a fait les estimations données par le tableau de la page suivante.
Exercice 10.3-2 (suite)
Cours
4 3
2 1
9 8
9 7
7 4
5 5
4 2
9 7
6 6
3
6 2
5 3
1
Points obtenus estimés Journée
de travail
2 Exercice 10.4-1
Un joueur de backgammon va jouer 3 parties
consécutives ce soir. Pour chaque partie, il pourra parier sur sa victoire un montant compris entre 0 et l’argent qu’il lui reste après le pari de la partie précédente. La probabilité de victoire est 0,5. Il commence avec 75 $ et la partie s’arrête quand il atteint exactement 100 $.
Il veut trouver une politique lui permettant de maximiser la probabilité d’atteindre 100$ après les 3 parties.
Résoudre ce problème par la programmation dynamique.
Exercice 12.2-8
Soit la fonction suivante:
f(x)=5x
1+2x
22+x
3-3x
3x
4+4x
42+2x
54+x
52+3x
5x
6+6x
62+3x
6x
7+x
72Montrer que cette fonction est convexe en l’exprimant comme une somme de fonctions (d’une ou de deux variables) convexes.
Exercice 12.2-10
Min Z=x
14+2x
22X
12+x
22>=2
(a) Utiliser l’analyse géométrique pour déterminer si le domaine réalisable est convexe.
(b) Utiliser l’algèbre et le calcul pour déterminer si le domaine réalisable est convexe.
Exercice 12.4-7
Max f(x)=32x1+50x2-10x22+x23-x14-x24 3x1+x2<=11
2x1+5x2<=16 x1>=0, x2>=0
Ignorer les contraintes et résoudre les deux problèmes à une variable et sans contraintes. Utiliser le calcul pour résoudre le problème en x1, puis la méthode de bisection (avec epsilon=0.001 et les bornes initiales égales à 0 et 4) pour résoudre le problème en x2.
Montrer que cette solution vérifie toutes les contraintes du problème et qu’elle est donc optimale.
3 Exercice 12.5-4
En partant du point (0,0), utiliser la méthode interactive du sous-gradient avec epsilon=0.3 pour obtenir une solution approchée pour le problème suivant, puis appliquer la routine automatique avec epsilon=0,001.
Max f(x)=6x1+2x1x2-2x2-2x12+2x22
Puis résoudre gradient f(x)=0 pour obtenir la solution optimale.