• Aucun résultat trouvé

IFT 1575

N/A
N/A
Protected

Academic year: 2022

Partager "IFT 1575"

Copied!
3
0
0

Texte intégral

(1)

1

IFT 1575

DEMO 9

Exercice 10.2-4

Déterminer si les affirmations suivantes sur la programmation dynamique sont vraies ou fausses, et justifier.

(a) La méthode de résolution utilise une relation récursive qui permet de trouver la politique optimale à l’étape n+1en utilisant la politique optimale à l’étape n.

(b) Si, a la fin de la procédure de résolution, une décision non optimale a été choisie par erreur, la procédure de résolution devra être réappliquée pour déterminer la nouvelle solution optimale (en partant de la solution non optimale), à partir des étapes suivantes.

(c) Une fois trouvée la politique optimale pour le problème, l’information nécessaire pour déterminer la politique optimale à une étape donnée est l’état à cette étape et la décision prise à l’étape précédente.

Exercice 10.3-2

Une étudiante n’a plus que 7 jours avant les examens dans ses 4 cours et elle veut utiliser son temps au mieux. Elle a besoin d’au moins un jour par cours, et elle ne révise qu’un cours par jour:

elle veut donc allouer 1, 2, 3 ou 4 jours par cours. Comme elle a eu récemment un cours de RO, elle décide d’utiliser la programmation dynamique pour maximiser le nombre de points qu’elle obtiendra à ses 4 cours. Elle a fait les estimations données par le tableau de la page suivante.

Exercice 10.3-2 (suite)

Cours

4 3

2 1

9 8

9 7

7 4

5 5

4 2

9 7

6 6

3

6 2

5 3

1

Points obtenus estimés Journée

de travail

(2)

2 Exercice 10.4-1

Un joueur de backgammon va jouer 3 parties

consécutives ce soir. Pour chaque partie, il pourra parier sur sa victoire un montant compris entre 0 et l’argent qu’il lui reste après le pari de la partie précédente. La probabilité de victoire est 0,5. Il commence avec 75 $ et la partie s’arrête quand il atteint exactement 100 $.

Il veut trouver une politique lui permettant de maximiser la probabilité d’atteindre 100$ après les 3 parties.

Résoudre ce problème par la programmation dynamique.

Exercice 12.2-8

Soit la fonction suivante:

f(x)=5x

1

+2x

22

+x

3

-3x

3

x

4

+4x

42

+2x

54

+x

52

+3x

5

x

6

+6x

62

+3x

6

x

7

+x

72

Montrer que cette fonction est convexe en l’exprimant comme une somme de fonctions (d’une ou de deux variables) convexes.

Exercice 12.2-10

Min Z=x

14

+2x

22

X

12

+x

22

>=2

(a) Utiliser l’analyse géométrique pour déterminer si le domaine réalisable est convexe.

(b) Utiliser l’algèbre et le calcul pour déterminer si le domaine réalisable est convexe.

Exercice 12.4-7

Max f(x)=32x1+50x2-10x22+x23-x14-x24 3x1+x2<=11

2x1+5x2<=16 x1>=0, x2>=0

Ignorer les contraintes et résoudre les deux problèmes à une variable et sans contraintes. Utiliser le calcul pour résoudre le problème en x1, puis la méthode de bisection (avec epsilon=0.001 et les bornes initiales égales à 0 et 4) pour résoudre le problème en x2.

Montrer que cette solution vérifie toutes les contraintes du problème et qu’elle est donc optimale.

(3)

3 Exercice 12.5-4

En partant du point (0,0), utiliser la méthode interactive du sous-gradient avec epsilon=0.3 pour obtenir une solution approchée pour le problème suivant, puis appliquer la routine automatique avec epsilon=0,001.

Max f(x)=6x1+2x1x2-2x2-2x12+2x22

Puis résoudre gradient f(x)=0 pour obtenir la solution optimale.

Références

Documents relatifs

Dans le cas d’un problème d’optimisation, la programmation dynamique identifie une politique optimale : une décision optimale à chaque étape pour chaque état

[1] Individual vaccination as Nash equilibrium in a SIR model: the interplay between individual optimization and societal policies Dans cette nouvelle approche au temps t l’individus

(a) La file d’attente est l’endroit, dans le système de file d’attente, où les clients attendent que leur service soit complété.. (b) Les modèles de file d’attente supposent

Leur mobilisation pour le contrôle de leurs luttes en toute indépendance de ceux qui comme Boric, les appellent « à  ne pas s’impatienter », à « des réformes graduelles »,

- Les élèves sélectionnent en testant toute au long de la séance 8, plusieurs façons de nager et d’entrer à l’eau, ce qu’ils savent/veulent faire. - En fonction de leur

à Le projet de la classe est de réaliser un album de monstre imitant la structure de « va-t’en grand monstre

D'autres travaux ont montré que certains enfants présentant des difficultés dans l'apprentissage du calcul manifestaient par ailleurs des troubles perceptivo-tactiles, notamment

(e) Pour pouvoir ˆ etre execut´ e, l’algorithme de Bellman-Ford doit ˆ etre ap- pliqu´ e ` a un graphe poss´ edant au moins un chemin entre la source et la destination, et ne pas