• Aucun résultat trouvé

Jeux dynamiques en information complète :

N/A
N/A
Protected

Academic year: 2022

Partager "Jeux dynamiques en information complète :"

Copied!
29
0
0

Texte intégral

(1)

Jeux dynamiques en information complète :

Propos liminaires :

Dans la plupart des situations économiques, les agents sont engagés dans un processus de décision dynamique.

Exemples :

Négociation entre un syndicat et sa direction pour une revalorisation salariale. Ce type de négociation a un aspect séquentiel, c.-à-d. que les salariés arrivent avec une offre, les représentant de la direction la consulte, font une contre-offre etc…

Concurrence sur un marché ayant une structure d’oligopole

Dans les jeux dynamiques : L’interaction se déroule sur plusieurs périodes, de manière séquentielle ou répétée.

Qu’est-ce qu’une stratégie dans un jeu dynamique ? Quand peut-on dire qu’une stratégie est crédible ?

Crédibilité d’une stratégie :

Exemple. Jeu de la grenade à deux étapes.

Supposez que le joueur 2 menace le joueur 1 de faire exploser la grenade s’il ne lui donne pas 1000 euros…

Le joueur 1 choisit d’abord de donner 1000 euros au joueur 2 ou de ne rien donner.

Le joueur 2 décide ensuite de dégoupiller ou non une grenade, la première option les tuerait tous les deux.

On est dans de l’information complète. On connait les préférences de notre adversaire.

Que doit faire le joueur 1 ? Dans la plupart des situations, le paiement qu’il aurait en faisant sauter la grenade est largement inférieur que l’inverse, donc la stratégie de faire sauter la grenade du joueur 2 n’est pas crédible.

Contenu :

Représentation sous forme extensive d’un jeu dynamique.

Rôle de l’information, parfaite ou imparfaite : Selon que les joueurs observent ce qui s’est passé dans le jeu jusqu’à leur tour.

(2)

Crédibilité : l’équilibre de Nash est insuffisant, ne permet pas d’écarter les stratégies basées sur des menaces non crédibles.

Analyse basée sur la rationalité séquentielle des joueurs : o Principe d’induction rétroactive et,

o Equilibre de Nash parfait en sous jeux (Selten, 1965).

Etude des situations de jeux répétés.

Plan :

1. Introduction

2. Représentation sous forme extensive o Exemples et définitions o Les stratégies

3. Résolution d’un jeu dynamique

o Information parfaite et principe d’induction rétroactive o Equilibre de Nash parfait en sous-jeux

4. Applications

o Jeu de révolution vs démocratisation o Autres applications

5. Jeux répétés

Représentation du jeu :

Pour la représentation d’un jeu, il faut connaître :

Les joueurs,

Les règles (les stratégies),

Les résultats possibles et,

Les fonctions de paiement.

Les résultats du jeu sont toujours fonction des stratégies adoptées par tous les joueurs.

A chaque étape, quel est le joueur qui agit ? Que sait-il ? Quelles sont les actions possibles ? La représentation du jeu : Arbre du jeu.

Dilemme du prisonnier à deux étapes :

Les deux suspects sont arrêtés et interrogés l’un après l’autre.

Le premier prisonnier décide de dénoncer ou non (première période).

Puis le second prisonnier, ayant observé la décision de l’autre, est confronté à la même décision.

(3)

Mêmes paiements mais la différence principale : la prise de décision intervient de manière séquentielle non simultanée.

Même sous forme dynamique, on regarde le joueur qui joue en dernier, on voit qu’il aura forcément intérêt à jouer C, donc le joueur 1 en anticipant que le joueur 2 va jouer C, va jouer C. Donc ce jeu garde la spécificité que (C, C) est la meilleure stratégie sous forme dynamique comme sous forme simultanée.

Représentation sous forme d’arbre :

Le jeu débute au niveau du nœud initial : spécifie quel est le premier joueur à agir (J1).

De ce nœud partent deux branches : nombre d’actions possibles pour J1.

Ces branches atteignent deux nœuds de décision intermédiaires, au niveau desquels J2 doit choisir son action.

Dans ce jeu, J2 sait en quel nœud il se situe (gauche ou droite).

 Jeu en information parfaite : Il a pu observer le choix de J1.

De chacun de ces nœuds partent encore deux branches, qui décrivent les actions possibles de J2.

Après le mouvement de J2, le jeu se termine.

J1

(4)

La fin est matérialisée par les nœuds terminaux.

Autant de nœuds terminaux que de résultats possibles (4).

Y figurent les paiements associés au résultat correspondant.

Jeu de la pièce à deux étapes :

J1 Commence par choisir le côté de la pièce qu’il veut présenter.

Puis J2 fait la même chose en ayant la possibilité de voir ce qu’a fait J1.

Information parfaite : tous les joueurs connaissent les actions passées, jouées par leurs adversaires lorsque leur tour arrive ; tous savent où ils se trouvent dans l’arbre.

Représentation ?

Le joueur 1 est désavantagé dans ce jeu.

Dans cette version simple de jeu, avec 2 étapes, on retombe dans un jeu simultané.

Remarque : Situation différente où un joueur ignore sa position dans l’arbre au moment de jouer.

Information imparfaite et ensemble d’information :

Supposons que lorsque c’est au tour de J2 de jouer, il ne peut observer le choix du joueur 1 (J1 cache la pièce avec sa main).

Représentation similaire à un détail près : ellipse incluant les deux nœuds de décision du J2.

(5)

(Il faut noter l’ellipse pour signifier que j2 ne sait pas où il se situe)

 Ensemble d’information de J2 qui ignore en lequel des nœuds exactement il se situe.

J2 dispose du même ensemble d’actions possibles en chacun des nœuds de son ensemble d’information.

Un ensemble d’information (EI), pour le joueur i est un sous ensemble des nœuds de décision de ce joueur.

La liste de tous les EI d’un joueur caractérise tous les évènements distinguables suite auxquels il va être amené à prendre une décision.

Dans les jeux à information parfaite (premier jeu de la pièce) : les EI sont des singletons c.-à-d.

contiennent un unique nœud de décision. Un ensemble d’information est confondu avec un nœud de décision.

- Dans ce jeu, quand le J1 a joué C, on est sur le nœud qui correspond à l’EI « le joueur 1 a joué C »

Dans les jeux à information imparfaite (deuxième jeu de la pièce) : Les EI de certains joueurs contiennent plusieurs nœuds de décision. Le joueur 2 a 2 nœuds de décision mais un seul ensemble d’information.

- Pour le J2, l’EI après le premier tour est simplement : « le joueur 1 a joué . ».

(6)

Remarque : On suppose que les joueurs ne peuvent oublier ce qu’ils ont su à un moment dans le jeu : mémoire parfaite.

Jeu d’entrée sur un marché :

Deux joueurs : La firme I et la firme E

La firme E peut choisir d’entrer (E) ou pas (N) sur le marché.

Si elle n’entre pas, elle ne retire aucun gain et la firme I obtient un paiement égal à 2.

Si la firme E décide d’enter, alors la firme I a le choix entre 2 actions :

Elle peut tolérer la nouvelle entrante et partager le marché (gain respectifs de 2 et 1),

Elle peut adopter une stratégie agressive de type guerre des prix (pertes de -3 et -1) Représentation sous forme extensive :

Précision : J1 ≡ FE donc le joueur 1 est le premier à jouer et J2 ≡ FI

(7)

On peut se dire que les paiements résultant de cette interaction entre les deux firmes vont dépendre de la conjoncture économique, donc ils vont dépendre de leurs décisions mais aussi d’un élément qui est inconnu des joueurs. Donc on va représenter ce même jeu mais en présence d’un aléa.

Prise en compte de l’aléa :

Jusqu’ici, situations où le résultat du jeu est entièrement et uniquement déterminé par les actions entreprises par les joueurs.

Possible que l’issue du jeu soit soumise à un aléa c.-à-d. à la survenue d’un évènement extérieur.

La conjoncture économique peut être soit bonne (B) soit mauvaise (M, on retire 1 à tous les paiements).

Le résultat du jeu est donc aléatoire.

Introduction d’un nouveau joueur dans le jeu : La nature. Représentation de cette incertitude par un troisième joueur, la Nature, qu’on fait généralement jouer en premier.

Ses « actions » sont décrites par une loterie avec probabilités fixées.

Description : 2 états de la nature {B, M} auxquels on associe une distribution de probabilité (μ, 1 – μ).

Comment décrire ce jeu ?

On reprend l’arbre, mais le premier joueur qui va jouer va être la nature :

(8)

On peut noter en espérance d’utilité : UFE(E, G) = -3.μ – 4(1-μ)

Jeu de signal :

Deux joueurs en interaction pour une transaction.

Le vendeur d’un bien propose un prix unitaire p ∈ {p1, p2}.

Puis le consommateur, ayant observé le prix, décide de la quantité à acheter q ∈ {q1, q2}.

Tous les joueurs ne connaissent pas les fonctions de paiement (u(.), ∏(.)) : incertitude sur la qualité du produit.

Description : Etats de la Nature Ω = {w1, w2}, et distribution de probabilité (μ, 1 – μ).

Le vendeur connaît toujours la qualité – le consommateur ne connaît jamais la qualité mais dispose de l’information ci-dessus.

Jeu à information incomplète transformé en jeu en information imparfaite :

Représentation de cette incertitude par un troisième joueur, la Nature, qu’on fait généralement jouer en premier.

Remarque : La structure du jeu est toujours de connaissance commune.

B(μ)

M(1-μ)

(9)

Donc ici 3 joueurs : N = {1, 2, 3}

X = {0, 1, …, 10} ensemble de nœuds de décision f(1) = 0 le nombre de nœuds successeurs au nœud 1.

f(0) = ∅ par ce que le nœud initial n’a pas de prédécesseur s donne les successeurs de tous les nœuds

Par exemple : s(4) = {5, 6}

T = {2, 3, 7, 8, 9, 10} les nœuds terminaux, qui n’ont pas de successeurs

Définition d’un jeu sous forme extensive :

J1 0

10 9 8 7

6 4 5

3 2

1

(10)

1/ Ensemble fini de joueurs N = {1, …, i,… n} , ensemble fini de nœuds X, ensemble fini d’actions A =

i=1 n

Ai.

2/ Fonction f : X  X U ∅ spécifiant le prédécesseur de chaque nœud x ;

f(x) est non vide pour tous les x ∈ X sauf un, le nœud initial x0. Les successeurs immédiats de x sont les s(x) = f-1(x). Ces ensembles sont supposés disjoints.

L’ensemble des nœuds terminaux est noté T = {x ∈ X/s(x) = ∅}. Tous les autres nœuds, dans X / T sont des nœuds de décision.

3/ Fonction α : X / {x0}  A donnant l’action qui conduit à n’importe quel nœud à partir de son prédécesseur f(.)

Propriété : si x’, x’’ ∈ s(x) et x’ ≠ x’’ alors α(x’) ≠ α(x’’).

Donc dans notre exemple α(7) = l et α(3) = B 2, 3 : α(2) différent de α(3)  A différent de B 4/ L’ensemble des choix disponibles au nœud x est : C(x) = {a ∈ A/a = α(x’) pour x’ ∈ s(x)}.

Exemple : c(4) = {a, b} (dans le jeu precedent).

Les choix disponibles en h : C(h) = {a ∈ A/a ∈ c(x) pour x ∈h}.

5/ Collection d’EI ψ et fonction h : X  ψ qui associe à chaque noeud x un EI h(x) ∈ ψ.

h(1) = h1

h(5) = h(6) = h56 donc ils appartiennent au même ensemble d’information dans notre jeu. C’est

l’information selon laquelle le joueur 2 a joué avant, il sait qu’il a le choix entre 2 stratégies a et b mais il ne peut distinguer quelle stratégie. Je ne peux donc pas baser ma propre action sur ce que l’autre joueur a fait. Ca veut dire que :

c(5) = c(6) = {l, r} les choix possibles dans ce nœud de décision sont simplement l et r.

Donc Tous les nœuds appartenant au même EI ont les mêmes choix disponibles : c(x) = c(x’) si h(x) = h(x’).

6/ Fonction Ԑ : ψ  {0, 1, …, i, …, n} associant à chaque EI le joueur (ou la Nature, joueur 0) qui doit agir aux nœuds de décision qui le composent.

(11)

Donc dans n’importe quel énoncé on doit voir la séquence des étapes dans le jeu, et associer à chaque étape le joueur qui joue.

Ici, le joueur associé au nœud de décision 1 c’est le troisième joueur  Ԑ(h1) = 3 de même, Ԑ(h56) = 3.

ψ i = {h ∈ ψ / i = Ԑ(h)} : collection des EI du joueur i.

Donc ψ 3 = {h1, h56}.

7/ Fonction ρ : ψ0 . A  [0, 1] donnant les probabilités associées aux actions de la nature et satisfaisant : ρ(h, a) = 0 si a ∉ C(h) et ∑a∈C(h) ρ(h, a)

= 1 pour tout h ∈ ψ0

8/ Collection de fonctions d’utilité VNM u = {u1, …, ui, … un}, ui : T ℝ, donnant le gain de chaque joueur pour tous les nœuds terminaux qui peuvent être atteints.

Aucune chance de devoir définir un jeu sous forme extensif à l’exam, mais comprendre ce que ça veut dire.

Définition d’une stratégie dans un jeu dynamique :

Règle de décision spécifiant ce qu’un joueur va « faire » dans n’importe laquelle des situations où il est appelé à agir.

 Une stratégie va associer à tous les ensembles d’informations une décision.

 Plan d’action qui indique comment un joueur prévoit de jouer en n’importe lequel de ses EI.

Notation : L’action entreprise par le joueur i à l’ensemble d’information m : ai(hm)

(12)

Définition d’une stratégie : exemple :

Remarque : Une stratégie spécifie souvent les actions jouées à des EI qui ne sont pas atteints au cours du jeu effectivement joué.

Exemple : Jeu de la pièce en information parfaite à deux joueurs , J2 joue en premier.

De combien de nœud de décision chaque joueur dispose-t-il ? il faut associer à chaque joueur l’ensemble des nœuds de décision qui lui correspond.

Pour le joueur 2, c’est jouer F ou jouer P, un seul nœud de décision. Il a 2 stratégies possibles.

Pour le joueur 1 : Il a deux nœuds de décision. Une stratégie pour le joueur 1 va spécifier une action lorsqu’il se situe à 1 nœud de décision, et spécifier aussi une action sur l’autre nœud.

La stratégie de J2 indique quelle est son action au nœud initial.

Deux stratégies possibles : jouer P ou jouer F.

Pour J1, une stratégie précise comment il joue (P et F) à chacun de ses deux EI.

C.-à-d. comment il joue si J2 joue F et comment il joue si J2 joue P.

(13)

Jeu de la pièce :

J1 a donc 4 stratégies possibles :

s11 : Jouer F si J2 joue F ; Jouer F si J2 joue P ; ou{F, F}

s12 : Jouer F si J2 joue F ; Jouer P si J2 joue P ; ou {F, P}

s13 : Jouer P si J2 joue F ; Jouer F si J2 joue P ; s14 : Jouer P si J2 joue F ; Jouer P si J2 joue P.

 L’action de J1 est conditionnée aux choix de J2.

Cela suppose de pouvoir observer sa décision : information parfaite.

Si J1 ne peut observer le choix de J2 : un seul EI et seulement deux stratégies possibles : jouer P ou jouer F.

Reprenons le même jeu mais supposons qu’on ne soit plus en information parfaite :

Ici il n’a que 2 stratégies possibles.

Stratégies, résultats et forme normale :

Tout profil de stratégies s = (s1, …, si, …, sn) est associé à un résultat du jeu (un suite de décisions prises par les joueurs). Dans le jeu de la pièce, un profil de stratégie : s = (s1, s2) par exemple = ({F, F}, F)

(14)

 Vecteur de gain générés par n’importe quel profil de stratégie.

Représentation possible sous la forme normale = forme condensée.

J2

J1 F P

{F, F} 1, -1 -1, 1

{F, P} 1, -1 1, -1

{P, F} -1, 1 -1, 1

{P, P} -1, 1 1, -1

Tout jeu sous forme extensive admet une représentation sous forme normale… à condition que les stratégies soient bien spécifiées.

Comment obtenir la solution d’un jeu dynamique ?

S’appuyer sur la notion de meilleure réponse : a priori, représentation sous forme normale et équilibre de Nash.

Jeu d’entrée sur un marché à deux joueurs : Firme I et firme E.

Exemple :

FI FE

A (si E) G (si E)

N (0, 2) (0, 2)

E (2,1) (-3, -1)

FE choisit d’abord d’entrer ou de rester extérieure au marché. Si elle n’entre pas, elle ne retire aucun gain et la firme I conserve son paiement (2).

(15)

Si FE décide d’entrer sur le marché, alors FI peut tolérer la nouvelle entrante, sans qu’il n’y ait aucune répercussion sur le prix (gains respectifs 2 et 1).

Ou bien, elle peut choisir de se lancer dans une guerre des prix : baisse du prix de marché (pertes -3 et -1)

Représentation sous forme normale : 2 équilibres de Nash (N, G si E) et (E, A si E).

Problème : (N, G si E) est une prédiction incorrecte. A la place de la firme E, je me dirais : supposons que j’entre, que va faire l’autre, ben il va accepter.

La stratégie de la firme I repose sur une menace non crédible.

Le concept d’équilibre de Nash est insuffisant car ne permet pas d’exclure les solutions basées sur des stratégies non crédibles.

L’induction rétroactive :

Méthode qui élimine les prédictions basées sur des stratégies non crédibles.

2 hypothèses :

1/ Rationalité séquentielle : La stratégie d’équilibre doit spécifier les actions optimales des joueurs en n’importe quel nœud de l’arbre.

Jeu précédent : La stratégie G si FE joue E n’est pas optimale pour FI : Si E entre effectivement, la stratégie optimale est A.

2/ Connaissance commune du fait que les joueurs vont se comporter de manière rationnelle à chaque nœud de décision.

Raisonnement dans un jeu (à horizon) fini :

1. On se place en n’importe lequel des nœuds qui précèdent les nœuds terminaux : la dernière étape.

Si le joueur i (décisionnaire en ce nœud) est rationnel, alors il va opter pour l’action qui est la meilleure pour lui  celle qui lui procure le gain le plus élevé.

Autant de fois que de nœuds de décision pour Ji.

2. Ensuite, on se place donc au niveau du nœud prédécesseur du (des) nœud(s) étudié(s) en 1/ : avant la dernière étape.

Etude du problème du joueur i – 1 jouant juste avant Ji

(16)

Le joueur i – 1 est capable d’anticiper correctement la réaction qui suivra son action.

Il sait que Ji est rationnel et donnera une meilleure réponse.

 Jeu réduit où le nœud considéré en 1/ devient terminal : on lui assigne le paiement associé à l’action choisie par i.

Solution = (E, A si E)

Dans ce jeu réduit Ji – 1 opte pour l’action la meilleure pour lui étant donné son anticipation.

Troisième étape (etc.) : On répète la procédure jusqu’à ce qu’on « remonte » au nœud initial.

Jeu d’entrée sur le marché :

On commence par se placer au nœud de décision de J2 (FI). Choix entre A et G : Il choisit A puisque 1

> -1.

On obtient ensuite un jeu réduit où le nœud de J2 devient un nœud terminal associé au paiement (2, 1).

Etude ensuite du problème de J1 (FE) : Sa stratégie optimale est E puisque 2 > 0.

La solution obtenue est le seul équilibre de Nash qui repose sur des menaces crédibles : (E, A si E).

(17)

Jeu abstrait à 3 joueurs :

Nœuds prédécesseurs des nœuds terminaux : ceux où J3 joue.

Détermination de la meilleure action de J3 en ces nœuds.

Ensuite, problème du joueur qui joue juste avant J3. D’abord J2 qui joue après J1 ou ne joue pas.

Enfin nœud initial pour déterminer la stratégie optimale du J1.

Quelle est la solution ?

Solution = {s1, s2, s3} = {( R), (a si R), (r si J1 joue L, r si J1 joue R et J2 joue a, l si J1 joue R et J2 joue b)}

Le joueur 3 a 3 stratégies solution parce qu’il a 3 ensembles d’informations.

Remarque : Cette solution correspond à un équilibre de Nash du jeu sous forme normale.

Le jeu du mille-pattes :

Stratégies de J2 = {a, d}

Stratégies de J1 = {Dα, Dδ, Aα, Aδ}

Solution = {( D, δ si J2 joue a si J1 joue A) ; (d)}

Situation où deux joueurs ont un intérêt mutuel à faire durer une relation alors qu’individuellement il existe un intérêt à l’arrêter.

Départ du dernier nœud de décision : Troisième étape où le J1 doit décider entre ses actions α et δ.

α

δ

(18)

Seconde étape où c’est au tour de J2 de décider s’il poursuit la relation (a) ou la stoppe (d) ; sachant ce que fera J1 s’il poursuit.

Remplacement du nœud de décision par le nœud terminal associé aux gains correspondants etc.

Remarque :

La solution obtenue par induction rétroactive est celle où la relation est interrompue dès la première étape par le J1.

Les deux auraient obtenu mieux en « coopérant » ou en s’engageant (par contrat) sur les stratégies jouées.

Cette absence de capacité à s’engager empêche d’atteindre la troisième étape où les gains sont strictement meilleurs pour les deux joueurs.

Théorème de Zermelo :

Représentation sous forme de programme d’optimisation :

Cadre simple d’un jeu à deux joueurs et deux étapes :

J1 choisit d’abord son action a1 dans l’ensemble des actions possibles A1.

J2 choisit ensuite sa propre action a2 dans son ensemble A2

Les gains sont égaux à u1(a1, a2) et u2(a1, a2).

Remarque 1 : L’ensemble des actions disponibles pour J2 peut dépendre de l’action choisie par J1 : A2(a1).

Remarque 2 : Description de nombreux problèmes économiques comme le duopole de Stackelberg ou le modèle de Leontieff etc.

(19)

Résolution par IR :

D’abord, étude du problème de J2 (seconde étape) :

(ça veut juste dire choisir la meilleure solution avec a1 donné comme on a vu avant).

Supposez que pour chaque a1 la solution de ce problème est unique

Fonction de réaction (meilleure réponse) : R2(a1).

Première étape : Remplacement de la stratégie de J2 par sa meilleure réponse dans le problème de J1 :

J1 est rationnel et peut anticiper que J2 rationnel jouera une meilleure réponse à n’importe laquelle de ses actions.

 Sous les bonnes propriétés, la solution du jeu (a1*, R2(a1*))

Avantages et inconvénient de l’IR :

L’IR permet de sélectionner les seuls équilibres de Nash basés sur des stratégies crédibles.

Méthode « intuitive » : connaissance commune de la rationalité (séquentielle) des joueurs.

 Possible d’anticiper à n’importe quelle étape (nœud), quelles seront les actions choisies ensuite.

Problème : Inopérante dès qu’on sort du cadre des jeux à information parfaite et à horizon fini.

Perfection en sous-jeux : extension de la méthode au-delà de cette classe de jeux dynamiques.

Principe :

Exploiter la propriété essentielle de l’IR :

Les stratégies d’équilibre du jeu de départ constituent un équilibre pour n’importe quelle partie – sous-jeu – du jeu complet.

La perfection en sous-jeux étant cette propriété pour les jeux dynamiques à information imparfaite.

Jeu d’entrée : Une fois que la firme E décide d’entrer, les deux firmes choisissent simultanément une stratégie parmi A et G.

(20)

Raisonnement :

Jeu en information imparfaite : à la dernière étape, FI ne sait pas en quel nœud de son ensemble d’information elle se situe.

Elle ne peut observer l’action choisie par FE…

De même FE ne peut observer le choix de FI : Jeu simultané intégré dans l’arbre du jeu.

Pour FE, deux nœuds de décisions, 4 stratégies possibles :

NE, A si E

NE, G si E

E, A si E

E, G si E

Pour FI, un seul ensemble d’information et deux stratégies : A e G.

Quel est le nombre d’équilibres de Nash ? On fait la représentation sous forme normale :

FI

FE

A G

N, A (0, 2) (0, 2)

N, G (0, 2) (0, 2)

E, A (3, 1) (-2, -1)

E, G (1, -2) (-3, -1)

3 équilibres de Nash : - ({N, A}, G) - ({N, G}, G) - ({E, A}, A)

(21)

Il y a des stratégies non crédibles parmi ces équilibres de Nash, comment les éliminer ? (équiliber de Nash en soius-jeu)

L’IR est inopérante : avant les nœuds terminaux, on ne trouve pas un nœud mais un ensemble d’information.

L’équilibre de Nash du jeu simultané (suivant l’entrée) est (1, A).

Les joueurs devraient anticiper qu’ils joueront A en suivant l’entrée, mais si c’est le cas, alors FE devrait entrer.

 La rationalité séquentielle suggère que seul (E, A si E ; A) est une prédiction raisonnable : équilibre de Nash parfait en sou-jeux.

FI FE

A G

A (3, 1) (-2, -1)

G (1, -2) (-3, -1)

Dans le sous-jeux, un seul équilibre de Nash = (A, A). Donc je sais que si FE rentre, ce qui va résultat c’est que chaque joueur va choisir la stratégie A, et les paiements vont être (3, 1). A partir de là, FE compare avec si elle n’entrait pas (paiement 0, 2) donc elle a intérêt à rentrer.

 Solution = (E, A si E ; A)

On peut noter que le seul équilibre de Nash qui a survécu est ({E, A}, A), les autres n’étant pas crédibles.

Sous jeu d’un jeu sous forme extensive :

 Les ensembles d’information ne peuvent être rompus.

Exemple : Jeu de l’entrée avec décisions simultanées après l’entrée.

(22)

2 sous jeux dont le jeu entier

Remarques :

Lien entre perfection en sou-jeux (PSJ) et IR :

Dans un jeu fini en information parfaite, tous les nœuds de décision sont associés à un sous jeu.

La solution calculée par IR est un EN parfait en sous jeu.

Elle a la propriété de continuer à être une solution de n’importe quel sous jeu qui compose le jeu entier.

Manière de raisonner avec la perfection en sous-jeux :

Etudié de manière isolé, n’importe quel sous jeu constitue un jeu à part entière.

 Recherche des équilibres de Nash dans chaque sous-jeu

Equilibre de Nash parfait en sous-jeux :

Exemple 2 : Application de la perfection en sous-jeux dans un jeu abstrait (entrée en information imparfaite).

(23)

Le jeu a 2 sous-jeux (dont le jeu entier). On va chercher les équilibres de Nash de tous les sous-jeux et retenir comme solution le profil de stratégie qui constitue un équilibre de Nash dans tous les sous- jeux. On commence par se demander quel est le nombre de stratégie dont dispose chaque joueur : Joueur 1 : 4 stratégies :

- E, T - E, B - X, T - X, B

Joueur 2 : 2 stratégies

- L

- R

On représente ce jeu sous forme normale :

J2

J1

L R

E, T 0, 1 3, 2

E, B -1, 3 1, 5

X, T 2, 6 2, 6

X, B 2, 6 2, 6

Jeu entier : 3 équilibre de nash : ({E, T}, R) ({X, T}, L) et ({X, B}, L

Maintenant on regarde le second sous jeu : C’est comme un jeu simultané ou chaque joueur a 2 choix possibles :

Joueur 2 Joueur 1

L R

T (0, 1) (3, 2)

B (-1, 3) (1, 5)

1 équilibre de nash en sous jeu : (T, R).

Equilibre de Nash parfait en sous jeu : Il nous faut identifier un profil de stratégie où pour le joueur 1 il y aura l’action jouer T, et pour le joueur 2 il faudra qu’il y ai R. On filtre parmi les 3 EN qu’on avait au départ, il nous reste seulement le premier ({E, T}, R). C’est le seul équilibre de Nash parfait en sous jeu.

Remarques :

(24)

L’équilibre de Nash PSJ permet de sélectionner les seuls équilibres de Nash raisonnables des jeux sous forme extensive.

Autrement dit, élimination des EN qui reposent sur des stratégies non crédibles, jouées dans certains sous-jeux…

C.-à-d. ceux qui ne se trouvent pas sur le « chemin » effectivement emprunté dans l’arbre ».

Détermination des ENPSJ : 2 approches

Déterminer les EN de tous les sous-jeux et sélectionner le profil de stratégies qui constitue un EN dans tous ces sous-jeux.

Résoudre de manière rétroactive :

o Partir de la « fin du jeu » et identifier les EN de chacun des sous-jeux finaux (qui ne renferment pas d’autres sous jeux).

o Sélectionner un EN et construire le jeu réduit où chaque sous-jeu est remplacé par les gains résultants des actions d’EN.

o Répéter les étapes 1 et 2 pour le jeu réduit.

Continuer jusqu’à ce que toutes les actions dans GE aient été déterminées.

Détermination des ENPSJ : Multiplicité :

Le profil de stratégies obtenu constitue un ENPSJ de GE.

Si aucun problème de multiplicité d’EN rencontrés lors de l’une quelconque des étapes ; le profil de stratégies est l’unique ENPSJ.

Si lors d’une étape, il y a une multiplicité d’EN, l’ensemble des ENPSJ est identifié en répétant la procédure pour tous les EN.

(25)

Théorèmes :

Acemoglu et Robinson (2006) :

Attention : la fin du cours est une application (complexe) disponible entièrement sur l’ent, et incomplète dans ce document.

(1)

δ c’est la proportion d’élite dans la population (< 0,5).

(2)

Taux * δ revenu des riches + taux * (1 – δ) revenu des pauvres = taux * revenu moyen

 t. δyR + t-1 – δ)yP = t ´y

Les joueurs sont intéresser uniquement par le revenu après taxe (ils cherchent à le maximiser).

(26)

(t – C(t)) ´y correspond au transfert.

Politique préférée des élites : tR = 0 puisque tout taux de taxe va se traduire par un transfert de ressource des élites vers le peuple (logique).

- Si taxe = 0, son revenu c’est yR

- Si elle choisi un taux de taxe positif son revenu c’est : (1 , t)yR + (t – C(t)) ´y Est-ce que yR > (1 , t)yR + (t – C(t)) ´y

0 > t( ´y – yR) – C(t) ´y

Donc avec les hypothèses qu’on a, forcément yR > ´y

Politique préférée du peuple : Max (1 – t)yP (t- C(t) ´y CPO : - yP + (1 – C’(t)) ´y = 0

 C’(t) =( ´y – yP) / ´y = ´y−(1−θ´y) 1−δ

´y

= θ−δ 1−δ

(3)

Graphique 8.

4 sous jeu dans ce jeu (4)

D’abord on se demande si la menace de révolution des citoyens est crédible.

Je dois comparer le revenu des pauvres lorsqu’ils font la révolution au revenu qu’ils auraient s’ils ne la faisaient pas (dans le cas ou l’élite ne choisit pas la démocratie naturellement).

VP(R, μ) < VP(yP / (tel que) tN = tR) si ceci est vérifié je n’ai jamais intérêt à faire la révolution.

Equation 1

On va supposer que μ ≤ 0 pour l’instant.

Le système démocratique le plus favorable pour eux c’est celui où l’élite s’engage à mettre un taux de taxe tP. VR(R, μ) = VP(yP / t N = tP) Paiement en faisant la révolution = paiement quand l’élite fait dictature mais choisis un taux tp.

Equation 2

Il faut voir maintenant sous quelles conditions le paiement suite à la démocratisation est supérieur sans révolution au paiement révolution.

Si μ < μ*  Aucun niveau de concessions ne permet à l’élite d’éviter la révolution. Dan ce cas là il est optimal de choisir la démocratie si :

Vp(R, N) < VP(yp / tp) Qui peut s’écrire

(27)

Equation 3

Donc premier équilibre de Nash parfait en sous-jeu : (D, R si N, N si D)

Le cours s’arrête ici, ce qui suit n’a pas été vu en cours cette année…

Version dynamique du modèle de Cournot :

Deux firmes se font concurrence (imparfaite) mais n’ont pas la même position dans l’industrie.

La firme 1 a une position de leader : firme qui a un rôle de précurseur en termes de politique industrielle, commerciale etc.

La firme 2 a une position de suiveur : Elle s’adapte aux décisions du leader.

Les décisions portent sur les quantités : la firme 1 joue en premier, la firme 2 en second.

Exemple : Position de General Motors dans l’industrie automobile US.

Le timing du jeu :

La firme 1 (leader) choisit la quantité à produire et offrir q1 ≥ 0.

La firme 2 (suiveur) observe la décision de la firme 1 et doit à son tour décide quelle quantité produire q2 ≥ 0.

La demande de marché s’exprime par : p(Q) = a – Q avec a ≥ 0 et Q la quantité demandé du bien.

Equilibre de marché : Q = q1 + q2.

L’objectif de chaque firme i est de maximiser ses profits :

i(qi, q- i) = (a – (qi + q- i))qi - cqi²

2 avec c > 0

Le problème :

Deux joueurs trouvent 1 euro et doivent décider d’un partage.

Chaque joueur est neutre au risque et actualise le futur à un taux exponentiel.

Si un joueur obtient x euro à la date t, la valeur actualisée de x à la date 0 sera δtx avec δ ∈ (0, 1), le facteur d’actualisation.

L’ensemble de toutes les divisions possibles est : D = {(x, y) ∈ [0, 1]² / x + y ≤ 1 }.

Jeu en 2 étapes : Le scénario :

(28)

Lors de la première étape, J1 fait une offre de partage (x1, y1) ∈ D.

J2 reçoit l’offre et décide soit de l’accepter soit de la rejeter.

S’il accepte l’offre, alors le jeu se termine et le résultat est (x1, y1).

S’il rejette l’offre, deuxième étape J2 fait une contre-offre (x2, y2) ∈ D.

Le J1 observe cette offre et décide de l’accepter ou de la refuser.

Si J1 accepte l’offre alors elle détermine le partage de l’euro et chaque joueur obtient le gain actualisé : (δx2, δy2).

Si les deux joueurs refusent l’offre qui leur est faite, alors le jeu se termine et le dollar est perdu, les gains sont (0, 0).

Résolution par IR.

Jeu d’offres / contre-offres répété n fois :

S’ils ne trouvent pas d’accord en seconde étape, alors troisième étape où J1 propose une nouvelle offre (x3, y3) ∈ D.

Si elle est acceptée par J alors chacun obtient le gain actualisé associé : (δ²x3, δ²y3).

Si J2 rejette l’offre alors nouvelle contre-offre (x4, y4) ∈ D etc.

Cela peut continuer jusqu’à l’étape 2n. S’ils ne se sont toujours pas entendus à cette date, le jeu se termine et l’euro est perdu.

Le problème :

Deux pays identiques, i = 1, 2.

3 types d’agents :

1 gouvernement décide d’une taxe sur les importations

1 firme produit un bien pour la consommation domestique et les exportations

Des consommateurs achètent le bien sur le marché national, alimenté par la firme nationale et la firme étrangère.

Le modèle :

Soit Qi la quantité total du bien disponible sur le marché du pays i.

Prix d’équilibre du marché : pi(Qi) = a – Qi.

La firme i produit une quantité hi destinée au marché domestique et ei pour les exportations : Qi = hi et ej.

Elle supporte un coût de production unitaire constant c < a et la taxe sur les importations imposée par le gouvernement j : taux unitaire tj.

Le timing :

D’abord les gouvernements choisissent simultanément les taxes {ti, tj}.

Ensuite, les firmes observent les taux de taxe et décident simultanément quelle paie {hi, ei} produire.

(29)

Les fonctions de gain sont le profit pour les firmes et le bien-être social pour les gouvernements.

Bien-être social : somme du profit, du surplus des consommateurs et du revenu fiscal.

_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _

_ _ _ _

Références

Documents relatifs

JEUX DE SOCIÉTÉ Jeux de société. Jeux

[r]

Pour déterminer les équilibres en stratégies mixtes, remarquons d’abord qu’il n’y a pas d’équilibre dans lequel un joueur joue une stra- tégie pure et l’autre joue

[r]

Bordures crées par The 3AM Teacher Teacher http://the3amteacher.blogspot.com/. Jeux mathématiques Jeu x

Complète la règle du jeu et le matériel pour que le jeu soit équitable mais qu’il y est une petite probabilité que les 2 joueurs perdent2. Nombre de joueurs

Vous ne fêtez pas vraiment Halloween mais vous désirez tout de même marquer le coup avec une soirée thématique, voici une liste pour organiser une soirée jeux de société

Pour toutes les manipulations, nous conseillons de respecter les consignes données fiche par fiche mais surtout de faire construire chaque tapis en posant tout d’abord les réglettes