• Aucun résultat trouvé

Jeu séquentiel à information complète et parfaite

Chapitre 3 : Jeux dynamiques à information complète

3.2.   Jeu séquentiel à information complète et parfaite

Dans un jeu séquentiel à information complète et parfaite, les joueurs jouent à tour de rôle. Au moment de choisir, chaque joueur connaît parfaitement l’histoire du jeu. La méthode de récurrence vers l’amont (Backward Induction) permet de trouver la séquence optimale du jeu.46

3.2.1. La procédure de Récurrence vers l'amont (Backwards induction)

Pour un jeu dynamique à information complète et parfaite, l'issue du jeu peut être déterminé par la méthode de la récurrence vers l'amont.47 Pour montrer cela, considérons le jeu suivant :

- Le joueur 1 choisit une action a1 de l'ensemble A1 ;

- Le joueur 2 observe a1, l’action choisie par le joueur 1 et choisit à son tour une action a2 de l’ensemble A2 ;

- Le jeu s'arrête et le paiement de deux joueurs est donné par les fonctions u1

(

a1,a2

)

et u2

(

a1,a2

)

.

Plusieurs modèles correspondent à cette classe de jeu comme par exemple le modèle de duopole de Stackelberg (1934). Au moment de jouer, le joueur 2 observe l’action a1 choisie par le joueur 1. Il choisit une action a2 qui soit la meilleure réponse à a1 et est donc la solution du programme suivant :

(

1 2

)

2 ,

Max

2 2

a a u

A a

46 Voir K. Binmore pour une discussion critique de la relation entre rationalité et méthode de récurrence vers l’amont.

47 Remarquons que nous n'avons pas utilisé le concept d'équilibre de Nash, car la méthode de récurrence vers l'amont n'est pas définie en termes de stratégies mais en termes d'actions.

En supposant, pour simplifier, que cette meilleure réponse est unique, on a donc

( )

1

2

*

2 MR a

a = .48 Etant dans un cadre d'information complète, le joueur 1 connaît u2

(

a1,a2

)

la fonction de paiement du joueur 2 et sait qu'il est rationnel. Le joueur 1 peut donc anticiper

( )

1

2 a

MR la meilleure réponse du joueur 2. Il intégrera donc MR2

( )

a1 dans son programme.

De ce fait, le joueur 1 choisit son action qui soit la solution du programme suivant :

( ) (

1 2 1

)

1 ,

Max

1 1

a MR a u

A a

En supposant encore que ce problème de maximisation n'admette qu'une seule réponse a1*, alors

(

2

( )

1*

)

*

1,MR a

a est l'issue du jeu selon la méthode de Récurrence vers l'amont. Notons que la solution obtenue par la méthode de Récurrence vers l'amont n'inclut aucune menace non crédible du joueur 2. En d'autres termes, le joueur 1 n'a aucune croyance selon laquelle, après avoir observé a1, le joueur 2 n'agira pas dans son propre intérêt.

Pour montrer comment obtenir la solution d'un jeu séquentiel à information complète et parfaite par la méthode de récurrence vers l'amont, considérons le jeu décrit par la figure 3.1.

Etant données les hypothèses de rationalité et de connaissance commune, le joueur 1 sait que s'il choisit L, la meilleure réponse du joueur 2 sera de jouer D car il obtient ainsi un paiement de 2 au lieu de 1. De même, il sait que s'il joue R, la meilleure réponse du joueur 2 sera de choisir U car lui procurant un paiement de 2 au lieu de 0. Etant données ces anticipations, on peut remplacer le jeu de la figure 3.1 par la forme extensive réduite suivante :

Cette forme réduite est obtenue après avoir remplacé chacun des sous-jeux du joueur 2 (l’un débutant après l’action L et l’autre après l’action R) par les paiements résultants du choix optimal du joueur 2. Le meilleur choix pour le joueur 1 est de jouer R. La figure suivante résume l'issue du jeu obtenue par la méthode de Récurrence vers l'amont.

48 MR1( )a2 est la fonction (ou correspondance) de meilleure réponse du joueur 1 à l’action a2 du joueur 2. Au chapitre 2, cette fonction (ou correspondance) a été notée par b1( )a2 .

L R

Joueur 1

1 2 2 1

Figure 3.4

D'une façon générale, la procédure de Récurrence vers l'amont s'applique à la classe des jeux finis à information parfaite.

3.2.2. Application de la récurrence vers l'amont : le modèle de duopole de Stackelberg

Le modèle de duopole de Stackelberg (1934) est un exemple de jeu dynamique à information complète et parfaite qui peut être résolu par la méthode de Récurrence vers l'amont. On considère un marché où existent deux firmes. L'une (la firme 1) est le leader et l'autre (la firme 2) est le follower. La décision à prendre pour chaque firme porte sur la quantité à produire. Par rapport au modèle de Cournot où les quantités sont choisies simultanément par les deux firmes, dans le modèle de Stackelberg, les quantités sont choisies de façon séquentielle. Le déroulement du jeu est donc le suivant :49

- La firme 1 choisit une quantité q1 ≥0.

- La firme 2 observe q1 et choisit une quantité q2 ≥0.

- Le jeu s'arrête et les deux firmes obtiennent un profit selon la fonction

(

q q

)

qi

(

P

( )

Q c

)

i 1, 2 = −

π .

Pour simplifier, on considère que le coût unitaire de production c, est constant (les coûts fixes de production supposés nuls) et identique pour les deux entreprises. La quantité totale offerte par les deux firmes est Q=q1 +q2 et P

( )

Q est la fonction de demande inverse donnant le prix d'équilibre du marché en fonction de la quantité totale offerte par les deux firmes. Pour simplifier, on considère que cette fonction prend la forme linéaire P

( )

Q =abQ avec ac, ce qui donne le graphe de la figure 3.6 :

49 Voir également Gibbons R. (1992). Page 61.

L R

1

D D U

U

2 2

3 1 2 0 1 2 1 0

Figure 3.5

La résolution du jeu par la méthode de Récurrence vers l'amont (Backwards Induction) commence par la détermination du choix optimal de la firme 2. Celle-ci choisit la quantité q2

après avoir observé la quantité q1 choisie par la firme 1. Le choix de la firme 2 est donc la solution du programme suivant :

(

q q

)

q

(

a b

(

q q

)

c

)

La condition nécessaire et suffisante est :

0

Etant donnée l'hypothèse d'information complète (chaque firme connaît la fonction de paiement de l'autre), la firme 1 peut anticiper la réponse MR2

( )

q1 de la firme 2. Elle choisira

La condition nécessaire et suffisante est donc : 2 0

En comparant par rapport au résultat du modèle de Cournot, on peut remarquer que la quantité choisie par le leader

b

= − est supérieure à la quantité choisie par chaque firme en situation de choix simultanés

b

= , elle-même supérieure à la quantité choisie par le follower

La quantité totale produite dans le choix séquentiel,

( )

b celle produite en situation de choix simultanés, soit

( )

b c Qc a