• Aucun résultat trouvé

L’espérance de paiement dans un jeu bayésien

Chapitre 4 : Jeux simultanés à information incomplète

4.3.   L'équilibre de Nash bayésien

4.3.2.   L’espérance de paiement dans un jeu bayésien

Dans un jeu bayésien, tiTi est une information privée du joueur i. On dit que ti est le type du joueur i. Il est observé uniquement par le joueur i. Pour tous les autres joueurs, ti est une variable aléatoire.

Le paiement du joueur i pour le profil de stratégies s =

(

s1

( )

t1 ,L,sn

( )

tn

)

=

(

si

( ) ( )

ti ,si ti

)

prend la forme de l'espérance de paiement :

( ) ( )

4.3.3. L'équilibre de Nash bayésien

Dans le cadre d’un tel jeu, l’équilibre bayésien de Nash est défini comme suit :

Définition: Un équilibre de Nash bayésien pour le jeu bayésien

(

S1,L,Sn;u1,L,un ;T ;F

( )

)

( ) ( )

(

i i i i

)

i

(

i

( ) ( )

i i i

)

i s t s t u s t s t

u~ * , * ≥~ , * pour tout si

( )

tiS~i Soit si :

( ) ( ( ) ( ) ) ( ) ( ( ) ( ) )

t

i i i i i i t

i i i i i

i s t s t t P t u s t s t t

u t

P * , * , , * , pour tout si

( )

tiS~i

En d’autres termes, le profil de stratégies

(

s1*

( )

t1 ,L,sn*

( )

tn

)

est un équilibre de Nash du jeu bayésien où chaque agent maximise son utilité espérée conditionnelle à ses croyances sur le type des autres agents. L’équilibre bayésien est donc moins exigeant que l’équilibre de Nash en information complète puisque les joueurs ne maximisent leur utilité qu’en espérance.

Si le jeu bayésien sous forme normale G

(

S S~n;u~, ,u~n

)

,

~,

1

1 L L

= est un jeu fini, c'est-à-dire si l'ensemble des joueurs et les ensembles de stratégies f i sont finis, alors on peut appliquer le théorème de Nash. Pour un tel jeu fini, il existe donc un équilibre de Nash, possiblement en stratégies mixtes.

A titre d'exemple, considérons le jeu suivant pour lequel il faut identifier tous les équilibres de Nash bayésien en stratégies pures :70 Deux armées opposées sont sur le point de conquérir une île. Chaque général peut choisir soit "attaquer" –A– soit "ne pas attaquer" –NA–. Chaque armée est soit "puissante" soit "faible" avec probabilité égale (le tirage aléatoire du type de chaque armée est indépendant) et le type de chaque armée n'est connu que de l'armée concernée. La conquête de l'île procure une valeur égale à M. Une armée peut conquérir l'île soit en attaquant seule soit en n'attaquant pas seule sachant qu'elle-même est du type

"puissante" et l'autre du type "faible". Aucune des deux armées ne peut conquérir l'île si elles attaquent toutes les deux et sont du même type. En attaquant, une armée supporte un coût égal à s si elle est du type "puissante" et de w si elle est du type "faible" avec s<w. En attaquant seule, une armée ne supporte aucun coût.

Pour mettre ce jeu sous la forme normale, nous devons au préalable définir l'espace des stratégies de l'armée i. Dans ce jeu, chaque joueur dispose de quatre stratégies, à savoir :

1

si : Attaquer si type "puissant" –s ; Attaquer si type "faible" –w : (A/s ; A/w) ;

2

si : Attaquer si type "puissant" –s ; Ne pas attaquer si type "faible" –w : (A/s ; NA/w) ;

3

si : Ne pas attaquer si type "puissant" –s ; Attaquer si type "faible –w (NA/s ; A/w) ;

4

si : Ne pas attaquer si type "puissant" –s ; Ne pas attaquer si type "faible" –w : (NA/s ; NA/w).

Pour fixer les idées, supposons que M = 10, s = 3 et w = 5. Nous obtenons ainsi la matrice des paiements suivante :

70 Exemple tiré de Mas-Colell, Whinston and Green (1995), page 265.

Pour déterminer l'équilibre de Nash, on calcule les espérances de paiement de chaque joueur pour tous les profils de stratégies. Par exemple, pour le profil de stratégies

(

s11,s21

)

, le gain du joueur 1 est de :

ƒ -3 si les deux joueurs attaquent et sont du type s (la probabilité est de ¼) ;

ƒ -5 si les deux joueurs attaquent, le joueur 1 étant du type w et le joueur 2 du type s (la probabilité est de ¼) ;

ƒ 7 si les deux joueurs attaquent, le joueur 1 étant du type s et le joueur 2 du type w (la probabilité est de ¼) ;

ƒ -5 si les deux joueurs attaquent et sont du type w (la probabilité est de ¼).

Pour ce profil, le paiement espéré du joueur 1 est donc

(

−3−5+7−5

)

/4=−1,5. Ce même calcul appliqué, à toutes les combinaisons de stratégies, permet d’obtenir la matrice des paiements suivante :

Ce jeu admet les deux équilibres de Nash bayésiens suivants :

(

s12,s21

)

et

(

s11,s22

)

.

On peut déterminer l'équilibre de Nash bayésien en adoptant une démarche équivalente. Il faut remarquer en effet, qu'avant de faire son choix, chacun des joueurs i connaît (observe) son type ti. Donc, dans un équilibre de Nash bayésien (en stratégies pures), chaque joueur choisit

J o u e u r 2

J o u e u r 1

s21 s22 s23 s24

s11 -1.5 ; -1.5 3 ; 1 5.5 ; -2.5 10 ; 0 s12 1 ; 3 1.75 ; 1.75 4.25 ; -1.25 5 ; 0 s13 -2.5 ; 5.5 1.25 ; 4.25 1.25 ; 1.25 5 ; 0

s14 0 ; 10 0 ; 5 0 ; 5 0 ; 0

Figure 4.9 Joueur 2

s21 s22 s23 s24

A/s A/w A/s NA/w NA/s A/w NA/s NA/w

s11 A/s -3 -3 7 -5 -3 -3 10 0 10 0 7 -5 10 0 10 0 A/w -5 7 -5 -5 -5 7 10 0 10 0 -5 -5 10 0 10 0 s12 A/s -3 -3 7 -5 -3 -3 10 0 10 0 7 -5 10 0 10 0

NA/w 0 10 0 10 0 10 0 0 0 0 0 10 0 0 0 0

s13 NA/s 0 10 0 10 0 10 0 0 0 0 0 10 0 0 0 0 A/w -5 7 -5 -5 -5 7 10 0 10 0 -5 -5 10 0 10 0 s14 NA/s 0 10 0 10 0 10 0 0 0 0 0 10 0 0 0 0

NA/w 0 10 0 10 0 10 0 0 0 0 0 10 0 0 0 0

J o u e u r 1

Figure 4.8

une stratégie (action) qui soit la meilleure réponse aux stratégies des autres joueurs (selon la distribution conditionnelle fi

(

ti/ti

)

) et ce pour chacun des types ti pouvant survenir. Cette démarche équivalente a donné lieu à la proposition suivante :

Proposition : Le profil de stratégies pures

(

s1*

( )

t1 ,L,sn*

( )

tn

)

est un équilibre de Nash bayésien

Cette proposition signifie que dans un équilibre de Nash bayésien, chaque joueur i choisit une meilleure réponse à la distribution de probabilité conditionnelle des stratégies des autres joueurs et ce pour chacun des types ti pouvant survenir avec une probabilité non nulle. En d'autres termes, chaque type ti du joueur i est considéré comme si c'était un joueur à part entière cherchant à maximiser son utilité espérée étant donné sa distribution conditionnelle sur les stratégies des autres joueurs. Cette approche est qualifiée de type-centered interpretation.71 Cette caractéristique est bien mise en évidence par exemple, dans le jeu du free riding avec asymétrie de l'information. Dans ce jeu, après avoir observé son type (I ou II), le joueur 2 choisit sa meilleure réponse. On a bien si*

( )

ti .

L'espérance est calculée par rapport aux variables aléatoires que constituent la réalisation des ti des autres joueurs conditionnel à la réalisation de ti.

Démonstration : Nous voulons montrer que :

( ) ( )

avec une probabilité positive, alors le joueur i peut améliorer son paiement en choisissant une meilleure stratégie dans le cas d'occurrence de ti. Ceci contredit le fait que

(

s1*

( )

t1 ,L,sn*

( )

tn

)

est un équilibre de Nash bayésien.

71 J. Harsanyi, J. (1995). “Games with Incomplete Information”. The American Economic Review, Vol. 85, n° 3, page 295. June 1995.

Pour montrer que l'inégalité est suffisante, il faut remarquer que si elle est vérifiée pour tout

i

i T

t ∈ ayant une probabilité non nulle, le joueur i ne peut améliorer son paiement en déviant de si*

( )

ti .

L'application de cette proposition à l'exemple de la conquête de l’île permet de vérifier l'équivalence des deux démarches. Pour chacun des deux joueurs, on détermine l'espérance de paiement lorsqu'il est du type s et lorsqu'il est du type w, l'espérance étant calculée par rapport à ses croyances. Ainsi, lorsque le joueur 2 joue s21, le joueur 1 obtient :

( ) ( ) ( )

7 2

2 3 1 2 , 1 , 21

1 A s s = − + =

u

( ) ( ) ( )

0 0

2 0 1 2 , 1 , 21

1 NA s s = + =

u

( ) ( ) ( )

5 5

2 5 1 2 , 1 , 21

1 A s w = − + − =−

u

( ) ( ) ( )

0 0

2 0 1 2 , 1 , 21

1 NA s w = + =

u

On a ainsi u1

(

A,s21,s

)

>u1

(

NA,s21,s

)

et u1

(

NA,s21,w

)

>u1

(

A,s21,w

)

. Par conséquence, la meilleure réponse à s21 est

(

A/s,NA/w

)

=s12, soit b1

( )

s21 =s12.

La meilleure réponse du joueur 1 par rapport aux autres stratégies du joueur 2 est obtenue de la même manière, ce qui donne b1

( )

s22 =s11, b1

( )

s23 =s11 et b1

( )

s24 =s11. La même démarche est appliquée au joueur 2 et on a b2

( )

s11 =s22, b2

( )

s12 =s21, b2

( )

s13 =s21 et b2

( )

s14 =s21. En rassemblant les meilleures réponses des deux joueurs, on obtient les deux équilibres de Nash bayésiens identifiés plus haut, à savoir

(

s12,s21

)

et

(

s11,s22

)

.

Ce résultat est identique à celui obtenu en utilisant la définition de l'équilibre de Nash bayésien à partir de la forme normale.

J o u e u r 2

J o u e u r 1

s21 s22 s23 s24

s11 b1 b2 b1 b1

s12 b1 b2

s13 b2

s14 b2

Figure 4.10

4.4. Application : Le modèle de Cournot selon l'approche de Harsanyi