• Aucun résultat trouvé

Comportements stratégiques: la théorie des jeux

N/A
N/A
Protected

Academic year: 2022

Partager "Comportements stratégiques: la théorie des jeux"

Copied!
111
0
0

Texte intégral

(1)

Comportements strat´ egiques: la th´ eorie des jeux

´Ecole centrale 2021 - 2022

Ga¨etan Fournier

13 Septembre, 04 et 11 Octobre: 8h-12h + TD (Sarah Vincent)

(2)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(3)

Qu’appelle t-on un jeu ?

→Une situation o`u diff´erents agents interagissent. Cette th´eorie a ´et´e d´evelopp´ee et utilis´ee de plus en plus fr´equemment `a partir des ann´ees 1960 en ´economie, en sociologie, en politique, dans l’analyse strat´egique des relations internationales...

Un monopole

I Choisit son prix de vente I Attire plus de client quand son

prix est bas

I G´en`ere plus de b´en´efice par client quand son prix est haut I Doit r´esoudre son probl`eme de

maths (optimisation)

Une entreprise en duopole I Choisit son prix de vente I Doit comparer son prix avec

celui de son concurrent I Doit d’adapter `a la strat´egie

de l’autre

I Anticipe une r´eaction `a sa r´eaction

I Ne peut pas savoir, a priori, si son prix est le bon ou pas

(4)

Un jeu (sous forme normale) est d´efini principalement par trois param`etres :

1/ un ensemble de joueurs ou agents, 2/ leurs ensembles d’actions,

3/ leurs fonctions de paiement ou fonctions d’utilit´e.

De mani`ere formelle :

(i) Joueurs.On noteN l’ensemble des joueurs ;

(ii) Strat´egies.´etant donn´e un certain agenti∈N, son ensemble d’action sera not´eSi;

S := Πi∈NSi. Un ´el´ements∈S sera appel´e unprofil de strat´egies; c’est `a dire un vecteur sp´ecifiant une action pour chaque agent : s= (si)i∈N.

(iii) Paiements. La fonction de paiement du joueuri est not´eeui. Il s’agit d’une application deS dans→Rqui, `a un profil de strat´egies s donn´e, associe l’utilit´e du joueuri,ui(s).

(5)

Exemple 1

Dilemme du prisonnier.Il s’agit probablement de l’exemple le plus c´el`ebre en th´eorie des jeux.

Deux suspects pour un crime sont gard´es prisonniers dans deux cellules diff´erentes. Ils sont interrog´es s´epar´ement et peuvent soit refuser de parler (Coop´erer) ou avouer et d´enoncer leur partenaire (Trahir). Si les deux nient, ils passent un temps relativement court en prison. Si l’un des deux d´enonce l’autre, l’informateur est lib´er´e mais son complice ´ecope d’une tr`es longue peine. S’ils se d´enoncent mutuellement, ils restent en prison pour une peine assez longue :

Joueur 2

C T

Joueur 1 C 1,1 4,0 T 0,4 3,3

Exception : les joueurs minimisent

(6)

Exemple 1

Le Dilemme du prisonnier fait partie d’une famille de jeux int´eressants, o`u la coop´eration est possible mais pas syst´ematique. Voyons un autre exemple :”Voler ou Partager ?”(”Steal or split ?”) est un jeu t´el´evis´e aux

´etats-Unis.

I Les 2 joueurs arrivant en finale doivent se partager les gains accumul´es pendant l’´emission (supposons 1000$).

I Chacun choisit simultan´ement ”Partager”, c’est `a dire proposer le partage 50−50, ou ”Voler”, c’est `a dire tenter de voler l’enti`eret´e de la mise `a l’autre finaliste s’il a choisi ”Partager”.

I Si les deux choisissent ”Voler”, tous les gains sont perdus.

(7)

Exemple 1

La th´eorie des jeux essaie de pr´evoir et d’analyser l’interaction. Mais c’est difficile, surtout s’il y a des facteurs sociaux ou psychologiques qui entre en jeu. Dans l’exemple pr´ec´edent : empathie, cons´equence du vol, profils des joueurs (ge, sexe, classe sociale...).

→Martijn J. van den Assem (Amsterdam), Dennie van Dolder

(Amsterdam) and Richard H. Thaler (Chicago) sont trois chercheurs en

´economie qui ont ´etudi´e le comportement des participants de l’´emission

”Partager ou voler”. Ils ont remarqu´e que :

I Les fr´equencs empiriques sont (”Partager”,”Voler”)= (0.53,0.47).

I Lorsque les participants sont jeunes, les hommes choisissent plus

”Voler” que les femmes, mais chez les participants plus g´es le ph´enom`ene s’inverse.

I Lorsque les joueurs ont d´ej`a cherch´e `a s’attaquer lors des phases pr´ec´edentes du jeu, ils ont plus tendance `a choisir ”Voler”.

→Dans ce cours nous allons ignorer tous ces facteurs ext´erieurs et ne s’int´eresser qu’`a l’aspect rationnel de l’interaction.

(8)

Quelques remarques

I Strat´egie vs Action.

Deux joueurs peuvent prendre la mme d´ecision pour des raisons diff´erentes. Par exemple, au poker avecune pair d’as, je peux faire tapis (strat´egie A) ou faire tapis seulement si la derni`ere fois que j’ai eu la main mme je n’ai pas fait tapis (strat´egie B). Voir l’action du joueur (faire tapis) ne vous renseigne pas n´ecessairement sur la strat´egie choisie.

I Pr´ef´erences ordinal vs cardinal.

Une partie de la th´eorie peut se faire avec des pr´ef´erences ordinal (relation d’ordre sur les issues du jeu). Les notions de strat´egie domin´ee, d’´equilibres purs, etc. Dans la th´eorie du vote, on ne s’int´eresse souvent qu’aux pr´ef´erences ordinales. Certains notions plus complexe ont besoin de pr´ef´erences cardinales.

I Forme normale vs forme s´equentielle.

On va ´etudier les liens entre les deux, mais chaque forme `a son utilit´e : la forme s´equentielle repr´esente mieux le timing d’un jeu, la forme normale est plus adapt´e pour les calculs d’´equilibres.

(9)

Notation : on noteS−i = Πj6=iSj l’ensemble des profils d’actions de tous les joueurs, sauf le joueuri et on notes−i un de ses ´el´ements.

ui :Si×S−i→R. s= (s1, . . . ,si, . . . ,sn)

s−i= (s1, . . . ,si−1,si+1, . . . ,sn)

On s’autorise souvent la notationui(si,s−i), qui modifie l’ordre des variables.

Le tripletG= (N,(Si)i∈N,(ui)i∈N) d´efinit la forme normaled’un jeu.

Un jeu est ditfini lorsqueN est fini et chaque ensemble de strat´egieS est fini. Dans le cas particulier d’un jeu `a deux joueurs fini, la fonction de paiement peut ˆetre repr´esent´ee `a l’aide d’une matrice (appel´eematrice de paiement) : c’est unjeu matriciel.

(10)

Exemple 2

Pierre, ciseaux, feuille.Deux joueurs jouent au c´el`ebre jeu

Pierre-ciseaux-feuille. Ils choisissent simultan´ement une action, sachant que pierre bat ciseaux, ciseaux bat feuille et feuille bat pierre. Ceci peut ˆetre repr´esent´e par la matrice 3×3 suivante :

Joueur 2

P F C

Joueur 1

P 0,0 −1,1 1,−1 F 1,−1 0,0 −1,1 C −1,1 1,−1 0,0

(11)

Exemple 3

Ench`ere simulatan´ee au second prix = ench`eres de VickreyUn objet est `a vendre. Chaque joueuri a une ´evaluation priv´ee de sa valeurvi. Chaque joueur soumet secr`etement son unique offrexi. Le joueur ayant propos´e le prix le plus ´elev´e ach`ete l’objet au second prix le plus ´elev´e.

ui(xi,x−i) =

(0 ifi6=i=argmax xi

vi−maxi6=ixi otherwise.

(12)

Selon le dernier Observatoire de le-pub : les investissements en publicit´e sur le digital ont atteint en France 3.45 milliards d’euros en 2016. Cela repr´esente pr`es de 30% des investissements de la part des annonceurs, d´epassant ainsi la t´el´e (28 %) et la presse (un peu plus de 20 %).

Possibilit´e de choisir sa cible.

(13)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(14)

Premier pas : ´ eliminer les actions domin´ ees

Commen¸cons par d´efinir ce que l’on entend par une actionmeilleure qu’une autre pour un certain joueur.

La strat´egiesi0 eststrictement domin´ee parsi si

∀s−i∈S−i, ui(si0,s−i)<ui(si,s−i)

On noterasi0<si. Lorsqu’une action est strictement domin´ee par une autre action, elle fait toujours strictement moins bien.

Exemple d’application dans un jeu matriciel : Joueur 2

l m r

Joueur 1

T 2,1 2,3 1,2 M 2,0 1,2 1,1 B 1,5 1,4 5,0 On remarque que :

I r <m

I M ≤T mais a ne suffit pas pour ´ecarter cette strat´egie !

(15)

Deuxi` eme pas : vers la proc´ edure d’EISSD

Nous adopterons l’hypoth`ese restrictive mais classique dite de connaissance commune.

Hypoth`ese de connaissance commune.Nous supposerons dans la suite que les joueurs sont rationnels (cherchent `a maximiser leur paiement). De plus, chaque joueur sait que tous les joueurs sont rationnels et que tous les joueurs savent que tous les joueurs sont rationnels etc...

I Dans une partie d’´echecs, un joueur ne va jamais faire de pi`ege.

I Au moment de prendre leurs d´ecisions, les traders ont diff´erents niveaux d’information. Mais chacun va joueur optimalement en fonction de son information, de ses croyances les informations manquantes, de ce qu’ils sait sur ce que les autres savent, de ce qu’ils sait que les autres croient sur ce qu’ils ne savent pas, etc, etc...

En pratique les joueurs se heurtent `a des limites cognitives et `a des biais sur les croyances (par exemple que mon adversaire est moins intelligent que moi).

(16)

Contre-exemple ` a l’hypoth` ese de connaissance commune

Concours de beaut´e (par extention, Keynes 1936) : chacun donne un nombre entre 0 et 100. Le but est d’tre le plus proche de la moiti´e de la moyenne des participants. Par exemple, s’il y a 3 joueurs :

(x1,x2,x2) = (25,50,75) alorsj1 gagne.

Rosemarie Nagel [1995] : recherche exp´erimentale qui d´ecrit plusieurs niveaux de raisonnement logique.

I Les joueurs de plus bas niveau, ou niveau L0, choisira ainsi un nombre purement au hasard entre 1 et 100.

I Les joueurs de niveau imm´ediatement sup´erieurL1 pensent que leurs adversaires sont de niveau 0 et adaptent leur strat´egie selon cette pr´ediction. UnL1choisira donc 25 = 502.

I Et ainsi de suite pour les joueurs de niveau 3, 4, 5... qui choisissent

50 2n.

I Dans l’hypoth`ese d’une infinit´e de niveaux de raisonnement, l’´equilibre ´etabli serait que les joueurs choisissent 0.

En pratique, le niveau de complexit´e du jeu exc`ede rarement le niveau 3, si bien que les joueurs sont de cat´egorieL0,L1,L2 ouL3(conform´ement aux pr´edictions de Keynes).

(17)

Joueur 2

l m r

Joueur 1

T 2,1 2,3 1,2 M 2,0 1,2 1,1 B 1,5 1,4 5,0

Apr`es une ´etude attentive, le joueur 2, mais aussi le joueur 1 consid`erent que la strat´egier est absurde et ne sera pas jou´ee. Le jeu est donc

´equivalent au jeu suivant (jeu r´eduit) :

Joueur 2

l m

Joueur 1 T 2,1 2,3 M 2,0 1,2 B 1,5 1,4

(18)

Joueur 2

l m

Joueur 1 T 2,1 2,3 M 2,0 1,2 B 1,5 1,4

Mais on remarque que dans ce jeu, on a `a nouveau une strat´egie domin´ee :B <T.

Sous l’hypoth`ese de connaissance commune, on peut continuer `a ´eliminer des strat´egies mˆeme dans le jeu r´eduit. On appelera cette proc´edure : l’´elimination it´er´ee des strat´egies strictement domin´ees : l’EISSD.

On peut donc ´eliminerB. Puisl<m.

EnfinM<T.

Finalement, seul le profil (T,m) survit.

I En conclusion, si les joueurs ne prennent pas de d´ecisions absurdes, et si les joueurs supposent que leurs adversaires ne prendront pas non plus de d´ecisions absurdes (etc...) alors les joueurs devraient jouer (T,m). Nous formaliserons ce r´esultat bientˆot.

I Nous verrons aussi qu’il n’est pas absurde de jouer une strat´egie faiblement domin´ee.

(19)

Question : Dans le jeu suivant, proc´eder `a l’EISSD. Termine t-elle avec un unique profil de strat´egie, comme dans l’exemple pr´ec´edent ?

Joueur 2

l m r

Joueur 1

T 4,3 4,4 3,2 M 2,0 5,1 1,2 B 1,5 1,4 2,0

Proposition : L’ensemble des strat´egies qui survivent `a l’´elimination it´er´ee ne d´epend PAS de l’ordre d’´elimination (si la domination est stricte) L’EISSD est une proc´edure qui donne un r´esultat int´eressant lorsqu’elle aboutit `a un unique profil de strat´egie. Mais sinon ?

(20)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(21)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(22)

L’´ equilibre de Nash

Definition

Un profil de strat´egiess estun ´equilibre de Nash (pur)si

∀i, ∀si∈Si, ui(si,s−i )≥ui(si,s−i )

Un ´equilibre de Nash est donc un profil de strat´egies tel qu’aucun agent n’a int´erˆet `a d´evier (jouer une autre action que son action `a l’´equilibre) si les autres joueurs jouent leur action d’´equilibre.

A un ´` equilibre de Nash, aucune d´eviation unilat´erale n’est profitable.

John Nash (1928-2015)

Prix Nobel d’´economie en 1994.

(23)

L’´ equilibre de Nash

Definition

Un profil de strat´egiess estun ´equilibre de Nash (pur)si

∀i, ∀si∈Si, ui(si,s−i )≥ui(si,s−i )

Un ´equilibre de Nash est donc un profil de strat´egies tel qu’aucun agent n’a int´erˆet `a d´evier (jouer une autre action que son action `a l’´equilibre) si les autres joueurs jouent leur action d’´equilibre.

A un ´` equilibre de Nash, aucune d´eviation unilat´erale n’est profitable.

John Nash (1928-2015)

Prix Nobel d’´economie en 1994.

(24)

Exemple 1

Joueur 2

l m r

Joueur 1

T 2,1 2,3 1,2 M 2,0 1,2 1,1 B 1,5 1,4 5,0

Questions : Le profil d’action (T,l) est-il un ´equilibre de Nash ? Et le profil (T,m) ? Y-a-t’il un autre ´equilibre de Nash ?

(25)

Exemple 2

Y a t-il un probl`eme avec la solution propos´ee par Nash ? Joueur 2

l m r

Joueur 1

T 1000,1000 0,1000 1000,1000

M 1000,0 1,1 1000,0

B 1000,1000 0,1000 1000,1000

Equilibre6= Stabilit´e (attractivit´e) 6= Pr´ediction parfaite

(26)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(27)

Meilleures r´ eponses (1)

Une d´efinition alternative des ´equilibres de Nash repose sur la notion de correspondance de meilleure r´eponse. Une action est unemeilleure r´eponseface `a un profil d’action des autres joueurs si elle garantit le meilleur paiement possible face `a ce profil :

Definition

La correspondance de meilleure r´eponseBRi de l’agent i est une application deS−i dans l’ensemble des parties deSi d´efinie par

∀s−i ∈S−i, BRi(s−i) :=Argmaxsi∈Siui(si,s−i).

Les ´el´ements de l’ensembleBRi(s−i) sont appel´eesmeilleure r´eponsesdu joueuri face `as−i.

(28)

Example

Joueur 2

l m r

Joueur 1

T 2,1 2,3 1,2 M 2,0 1,2 1,1 B 1,5 1,4 5,0 Question : CalculerBR2(T), BR1(m), BR1(l).

(29)

Meilleures r´ eponses (2)

A l’aide des correspondances de meilleure r´eponses individuelles, nous pouvons d´efinir une application de meilleure r´eponse globale :

Definition

On noteBR la correspondance (globale) de meilleure r´eponse. Il s’agit de l’application deS dans l’ensemble des parties deS, d´efini par

BR(s)=BR1(s−1)×BR2(s−2)×...×BRn(s−n)).

Question : choisir un profilsde strat´egies dans le jeu pr´ec´edent et calculerBR(s).

(30)

Equilibre de Nash ´ versus Meilleures R´ eponses

Definition

Un profil de strat´egiess est un ´equilibre de Nash ssi s∈BR(s).

Autrement dit :

sest un ´equilibre de Nash ssi, pour tout joueuri,si est une meilleure r´eponse face `as−i :∀i,si ∈BRi(s−i).

Cette d´efinition est clairement ´equivalente `a la pr´ec´edente.

→M´ethode g´en´erale pour trouver les ´equilibres de Nash (purs) dans un jeu matriciel `a deux joueurs : souligner, dans chaque colonne, les paiements maximum du joueur 1 et souligner, sur chaque ligne les paiement maximums du joueur 2. Les profils d’actions pour lesquels les deux paiements sont soulign´es correspondent aux ´equilibres de Nash purs du jeu.

(31)

Question : Utiliser la m´ethode sur le jeu suivant.

Joueur 2

g m d

Joueur 1

A 3,3 6,3 −1,2 B 2,−2 9,2 0,1 C 2,−1 2,4 2,3

Combien d’´equilibres de Nash trouvez-vous ? La multitude est-elle en g´en´erale un d´efaut ou une qualit´ee pour un concept de solution ?

(32)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(33)

Retour sur les exemples

• Pierre-ciseaux-feuille : il n’y a pas d’´equilibre de Nash pur ici.

Remarque : la non-existence est un gros d´efaut pour un concept de solution, mais cette partie du probl`eme sera r´egl´e quand nous aborderons les ´equilibres mixtes.

• Dilemme du prisonnier : l’unique ´equilibre de Nash est (D,D).

Remarque : l’´equilibre de Nash est domin´e, au sens de Pareto, par le profil (N,N). Cette classe de jeux a ´et´e intensivement ´etudi´ee car elle permet de mod´eliser des situations dans lesquelles l’interaction strat´egique entre les deux joueurs va `a l’encontre du bien-ˆetre global. Les agents obtiendraient un paiement plus grand s’ils coop´eraient tous les deux. Un ´equilibre de Nash estnon-coop´eratif, dans le sens o`u cette notion d’´equilibre est bas´ee sur le fait que chaque agent agit pour son propre int´erˆet et qu’aucune coalition n’est envisag´ee entre les agents.

(34)

Lien entre strat´ egies strictement domin´ ees et ´ equilibres de Nash

Proposition 1 :Soits un ´equilibre de Nash (pur). Alors, pour tout i∈N,sin’est pas strictement domin´ee par une autre strat´egie.

Preuve.Au tableau.

Proposition 2 :Soitti ∈Si une strat´egie strictement domin´ee du joueur i. Alors, si on noteG0 le jeu obtenu `a partir deG en enlevant la strat´egie ti pour le joueur i, l’ensemble des ´equilibres de Nash purs du jeuG0 est

´egal `a l’ensemble des ´equilibres de Nash purs du jeuG.

Preuve.Au tableau.

Autrement dit : L’ensemble des ´equilibres de Nash est stable par

´elimination des strat´egies strictement domin´ees. Une cons´equence directe est qu’aucune strat´egie apparaissant dans un ´equilibre de Nash ne peut ˆetre ´elimin´ee par le proc´ed´e d’´elimination.

(35)

Conclusion sur le proc´ ed´ e d’EISSD

Ainsi, le proc´ed´e d’´elimination ne supprime pas d’´equilibre de Nash pur.

Pour simplifier la recherche d’´equilibres de Nash (purs, mais ce sera aussi le cas en mixte), il est donc conseill´e de commencer par appliquer le proc´ed´e d’EISSD.

Si le proc´ed´e aboutit `a un unique profil, celui-ci est l’unique ´equilibre de Nash et on dit alors que le jeu estsolvable par ´elimination des strat´egies strictement domin´ees(ou plus simplementsolvable par ´elimination).

C’est ce qui arrive par exemple dans le cas du dilemme du prisonnier : seul le profil (D,D) survit `a l’´elimination.

(36)

Existe-il un proc´ ed´ e d’EISFD ?

Pour certains jeux, il peut ˆetre int´eressant d’´eliminer les strat´egies faiblement domin´ees, mais deux probl`emes peuvent apparaˆıtre : (i) certains ´equilibres de Nash peuvent ˆetre ´elimin´es

(ii) le r´esultat n’est pas invariant par modification de l’ordre d’´elimination.

Illustrations : Le jeu matriciel suivant illustre (i) : Joueur 2

L R

Joueur 1 T 1,1 0,0 B 0,0 0,0 L’exemple suivant illustre (ii) :

Joueur 2

g m d

Joueur 1

A 1,0 3,1 1,1 B 1,1 3,0 0,1 C 2,2 3,3 0,2

On peut aboutir aux profils (A,d) ou (C,m).

(37)

Existe-il un proc´ ed´ e d’EISFD ?

Pour certains jeux, il peut ˆetre int´eressant d’´eliminer les strat´egies faiblement domin´ees, mais deux probl`emes peuvent apparaˆıtre : (i) certains ´equilibres de Nash peuvent ˆetre ´elimin´es

(ii) le r´esultat n’est pas invariant par modification de l’ordre d’´elimination.

Illustrations : Le jeu matriciel suivant illustre (i) : Joueur 2

L R

Joueur 1 T 1,1 0,0 B 0,0 0,0 L’exemple suivant illustre (ii) :

Joueur 2

g m d

Joueur 1

A 1,0 3,1 1,1 B 1,1 3,0 0,1 C 2,2 3,3 0,2 On peut aboutir aux profils (A,d) ou (C,m).

(38)

Exemple 1 : Les jeux de congestion

Une population deN= 4000 automobilistes d´esire voyager d’un point de d´epart `a un point d’arriv´ee.

Initialement, on suppose que deux chemins sont possibles :

I un passant par l’´etape A. Du d´epart `a A, le temps de parcours d´epend du nombre d’usagers, il est ´egal `an/100, o`uncorrespond au nombre de personne empruntant cette route. De A `a l’arriv´ee, le temps de parcours fixe ´egal `a 45 minutes.

I un autre passant par l’´etape B. Le temps de parcours entre le d´epart et B est fixe, de 45 minutes et le temps de parcours de B `a l’arriv´ee est ´egal `an/100.

A

B

45’

45’

n/100

n/100

D´epart Arriv´ee

Figure–2 chemins possibles (donc deux strat´egies).

(39)

Les agents cherchent `a minimiser leur temps de parcours.

Question : Montrer qu’il y a un unique ´equilibre de Nash. Est-il efficace ?

Solution : 2000 usagers passent par A et les 2000 autres passent par B est un ´equilibre de Nash. Le temps de trajet est le mˆeme pour tout le monde et est ´egal `a 65 minutes.

Clairement, tout profil asym´etrique (strictement plus d’usagers

empruntent un des deux itin´eraire) ne peut pas ˆetre un ´equilibre de Nash : un des usagers empruntant l’itin´eraire le plus emprunt´e a int´erˆet `a d´evier. Montrons maintenant que l’´equilibre est efficace, c’est `a dire qu’on ne peut pas faire mieux. La somme totale des temps de parcours est ´egale `a : T =nA(nA/100 + 45) +nB(nB/100 + 45) = 45N+ (n2A+ (N−nA)2)/100 qui est minimale pournA =N/2 = 2000.

(40)

Les agents cherchent `a minimiser leur temps de parcours.

Question : Montrer qu’il y a un unique ´equilibre de Nash. Est-il efficace ? Solution : 2000 usagers passent par A et les 2000 autres passent par B est un ´equilibre de Nash. Le temps de trajet est le mˆeme pour tout le monde et est ´egal `a 65 minutes.

Clairement, tout profil asym´etrique (strictement plus d’usagers

empruntent un des deux itin´eraire) ne peut pas ˆetre un ´equilibre de Nash : un des usagers empruntant l’itin´eraire le plus emprunt´e a int´erˆet `a d´evier.

Montrons maintenant que l’´equilibre est efficace, c’est `a dire qu’on ne peut pas faire mieux. La somme totale des temps de parcours est ´egale `a : T =nA(nA/100 + 45) +nB(nB/100 + 45) = 45N+ (n2A+ (N−nA)2)/100 qui est minimale pournA =N/2 = 2000.

(41)

Paradoxe de Braess

Supposons maintenant que l’on construit une voie (ultra) rapide `a sens unique de A `a B, de temps de parcours nul. Cet ajout augmente le nombre de strat´egies possibles des usagers (ce nombre passe de 2 `a 3, puisqu’il est dor´enavant possible de passer par A, puis B).

A

B

45’

45’

n/100

n/100

D´epart 0’ Arriv´ee

Figure–Nouvelle option : prendre la voie rapide (3 strat´egies).

Question : Comment cela change t-il l’´equilibre ?

(42)

La nouvelle strat´egie domine strictement les deux anciennes. On va toujours plus vite du d´epart `a B en passant par A (on met au plus 40 minutes en passant par A) De plus, il est toujours strictement plus rapide d’aller de B `a l’arriv´ee que de A `a l’arriv´ee.

Il y a un ´equilibre de Nash o`u tout le monde utilise le mˆeme itin´eraire, qui est de passer par A puis B.

Le temps de parcours d’un usager `a l’´equilibre est maintenant de 80 minutes. La construction de cette nouvelle route se fait donc au d´etriment du temps de parcours.

Ce paradoxe a ´et´e trouv´e par le math´ematicien Dietrich Braess en 1968.

Il y a des exemples concrets :

I En 1990 : fermeture de la 42`eme rue `a New York. Cons´equence : moins d’embouteillage dans la zone.

I En 2011 : fermeture de l’Interstate 405 (une des principales autoroutes inter-´etats, en Californie) : moins d’embouteillage dans une large zone au sud de la Californie.

(43)

Exemple 2 : un mod` ele de biens publics avec seuil.

I Consid´erons une population denindividus. Chaque individus doit choisir s’il veut apporter une contribution t>0 `a l’´elaboration d’un bien public.

I Si au moinsk personnes choisissent de contribuer, le bien public est produit et chaque agent (mˆeme ceux qui n’ont pas contribu´e) re¸coit une utilit´eG >t. Dans le cas contraire, le bien public n’est pas produit et chaque agent re¸coit 0 (les contributions sont perdues).

Chaque agent a deux strat´egies. On ´ecrit si = 1 sii contribue etsi = 0 sinon. Le bien public est produit ssiX

j

sj ≥k. L’utilit´e d’un agent donn´e est :

ui = 0 sisi = 0 etP

jsj <k ui =G si si = 0 etP

jsj ≥k ui =−t sisi= 1 andP

jsj<k ui =G −t sisi = 1 etP

jsj ≥k

Question : Quels sont les ´equilibres de Nash ? Sont-ils efficaces ?

(44)

Solution

La situation la plus efficace correspond au cas o`u il y a exactementk contributeurs.

L’utilit´e agr´eg´ee est alorsnG−kt. Il s’agit ´egalement d’un ´equilibre de Nash.

N´eanmoins, il existe un autre ´equilibre de Nash, dans lequel personne ne contribue. Les interactions dans ce jeu sont similaires `a celles dans un jeu de coordination avec une issue Pareto-domin´ee.

(45)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples

Strat´egies mixtes D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(46)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples

Strat´egies mixtes D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(47)

Extension mixte

Jusqu’`a pr´esent : les joueurs ne jouaient que des strat´egies pures, ils jouaient telle ou telle de leurs actions de mani`ere d´eterministe. Nous allons maintenant d´efinir ce que l’on entend parstrat´egie mixte.

Soit l’exemple de jeu `a somme nullematching pennies: Joueur 2

P F

Joueur 1 P −1,1 1,−1 F 1,−1 −1,1

Il n’existe pas d’´equilibre de Nash en strat´egie pure, car si les deux joueurs r´ev`elent `a l’autre joueur leur choix d’action, un des deux aura int´erˆet `a changer. Ce n’est plus le cas si l’on autorise les joueurs `a jouer de mani`ere al´eatoire entre leurs actions.

(48)

Une strat´egie mixtexi d’un joueuri est une loi de probabilit´e sur l’ensemble des actions de ce joueur.

Par exemple, siA1={T,M,B}, alorsx1telle que

x1(T) = 0.6, x1(M) = 0, x1(B) = 0.4 est une strat´egie mixte.

On notera parfoisx1= (0.6,0,0.4).

Deux cas extrˆemes :

I Un cas particulier de strat´egie mixte est une strat´egie pure (c’est `a dire les strat´egies que nous avons consid´er´ees jusqu’`a maintenant).

La strat´egie puresi du joueuri correspond `a la strat´egie mixtexi

telle quexi(si) = 1 etxi(si0) = 0 poursi0 6=si.

I Lorsqu’une strat´egie mixte associe une probabilit´e strictement positive `a chaque action :xi(si)>0, ∀si ∈Si, on dira quexi est une strat´egie compl`etement mixte; cela signifie que le joueur aura une chance de jouer chacune de ses actions.

(49)

Calcul du paiement avec des strat´ egies mixtes

Le paiement dans l’extension mixte du jeu peut ˆetre per¸cu comme un paiement ”moyen” lorsque les joueurs choisissent de rendre leurs choix d’actions al´eatoires.

D´efinition : On noteG l’extension mixte du jeuG, c ’est `a dire le jeu o`u les joueurs peuvent choisir une strat´egie mixtexi ∈Xi. Dans ce

”nouveau” jeu, si chaque joueuri choisit la strat´egie mixtexi, le paiement associ´e au joueuri est donn´e par

ui(x1, ...,xn) := X

(s1,...,sn)∈S

x1(s1)....xn(sn)ui(s1, ...,sn)

Hypoth`ese implicite : les joueurs ont une attitude neutre face au risque.

(50)

Exemple 1

Joueur 2

P F

Joueur 1 P −1,1 1,−1 F 1,−1 −1,1

Le joueur 1 doit choisir une strat´egie mixtex1= (x1(P),x1(F)) et le joueur 2 doit choisir une strat´egie mixte (x2(P),x2(F)). Bien entendu, on doit avoirxi(F) = 1−xi(P) pour que ce soient bien des probabilit´es.

Par exemple :x1= (1/3,2/3) etx2= (3/4,1/4). Cela signifie que le joueur 1 choisit de jouerPileune fois sur trois et que le joueur 2 choisit de jouerpile3 fois sur 4. Le paiement du joueur 1 associ´e `a ce profil de strat´egies mixtes est donn´e par une somme de quatre termes :

u1(x) =1 3 ×3

4 × −1 +1 3 ×1

4 ×1 +2 3 ×3

4×1 + 2 3×1

4 × −1 = 1 6 Puisque le jeu est`a somme nulle, l’adversaire obtient le paiement oppos´e :−1/6.

(51)

Exemple 2

Joueur 2

P F

Joueur 1 P 4,3 1,−2 F 0,1 2,1

Question : Quel est le paiement du joueur 1 six1= (14,34) etx2(P) =12. R´eponse :

u1((14,34),(12,12)) = 14×12×4 +14×12×1 +34×12×2 = 12+18+68= 118.

(52)

Equilibre de Nash mixte ´

On introduit maintenant la notion d’´equilibre de Nash dans l’extension mixte du jeu :

Definition

Soitx= (x1,x2, ...,xn) un profil de strat´egies mixtes. On dira quex est un ´equilibre de Nash si, pour tout joueuri,

∀xi ∈∆(Si),ui(xi,x−i )≥ui(xi,x−i ).

Proposition :le profil de strat´egies mixtesx est un ´equilibre de Nash ssi

∀si ∈Si, ui(xi,x−i )≥ui(si,x−i ).

Preuve : Par contrapos´ee. Si aucune strat´egie pure n’est une d´eviation profitable, alors aucune strat´egie mixte ne l’est non plus, par lin´earit´e.

(53)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples

Strat´egies mixtes D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(54)

Th´ eor` eme de Nash (1951)

On a vu qu’il pouvait ne pas exister d’´equilibre en strat´egie pure.

N´eanmoins, lorsque l’on autorise l’usage des strat´egies mixtes, ceci n’est plus possible.

Th´eor`eme :Dans un jeu sous forme normale fini, il existe toujours au moins un ´equilibre de Nash en strat´egies mixtes.

(55)

Preuve 1/2

La d´emonstration originale de Nash s’appuie sur le th´eor`eme de

Brouwer : soit une application continueg :X →X, o`uX est compact et convexe. Alorsg admet un point fixex, c’est `a dire tel queg(x) =x.

On noteX l’ensemble des profils de strat´egies mixtes,X = ΠXi. On notea+= max{a,0}.

Soit l’applicationg :X →X, d´efinie parg(x) = (g1(x), ...,gn(x)), o`ugi

est une application deXi dansXi donn´ee par

(gi(x))(si) := xi(si) + (ui(si,x−i)−ui(xi,x−i))+ 1 +P

si0∈Si(ui(si0,x−i)−ui(xi,x−i))+ (Eq) On agi(x)∈Xi, et doncg(x)∈X. La continuit´e deg est claire.

L’applicationg admet donc un point fixex. Il nous reste `a montrer que x est un ´equilibre de Nash.

(56)

Preuve 2/2

I Supposons quex ne soit pas un ´equilibre de Nash : il existe donc un joueuri qui peut obtenir un paiement strictement plus grand en d´eviant dexi vers une strat´egie pure, face `ax−i ; ainsi, pour ce joueuri, on a

X

si0∈Si

ui(si0,x−i )−ui(xi,x−i )+

>0,

car au moins un des termes de la somme est strictement positif. Le d´enominateur dans (Eq) est donc strictement plus grand que 1.

I Soit maintenant si ∈Si telle quexi(si)>0 et ui(xi,x−i )≥ui(si,x−i ), c’est `a dire que

(ui(si,x−i)−ui(xi,x−i))+= 0. Conclusion : puisquex est un point fixe deg, on a donc

xi(si) = (gi(x))(si) = xi(si) 1 +P

s0i∈Si ui(si0,x−i )−ui(xi,x−i )+, et doncxi(si) = 0 (on a une ´equation de la formex =dx avecd>1).

On aboutit `a une contradiction.x est donc un ´equilibre de Nash.

(57)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples

Strat´egies mixtes D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(58)

Interpretation 1 : v´ eritables strat´ egies des joueurs

Professionals Play Minimax, article de recherche d’Ignacio Palacios-Huerta

The Review of Economic Studies(2003)

gL etgR = 1−gL : le gardien choisit de plonger `a sa gauche (L) ou `a sa droite (R).

kL etkR := 1−kL : le tireur choisit de tirer `a la gauche du gardien (L) ou `a sa droite (R).

Ces fr´equences (empiriques sur 5 grands championnats) peuvent d´efinir le paiement du jeu matriciel `a somme nulle.

(59)

Interpretation 1 : v´ eritables strat´ egies des joueurs

Professionals Play Minimax, article de recherche d’Ignacio Palacios-Huerta

The Review of Economic Studies(2003)

gL etgR = 1−gL : le gardien choisit de plonger `a sa gauche (L) ou `a sa droite (R).

kL etkR := 1−kL : le tireur choisit de tirer `a la gauche du gardien (L) ou `a sa droite (R).

Ces fr´equences (empiriques sur 5 grands championnats) peuvent d´efinir le paiement du jeu matriciel `a somme nulle.

(60)

Interpretation 1 : v´ eritables strat´ egies des joueurs

Aussi observ´e dans le poker (o`u les joueurs peuvent mixer `a l’aide d’une montre).

Libratus (Universit´e de Pittsburgh, 2017) est un programme informatique d’intelligence artificielle destin´e `a jouer au poker, qui bat largement les meilleurs joueurs du monde : 14,72bb/100 (´ecarts comparables `a la diff´erence entre amateur r´egulier et joueur professionnel).

Avantage comparatif : connaissance parfaite de l’´equilibre de Nash (strat´egie inexploitable, qui attend les erreurs), dont le support mixte est beaucoup plus large que les humains et excellente maitrise de la

randomisation mme des ´ev`enements rares.

(61)

Autres interpretations

I Si une interaction strat´egique est r´ep´et´ee, une strat´egie mixte peut parfois s’interpr´eter comme la fr´equence `a laquelle chaque action est jou´ee.

I Si de nombreux individus ne savent pas avec qui ils vont interagir, ils s’int´eressent `a la fr´equence des actions jou´ees par la foule.

I etc

(62)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples

Strat´egies mixtes D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(63)

Comment trouver les ´ equilibres Nash mixtes ?

Proposition : Soit un profil de strat´egies mixtesx= (x1,x2, ...,xn). Si x est un ´equilibre de Nash, alors, pour tout joueuri,

∀si ∈Sitel que xi(si)>0, on a ui(xi,x−i ) =ui(si,x−i ).

Preuve.Soientsi+ etsi deux strat´egies du joueuri telles que xi(si+)>0,xi(si)>0 etui(si+,x−i )>ui(si,x−i ).

Consid´erons alors la strat´egie mixtexi d´efinie de la mani`ere suivante : xi(si) =xi(si),∀si6=si+,si

xi(si+) =xi(si+) +xi(si) xi(si) = 0

Alors on v´erifie facilement que

ui(xi,x−i )>ui(xi,x−i ), ce qui contredit le fait quexest un ´equilibre de Nash.

On a donc montr´e que, pour toute strat´egiesi ∈Si telle quexi(si)>0 on a forc´ement le mˆeme paiement face `a x−i . Par lin´earit´e de la fonction de paiement ce paiement est ´egal `aui(xi,x−i ). Le r´esultat est prouv´e.

(64)

Simplifier un jeu avant d’en trouver les ´ equilibres Nash mixtes ?

Proposition :Soitsi une strat´egie pure du joueuri domin´ee strictement par une strat´egie mixtexi :

∀s−i ∈S−i, ui(si,s−i)<ui(xi,s−i).

Alors, sixest un ´equilibre de Nash, on axi(si) = 0.

Ceci signifie que l’on peut ´eliminer les strat´egies pures strictement domin´ees par une strat´egie mixte lorsque l’on recherche l’ensemble des

´equilibres de Nash d’un jeu, car elles ne seront pas jou´ees par le joueur concern´e, `a l’´equilibre.

(65)

Exemple : Cherchons l’ensemble des ´equilibres de Nash du jeu suivant : Joueur 2

g d

Joueur 1 H 3,0 0,1 M 0,0 3,1 B 1,1 1,0

On voit facilement qu’il n’y a pas de strat´egie pure strictement domin´ee par une autre strat´egie pure.

N´eanmoins, la strat´egieB est domin´ee par la strat´egie mixte x1= (12,12,0) pour le joueur 1, car les paiements correspondant sont

u1(x1,g) = 3/2>1, u1(x1,d) = 3/2>1.

On peut donc ´eliminer la strat´egie pureB pour le joueur 1.

(66)

Apr`es ´elimination, on obtient :

Joueur 2

g d

Joueur 1 H 3,0 0,1 M 0,0 3,1

Dans cette matriceg est domin´ee pard donc on peut ´eliminerg, ce qui aboutit `a l’unique ´equilibre de Nash (M,d).

(67)

Quelques remarques g´en´erales sur l’ensemble des ´equilibres de Nash :

∗ Un ´equilibre de Nash est ditcompl`etement mixtelorsque chaque joueur joue une strat´egie compl`etement mixte. Le fait qu’il y a toujours un ´equilibre de Nash en strat´egie mixte ne signifie pas qu’il existe toujours un ´equilibre de Nash compl`etement mixte ;

∗ d’ailleurs, un ´equilibre de Nash pur est un cas particulier d’´equilibre de Nash mixte ; en effet, comme on l’a vu plus haut, on peut identifier l’actionsi avec la strat´egie mixtexi telle quexi(si) = 1

∗ Il peut y avoir une infinit´e d’´equilibres de Nash, par exemple, dans un jeu `a deux joueurs avec deux strat´egies pures chacun, si un des deux joueurs est indiff´erent entre ses deux actions, `a l’´equilibre il pourra jouer n’importe quelle probabilit´e sur ses deux actions ;

∗ Il est assez compliqu´e en g´en´eral de trouver tous les ´equilibres de Nash d’un jeu. N´eanmoins, dans le cas `a deux joueurs avec peu d’actions possibles, une m´ethode pratique possible est :

a) Proc´eder `a l’´elimination it´er´ee des strat´egies strictement domin´ees (par une strat´egie mixte) ;

b) Chercher les ´equilibres purs dans la nouvelle matrice obtenue ; c) Chercher les ´equilibres mixtes en faisant des hypoth`eses et en

utilisant la proposition qui donne l’´egalit´e des paiements.

(68)

Exemples de r´ esolution de jeux deux joueurs

Dans chacun des cas suivants, on cherche l’ensemble des ´equilibres de Nash.

Premier exemple :Consid´erons la matrice de paiement Joueur 2

g d

Joueur 1 H 0,0 2,3 B 1,1 0,0

1. Pas d’´elimination possible, on passe `a la recherche des ´equilibres.

2. Il y a deux ´equilibres de Nash purs : (H,d) et (B,g).

3. Face `a une strat´egie pure, les joueurs ne sont jamais indiff´erents entre leurs deux actions donc il n’existe pas d’´equilibre de Nash pour lequel un des deux joueurs joue une strat´egie pure et l’autre joueur joue compl`etement mixte.

4. Cherchons maintenant les ´equilibre de Nash compl`etement mixte.

(69)

Six= (x1,x2) est un ´equilibre de Nash mixte, avecx1= (x,1−x) et x2= (y,1−y) (x ∈]0,1[,y ∈]0,1[ alors, lorsque le joueur 1 utilise la strat´egie mixtex1, on sait que le joueur 2 doit ˆetre indiff´erent entre ses deux strat´egies pures :

u2(x1,g) = (1−x)×1; u2(x1,d) =x×3.

Il y a ´egalit´e ssix= 1/4. De la mˆeme mani`ere, lorsque le joueur 2 joue selonx2, le joueur 1 est indiff´erent entre ses deux actions :

u1(H,x2) = (1−y)×2; u1(B,x2) =y×1, ce qui implique quey = 2/3.

Il existe donc un unique ´equilibre de Nash compl`etement mixte : 1

4,3 4

,

2 3,1

3

(70)

Deuxi`eme exemple :Soit la matrice de paiement Joueur 2

g d

Joueur 1 H 2,1 1,3 M 1,3 2,2 B 1,5 1,0

1. la strat´egie pureB est domin´ee strictement par la strat´egie mixte (1/2,1/2,0), qui consiste `a jouer une fois sur 2H et une fois sur deuxM. On peut donc ´eliminer la strat´egie pure B pour le joueur 1 et consid´erer la matrice de paiement simplifi´ee.

Joueur 2

g d

Joueur 1 H 2,1 1,3 B 1,3 2,2

2. On v´erifie facilement qu’il n’y a pas d’´equilibres de Nash purs. 3. On v´erifie facilement qu’il n’y a pas d’´equilibres de Nash

partiellement mixte.

4. Il y a donc un unique ´equilibre de Nash, qui est compl`etement mixte.

(71)

Deuxi`eme exemple :Soit la matrice de paiement Joueur 2

g d

Joueur 1 H 2,1 1,3 M 1,3 2,2 B 1,5 1,0

1. la strat´egie pureB est domin´ee strictement par la strat´egie mixte (1/2,1/2,0), qui consiste `a jouer une fois sur 2H et une fois sur deuxM. On peut donc ´eliminer la strat´egie pure B pour le joueur 1 et consid´erer la matrice de paiement simplifi´ee.

Joueur 2

g d

Joueur 1 H 2,1 1,3 B 1,3 2,2

2. On v´erifie facilement qu’il n’y a pas d’´equilibres de Nash purs.

3. On v´erifie facilement qu’il n’y a pas d’´equilibres de Nash partiellement mixte.

4. Il y a donc un unique ´equilibre de Nash, qui est compl`etement mixte.

(72)

Six= (x1,x2) est un ´equilibre de Nash mixte, avecx1= (x,1−x) et x2= (y,1−y) (x ∈]0,1[,y ∈]0,1[ alors, lorsque le joueur 1 utilise la strat´egie mixtex1, on sait que le joueur 2 doit ˆetre indiff´erent entre ses deux strat´egies pures :

u2(x1,g) =x×1 + (1−x)×3, u2(x1,d) =x×3 + (1−x)×2. Il y a ´egalit´e six= 1/3. De la mˆeme mani`ere, lorsque le joueur 2 joue selonx2, le joueur 1 est indiff´erent entre ses deux actions :

u1(H,x2) =y×2 + (1−y)×1; u1(M,x2) =y×2 + (1−y)×2, ce qui implique qu’il y a ´egalit´e ssiy = 1/2.

Il existe donc un unique ´equilibre de Nash compl`etement mixte : 1

3,2 3

,

1 2,1

2

(73)

Troisi`eme exemple :Soit la matrice de paiement Joueur 2

g d

Joueur 1 H 1,1 2,1 B 0,0 1,0

1. H domine strictementB.

2. Une fois queB est ´elimin´e, le joueur 2 est indiff´erent entreg etd. Dans ce jeu, il y a donc une infinit´e d’´equilibres de Nash, de la forme (H,(y,1−y)).

(74)

Troisi`eme exemple :Soit la matrice de paiement Joueur 2

g d

Joueur 1 H 1,1 2,1 B 0,0 1,0 1. H domine strictementB.

2. Une fois queB est ´elimin´e, le joueur 2 est indiff´erent entreg etd. Dans ce jeu, il y a donc une infinit´e d’´equilibres de Nash, de la forme (H,(y,1−y)).

(75)

Exercice suppl´ementaire :

Joueur 2

g m d

Joueur 1

A 5,10 10,15 5,0 B 0,20 5,5 10,25

(76)

Plan

Introduction

Strat´egie domin´ee et EISSD L’´equilibre de Nash

D´efinition

Meilleures r´eponses

Connexion EISSD-Nash et exemples Strat´egies mixtes

D´efinition

Th´eor`eme de Nash

Interpr´etation des ´equilibres de Nash mixtes Simplifier un jeu avant le calcul des ´equilibres Jeux `a espaces d’actions continus

Jeux s´equentiels

(77)

Comp´ etition imparfaite

Les deux jeux les plus ´etudi´es en ´economie : la comp´etition de Cournot et la comp´etition de Bertrand.

Comptition de Cournot : comptition sur les quantits.

Comptition de Bertrand : comptition sur les prix.

Le cadre est commun :

I Production d’un bien assur´ee parnfirmes.

I Coˆut marginal constant :c>0

I Demande des consommateurs et prix sont relis par une foncion affine :p(q) =a−bqou q(p) = a−qp .

(78)

(i) Dans le mod`ele de Cournot : chaque firme choisit qi. La quantit´e totale estq=X

i

qi. p=

(a−bq si q∈[0,a/b]

p= 0 siq≥a/b Chaque firme souhaite maximiser :

ui(qi,q−i) = (p−c)qi.

(ii) Dans le mod`ele de Bertrand :, chaque firme choisitpi. Le prix de vente estp:= min

i pi.

La demandeqdes consommateurs est alors : q=

(1

b(a−p) sip∈[0,a]

q= 0 sip≥a.

Chaque firme souhaite donc maximiser : ui(pi,p−i) =

(1

N(p−c)qsipi = min

j pj 0 sinon

. o`uNest le nombre de firmes affichant le prix le plus bas p.

(79)

Comp´ etition ` a la Cournot

Le cas du monopole.

Lorsqu’une firme est seule sur le march´e (n= 1), elle maximise son profit en produisant :

qmonopole =a−c 2b

Le prix en situation de monopole est alors donn´e par pmonopole= 1

2(a+c) Le profit de la firme est donn´e par

umonopole= 1

4(a−c)2/b

(80)

L’optimum en utilit´e.

On a : X

i

ui(qi,q−i) =X

i

(p−c)qi= (p−c)q=

((a−c−bq)qsi q≤a/b

−cq siq≥a/b

• Pour maximiser l’utilit´e agr´eg´ee, les firmes doivent se comporter comme une seule firme en monopole.

• Elles doivent donc produire q=qmonopole. Cette production pouvant ˆ

etre r´eparti de n’importe quelle mani`ere entre les firmes.

• q peut par exemple ˆetre r´epartie ´equitablement entre lesnfirmes : qi =1nqm

(81)

Quelques remarques sur les interactions.

On a :

∂ui

∂qj

=−bqi ≤0

On dit que le jeu est `aexternalit´es n´egatives. Une augmentation de la quantit´e produite chez les concurrents conduit `a une baisse du profit.

On a aussi :

2ui

∂qi∂qj

=−b<0

On dit que le jeu est `asubstituts strat´egiques . Une augmentation de la quantit´e produite chez les concurrents conduit `a une baisse de la rentabilit´ee.

(82)

Et les ´equilibres de Nash ? Calculons les fonctions de meilleure r´eponse.

ui(qi,q−i) = (p−c)qi = (a−c−b(qi+q−i))qi siqi+q−i≤a/b La d´eriv´ee partielle de cette application par rapport `aqi est

∂ui

∂qi

=a−c−b(qi+q−i)−bqi =a−c−2bqi−bq−i. La fonction de meilleure r´eponse est alors

BRi(q−i) = 1

2 a−c

b −q−i

si q−ia−cb 0 siq−ia−cb .

(83)

Si (qi)i est un ´equilibre de Nash o`u tout le monde produit, alors : qi= 1

2 a−c

b −q−i

Il s’agit d’un syst`eme den´equations `aninconnues, que l’on peut r´esoudre `a l’aide de l’astuce suivante :

1. On retranche 12qi de chaque cˆot´e, et on obtientqi= a−cb −q.

2. On somme suri, et on obtient : q= n+1n a−cb

3. A l’aide des 2 points pr´ec´edents, on obtient : qi =n+11 a−cb .

(84)

On peut comparer l’´equilibre de Nash au r´esultat obtenu pour l’optimum en utilit´e.

qequilibre= 2 n

n+ 1qmonopole

Les firmes produisent beaucoup plus `a l’´equilibre.

On peut aussi calculerpequilibre= a+ncn+1 donc

uequilibre= 4

(n+ 1)2um

(85)

Existe-il des ´equilibres de Nash o`u certaines firmes ne produisent pas ? La r´eponse est non.

En effet, supposons que (qi)i est un ´equilibre de Nash dans lequel seulementk <nfirmes produisent.

On a alors :

q= k k+ 1

a−c b

Pour toute firmei ne produisant pas, la meilleure r´eponse est donn´ee par : BRi(q−i) = 1

2 a−c

b − k

k+ 1 a−c

b

= 1

2(k+ 1) a−c

b >0, ce qui est une contradiction.

(86)

Pour r´esumer, on a prouv´e les r´esultats suivants :

I Dans le mod`ele de comp´etition de Cournot, il existe un unique optimum en utilit´e sym´etrique, o`u chaque firme produit qi =1nqmonopole et obtient le paiement 1numonopole

I Il existe un unique ´equilibre de Nash o`u chaque firme produit qi =n+12 qm et obtient le paiement (n+1)4 2um

I Les producteurs produisent donc plus et gagnent moins `a l’´equilibre de Nash qu’`a l’optimum en utilit´e. De plus, lorsquenaugmente, la somme des paiements `a l’´equilibre tend vers 0.

(87)

Comp´ etition ` a la Bertrand

Le monopole.

p=pmonopole =a+c

2

Le calcul est le mˆeme que pour le monopole sous Cournot.

L’optimum en utilit´e.

N’importe quel profil tel quep=pmonopole= a+c2 .

(88)

L’´equilibre de Nash.

Soitn≥2 le nombre de joueurs. Les ´equilibres de Nash sont les profils (pi)i tels qu’au moins deux firmes choisissentc et toutes les autres choisissent un prix sup´erieur `ac.

Remarque : le paiement de chaque firme est nul `a l’´equilibre.

(89)

Troisi` eme exemple de jeu avec continuum d’action : les fournitures de biens publics

I nagents contribuent (ou non) `a la production d’un bien public.

I Ils poss`edent des ressources (y1, . . . ,yn).

I Chaque agenti divise ses ressources entre une contributiongi `a la production du bien public et sa consommation personnelle ci. I On noteG =

n

X

i=1

gi la contribution totale.

I L’utilit´e des agents est repr´esent´ee par la fonction d’utilit´e de Cobb-Douglas :

ui(gi,g−i) =αln(G) + (1−α) ln(yi−gi) I Chaque agenti cherche `a maximiser la quantit´e :

αln(gi+g−i) + (1−α) ln(yi−gi), avecgi ∈[0,yi].

Références

Documents relatifs

Les rats étaient partout, dans les tiroirs, dans les armoires, dans les placards et jusque dans les berceaux… Toute la ville en était infestée 2.. Les habitants de Hamelin,

L’ITF est signataire des dispositions et principes de la Convention des Nations Unies portant sur les Droits de l’Enfant, texte qui fut ratifié en 2002 par la quasi totalité des

On constate donc aujourd’hui que les joueurs et les joueuses de haut niveau consacrent à la préparation physique une part importante de leur temps

Important: Lorsque vous construisez un service ou un module spécialisé, vous devez le prendre de la réserve à côté du plateau principal dans la zone attitrée.. S’il n’y en a

Règle du jeu : Le premier joueur lance le dé et prend autant d’étoiles qu’il y a de points sur le dé (ou autant d’étoiles que le chiffre indiqué).. Variante GS : le joueur

Ce soir, je dormirai dans le lit de ma petite sœur.. Les petites peluches et les gros jouets s’étalent dans

Dans un déterminant, on peut intervertir lignes entre elles, colonnes entre elles, intervertir lignes et colonnes, sa valeur est constante.. On a ainsi des classes

Zig et Puce chacun ` a son tour ´ ecrivent sur une mˆ eme ligne un nombre choisi parmi l’ensemble des 24 premiers nombres naturels 1 ` a 24, distinct de tous ceux qui ont d´ ej` a