Jeux évolutionnistes (-naires ?)
Jeux spaiaux
Liene3 - Introdutionaux systèmesomplexes
Sébastien Verel
vereli3s.unie.fr
www.i3s.unie.fr/
∼
verel/TEACHING/11-12/introSC/index.html ÉquipeSoBi-UniversitéNieSophiaAntipolis23 février2012
Plan
1
Une introdutionaux jeux!
2
Jeux évolutionnistes/évolutionnaires
3
Jeux spatiaux
Evolutionary games
Ceours est basésur lestravaux
et lelivre de MartinA. Nowak
M.A.Nowak, Evolutionary
Dynamised. TheBelknap
press ofHarvard University
press,2006.
Unevidéo (et slides)d'uneprésentationàHarvard en 2004 :
http://athome.harvard.edu/programs/evd/evd_video/evd_1.html
Jeux de l'ultimatum
on ore 100 euros à2joueurs s'ilsse mettent d'aord surle
partage
On lane unepièe pour déiderquiprend lerlede eluiqui
propose etquiprend lerle deeluiquireçoit
Uneore est faitepareluidont'estle rle
Le "reeveur"peut aepter ou refuser:
s'ilaepte,l'argentestpartagé
S'ilrefuse, personnene reçoitd'argent
Jeux de l'ultimatum : résultat
Résultats :
Lamajorité(66
%
) desoressontentre 40
%
et50%
etsontaeptées
Peu d'oressontinférieures
à20
%
etlamajoritéalorsrejetée
Interprétation:
→
hypothèsede rationalité : ore lapluspetitepossibleet aeptable
→
résultatspeu dépendants delasomme,du sexe,de la
religionou dupays...
Jeux de l'ultimatum
Mahiguenga(Pérou) vsAuand Gnau (Papouasi nouvelleGuinée)
Jeux de l'ultimatum
Quelquesonlusions
L'habitude duommere et dumarhandage déterminela
notiond'équité
L'ore50/50est onsidérée omme équitable, 40/60 tolérable
une oretrop faibleest onsidérée ommeune oense
personnelle
Toutefois, personne n'est oenséetaepteune ore faible
lorsque:
l'aetationdesrlesn'estpasaléatoiremaisrésulted'une
ompétition
unordinateurfaitl'ore
Jeux de l'ultimatum
Quelquesonlusions:interprétationparl'interationsurl'ensembledelapopulation
Les personnessonttrès sensiblesaux injusties:
les"oreurs"proposentun adeauaveun ertainoût:
ationoopérative
les"déideurs"se vengentd'uneorefaibleaveun ertain
out:punition
oreséquitablesempêhentlapunition:lapunitionrenforela
oopération
Le problème de la oopération
groupe de défenseet
fouragement
surveillanede prédateur et
appel d'alarme
protetion soiale
viabilité globalede ertains
systèmes
→
onit d'intérêtentrelesperformanes d'un individu et
d'une ommunauté
Dilemme soial
Dénition
Les oopérateurssoutiennentle bienommunmalgréun
ertain oûtpersonnel
alorsqueles traitrestententd'exploiter les ressouresen
évitant le oûtde etteexploitation
ungroupe de oopérateursfaitmieuxqu'ungroupe de traitres
les traitresfont mieuxqueles oopérateursdanshaun des
groupes(oopérateursou traitre)
= ⇒
Situation de dilemmesoialUn jeux itéré pour vous (inspiré de J.P. Delahaye)
les mursn'étant pas trèsépais :2voisins peuvent entendrela
musique de l'autre
hardrok punkhardà22h de l'un
Le lendemainl'autre voisin:hard rokméga punk
réagir ou paspour almerplusrapidement?
Un jeux itéré pour vous (inspiré de J.P. Delahaye)
10 partiespoure jeux à2 joueurs:
Silene Rok
Silene 3 0
Rok 5 1
Si Joueur1 =SileneetJoueur 2 =Silenealorsjoueur 1
gagne 3 points:J1 etJ2gagne parlatranquilitéde
l'environnement
SiJoueur 1=SileneetJoueur2 =Rok alorsjoueur1gagne
0 point:J1doit supporter sonvoisin, auungain.
SiJoueur 1=RoketJoueur 2=Silenealorsjoueur1gagne
5 points:J1 gagne pare qu'ilest ontentde déranger son
voisinsansen subirles onséquenes
Si Joueur1 =Roket Joueur 2=Rok alorsjoueur 1gagne
1 point :J1gagne peu pare qu'ilsubitaussides onséquenes
de sa nuisane
Un jeux itéré pour vous (inspiré de J.P. Delahaye)
10 partiespoure jeux à2 joueurs:
Silene Rok
Silene 3 0
Rok 5 1
Quelest votregain?
Quelest legain totaldes2 joueurs?
Comparer esgains avele gainmaximal?
Jeux évolutionnistes
Populationde "joueurs" :
haque joueuradoptel'une des2 stratégiespossibles
Les joueursne hangent pas stratégie:
ilsdisparaissent(meurent) auprot de eux quiont les
meilleurs performanes quise reproduisent
Variationde latailledespopulationsest proportionnelle à :
latailledelapopulation
laperformanede lastratégie(tness)
Performanede lastratégie(tness) dépend de latailledes 2
sous-populations de joueurs
Reprodution
+
Imaginons desellulesquise
divisent toutesles 20
minutes
Combien de ellulesaubout
de 3 jourss'ily a assezde
nourritures?
x
t
+
1=
2xtx
t
:nombrede ellules au
tempst
x
t
+
1:nombre de ellulesau
tempst
+
1pour toutt
≥
0,x
t
=
x0 2t
Reprodution
équationdiérentielle
x
t
+
1=
kxt équivalent àxt+
1−
xt=
rxt aver=
k−
1plus généralement,
pour tout
δ >
0,xt+δ −
xt= δ
rxtd'où équation diérentielleassoiée
(ex. de passage disret
−
ontinu) :˙
x
=
rxQui signie :
La variationdunombre de ellulesest proportionnelle
à lataillede lapopulation.
x
=
x0ertSébastienVerel théoriedesjeux
Reprodution
t=0 t=1 t=2 t=3 t=4
r
=
1Reprodution
t=0 t=1 t=2 t=3 t=4
r
≈
0.
75Disparition : Cellules meurt
t=0 t=1 t=2 t=3 t=4
d
≈
0.
5Disparition
Cellulesmortelles
Mais les ellulesmeurent!
Introdution d'un tauxde mortalitéd
˙
x
= (
r−
d)
xDynamiques possibles
si r
>
d :lataillede lapopulationaugmenteindénimentsi r
<
d :lapopulations'éteintSi r
=
d :lataillede lapopulationresteonstante, mais lasituationest instable.
une petite variationprovoquel'expansion ou ladisparition
Jeux évolutionnistes / évolutionnaires
Populationde "joueurs" :
haque joueuradopte1 stratégieparmi
{
A,B}
Variationde latailledespopulationsest proportionnelle à :
latailledelapopulation
laperformanede lastratégie(tness)
˙
x
A
=
xA fA
˙
x
B
=
xB fB
Taille de population onstante : pression de séletion
Proessusdemortetnaissane
Lataillede lapopulationde joueurs
reste onstante
x
A
+
xB=
1Taux de mortalité identique dans
haque sous-population:m
˙
x
A
=
xA(
fA−
d)
˙
x
B
=
xB(
fB−
d)
d'où d
=
xA fA
+
xB fB
(tnessmoyenne)
exemple f
A
=
2et fB=
1Evolution sous séletion onstante
En posant :
x
A
=
xx
B
=
1−
xOn en déduit parsubstitution:
˙
x
=
x(
1−
x)(
fA−
fB)
fa < fb
x=1 x=0
tout B tout A
fa > fb
Jeux évolutionnistes : séletion non onstante
Dans lathéoriedesjeux évolutionnnaires:
gain(tness) delastratégiedépendde latailledespopulations
fitness A = 2 fitness A = 1
Fitness onstante
fitness A < fitness B fitness A > fitness B
latnessdépendde la
ompositionde lapopulation, de
lataillede haque
sous-population
Jeux à 2 joueurs
Les tnessdépendent dex
A etx
B :
f
A
=
fA(
xA,
xB)
etfB=
fB(
xA,
xB)
˙
x
A
=
xA[
fA(
xA,
xB) −
d]
˙
x
B
=
xB[
fB(
xA,
xB) −
d]
Comment dénirles fontionsde gain (tness) f
A et f
B
?
Jeux à 2 joueurs
A B
A a b
B d
Agagne le gaina lorsqu'il
joueontre A
Agagne le gainb lorsqu'il
joueontre B
Bgagne le gain lorsqu'il
joueontre A
Bgagne le gaind lorsqu'il
joueontre B
Renontre aléatoire desjoueurs.
Chaque joueur renontre:
Aaveune probabilitéx
A
B aveuneprobabilitéx
B
tness=espéranedu gain:
f
A
=
axA+
bxB fB
=
xA+
dxB5 Dynamiques possibles
AdomineB, si a
>
etb>
dA B
Bdomine A,si a
<
etb<
dA B
Aet Bsontbi-stable,sia
>
et b<
dB A
Aet Bo-existent, sia
<
et b>
dB A
Aet Bsontneutres, sia
=
et b=
dA B
Sens de l’évolution Equilibre stable de A
Co−existence stable de A et B
Equilibre unstable de A
Equilibre unstable de A
co−existence unstable de A et B
Equilibre stable de B
Pause historique et bibliographique
Théorie desjeux inventée parJohn Von Neumann et Oskar
Morgenstein(1944)
John Nash"Thisman isgenius" :prixNobel en 1950,
équilibrede Nash
Domaine sientique:John Maynard Smith,Prie(1973),
appliation àlabiologieet l'évolutiondespopulations
J.M.Smith :evolutionarilyStable Strategy
essordanslesannées 1990 et 2000
Hofbaueret Sigmund:"Evolutionary Gameand population
dynamis". Cambridge :CambridgeuniversityPress, 1998.
La théoriedesjeux ne reposepas sur larationalité.Populationde
joueurs de stratégiexe.Interationaléatoire.Legain estinterprété
omme une tness,untaux de reprodution.
Equilibre de Nash
Jeuxà2joueurs
Si les 2joueurs jouentlastratégiequiest unéquilibrede Nash,
Alorsauundes 2joueurs peut hanger de stratégieetaugmenter
son gain
A B
A a b
B d
Aest unéquilibrede Nashstritsia
>
Aest unéquilibrede Nashsi a
≥
Best unéquilibrede Nashstritsid
>
bBest unéquilibrede Nashsi d
≥
bEquilibre de Nash
A B
A 3 0
B 5 1
Béquilibre stritde
Nash
A B
A 3 1
B 5 0
Aet Bne sontpas
deséquilibresde
Nash
A B
A 5 0
B 3 1
AetB sontdes
équilibres stritsde
Nash
Evolutionarily Stable Strategy (ESS) - J. Maynard Smith
Imaginons unelargepopulationde joueursA.
Un mutant de typeB estintroduitdansla population.
Quelleest laondition surlaséletion permette l'invasion deB?
posons x
B
= ǫ
f
A
>
fBdonne a
(
1− ǫ) +
bǫ >
(
1− ǫ) +
dǫ
en négligeantlestermes en
ǫ
(quand on peut):a
>
,ou a=
etb>
dEvolutionarily StableStrategy
A est unESSssisoita
>
,soit a=
etb>
d.stritNash
⇒
ESS⇒
weakESS⇒
NashFauon ou Colombe (Hawk or Dove)?
Les animaux d'unemême espèese battent entreeux :
Conit pourlanourriture, leterritoire,lesexe,et.
Toutefoisles onits n'esaladentpas tous:
ombatsonventionnels, peude ombat mèneàde sérieux
dégâts
Expliationlassique :ombatsonventionnels existent arils
sontbonspour l'espèe.
Les ombatsterriblessontmauvais pourl'espèe
Problème:
vraiauniveaud'un groupeoud'uneespèe,maislaséletion
agitsurlesindividus
Siunindividudésobéitàlarègleetinigedesdégâtsà
l'adversaire,ildoitentirerunavantagereprodutif
Fauon ou Colombe? - J. Maynard Smith
2 espèes :
H :Fauons quifont monter
le ombat
D:Colombesquiseretirent
toujoursd'un ombat
Gains :
b :gain d'avoirgagné un
ombat
:outde laperte
H D
H b
−
2 b
D 0
b
2
Gains :
unfauonfae àune
olombe gagne b ontre 0
lorsque 2animaux de la
même espèeserenontrent,
ilpartagelepaiement.
Fauon ou Colombe?
H D
H b
−
2 b
D 0
b
2
Si b
<
:Pasd'équilibre de Nash
Co-existenedesespèes:
proportionde fauons b
B A
Jeux de la poule mouillée
2 voituresroulent faeà faeà
grande vitesse,le perdant est
eluiquisorten premierde sa
voiture
2 stratégies:
A:on reste dedans
B:on saute après unertain
temps
Gains etperte:
−
:pertedueàlaollisionb :gain sigagnant
A B
A
−
bB 0
b
2
pas d'équilibrede Nash
Co-existenedesstratégies
B A
Dilemme des prisonniers
Deux prisonnierssefont prendre,
ils sontinterrogésséparément.
2 stratégies:
Soitildénonesonamarade
(défetionD)
Soitiloopère etreste
silenieux(oopérationC)
tradution en années de prison :
C D
C -1 -10
D 0 -7
Quefaire????
Dilemme des prisonniers
tradution en gain :
C D
C 3 0
D 5 1
Dynamiqued'évolution vers
traitrise
A
B
Dilemme des prisonniers
C D
C R S
D T P
T
>
RP
>
SR
>
PEtmême :R
> (
T+
P)/
2 :pourgarantirque
l'alternaneest moinsbonne
quelaoopération
Défetionest unéquilibrede
Nash
Laoopérationmutuelleest
plusavantageuse quela
défetion
Pas de oopération aveune
dynamique évolutionniste
Dilemme des prisonniers itéré : réiproité direte
Le jeux estrépété mfois.
2 stratégies:
GRIM:oopèrela première
fois jusqu'àlapremière
traitriseadversaire
ALLD :toujoursladéfetion
GRIM ALLD
GRIM mR S
+ (
m−
1)
PALLD T
+ (
m−
1)
P mPsimR
>
T+ (
m−
1)
P,GRIMest unéquilibrede
Nash:laoopérationse
maintient
m
>
T−
PR
−
PALLD estaussiunéquilibre
de Nash:
GRIMn'explique pas
l'apparitiondelaoopération
Oeil pour oeil : tit-for-tat
Tournoid'Axelrod
stratégietit-for-tat:
TFT :oopération,puis
reproduit lastratégiede
l'adversaire
Tournoi gagné faeàdes
stratégiesinonnues
TFTne restepas bloqué
danslatraitrise
TFT ALLD
TFT mR S
+ (
m−
1)
PALLD T
+ (
m−
1)
P mPDénition
Lapopulationde joueurs est
disposée surunegrille
Ahaque partie, haque
joueurjoueaveses9voisins
Le paiementtotalest alulé
les joueursadoptent la
stratégiedujoueur voisin
avele plusgrandgain s'il
est supérieurau sien
3a+5b 4c+4d
2c+6d 4a+4b 7a+1b
1c+7d
4c+4d 2c+6d 4a+4b
A B
A a b
B d
Un as simple
C D
C 1 0
D b
ǫ
b
>
1:C n'est pasunéquilibre de Nash
ǫ
prohede 0 :pourdépartager les asd'égalité
2b+6e 4b+4e
2b+6e
4b+4e 3 4
7 4
b+7e
Les traitres envahissent les oopérateurs
Croissance D
7 8
8b
5b 3b
0
7 6 5
8
8 5
7 7
4b 5b
Trouvez lesonditions surhaque transition.
Les oopérateurs envahissent les traitres
b
8
5 3
3b 2b
Condition : oin-et-ligne