• Aucun résultat trouvé

D'autres modèles d'évolution de la coopération sur des graphes.

Section I.3. Théorie des jeux évolutionnaires et répartition spatiale

C. D'autres modèles d'évolution de la coopération sur des graphes.

Le modèle de Nowak et May repose sur la répartition d'une population de stratégies jouant le dilemme du prisonnier simple. Des développements ultérieurs étudient la répartition d'autres populations de stratégies. Parmi les populations de stratégies qui peuvent ou non adopter un comportement interprétable comme comportement coopératif, on a notamment :

● le dilemme du prisonnier itéré

● le dilemme colombes et faucons ("hawk-doves dilemma") ou "snowdrift dilemma" ● le dilemme du prisonnier simple auquel on rajoute le comportement solitaire ("Loners")

La répartition spatiale des populations associées à ces dilemmes modifie la dynamique évolutionnaire dans chacun des cas.

Dilemme du prisonnier itéré

Dans la continuité des travaux sur l'évolution de la coopération en théorie des jeux évolutionnaires, beaucoup de travaux se font autour du dilemme du prisonnier itéré, les simulations se limitant souvent à des classes de stratégies particulières [Beaufils 00]. Notamment, beaucoup des travaux étudient les populations de stratégies à mémoire 1 de ce dilemme. Pour certains, ils considèrent la version déterministe de ces stratégies, pour d'autres la version aléatoire.

Le dilemme itéré du prisonnier, présenté dans la section 1 du présent chapitre, est en soi un cadre permettant d'établir la coopération avec l'introduction du comportement TFT par exemple. Néanmoins, la portée du résultat est limitée. En effet, chez Axelrod [1984], c'est la possibilité d'interactions futures qui engage les individus à coopérer dès les premières générations. Parce que l'interaction va être renouvelée, mieux vaut rapidement établir la coopération. Ce modèle suppose donc des interactions répétées entre deux individus pour fonder la coopération. Cependant, des exemples économiques et biologiques montrent que la coopération peut s'établir alors même que les relations individuelles sont courtes et que les agents changent de comportement. Ayant établi ce constat, Cohen, Riolo et Axelrod [Cohen 01] développent un nouveau modèle reposant sur la répartition spatiale d'agents jouant le dilemme du prisonnier itéré. Ils veulent d'abord mettre en évidence le rôle de la spatialité dans l'évolution de la coopération et discuter ensuite de l'importance du fait que la structure de la population soit ou non clusterisée.

Les auteurs considèrent une population de stratégies jouant le dilemme du prisonnier itéré. Ils se limitent au cas des stratégies probabilistes à mémoire 1 sur le coup de leur adversaire. Ces stratégies sont définies par 3 paramètres : la probabilité de coopérer au premier coup, la probabilité de coopérer après que l'adversaire ait coopéré et la probabilité de coopérer après que l'adversaire ait joué un coup agressif. Les stratégies copient celui des comportements avec lesquels ils ont interagit qui a obtenu le plus fort score. Sont comparés différents modes d'interaction pour la population des stratégies dans le but de tester si c'est la fixité des relations seule ou la fixité des relations et leur organisation clusterisée qui conditionnent la convergence vers des équilibres coopératifs et leur maintien.

Fréquence des cas ayant atteint de "hauts niveaux" de coopération

Gain Moyen des relations Fréquence des simulations pour

lesquelles la coopération se maintient. Population non répartie. Rencontres

aléatoires à chaque génération

0.3 1091 0.015

Population répartie sur une grille 16×16

1 2.557 0.997

Population répartie sur un graphe aléatoire

1 2.575 0.995

Population répartie sur un graphe aléatoire avec variation de 30% des

relations

1 2.1 0.402

Population répartie sur un graphe aléatoire avec variation de 50% des

relations

0.93 1.257 0.061

Tableau C.1 : Statistiques caractéristiques pour l'évolution de la coopération dans le cas des interactions pour le modèle proposé par [Cohen 01]. Les valeurs du dilemme du prisonnier utilisées sont : T=5, C=3, P=1, S=0.

Le premier résultat mis en évidence est proche de celui de Nowak et May et de ceux des premiers travaux sur la répartition de populations du dilemme du prisonnier itéré [Lombord 96]. Dans le cas où chacun des voisins rencontre 4 voisins choisis au hasard dans la population à chaque génération, la coopération atteint des "hauts niveaux" seulement dans une minorité des cas et les équilibres coopératifs ne sont pas stables. Au contraire, la répartition spatiale permet l'émergence systématique et le maintien des équilibres coopératifs, le gain moyen par relation se trouvant alors fortement renforcé.

Le test de la répartition sur des graphes aléatoires montre que l'évolution vers la coopération n'est pas due à des particularités des topologies de grilles. Pour tester l'importance de l'hypothèse de fixité des relations, des modes d'interaction différents sont testés : les deux dernières lignes du tableau renvoient à des mécanismes où les agents sont reliés entre eux par des relations fixes, formant un graphe aléatoire. A chaque instant, on détermine le voisinage

V

d'un agent et on modifie une part p des agents de

V

en choisissant des voisins au hasard. L'agent interagit alors avec ce voisinage modifié. Le tableau montre qu'en augmentant p au delà d'un certain niveau, on continue de faire apparaître des équilibres coopératifs, mais ces équilibres sont beaucoup plus instables et le gain moyen est fortement dégradé : on se rapproche de la forme d'évolution constatée sur la population non répartie. C'est donc la fixité des relations plus que l'aspect clusterisé du graphe qui importe. En effet, il n'apparaît pas de différence notoire entre les graphes aléatoires et les grilles.

99] : les auteurs étudient un ensemble de stratégies à mémoire 1 sur leur coup et le coup de l'adversaire, soit un ensemble de stratégies plus important que l'ensemble considéré chez [Cohen 01] qui ne considère que des stratégies à mémoire 1 sur le coup de l'adversaire. [Bracuhli 99] obtient un résultat central qui est que la coopération passe par des formes clusterisées, mais met en évidence une grande diversité de clusters possibles (forme et types de stratégies). Le dilemme faucon colombe

Ce dilemme est également connu comme "Hawk-Doves Dilemma", "Snowdrift Dilemma" ou "Chiken Game" [Binmore 99]. On le donne sous sa forme classique [Smith 73]:

H D H

1

2∗V −C 

V

D

0

V

2

Figure C.2 : Matrice des scores pour le dilemme faucons colombes

Ce dilemme symbolise la situation ou deux populations animales, les faucons et les colombes, s'affrontent pour un territoire : dans le cas où deux faucons ("Hawks") se rencontrent, ils s'affrontent et se partagent le territoire : ils gagnent chacun

V2

pour le partage du territoire, mais leur affrontement leur cause un dommage

2C.

Dans le cas d'une colombe ("Dove") qui rencontre un faucon, le territoire est partagé à l'avantage du faucon qui gagne

V ,

la colombe a un score de

0.

Enfin, dans le cas de la rencontre de deux colombes, la coexistence se fait de manière pacifique sur le territoire qui est partagé sans affrontement : chaque colombe gagne

V2

.

Pour avoir un dilemme faucon-colombe, il faut

C V

: face à un acteur agressif, un faucon, mieux vaut jouer le coup D (colombe). Dans ce cas, le dilemme présente deux équilibres de Nash en stratégies pures (H,D) et (D,H) et un équilibre en stratégies mixtes : jouer H avec une probabilité

p

E

,

jouer D avec une probabilité

1− p

E

.

A cet équilibre en stratégies mixtes du jeu correspond un équilibre d'une population de stratégies jouant ce jeu : une population composée d'une part

p

E des stratégies jouant H et une part

1− p

E jouant D est en équilibre.

En calculant, on obtient

p

E

=

V

C

[Smith 82].

Faucon comme un comportement agressif. En effet, l'adoption du comportement colombe par un joueur augmente toujours le score de son adversaire, soit une approche plus large de la coopération que celle donnée dans la partie B de la section 1.

Le dilemme a lui aussi été étudié dans le cadre de la répartition spatiale en utilisant une dynamique d'imitation du meilleur voisin [Killingback 96][Nowak 94][Hauert 04]. L'enjeu n'est pas le même que dans le cas du dilemme du prisonnier ici puisque la survie des comportements coopératifs est garantie dans le dilemme. En effet, un équilibre de la population non répartie est mixte : dans une population de stratégies agressives, une stratégie augmente sa performance en adoptant le comportement coopératif.

Dans le cas de ce dilemme, [Hauert 04] montre que l'impact de la topologie dépend des paramètres du modèle et de la matrice des jeux pour une même dynamique d'imitation du comportement voisin le plus performant que celle introduite avec le modèle de Nowak et May. Comme indiqué plus haut,

p

E est la part d'équilibre des comportements

de type faucon dans la population non répartie, cette part augmente avec la diminution du risque

C

de blessure par rapport au gain

V.

Pour chaque topologie, il existe un seuil

p

S tel que, pour

p

E

p

S

,

la fréquence

des coopérateurs est améliorée par le passage à des interactions topologiques, alors que sinon, la part des comportements coopératifs diminue avec la répartition topologique. Notamment, plus le degré des nœuds augmente, plus le seuil

p

S est bas : c'est à dire que se restreint la plage des paramètres pour laquelle la coopération est

augmentée avec le passage aux interactions topologiques. Pour comprendre ce résultat, il faut noter que tout joueur confronté à

k

faucons a intérêt à jouer le coup colombe : il gagnera 0 au lieu de

k2×V −C0.

Donc quelque soit la taille du groupe, un individu a toujours intérêt à adopter le comportement colombe face à un groupe composé uniquement de faucons. En revanche, si un voisin a déjà adopté le comportement colombe, il existe un nombre de faucons tel qu'il n'est opportun pour aucun d'eux de changer de comportement. Notons k ce nombre. Ceci signifie qu'un groupe de k-2 faucons et 1 colombe est stable mais aussi qu'un groupe de k-3 faucons et 1 colombe est stable. Dans un cas comme dans l'autre, il y a une seule colombe à l'équilibre alors que la taille du groupe a varié. En répartissant spatialement la population et diminuant le degré moyen, c'est à dire la taille des groupes d'interaction, on augmente la proportion des comportements C, à l'inverse, en augmentant le degré moyen, on augmente la taille des groupes d'interaction et on fait baisser le nombre des comportements C en état stable, de sorte que le seuil

p

S

Figure C.3 : Pour une même grille de Von Neumann, la figure de gauche présente l'organisation obtenue dans le cas d'une population jouant le dilemme du prisonnier itéré, quand la figure de droite correspond au cas d'une population jouant le dilemme snowdrift. Les coopérateurs apparaissent en noir.

La figure C.3 montre les formes d'organisation comparées pour le dilemme faucon-colombe et le dilemme du prisonnier. Dans ce dernier cas, un coopérateur doit être isolé des D pour être efficace, alors que dans le premier cas, la coopération est plus performante en présence de comportements agressifs : les comportements coopératifs sont organisés en fils. Ceux-ci sont issus d'un coopérateur initial dont le comportement s'est diffusé. Une référence sur l'évolution spatiale des populations du Snowdrift est [Doebeli 05].

Introduction des solitaires dans le domaine du prisonnier

L'une des extensions à l'étude spatiale du dilemme du prisonnier est l'introduction d'un troisième comportement : le comportement solitaire (Loner), en plus des comportements C et D. Ce comportement consiste à refuser le dilemme. Les stratégies adoptant ce comportement sont alors défavorisées par rapport à une population de stratégies coopératives qui sont parvenues à établir la coopération entre elles, mais elles sont avantagées par rapport aux stratégies D puisqu'elles évitent l'agression. La présence de ce type de comportement permet l'instauration durable de la coopération.

Dans ce cas, la matrice des gains a cette forme :

1

0 

b

0 

  

avec

01

qui est le gain certain hors de toute interaction. Les deux premières lignes et colonnes reproduisant le dilemme du prisonnier simple.

En faisant évoluer ces populations sur une grille [Szabó 02], on constate que les comportements solitaires disparaissent si

b

est trop faible. Si

b

est au dessus de ce seuil de disparition, il y a augmentation monotone de

la part des solitaires avec

b.

Figure C.4 : Etat d'une grille pour les trois comportements : solitaire, C et D.

Ici, la coopération survit pour une très large plage des valeurs de la matrice de gain et notamment, quelle que soit la valeur de b au dessus de la valeur seuil, la coopération survit [Szabó 04][Hauert 02][Michor 02]. Ce résultat est différent de celui du modèle de Nowak et May pour lequel il existe un seuil de la propension à trahir tel qu'au dessus de ce seuil, les coopérateurs disparaissent. Ici, un fort niveau de

b

implique une fréquence importante des solitaires, soit des zones du graphe sans comportements D où les comportements C peuvent se développer. Les clusters qui apparaissent sur le graphe C.4 sont en mouvement constant dans le graphe. Les auteurs parlent de "Red Queen Mechanism", faisant référence à "Alice au Pays des Merveilles" de L. Carroll : As in the land of the Red Queen, “it takes all the running you can do, to keep in the same place.”. C'est à dire que la conservation des coopérateurs passe par des évolutions constantes des clusters de C dans le graphe : il n'y a pas de site fixe dans le graphe. La survie des coopérateurs devient alors un phénomène similaire à la survie des comportements dans les modèles SIR mis en évidence dans la théorie des graphes (I.C).