HAL Id: tel-03274530
https://tel.archives-ouvertes.fr/tel-03274530
Submitted on 30 Jun 2021
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Ziad Kobeissi
To cite this version:
Ziad Kobeissi. Contributions to the theory of mean field games. Computer Science and Game Theory
[cs.GT]. Université de Paris, 2020. English. �NNT : 2020UNIP7150�. �tel-03274530�
École doctorale Sciences Mathématiques de Paris Centre (ED 386) Laboratoire Jacques-Louis Lions
Quelques contributions à la théorie des jeux à champ moyen
Contributions to the theory of Mean Field Games
Thèse de doctorat présentée par Ziad Kobeissi
Sous la direction d’Yves Achdou et de Pierre Cardaliaguet
Présentée et soutenue à Paris le 02/10/2020, devant le jury composé de Yves Achdou Université de Paris Directeur Pierre Cardaliaguet Université Paris-Dauphine PSL Directeur Filippo Santambrogio Université Claude Bernard Lyon 1 Rapporteur Fabio Camilli Sapienza Università di Roma Rapporteur
Annalisa Cesaroni Univesrità di Padova Examinatrice
Jean-François Chassagneux Université de Paris Examinateur
Guy Barles Université de Tours Examinateur
Alessio Porretta Università di Roma Tor Vergata Examinateur
Jean-Michel Lasry Université Paris-Dauphine PSL Membre invité
1 Introduction 1
1.1 La théorie des jeux à champ moyen . . . . 1
1.1.1 Le jeu à N joueurs . . . . 1
1.1.2 Le système de jeu à champ moyen . . . . 3
1.1.3 Jeux à champ moyen de contrôle . . . . 5
1.2 Organisation de la thèse . . . . 7
1.2.1 À propos des solutions classiques du système de jeu à champ moyen de contrôle . . . . 8
1.2.2 Approximation par la méthode des différences finies du système de jeu à champ moyen de contrôle . . . . 10
1.2.3 Jeux à champ moyen avec interactions monotones par la loi des états et des contrôles des joueurs . . . . 12
1.2.4 Un algorithme primal-dual pour des jeux à champ moyen dynamique du second-ordre et à couplage local . . . . 13
1.2.5 Perspectives et travaux futurs . . . . 14
2 On Classical Solutions to the Mean Field Game System of Controls 17 2.1 Introduction . . . . 18
2.2 Notations and assumptions . . . . 21
2.2.1 Notations and definitions . . . . 21
2.2.2 Assumptions . . . . 22
2.2.3 Main results . . . . 24
2.3 The fixed point relation in µ and the proof of Lemma 2.2.3 . . . . 26
2.4 A priori estimates and the proof of Lemma 2.2.4 . . . . 29
2.4.1 A priori estimates on u . . . . 29
2.4.2 A priori estimates on m . . . . 31
2.4.3 A priori estimates on derivatives of u . . . . 32
2.5 Existence and uniqueness results under additional assumptions . . . . 37
2.5.1 Solving the MFGC systems for M < ∞ . . . . 37
2.5.2 Existence results when q 0 ≤ q 0 . . . . 38
2.5.3 Existence results which do not need the assumption q 0 < q 0 . . . . . 39
2.5.4 Existence and uniqueness results with a short-time horizon assumption 41 2.6 Applications . . . . 43
2.6.1 Exhaustible ressource model with nonpositively correlated ressources 44 2.6.2 Price impact models with bid and ask prices . . . . 46
2.6.3 First-order flocking model with velocity as controls . . . . 47
2.6.4 A model of crowd motion . . . . 48
3 Mean Field Games of Controls: Finite Difference Approximations 59
3.1 Introduction . . . . 60
3.1.1 A brief discussion on the mathematical analysis of (3.1.1) . . . . 61
3.1.2 A more detailed description of the considered class of MFGCs . . . . 62
3.1.3 Organization of the paper . . . . 63
3.2 Finite difference methods . . . . 64
3.2.1 Notations and definitions . . . . 64
3.2.2 The scheme . . . . 66
3.2.3 Solving the discrete version of the Hamilton-Jacobi-Bellman equation 68 3.2.4 Solving the discrete version of the Fokker-Planck-Kolmogorov equation 69 3.3 Newton algorithms for solving the whole system (3.2.8)-(3.2.17) . . . . 69
3.3.1 The coupling cost and the average drift . . . . 70
3.3.2 The linearized operators . . . . 71
3.3.3 The algorithm for solving (3.2.8)-(3.2.17) . . . . 73
3.4 Numerical simulations . . . . 74
3.4.1 First example . . . . 74
3.4.2 Second example . . . . 82
4 Mean Field Games with monotonous interactions through the law of states and controls of the agents 93 4.1 Introduction . . . . 94
4.2 Assumptions . . . . 97
4.2.1 Notations . . . . 97
4.2.2 Hypotheses . . . . 98
4.2.3 Main results . . . 100
4.2.4 Properties of the Lagrangian and the Hamiltonian in (4.2.3) and (4.2.5)103 4.3 Applications . . . 106
4.3.1 Exhaustible ressource model . . . 106
4.3.2 A model of crowd motion . . . 108
4.4 The fixed point (4.2.5c) and the proof of Lemma 4.2.4 . . . 109
4.4.1 Leray-Schauder Theorem for solving the fixed point in µ . . . 109
4.4.2 The continuity of the fixed point in time . . . 111
4.5 A priori estimates for the solutions to (4.2.5) . . . 112
4.6 Existence and Uniqueness Results . . . 117
4.6.1 Proof of Theorem 4.2.6: existence of solutions to (4.2.5) . . . 117
4.6.2 Proof of Theorem 4.2.7: passing from the torus to R d . . . 118
4.6.3 Proof of Theorem 4.2.8: uniqueness of the solutions to (4.2.3) and (4.2.5) . . . 121
4.6.4 Theorems 4.2.2 and 4.2.3: existence and uniqueness of the solution to (4.1.6) . . . 122
5 On the implementation of a primal-dual algorithm for second order time- dependent mean field games with local couplings 125 5.1 Introduction . . . 126
5.2 Preliminaries and the finite difference scheme . . . 127
5.3 The finite dimensional variational problem and the discrete MFG system . . 129
5.4 A primal-dual algorithm . . . 133
5.5 Preconditioning strategies . . . 135
5.5.1 Multigrid preconditioner . . . 137
5.5.2 Numerical Tests . . . 139
Introduction
La théorie des jeux à champ moyen permet l’étude de systèmes dans lesquels une infinité de joueurs interagissent. Ces joueurs sont supposés indiscernables, interchangeables et parfaitement rationnels. c’est-à-dire que chaque joueur possède un but et agit toujours de manière optimale pour l’atteindre, malgré la présence d’autres joueurs qui sont interchange- ables de son point de vue. Leurs interactions ont lieu à travers des quantités moyennes agrégées qui dépendent symétriquement et faiblement de chaque joueur. De telles interac- tions sont appelées à champ moyen. Cette terminologie vient de la physique statistique et plus particulièrement de l’étude de systèmes mécaniques dans lesquels un grand nombre de particules interagissent (comme les particules subatomiques, ou les étoiles d’une galaxie).
Lorsque le nombre de joueurs est fini, la théorie des jeux s’intéresse souvent aux équili- bres de Nash dont la théorie est antérieure à celle des jeux à champ moyen. Les applications des équilibres de Nash avec un grand nombre de joueurs sont nombreuses et variées. En économie, le comportement d’un agent dépend souvent de quantités macro-économiques dont les valeurs résultent des habitudes de consommation de l’ensemble des agents de manière statistique à travers la loi de l’offre et la demande. En dynamique des populations (humaines, animales, bactériennes . . . ), des phénomènes de foules naissent du mouvement individuel de chaque agent. D’autres exemples viennent des réseaux sociaux, de la finance, de l’économie des énergies fossiles et renouvelables . . . L’apparition de situations d’équilibre dans de tels cas est observée. Cependant, l’analyse théorique de ces problèmes s’avère sou- vent difficile et leur résolution numérique totalement impossible à cause du grand nombre de joueurs. C’est ici que la théorie des jeux à champ moyen apporte une réponse. Le passage à une infinité de joueurs engendre des simplifications permettant l’étude du com- portement statistique des joueurs. La solution d’un jeu à champ moyen peut ensuite être utilisée comme une bonne approximation d’un équilibre de Nash avec un nombre fini de joueurs, lorsque ce nombre est très grand.
La théorie des jeux à champ moyen est assez récente puisqu’elle date des années 2005- 2006, et des travaux indépendants de Jean-Michel Lasry et Pierre-Louis Lions [82, 83, 84], et de Minyi Y. Huang, Peter E. Caines et Roland E. Malhamé [69, 70].
1.1 La théorie des jeux à champ moyen
1.1.1 Le jeu à N joueurs
Nous introduisons ici le cadre mathématique le plus élémentaire possible. Nous considérons
des jeux différentiels, dont la théorie a été introduite par R. Isaac [72] et N.S. Pontryagin
[93]. Dans un jeu différentiel, les variables de temps et d’espace sont continues. On note N > 1 le nombre de joueurs. L’horizon de temps est noté T > 0 et on suppose pour éviter des détails technique que l’état des joueurs évolue dans T d = R d / Z d le tore de dimension d ≥ 1. L’état du joueur d’indice i ∈ {1, 2, . . . , N} varie selon un processus aléatoire noté
X t i
t∈[0,T] qui satisfait l’équation différentielle stochastique suivante, dX t i = α i t dt + √
2νdW t i , X 0 i = x i ∈ T d , où ν > 0 est le coefficient de diffusion, W j
1≤j≤N sont N mouvements browniens in- dépendants, et α i est le contrôle le contrôle du joueur. Nous supposons que α i est un processus markovien dépendant de l’état de tous les joueurs ; en particulier il est de la forme α i t = α i
t,
X t j
1≤j≤N
, où α i est maintenant une fonction mesurable par rapport à la tribu borélienne de [0, T ] × T d N
dans T d . Le joueur d’indice i cherche à minimiser son coût individuel donné par
J
α i , α j
j6=i
= E Z T
0
L t, X t i , α i t , m i t
dt + g X T i , m i T
, où L : [0, T ]× T d × R d × P T d
→ R d est le Lagrangien, g est le coût terminal, m i t = X
j6=i
δ X
jt