• Aucun résultat trouvé

0 0.2 0.4 0.6 0.8 1

b = 0.001 b = 0.1 b = 2

Figure 3.3 – Partitions optimales de taille 5 : pour M = 5, nous avons représenté les

partitions optimales pour les valeurs du paramètre b suivantes : b ∈ {0.001, 0.1, 2}. La distribution de probabilité prise sur l’état (le besoin) est la probabilité uniforme.

0 0.2 0.4 0.6 0.8 1

p∼U([0, 1]) p∼N[0,1](0.5, 0.1) p∼N[0,1](0.5, 0.05)

Figure 3.4 – Partitions optimales en fonction de la probabilité sur l’état : pour un

nombre de messages M = 5, un biais b = 0.1, nous faisons varier la distribution de probabilité

p(·) : nous prenons une loi normale avec deux variances différentes (0.05 et 0.1) ainsi que la

probabilité uniforme sur [0, 1].

3.3 Résultats théoriques

3.3.1 Le cas de la dimension 1

Nous détaillons ici les résultats théoriques que nous avons dans le cas scalaire, c’est-à-dire pour T = 1. Premièrement, nous commençons par énoncer un résultat d’existence d’équilibre de Nash mixte dans notre modèle, pour un nombre de messages M fixé.

Proposition 3.1 (Existence). Pour tout M fixé, il existe un équilibre de Nash mixte avec M

messages.

Ce résultat d’existence ne garantit pas qu’un équilibre partitionnel de n’importe quelle taille existe. En effet, il peut y avoir des cellules de la partition qui dégénèrent, c’est-à-dire dont le poids tend vers 0, ce qui implique que les messages associés à ces cellules sont envoyés avec probabilité nulle. Le nombre de cellules (messages/actions) peut donc être borné.

Si nous supposons de plus que les fonctions d’utilités des deux agents sont concaves, alors les

équilibres de Nash seront purs comme dans [27], qui donne une méthode constructive pour les

expliciter.

Nous exhibons de plus une condition suffisante d’unicité de l’équilibre, dans le cas où la fonction de coût c(·) est quadratique. Cette condition sera vérifiée dans des cas pratiques d’un intérêt important pour les réseaux de véhicules électriques. Elle est de plus moins restrictive que celle de [27], qui suppose également que les fonctions d’utilités ne dépendent que de la différence s− a entre le besoin et l’action.

Proposition 3.2 (Condition suffisante d’unicité de l’équilibre). Supposons que la fonction de

coût c est quadratique, c’est-à-dire : c(a) = ∥a∥2

2 = a2. Définissons

pmax = arg max

et

pmin= arg min

s∈[0,1] p(s) (3.35)

Si

pmax

pmin1 + b (3.36)

et le nombre de messages M est fixé, alors l’équilibre de Nash de taille M est unique.

Maintenant que nous avons montré l’existence et l’unicité (dans certains cas) de l’équilibre de Nash, une question fondamentale est de trouver une méthode efficace pour les calculer. Nous analysons donc dans la suite la dynamique de meilleure réponse pour un nombre de messages M fixé, et nous montrons qu’elle converge si une hypothèse (raisonnable) est faite sur la distribution de probabilité du besoin du consommateur.

Pour commencer, nous devons prouver quelques propriétés utiles sur la dynamique dans notre contexte. Premièrement, il est possible d’exhiber une forme explicite des meilleures réponses des deux agents (toujours dans le cas de la dimension un). C’est ce que caractérise la proposition suivante :

Proposition 3.3 (Caractérisation explicite des meilleures réponses). Supposons que p(·) > 0,

que le nombre de messages M est fixé, et que la fonction de coût c est convexe et strictement croissante. Alors les meilleures réponses du consommateur et de l’agrégateur sont respectivement :

BRC(a) = (sm)m∈{0,...,M} (3.37) ! ⎧ ⎪ ⎨ ⎪ ⎩ 0 si m = 0 am+am+1 2 si 1 ≤ m ≤ M − 1 1 si m = M , (3.38) et BRA(s)! M max(0, h−1(2 Fsm sm−1vp(v)dv Fsm sm−1p(v)dv )) N m∈{1,...,M} (3.39) où nous définissons la fonction : h : a -−→ 2a + bc(a).

Notons que la meilleure réponse du consommateur est exactement une partition de Voronoï.

Observons également que dans le cas où la fonction de coût est c(a) = a2, la meilleure réponse

de l’agrégateur se réduit à la forme

BRA(s) = M Fsm sm−1sp(s)ds (1 + b)Fsm sm−1p(s)ds N m∈{1,...,M} (3.40) qui devient, quand b = 0 :

BRA(s) = MFsm sm−1sp(s)ds Fsm sm−1p(s)ds N m∈{1,...,M} (3.41)

3.3. Résultats théoriques qui est exactement ce que nous trouvons en quantification.

Nous regardons maintenant la notion de dégénérescence des cellules [36] : une cellule dégénère si ses points extrêmes sont confondus. Dans le cas de la dimension un, cela veut dire que, pour m ∈ {0, 1, . . . , M} si sm−1 = sm alors la cellule [sm−1, sm] est dégénérée. C’est une notion très importante pour que la dynamique de meilleure réponse soit bien définie à chaque itération et que le calcul des intégrales soit possible. Les auteurs de [36] font un raisonnement similaire dans le cas de la quantification et trouve une borne uniforme sur la taille des cellules.

En utilisant la caractérisation des meilleures réponses, nous pouvons prouver maintenant une propriété fondamentale de la dynamique de meilleure réponse, concernant l’ordre de dégé-nérescence des cellules de la partition utilisée par le consommateur à l’équilibre. La proposition suivante indique que, si des cellules dégénèrent, alors ces cellules doivent forcément être celles les plus proches de zéro :

Proposition 3.4 (Ordre de dégénérescence de la partition du consommateur). Supposons que

p(·) > 0 et que la fonction de coût c est convexe. Alors, si des cellules de la partition dégénèrent pendant la dynamique de meilleure réponse, c’est-à-dire si s(n)m−1 = s(n)m pour une certaine étape n du processus itératif, alors elles dégénèrent dans l’ordre croissant en partant de la cellule la plus proche de zéro.

Notons ici que nous prouvons que si des cellules dégénèrent, elles le font en zéro. Ceci est dû au cas particulier de fonctions d’utilité choisies dans ce chapitre, et le fait que le biais b est choisi strictement plus grand que zéro. Pour d’autres fonctions d’utilités, il peut arriver que les points extrêmes des intervalles d’une partition d’équilibre se regroupent en un, ou à un autre point entre zéro et un. Ceci est en fait lié au sens du biais comme défini dans [45] : le sens du biais nous permet de savoir où la dégénérescence des cellules va se produire.

Nous pouvons maintenant énoncer une condition suffisante pour avoir des cellules de la parti-tion du consommateur qui ne dégénèrent jamais au cours de la dynamique de meilleures réponses, c’est-à-dire ∀n, s(n)1 > 0.

Proposition 3.5 (Condition suffisante de non-dégénérescence des partitions pendant la

dyna-mique de meilleure réponse). Fixons M ∈ N. Supposons que p(·) > 0 et que la fonction de coût

c est convexe. Si c(0) = 0, alors les partitions d’équilibre ne dégénèrent pas tout au long de la dynamique de meilleure réponse.

Lorsque cette condition suffisante sera vérifiée, la dynamique de meilleure réponse sera bien définie à chaque itération. Ce qui est essentiel pour le théorème suivant sur la convergence de la dynamique. Pour cela nous avons besoin d’un lemme, qui montre qu’un résultat proposé par [86], peut être étendu au cadre étudié ici :

Lemme 3.6 (Wu [86]). Fixons le nombre M de messages et considérons les fonctions d’utilités

(3.9) et (3.10). Si les actions de l’agrégateur (respectivement les points extrêmes des intervalles de la partition du consommateur) sont croissantes comme une fonction des points extrêmes de l’intervalle auquel il est associé (respectivement des actions), alors l’algorithme de Lloyd-Max converge.

La preuve est la même que celle proposée dans [86], qui considère le cas où les agents

doit appartenir à une classe de fonctions qui dépend de la réalisation de l’état s, de la différence entre cette réalisation et l’action a, et doit être symétrique en s−a. Si b = 0, notre fonction vérifie bien cela. Nous étendons cela au cas général b ≥ 0 en utilisant la preuve pour deux fonctions d’utilités distinctes.

Nous avons finalement le résultat suivant sur la convergence de la dynamique de meilleure réponse :

Théorème 3.7 (Convergence de la dynamique de meilleure réponse). Supposons que p(·) est une

densité de probabilité continue et strictement positive sur [0, 1], et que la dynamique de meilleure réponse est bien définie à chaque itération. Alors cette dynamique converge.

Il est très important pour l’application pratique d’avoir la convergence de la dynamique de

meilleure réponse, comme nous le verrons en section 3.4.

3.3.2 Discussion en dimension supérieure

Pour étudier ce modèle en dimension quelconque T ≥ 1, de nouveaux problèmes se posent. Pour commencer, les objets à manipuler sont bien plus complexes, notamment les stratégies (et les espaces dans lesquels elles vivent) qui sont des vecteurs de vecteurs (voir par exemple les équations (3.9) et (3.10)). Les théorèmes d’existence d’équilibres de Nash ainsi que ceux de convergence de la dynamique de meilleure réponse ne s’étendent pas de manière triviale.

De plus, [52] est un des seuls articles qui traite de la dimension T quelconque, et ce pour une

unique fonction d’utilité, donc un cas particulier de jeu. Le fait que les utilités soient les mêmes pour les deux agents permet d’avoir un jeu de potentiel et d’utiliser les propriétés de ce jeu, ce qui n’est plus possible lorsque les deux agents ont chacun leur utilité propre.

Enfin, d’un point de vue numérique, trouver les cellules de la partition (qui sont des polytopes

convexes) n’est pas un problème compliqué29

, en revanche calculer leur volume pour pouvoir connaître la valeur de l’utilité des agents est un problème difficile [53] [59] . Il existe cependant des algorithmes pratiques se basant sur des méthodes de Monte-Carlo pour estimer avec une précision arbitrairement faible ces volumes [35] [41]. Ces méthodes pratiques convergent de plus en temps polynomial. Nous les utilisons pour notre application numérique lorsque T > 1.