• Aucun résultat trouvé

4.1.1 Introduction

Supposons que K ≥ 2 agents jouent un jeu répété de long terme. La caractérisation des utili-tés d’équilibre d’un jeu répété est très liée aux hypothèses faites sur les capaciutili-tés d’observations des agents. En effet, considérons par exemple la stratégie « grim trigger » : un agent coopère tant

qu’aucun agent ne trahit, mais dès lors qu’un agent dévie de la stratégie coopérative, l’agent utilisant « grim trigger » va sanctionner le déviateur en jouant une stratégie de punition sur toutes les étapes restantes du jeu. Cette stratégie est utilisée pour prouver le théorème Folk non

parfait [75]. Elle n’est cependant possible que si une déviation d’un agent est détectée, ce qui

suppose une certaine observation des actions passées des autres agents.

Dans ce chapitre, nous faisons l’hypothèse que les agents ont une structure d’observation quel-conque, qui en toute généralité ne garantit pas de détecter les déviations. Nous ajoutons de plus un encodeur, qui permettra de transformer la structure d’observation initiale en une nouvelle structure que nous choisirons. Cet encodeur observe parfaitement les actions passées de tous les agents, que nous voyons comme une source d’information à transmettre. Cette source est plus générale que dans les chapitres précédents, car nous relâchons en partie l’hypothèse selon laquelle la distribution de probabilité de cette source est connaissance commune à tous les agents du sys-tème ainsi qu’à l’encodeur. Nous supposons que cette source d’information a K composantes et qu’une de ses composantes, la i-ème par exemple, a une distribution de probabilité connue seule-ment de l’Agent i. Cette hypothèse transcrit le fait qu’un agent peut dévier arbitraireseule-ment, et nous concevrons un code qui devra être robuste fasse à n’importe quelle distribution (déviation) utilisée par l’Agent i.

Nous nous focalisons sur les déviations unilatérales des agents puisque nous voulons reconstruire une structure d’observation qui permet d’avoir une caractérisation des utilités d’équilibre de Nash uniforme. Ce travail est un premier pas et une extension possible sera de considérer une coalition d’agents qui dévient de manière coopérative de sorte que la déviation bénéficie à tous les agents de la coalition. Le concept de solution qu’il faudra alors considérer est l’équilibre de Nash fort32

. Il est important de noter que dans notre modèle l’encodeur ne cherche pas simplement à transmettre la source. Son rôle est en fait double : premièrement, le code conçu doit être fiable et doit permettre de garantir la nouvelle structure d’observation. Deuxièmement, ce code doit avoir une complexité minimale, c’est-à-dire que nous cherchons le taux optimal qui permet de passer de la structure d’observation quelconque à la nouvelle structure (après transformation). Les signaux reçus par les agents doivent être complémentaires de leurs signaux privés et la source d’information doit être envoyée de la manière la plus concise possible.

Le taux minimal sera caractérisé par une contrainte d’information, qui dépendra fortement de l’hypothèse faite sur la source concernant les possibilités de déviation des agents. Cette hypothèse amènera un coût en terme d’efficacité de compression. Elle dépendra également de la structure que nous voulons atteindre. Ici, nous nous concentrerons sur la manière d’assurer l’observation parfaite pour tous les agents. Retrouver l’observation parfaite pour tous les agents est très im-portant d’un point de vue de la théorie des jeux, car grâce à cette hypothèse il est possible de caractériser les paiements d’équilibre d’un jeu répété de long terme. Cette condition suffisante

permet d’obtenir un théorème Folk (voir le théorème B.34). Cela permet également d’avoir

un ensemble d’équilibres contenant des équilibres efficaces, ce qui peut faire défaut lorsque les agents sont « aveugles » [3]. La condition d’observation parfaite est une condition forte. Une des extensions possibles serait de rétablir une condition moins contraignante, mais qui permet éga-lement d’obtenir un théorème Folk. Par exemple la condition « 2-connected observation graph » définie dans [74].

Dans ce chapitre, nous caractérisons la contrainte d’information qui permet de reconstruire

l’observation parfaite virtuelle (Définition 4.3), en donnant une condition suffisante (Section

4.1. Motivation et état de l’art

4.3.2) et nécessaire (Section 4.3.3). Cette condition permet de caractériser complètement la ca-pacité du système considéré.

Nous appliquons enfin ce cadre à un exemple de jeu répété (Section 4.4).

4.1.2 Etat de l’art

Dans ce chapitre, nous généralisons le résultat de [60]. Dans cet article, les auteurs consi-dèrent des jeux avec structure d’observation arbitraire. Les agents n’observent pas parfaitement les actions passées des autres agents, ils reçoivent simplement un signal privé via une structure d’observation fixée. L’ajout d’un encodeur qui aidera à rétablir l’observation parfaite est alors considéré, et cet encodeur enverra un signal public, qui sera observé de manière parfaite par tous les agents. L’encodeur est supposé observer parfaitement les actions de tous les agents ainsi que la structure d’observation, et a pour seul but d’améliorer les capacités d’observation des agents. Une condition suffisante sur le nombre de messages nécessaires pour reconstruire l’information est donnée. Cette condition est une contrainte d’information, et nous la généralisons [60] en sup-posant que l’encodeur choisit une certaine séquence qui sera l’entrée d’un canal de diffusion, et chaque agent reçoit une sortie de ce canal (bruité), qui sera son signal additionnel privé. Ceci est détaillé en Figure 4.1.

Dans ce modèle, nous considérons également qu’un des agents peut « dévier », c’est-à-dire que la distribution de probabilité sur sa séquence d’actions n’est connue que de lui. Ceci est diffé-rent par rapport au cas où la distribution de probabilité de la source est connaissance commune pour tous les agents du système. Ici, cette distribution peut varier arbitrairement. Les sources aux variations arbitraires sont étudiées en théorie de l’information, notamment dans [1,2], nous

permettant donc d’utiliser ce cadre comme cela été fait dans [60]. L’encodeur sera alors robuste

au déviation d’un agent. Pour une source « classique », c’est-à-dire aux variations connues, une des principales techniques de preuve des théorèmes de codage est la méthode des types (voir SectionA.3). Cette méthode suppose connue la distribution de probabilité de la source, elle n’est donc pas adaptée aux sources aux variations arbitraires, pour lesquelles d’autres techniques sont utilisées.

Nous supposons ici qu’un seul agent peut dévier. En effet, comme expliqué précédemment, la no-tion d’équilibre uniforme dans les jeux répétés s’intéresse uniquement aux déviano-tions unilatérales, même si le jeu se déroule sur plusieurs étapes. Si nous voulons être robustes à des déviations de plusieurs agents, il faudra préciser la notion d’équilibre correspondante.

Le fait d’ajouter un canal de diffusion (voir Section A.5) amène des difficultés

supplémen-taires pour les schémas de codage. En effet, lorsque le nombre d’agents (d’utilisateurs) est K = 2, utiliser des codes source et canal séparés est optimal et il est donc possible de s’y restreindre pour atteindre la capacité du canal. Ce résultat est notamment utilisé dans [61] pour caractériser la capacité d’un système à deux utilisateurs et un espion. En revanche, pour un nombre d’utili-sateur supérieur, K > 2, cela ne résout pas entièrement le problème, il y a une perte à séparer les deux codes. Or, pour un cas particulier du canal de diffusion avec une source commune pour

tous les agents, il est prouvé dans [84] qu’utiliser un code source-canal conjoint amène à une

caractérisation des taux (canal) atteignables. C’est un résultat important car c’est le premier pour lequel un code source-canal conjoint caractérise complètement les taux atteignables alors que la caractérisation pour des codages séparés est inconnue. Comme notre modèle correspond à ce cas particulier de canal de diffusion avec source commune, il n’est donc pas nécessaire de connaître la capacité du canal de diffusion général (avec messages privés). La capacité d’un tel

canal est encore inconnue à ce jour à part pour des cas particuliers comme par exemple le cas de dégradation physique [40].

Pour prouver que la contrainte d’information est suffisante, nous allons créer un code hybride

qui utilisera le schéma de codage pour une source aux variations arbitraires (utilisé dans [60])

combiné au schéma de codage source-canal conjoint de Tuncel [84].