• Aucun résultat trouvé

2.2 Partage du spectre ASM robuste et décentralisé

2.2.3 Solution du jeu de maximisation du débit

Meilleure réponse et équilibre de Nash

Le problème de maximisation compétitive (2.3) exprimé par le jeu G peut être résolu grâce à l’équilibre de Nash. En théorie des jeux, cette équilibre est un concept de solution qui est optimal au sens de la maximisation égoïste de l’utilité de chaque joueur. Dans notre cas, il est défini comme suit :

Définition 2.2.1 Un équilibre de Nash du jeu G défini par (2.5) est un profil

d’allo-cations de puissance p? tel qu’on ait ∀i ∈ I et ∀pi ∈ Pi

ui(p?i, p?−i) ≥ ui(pi, p?−i). (2.14)

Dans le contexte du présent problème, cette définition signifie que les joueurs sont en équilibre de Nash dès lors qu’aucun d’entre eux ne peut dévier unilatéralement du profil d’équilibre p? = p? T

1 , · · · , p? T I

T

sans que sa fonction d’utilité ne décroisse. Pour le jeux G, l’existence d’au moins un équilibre de Nash est garanti par le théorème de Debreu, Glicksberg and Fan [Fudenberg91, Theorem 1.2]. Une autre interprétation de la solution de Nash peut être formulée en définissant le concept de meilleure réponse :

36

CHAPITRE 2. SYSTÈMES DE COMMUNICATIONS ASM AUTO-RECONFIGURABLES ET ADAPTATIFS À L’ENVIRONNEMENT

Définition 2.2.2 Soit le jeu G = (I, P, (ui)i∈I) et un joueur i ∈ I. Étant donné un

profil de stratégies (pures) des adversaires de i noté p−i ∈ Pp−i, les meilleures réponses de i à p−i sont dans l’ensemble BRi(p−i) défini par

BRi(p−i)=p?

i ∈ RN

+ : ui(p?i, p−i) ≥ ui(pi, p−i), ∀ pi ∈ Pi . (2.15) À l’équilibre de Nash, tous les joueurs de I jouent donc une meilleure réponse aux meilleures réponses jouées par leurs adversaires, c’est à dire que le profil d’équilibre p? vérifie p?

i ∈ BRi(p?

−i).

La meilleure réponse d’un joueur i quelconque à la stratégie p−i de ses adversaires

est l’unique solution de (2.3) et peut être obtenue en résolvant le système d’équa-tions données par les condid’équa-tions de Karush-Kuhn-Tucker associées à ce problème. Ceci conduit à la solution de water-filling donnée ∀i ∈ I, et pour un p−i fixé, par

pi(n)? =  λi1 γi(n) + , ∀n ∈ N , (2.16) où [x]+

= max(0, x), γi(n)est donné par l’équation (2.12), et λi est le multiplicateur de Lagrange devant être choisi de manière à saturer la contrainte de puissance (2.1). Un

équilibre de Nash du jeu G est donc tout vecteur p? tel que tous les joueurs jouent une

allocation de puissance p?

i qui vérifie l’ensemble d’équations de water-filling donnée par (2.16), étant donnée l’état statistique de leur canal respectif.

Dans la pratique, les équilibres de Nash émergent à la suite d’un processus d’appren-tissage au cours duquel les joueurs interagissent en jouant leurs meilleures réponses ité-rativement [Fudenberg98]. Dans le contexte du jeu de partage de spectre, cela consiste à mettre en œuvre un algorithme de water-filling itératif et distribué parmi les joueurs. Le water-filling séquentiel est considéré où les joueurs mettent à jour leur stratégie d’al-location de puissance les uns après les autres en fonction de la solution (2.16). Cette implémentation particulière n’exige pas de synchronisation explicite entre les liens de communication si nous supposons simplement que les systèmes ont la même fréquence de mise à jour mais commencent leur transmission à des moments différents. Ce choix est principalement motivé par la facilité d’implémentation qu’il offre. Cependant, un schéma de mise à jour totalement asynchrone est également possible lorsque les utilisa-teurs ont différentes périodes de mise à jour [Scutari08]. En général, la convergence des algorithmes de meilleures réponses tels que proposé n’est pas garantie [Bacci16]. De plus, selon les conditions du canal, plusieurs équilibres de Nash peuvent exister au sein du jeu G. Des conditions suffisantes pour l’unicité d’un équilibre et pour la convergence de l’algorithme utilisé sont proposées dans [Pottier17].

Incertitude sur les statistiques du canal

La résolution du jeu de partage de spectre tel que présenté jusqu’ici requiert des joueurs une connaissance parfaite des statistiques de leur canal. Dans une situation pratique, les récepteurs auraient à les estimer avec des symboles pilotes insérés en début

de chaque trame. Quel que soit l’estimateur de γi(n) mis en œuvre par le récepteur

2.2. PARTAGE DU SPECTRE ASM ROBUSTE ET DÉCENTRALISÉ 37

alors imparfaite. Face aux erreurs d’estimation, il est néanmoins possible d’adopter une approche robuste similaire à celle présentée à la section 2.2.2. On va donc formuler ici un nouveau problème d’optimisation robuste contre l’erreur d’estimation la plus pénalisante.

On considère l’estimateur ˆγi(n) de γi(n) variable aléatoire absolument continue de variance finie telle que ∀ n = 1, · · · , N nous avons

E {ˆγi(n)} = γi(n) (2.17)

σˆγ2

i(n) = E (ˆγi(n) − γi(n))2 . (2.18)

L’estimateur est supposé non biaisé. L’incertitude sur l’estimation de l’état statistique

du canal est contenue dans la variance d’estimation σ2

ˆ

γi(n). On considère que l’estima-teur produit des erreurs bornées et on définit l’ensemble des états statistiques du canal du joueur i pour lesquels l’erreur d’estimation est bornée par

Γi =i ∈ RN

+ : |ˆγi(n) − γi(n)| ≤ i(n), ∀ n = 1, · · · , N , (2.19)

où i(n) est la borne d’incertitude à la sous porteuse n. L’hypothèse posée est

rai-sonnable puisque l’incertitude sur une variable aléatoire quelconque peut être bornée avec une forte probabilité en vertu de l’inégalité de Bienaymé-Chebychev. Pour tout i(n) ∈ R+ et quelle que soit la loi de probabilité de ˆγi(n) (avec σ2

ˆ γi(n) < ∞), nous avons : P [|ˆγi(n) − γi(n)| ≤ i(n)] ≥ 1 −σ 2 ˆ γi(n) 2 i(n) . (2.20)

L’incertitude sur l’estimation de l’état du canal peut donc être prise en compte dans le problème de partage de spectre en maximisant une utilité minimisée vis-à-vis de l’erreur d’estimation la plus préjudiciable. Le jeu robuste, noté ˜G, est alors défini par le tripet

˜

G = {I, P, ˜u} , (2.21)

où ˜u = {˜ui}i∈I sont de nouvelles fonctions d’utilité qu’on exprime au travers de la

minimisation : ˜ ui(pi, p−i)= min γi∈Γiα N X n=1 log (1 + γi(n)pi(n)) = α N X n=1 log 1 + [ˆγi(n) − i(n)]+pi(n) . (2.22)

La résolution de ce nouveau jeu par l’équilibre de Nash à travers le calcul des meilleures réponses amène à une solution que l’on appellera water-filling robuste et qui s’ exprime comme : ˜ p?i(n) =  λi1 [ˆγi(n) − i(n)]+ + , ∀ n ∈ {1, · · · , N } . (2.23)

Le jeu robuste présenté ici peut s’interpréter comme une pénalisation de la fonction d’utilité originale ui par un terme représentant l’incertitude sur l’état des sous-canaux

38

CHAPITRE 2. SYSTÈMES DE COMMUNICATIONS ASM AUTO-RECONFIGURABLES ET ADAPTATIFS À L’ENVIRONNEMENT

n ∈ N. Un tel mécanisme a pour effet de forcer les émetteurs a n’allouer leur puissance

disponible que sur les sous-porteuses dont le rapport signal sur interférence plus bruit est le meilleur. Comme les résultats le montreront, ce genre de comportement peut avoir l’avantage de conduire les joueurs vers un partage de spectre plus efficace que l’équilibre de Nash du jeu G sous connaissance parfaite de l’état du canal. Lorsqu’un joueur ne gaspille plus sa puissance sur un sous-canal de faible qualité, il génère ainsi moins d’interférences et le libère pour les joueurs adverses.