Commande prédictive décentralisée pour MAS

multi-agents

4.5 Commande prédictive des systèmes dyna- dyna-miques multi-agents

4.5.3 Commande prédictive décentralisée pour MAS

Un premier essai pour réduire la complexité du problème de commande pré-dictive centralisée a été l’utilisation des techniques distribuées qui permettent de décomposer le problème en sous-problèmes et résoudre ces sous-problèmes plus simples jusqu’à trouver un consensus. Dans la suite, afin de diminuer la complexité du problème distribué, nous faisons l’hypothèse que les agents

ne cherchent pas à obtenir un consensus. Cela se traduit par une approche décentralisée, où chaque agent a sa propre loi de commande, avec un échange minimal d’informations avec les autres agents. Une première approche dé-centralisée que nous avons proposée [70] impose des priorités aux agents, par exemple des configurations de type leader-suiveur (“leader-follower”). Une deuxième approche décentralisée à base de champ de potentiel attractif ou répulsif est également explorée [74], [73].

4.5.3.1 Approche décentralisée à base des priorités

Une manière simple de réduire la charge de calcul par une approche décen-tralisée [70] est de ne pas prendre en compte des contraintes d’évitement des collisions dans le problème d’optimisation. Cela peut se faire en imposant a priori des priorités aux agents, par exemple comme montré Figure 4.9. Ainsi l’agent numéro 1 doit suivre une trajectoire, tandis que les autres agents res-tent autour de lui à une distance pré-imposée. Dans cette figure, les agents (considérés homogènes ici) sont représentés par des points entourés par leurs régions de sécurité. En pointillé, nous avons représenté les couloirs permis pour le déplacement de chaque agent autour de l’agent central.

Figure 4.9 – Contraintes de priorité imposées dans une approche décentra-lisée.

Même si en pratique cette approche semble marcher assez bien, l’incon-vénient est que la formation ne peut pas être étroite. Une nouvelle approche à base de champ de potentiel est proposée dans la sous-section suivante.

4.5.3.2 Approche décentralisée à base de champ de potentiel Cette approche de commande prédictive décentralisée à base de champ de potentiel permet de synthétiser une loi de commande uniquement à partir des informations locales au sein de la formation d’agents. L’évitement des collisions se fait à l’aide des champs de potentiel répulsifs. Les champs de potentiel attractifs permettent de garder les agents en formation. L’utilisation des champs de potentiel permet de réduire la complexité de calcul par rapport aux techniques précédentes à base de MIP, en revanche la preuve de stabilité reste difficile.

Plusieurs méthodes pour éviter les collisions en utilisant des champs de potentiel existent dans la littérature : par exemple des approches à base de gradient [39], des approches à base de fonctions de navigation [79] (qui, de plus, ont l’avantage d’éviter les minima locaux et l’inconvénient d’une charge importante de calcul).

Dans la suite nous allons considérer une méthode qui permet de combiner la commande prédictive décentralisée (utilisant les informations locales sur les voisins) et la méthode de champ de potentiel. Cette approche s’inscrit également dans le cadre des approches de type leader-suiveur. Dans ce cas, le leader suit la trajectoire et les suiveurs maintiennent la formation autour du leader.

La loi de commande prédictive pour le leader peut être formulée de la manière suivante :

u^∗_L= arg min

u_L J_L(x_L(k + N_p,L|k), u_L(k + N_p,L− 1|k)) sous les contraintes :

x_L(k + l + 1|k) = A_Lx_L(k + l|k) + B_Lu_L(k + l|k), l = 0, . . . , N_p, L − 1 x_L(k + l|k) ∈ X_L, l = 1, . . . , N_p, L u_L(k + l|k) ∈ U_L, l = 1, . . . , Np,_L (4.37) avec l’indice L utilisé pour désigner le leader de la formation et l’horizon de prédiction pour le leader N_p,L. Le critère J_L est donné par :

avec les matrices de pondération ˜P = ˜P^> 0, ˜Q = ˜Q^> 0 et ˜R 0. La loi de commande pour les suiveurs est calculée comme :

u^∗ = arg min ui N_p,F−1 P l=0 V_i(p_i(k + l|k), v_i(k + l|k)) sous les contraintes :

xi(k + l + 1|k) = Aixi(k + l|k) + Biui(k + l|k), l = 0, . . . , Np,_F− 1 x_i(k + l|k) ∈ X_L, l = 1, . . . , N_p, F u_i(k + l|k) ∈ U_L, l = 1, . . . , N_p, F (4.39) où l’indice F désigne les suiveurs, Np,_Fest l’horizon de prédiction des suiveurs. La fonction de potentiel V_i(p_i, v_i) (en fonction de la position p_i et de la vitesse v_i) est donnée par :

V_i(p_i, v_i) = β_rV_i,r(p_i) + β_aV_i,a(p_i, v_i), ∀i ∈ N_i (4.40) avec βr, βa des coefficients de pondération.

Les potentiels répulsifs de l’agent i par rapport à ses voisins j sont notés par Vi,r(p_i) = P

j∈Ni

V_ij,r(p_i). Plusieurs choix sont possibles pour V_ij,r(p_i), i 6= j, i 6= L, par exemple une formulation à l’aide d’une fonction polyhèdrale7[12] :

V_ij,r(p_i) = c₁e^−(µ(pi)−c2)2

, où µ(x) = F_ix, ∀x ∈ X_i, i ∈ N_i (4.41) ou à l’aide d’une fonction somme (“sum function”) [16] :

V_ij,r(p_i) = ^c¹ (c₂+ ψ_ij(p_i))2, où ψ_ij(x) = Ni X i=1 (h_ix − k_i+ |h_ix − k_i|), ∀x ∈ X_i (4.42) avec c₁, c₂ > 0 des constantes. Les Figures 4.10a, b montrent une fonction polyhèdrale avec respectivement un potentiel répulsif construit à base d’une fonction polyhèdrale. Une fonction de type “sum function” est représentée Figure 4.11.a et un potentiel répulsif construit à l’aide de cette fonction est proposé Figure 4.11.b.

Un ensemble convexe borné S induit une fonction de Minkowski µ(x) : Rⁿ → R définie comme µ(x) = inf {α ∈ R+: x ∈ αS}. Une fonction polyhèdrale µ(x) : Rⁿ → R, avec µ(x) = kF xk_∞, est une fonction Minkowski de l’ensemble polyhèdral convexe borné S = {x ∈ Rn : h_ix < ki, , i = 1, . . . , N }, avec la matrice F ∈ RN ×n de type “full column matrix” donnée par F_i= h_i/k_i, i = 1, . . . , N .

Figure 4.10 – Exemple d’un potentiel répulsif à base de fonction polyhè-drale.

Figure 4.11 – Exemple d’un potentiel répulsif à base de “sum function”.

Les potentiels attractifs donnés par V_i,a(p_i, v_i) = P j∈Ni

V_ij,a(p_i, v_i)+kp_L− p_ik, ∀i ∈ Ni with i 6= L, permettent aux agents suiveurs de rester dans une for-mation et, en même temps, de suivre le leader. Parmi les choix possibles, nous avons considéré :

V_ij,a(p_i, v_i) = log(ψ²(p_i)) + β_v(v_i− v_j) (4.43) avec β_rune pondération pour laquelle les vitesses des agents se synchronisent. Dans les techniques à base de champ de potentiel, le réglage des para-mètres est important. Dans la pratique, les constantes c₁, c₂et β_rsont choisies

entre 0, 1 et 1, tandis que les constants βa et βv sont plutôt choisies de entre 10 et 20. Une analyse de choix de ces paramètres est proposée par [107], [5]. L’application des techniques de commande prédictive pour des systèmes multi-agents est illustrée dans la section suivante.

4.6 Applications

Cette section regroupe plusieurs simulations, ainsi que des applications réelles sur des drones, en utilisant les techniques proposées dans ce chapitre.

Dans le document Contributions à l’estimation robuste et à la commande prédictive robuste par méthodes ensemblistes (Page 151-156)