Techniques de distribution - Commande distribu´ee

2.2 Contrˆ ole pr´edictif pour les syst`emes de grande taille

2.2.3 Commande distribu´ee

2.2.3.3 Techniques de distribution

Concernant les aspects algorithmiques, l’état de l’art de R. Scattolini, [166], suggère trois critères pour classer les structures MPC distribuées.

1. Premièrement, en fonction de la topologie du réseau de communication, les deux cas suivants peuvent être considérés :

– algorithmes complètement connectés, dans lesquels l’information est envoyée (et re¸cue) de tous les contrôleurs locaux vers tous les autres

– algorithmes partiellement connectés, dans lesquels l’information est envoyée (et re¸cue) de tous les contrôleurs locaux seulement vers un sous-ensemble des autres agents.

Sans doute les structures topologiques partiellement connectées sont plus séduisantes du point de vue de l’implantation, tout spécialement dans le cas des systèmes de grande taille. Néanmoins, la topologique de communication entre les agents suit, naturellement, celle des interconnexions entre les sous-systèmes.

2. Un aspect essentiel des algorithmes distribués réside dans l’échange d’informations entre les contrôleurs. C’est d’ailleurs le détail qui fait la distinction entre les approches

distribuées et celles complètement décentralisées. Le nombre d’échanges d’informa-tion par période d’échantillonnage constitue alors un autre critère de classificad’informa-tion. Ainsi, on peut différencier :

– algorithmes non itératifs, dans lesquels l’information est envoyée (et re¸cue) une seule fois par instant d’échantillonnage

– algorithmes itératifs, dans lesquels l’information est envoyée (et re¸cue) plusieurs fois par instant d’échantillonnage.

3. Typiquement, les algorithmes itératifs sont construits pour converger vers un consen-sus global ou un point d’équilibre (de Nash). À cet égard, une troisième classification peut être considérée :

– algorithmes communiquants, dans lesquels chaque contrôleur minimise un critère local, en prenant en compte l’influence des autres sous-systèmes sur ses propres variables

– algorithmes coopératifs, dans lesquels chaque contrôleur local minimise un critère qui prend également en compte l’effet des actions locales sur l’objectif global. Cette dernière classification a, probablement, les conséquences les plus importantes sur la complexité des correcteurs locaux. En réduisant les connaissances du contrôleur local à son propre modèle de prédiction et à la fonction de coût locale, le comportement des agents sera caractérisé par des actions égo¨ıstes. C’est le cas des algorithmes de communication itératifs, qui convergent généralement vers un point d’équilibre, ou un point de Nash [132], spécifique à la théorie des jeux [18].

Dans cette catégorie, rappelons les travaux de [86, 31] qui présentent des algorithmes communiquants. Une contrainte sur la matrice globale d’état est utilisée pour garantir la stabilité nominale en boucle fermée. Une structure distribuée, dans laquelle les interactions entre les sous-systèmes sont traitées comme des incertitudes bornées, est décrite dans [85]. Chaque contrôleur impose des contraintes locales sur ses propres états, contraintes qui seront utilisées par les autres agents afin de formuler un problème de type min-max. La preuve de stabilité est obtenue en bornant l’ensemble des contraintes sur l’état. Dans [131], un autre algorithme indépendant est présenté dans le cadre sans contrainte. L’article propose également une méthode afin de partitionner un système global en sous-systèmes, par l’utilisation de la norme de Hankel, qui exprime l’énergie des paires entrée/sortie. Dans le même cadre de travail, des conditions nécessaires et suffisantes pour la convergence et la stabilité nominale sont déterminées dans [51, 98], utilisant la solution analytique du problème d’optimisation quadratique. La stabilité de la boucle fermée est également étudiée pour l’algorithme équivalent, non itératif. Des conditions similaires sont montrées dans [68]. De plus, un retard d’un pas d’échantillonnage, correspondant à l’échange d’information, est ajouté dans [180].

Les travaux de [11] présentent une méthode de sélection de la structure de contrôle (parmi le MPC centralisé, l’algorithme distribué indépendant et la structure décentralisée).

de commande, en fonction de la marge de robustesse et de la connectivit´e entre les sous-syst`emes.

L’objectif des algorithmes coopératifs est d’assurer la convergence vers la solution op-timale globale. Généralement, pour atteindre ce but, les contrôleurs locaux doivent agir de fa¸con altruiste, ce qui suppose l’inclusion dans les fonctions de coût locales des termes liés aux objectifs des autres agents.

Ainsi, l’algorithme coopératifs proposé dans [184] implique la connaissance locale du modèle complet du système, afin que la fonction de coût globale soit minimisée locale-ment. Dans l’approche présentée, de nombreuses propriétés intéressantes sont prouvées comme la convergence de l’algorithme vers la solution optimale globale, mais également la faisabilité et la stabilité nominale en boucle fermée si l’algorithme est interrompu à une itération intermédiaire. Un autre algorithme convergeant vers l’optimum global est décrit dans [195], mais par rapport au précédent, cette étude est développée pour une optimisation sans contraintes. L’avantage de l’approche réside dans la minimisation locale d’une fonction qui réunit seulement le critère local et les critères des sous-systèmes voisins (directement interconnectés), ce qui augmente la flexibilité du système de contrôle. Deux algorithmes coopératifs sont analysés dans [103], dont le premier est non itératif et suppose des échanges unidirectionnels entre agents, tandis que le deuxième est itératif et utilise des communications bidirectionnelles. Pour prouver la stabilité des deux architectures, les au-teurs font appel à la théorie des ensembles invariants via l’utilisation d’une contrainte de stabilité. Les algorithmes sont ensuite appliqués au processus d’alkylation catalytique du benzène [104], composé par quatre réacteurs et un séparateur. Des extensions de ces tra-vaux, prenant en compte des mesures asynchrones ou retardées ainsi que la possibilité de perte d’informations se retrouvent dans [105] et [80].

Un algorithme intéressant qui implique seulement deux échanges d’information par période d’échantillonnage est proposé dans [113, 114] pour le cas de deux sous-systèmes. Chaque agent résout son propre problème d’optimisation et ensuite partage la solution optimale locale obtenue. Après le premier échange, la procédure d’optimisation locale est répétée et la nouvelle solution partagée, puis les agents choisissent la solution qui donne la meilleure performance globale, parmi un ensemble de possibilités. L’inconvénient de l’approche vient du fait que le nombre des communications peut s’avérer énorme pour des systèmes de grande taille.

Dans les approches mentionnées précédemment, la connaissance locale des objectifs d’autres agents réduit l’aspect décentralisé de la structure de contrôle. Une alternative intéressante est l’utilisation d’un mécanisme d’agent de prix, qui permet la convergence vers l’optimum global, alors que chaque contrôleur n’a qu’une vue locale du critère. Ce type d’algorithmes repose sur différentes techniques de décomposition.

Ainsi, la loi MPC distribuée présentée dans [69] est basée sur la décomposition duale et la mise à jour des multiplicateurs de Lagrange par une méthode de sous-gradient qui repose sur les travaux de [157, 158]. La vitesse de convergence faible est le principal in-convénient de l’algorithme. Par conséquent, les auteurs proposent un critère d’arrêt de

la procédure itérative de telle sorte qu’un certain degré de sous-optimalité est garanti si la stabilité asymptotique du système en boucle fermée est assurée. L’implantation de la stratégie suppose normalement l’apparition d’un ou plusieurs agents de prix qui diffusent les valeurs des multiplicateurs vers les contrôleurs locaux en fonction des solutions locales. Une telle structure de contrôle est présentée dans [27], pour la commande d’un système de réfrigération contrôlé par des variables booléennes ou dans [97], pour la gestion d’un réseau d’eau potable. Pour une application similaire, dans [84], un agent négociateur est employé pour chaque paire de régulateurs MPC qui partage une ou plusieurs variables. Il résout un problème d’optimisation au moyen d’un algorithme d’apprentissage par renforce-ment. D’autres structures de coordination, dont l’idée est de remplacer chaque contrainte couplée par un terme linéaire basé sur les multiplicateurs de Lagrange, sont proposées dans [137, 135, 136], avec des applications appropriées.

Afin de gérer de manière optimale les contraintes couplées dans une approche MPC distribuée, l’article [134] s’appuie aussi sur la décomposition duale. Une solution alternative pour le même type de problème est proposée dans [47], représentée par une version de l’algorithme de Han [78] adaptée à la formulation quadratique de la fonction de coût du MPC. L’idée principale de l’algorithme de Han est de résoudre le dual du problème d’optimisation centralisée dans un environnement parallèle. Ses améliorations sur la vitesse de convergence de l’algorithme sont réalisées en utilisant des pondérations individuelles pour chaque variable duale, ainsi qu’une solution initiale non nulle [48]. L’algorithme est appliqué pour la régulation des niveaux d’eau dans un canal d’irrigation.

La manque de convergence de la décomposition duale pour le cas d’un système non linéaire composé de quatre réservoirs a motivé les auteurs de [167] pour proposer une méthode de gradient dynamique distribué, dont l’idée est d’utiliser localement une infor-mation sur le gradient du critère global. À ce stade, les conditions nécessaires ou suffisantes pour la convergence de l’algorithme représentent les pistes futures de travail.

Concernant la programmation linéaire, une stratégie prédictive de coordination basée sur la décomposition de Dantzig-Wolfe est analysée dans [34]. Afin que la méthode soit em-ployée, les couplages entre les sous-systèmes sont négligés. La nécessité de la coordination réside dans l’existence d’une contrainte de couplage.

Plusieurs structures MPC distribuées ont été proposées pour des sous-systèmes décou-plés, dont l’interconnexion est réalisée par l’objectif de contrôle ou par les contraintes couplées. Une solution à ce type de problèmes est proposée dans [163], où les sorties des sous-systèmes sont couplées par une contrainte globale. Les agents résolvent les problèmes d’optimisation locaux de manière séquentielle, en échangeant les valeurs prédites des va-riables de couplage. Une preuve de faisabilité robuste est présentée brièvement, en sup-posant que les perturbations sur les sous-systèmes sont indépendantes et bornées. Une approche distribuée qui traite un problème similaire fait l’objet de l’étude dans [89], dont chaque agent calcule les séquences optimales locales ainsi que celles des voisins. Un autre algorithme développé pour la commande d’un ensemble de sous-systèmes couplés unique-ment par une fonction de coût non-séparable est proposé dans [53]. La stabilité est assurée

par une contrainte, dite de compatibilité. Pourtant, cette contrainte peut conduire vers des performances différentes par rapport au cas centralisé. Les architectures distribuées utilisant des modèles découplés ont des applications intéressantes pour les problèmes de vol en formation [88, 153], l’évitement de collisions [32, 46], etc.

MPC Optimisation du crit`ere Solution

distribu´e, non it´eratif

d’´equilibre (Nash)

locale + prix locale diff´erentes formulations

distribu´e, it´eratif

globale locale décentralisé centralisé globale intermédiaire décentralisée centralisée

C

o

m

p

le

x

it

´e

O

p

ti

m

a

li

t´e

Figure 2.9 – Caractéristiques des différentes catégories d’algorithmes MPC La figure 2.9 représente un schéma synthétique des structures de commande prédictive pour les systèmes de grande taille. Le choix de l’algorithme de commande est généralement la conséquence d’un compromis entre le degré d’optimalité de la solution fournie et la complexité des régulateurs.

Dans le document Commande prédictive distribuée. Approches appliquées à la régulation thermique des bâtiments. (Page 53-57)