• Aucun résultat trouvé

Stabilisation par méthode de Lyapounov et backstepping 166

3.4 Commande linéaire quadratique LQR

3.5.2 Stabilisation par méthode de Lyapounov et backstepping 166

On a déjà découvert cette méthode de stabilisation autour d’un point d’équilibre lors de l’exemple représenté sur la Figure 3.1. On reprend ici simplement l’idée de base pour un système non linéaire12.

On part d’un système dynamique avec un seul contrôle u (pour simplifier), d

dtx = f (x) + ug(x)

et d’une fonction V (x) positive et qui tend à l’infini quand x ∈ Rn tend vers l’infini en norme. On suppose ici que toutes les fonctions sont dérivables autant de fois que nécessaire.

On suppose de plus que pour u = 0, la dérivée de V le long des trajectoires d

dtx = f (x) est négative ou nulle. Pour les systèmes mécaniques, V est souvent l’énergie mécanique. Ainsi par hypothèse pour tout x on a

∂V ∂xf (x) ≤ 0 Avec u 6= 0, on a d dtV = ∂V ∂xf (x) + u ∂V ∂xg(x)

Le feedback est alors construit avec n’importe quelle fonction K : R 7→ R assez régulière qui s’annule en 0 uniquement et telle que K(ξ) > 0 si ξ < 0 et K(ξ) < 0 si ξ > 0

u = K ∂V ∂xg(x)



Le principe d’invariance de LaSalle s’applique alors (voir le Théorème 11). L’ensemble vers lequel convergent les trajectoires du système en boucle fer-mée est donné en résolvant le système sur-déterminé suivant

d dtx = f (x), ∂V ∂xf (x) = 0, ∂V ∂xg(x) = 0.

La méthode consiste à dériver un certain nombre de fois les deux équations “algébriques” ∂V∂xf (x) = 0 et ∂V∂xg(x) = 0 par rapport au temps et à remplacer à chaque fois dtdx par f (x). La fonction V est souvent appelée “controlled Lyapounov function” ou CLF.

La méthode dite du “backstepping” résout le problème suivant. Les don-nées sont

12. L’idée s’applique aussi aux systèmes de dimension infinie, i.e., gouvernés par des équations aux dérivées partielles avec un contrôle sur la frontière.

– un système affine en contrôle (on suppose toujours, pour simplifier l’ex-posé, un seul contrôle scalaire)

d

dtx = f (x) + ug(x)

– une fonction de Lyapounov V pour u = 0 (une CLF donc)

On peut donc utiliser la méthode ci-dessous pour construire le feedback, noté u = k(x), qui stabilise le système. On souhaite en déduire un feedback stabilisant pour le système étendu

d

dtx = f (x) + νg(x), d dtν = u

où maintenant le contrôle n’est plus ν mais sa dérivée u. On considère la fonction suivante

W (x, ν) = V (x) + 1

2(ν − k(x)) 2

Ainsi W est bien infinie à l’infini et reste positive. Calculons sa dérivée par rapport au temps d dtW = ∂V ∂x(f (x) + νg(x)) + p(ν − k(x))  u − ∂k ∂x(f (x) + νg(x)) 

Utilisons le fait qu’avec ν = k(x) la dérivée dtdV = ∂V∂x(f (x) + k(x)g(x)) est négative. Cela conduit au réarrangement suivant du second membre

d dtW = ∂V ∂x(f (x)+k(x)g(x))+(ν−k(x))  u −∂k ∂x(f (x) + νg(x)) + ∂V ∂xg(x) 

Il suffit, avec p paramètre positif, de poser u = ∂k ∂x(f (x) + νg(x)) − ∂V ∂xg(x) − p(ν − k(x)) pour avoir d dtW = ∂V ∂x(f (x) + k(x)g(x)) − p(ν − k(x)) 2 ≤ 0

On conclut l’analyse toujours par l’invariance de LaSalle. Pour un exposé détaillé des possibilités de ces méthodes nous renvoyons le lecteur intéressé à [55].

Observabilité, estimation et

adaptation

Dans le chapitre précédent, nous avons vu comment stabiliser un système par retour d’état (feedback). La réalisation pratique de tels bouclages né-cessite la connaissance à chaque instant de l’état x. Or, il est fréquent que seule une partie de l’état soit directement mesurée. On est alors confronté au problème suivant. Connaissant les équations du système (i.e., ayant un modèle), dtdx = f (x, u), les relations entre les mesures y et l’état, y = h(x), les entrées t 7→ u(t) et les mesures t 7→ y(t) , il nous faut estimer x. Cela revient à résoudre le problème suivant

d

dtx = f (x, u), y = h(x)

où x est l’inconnue (une fonction du temps) et où u et y sont des fonctions connues du temps. Il est clair que ce problème est sur-déterminé. L’unicité de la solution correspond à la propriété d’observabilité que nous allons définir. L’existence d’une solution provient du fait que y et u ne peuvent pas être des fonctions du temps indépendantes l’une de l’autre. Elles doivent vérifier des relations de compatibilité qui prennent la forme d’équations différentielles (le modèle).

Ce chapitre aborde ces questions. Tout d’abord nous donnons, dans un cadre général, les définitions et les critères assurant l’existence et l’unicité de la solution. Pour les systèmes linéaires nous présentons une méthode très économe en calculs pour obtenir x avec un observateur asymptotique. Nous montrons aussi comment paramétrer de “façon optimale” un tel observateur asymptotique grâce au filtre de Kalman. Le couplage avec la loi de feed-back est alors simple : il suffit de remplacer dans les formules donnant la loi de rétro-action les valeurs de l’état par leur estimées. On montre alors que

le contrôleur ainsi obtenu, celui qui part des sorties, estime l’état et utilise cette estimation pour calculer le contrôle (observateur contrôleur, commande modale, bouclage dynamique de sortie), permet de stabiliser asymptotique-ment tout système linéaire à coefficients constants commandable et obser-vable (c’est le principe de séparation). Enfin, nous proposons quelques ex-tensions aux cas non linéaires avec la synthèse d’observateurs asymptotiques via l’injection de sortie et la notion de contraction.

4.1 Un exemple

Cet exemple est représentatif de ce que, dans certains domaines indus-triels, les ingénieurs appellent les capteurs logiciels. Il s’agit, pour un moteur électrique, d’estimer la vitesse de rotation et son couple de charge via les signaux de courants (mesure) et de tension (contrôle). Il est possible d’obte-nir des estimations de ces deux variables mécaniques, coûteuses à mesurer, en partant des variables électriques, qui sont simples et faciles à mesurer. Pour simplifier, nous traitons ici le cas des moteurs à courant continu. Pour les moteurs à induction, le même problème se pose mais il est nettement plus complexe, non complètement résolu et fait encore l’objet de travaux de recherches et de développement1.

Les capteurs logiciels sont des outils de traitement en temps-réel de l’in-formation. Ils fournissent (idéalement) des informations non bruitées sur des grandeurs mesurées ou non. Sur l’exemple choisi ici, il s’agit, à partir de la mesure des tensions et des courants qui traversent le moteur, d’estimer de façon causale sa vitesse mécanique et son couple de charge. L’intérêt pra-tique est évident : les informations électriques sont toujours disponibles car les capteurs sont simples et fiables. Au contraire, les informations mécaniques nécessitent une instrumentation complexe, chère et peu fiable. On cherche à s’en passer. Pour des raisons de coût mais aussi de sécurité, déduire des cou-rants et tensions, la vitesse de rotation est un enjeu technologique important en électro-technique.

Dans d’autres domaines, on rencontre des problèmes très similaires. Pour les procédés, les débits, températures et pressions sont faciles à avoir par des capteurs simples et robustes alors que les compositions sont plus difficiles à mesurer (temps de retard de l’analyse, ...). Un traitement de l’informa-tion contenue dans les signaux de températures, pressions et débits permet souvent d’obtenir des estimations précieuses sur les compositions. Un autre exemple intéressant (également évoqué dans l’Exemple 28) est l’estimation 1. Le système est inobservable au premier ordre et très sensible aux paramètres à basse vitesse.

de l’orientation relative d’un mobile par rapport à un référentiel terrestre les mesures sont de deux types : les gyromètres donnent de façon précise et ra-pide les vitesses angulaires ; le GPS ou les images issues caméra embarquées donnent des informations basse fréquence sur les positions et orientations. On peut déduire grâce aux relations cinématiques, une estimation robuste de l’orientation du mobile (ses trois angles d’Euler, i.e., une matrice de rotation), de sa vitesse et de sa position. Ce problème est central dans les techniques de guidage de missiles et de drones.

L’exemple du moteur à courant continu que nous présentons en détails illustre la notion d’observabilité (voir la Définition 14), la technique des ob-servateurs asymptotiques (voir la Section 4.3.2), et l’observateur-contrôleur (voir la Section 4.4).