• Aucun résultat trouvé

Systèmes à non minimum de phase

2.4 Compléments

2.4.4 Systèmes à non minimum de phase

Le transfert rationnel G(s) = N (s)D(s) où N (s) et D(s) sont deux polynômes premiers entre eux (i.e., pas de racine commune dans C) est dit à non mi-nimum de phase si l’un de ses zéros (i.e. l’une des racines de N (s)) est à partie réelle strictement positive. On parle alors de zéro instable. Ce type de systèmes est réputé difficile à contrôler. Ces systèmes sont souvent associés à une réponse inverse lors d’une variation en échelon de l’entrée13.

Pour comprendre la difficulté, rien ne vaut un petit exemple. Considérons le second ordre suivant

G(s) = 1 − s s2 .

Ce transfert correspond, sous forme d’état, à un double intégrateur, typique-ment un système mécanique régi par la loi de Newton,

d

dtx1 = x2, d

dtx2 = u

où la mesure y est une combinaison "contradictoire" de la position x1 et la vitesse x2 :

y = x1− x2.

En partant de l’équilibre x1 = x2 = y = u = 0 pour les t ≤ 0, considérons la réponse à un échelon unitaire u = 1 pour t > 0. Un calcul simple donne y(t) = t22 − t pour t > 0. Ainsi au tout début y commence par être négatif pour à terme devenir positif. Si au lieu de 1 − s on avait eu 1 + s, nous n’aurions pas eu cette réponse inverse. Ainsi, pour réguler y, un contrôleur proportionnel ne sait pas dans quelle direction partir. Le bouclage u = −Kpy conduit toujours à une boucle fermée instable quelque soit le gain Kp choisi. En effet le système bouclé,

d

dtx1 = x2, d

dtx2 = −Kpx1+ Kpx2,

13. Cette réponse inverse n’est pas cependant une caractérisation mathématique du fait qu’un zéro soit instable.

est instable dès que Kp 6= 0 : la matrice 

0 1

−Kp Kp 

est toujours instable avec une trace et un déterminant de même signe (voir le critère de Routh, condition 1.12). En transfert, on retrouve ce résultat en regardant les zéros de 1 + GK avec K(s) = Kp, soit 1 + Kp1−ss2 = 0 qui donne s2− Kps + Kp = 0.

Avec un correcteur PI de transfert K(s) = Kp+Ki

s (Kpgain proportionnel et Ki gain intégral) la situation est identique : 1 + GK = 0 s’écrit 1 +

1−s

s2 Kp+Ki

s  = 0 soit

s3− Kps2+ (Kp− Ki)s + Ki = 0.

Le critère de Routh (conditions 1.13) donne ici les conditions de stabilité −Kp > 0, Kp − Ki > 0, Ki > 0, −Kp(Kp− Ki) > Ki qui sont impossibles à satisfaire quelques soient les valeurs de Kp et Ki.

Il est possible, pour stabiliser, de remplacer le terme "intégral" par un terme "dérivé"

K(s) = Kp+ Kds

de gain Kd. Maintenant, 1 + GK = 0 donne l’équation d’ordre 2 suivante : (1 − Kd)s2+ (Kd− Kp)s + Kp = 0

Ces racines sont stables si, et seulement si, Kd− Kp

1 − Kd > 0,

Kp

1 − Kd > 0.

Un raisonnement simple montre que ces conditions de stabilité sont équiva-lentes à

0 < Kd< 1, 0 < Kp < Kd,

Ces deux inégalités définissent un triangle. Le fait que ce domaine de stabilité soit si peu étendu dans le plan (Kp, Kd) est une indication de petites marges de robustesse. Pour s’en convaincre, il suffit de tracer le lieu de Nyquist avec Kd = 1/2 et Kp = 1/4, par exemple. De plus un terme "dérivé" amplifie notablement les bruits de mesure et donc il vaut mieux prendre Kd petit.

Pour les systèmes d’ordre plus élevé, une telle analyse avec Routh n’est pas très commode. Il est alors utile de tracer le lieu de Nyquist de GK pour certaines valeurs des paramètres du correcteur K et d’analyser les marges de gain et de retard.

Commandabilité, stabilisation,

feedback

Un système commandé dtdx = f (x, u) est un système sous-déterminé. La différence entre le nombre d’équations (indépendantes) et le nombre de variables donne le nombre de commandes indépendantes m = dim u. Il faut noter que le degré de sous-détermination est ici infini car on ne manipule pas des scalaires mais des fonctions du temps. L’étude des systèmes sous-déterminés d’équations différentielles ordinaires est d’une nature différente de celle des systèmes déterminés qui ont été l’objet du Chapitre 1. Néanmoins, toutes les notions que nous y avons vues vont nous être utiles.

La particularité de ces systèmes sous-déterminés est qu’on peut utiliser la commande pour agir sur eux. En pratique, deux problèmes nous intéressent : la planification et le suivi de trajectoires.

La notion clef de ces problèmes est la commandabilité. Dans ce chapitre, après une rapide définition de cette propriété dans le cas non linéaire général (voir Définition 10), nous étudions en détails les systèmes linéaires dtdx = Ax + Bu. Leur commandabilité est caractérisée par le critère de Kalman (voir Théorème23). Nous présentons alors deux méthodes pour résoudre les problèmes qui nous préoccupent.

La première méthode utilise la forme normale dite de Brunovsky. L’écri-ture sous cette forme met en lumière un paramétrage explicite de toutes les trajectoires en fonctions de m fonctions scalaires arbitraires t 7→ y(t) et d’un nombre fini de leurs dérivées. Ces quantités y, dites sorties de Brunovsky, sont des combinaisons linéaires de x. Elles permettent de calculer très simple-ment des commandes u faisant transiter le système d’un état vers un autre. Le problème de planification de trajectoire est ainsi résolu. Ce point est dé-taillé à la Section 3.3.4. Les sorties de Brunovsky permettent également de construire le bouclage (“feedback”) qui assure le suivi asymptotique d’une

Figure 3.1 – Deux pendules accrochés au même chariot d’abscisse u, le contrôle.

jectoire de référence arbitraire. La convergence est obtenue par la technique de placement de pôles. On se reportera au Théorème25.

La seconde méthode s’attache à optimiser les trajectoires. On caractérise le contrôle en boucle ouverte permettant d’aller d’un état vers un autre tout en minimisant un critère quadratique. On calcule également la commande minimisant l’écart quadratique entre la trajectoire de référence et la trajec-toire réelle. On montre que la solution optimale est donnée par un feedback dont les gains sont calculés à partir d’une équation matricielle de Riccati. C’est la commande linéaire quadratique. Cette technique est détaillée à la Section3.4.

3.1 Un exemple de planification et de suivi de

trajectoires

Nous considérons un système de deux oscillateurs de fréquences diffé-rentes soumis en parallèle à un même contrôle. Comme nous le verrons dans l’Exemple15, ce modèle est d’une portée assez générale. Il correspond, à une réécriture près, à la dynamique linéarisée d’un système quantique à trois ni-veaux dont les transitions entre le niveau fondamental et les deux nini-veaux excités (d’énergies différentes) sont contrôlées par la lumière d’un laser.