• Aucun résultat trouvé

Pré-compensation et suivi de trajectoires sur un système linéaire du pre-

1.5 Cas d'étude

1.5.9 Pré-compensation et suivi de trajectoires sur un système linéaire du pre-

Pour comprendre de façon plus formelle et plus précise le rôle de ces deux types d'antici-pation, prenons comme modèle de contrôle, le modèle linéaire tangent autour d'un équilibre (¯θ,u,¯ θ¯ext). On noteδθ et δu les écarts à l'équilibre. La première variation de (1.20) autour de l'équilibreθ¯etu¯, donne un système du premier ordre stable. On va la calculer. Le modèle (1.20) est de la forme dtdθ=f(θ, u, θext)avecf fonction régulière de ces arguments etf(¯θ,u,¯ θ¯ext) = 0.

On remarque que a > 0, b > 0 et d > 0. Ainsi, le système est asymptotiquement stable en boucle ouverte. On peut interpréter la température y comme la sortie d'un ltre du premier ordre de constante de temps τ = 1/a, excité par le signal τ(bu+dw) en notant

d dty= 1

τ(τ bu+τ dw−y) Pour simplier, nous considérons ici : umin =−∞ etumax = +∞.

Supposons qu'on souhaite suivre une référencet 7→yr(t)continue et dérivable par morceaux tout en connaissant à chaque instant la perturbation w(t). On dénit le contrôle de référence comme étant la fonction t7→ur(t) continue par morceaux et telle que dtdyr =−ayr+bur+dw,

La partie anticipation (feedforward) correspond à ur : elle compense, de façon cohérente avec le modèle, les eets transitoires dus aux variations deyr etw. On obtient ainsi en boucle fermée un système diérentiel autonome pour les variables e=y−yr etI

d

dte=−(bKp+a)e+bI, d

dtI =−Kie Ce système s'écrit alors sous la forme d'un système du second ordre

d2

dt2e=−2ξω0 d

dte−(ω0)2 e (1.31)

avec les notations usuelles

2ξω0 = (bKp+a), (ω0)2 =bKi

où ω0 > 0 est la pulsation de coupure et ξ > 0, le facteur d'amortissement. Ainsi, même si w et yr varient au cours du temps, leurs variations sont pré-compensées par ur qui est une

combinaison linéaire de yr, y˙r et w. On comprend mieux l'intérêt des termes Krr et Kextw dans (1.29).

En pratique, les coecients a, b et d ne sont connus qu'avec une certaine approximation.

Si l'on note ηa, ηb et ηd les écarts entre leurs vraies valeurs (celles du modèle (1.30)) et celles utilisées pour le calcul deur par y˙r =−(a−ηa)yr+ (b−ηb)ur+ (d−ηd)w, alors la dynamique de l'erreur e devient

d2

dt2e=−2ξω0 d

dte−(ω0)2 e+ηbrdw˙ +ηar En absence de terme de feedforward, le simple contrôleur PI

u=Kp(yr−y) +I, d

dtI =Ki(yr−y) conduit à un système du second ordre similaire pour e=y−yr

d2

dt2e=−2ξω0 d

dte−(ω0)2 e− d2

dt2yr+dw˙ +ay˙r (1.32) mais avec un terme source−dtd22yr+dw˙−ay˙r a priori beaucoup plus grand queηbrdw˙+ηar

dans (1.31), puisque les erreurs paramétriques sont supposées peu importantes. Ainsi, même avec des erreurs de modélisation, le rajout deur conduit en général à une amélioration notable du suivi : e reste plus près de0.

En l'absence de feedforward, on voit que la partie rétro-action, le feedback, doit alors corriger après coup les variations de la référence yr et les perturbations w. Il en résulte une moins bonne précision dans le suivi de la référence yr et des performances dégradées car on demande au feedback de compenser non seulement les erreurs de modèle, ce qui est son rôle premier, mais aussi les variations deyr etw, ce qui est mieux réalisé par le contrôle feedforward ur.

1.6 Cas d'étude : contrôle hiérarchisé et régulateurs en cas-cade

La théorie des systèmes lents/rapides (en particulier le Théorème15de Tikhonov) permet de justier une pratique courante pour la synthèse de boucle de régulation : le contrôle hiérarchisé qui consiste à imbriquer les régulateurs. Un exemple sura pour comprendre ce dont il s'agit.

Cet exemple est non trivial car il s'agit d'un système du second ordre avec dynamique inconnue et des contraintes à la fois sur l'état et sur le contrôle. La synthèse d'un contrôleur prenant explicitement les contraintes d'état est un problème largement ouvert et pour lequel on ne dispose pas, à l'heure actuelle, de solution systématique et simple. Des solutions plus numériques fondées sur les techniques de commande prédictive peuvent être considérées mais elles sont coûteuses en temps de calculs et peuvent poser problème en particulier en ce qui concerne l'existence de solutions et la convergence numérique17. Le contrôleur que nous proposons ci-dessus s'appuie sur le paradigme des systèmes lents/rapides, sa structure est facile à comprendre.

17. La technique MPC (Model Predictive Control) propose une sélection optimale, au sens d'un critère choisi par l'utilisateur, parmi des trajectoires satisfaisant des contraintes. Elle suppose l'existence de telles trajectoires et l'unicité d'un optimum caractérisable numériquement. Ce sont ces hypothèses qui sont bien souvent diciles à garantir sur des exemples concrets généraux. Si ces hypothèses sont vériées, la technique MPC consiste en la résolution itérée du problème d'optimisation avec mise à jour à chaque nouvelle période d'échantillonnage de la condition initiale. La fonction coût optimal est alors une fonction de Lyapounov, elle garantit la stabilité.

Le réglage des gains est simple et s'eectue à partir des contraintes. Nous donnons des formules explicites qui peuvent être utilisées.

Considérons un système du second ordre de la forme suivante d2

dt2x=f(x, d

dtx) +u

où x et u sont dans R. De tels modèles se rencontrent naturellement pour les systèmes méca-niques (par formulation variationnelle) : il s'agit par exemple de l'équation de Newton qui relie l'accélération aux forces extérieures parmi lesquelles se trouve le contrôle u. On suppose qu'on ne connaît pas bien f(x,dtdx).

Il est possible de se ramener, au moins approximativement, au cas de deux systèmes du premier ordre. Le principe de la stratégie de contrôle hiérarchisé comporte deux étapes : un premier régulateur proportionnel (régulateur P) assure la convergence rapide de la vitesse v =

d

dtxvers une consigne v¯. Un second régulateur PI cherche à stabiliser la position xà x¯et, pour ce faire, met lentement à jour la consigne du régulateur de vitesse v¯. Comme nous allons le voir, il est assez aisé de prendre en compte des contraintes sur la vitesse v et le contrôle u.

Écrivons l'équation du second ordre sous la forme d'un système de deux équations du premier ordre



 d dtx=v

d

dtv =f(x, v) +u

(1.33)

Les contraintes sont u ∈ [−umax, umax] et v ∈ [−vmax, vmax] (umax, vmax > 0). On considère un régime stationnaire caractérisé par un état admissible (¯x,v¯ = 0) et un contrôle admissible u¯; soit |¯u|< umax et f(¯x,0) + ¯u= 0. On cherche par un bouclage u à stabiliser (x, v) en(¯x,u)¯ , en respectant les contraintes suru et aussi surv. Précisément, si la vitesse initiale v0 appartient à [−vmax, vmax]alors on souhaite que pour t >0la vitesse v(t)du système en boucle fermée reste aussi dans [−vmax, vmax]. Cet objectif doit être atteint de manière robuste aux incertitudes sur la fonction f(x, v).

Sans hypothèse supplémentaire sur f, il est dicile de donner une réponse un peu générale à ce problème. Nous allons supposer qu'il existe 0< α <1 tel que pour tout(x, v),

|f(x, v)| ≤αumax (1.34)

Cela veut dire que pour toute valeur de (x, v), on peut choisir un contrôleuqui domine f(x, v) et ainsi imposer le signe de dtd22x. Cette hypothèse est essentielle.

La cascade de deux régulateurs, évoquée ci-dessus, donne l'algorithme de contrôle suivant





 d

dtI =Ki(¯x−x) +Ks(¯v−Kp(¯x−x)−I)

¯

v =Svat[Kp(¯x−x) +I]

u=Suat[Kp(¯v−v)/]

(1.35)

avec Kp > 0, Ki > 0, Ks > 0, KsKp > Ki, et un paramètre positif. Les fonctions Svat et Suat sont les fonctions de saturation usuelles (telles que celle utilisée en (1.24)) associée aux contraintes sur v et u(projections sur les convexes [−vmax, vmax]et [−umax, umax]).

La dynamique en boucle fermée est le système de trois équations diérentielles non linéaires Suat sont les fonctions identités. Ainsi, le système bouclé ci-dessus devient

Ce système est bien sous la forme standard du théorème15de Tikhonov : l'état lent est(x, I), l'état rapidev, et la dynamique rapide est bien asymptotiquement stable. Le système lent

d

dtx=v, d

dtI =Ki(¯x−x)

est bien asymptotiquement stable. On conclut à la stabilité via le théorème16. En l'absence de contraintes, la preuve de la stabilité repose uniquement sur le fait que est susamment petit.

Pour garantir la stabilité avec la prise en compte des eets non linéaires dus aux fonctions de saturation Suat et Svat, il convient de ne pas choisir Kp etKi n'importe comment. Intuitivement, si notre raisonnement par échelles de temps est correct, il faut que le système rapide soit en mesure de suivre sa consigne v¯ = Svat[Kp(¯x−x) +I] même si cette dernière varie au cours du temps : cela entraîne qualitativement que dtdv¯ doit respecter les contraintes sur u, tout au moins sur la partie de u qui reste disponible après avoir dominé la dynamique f(x, v). Cela veut dire approximativement que le module de dtdv¯ ne doit pas dépasser (1−α)umax. Il nous faut maintenant avoir une idée de l'ordre de grandeur de dtdv¯: pour cela on dérive dans le cas non saturé ¯v et on néglige la variation deI. Cela nous donne comme estimation de dtdv¯:−Kpv. Ainsi, il est naturel d'imposerKp(1−α)uvmaxmax.

On constate, avec des simulations numériques qu'avec Kp = vmax

(1−α)umax, Ki = Kp2

5 , Ks = 2Kp

5 , = 3,

le contrôleur (1.35) est bien stabilisant tout en respectant les contraintes sur u et approxima-tivement les contraintes sur v.

Ce qui précède n'est pas une preuve formelle mais plutôt une illustration de la démarche fondée sur la théorie des perturbations pour concevoir un régulateur simple pour un système du second ordre dont le modèle comporte d'importantes incertitudes que l'on peut dominer par un contrôle borné. De plus ce régulateur (1.35) prend en compte la contrainte d'état|v| ≤vmax.

Chapitre 2

Fonctions de transfert

Les résultats du Chapitre 1 sont essentiellement de nature qualitative. La stabilité d'un système est garantie sous l'hypothèse qu'un paramètre soit susamment petit. Dans ces conditions, on peut alors raisonner sur un système simplié (nominal). La question de la robus-tesse a été traitée de manière perturbative : si le système nominal en boucle fermée ou en boucle ouverte admet un équilibre asymptotiquement stable, alors le système perturbé (régulièrement et/ou singulièrement)1 admet un équilibre voisin de celui du système nominal, équilibre qui est lui aussi asymptotiquement stable.

La question de savoir à partir de quelle valeur critique ¯ de il y a perte de stabilité est importante, notamment d'un point de vue pratique. Comme nous allons le voir dans ce chapitre, une réponse est liée aux notions de marges de robustesse que nous allons dénir. On notera que, d'un point de vue formel, l'étude des changements qualitatifs de comportement d'un système dynamique en fonction de paramètres intervenant dans les équations est l'objet de la théorie des bifurcations et des catastrophes [21]. Cette théorie dépasse largement le cadre de ce cours.

Les marges de robustesse sont des notions diciles à aborder de façon générale pour un système non linéaire. Cependant, il est possible, une fois de plus, d'obtenir des informations précieuses en considérant le système linéarisé tangent autour de l'équilibre.

On utilise sur ce système linéaire le calcul symbolique2, i.e. on remplace l'opérateur dtd par la variable de Laplace s ∈ C (en utilisant la transformée de Laplace voir [55]). Grâce à ce formalisme3, on peut faire des calculs algébriques pour aboutir à une équation reliant entrée et sortie. Le système est alors représenté par une fonction de la variable complexe s (notée aussi p et correspondant enn à ıω en théorie des circuits). Cette fonction est appelée fonction de transfert. L'analyse complexe fournit une réponse directe (par le Théorème de Cauchy) à la dénition des marges de robustesse.

1. On parle de perturbations régulières lorsque apparaît dans les membres de droite des équations dié-rentielles, comme par exemple, dtdx=f(x, z, )et dtdz=g(x, z, ). On parle de perturbations singulières lorsque apparaît à gauche devant une dérivée en temps, comme par exemple dtdx=f(x, z)et dtdz=g(x, z). Ainsi le système dtdx=f(x, z, )etdtdz=g(x, z, )est à la fois régulièrement et singulièrement perturbé. Ses solutions sont alors proches de celles du système nominal (obtenu en faisant= 0, dtdx=f(x, z,0)et0 =g(x, z,0)) sous certaines hypothèses comme celles du théorème15.

2. Le calcul symbolique est aussi dénommé calcul opérationnel [78,22] en référence à la théorie des opérateurs linéaires [45].

3. Nous laissons de côté les problèmes de convergence des transformées de Laplace qui sont relativement hors-sujet ici et qui sont abordés dans les cours [54, 55]. On pourra aussi se reporter à [15] pour un exposé mettant en lumière le rôle des bandes de convergence dans le plan complexe.

63