Modélisation et propriétés structurelles en dimension inﬁnie: des systèmes à retards aux équations aux dérivées partielles

(1)

Modélisation et propriétés structurelles en dimension infinie: des systèmes à retards aux

équations aux dérivées partielles

Hugues Mounier

Institut d’Électronique Fondamentale, Université Paris sud

École d’automne – Douz, 2006

1

(2)

Plan

Régulateurs de type PID

Application aux réseaux informatiques – Notion de platitude Des SàR aux EDP : Équation des ondes et forage

Commandabilités et π-liberté

2

(3)

Régulateurs de type PID

3

(4)

Motivation et commandabilité en dimension finie

4

(5)

Motivations

Obtenir des schémas de stabilisation simples et proches des classiques utilisés en ingénierie, pour des systèmes de transfert :

G (s )e ^−hs où G (s) est éventuellement instable.

Le schéma proposé :

Généralise les régulateurs PID et le prédicteur de Smith.

Permet une reconstruction exacte des dérivées des mesures.

5

(6)

Motivations (suite)

Utilisation :

De prédicteurs utilisant les valeurs passées de l’entrée.

De reconstructeurs intégraux exacts utilisant les mesures et leurs intégrales itérées.

Cette dernière reconstruction a un effet lissant par l’utilisation d’intégrales, mais

elle évite les erreurs d’approximation d’un filtrage de type boîte noire.

utilisée au sein d’un régulateur PID, elle est plus robuste qu’un observateur asymptotique.

6

(7)

Un réacteur simple

Réacteur isotherme uniformément agité Réaction du 1 ^er ordre :

A −→ produits

Commandé par la concentration d’entrée en A : c _AF Flux d’entrée mélangé en amont du réacteur : retard sur l’entrée non négligeable.

7

(8)

Un réacteur simple (suite)

Équilibre molaire

˙

c _A (t ) = q [c _AF (t − τ ) − c _A (t)] − kc _A (t) Avec les constantes q le débit d’entrée et k le taux de réaction.

Correspond au modèle de Broïda-Stretch : e ^−hs

1 + Ts

Ce modèle est utilisé pour diverses modélisations.

8

(9)

Modèle employé

On considère le modèle perturbé

sy = ay + be ^−hs u + $ e ^−ϕs s Avec a éventuellement positif.

La perturbation constante $ apparaît à t > ϕ par le biais d’un heaviside translaté.

On considère également le modèle nominal sy _nom = ay _nom + be ^−hs u _nom

9

(10)

Forme adaptée au suivi

On exprime directement u nom en fonction de y nom et sy nom

u nom = 1

b se ^hs y nom − a

b e ^hs y nom

Cette forme est très utile pour le suivi d’une trajectoire désirée y _nomd en boucle ouverte.

Il n’y a pas d’intégration d’équation différentielle aux différences.

La prédiction e ^hs y _nom n’est pas un inconvénient en suivi en boucle ouverte, connaissant le trajectoire désirée y nomd sur tout l’horizon temporel.

10

(11)

Rappel de commandabilité en dimension finie

Système classique, mono-entrée s x = Ax + bu, x = (x 1 , . . . , x n ).

Critère de Kalman

rg _R [b, Ab, . . . , A ⁿ⁻¹ b] = n Critère de Hautus-Popov-Belevitch

∀s ∈ C , rg _C [sI − A | b] = n

11

(12)

Rappel de commandabilité en dimension finie (suite)

Mise sous forme compagnon s z 1 = z 2

sz 2 = z 3

.. .

sz n−1 = z n

sz n = p 1 z 1 + p 2 z 2 + . . . + p n z n + qu Sous-espace de non commandabilité de Kalman vide.

La forme compagnon permet un suivi de trajectoire des plus aisés ; posant z _1d = y _d :

u d = − 1 β

α 1 y d + α 2 sy d + . . . α n s ⁿ⁻¹ y d (t) − s ⁿ y d (t)

12

(13)

Rappel de commandabilité en dimension finie (suite)

Par ailleurs, z ₁ fournit une paramétrisation complète : toute variable s’exprime comme combinaison linéaire de z 1 et d’un nombre fini de ses dérivées.

z 2 = sz 1

z 3 = s ² z 1

.. .

z n = s ⁿ⁻¹ z 1

u = − 1 β

α ₁ z ₁ + α ₂ sz ₁ + . . . α _n s ⁿ⁻¹ z ₁ − s ⁿ z ₁ y = z ₁

Cette agréable propriété se nomme la liberté.

13

(14)

Classe de systèmes étudiés et liberté

14

(15)

Classe de systèmes étudiés

Système à retards Λ donné par

Λ = [w 1 , . . . , w α ] , [w ] P Λ (s , e ^hs ) w = 0

avec P _Λ ∈ R [s , e ^hs ] ^β×α , rg _R _[s,e

hs

] P _Λ = β, β 6 α.

Λ est sans retard si P _Λ ∈ R [ _dt ^d ] ^β×α , c.à.d. s’il existe des équations du modèle ne contenant pas de retard.

Une dynamique Λ d’entrée u est quasi-finie s’il existe des monômes M _i (δ), i = 1, . . . , m tels que posant v _i = M _i (δ)u _i , la dynamique Λ ˜ d’entrée v = (v 1 , . . . , v m ) est sans retard.

15

(16)

Liberté et liberté par anticipation

Un modèle de dimension finie munie d’une entrée

indépendante u (t) = (u 1 (t), . . . , u m (t)) est dit libre s’il existe ω(t) = (ω 1 (t), . . . , ω m (t))

que l’on nomme base (ou sortie plate), telle que : (1) Elle fait partie du modèle (caratère endogène) :

les ω

_i

s’expriment comme combinaison linéaire des variables du modèle (c.à.d. x , u ici) et de leurs dérivées :

ω

_i

= Lx + N

₀

u + N

₁

su + . . . + N

_α

s

^α

u L ∈ R

^n×n

, N

i

∈ R

^n×m

, i = 0, . . . , α.

16

(17)

Liberté et liberté par anticipation (suite)

(2) Ses composantes sont indépendantes (indépendance) : Il n’existe aucune relation différentielle entre les ω

_i

:

M

₀

ω + M

₁

sω + . . . + M

_β

s

^β

ω = 0 = ⇒ M

_i

= 0

M

_i

∈ R

^q×m

, i = 0, . . . β.

(3) Elle fournit une paramétrisation complète du système (forme canonique de suivi) :

x = P

₀

ω + P

₁

sω + . . . + P

_γ

s

^γ

ω (1)

u = Q

0

ω + Q

1

sω + . . . + Q

µ

s

^µ

ω (2)

P

i

∈ R

^n×m

, Q

j

∈ R

^m×m

, i = 0, . . . , γ, j = 0, . . . , µ, La dernière propriété, et plus spécialement l’équation (2) fournit une solution simple et naturelle au suivi de la sortie y = ω.

17

(18)

Liberté et liberté par anticipation (suite)

Une dynamique à retards presque finie est dit libre par

anticipation (ou δ-libre ou e ^−hs -libre) si elle est libre pour peu que l’on s’autorise des avances.

Ceci conduit à une forme canonique de suivi telle que :

x = P ₀ ω + P ₁ s ω + . . . + P γ s ^γ ω (3) u = Q ₀ e ^hs ω + Q ₁ se ^hs ω + . . . + Q _µ s ^µ e ^hs ω (4)

18

(19)

Suivi en boucle ouverte

Considérons la trajectoire de concentration c _Ad (t).

La loi de commande en boucle ouverte c AFd (t) assurant le suivi est

c _AFd (t) = 1

q c ˙ _Ad (t + τ ) +

1 + k q

c _Ad (t + τ ).

19

(20)

Systèmes quasi-finis commandables

Représentation d’état typique, cas d’un seul retard

(∗) sx = Ax + B δu

où A ∈ R ^n×n , B ∈ R ^n×m .

Les trois conditions suivantes sont équivalentes

1/ (∗) est commandable sans torsion, c.à.d. qu’il n’y a pas de trajectoires fixées dans le système

2/ (∗) est spectralement commandable, ou encore

∀s ∈ C , rk

_C

[sI − A | e

^−hs

B ] = n 3/ (∗) est en liberté anticipée,

4/ rg(B , AB, . . . , A

ⁿ⁻¹

B) = n.

On dira dans ce cas qu’elle est commandable.

20

(21)

Systèmes quasi-finis observables

Représentation d’état typique, cas d’un seul retard

(∗) sx = Ax + Bδu

y = C x où A ∈ R ^n×n , B ∈ R ^n×m , C ∈ R ^p×n .

Les trois conditions suivantes sont équivalentes

1/ La dynamique de dimension finie d’entrée u(t) = u (t − h) et de sortie y (t) est observable,

2/ (∗) est spectralement observable, ou bien

∀s ∈ C , rk

_C

C

sI − A

= n 3/ rk

C AC . . . A

ⁿ⁻¹

C

^T

= n.

On dira dans ce cas qu’elle est observable.

21

(22)

Hypothèses de travail

Les systèmes presque finis que nous allons étudier seront supposés

sans trajectoire fixée (toute trajectoire est susceptible d’être perturbée),

entièrement au repos pour t 6 0.

En outre, le système nominal correspondant sera commandable et

observable,

au sens défini par les deux résultats précédents.

22

(23)

Méthodologie pour suivi de trajectoires

23

(24)

Un mot de méthodologie

Formulation d’atteinte d’objectif en suivi de trajectoires Suivi réalisé en 2 étapes découplées :

Suivi en boucle ouverte, utilisant la liberté (ou la platitude).

Stabilisation autour de la trajectoire.

24

(25)

Un mot de méthodologie (suite)

Se retrouve en génie logiciel (forte cohésion, faible couplage).

Hiérarchisation à deux résolutions

La première étape permet un “dégrossisage” du problème, en se laissant guider par le modèle (au travers de la liberté).

La deuxième affine le suivi et corrige les imperfections de modèle et méconnaissances de conditions initiales par bouclage.

25

(26)

Suivre ou ne pas suivre ?

Cette deuxième étape de stabilisation est ici réalisée par un PID généralisé.

Quel est l’avantage de cette démarche à 2 étapes par rapport à une approche de type “stabilisation pure” ?

26

(27)

Suivre ou ne pas suivre ? (suite)

Supposons avoir un changement de point de consigne, y(t) passant de y ₀ à y ₁ , dont l’amplitude |y ₁ − y ₀ |est importante par rapport aux grandeurs caractéristiques du modèle.

Réalisant ce changement directement en cherchant à faire tendre vers zéro |y(t) − y 1 | (par exemple avec un PID

classique), on obtient des dépassements (“overshoots”) et des oscillations idésirables.

En effectuant d’abord un suivi en utilisant la liberté, on se laisse guider par le modèle plutôt que d’essayer de le forcer.

27

(28)

Modèle du second ordre

Équation de Newton :

M ¨ z + γ z ˙ + kz = F avec

F force appliquée

γ z ˙ terme d’amortissement kz terme de raideur

28

(29)

Second ordre : trajectoire de référence

0 2 4 6 8 10 12 14 16 18 20

−4

−3

−2

−1 0 1 2 3 4

Reference trajectory

TIME t

x1ref

Fig. 1: Trajectoire désirée en hauteur

29

(30)

Second ordre : trajectoire de référence

Méthode du couple calculé (Computed Torque) F ref (t) = M ¨ z ref (t) + γ z ˙ ref (t) + kz ref (t)

30

(31)

Second ordre : commande de référence

0 2 4 6 8 10 12 14 16 18 20

−0.4

−0.3

−0.2

−0.1 0 0.1 0.2 0.3 0.4

Open loop control

uref

TIME t

Fig. 2: Loi de commande en boucle ouverte réalisant le suivi

31

(32)

Suivre ou ne pas suivre ? (suite)

0 2 4 6 8 10 12 14 16 18 20

−0.2 0 0.2 0.4 0.6 0.8 1 1.2

Reference trajectory "−−" Actual trajectory "−"

TIME t

x1 and x1ref

Fig. 3: Trajectoire de référence et réelle (PID pur)

32

(33)

Suivre ou ne pas suivre ? (suite)

0 1 2 3 4 5 6 7 8 9 10

−0.8

−0.6

−0.4

−0.2 0 0.2 0.4 0.6 0.8 1

Tracking error

x1 − x1ref

TIME t

Fig. 4: Erreur de suivi (PID pur)

33

(34)

Suivre ou ne pas suivre ? (suite)

0 2 4 6 8 10 12 14 16 18 20

−0.5

−0.4

−0.3

−0.2

−0.1 0 0.1 0.2 0.3 0.4 0.5

Closed loop control

u

TIME t

Fig. 5: Loi de commande appliquée (PID pur)

34

(35)

Suivre ou ne pas suivre ? (suite)

0 2 4 6 8 10 12 14 16 18 20

0 0.2 0.4 0.6 0.8 1 1.2 1.4

Reference trajectory "−−" Actual trajectory "−"

TIME t

x1 and x1ref

Fig. 6: Trajectoire de référence et réelle (suivi stabilisé par PID)

35

(36)

Suivre ou ne pas suivre ? (suite)

0 1 2 3 4 5 6 7 8 9 10

−0.8

−0.6

−0.4

−0.2 0 0.2 0.4 0.6 0.8 1

Tracking error

x1 − x1ref

TIME t

Fig. 7: Erreur de suivi (suivi stabilisé par PID)

36

(37)

Suivre ou ne pas suivre ? (suite)

0 2 4 6 8 10 12 14 16 18 20

−0.4

−0.3

−0.2

−0.1 0 0.1 0.2 0.3 0.4 0.5

Open loop control "−−" Closed loop control "−"

u and uref

TIME t

Fig. 8: Commandes en boucle ouverte et appliquée (suivi stabilisé par

PID) 37

(38)

Liens multirésolution/génie logiciel

Se retrouve en génie logiciel (forte cohésion, faible couplage).

Hiérarchisation à deux résolutions

La première étape permet un “dégrossisage” du problème, en se laissant guider par le modèle (au travers de la liberté).

La deuxième affine le suivi et corrige les imperfections de modèle et méconnaissances de conditions initiales par bouclage.

38

(39)

Avantages de ce schéma

Performances

La loi de commande en boucle ouverte est obtenue sans intégrer d’équation différentielle. Elle peut donc être calculée hors-ligne et tabulée

Choix de la trajectoire

Donne une grande souplesse par rapport à un simple changement de point de consigne

39

(40)

Avantages de ce schéma (suite)

Respect des contraintes

Pour des spécifications données (bornes d’erreur, . . . ), permet de moins relever les gains et donc de dépenser moins d’énergie par le biais de la commande

Contrôle des transitoires

Spécialement pour des systèmes non linéaires, se laisser guider par un modèle permet de maîtriser les évolutions transitoires en changement de régime

40

(41)

Suivi de trajectoires et PI généralisé sur divers exemples

41

(42)

Système instable du premier ordre

On considère

sy = ay + be ^−hs u + $ e ^−ϕs

s (5)

avec y la sortie mesurée u la commande

$ une perturbation constante à t = ϕ a > 0 donnant un système instable

42

(43)

Suivi en boucle ouverte du réacteur simple

Pour y r le signal de référence, la loi en boucle ouverte assurant le suivi est

u r = 1

b se ^hs y r − ae ^hs y r

(6)

On définit les erreurs :

y e = y − y r , u e = u − u r

Et l’on obtient la dynamique d’erreurs : sy _e = ay _e + be ^−hs u _e + $ e ^−ϕs

s (7)

43

(44)

Régulation par PI

Posant

v _e = e ^−hs u _e la dynamique

sy _e = ay _e + bv _e + $ e ^−ϕs s

peut être régulée, avec rejet de la perturbation, par le contrôleur PI

v e = k p y e + k _i s ⁻¹ y e (8)

44

(45)

Prédiction

Ce contrôleur peut être réécrit u _e = k _p e ^hs y _e + k _i e ^hs s ⁻¹ y _e

= k _p e ^hs y _e + k _i s ⁻¹ y _e − k _i 1 − e ^−hs s e ^hs y _e Définissons la dynamique non perturbée

s ˜ y _e = a˜ y _e + be ^−hs u ˜ (9) avec

y _e = ˜ y _e − $ a

e ^−ϕs s

45

(46)

Prédiction (suite)

Le bouclage prédictif utilisé est :

˜

u e = k p e ^hs ˜ y e + k i s ⁻¹ y e − k i

1 − e ^−hs

s e ^hs y ˜ e (10) où le 1 ^er terme e ^hs y ˜ e et le 3 ^ième terme nécessitent une forme de prédiction.

On utilise

˜

y _e = b e ^−hs s − a u ˜ _e

46

(47)

Prédiction (suite)

D’où la prédiction e ^hs ˜ y e = b

s − a e ^−h(s−a) + 1 − e ^−h(s−a)

˜ u e

= e ^ha b

s − a e ^−hs ˜ u _e + b 1 − e ^−h(s−a) s − a ˜ u _e C’est-à-dire :

e ^hs ˜ y e = e ^ha y ˜ e + b 1 − e ^−h(s−a) s − a ˜ u e

47

(48)

Régulateur prédictif

Le régulateur utilisé s’écrit

¯

u _e = k _p y _e ^pred + k _i

s ⁻¹ y _e + 1 − e ^−hs s y _e ^pred

(11a) avec :

y _e ^pred = e ^ah y e + b 1 − e ^−h(s−a)

s − a u ˜ e (11b)

48

(49)

Régulateur prédictif (suite)

Ou, dans le domaine temporel :

¯

u _e (t) = k _p y _e ^pred (t) + k _i Z t

0 y _e (τ )d τ + Z t

t−h

y _e ^pred (τ )d τ

(12a) avec :

y _e ^pred (t) = e ^ah y e (t) + Z t

t−h

e ^a(t−τ) b¯ u e (τ )d τ (12b)

49

(50)

Simulations

Modèle : y ˙ (t) = 1 ∗ y(t) + 2 ∗ u(t − 1) + 5 Régulateur P : u(t) = −3 ∗ y(t + 1)

0 5 10 15 20

0 2 4 6 8 10 12

Time t Output ye

0 5 10 15 20

−8.35

−8.3

−8.25

−8.2

−8.15

Time t Control ue

Fig. 9: Régulateur P.

50

(51)

Simulations (suite)

Modèle : y ˙ (t) = 1 ∗ y(t) + 2 ∗ u(t − 1) + 5 Régulateur PI : u(t) = −3 ∗ y(t + 1) − 5 ∗

Z t+1 0

y(s)ds

0 5 10 15 20

−2 0 2 4 6 8 10 12

Time t Output ye

0 5 10 15 20

−12

−11

−10

−9

−8

−7

−6

−5

−4

−3

−2

Time t Control ue

51

(52)

Simulations : système perturbé

˙

y(t ) = (a + ∆a)y(t) + (b + ∆b)u (t − h − ∆h) + $

0 50 100 150 200

−10 0 10 20 30 40 50 60

Time t Output ye

0 50 100 150 200

−35

−30

−25

−20

−15

−10

−5 0

Time t Control ue

Fig. 10: régulateur PI avec erreurs : 40% sur a et h, 30% sur h. 52

(53)

Modèle du second ordre

Considérons le modèle du second ordre

s ² y + a ₁ sy + a ₀ y = e ^−hs u + $ e ^−ϕs s La sortie y est une base.

Soit y _r un signal de référence et

y e = y − y r , u e = u − u r

les erreurs.

53

(54)

Modèle du second ordre (suite)

On obtient l’équation d’erreur

s ² y _e + a ₁ sy _e + a ₀ y _e = e ^−hs u _e + $ e ^−ϕs

s (13)

Prenant un PID classique, on a

e ^−hs u e = −k _d sy e − k p y e − k i

s y e (14)

Afin d’avoir une expression pour sy _e , on utilise un

reconstructeur intégral, fournissant un filtrage fondé sur le modèle. Avec $ = 0, on a

sy e = −a ₁ y e − a 0

s y e + 1

s u e (15)

54

(55)

Modèle du second ordre (suite)

Par substitution dans (14) e ^−hs u e = −k _d

− a 1 y e − a 0

s y e + 1 s e ^−hs u e

− k p y e − k i

s y e

= (a ₁ k _d − k _p )y _e + a ₀ k _d − k _i

s y _e − k _d s u _e Ce qui conduit à

e ^−hs u e = −k _d sy e − k p y e − k i

s y e − k _d $ e ^−ϕs s ² ayant supposé $ = 0 dans (15).

55

(56)

Modèle du second ordre (suite)

Pour avoir une erreur statique nulle, il faut un double intégrateur sur y _e

u _e = −k _d se ^hs y _e − k _p e ^hs y _e − k _i

s e ^hs y _e − k _ii s ² e ^hs y _e Ce qui conduit au système en boucle fermée suivant

s ² + (a ₁ + k _d )s + (a ₀ + k _p ) + k _i s + k _ii

s ²

y _e = 1 + k _d

s

$ e ^−ϕ s

56

(57)

Reconstructeurs intégraux

57

(58)

Reconstructeurs bruts

Considérons la représentation d’état

˙

x = Ax + B u y = C x

Par dérivations successives de la sortie y , on obtient y = C x

y ˙ = CAx + CB u

¨

y = CA ² x + CABu + CB u ˙ .. .

y ⁽ⁿ⁻¹⁾ = CA ⁿ⁻¹ x +

n−2

X

i=0

CA ⁿ⁻²⁻ⁱ Bu ⁽ⁱ⁾

58

(59)

Reconstructeurs bruts (suite)

qui se réécrit

Y = Ox + T U avec O la matrice d’observabilité,

Y =





 y

˙ y .. . y ⁽ⁿ⁻¹⁾







, U =





 u

˙ u .. . u ⁽ⁿ⁻²⁾







59

(60)

Reconstructeurs bruts (suite)

et T la matrice

T =





 0

h 1 0 0

.. . . .. ...

h n−1 · · · h 1 0







avec h i = CA ⁱ⁻¹ B les paramètres de Markov parameters et 0

la matrice bloc nulle.

60

(61)

Reconstructeurs bruts (suite)

Multipliant par O ^T ,

O ^T Y = O ^T Ox + O ^T T U Si le système est observable O est de rang plein, Donc O ^T O est inversible, et

x = O ^† Y − O ^† T U (16) avec O ^† = (O ^T O) ⁻¹ O ^T .

Cette expression ne peut être utilisée telle quelle, à cause des dérivées succesives des mesures.

61

(62)

Reconstructeurs intégraux

Le modèle étudié

˙

x = Ax + B u y = C x peut se réécrre, par intégration

x = Ax ^R + B u ^R y = C x

où ^R désigne l’integration, c.à.d.

˙ z

R

= z, et z

R i = z

R i−1 ^R

62

(63)

Reconstructeurs intégraux (suite)

Par récurence, pour ν > 0, on obtient x = A ^ν x ^R ^ν +

ν

X

i=1

A ⁱ⁻¹ Bu ^R ⁱ (17) Supposant le système observable, un reconstructeur brut s’écrit

x = O ^† Y − O ^† T U

63

(64)

Reconstructeurs intégraux (suite)

Et, posant ν = n − 1 dans (17) x = A ⁿ⁻¹ x ^R ⁿ⁻¹ +

n−1

X

i =1

A ⁱ⁻¹ B u ^R ⁱ et d’après (16)

= A ⁿ⁻¹ O ^† Y

R n−1 − A ⁿ⁻¹ O ^† T U

R n−1

+

n−1

X

i =1

A ⁱ⁻¹ Bu

R i

= A ⁿ⁻¹ O ^† Y − A ⁿ⁻¹ O ^† T U + C e U

= A ⁿ⁻¹ O ^† Y +

C − e A ⁿ⁻¹ O ^† T U

64

(65)

Reconstructeurs intégraux

avec

Y =





 y ^R ⁿ⁻¹

.. . y ^R

y







, U =





 u ^R ⁿ⁻¹

.. . u ^R





 ,

C e = A ⁿ⁻² B A ⁿ⁻³ B · · · AB B

65

(66)

Reconstructeurs intégraux (suite)

Cette expression est un reconstructeur intégral de l’état x, noté x ^R ^uy

x

R uy = A ⁿ⁻¹ O ^† Y +

C − e A ⁿ⁻¹ O ^† T

U (18) Cette expression inclut des intégrales itérées des entrées et des sorties,

Ceci lisse les mesures

Ce schéma n’est pas stabilisant. Il doit être utilisé dans une boucle de régulation.

66

(67)

Conclusions pour le GPI

Schéma simple et proche de ceux utilisés dans l’ingéniérie Fournit une certaine robustesse

Obtenir le meilleur des deux mondes :

le modèle par variables d’état fournit les gains de stabilisation ; la régulation par PI assure la robustesse

67

(68)

Application aux réseaux informatiques – Notion de platitude

68

(69)

Aperçu sur la variété des modèles

69

(70)

Modèles : transmission physique

Transmission physique

État : w (z , t), à l’abscisse z et au temps t Commande : u (t) signal émis en x = 0 Modèle d’état linéaire (avec atténuation) :

ν ² ∂ ² w

∂z ² (z, t) = ∂ ² w

∂t ² (z , t) + γ ∂w

∂t (z, t), z ∈ [0, L]

∂w

∂z (0, t) = u(t)

∂w

∂z (L, t) = y(t )

La mesure est le signal réceptionné à l’autre bout.

70

(71)

Modèles : Dynamique de file d’attente

Dynamique de file d’attente État : q(t) longueur de la file Commande : λ(t) taux d’arrivée Modèle d’état :

˙

q(t) = −µ q(t)

1 + q(t) + λ(t) µ : taux de service (ici constant).

En régime stationnaire : ¯ λ = µ ¯ q 1 + ¯ q ou encore q ¯ = λ ¯

µ − λ ¯

71

(72)

Modèles : Session TCP linéarisée

État : q (t), où q (t) est la longueur de la file d’attente du noeud congestionné.

Commande : W (t), où W (t) est la largeur de la fenêtre.

Modèle d’état (Hollot, Towsley, ..., 2001), linéarisation autour d’un point de fonctionnement :

˙

q(t) = − 1 R 0

q (t) + N R 0

W (t) avec

N Nombre de sessions TCP traversant le noeud congestionné R ₀ Valeur nominale du RTT (Round Trip Time) (sec)

72

(73)

Modèles : Session TCP/RED linéarisée

État : (W (t) q(t)) ^T , où W (t ) est la largeur de la fenêtre et q(t) la longueur de la file d’attente du noeud congestionné.

Commande : p(t) = P (¯ q (t)) la probabilité de rejet d’un paquet, avec ¯ q(t) une estimée de la longueur moyenne de q(t).

Modèle d’état (Hollot et al. 2001), linéarisation : W ˙ (t) = − 2N

R ₀ ² C W (t) − R ₀ C ²

2N ² p(t − R ₀ )

˙

q(t) = − 1

R ₀ q (t) + N R ₀ W (t)

avec N Nombre de sessions TCP traversant le noeud congestionné R ₀ Valeur nominale du RTT (Round Trip Time) (sec)

C capacité du lien (paquets/sec)

73

(74)

Modèles : Session TCP/RED non linéaire

État : (W (t) q(t) R(t)) ^T , avec W (t ) largeur de la fenêtre, q (t) longueur de file et R(t) la valeur du RTT (Round Trip Time).

Commande : p(t) = P (¯ q (t)) la proba. de rejet d’un paquet.

Modèle d’état (Hollot et al. 2001), approximation fluide : W ˙ (t) = 1

R(t ) − W (t)W (t − R(t))

2R(t − R(t)) p(t − R(t))

˙

q(t) = − W (t)

R(t) N(t) − C , avec R(t) = q(t ) C + T p

où N(t) Nombre de sessions TCP traversant le noeud congestionné C capacité du lien (paquets/sec)

T p temps de propagation source/noeud congestionné

74

(75)

Approximation fluide : Nature continue du temps

Temps de traitement d’une unité d’accès (unité atomique d’information transférée) suffisamment court.

⇒ rapport débit global taille d’unité d’accès suffisamment grand.

Très bien vérifié pour les réseaux haut débit.

ATM : cellule 40 octets, débit 150 à 300 Mbit/s Ethernet Gigabit : trame 1, 5Ko, débit qques Gbit/s

Pour des faibles débits, les schémas proposés sont transposables en discret.

75

(76)

Approximation fluide : Nature continue des commandes

Commandes en débit (paquets/s) prises continues.

Bonne approximation pour de hauts débits.

Pour des faibles débits, les schémas sont transposables en discret.

76

(77)

Approximation des retards

Caractère stationnaire des retards.

Approximation fausse en réalité.

⇒ Nécessité d’un schéma prenant en compte la variabilité des retards

77

(78)

Modèles fluides de routeurs

78

(79)

Modèles de file FIFO

Modèle de tampon de sortie d’un routeur Par analogie avec un équilibre de débit de fluide

˙

q(t) = v(t) − w (t) v(t) débit d’entrée à la file

w (t) débit de sortie de la file

Débit de sortie : vitesse de traitement de la file r(q)

79

(80)

Files FIFO : vitesse de traitement

Vitesse de traitement

r (q(t)) = q (t) θ(q(t))

où θ(q) est le temps de séjour global de tous les paquets θ fonction monotone croissante de q

Comprend

temps de traitement temps d’attente temps d’émission

80

(81)

Files FIFO : Modèles de temps de séjour

Modèle constant

θ(q) = 1 ρ Modèle constant/linéaire par morceaux

θ(q) =



 



 

 1

ρ si q < q _c (routeur non chargé) q

µ si q > q _c (routeur chargé)

81

(82)

Files FIFO : Modèles de temps de séjour (suite)

Modèle linéaire

θ(q) = a + q µ Modèle non linéaire

θ(q) = a + q + bq ² µ

82

(83)

Modèles (de file d’attente) de routeur

Modèle à charge constante

˙

q(t) = −ρ q(t) + u(t) Modèle à charge constante par morceaux

˙ q(t) =

( −ρ q(t) + u(t) si q < q _c (routeur non chargé)

−µ + u(t) si q > q _c (routeur chargé) c.à.d. un modèle saturé

˙

q(t) = −ρ sat _µ/ρ,q

_c

(q (t)) + u(t) Modèle à charge linéaire

˙

q(t) = − µq(t)

a + q(t) + u(t)

83

(84)

Routeur à charge constante avec retard de propagation

Modèle source, routeur intermédiaire, destination Le routeur intermédiaire est celui le plus chargé entre la source et la destination

˙

q ₁ (t) = −ρ ₁ q ₁ (t) + u(t − τ ₁ )

˙

q ₂ (t) = ρ ₂ q ₂ (t − τ ₂ )

Avec q ₁ (t) Taille de la file au goulot d’étranglement q ₂ (t) Taille de la file à la destination

u(t) Débit de la source, pris comme commande τ ₁ Retard de la source au goulot

τ ₂ Retard du goulot à la destination

84

(85)

Modèle de routeur à charge constante avec retard : remarques

Remarque : schéma point à point (“end to end”) ; seule la source est commandée

Modèle s’apparentant à ceux de Mascolo (1999), Hollot et al.

(2001), Imer et Bașar (2001)

85

(86)

Modèle routeur à charge constante avec retard : mesures

Mesure de la taille de la file au goulot (en nombre de paquets) :

y(t)= q ₁ (t − τ ₁ ) du goulot à la source, accessible à la source

Information de rétro-action utilisée pour la stabilisation autour des trajectoires de référence

Représente l’état (de charge) du réseau

86

(87)

Routeurs : suivi de trajectoire

87

(88)

Liberté et suivi en boucle ouverte de routeurs à charge constante

Une fois une stratégie déterminée, les autres variables en découlent À partir de

˙

x 1 (t) = v(t − τ 1 ) − ρx 1 (t)

˙

x 2 (t) = ρx 1 (t − τ 2 ) y(t) = x ₁ (t − τ ₂ )

σ(t) = x _2r (t ) trajectoire de référence

88

(89)

Liberté et suivi en boucle ouverte de routeurs à charge constante (suite)

On obtient

x 1r = 1

ρ σ(t + τ 2 ) v _r (t) = 1

ρ ² ¨ σ(t + τ ₁ + τ ₂ ) + ˙ σ(t + τ ₁ + τ ₂ ) y r (t) = ˙ σ(t + τ 2 − τ 1 )

89

(90)

Suivi en boucle ouverte : remarques

Les expressions précédentes ne nécessitent aucune intégration d’équation différentielle aux différences

Seul imprératif : σ(t) doit être dérivable.

Une paramétrisation complète est obtenue.

Le fait d’avoir des avances (σ(t + τ 2 ), . . . ) n’est pas gênant puisque σ(t) est connue à l’avance.

90

(91)

Routeurs : stabilisation et prédicteurs

91

(92)

Suivi avec stabilité par prédiction : introduction

On peut, dans le cas de retards constants, utiliser des lois incluant des retards dits distribués.

Par exemple, dans le cas d’un modèle de dynamique de file de la forme

˙

q(t) = −ρ + u (t − τ ) où

q(t) est la taille de la file,

ρ est la vitesse de traitement du routeur étudié, u(t) est le débit de la source,

τ est le retard de transmission de la source au routeur

92

(93)

Suivi avec stabilité par prédiction : introduction (suite)

Une loi de commande stabilisante est u(t) = ρ − Kq(t + τ ) Et, pour estimer la prédiction q(t + τ ), on pose

q (t + τ ) − q(t) = Z t+τ

t

˙ q(η)d η d’où

q(t + τ ) = q(t) + Z t+τ

t

−ρ + u(η − τ )d η

= q(t) + ρτ + Z t

t−τ

u(η)d η

93

(94)

Suivi avec stabilité par prédiction : introduction (suite)

La loi de commande cherchée est donc u(t ) = (1 − K τ )ρ − Kq(t) − K

Z t t−τ

u(η)d η le dernier terme étant qualifié de retard distribué.

94

(95)

Suivi avec stabilité de routeurs à charge constante

Ayant le modèle

˙

x ₁ (t) = v (t − τ ₁ ) − ρx ₁ (t)

˙

x ₂ (t) = ρx ₁ (t − τ ₂ ) y(t) = x 1 (t − τ 1 ) L’équation E/S s’écrit

˙

y (t) + ρy(t) = v(t − 2τ 1 ) Posant

y _e (t) = y(t) − y _r (t), v _e (t) = v(t) − v _r (t)

95

(96)

Suivi avec stabilité de routeurs à charge constante (suite)

On obtient le système d’erreur

˙

y _e (t) + ρy _e (t ) = v _e (t − 2τ ₁ ) ou, symboliquement

(s + ρ)ˆ y _e = e ^−2τ

¹

^s ˆ v _e Remarque : le système d’erreur est stable ! Stabilisation : y _e = y − y _r −→

t→+∞ 0

On veut un comportement exponentiellement stable des erreurs de suivi, c.à.d. :

˙

y _e (t) = −λy _e (t) avec λ > 0 en boucle fermée avec un taux de convergence spécifié

96

(97)

Suivi avec stabilité de routeurs à charge constante (suite)

Ayant y ˙ _e (t) + ρy _e (t) = v _e (t − 2τ ₁ ) et voulant

˙

y e (t) = −λy _e (t) On pose

v _e (t) = (ρ − λ)y _e (t + 2τ ₁ )

97

(98)

Suivi avec stabilité de routeurs à charge constante (suite)

Symboliquement y _e (t + 2τ ₁ ) s’écrit (cf. Manitius et Olbrot (1979), Bréthé et Loiseau (1998))

e ^2τ

¹

^s ˆ y _e = 1

s + ρ ˆ u _e instable si ρ < 0

= 1

s + ρ

e ^−2τ

¹

^(s+ρ) + 1 − e ^−2τ

¹

^(s+ρ) ˆ u _e

= e ^−2τ

¹

^ρ 1

s + ρ e ^−2τ

¹

^s ˆ u _e

+ 1 − e ^−2τ

¹

^(s+ρ) (s + ρ) ˆ u _e

= e ^−2τ

¹

^ρ y ˆ _e + 1 − e ^−2τ

¹

^(s+ρ) (s + ρ) u ˆ _e

98

(99)

Suivi avec stabilité de routeurs à charge constante (suite)

ou, en temporel

y e (t + 2τ 1 ) = e ^−2τ

¹

^ρ y e (t) + Z t

t−2τ

₁

e ^{−ρ(t−η)} u e (η)d η La loi de commande de suivi stabilisant est donc

v(t) = v r (t) + v e (t )

= v _r (t) + (ρ − λ)e ^−2τ

¹

^ρ y _e (t)+

(ρ − λ) Z t

t−2τ

₁

e ^{−ρ(t−η)} (v(η) − v r (η))d η

99

(100)

Suivi avec stabilité de routeurs à charge constante (suite) (suite)

ou encore

v(t) = v r (t) + (ρ − λ) Z t

t−2τ

1

e ^{−ρ(t−η)} v r (η)d η

| {z }

connu

+

(ρ − λ)

e ^−2τ

¹

^ρ y e (t) + Z t

t−2τ

₁

e ^{−ρ(t−η)} v(η)d η

| {z }

mesuré

avec v r (t) = 1

ρ ² σ(t ¨ + τ 1 + τ 2 ) + ˙ σ(t + τ 1 + τ 2 ) et

Z ∞ 0

σ(η)d η données à recevoir à la destination (requête)

100

(101)

Platitude et suivi de modèles non linéaires

101

(102)

Platitude différentielle

Considérons un système non linéaire

F _l (z, . . . , z ⁽ⁱ ⁾ , . . . , z ^(ν

^l

⁾ ) = 0, l = 1, . . . , N.

Il est différentiellement plat s’il existe un m-uple y = (y ₁ , . . . , y _m ) (m nombre d’entrées indépendantes) de fonctions, la sortie plate, t.q. :

1/ Caractère endogène :

y s’exprime en fonction des variables du système z y _i = P _i (z, . . . , z ^(k) , . . . , z ^(ρ

ⁱ

⁾ ) pour i = 1, . . . , m.

102

(103)

Platitude différentielle (suite)

2/ Indépendance :

Les composantes de y sont différentiellement indépendantes Q (y , . . . , y ^(k ⁾ , . . . , y ^(α) ) = 0 = ⇒ Q ≡ 0

3/ Forme canonique de suivi :

Toute variable z _i du système s’exprime directement à partir y et de ses dérivées

z i = R(y , . . . , y ^(k) , . . . , y ^(γ) )

103

(104)

Platitude différentielle (suite)

La 3 ^e propriété : sol. simple du suivi de trajectoires de références y _r = (y _1r (t), . . . , y _mr (t)).

La 2 ^e propriété : les composantes de y _r (t ) peuvent être choisies indépendamment.

104

(105)

Platitude différentielle d’un modèle d’état

Le système x ˙ (t) = f (x(t), u(t)), où x(t) ∈ R ⁿ et u(t) ∈ R ^m est différentiellement plat s’il existe un m-uple de sorties plates,

y (t) = h(x (t), u(t), u ˙ (t), . . . , u ^(r ⁾ (t)), y (t) ∈ R ^m , r ∈ N tel que d’une part

x(t) = A(y (t), y ˙ (t), . . . , y ^(q) (t)) u(t) = B(y (t), y ˙ (t), . . . , y ^(q+1) (t)) où q ∈ N, et t.q. d’autre part les éqs. du système dA

dt (y (t), . . . , y

^(q+1)

(t)) = f (A(y (t ), . . . , y

^(q)

(t )), B(y (t), . . . , y

^(q+1)

(t ))) soient identiquement satisfaites.

105

(106)

Suivi de trajectoires

Session TCP/RED : modèle simplifié

W ˙ (t) = 1 R 0

− (W (t)) ² 2R 0

p(t − R)

˙

q(t) = W (t) R 0

N − C W (t) largeur de la fenêtre

q(t) longueur de la file d’attente du noeud congestionné p(t) probabilité de rejet d’un paquet

N Nombre de sessions TCP traversant le noeud congestionné R 0 Valeur nominale du RTT (Round Trip Time) (sec)

C capacité du lien (paquets/sec)

106

(107)

Suivi de trajectoires (suite)

Supposons avoir, d’après un opérateur, une politique

d’allocation de file de noeuds chargés, q _r (t). Alors, on en tire W (t) = R ₀ ( ˙ q _r (t) + C )

N et, d’après la dynamique de fenêtre

p(t − R) = 2R ₀ (W (t)) ²

1 R 0

− W ˙ (t)

= 2(1 − R ₀ W ˙ (t)) (W (t)) ²

107

(108)

Suivi de trajectoires (suite)

et, après remplacement

p _r (t) = 2N(N − R ₀ ² q ¨ _r (t + R ₀ )) (R 0 q ˙ r (t + R 0 ) + C ) ² qui assure le suivi en boucle ouverte de q r .

Ainsi, pour un taux de charge (resp. de pertes) instantanné donné (via q r (t)), on en déduit la probabilité de marquage à appliquer,

et ce, sans intégrer d’équation différentielle.

108

(109)

Conception de trajectoires

On désire une représentation simple et souple des trajectoires de référence dans un espace fonctionnel F donné

Plus précisément, on recherche une classe de trajectoires telle que :

Les membres de cette classe soient une combinaison linéaire de fonctions connues, P

N

1

α

i

φ

i

(t).

La classe forme un espace d’approximation de F.

Les bornes supérieures et inférieures d’un membre de la classe se déduisent simplement des paramètres servant à composer ce membre.

Les fonctions φ

_i

(t) soient bien localisées en temps et en fréquence.

109

(110)

Conception de trajectoires (suite)

On prend par exemple une B-spline d’ordre k σ(t) =

N

0

X

0 p _i b _i,k (t)

p i : points de contrôle

b _i,k (t) : fonctions de base B-spline d’ordre k .

Les points de contrôle p _i sont des paramètres de conception spatiaux de trajectoire.

On peut également prendre des Splines d’ondelettes.

110

(111)

Modélisation et propriétés structurelles en dimension inﬁnie: des systèmes à retards aux équations aux dérivées partielles

Modélisation et propriétés structurelles en dimension infinie: des systèmes à retards aux

équations aux dérivées partielles

Hugues Mounier

Institut d’Électronique Fondamentale, Université Paris sud

École d’automne – Douz, 2006

1

Plan

Régulateurs de type PID

Application aux réseaux informatiques – Notion de platitude Des SàR aux EDP : Équation des ondes et forage

Commandabilités et π-liberté

2

Régulateurs de type PID

3

Motivation et commandabilité en dimension finie

4

Motivations

Obtenir des schémas de stabilisation simples et proches des classiques utilisés en ingénierie, pour des systèmes de transfert :

G (s )e −hs où G (s) est éventuellement instable.

Le schéma proposé :

Généralise les régulateurs PID et le prédicteur de Smith.

Permet une reconstruction exacte des dérivées des mesures.

5

Motivations (suite)

Utilisation :

De prédicteurs utilisant les valeurs passées de l’entrée.

De reconstructeurs intégraux exacts utilisant les mesures et leurs intégrales itérées.

Cette dernière reconstruction a un effet lissant par l’utilisation d’intégrales, mais

elle évite les erreurs d’approximation d’un filtrage de type boîte noire.

utilisée au sein d’un régulateur PID, elle est plus robuste qu’un observateur asymptotique.

6

Un réacteur simple

Réacteur isotherme uniformément agité Réaction du 1 er ordre :

A −→ produits

Commandé par la concentration d’entrée en A : c AF Flux d’entrée mélangé en amont du réacteur : retard sur l’entrée non négligeable.

7

Un réacteur simple (suite)

Équilibre molaire

˙

c A (t ) = q [c AF (t − τ ) − c A (t)] − kc A (t) Avec les constantes q le débit d’entrée et k le taux de réaction.

Correspond au modèle de Broïda-Stretch : e −hs

1 + Ts

Ce modèle est utilisé pour diverses modélisations.

8

Modèle employé

On considère le modèle perturbé

sy = ay + be −hs u + $ e −ϕs s Avec a éventuellement positif.

La perturbation constante $ apparaît à t > ϕ par le biais d’un heaviside translaté.

On considère également le modèle nominal sy nom = ay nom + be −hs u nom

9

Forme adaptée au suivi

On exprime directement u nom en fonction de y nom et sy nom

u nom = 1

b se hs y nom − a

b e hs y nom

Cette forme est très utile pour le suivi d’une trajectoire désirée y nomd en boucle ouverte.

Il n’y a pas d’intégration d’équation différentielle aux différences.

La prédiction e hs y nom n’est pas un inconvénient en suivi en boucle ouverte, connaissant le trajectoire désirée y nomd sur tout l’horizon temporel.

10

Rappel de commandabilité en dimension finie

Système classique, mono-entrée s x = Ax + bu, x = (x 1 , . . . , x n ).

Critère de Kalman

rg R [b, Ab, . . . , A n−1 b] = n Critère de Hautus-Popov-Belevitch

∀s ∈ C , rg C [sI − A | b] = n

11

Rappel de commandabilité en dimension finie (suite)

Mise sous forme compagnon s z 1 = z 2

sz 2 = z 3

.. .

sz n−1 = z n

sz n = p 1 z 1 + p 2 z 2 + . . . + p n z n + qu Sous-espace de non commandabilité de Kalman vide.

La forme compagnon permet un suivi de trajectoire des plus aisés ; posant z 1d = y d :

u d = − 1 β

α 1 y d + α 2 sy d + . . . α n s n−1 y d (t) − s n y d (t)

12

Rappel de commandabilité en dimension finie (suite)

Par ailleurs, z 1 fournit une paramétrisation complète : toute variable s’exprime comme combinaison linéaire de z 1 et d’un nombre fini de ses dérivées.

z 2 = sz 1

z 3 = s 2 z 1

.. .

G (s )e ^−hs où G (s) est éventuellement instable.

Réacteur isotherme uniformément agité Réaction du 1 ^er ordre :

Commandé par la concentration d’entrée en A : c _AF Flux d’entrée mélangé en amont du réacteur : retard sur l’entrée non négligeable.

c _A (t ) = q [c _AF (t − τ ) − c _A (t)] − kc _A (t) Avec les constantes q le débit d’entrée et k le taux de réaction.

Correspond au modèle de Broïda-Stretch : e ^−hs

sy = ay + be ^−hs u + $ e ^−ϕs s Avec a éventuellement positif.

On considère également le modèle nominal sy _nom = ay _nom + be ^−hs u _nom

b se ^hs y nom − a

b e ^hs y nom

Cette forme est très utile pour le suivi d’une trajectoire désirée y _nomd en boucle ouverte.

La prédiction e ^hs y _nom n’est pas un inconvénient en suivi en boucle ouverte, connaissant le trajectoire désirée y nomd sur tout l’horizon temporel.

rg _R [b, Ab, . . . , A ⁿ⁻¹ b] = n Critère de Hautus-Popov-Belevitch

∀s ∈ C , rg _C [sI − A | b] = n

La forme compagnon permet un suivi de trajectoire des plus aisés ; posant z _1d = y _d :

α 1 y d + α 2 sy d + . . . α n s ⁿ⁻¹ y d (t) − s ⁿ y d (t)

Par ailleurs, z ₁ fournit une paramétrisation complète : toute variable s’exprime comme combinaison linéaire de z 1 et d’un nombre fini de ses dérivées.

z 3 = s ² z 1

z n = s ⁿ⁻¹ z 1

α ₁ z ₁ + α ₂ sz ₁ + . . . α _n s ⁿ⁻¹ z ₁ − s ⁿ z ₁ y = z ₁

Λ = [w 1 , . . . , w α ] , [w ] P Λ (s , e ^hs ) w = 0

avec P _Λ ∈ R [s , e ^hs ] ^β×α , rg _R _[s,e

] P _Λ = β, β 6 α.

Λ est sans retard si P _Λ ∈ R [ _dt ^d ] ^β×α , c.à.d. s’il existe des équations du modèle ne contenant pas de retard.

Une dynamique Λ d’entrée u est quasi-finie s’il existe des monômes M _i (δ), i = 1, . . . , m tels que posant v _i = M _i (δ)u _i , la dynamique Λ ˜ d’entrée v = (v 1 , . . . , v m ) est sans retard.

anticipation (ou δ-libre ou e ^−hs -libre) si elle est libre pour peu que l’on s’autorise des avances.

x = P ₀ ω + P ₁ s ω + . . . + P γ s ^γ ω (3) u = Q ₀ e ^hs ω + Q ₁ se ^hs ω + . . . + Q _µ s ^µ e ^hs ω (4)

Considérons la trajectoire de concentration c _Ad (t).