SY15 - Automatique avancée Introduction à la commande des systèmes non-linéaires S. Mottelet

(1)

SY15 - Automatique avanc ´ee

Introduction à la commande des syst èmes non-lin éaires

S. Mottelet

Universit ´e de Technologie de Compi `egne

1^erjuin 2015

(2)

1 Cours 1 : particularit és des syst èmes non-lin éaires

2 Cours 2 : contr ôle LQR d’un syst ème non-lin éaire

3 Cours 3 : contr ˆole par feedback lin ´earisant

(3)

Cours 1

Particularit és des syst èmes lin éaires et non-lin éaires

1 Exemples

2 Calcul des solutions

3 Points d’ ´equilibre

4 Stabilit ´e

5 Etude locale des syst `emes non-lin ´eaires

(4)

1.1. Pendule (TD1)

θ⁰⁰=−g L sinθ

(5)

1. Exemples

1.2. Equation de Duffing (TD1)

x⁰⁰+kx⁰−x+x³=bcost,

(6)

1.3. Equation de Van der Pol (TD1)

x⁰⁰−µ(1−x²)x⁰+x =0.

(7)

1. Exemples

1.4. Pendule invers ´e (TD2)

(M+m)x⁰⁰+ml(cosθ)θ⁰⁰ = F +mlθ⁰²sinθ, (1) (cosθ)x⁰⁰+lθ⁰⁰ = gsinθ, (2)

(8)

1.5. Scaphandre autonome (TD3)

h⁰⁰=a−bh⁰−c N

d+h, (3)

N⁰ =u. (4)

(9)

2. Calcul des solutions

2.1 Syst `emes lin ´eaires

X⁰=AX+Bv,t >0, (5)

X(0) =X₀, (6)

X(t) =exp(At)X₀+exp(At) Z t

0

exp(−Aτ)Bv(τ)dτ

(10)

2.1 Syst `emes lin ´eaires

mx⁰⁰+kx =0,t>0, (7) x(0) =x₀,x⁰(0) =v₀ (8)

X = x

x⁰

X⁰=AX

x(t) =x₀cos(ωt) +v₀

ω sin(ωt), ω²= k m

(11)

2. Calcul des solutions

2.2 Syst `emes non-lin ´eaires

x⁰+x²=0,t >0, (9)

x(0) =1, (10)

x(t) = 1 t+1

(12)

2.2 Approximation dans le cas g ´en ´eral

X⁰ =f(t,X),t ∈[0,T], (11)

X(0) =X₀, (12)

Discr ´etisation de[0,T]:t_k =kT/N,k =0. . .N.

Sch éma num érique (Euler, Runge-Kutta, . . .) : X_k₊₁=X_k+hφ(t_k,X_k),k =0. . .N−1 Ordre d’un sch éma :

∃C >0,∀k =1. . .N,kX(t_k)−X_kk ≤Ch^p

(13)

2. Calcul des solutions

2.2 Approximation dans le cas g ´en ´eral

Le pendule en Scilab : function dXdt=f(t,X)

dXdt=[X(2);-g/L*sin(X(1)];

endfunction X0=[1;0];

t=linspace(0,10,1000);

X=ode(X0,0,t,f);

plot(t,X(1,:));

(14)

Syst `eme autonome :X(t)∈Rⁿ,

X⁰=f(X),t >0. (S)

D ´efinition

Le vecteurX^∗est un point d’ ´equilibre de(S)si X(0) =X^∗ ⇒ ∀t>0,X(t) =X^∗.

Les points d’ équilibre de (S) sont caract éris és par f(X^∗) =0.

(15)

3. Points d’ ´equilibre

3.1. Syst `emes lin ´eaires

X⁰ =AX,t>0,

AX^∗ =0 ⇒ X^∗ ∈KerA, Masse-ressort

mx⁰⁰+kx =0, Double int ´egrateur

x⁰⁰=0.

(16)

3.2. Syst `emes non-lin ´eaires

Pendule

X⁰ =

X₂

−^g_LsinX₁

,t >0,

(17)

4. Stabilit ´e des syst `emes autonomes

4.1. D ´efinitions

X⁰=f(X),t >0, (13) f(X^∗) =0

D ´efinition

Le point d’ ´equilibreX^∗ est stable si

∀R>0,∃r >0,kX(0)−X^∗k<r ⇒ ∀t >0,kX(t)−X^∗k<R.

D ´efinition

Un point d’ ´equilibreX^∗ qui n’est pas stable est dit instable et on a

∗ ∗

(18)

4.1. D ´efinitions

Portrait de phase du pendule centr ´e sur(0,0)

(19)

4. Stabilit ´e des syst `emes autonomes

4.1. D ´efinitions

Portrait de phase du pendule centr ´e sur(π,0)

(20)

4.1. D ´efinitions

D ´efinition

Le point d’ ´equilibreX^∗ est asymptotiquement stable si il est stable et si

∃r >0,kX(0)−X^∗k<r ⇒ ∀t >0, lim

t→+∞kX(t)−X^∗k=0.

Pendule amorti X⁰ =

X₂

−^g_LsinX₁−αX₂

,t>0, avecα >0.

(21)

4. Stabilit ´e des syst `emes autonomes

4.1. D ´efinitions

Portrait de phase du pendule amorti centr ´e sur(0,0)

(22)

4.2. Stabilit é des syst èmes lin éaires

X⁰ =AX,t>0. (SL)

Propri ´et ´e

Le syst `eme (SL) est

instable si au moins une valeur propre deAest `a partie r ´eelle strictementpositive,

stable si toutes les valeurs propres deAsont à partie r éelle n égative,

asymptotiquement stable si si toutes les valeurs propres deAsont

à partie r éellestrictementn égative.

(23)

5. Etude locale des syst `emes non-lin ´eaires

5.1. Rappels de calcul diff ´erentiel

D ´efinition

Soitf :Rⁿ →R^m, on dit quef est diff ´erentiable enX₀s’il existe une matricef⁰(X₀)tel que

f(X₀+h) =f(X₀) +f⁰(X₀)h+khk(h), o `u(h)tend vers 0 quandhtend vers 0.

−→f⁰(X0)est la matrice des d ériv ées partielles def1, . . . ,fmpar rapport àX₁, . . . ,Xn

[f⁰(X₀)]_i,j = ∂f_i

∂X_j(X₀).

(24)

5.2. Lin ´earis ´e tangent

D ´efinition

Soit le syst ème d éfini par l’ équation diff érentielle autonome

X⁰=f(X),t >0, (S) etX^∗ un point d’ équilibre de ce syst ème. Son lin éaris é tangent enX^∗ est le syst ème lin éaire d éfini par

Z⁰=f⁰(X^∗)Z,t >0. (SLT_X^∗)

(25)

5. Etude locale des syst `emes non-lin ´eaires

5.3. Resultats de stabilit ´e

Th ´eor `eme 1

(SLT_X^∗) stable⇐⇒X^∗est un point d’ ´equilibre stable de (S).

Th ´eor `eme 2

(SLT_X^∗) asymptotiquement stable

=⇒X^∗est un point d’ ´equilibre asymptotiquement stable de (S).

La r éciproque du th éor ème 2 est fausse !

A. M. Liapounov 6/6/1857 - 3/11/1918

(26)

Contr ôle LQR d’un syst ème non-lin éaire

1 Contr ˆole par retour d’ ´etat

2 Le r ´egulateur lin ´eaire quadratique (LQR)

3 Application au pendule

4 Application au pendule invers ´e

(27)

1. Contr ôle par retour d’ état lin éaire

1.1. Cas des syst `emes lin ´eaires

X⁰ =AX +Bv,t >0, (14)

X(0) =X₀. (15)

X(t)∈Rⁿ,v(t)∈R^m

Si le syst ème est stabilisable alors il existeK ∈ M_m,ntelle que les valeurs propres deA−BK sont à partie r éelle strictement

n ´egatives :

v(t) =−KX(t).

(28)

1.2. Cas des syst `emes non-lin ´eaires

X⁰ =f(X,v),t >0, (16)

X(0) =X₀. (17)

Point d’ ´equilibre(X^∗,v^∗):

0=f(X^∗,v^∗).

Retour d’ ´etat :v =v^∗−K(X−X^∗).

Si possible, d éterminerK pour assurer la stabilit é asymptotique du syst ème.

(29)

1. Contr ôle par retour d’ état lin éaire

X⁰ =f(X,v),t >0, X(0) =X₀.

Syst `eme en boucle ferm ´ee

X⁰ =f(X,v^∗−K(X −X^∗)) =g(X), Syst `eme autonome

(30)

X⁰ =f(X,v^∗−K(X−X^∗)) =g(X), (S)

Proposition Si on note

A=f_X⁰(X^∗,v^∗), B =f_v⁰(X^∗,v^∗),

o ùf_X⁰ etf_v⁰ d ésignent les d ériv ées partielles def par rapport àX etv respectivement, alors l’ équation d’ état du lin éaris é tangent de (S) en X^∗ est donn ée par

Z⁰ = (A−BK)Z. (SLT)

(31)

1. Contr ôle par retour d’ état lin éaire

Sans perte de g én éralit é on supposeX^∗ =0,v^∗ =0 g(X) =f(X,−KX),

g⁰(X) =f_X⁰(X,−KX)−f_v⁰(X,−KX)K, g⁰(0) =f_X⁰(0,0)−f_v⁰(0,0)K,

=A−BK.

(32)

Syst `eme non autonome :

X⁰ =f(X,v), (S) Lin éaris é tangent du syst ème de (S) en(X^∗,v^∗):

Z⁰=f_X⁰(X^∗,v^∗)Z +f_v⁰(X^∗,v^∗)u. (SLT)

Th ´eor `eme

Si (SLT) est stabilisable, alors il existeK telle que le syst `eme boucl ´e X⁰ =f(X,v^∗−K(X−X^∗))

est asymptotiquement stable.

(33)

2. Le r ´egulateur LQR

2.1. Probl `eme de contr ˆole optimal

Syst `eme contr ˆolable

X⁰ =AX +Bv,t∈[0,T], (18)

X(0) =X₀. (19)

Fonction co ˆut

J(v) = 1 2

Z T 0

(X^>QX+v^>Rv)dt.

Probl `eme d’optimisation : trouvervˆ∈C(0,T)tel que

∀v ∈C(0,T),J(ˆv)≤J(v).

(34)

Th ´eor `eme

Pour tousu,v ∈C(0,T)on d éfinit l’application d ériv ée deJ par

J⁰(u)v = lim

h→0

J(u+hv)−J(u)

h ·

Sivˆ est le contr ˆole optimal, alors on a n ´ecessairement

∀v ∈C(0,T),J⁰(ˆv)v =0.

(35)

2. Le r ´egulateur LQR

On noteX etY les solutions respectives de

X⁰ =AX +Bu,X(0) =X0, (20) Y⁰ =AY +Bv,Y(0) =0. (21)

Y(t) = Z t

0

exp(A(t−τ))Bv(τ)dτ.

On montre ais ´ement que

J⁰(u)v = Z T

0

(X^TQY +u^TRv)dt.

(36)

Z T 0

X^TQY dt = Z T

0

Z t 0

X(t)^>Qexp(A(t−τ))Bv(τ)dτdt,

= Z T

0

Z T τ

X(t)^>Qexp(A(t−τ))Bv(τ)dt dτ,

=− Z T

0

Z τ T

exp(A^>(t−τ))QX(t)>

Bv(τ)dt dτ,

=− Z T

0

Z τ

T

exp(−A^>(τ −t))QX(t)dt

>Bv(τ)dτ,

=− Z T

0

p(τ)^>Bv(τ)dτ

(37)

2. Le r ´egulateur LQR

Etat adjoint :p

p⁰=−A^>p+QX,t ∈[0,T[, p(T) =0.

Calcul de la d ´eriv ´ee J⁰(u)v =

Z T 0

(X^TQY+u^TRv)dt = Z T

0

−B^>p+Ru>

v dt

Condition d’optimalit ´e

∀v ∈C(0,T),J⁰(ˆv)v =0=⇒ −B^>p+Rˆv =0, vˆ=R⁻¹B^>p

(38)

Syst `eme d’optimalit ´e

X⁰ =AX +BR⁻¹B^>p,t ∈]0,T], p⁰ =−A^>p+QX,t ∈[0,T[, X(0) =X₀,

p(T) =0.

Probl `eme ”aux deux bouts”

(39)

2. Le r ´egulateur LQR

2.2. Probl `eme de contr ˆole optimal avec horizon infini

On consid `ere le casT → ∞

X⁰ =AX+BR⁻¹B^>p,t >0, p⁰ =−A^>p+QX,t >0 avec

tlim→∞X(t) = lim

t→∞p(t) =0, et on cherchePtelle que

∀t>0,p(t) =−PX(t), ce qui permet d’obtenir

vˆ =−BR⁻¹B^>PX =−KX.

(40)

2.2. Probl `eme de contr ˆole optimal avec horizon infini

Th ´eor `eme

On consid `ere le syst `eme stabilisable

X⁰ =AX +Bv,t >0, X(0) =X₀,

et la fonction co ˆut

J(v) = 1 2

Z +∞

0

(X^>QX +v^>Rv)dt.

Le minimum deJ(v)est atteint envˆ =−KX o ùK =R⁻¹B^>P etP est l’unique solution d éfinie positive de l’ équation de Riccati

PA+A^>P−PBR⁻¹B^>P+Q=0.

(41)

2. Le r ´egulateur LQR

2.3. Calcul pratique

J(v) = 1 2

Z +∞

0

(X^>QX +v^>Rv)dt.

Param ètres de design : pond ération avec des matrices sym étriques

Q ≥0,R>0 LQR vs placement de p ˆoles ?

Dans le cas des syst èmes à plusieurs entr ées le placement de p ôles peut être impossible !

(42)

2.3. Calcul pratique

Avec Matlab :

>> A=[0 1;-1 0];

>> B=[0;1];

>> Q=eye(2,2);

>> R=1;

>> [K,P,e]=lqr(A,B,Q,R,0) e =

- 0.6760967 + 0.9783183i - 0.6760967 - 0.9783183i P =

1.9122903 0.4142136 0.4142136 1.3521934 K =

0.4142136 1.3521934

(43)

3. Application au pendule

3.1. Syst ème lin éaris é tangent

Pendule command ´e par un couplev :

X⁰=

X₂

−^g_LsinX₁+_mL¹2v

. (S)

Point d’ ´equilibre instableX^∗= π

0

,

Z⁰ =AZ +Bv, (SLT)

A=

0 1

g L 0

, B=

0

1 mL²

.

Contr ˆolabilit ´e :

(B,AB) = 1 mL²

0 1 1 0

(44)

3.2. R ´esultats num ´eriques

L=1, m=1, g=9.81

Q=

1 0 0 0

,R =10⁻³.

Syst `eme boucl ´e

X⁰ =

X2

−^g_LsinX1−_mL¹₂K(X −X^∗)

,

X(0) =X₀.

X₀proche deX^∗=⇒stabilit ´e asymptotique Distance critique ?

(45)

3. Application au pendule

(46)

4.1. Forme du premier ordre en temps

X = [x, θ,x⁰, θ⁰]^>, X^∗ = [x^∗,0,0,0]^>,

v^∗ =0, v =F~.~ı

M+m mLcosθ

cosθ L

x⁰⁰ θ⁰⁰

=

v+mLθ⁰²sinθ gsinθ

(47)

4. Application au pendule invers ´e

4.1. Forme du premier ordre en temps

Forme implicite

X₁⁰ =X₃, X₂⁰ =X₄, M+m mLcosX₂

cosX₂ L

X₃⁰ X₄⁰

=

v +mLX₄²sinX₂ gsinX₂

Forme explicite

X⁰ =f(X,v).

(48)

Calcul def_X⁰(X,v): le vecteurf(X,v)est solution du syst `eme d’ ´equations H(X)f(X,v) =g(X,v),

H(X) =





 1

1

M+m mLcosX2

cosX2 L







,g(X,v) =







X3

X4

v+mLX₄²sinX2

gsinX2







qu’il suffit de d ériver formellement par rapport àXet d’ écrire en(X^∗,v^∗): H⁰(X^∗)f(X^∗,v^∗) +H(X^∗)fX⁰(X^∗,v^∗) =g⁰X(X^∗,v^∗).

Par d ´efinitionf(X^∗,v^∗) =0, doncf_X⁰(X^∗,v^∗)est solution de H(X^∗)f_X⁰(X^∗,v^∗) =g⁰(X^∗,v^∗)soit

f_X⁰(X^∗,v^∗) =H(X^∗)⁻¹g_X⁰(X^∗,v^∗).

(49)

4. Application au pendule invers ´e

Calcul def_v⁰(X,v): en d érivant par rapport àvle calcul est plus simple carH(X) ne d épend pas dev. On a donc

H(X^∗)f_v⁰(X^∗,v^∗) =g⁰_v(X^∗,v^∗),

soit

f_v⁰(X^∗,v^∗) =H(X^∗)⁻¹g_v⁰(X^∗,v^∗).

Comme ici(X^∗,v^∗) = (0,0)on obtient

f_X⁰(0,0) =





 1

1

M+m mL

1 L







−1





1 1

0 0

0 g







=







1 1 0 −^gm_M

0 ^g(M+m)_ML





 ,

fv⁰(0,0) =





 1

1

M+m mL

1 L







−1



 0 0 1 0







=





 0 0

1 M

−_ML¹





 .

(50)

Z⁰ =







0 0 1 0

0 0 0 1

0 −^gm_M 0 0 0 ^g(M+m)_ML 0 0







| {z }

A=f_X⁰(X^∗,v^∗)

Z+





 0 0

1 M

−_ML¹







| {z }

B=f_v⁰(X^∗,v^∗)

v (SLT)

(SLT) est instable

λ₁=λ₂=0, λ₃=− s

g(M+m) ML , λ₄=

s

g(M+m) ML · Contr ˆolabilit ´e

2 3

(51)

4. Application au pendule invers ´e

4.3. Syst `eme boucl ´e

X₁⁰ =X₃, X₂⁰ =X4, M+m mLcosX₂

cosX₂ L

X₃⁰ X₄⁰

=

−KX +mLX₄²sinX₂ gsinX₂

.

function dXdt=f(t,X) v=-K*X;

accel=[M+m,m*L*cos(X(2))

cos(X(2)),L] \ [v+m*L*X(4)ˆ2*sin(X(2));g*sin(X(2))];

dXdt=[X(3:4);accel];

end

(52)

M =1,m=0.1,L=0.7,g =9.81,Q=diag(1,1,0.1,0.1),R=0.1

(53)

Cours 3

Contr ˆole par feedback lin ´earisant

1 Mod ´elisation du scaphandre autonome

2 Stabilit ´e

3 D ´ecomposition lent/rapide

4 Feedback lin ´earisant

(54)

(55)

1. Mod ´elisation du scaphandre autonome

Gilet stabilisateur

Dynamique de remplissage N⁰ =u.

(56)

1.1. Un peu de thermodynamique

Air dans le gilet→volumeV (m³) , quantit ´eN (moles) pV =NRθ, p=p0+hρg.

Pouss ´ee d’Archim `ede→f (Newtons) f =−(V₀+V)ρg.

Relation fondamentale de la dynamique mh⁰⁰=mg−

V₀+ NRθ p₀+hρg

ρg−Ch⁰,

=(m−ρV₀)

| {z }

≥0

g−Rθ N

p₀

ρg+h−Ch⁰.

(57)

1. Mod ´elisation du scaphandre autonome

1.2. Equation d’ ´etat

a= m−ρV₀

m , b= C

m, c =Rθ, d = p₀ ρg

h⁰ =a−bh⁰−c N d+h, N⁰ =u.

Forme standard d’ordre 1

X = h,h⁰,N>

,

X⁰ =







X₂ a−bX₂−c X₃

d+X1







=f(X,u).

(58)

Point d’ ´equilibre

f(X^∗,u^∗) =0⇐⇒u^∗=0,X₂^∗=0,a−c X₃^∗

d+X₁^∗ =0, N^∗ = a

c(d+h^∗).

D ´eriv ´ees

f_X⁰(X^∗,u^∗) =





0 1 0

α −b β

0 0 0



,

α= a

d+h^∗, β =− c d +h^∗·

(59)

2. Stabilit ´e

2.3. Retour statique

u=k(h−h^∗),k ∈R,

X⁰=





X₂

a−bX₂−c_d+X1^X³ k(X₁−h^∗)



=g(X).

Etude locale

g⁰(X^∗) =





0 1 0

α −b β

k 0 0



.

(60)

2.3. Retour statique

Recherche des valeurs propres

d ´et(g⁰(X^∗)−λI) =λ³+bλ²−αλ−kβ, Hypoth `ese : Re(λ_i)<0,i=1,2,3

(λ−λ₁)(λ−λ₂)(λ−λ₃) =λ³−(λ₁+λ₂+λ₃)λ² +(λ₁λ₂+λ₂λ₃+λ₁λ₃)

| {z }

>0

λ

−λ₁λ₂λ₃.

Quelque soitk le syst `eme boucl ´e est instable !

(61)

3. Contr ˆole rapide

3.1. Bouclage grand gain

Nouvelle commandev

u= v−X₃

ε ·

grand gain ⇐⇒ 1ε >0

X₁⁰ =X₂, (22)

X₂⁰ =a−bh⁰−c X₃

d +X₁, (23) X₃⁰= v−X₃

ε · (24)

(62)

3.1. Bouclage grand gain

Pourε=0.01 on aX₃≈v!

(63)

3. Contr ˆole rapide

3.2. D ´ecomposition lent/rapide

X₁⁰ =X₂,

X₂⁰ =a−bX₂−c X₃ d+X₁, X₃⁰=v−X₃.

Th ´eorie des perturbations singuli `eres

Si la dynamique rapide est asymptotiquement stable, on peut ´etudier le syst `eme quand=0

X₁⁰ =X2,

X₂⁰ =a−bX₂−c v d +X₁·

(64)

3.3. Synth `ese de la commande

1 Synth `ese de la commandev pour le sous-syst `eme lent : X₁⁰ =X₂,

X₂⁰ =a−bX₂−c v d+X₁, v=g(X₁,X₂).

2 Bouclage grand gain sur le vrai syst `eme X₁⁰ =X₂,

X₂⁰ =a−bX₂−c X₃ d+X₁, X₃⁰ =u,

u= g(X₁,X₂)−X₃

·

(65)

4. Feedback lin ´earisant

4.1. Bouclage non-lin ´eaire

Sous syst `eme lent

X₁⁰ =X2,

X₂⁰ =a−bX₂−c v d+X₁· Bouclage non-lin ´eaire

v = d+X₁

c (a−w).

=⇒syst ème lin éaire par rapport à la nouvelle commandew X₁⁰ =X₂,

X₂⁰ =−bX₂+w.

(66)

4.2. Placement de p ˆoles

Syst ème lin éaire + retour d’ état X₁⁰

X₂⁰

=

0 1 0 −b

X₁ X₂

+

0 1

w,

w = (s₁,s₂)

X₁−h^∗ X₂

.

Choix des p ˆoles en boucle ferm ´ee pourbpetit

λ=√

α(−1±i),

=⇒s₁=−2α, s₂=−2√ α.

(67)

4. Feedback lin ´earisant

4.3. Stabilisation `a la profondeurh^∗

Feedback non lin ´eaire obtenu

w =s₁(X₁−h^∗) +s₂X₂,v = d +X₁

c (a−w),u = v−X₃

ε ,

=⇒u= 1 ε

d +X₁

c (a−s1(X1−h^∗)−s2X2)−X3

.

Cas test : perturbation due `a la respiration du plongeur, X₂⁰ =a−bX2−c X₃

d+X₁−ρgV_rsin(2πft)

m ,

avecf =0,25 Hz,Vr =10⁻³m³.

(68)

Plongeur stabilis é à 30 m. Mise en route du contr ôle à 27 m.

(69)

4. Feedback lin ´earisant

Air dans le gilet

(70)

4.4. Remont ´ee entre deux paliers

Remont ée deh^∗=30 m àh₀=6 m, vitesse normalis ée (0,25 ms⁻1)

−→consigneh_d(t)

(71)

4. Feedback lin ´earisant

h_d(t) =







h^∗, sit<t1, h^∗+ (t−t₁)^h_t⁰^−h^∗

2−t₁ , sit₁≤t<t₂, h₀, sit≥t₂, h₀−h^∗

t₂−t₁ =−0.25.

u= 1 ε

d+X₁

c (a−s₁(X₁−h_d(t))−s₂X₂)−X₃

.

(72)

R ´esultats : suivi de la consigneh_d(t)parh(t)

(73)

4. Feedback lin ´earisant

R ´esultats : air dans le giletN(t)

(74)

R ´esultats : commandeu(t)