• Aucun résultat trouvé

Unicycle : stabilisation en un point

2.3 Etat de l'art du contrôle des véhicules non holonomes et sous-actionnés

2.3.2 Unicycle : stabilisation en un point

Le théorème de Brockett fait obstruction à l'utilisation de retours d'états continus pour stabi- liser l'Unicycle en un point. Pour pallier à cette restriction, des techniques de bouclage à temps variant sont possibles. Nous proposons ici de les présenter. Nous nous contentons pour le moment des systèmes Unicycles et des systèmes chaînés [Murray & Sastry 1991] qui constituent des modèles génériques plus simples à analyser. Nous savons déjà que la plupart des modèles cinématiques des véhicules à roues peuvent être réduits à l'Unicycle. Par ailleurs, il existe des conditions nécessaires et susantes [Murray & Sastry 1991] pour transformer un système dynamique en une forme chaînée via un changement de coordonnées. La plupart des véhicules non holonomes, dont l'Unicycle, satis- font ces conditions. Ces raisons nous ont ainsi poussé à insérer ces systèmes dans l'état de l'art. De nombreux auteurs cherchent à ramener leurs modèles dynamiques aux cas de systèmes chaînés plus simples et pour lesquelles de nombreux outils d'analyse existent. Nous pouvons citer un exemple classique de transformation (2.69) qui amène le modèle Unicycle (2.48) en la forme chaînée (2.70).

z1 = x z2 = tan(ψ) z3 = y v1 = u1/ cos(ψ) Ω = u2cos(ψ)2 (2.69)

   ˙ z1 = u1 ˙ z2 = u2 ˙ z3 = z2u1 (2.70) Dans le cadre plus spécique de la stabilisation en un point, les méthodes non autonomes ont été pour la première fois utilisées pour les véhicules de type Unicycle dans [Samson 1991]. Dès lors, de nombreuses études ont été menées sur ces retours à temps variant.

2.3.2.1 Commande régulière à temps variant Système chaîné de dimension 3 :

Le système de l'Unicycle réduit à la stabilisation en un point se trouve sous la forme d'un sys- tème chaîné de dimension 3. Nous rappelons l'expression de ses dynamiques vue précédemment à l'équation (2.62) :    ˙ e1 = U1 ˙ e2 = −e1Ω ˙ e3 = Ω

De manière analogue à la loi de commande non linéaire précédente stabilisant une référence ex- citante, le contrôle [Morin & Samson 2009a] ci-après assure la convergence de e2 et e1 si Ω est

excitant, c'est-à-dire s'il ne tend pas vers 0. Tout d'abord, U1= Ωk2e2− |Ω|k1e1

rend la fonction de Lyapunov

V (e) = e22+ 1 k2

e21 décroissante le long des solutions :

˙

V = −2k1 k2

|Ω|e2 1.

V (e)tend vers une limite Vlimd'après le lemme de Barbalat ˙V →t→∞0, ce qui assure limt→∞Ωe21=

limt→∞Ωe1= 0. d dt(Ω 2e 1) = Ω2U1+ o(t), lim t→∞o(t) = 0 Comme d dt(Ω 2e

1) → 0 d'après Barbalat, Ω2U1 = Ω3k2e2+ o(t) → 0 et Ωe2 → 0. Il est facile de

montrer que ΩV (e) → 0 puisque Ωe2 → 0 et Ωe1 → 0. L'hypothèse Ω excitante permet alors de

conclure que Vlim= 0. Ce contrôle fait converger e2 et e1uniquement si la deuxième commande Ω

est excitante. Il sut de trouver une expression de Ω qui soit excitante tant que (e1, e2) 6= (0, 0).

Par exemple,

Ω = k(e1, e2) sin(t)

avec k(., .) une fonction strictement positive sur R × R − (0, 0). Pour faire converger e3 vers 0, un

terme de régulation peut être ajouté sous la forme :

Ω = −k3e3+ k(e1, e2) sin(t).

Finalement, le bouclage temps variant (U1(e, t), Ω(e, t))déni par



Ω = −k3e3+ k(e1, e2) sin(t)

U1 = Ωk2e2− |Ω|k1e1 (2.71)

Système chaîné de dimension n :

Le paramètre temporel supplémentaire est vu comme une variable excitante an de rendre le système commandable lorsque c'est nécessaire. Ce dernier résultat est étendu aux systèmes chaînés de dimension quelconque dans [Samson 1995]. Soit,

                       ˙ x1 = u1 ˙ x2 = u1x3 ˙ x3 = u1x4 . . . ˙ xn−1 = u1xn ˙ xn = u2 (2.72)

un système chaîné de dimension n muni des commandes u1, u2. Il est prouvé dans [Samson 1995],

[Morin & Samson 2000] et [Morin & Samson 1997] que la loi de contrôle (2.73) stabilise globalement et asymptotiquement l'origine de (2.72).



u1(x, t) = −k1x1+ g(X2) sin t

u2(x, t) = −u1(x, t)P i=n

i=2aisign(u1)n+1−ixi (2.73)

avec k1positif, g(X2)une fonction continue qui s'annule pour X2= (x2, x3, ..., xn)>= (0, ..., 0)> et

aides gains qui stabilisent asymptotiquement le système (2.74) avec la commande u = − P i=n i=2aixi.                    ˙ x2 = x3 ˙ x3 = x4 . . . ˙ xn−1 = xn ˙ xn = u (2.74)

La démonstration est la généralisation de la preuve précédente, réalisée pour le système Unicycle, à une dimension quelconque. En eet, le lemme de Barbalat sert également à montrer que le système (2.72) muni seulement de la commande u2 décrite à l'équation (2.73) est asymptotiquement stable

si u1est excitant.

Système sans dérive :

De surcroît, l'auteur de [Coron 1992] a prouvé l'existence de bouclages réguliers à temps va- riant périodiques qui stabilisent tout système sans dérive vériant la condition de rang de l'algèbre de Lie sur Rn − {0}. La section 4.4 du chapitre 4 utilise d'ailleurs les résultats présentés dans

[Coron & d'Andréa-Novel 1993] pour la synthèse de bouclages stabilisant l'origine des systèmes du type ˙x = vf(x, u).

2.3.2.2 Commande homogène à temps variant

La principale limitation des commandes régulières à temps variant est la vitesse de convergence relativement lente. Néanmoins, il est prouvé dans [Coron & Pomet 1993] qu'il est possible de générer des retours périodiques assurant une convergence en temps ni au moyen de bouclages réguliers partout sauf à l'origine. Ce résultat a alors amené la communauté à élaborer des contrôles de ce genre, apportant ainsi une convergence exponentielle. La technique la plus usitée s'appuie sur les propriétés d'homogénéité des systèmes. Rappelons quelques dénitions :

Dénition 2.3.4 Soit λ > 0 et un ensemble de réels ri> 0 (i = 1, ..., n). L'opérateur de dilatation

δr

λ: Rn7→ Rn est déni par

δλr(x1, ..., xn) = (λr1x1, ..., λrnxn).

Dénition 2.3.5 Une fonction continue f : Rn7→ R est homogène de degré d ≥ 0 par rapport à la

dilatation δr λ si

∀λ > 0, f (δλr(x)) = λdf (x).

Dénition 2.3.6 Un système diérentiel ˙x = f(x) avec f : Rn

7→ Rn continue, est homogène de

degré d ≥ 0 par rapport à la dilatation δr λ si

∀λ > 0, fi(δλr(x)) = λ d+rif

i(x) (i = 1, ..., n).

Dénition 2.3.7 Toute fonction continue et positive ρ(x) qui s'annule seulement à l'origine et qui est homogène de degré 1 est appelée norme homogène. Un exemple d'une telle fonction est donné ci-dessous : ρrp(x) = ( n X j=1 |xj| p rj)1p, p > 0.

L'intérêt porté aux propriétés d'homogénéité s'explique par le théorème suivant : Théorème 2.3.8 Soit f ∈ C0

(Rn× R; Rn), f(x, .) périodique et dénit un champs de vecteur ho-

mogène de degré 0 par rapport à une dilatation δ(λ, .). Les deux propriétés suivantes sont alors équivalentes :

 l'origine x = 0 du système ˙x = f(x, t) est asymptotiquement stable,

 x = 0 est globalement exponentiellement stable au sens où il existe γ > 0 et, pour n'importe quelle norme homogène ρ, une valeur K telle que le long des trajectoires x(t) (t ≥ t0) du

système ˙x = f(x, t),

ρ(x(t)) ≤ Kρ(x(t0))e−γ(t−t0).

Les lois de contrôle à temps variant périodiques homogènes visent donc à rendre le système bouclé asymptotiquement stable à l'origine et homogène de degré 0 pour assurer la convergence exponen-

tielle. Diérentes démarches exposées dans [M'Closkey & Murray 1997], ou encore dans [Morin & Samson 2000], consistent à transformer les bouclages réguliers périodiques en des bouclages homogènes périodiques

réguliers excepté à l'origine.

Système chaîné de dimension n :

Nous reprenons l'exemple de la loi de contrôle C∞(2.73). Il est décrit dans [Morin & Samson 2000]

comment la transformer pour assurer une convergence exponentielle. La proposition 2 de [Morin & Samson 2000] est la suivante :

Proposition 2.3.9 Le bouclage continu temps variant (

u1(x, t) = −k1x1+ ρq(X2) sin(t) k1> 0, q ≥ q0

u2(x, t) = −u1(x, t)P i=n

i=2aisign(u1)n+1−iρq(X2x)in+1−i

(2.75) appliqué au système chaîné (2.72),

 rend le système bouclé homogène de degré 0 par rapport à la dilatation ¯

δq(λ, x) = (λx1, δq(λ, X2)),

 rend ρq(X2(t))décroissante le long des solutions,

 et stabilise exponentiellement et globalement l'origine du système (2.72).

Par ailleurs, q0 et ρq(.)doivent respecter certaines conditions (lemme 3 [Morin & Samson 2000]).

Ces contraintes sont cependant levées pour une norme particulière explicitée à la proposition 3 du même article.

Un inconvénient majeur apparaît cependant : ces lois de contrôle uniquement continues sont peu robustes [Morin & Samson 2006c], à l'inverse des commandes C∞ précédentes. Finalement, une

bonne robustesse aux bruits et aux erreurs de modélisation s'accompagne d'une convergence lente. Les lois homogènes continues assurent quant à elles une convergence rapide mais peu de robustesse.

Documents relatifs