• Aucun résultat trouvé

Synthèse des trajectoires optimales

Chapitre 4 Commande des systèmes affines commutés 45

4.3 Synthèse de commandes optimales

4.3.4 Synthèse des trajectoires optimales

A partir des arcs singuliers déterminés à la section précédente, nous avons proposé une méthode de synthèse des commandes optimales en temps rétrograde

depuis le point de fonctionnement xref. Cette méthode évite le traditionnel

pro-blème aux deux bouts nécessitant l’utilisation d’algorithmes de tirs. Nous supposerons que l’hypothèse suivante est satisfaite :

Hypothèse 1 Toutes les solutions optimales rallient le point de fonctionnement en temps fini ou éventuellement asymptotiquement pour un critère en temps infini.

4.3. Synthèse de commandes optimales C’est évidemment le cas pour un critère en temps optimal ou un critère tique en temps infini. Mais l’hypothèse n’est pas vérifiée pour un critère quadra-tique en temps fini.

Avec cette hypothèse et en exploitant le caractère singulier du point de

fonc-tionnement xref, nous avons montré qu’il est possible de déterminer les conditions

finales du système grâce à la proposition12. Le problème de commande optimale

est alors transformé en un simple problème de valeur initiale permettant de

gé-nérer un ensemble dense de trajectoires finissant sur le point d’équilibre xref.

Comme nous l’avons mentionné plus haut, le point d’équilibre xref fait partie

d’un arc singulier car la commande uref qui maintient l’état x sur l’équilibre xref

(f(xref) + g(xref)u = 0) n’est pas sur un sommet du domaine de commande.

Si une trajectoire rallie en temps fini ce point d’équilibre avec une commande

régulière (u = 0 ou u = 1), u doit commuter vers uref lorsque x(tr) = xref à

l’instant tr (temps de commutation). A partir de la proposition 12, les valeurs

admissibles λref pour λ(tr) peuvent être déduites. Un algorithme de tir n’est donc

pas nécessaire puisque les conditions finales sont connues.

Si l’hypothèse1est valide et afin de générer les trajectoires, nous pouvons alors

faire une intégration en temps rétrograde du système Hamiltonien en prenant

pour condition initiale (xref, λref) et les valeurs de commande données par u = 0,

u = 1 ou u = uref. Comme tout point singulier est potentiellement un point

de bifurcation, il faut envisager comme valeur de commande u = 0, 1 ou uref.

Cependant, ce n’est pas la bonne façon de procéder. Il y a au moins deux raisons pour lesquelles cette procédure n’est pas utilisable :

– La détermination des valeurs de la commande singulière passe par

l’inté-gration d’un système différentiel hautement non linéaire (l’équation de u)

et mal conditionné.

– Les arcs singuliers peuvent converger asymptotiquement vers le point d’équi-libre (Cas d’un critère quadratique en temps infini). Le calcul des arcs en temps rétrograde est donc numériquement infaisable.

En revanche, si l’on dispose d’une solution algébrique des arcs singuliers

conduisant au point d’équilibre xref, on peut commencer l’intégration en temps

rétrograde à partir de points xi sur ces arcs menant à xref. Le problème

d’inté-gration lié à la partie de segment (xi → xref) et correspondant à une durée de

temps infinie est de ce fait, rejeté.

En partant des conditions initiales ad hoc pour x et λ i.e. les valeurs singulières

obtenues d’après la proposition12, on considère deux bifurcations admissibles

cor-respondant aux commandes u = 0 et u = 1. On détermine ces deux bifurcations

par une intégration en temps rétrograde du système Hamiltonien (4.22) tout en

respectant la condition de minimum sur l’Hamiltonien.

Avec un choix adéquat de points initiaux sur ces arcs on parvient alors à générer un ensemble dense des trajectoires optimales finissant sur le point de

fonctionnement (Voir Fig. 4.1). Il convient néanmoins, et avant de fixer cet

Chapitre 4. Commande des systèmes affines commutés −0.4 −0.2 0 0.2 0.4 0.6 0.8 −1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1 x1 x2 Singular trajectory U = 0 U = 1

Equilibrium, u=uref

Figure 4.1 – Génération de toutes les trajectoires : intégration en temps

rétro-grade depuis les points sur l’arc singulier

−4 −3 −2 −1 0 1 −2 −1 0 1 2 3 4 x1 x2 Conflict point Conflict area

4.3. Synthèse de commandes optimales deux trajectoires se croisent dans l’espace d’état avec des commandes distinctes créant un conflit. On lève le conflit en considérant la valeur de la fonction coût. La branche de coût le plus élevé est alors coupée à partir du point de conflit

puisqu’il existe une solution moins coûteuse (Voir Fig. 4.2).

Remarque 3 Pour la classe des systèmes auxquels nous nous intéressons, les arcs singuliers sont connexes au point d’équilibre et mènent en ce point. En re-vanche, on ne peut exclure l’existence de trajectoires optimales composées alter-nativement d’arcs singuliers et réguliers. Ce cas de figure est un problème difficile et les conditions d’union entre les arcs singuliers et les arcs réguliers ne sont pas complètement connues [115], [81]. Nous ne l’avons pas rencontré dans les exemples traités.

Pour un ensemble suffisamment dense de trajectoires optimales calculées sur

un pavé de Rn, un réseau de neurones interpole les solutions optimales. La relation

entrée-sortie obtenue formée d’un nombre fini de sommes et produits détermine un retour d’état u(x) dont l’évaluation est simple et conduit à une loi de commande facilement implantable en temps réel. Comme les valeurs de la commande sont discrètes, l’interpolation obtenue sur la commande en utilisant un seuil est de très bonne qualité.

La proposition suivante résume la méthode :

Proposition 13 (Algorithme pour calculer la loi de commande par

re-tour d’état). Il est possible d’établir une commande par rere-tour d’état u(x) sui-vant le schéma suisui-vant :

1. Déterminer l’ensemble des arcs singuliers admissibles suivant la proposi-tion 12.

2. Intégrer en temps rétrograde le système Hamiltonien en vérifiant les condi-tions nécessaires du principe du minimum. Les intégracondi-tions commencent avec une valeur de x(tf) et de λ(tf) sur les arcs singuliers et avec une commande u à u = 0 ou u = 1. Pour un pas de discrétisation fixé et suf-fisamment petit, un ensemble "dense" de trajectoires issues de points xi, appartenant à la surface singulière, est généré par une intégration en temps rétrograde. La durée de cette intégration est choisie suffisamment grande pour couvrir la région de l’espace où le système est susceptible d’opérer. 3. Stocker toutes les trajectoires.

4. Lever les conflits éventuels.

5. Interpoler toutes les trajectoires optimales avec l’aide d’un réseau de neu-rones. Le réseau a comme entrée les valeurs de x et comme sortie la com-mande optimale u.

Chapitre 4. Commande des systèmes affines commutés – un système d’ordre faible.

– l’unicité des commandes singulières candidates u et de la variable adjointe λ comme fonction de l’état x.

– un arc singulier au plus par trajectoire.

Documents relatifs