MINISTERE DE L'ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE
UNIVERSITE FERHAT ABBAS – SETIF-1- UFAS (ALGERIE)
MEMOIRE
Présenté à la faculté de Technologie Département d’Electronique
Pour l’obtention du Diplôme de
MAGISTER Option : Contrôle
Par :
Melle. KHESRANI Samia
THEME
Commande des robots par platitude
Soutenu le : / 12 /2014 devant la commission d’examen :
Mr. A. KHELLAF Prof à l’Université de Sétif-1- Président
Mr. A. HASSAM MCA à l’Université de Sétif-1- Rapporteur
Mme. S. SEMCHEDDINE MCA à l’Université de Sétif-1- Examinateur
Mr. H. KARMED MCA à l’Université de Sétif-1- Examinateur
TABLE DES MATIERES
Résumé ... I
Introduction générale ... 1
CHAPITRE I : Manipulateurs Sous- Actionnés I.1 Introduction ... 4
I.2 Les robots marcheurs bipèdes ... 5
I.3 Les manipulateurs à chaine ouverte ... 8
I.4 Contrôle des systèmes sous-actionnés ... 10
I.5 La platitude différentielle ... 12
I.6 Conclusion ... 15
CHAPITRE II : Outils Pour la Commande des Systèmes Plats II.1 Introduction ... 16
II.2 Généralités ... 16
II.2.1 Variété ... 16
II.2.2 Difféomorphisme ... 17
II.2.3 Champ de vecteurs ... 17
II.2.4 Courbe intégrale ... 17
II.2.5 Dérivée de Lie ... 17
II.2.6 Crochet de Lie ... 18
II.2.7 Distributions de champs de vecteurs ... 19
II.3 Brève introduction à la géométrie des jets infinis ... 19
II.3.1 Jets infinis, coordonnées ... 19
II.3.2 champs de vecteurs ... 20
II.3.3 Systèmes ... 21
II.4 Equivalence au sens de Lie-Bäcklund et bouclages dynamiques ... 23
II.4.1 Equivalence ... 23
II.4.2 Bouclages dynamiques ... 25
II.4.2.1 Transformations dynamiques endogènes ... 25
II.4.2.2 Bouclages dynamiques endogènes ... 25
II.5 Systèmes commandés, commandabilité ... 26
II.5.1 Commandabilité des systèmes linéaires ... 26
II.5.1.1 Critère de Kalman ... 27
II.5.1.2 Forme canonique de commandabilité ... 27
II.5.1.3 Détermination des trajectoires de référence par la méthode polynomiale ... 29
II.5.1.4 Suivi de trajectoire, placement de pôles ... 31
II.5.2 Commandabilité des systèmes non linéaires... 32
II.5.2.1 Commandabilité au premier ordre ... 32
II.5.2.2 Commandabilité locale et crochets de Lie ... 33
II.6 Conclusion ... 34
CHAPITRE III : Les Systèmes Plats III.1 Introduction ... 36
III.2 Définition de la platitude dans le cadre de l’algèbre différentielle ... 37
III.3 Platitude et linéarisation ... 40
III.3.1 Linéarisation par difféomorphisme et bouclage statique ... 40
III.3.2 Linéarisation par bouclage dynamique endogène ... 42
III.3.3 Quelques propriétés liées à la platitude ... 44
III.3.3.1 Systèmes linéarisables par bouclage statique ... 44
III.3.3.2 Système à une seule commande ... 44
III.3.3.3 Systèmes affines en commande ... 44
III.3.3.4 Algorithme d’extension dynamique ... 45
III.4 Génération des trajectoires pour les systèmes plats ... 45
III.5 Conclusion ... 48
CHAPITRE IV : Conception de la Platitude Différentielle
IV.1 Introduction ... 49
IV.2 Robot à deux roues ... 51
IV.2.1 Planification et contrôle ... 51
IV.2.2 Construction du difféomorphisme ... 52
IV.2.3 La platitude différentielle basée sur la planification de la trajectoire 52 IV.2.4 Conception de la loi de commande pour la platitude différentielle ... 53
IV.2.5 Résultats de simulation ... 55
IV.3 Robot à 2-liens sous-actionnés... 57
IV.3.1 Planification et contrôle ... 57
IV.3.2 Stratégie de conception de la platitude différentielle ... 59
IV.3.3 Modèle dynamique ... 60
IV.3.4 Sorties plates, difféomorphisme et entrées de transformation ... 61
IV.3.5 La platitude différentielle basée sur la planification de la trajectoire . 65 IV.3.6 Conception de la loi de commande pour la platitude différentielle ... 68
IV.3.7 Résultats de simulation ... 71
IV.4 Conclusion. ... 74
Conclusion Générale ... 77
Références ... 79
Annexe ... 84
Table des figures
Figure I.1 Un plan à quatres bras d’un robot bipède ... 5
Figure I.2 Le schéma d’ un manipulateur à chaîne ouverte (3 degrés de libertés) et le robot étudié ... 8
Figure III.1 Système non linéaire bouclé équivalent à un système linéaire ... 40
Figure III.2 Génération de trajectoires ... 46
Figure IV.1 Robot mobile à deux-roues ... 50
Figure IV.2 Robot sous-actionné à 2-liens ... 50
Figure IV.3 Boucle de régulation pour le robot à deux roues ... 54
Figure IV.4 Les trajectoires désirées et mesurées du robot mobile à 2-roues .... 56
Figure IV.5 Les trajectoires désirées et mesurées de x(fig.a), y(fig.b) et (fig.c) du robot mobile à deux roues ... 57
Figure IV.6 Système reconçu du robot sous-actionné à 2-liens ... 60
Figure IV.7 La planification des trajectoires en utilisant le difféomorphisme .. 66
Figure IV.8 Les trajectoires planifiées de sortie plate pour le robot sous- actionné à 2-liens . ... 67
Figure IV.9 Les trajectoires planifiées de l'état original du système pour le robot
sous-actionné à 2- liens ... 67
Figure IV.10 Boucle de régulation pour le robot sous-actionné à 2-liens ... 70
Figure IV.11 Les résultats de simulation pour le suivi de trajectoire de sortie
plate du robot sous-actionné à 2- liens. ... 73
Figure IV.12 L’entrée nominale correspondante aux trajectoires planifiées pour
le robot sous-actionné à 2-liens ... 73
Figure IV.13 La transformation d'un système différentiellement plat non linéaire en un
système linéaire après une entrée et une transformation de l'état . ... 75
Figure IV.14 La planification basée sur la platitude et la méthodologie de
contrôle du mouvement point-à-point d'un robot sous-actionné à 2-liens. ... 76
RESUME
Le contrôle des systèmes non linéaires sous-actionnés est un domaine de recherche en
cours. En général, pour un système sous-actionné, toutes les trajectoires d'état sont
dynamiquement possibles et il est difficile de caractériser les trajectoires possibles
analytiquement. Même si une trajectoire possible est trouvée, la conception d'un dispositif de
commande pour un système sous-actionné reste également une tâche difficile. La platitude
différentielle, fournit une approche systématique unifiée qui permet de planifier
dynamiquement les trajectoires possibles et de concevoir un contrôleur qui permet de suivre
ces trajectoires. Cependant, un système non linéaire sous-actionné peut ne pas être
différentiellement plat. Ce travail présente une approche traitant des systèmes sous-actionnés
qui peuvent être conçus pour être différentiellements plats permettant la planification et le
contrôle de trajectoire systématique pour un robot à 2DDL sous actionné. Les trajectoires
possibles sont construites en utilisant MATLAB. Un contrôleur linéaire de retour d'état est
conçu dans le domaine de sortie plate pour suivre les trajectoires désirées. Les résultats de la
planification de mouvement et des simulations dynamiques de la platitude basée sur le suivi
de trajectoires sont présentés.
Introduction Générale
1
Introduction Générale
La notion de platitude introduite en 1992 [1], a été développée initialement dans le cadre des systèmes non linéaires de dimensions finis puis elle a été étendue sur plusieurs systèmes. Elle peut être appliquée dans plusieurs situations et pour n’importe quel système (par exemple un robot manipulateur ou un robot mobile).
L’objectif de la thèse est de proposer dans un premier temps, une méthode de modélisation d’un robot dédiée à sa commande. Le modèle sera développé à partir des travaux les plus aboutis en classification et modélisation des systèmes non linéaires. Dans un second temps, on projette une insertion de la technique de platitude au centre de la conception de la commande.
La technique proposée (platitude) est une méthode mathématique formelle qui permet de rechercher la commande désirée sans passer par l’intégration des équations régissant le système à commander. En effet, il suffit de calculer la trajectoire de la sortie plate correspondante ; qui est une des variables fondamentales du système. Cet état de raisonnement permet de déterminer implicitement une trajectoire physiquement réalisable pour le système.
Actuellement les méthodes de contrôle pour les systèmes sous-actionnés ne
sont applicables qu'à des cas de sous-actionnements très spécifiques ou elles
sont limitées à la commande d'un sous-système de l'ensemble du système sous-
actionné par la linéarisation rétroaction partielle tout en maintenant la stabilité
de repos du système. La planification et le contrôle des systèmes généraux sous-
actionnés n'est pas un problème résolu. La platitude différentielle, fournit un
Introduction Générale
2
moyen systématique et analytique de planifier et de suivre la trajectoire possible pour un système sous-actionné non linéaire. En général, les systèmes non linéaires sous-actionnés ne sont pas plats et la conception des classes de systèmes sous-actionnés pour être différentiellement plat a été choisie comme objectif de cette thèse.
En général, un système de commande est différentiellement plat s’il existe un ensemble de sorties, appelées sorties plates, égales au nombre d'entrées, tels que tous les états et les entrées peuvent être exprimés en termes algébriques de ces sorties et d’un nombre fini de leurs dérivés.
La méthodologie de conception, de planification et de contrôle basé sur la platitude différentielle est illustrée par un exemple d'un bras manipulateur à chaîne ouverte à deux degrés de liberté. On démontrera que lorsqu’on modifie la répartition de l'inertie de liens dans le système, de sorte que le centre de masse de la seconde liaison est au niveau de la seconde articulation avec une redistribution d’inertie et un placement d’un ressort, le système devient différentiellement plat.
Outre l’introduction et la conclusion générales, cette thèse est organisée en quatre chapitres répartis comme suit :
Le premier chapitre donne un tour d’horizon sur l’état de l’art des systèmes mécaniques sous-actionnés qui ont plusieurs degrés de liberté (DOF).
Nous y proposons également une introduction à plusieurs exemples, dont certains aspects méritent quelques précisions.
Dans le chapitre suivant, nous introduisons les outils de la commande des systèmes non linéaires plats.
Le troisième chapitre traite les systèmes plats en introduisant l’importance
des systèmes équivalents aux systèmes linéaires commandables par des
bouclages dynamiques endogènes.
Introduction Générale
3
L’étude de la platitude de deux classes de robots (robot mobile et bras
manipulateur) ainsi que les résultats de simulations de la planification et le
contrôle de suivi des trajectoires sont présentés au quatrième chapitre.
Chapitre I
Manipulateurs sous-actionnés
Chapitre I Manipulateurs sous-actionnés
4
Chapitre I Manipulateurs sous-actionnés
I.1 Introduction
Pour illustrer l’apport de cette nouvelle théorie de la platitude dans le cadre de la génération et la poursuite de trajectoires, nous avons choisi deux types de robots (un robot mobile, et un bras manipulateur sous-actionné), qui vont nous servir comme éléments de base pour la maitrise et la compréhension de cette nouvelle technique.
Nous projetons l’application de cette méthode de platitude sur un bras manipulateur qui représente l’exemple parfait d’un système sous-actionné.
Les systèmes mécaniques sous-actionnés sont donc des systèmes qui ont plusieurs degrés de liberté que les actionneurs, (c.-à-d. un ou plusieurs degrés de liberté ne sont pas actionnés) [2]. Les sous-actionneurs sont abondants dans les systèmes industriels.
Plusieurs systèmes sous-actionnés peuvent être caractérisées par un ensemble de corps ou d’éléments, appelés liaisons, reliés entre eux par l’intermédiaire d’un certain type d’articulation.
Dans ce chapitre, nous allons accentuer l’étude sur les robots marcheurs
bipèdes et la chaine de manipulateurs en série qui font partie des exemples des
systèmes sous-actionnés. Et nous allons aussi présenter les techniques de
planification et de contrôle pour cette classe de systèmes.
Chapitre I Manipulateurs sous-actionnés
5
Figure I.1: Un plan à quatre bras d’un robot bipède.
I.2. Les robots marcheurs bipèdes
Les motivations derrière l’étude de ce système sont multiple telles que les moyens de locomotion dans des terrains accidentés, dans la production des prothèses, et le développement des robots copiant les hommes dans certaines activités (assistance dans la maison, pour les soins des patients âgés… ). La locomotion bipède a été étudiée pendant plusieurs années, mais elle est encore loin d'être complètement résolue. L’inconvénient de ce système réside dans sa difficulté de contrôle à cause de sa dynamique non linéaire sous-actionnée.
Il existe trois catégories de robots marcheurs bipèdes se basant sur le nombre d'actionneurs existant par rapport au nombre de degré de liberté, ils sont largement présentés dans la littérature: actionnés, sous-actionnés et enfin complètement passifs.
Une des premières tentatives de faire marcher des robots bipèdes purement par gravité, sans aucun actionnement, a était faite par McGeer [3], qui a démontré que le robot planaire peut descendre une pente superficielle, seulement par gravité.
Les trois dimensions analogiques d’un robot de puissance du plan gravité ont été
également démontrées [4].
Chapitre I Manipulateurs sous-actionnés
6
Les robots bipèdes complètement actionnés tels que Honda humanoïdes [5]
et japonais HRP-2P [6, 7] et plusieurs autres [8,9] sont de l'autre extrême. Ceux-ci surmonte la limitation de ne pas avoir un actionneur entre le pied et le sol en s'assurant que le pied reste plat sur le sol pendant le cycle de la marche. Ceci est fait en sorte que le moment au point zéro (MPZ) (qui est la dynamique analogue du centre de gravité (CDG) pour le cas statique) reste à l'intérieur du polygone de sustentation donnée par la surface de contact du pied.
Les pieds passifs n’ont pas besoin de systèmes de contrôle élaborés, alors les pieds actifs ont besoin de contrôleurs très complexes. D'une part, les premiers ne consomment pas d'énergie mais la modulation de mouvement est limitée. D'autre part, les systèmes actifs demandent plus d’énergie et une complexité plus chère.
Entre ces deux systèmes se situe le système sous actionné. En outre, comme mentionné auparavant, les robots à marche entièrement actionné, le pied est placé horizontalement et à plat sur le sol, en opposition avec la marche humaine où les pointes de pied le long des bords après l'attaque du talon et avant le décollage. Par conséquent, afin de rendre le robot marcheur plus anthropomorphique le sous- actionnement est important. Aussi en marche bipède, le suivi strict des trajectoires prédéfinies n'est pas critique. D’autre part, le critère tel que la périodicité, le dégagement au sol du pied balançant et la forme approximative des trajectoires sont importants. Depuis un bipède, il n'est pas nécessaire de suivre un ensemble particulier de trajectoires articulaires, il ne serait pas absolument essentiel d'avoir un actionneur à chaque liaison. En outre, en raison de contraintes naturelles, il ne peut pas être un actionneur entre le pied et le sol. Par conséquent, dans la phase où le pied n’est pas à plat sur le sol et roule le long de la pointe ou le talon, il est donc sous-actionné. [10,11].
Ces faits montrent que l'étude des bipèdes comme des systèmes non linéaires
sous-actionnés peuvent aider davantage la compréhension du contrôle et du suivi
de trajectoire des systèmes bipèdes. L'exigence la plus importante pour tout
Chapitre I Manipulateurs sous-actionnés
7
système d’être utilisé comme un bipède est l'existence de cycles limités. Un système entièrement actionné peut être amené à passer par une trajectoire, mais pour un système non linéaire sous-actionné, il est difficile de prouver analytiquement l'existence des cycles limites. Plusieurs études intéressantes ont été publiées sur les systèmes bipèdes sous-actionnés. Grizzle et al. [12,13] ont utilisé la méthode de Poincaré pour montrer l'existence de valeurs des cycles limites ainsi que la stabilité asymptotique d'une unité de commande pour un robot bipède avec une cheville non-actionnée. Le contrôleur a essentiellement stabilisé certaines sorties à zéro et il a été montré que la dynamique de zéro associé n'entraîne pas l’instabilité du robot. Dans cette méthode, le sous-actionnement est limité aux chevilles et de nombreux calculs numériques doivent être effectués pour démontrer la stabilité via la méthode de Poincaré. Ono et al. [14,15] ont montré qu’un couple de hanche proportionnelle à l'angle d'articulation de genou génère un cycle limite stable dans un bipède à quatre bras avec un genou actionné seulement au niveau de l’articulation de la hanche. Il n'existe aucune preuve analytique de l'existence de ces cycles limites et elles ont été établis à l'aide des simulations dynamiques de l'avant du robot mobile. Chevallereau et al. [16,17] ont utilisé une méthode en deux étapes pour générer un bipède mobile où une trajectoire possible a été générée en utilisant l'optimisation numérique et un contrôle basé sur le temps a été conçu pour garantir la convergence géométrique avant la convergence temporelle des trajectoires désirées. Un inconvénient majeur est qu'il n'y a aucune garantie que l'on peut toujours trouver des trajectoires possibles avec la routine d'optimisation numérique. Cambrini et al. [18] ont proposé une méthode de linéarisation en utilisant une forme pour contrôler un robot mobile sous-actionnée à l'articulation de la cheville. Une autre approche de linéarisation partielle de rétroaction pour un bipède avec une cheville non actionnée a été présentée par Chemori et al. [19].
Les études existantes sur les robots bipèdes sous-actionnés utilisent soit des
méthodes numériques pour établir l'existence de cycles limites soit ils sont limités
au sous-actionnement seulement au niveau de l’articulation de la cheville.
Chapitre I Manipulateurs sous-actionnés
8
Il n'existe pas une méthode analytique pour générer des cycles limites pour une disposition plus générale des articulations non actionnées.
Figure I.2: Le schéma sur la gauche est un manipulateur de chaîne ouverte (3 degrés de libertés) et le robot fabriqué à droite.
I.3. Les manipulateurs à chaîne ouverte
Le sous-actionnement peut avoir plusieurs avantages pour les manipulateurs
de chaîne ouverte qui sont généralement utilisés comme manipulateurs industriels,
(figure I.2). Parmi les avantages les plus cités [20-21-22] la réduction dans les
coûts, des considérations en poids mort, les économies d'énergie avec moins
d’actionneur, et le gain en tolérance concernant la défaillance de l'actionneur. Un
système sous-actionné est incapable de suivre les trajectoires arbitraires pour ses
degrés de liberté, mais sous certaines conditions [2-23] il peut effectuer des
mouvements point-à-point. Ces mouvements point-à-point peuvent avoir plusieurs
applications industrielles telles que la mise en place et la reprise des objets à partir
des endroits spécifiés.
Chapitre I Manipulateurs sous-actionnés
9
La complexité mathématique et les perspectives diverses d’application ont rendus les manipulateurs sous-actionnés très sollicités par les chercheurs. La linéarisation rétroaction partielle est une technique basée sur le contrôle des manipulateurs sous-actionnés avec 2degrés de liberté dans le plan horizontal [21].
La stabilisation des manipulateurs sous-actionnés avec 2 degrés de liberté dans un plan horizontal en utilisant une variation dans le temps avec rétroaction conçue par l'analyse du plan de Poincaré est présentée dans [24]. Un mouvement périodique de l'articulation active est utilisé pour stabiliser l'articulation passive d'un manipulateur sous-actionnée avec 2-DOF dans le plan horizontal à un angle arbitraire [25]. Ici, le comportement de l'articulation passive est décrit dans le plan de Poincaré, et l'amplitude de l'articulation active est modifiée en fonction de l'état de l'articulation passive. Dans [26], Suzuki et al. ont utilisé une méthode moyenne pour approximer le système et de concevoir la commande de rétroaction. D'autres œuvres remarquables sur le contrôle des robots planaires sous-actionnés avec 2- DOF sont mentionnés dans [27-28].
Arai el al. [20] ont montré un manipulateur planaire à trois DOF avec la
dernière articulation passive pour être contrôlable par un procédé constructif en
absence de gravité. Ils ont construit les trajectoires entre les états terminaux
arbitraires en considérant le mouvement du centre de percussion de la liaison. De
Luca et al. [29-30] ont montré que le centre de percussion est une sortie de
linéarisation avec la linéarisation dynamique d'une rétroaction, même en présence
de gravité. Une autre approche basée sur les évaluations pour commander un
manipulateur sous-actionné à 3 degrés de liberté en absence de gravité à l'aide
d’une forme enchaîné est présentée dans [31]. Une technique de commande à base
d'énergie pour stabiliser l'équilibre de deux et trois articulations des manipulateurs
sous-actionnés sont présentées dans [32]. La démonstration de la contrôlabilité de
N articulations d’un manipulateur ayant une seule articulation passive, pas au
niveau de l’articulation inertielle fixe, a été présenté par Kobayashi et al. [33].
Chapitre I Manipulateurs sous-actionnés
10
Luca et al. [40] ont rapporté une autre étude avec un seul sous-actionnement à la dernière articulation des manipulateurs planaires, sur la base du centre de percussion de la dernière articulation. Les propriétés de contrôlabilité des manipulateurs de trois DOF, RRR et PPR pour les emplacements possibles de l'articulation passive unique a été étudiée par Mahindrakar et al. [34]. Paradigmes de contrôle pour N articulations des manipulateurs planaires avec une première articulation passive a été rapporté par Grizzle et al. [22]. La plupart de la documentation actuelle pour les manipulateurs planaires sous-actionnés se concentre sur les systèmes avec une seule articulation non actionnée. La non- linéarité et le couple nature peuvent agir sur les équations différentielles pour rendre le contrôle point-à-point. La plupart des manipulateurs planaires avec plusieurs articulations non actionnées restent toujours sans solution.
I.4. Contrôle des systèmes sous-actionnés: la solution stratégique La planification et le contrôle des systèmes sous-actionnés étudiés ci-dessus ainsi que les systèmes sous-actionnés en général, n'est pas un problème résolu.
Actuellement, les méthodes de contrôle disponibles pour les systèmes sous- actionnés sont applicables uniquement dans des situations très spécifiques ou bien sont limités pour le contrôle d'un sous-système de l’ensemble des sous-actionnés en utilisant dans la rétroaction une linéarisation partielle [2] tout en maintenant la stabilité du reste du système.
Le contrôle des systèmes sous-actionnés par rapport aux systèmes plats
actionnés est sensiblement difficile vu ces limitations évoquées. Les systèmes plats
actionnés, en dehors des questions de conception pratiques, n'ont pas de limites
théoriques pour le suivi d'un mouvement arbitraire. Autrement dit, tous les
mouvements possibles de ses degrés de liberté (DOF) sont dynamiquement
réalisables. D'autre part, pour un système sous-actionné il n’y a que ces
mouvements qui sont dynamiquement réalisable et qui ne nécessitent pas d’entrées
pour ces DOF non actionnées.
Chapitre I Manipulateurs sous-actionnés
11
Par conséquent, un système sous-actionné est incapable de suivre tout mouvement arbitraire. Cependant, un système sous-actionné pourrait être capable de poursuivre la trajectoire arbitraire entre un point initiale et final dans son espace d'état.
Un système sous-actionné avec cette propriété est appelé un système sous-actionné contrôlable [2]. Il convient de noter que les systèmes plats actionnés sont toujours contrôlables [2]. Un tel mouvement point-à-point peut être utile pour les manipulateurs en milieu industriel pour choisir la position entre les stations spécifiées ou dans des situations telles que les robots marcheurs où le suivi exacte des trajectoires par le robot n'a pas d'importance, mais la forme globale des trajectoires avec satisfaction de contraintes comme la garde au sol, la réaction normale du sol positif etc.. sont importants. Il existe des méthodes analytiques bien établies [2] pour établir la propriété de contrôlabilité des systèmes sous-actionnés.
Cependant, ces méthodes ne disent pas si le système est capable d'exécuter un mouvement point-à-point et elles ne fournissent pas une méthode pour construire une trajectoire reliant les deux points. Pour un système sous-actionné toutes les trajectoires reliant les deux points ne sont pas réalisables et en général la caractérisation de l'ensemble des trajectoires possibles reliant deux points pour un système sous-actionné contrôlable nécessite des procédures itératives. Une fois une trajectoire possible trouvée, la conception de suivre la trajectoire possible d'un contrôleur pour un système sous-actionné est également une tâche difficile.
La platitude différentielle [23-35-36] est une propriété des systèmes
dynamiques (plat actionné ou sous-actionnée), elle fournit une approche
systématique unifiée à planifier dynamiquement les trajectoires possibles et
concevoir le contrôle qui permet de suivre ces trajectoires. Cependant, les systèmes
sous-actionnés en général ne sont pas différentiellement plat. Une fois la géométrie
globale d'un robot est fixée, il y a encore des paramètres, tels que la distribution
d'inertie et la localisation des éléments durs lors du mouvement. L'approche
adoptée dans ce travail est d'utiliser ces paramètres et des systèmes de conception
Chapitre I Manipulateurs sous-actionnés
12
sous-actionnés pour être différentiellement plat et permettant une planification et un contrôle systématique. Ceci est motivé par un travail antérieur [37-38] où les robots de l'espace étaient conçus pour être différentiellement plat en modifiant la distribution d'inertie de la dernière liaison du robot.
Cette approche intègre la conception d'un système avec sa planification et les aspects de contrôle. Dans la section suivante, on va présenter une brève aperçu sur la théorie de la platitude différentielle.
I.5. La platitude différentielle
La platitude différentielle est une propriété des systèmes de contrôle dynamiques, Fliess et al. [35-36]. La platitude différentielle, fournit un cadre d’analyse unifié pour la planification de la trajectoire et le contrôle des systèmes non linéaires. Ceci est particulièrement utile pour les systèmes sous-actionnés non linéaires où il est difficile de planifier et de concevoir analytiquement les trajectoires possibles. La condition nécessaire pour qu’un système de commande soit différentiellement plat est qu'il doit être commandé.
Définition I.5.1 Un système est dit commandable au temps t
0s’il est possible de transférer le système de l’état initial x(t
0) à un autre état dans un intervalle fini de temps de moyen d'un vecteur de contrôle sans contrainte.
Les conditions nécessaires et suffisantes pour qu'un système soit contrôlable peuvent être trouvés dans [2-39]. En général, le système de commande est différentiellement plat s’il existe un ensemble de sorties, appelées sorties plates, en nombre égal au nombre d'entrées, tels que tous les états et les entrées peuvent être exprimées en termes algébriques de ces sorties et d’un nombre fini de leurs dérivés.
Définition I.5.2 Un système donné par :
( , )
x f x u ; x
n, u
m(I.1)
Chapitre I Manipulateurs sous-actionnés
13
est différentiellement plat si et seulement s’il existe un ensemble fini de variables indépendantes, égales au nombre d'entrées, appelé sorties plates y [ y
1,..., y
m]
Tde telle sorte que :
( , , ,...,
( )p)
y y x u u u (I.2)
( , , ...,
( )r)
x x y y y y (I.3)
( , , ...,
( )q)
u u y y y y (1.4)
En outre, pour un système plat, il existe une entrée inversible et des transformations d'état qui peuvent transformer les systèmes non linéaire en formes canoniques linéaires (chaîne linéaire commandable d'intégrateurs). Une trajectoire arbitraire pour les sorties plates correspond à l’état original du système des trajectoires de références. Cela rend la planification possible dans le domaine de sortie plate. En outre, le retour linéaire du contrôle peut être conçu dans le domaine des sorties plates linéaires par la fermeture de la boucle sur les erreurs dans les sorties plates et leurs dérivées. Des applications intéressantes de la platitude basées sur la planification de trajectoire et le contrôle pour les systèmes sous-actionnés peuvent être trouvées dans [40-41-42]. Les conditions nécessaires et suffisantes pour que le contrôle général du système soit différentiellement plat n'ont pas encore été trouvés et que certaines conditions suffisantes existent.
La condition suffisante largement employée pour la platitude différentielle est la linéarisabilité à retour statique [2] décrite ci-dessous:
Définition I.5.3 le contrôle d’un système de la forme :
1
( ) ( )
m
i i
i
x f x g x u
, x
n, u
m(I.5)
est dit linéarisable à retour d’état statique si et seulement s’il est possible de trouver un difféomorphisme :
( )
z x , z
n(I.6)
Chapitre I Manipulateurs sous-actionnés
14
et la loi de commande de rétroaction :
( ) ( )
u z z v , v
m(I.7)
de telle sorte que le système de (I.5) est transformé en un système linéaire
équivalent : z Az Bv (I.8)
Où :
...
...
, B=
...
...
0 1 0 0 0
0 0 1 0 0
A
0 0 0 1 0
0 0 0 0 1
(I.9)
Les conditions nécessaires et suffisantes pour la linéarisabilité de retour statique peuvent être trouvées dans [2]. Pour un système à entrée unique, la linéarisabilité de rétroaction statique est nécessaire aussi bien comme condition suffisante pour la platitude différentielle, mais pour les systèmes multi-entrées, ce n’est qu’une condition suffisante. Le système multi-entrées qui n'est pas linéarisable à retour statique peut-être différentiellement plat par la linéarisation à retour dynamique:
Définition I.5.4 Un système de commande :
( , )
x f x u ; x
n, u
m(I.10)
est linéarisable à retour dynamique si et seulement s’il existe une extension dynamique c.-à-d. si et seulement s’il existe une série de nouveaux états z
qet des entrées v
mqui dépendent du système (I.10) et qui donnent :
( , )
x f x u , u b x z v ( , , ) , z a x z v ( , , ) (I.11)
de telle sorte que le nouveau système obtenu dans (I.11) est linéarisable de retour
statique. Les conditions nécessaires et suffisantes mentionné précédemment pour
prouver qu’un système est linéarisable à retour dynamique n'ont pas encore été
trouvés. Certaines conditions suffisantes pour la linéarisation à retour dynamique
Chapitre I Manipulateurs sous-actionnés
15
comme la linéarisation par prolongation peuvent être trouvé dans [43-44].
Plusieurs applications intéressantes de la platitude différentielle pour la planification et le contrôle des systèmes sous-actionnés peuvent être trouvées dans [41-42-45].
I.6. Conclusion
Dans ce chapitre, nous avons exposé la problématique et l’état de l’art des
travaux dans le domaine de la platitude en donnant un aperçu sur la
méthodologie de la platitude différentielle appliquée à certaines classes des
manipulateurs planaires sous-actionnés à chaîne ouverte et les robots marcheurs
bipèdes introduit brièvement avec son approche unifiée à planifier dynamiquement
les trajectoires possibles et à concevoir le contrôle qui permet de suivre ces
trajectoires .
Chapitre II
Outils pour la commande des systèmes
plats
Chapitre II Outils pour la commande des systèmes plats
16
Chapitre II Outils pour la commande des systèmes plats
II.1. Introduction [46]
Dans ce chapitre nous allons présenter les outils nécessaires pour l’analyse des systèmes non linéaires plats. Nous introduisons d’abord les concepts les plus courants de la géométrie différentielle, notamment les difféomorphismes, les variétés, les champs de vecteurs, les dérivées de Lie, les distributions, champs de vecteurs en dimension infinie et la notion de systèmes, dont le formalisme est nécessaire pour la définition de la platitude. Pour plus de détails se référer à [47], [48-49]. Nous traitons, ensuite, une nouvelle relation d’équivalence appelée équivalence par bouclage dynamique endogène dans le cadre de l’algèbre différentielle, et équivalence de Lie Bäcklund dans le cadre de la géométrie différentielle. Cette équivalence permet le passage d’un système non linéaire à un système linéaire trivial [36], [47-50], [51], [48-49], [52],. Nous terminons par des rappels liés à cette notion d’équivalence comme la commandabilité linéaire et non linéaire [51], [48].
II.2. Généralités II.2.1. Variété
Définition 1 : Etant donnée une application différentiable de R
ndans R
n p(0 p n ) , on suppose qu’il existe au moins un x
0solution de l’équation implicite
(x) = 0 et que l’application linéaire tangente D (x) est de rang plein (n - p)
Chapitre II Outils pour la commande des systèmes plats
17
dans un voisinage V de x
0. On appelle variété différentiable de dimension p l’ensemble X défini par l’équation implicite (x) = 0. Autrement dit :
{ , ( ) 0}
X x V x (II.1)
Si en outre, F est k fois différentiable, on dit que X est une variété de classe C
k.k =1,…,
II.2.2. Difféomorphisme
Définition 2 : Etant donné une application d’un ouvert u
ndans un ouvert
v
nde classe C
k, k 1. On dit que est un difféomorphisme local de classe C
kdans un voisinage U(x
0) d’un point x
0de U si est inversible de U(x
0) dans un voisinage V ( (x
0)) du point (x
0) de V et si
1est aussi de classe C
k.. [48-49]
II.2.3. Champ de vecteurs
Définition 3 : Un champ de vecteurs f (de classe C
k, analytique) sur X est une application (de classe C
k, analytique) qui à tout x X fait correspondre le vecteur f(x) TxX. (TxX est l’espace tangent à X au point x X).
II.2.4. Courbe intégrale
Définition 4 : Une courbe intégrale du champ de vecteurs f est une solution locale de l’équation différentielle x f x ( ) .[48-49]
II.2.5. Dérivée de Lie
Définition 5 : Soit h une fonction de classe C
1de
ndans . On appelle dérivée de Lie de h dans la direction f, notée L
fh, la dérivée de h le long de la courbe intégrale de f en t=0. Autrement dit :
0 1
( ) ( ( )) ( ) ( )
n
f t t i
i i
d h
L h x h X x f x x
dt
x
(II.2)
Chapitre II Outils pour la commande des systèmes plats
18
Par cette formule, un champ de vecteurs f quelconque est identifié à l’opérateur différentiel linéaire du premier ordre. [48-49]
1
( )
n
f i
i i
L f x
x
(II.3) II.2.6. Crochet de Lie
Définition 6 : Le crochet des champs de vecteurs f et g est le champ de vecteurs défini par :
[ , ]f g f g g f
L L L L L (II.4)
En coordonnées locales:
1
1 1
[ , ]
n n
i i
j
i j j j i
g f
f g f g
x x x
(II.5) Le crochet de Lie jouit en particulier des propriétés suivantes :
Antisymétrie : [ f , g] = -[g, f ] ;
f , g f g , L
f g L
g f , pour toute paire , de fonctions
C
.
Identité de Jacobi: f
1, f
2, f
3 f
2, f
3, f
1 f
3, f f
1,
2 0
Il vérifie aussi la propriété suivante :
* , * f
1 f
2 * f f
1,
2
est un difféomorphisme de la variété X dans la variété Y.
1
,
2f f sont des champs de vecteurs arbitraires de X.
* f
1 , * f
2sont leurs images dans Y. Pour plus de détails voir [48].
Chapitre II Outils pour la commande des systèmes plats
19
II.2.7. Distributions de champs de vecteurs
Définition 7 : Une distribution de champs de vecteurs D est une application qui à tout point x X fait correspondre le sous-espace vectoriel D(x) de TxX. [48-49]
Soit V un ouvert de X. La distribution D est régulière et de rang constant k dans V s’il existe des champs de vecteurs réguliers g
1,…., g
ktels que :
rang g x
1( ).... g
k( ) x k pour tout xV.
D(x) =e.v.g1 (x),… , gk (x)K pour tout xV.
Définition 8 : La distribution D est dite involutive si et seulement si pour tout couple de champs de vecteurs f et g de D on a : f , g D. Une distribution involutive est donc caractérisée par : D, D D
Si D n’est pas involutive, on peut définir sa clôture involutive. [48-49]
Définition 9 : La clôture involutive D est une distribution qui est la plus petite distribution involutive contenant D. [48-49]
II.3. Brève introduction à la géométrie des jets infinis
II.3.1. Jets infinis, coordonnées Considérons le système [48-49] :
( , )
x f x u (II.6)
où f est de classe C
sur un ouvert X U
n
m.
f est, en fait, une suite infinie de champs de vecteurs paramétrés par u. Plus
précisément, pour définir une courbe intégrale (solution de l’équation différentielle
(II.6)), on ne doit pas seulement spécifier la condition initiale x
0à l’instant t=0,
mais aussi la fonction infiniment dérivable (on dira lisse dans la suite) t u(t) sur
un intervalle de temps donné. Cette dépendance de dimension infinie par rapport à
l’entrée u est relativement mal commode si l’on veut utiliser des bouclages
Chapitre II Outils pour la commande des systèmes plats
20
dynamiques par exemple. Donc, il apparaît nécessaire de développer un formalisme légèrement différent où les courbes intégrales de (II.6) sont décrites de façons plus compactes comme des fonctions lisses t (x(t), u(t)), paramétrées seulement par des conditions initiales. En d’autres termes, on est amené à considérer des conditions initiales ayant la forme d’une suite infinie
0 ( x u u
0,
0,
0,..., u
0( ),...) , où les dérivées de différent ordre de u à l’instant t=0 sont notées u
0( ), avec 0 . Ceci nous conduit à compléter les coordonnées originales (x, u) par la suite infinie de coordonnées
( )
0
( x u u
0,
0,
0,..., u
0,...) X xUx
m
, où l’on note
m m m... le produit d’un nombre dénombrable de copies de
m.
II.3.2. Champs de vecteurs
Dans ce contexte, une fonction lisse est une fonction qui dépend de façon infiniment dérivable d’un nombre fini (mais arbitraire) de coordonnées. Le champ de vecteurs f admet dans ces coordonnées un prolongement naturel [48-49].
( ) ( ( , ), , )
F f x u u u (II.7) et l’équation (II.6) devient :
( )
F (II.8) avec V(0)=V
0. Ainsi, (2.8) définit un champ de vecteurs au sens habituel sur une variété de dimension infinie M X U
m[48-49].
On arrive à la même conclusion par un autre raisonnement en calculant la formule de dérivée de Lie comme suit : Prenons une fonction lisse h, dépendant de façon infiniment dérivable de x, u et un nombre fini r de dérivées de u. On adopte les notations usuelles
1 n
i
i i
h h
f f
x
x
(II.9)
Chapitre II Outils pour la commande des systèmes plats
21
et
( 1) ( 1)
( ) 1 m
k k
k i k
i i
h h
u u
u u
(II.10)
La dérivée de h le long d’une trajectoire de (II.6) est donnée par
( 1)
...
( )r rh h h h
f u u
t x u u
(II.11)
et ce en tout point ( ( ), ( ), ( ),..., x t u t u t u
( )r,...). Notons que, bien que h ne dépende que des dérivées de u jusqu’à l’ordre r, la coordonnée u
(r1)apparaît, ce qui constitue une raison supplémentaire pour considérer des coordonnées formées par la suite infinie des dérivées de u.
Cette formule s’interprète comme la dérivée de Lie de h par rapport au champ de vecteurs de dimension infinie.
(1) (2) (1) (2)
( , , x u u , u ,...) F x u u ( , , , u ,...) (II.12) ou encore avec des notations plus simples à partir de la formule de dérivée de Lie précédente (II.11) :
(1) (2) ( 1)
( ) 0
( , , , ,...) ( , )
j jj
F x u u u f x u u
x u
(II.13)
Notons que chaque composante de F est une fonction lisse, (c'est-à-dire, dépend de façon infiniment dérivable d’un nombre fini de coordonnées).
II.3.3. Systèmes
Ainsi, au système (II.6) où f est une famille infinie de champs de vecteurs paramétrée par u, on préfère substituer la définition suivante de système, constitué d’un champ de vecteurs sur une variété de dimension infinie : [48-49]
Définition 10 : Un système est la donnée d’une paire ( , F) où F un champ de
vecteurs lisses sur M X U
mChapitre II Outils pour la commande des systèmes plats
22
Remarque : Une différence importante liée à la représentation en dimension infinie de (II.6) par rapport à la représentation usuelle est que la notion de dimension d’état est perdue. En fait, dans notre formalisme les équations suivantes:
( , ), ( , )
n mx f x u x u X U (II.14)
( , )
x f x u (II.15)
u v (II.16) ont la même description (M,F) , avec M X U
met
(1) (2) (1) (2)
( , , , ,...) ( ( , ), , ,...)
f x u u u f x u u u (II.17)
En effet, l’application t (x(t),u(t)) est une trajectoire de (II.14) si, et seulement si, l’application t ( ( ), ( ), ( )) x t u t u t est une trajectoire de (II.15). Une telle situation n’est pas surprenante puisque la dimension d’état n’est pas préservée par bouclage dynamique.
Exemple :
Le système trivial
m, T
m , de coordonnées y ( y
1,..., y
m) , y
(1) ( y
1(1),..., y
m(1)) ,
( ) ( ) ( )
(
1,..., )
m m m
y y y
met dont le champ de vecteurs, dit champ de vecteurs trivial noté T
mest donné par :
(1) (2) (1) (2)
( , , ,...) ( , ,...)
T
my y y y y (II.18)
ou, en termes d'opérateur différentiel, l'équation :
(1) (2) ( 1)
( )
1 0
( , , ,...)
m j
m j
i j i
T y y y y
y
(II.19)
représente n’importe quel système constitué de m chaînes d’intégrateurs de
longueurs arbitraires, et en particulier le transfert direct y
iu
i, i 1,…, m.
Chapitre II Outils pour la commande des systèmes plats
23
II.4. Equivalence au sens de Lie-Bäcklund et bouclages dynamiques II.4.1. Equivalence
Nous nous intéressons maintenant à définir une relation d’équivalence, dite de Lie Bäcklund, permettant de formaliser le fait que deux systèmes sont
"équivalents" s’il existe une transformation inversible qui échange leurs trajectoires. Elle s’appuie sur la notion d’isomorphisme de Lie-Bäcklund utilisée en physique mathématique. Comme nous le verrons dans la suite, cette équivalence est beaucoup moins restrictive que la notion classique, par difféomorphisme et bouclage statique d’état, et s’interprète en termes de bouclages dynamiques [48-49]
Considérons deux systèmes (M, F) et (N, G) et une application lisse
: M N
. Par définition, chaque composante d’une telle application ne dépend que d’un nombre fini de variables. Soit p M et notons q ( ) p .
Si t ( ) t est une trajectoire de (M, F) dans un voisinage de p , c'est-à-dire,
( ) ( ( )).
t t F t
(II.20)
Alors l’application composée t ( ) t ( ( )) t reste dans un voisinage de q et satisfait la règle des dérivées composées :
( ) t ( ( ), ( )) t t ( ( ), ( ( )) t F t
(II.21)
Insistons encore une fois sur le fait que ces expressions ne contiennent que des sommes finies, même si les vecteurs et les matrices ont des tailles infinies.
Alors, si les champs de vecteurs F et G sont - reliés en (p, q), c'est-à-dire :
, ( ) G ( , ( )) F
(II.22)
Alors pour tout dans un voisinage de p, on a :
( ) t G ( ( ( ))) t G ( ( )) t
(II.23)
Chapitre II Outils pour la commande des systèmes plats
24
Ce qui signifie que t ( ) t ( ( )) t est une trajectoire de (N, G). Si de plus
admet une application inverse régulière alors F et G sont également reliés en (q, p), et il existe une correspondance locale entre les trajectoires des deux systèmes.
Une telle application qui échange F et G est appelée transformation endogène.
Nous sommes donc conduits à introduire la définition suivante [48-49] :
Définition 10 : Soit une application lisse bijective de ( , F) dans (N, G) au voisinage du couple de points (p, q) avec p M et q (p) N dont l’inverse aussi est supposée lisse, et est notée . On dit que est un isomorphisme de Lie- Bäcklund en (p,q) si, et seulement si, les champs de vecteurs F et G sont - reliés en (p, q) et les champs G et F sont aussi -reliés en (q, p).
Les isomorphismes de Lie-Bäcklund conduisent naturellement au concept d’équivalence de Lie-Bäcklund suivant [48-49] :
Définition 11 : Deux systèmes (M, F) et (N, G) , sont dits Lie-Bäcklund équivalents en (p,q) M N si et seulement si, il existe une application lisse d’un voisinage de p sur un voisinage de q= (p) qui soit un isomorphisme de Lie-Bäcklund en ( p,q). (M,F) et (N,G) sont Lie-Bäcklund équivalents s’il existe une application lisse
d’un ouvert dense D M dans N qui soit un isomorphisme de Lie-Bäcklund de(M,F) dans (N,G) au voisinage de toutes paires de points (p, (p)) , avec p dans D.
Théorème 1 : Si les deux systèmes (M, F) et (N, G) sont Lie-Bäcklund équivalents, ils admettent le même nombre d’entées indépendantes.
Théorème 2 : Deux systèmes linéaires commandables sont Lie-Bäcklund
équivalents si, et seulement si, ils ont le même nombre d’entrées indépendantes.
Chapitre II Outils pour la commande des systèmes plats
25
II.4.2. Bouclages dynamiques
II.4.2.1. Transformations dynamiques endogènes
Définition 12 : La notion d’équivalence endogène est généralement définie en utilisant des transformations dynamiques endogènes. Pour ces transformations particulières, l’état et la commande u du bouclage dynamique s’expriment en fonction de l’état et d’un nombre fini de dérivées de la commande u [48-49].
( )
( )
( , ,..., ) ( , ,..., )
q
q
k C x u u v D x u u
(II.24)
II.4.2.2. Bouclages dynamiques endogènes
On considère le système (M, F) dont la représentation en dimension finie est [48- 49] :
( , )
x f x u (II.25) Un bouclage dynamique est la donnée d’une équation différentielle de la forme :
( , , )
z x z v (II.26) et un bouclage :
( , , )
u x z v (II.27) Le système bouclé est alors donné par :
( , ( , , )) ( , , ) x f x x z v z x z v
(II.28)
Un tel système peut avoir la propriété de non accessibilité, c’est-à-dire ne pas pouvoir revenir du système bouclé au système d’origine par un autre bouclage dynamique [48-49].
Définition 13 : Soit le système ( , F). On appelle bouclage dynamique endogène
un bouclage dynamique de la forme :
Chapitre II Outils pour la commande des systèmes plats
26 ( , , )
( , , ) z x z v u x z v
(II.29) tel que le système bouclé soit Lie-Bäcklund (L-B) équivalent au système (M, F).
Théorème 3 : Supposons que les deux systèmes (M, F) et (N, G) définis par
( , )
x f x u et y g y v ( , ) sont L-B équivalents, alors il existe un bouclage dynamique endogène :
( , , ) ( , ; ) z x z v u x z v
(II.30) tel que le système bouclé :
( , ( , , )) ( , , ) x f x x z v z x z v
(II.31)
soit difféomorphe au système prolongé :
( 1)
( , )
r