• Aucun résultat trouvé

Le mélange de la planification symbolique avec la planification de trajectoires

elle est difficile à atteindre. Les approches multi-résolutions abordent ce problème en adoptant un comportement déterministe, déterminisme qui semble améliorer l’efficacité des approches par échantillons [LaValle et al., 2004] : l’idée est de constituer une base de trajectoires pré-établies, éventuellement planifiées sous des contraintes difficiles qui empêchent l’approche d’être utilisée en temps réel. Le problème est que cette base doit être suffisamment représentative de tous les mouvements possibles tout en limitant leur diversité pour réduire la complexité des approches multi-résolutions [Branicky et al., 2008]

Le problème de la replanification est lui-même abordé : dans la veine des approches telles que D∗ [Stentz, 1995], des travaux proposent la transformation de l’arbre d’exploration issu d’une

première planification de RRT [Ferguson et al., 2006] plutôt qu’une replanification complète et certainement coûteuse.

Un résumé du fonctionnement de ces approches est proposé dans la Table 2.4.

Mon objectif est de pouvoir conserver un niveau suffisant de description des différentes entités. Cela doit être fait en ayant les garanties nécessaires sur l’exécution afin de contrôler la planification locale de trajectoire. Elle devient alors un mécanisme de vérification des mouvements pour les couches cognitives. Un résumé des critères recherchés pour créer l’approche cognitive est donné dans la Table 2.5.

2.4 Le mélange de la planification symbolique avec la

planification de trajectoires

Cette section présente les travaux relatifs à l’utilisation de comportements de pilotage dans les applications robotiques.

2.4.1 Comportements en planification de mouvement

[Reynolds, 1999] propose une approche découplée pour la description des comportements de pilotage utilisés par des personnages autonomes afin qu’ils puissent achever des tâches de haut niveau. Un niveau de sélection d’action décide en premier lieu des objectifs de haut niveau. Ceux-ci sont ensuite transmis à un niveau de planification de mouvement (de locomotion) qui se charge d’effectuer le déplacement.

Les approches centrées sur les comportements proposent d’intégrer le domaine de la planification de comportements dans les applications robotiques [Jones, 2004]. Celles-ci sont pourtant limitées à des architectures réactives s’appuyant sur les capteurs et les contrôleurs des robots [Brooks, 1985]. Il n’y a aucune inférence à propos des capacités de mouvement du robot ou encore de l’accessibilité des objectifs sélectionnés.

2.4.2 Approches mêlant états discrets et continus

Approches cognitives pour bras articulé

Les problèmes de planification de mouvement n’impliquent pas nécessairement un déplacement libre du robot dans l’environnement et donc un espace des configurations potentiellement infini : c’est par exemple le cas des bras articulés et en général des problèmes de manipulation d’objets dont les enjeux sont révélés par [Lozano-Perez et al., 1987]. Des contraintes peuvent apparaître sur les mouvements relatifs entre les éléments du bras, sur la manière d’attraper les objets à manipuler, sur l’équilibre du bras . . .

pi tr e 2. É ta t de l’a rt

RRT Configurations aléatoires Intégration aléatoire Commandes

EST Points de passage aléatoires Intégration aléatoire Commandes

PDST Segmentation de l’environnement Intégration aléatoire Commandes

-EXPLORE pour favoriser les zones sur plusieurs pas de temps

non explorées + poids sur les trajectoires

DSLx Choix déterministe de branches Intégration aléatoire Commandes et temps

à étendre en fonction de l’accessibilité des zones

RRT∗ Configurations aléatoires Intégration aléatoire Commandes

+ réorganisation de l’arbre

2.4. Le mélange de la planification symbolique avec la planification de trajectoires

Propriété Approches par échantillonnage Planification en temps réel Problème de l’aléatoire

Exploration de l’espace des solutions Oui, complète statistiquement pour RRT

Respect du modèle Oui

du robot et des contraintes

Application directe des commandes Oui

Compatibilité avec un planificateur de chemin Oui, mais guidage à formaliser Ajout de nouvelles contraintes Au niveau de la propagation

Table 2.5 – Propriétés attendues d’approche cognitive pour la planification de trajectoire et solutions apportés par les approches par échantillonnage.

Notons qu’un bras articulé ne peut s’étendre à l’infini. Dans ce contexte, les degrés de liberté sont définis par les angles entre chaque partie du bras dont les valeurs possibles sont limitées. L’espace des configurations qui en résulte est donc fini et peut être complètement calculé à l’avance. Cette possibilité est particulièrement intéressante puisqu’elle rend possible la vérification en ligne des états du robot. Dans ce contexte particulier, de récentes avancées dans [Jaesik et Eyal, 2009] ont ainsi été réalisées en associant la planification « classique » (raisonnement dans un monde symbolique) et la planification de mouvement. La partie descriptive utilise PDDL [McDermott et al., 1998]. L’espace des configurations du bras est représenté dans le niveau de planification des actions, assurant au préalable la faisabilité physique des décisions prises. Ce raisonnement est illustré par la figure 2.20. Une action est décrite en particulier par la configuration de départ et la configuration à atteindre. L’appartenance de ces configurations à l’espace des configurations sert alors de pré-condition au mécanisme de décision. Dans ce travail, je vois la fusion réussie de mécanismes de prise de décision qui gèrent la vérification physique des états du robot. Toutefois, dans cette approche, les contraintes cinématiques ne sont pas considérées puisque seul l’espace des configurations est utilisé. Or, cet espace ne décrit par la faisabilité des transitions entre deux configurations.

Approches par échantillonnage dans un espace hybride

Certains travaux comme [Branicky et al., 2006] tendent à utiliser des approches par échantillonnage pour explorer des espaces d’état. Leur approche est d’abord utilisée sur des espaces strictement discrets (s’inspirant de ce qui peut être fait dans la catégorie des algorithmes de renforcement). Puis leur approche est étendue à des espaces mêlant états continus et discrets. Toutefois, comme le montre avec pertinence [Jaesik et Eyal, 2009], l’espace des configurations peut grossir de manière exponentielle en faisant intervenir des états discrétisés. Dans le même ordre d’idée, [Agha-mohammadi et al., 2011] proposent une approche qui généralise PRM pour tenir compte de l’évolution des connaissances du robot (incertitude sur les obstacles par exemple) et pour guider le niveau de planification de trajectoire en fonction de l’évolution des connaissances du robot.

2.4.3 Description de comportements

Le réalisme des comportements de conduite est pourtant devenu un important challenge, ainsi qu’en témoigne la réflexion menée dans le domaine de la simulation de trafic routier [Lacroix et al., 2009]. Comme dans mon cas, la principale difficulté est de réussir à lier le haut

Figure2.20 – Illustration, tirée de [Jaesik et Eyal, 2009], du problème de planification cognitive de trajectoire dans l’espace des configurations : tous les mouvements possibles d’un bras articulé sont établis au préalable et donc les zones de l’espace qu’il peut atteindre. Cet espace des mouvements possibles sert alors de pré-condition aux actions envisagées par le planificateur : si elles entraînent le robot dans des configurations physiques infaisables, elles sont rejetées du planificateur. Ce planificateur prendra donc uniquement les décisions de déplacement que l’on sait effectivement réalisables par le bras manipulateur.

niveau, attaché au domaine de la psychologie du conducteur, au bas niveau, qui lui concerne les données mesurables (vitesse, braquage. . .). J’entends par psychologie du conducteur les éléments qui ont une influence sur le choix des trajectoires à suivre. Par exemple, un conducteur « agressif » choisira des solutions plus risquées qu’un conducteur « calme ». Ce problème a été par exemple traité par [Lacroix et al., 2007]. Celui-ci propose d’utiliser les distributions de probabilités sur les paramètres, tels que le temps avant collision ou encore le temps avant de traverser la ligne pour générer de la variété dans les comportements de conduite rencontrés dans le monde réel.

2.4.4 Planification de tâches complexes

Les plus hauts niveaux de raisonnement dans les applications robotiques doivent gérer le problème général de la planification de tâches complexes. Les approches usuelles sont soit basées sur une description de type STRIPS, comportant une description du monde et de toutes les actions possibles, soit sur une description en réseaux hiérarchiques de tâches (HTN pour Hierarchical Task Networks) pour décomposer un objectif en tâches composées. Les HTN ont été massivement utilisés car ils permettent de décrire des tâches de la même manière que les humains le font pour eux-mêmes, bien que leur expressivité dans la pratique ne soit pas meilleure que celle de STRIPS [Lekavy et Návrat, 2007].

Afin de planifier ces tâches tenant compte des capacités physique des robots, il faut disposer d’une représentation de l’environnement qui soit adaptée au contexte de la robotique. Il est pour cela nécessaire de construire des bases de connaissances orientées robotique, à l’image de celle proposée dans OpenRobotOntology [Lemaignan et al., 2010].