Algorithmes A ⋆ pour environnements dynamiques ou incertains

2.2 Algorithmes de plus court chemin

2.2.3 L’algorithme A ⋆

2.2.3.3 Algorithmes A ⋆ pour environnements dynamiques ou incertains

L’origine des travaux portant sur les plus courts chemins en environnement dynamique provient en partie des jeux vidéo. Dans les role-playing games notamment, un personnage se déplace dans un environnement 3D dynamique. Pour mouvoir ce personnage, le joueur effectue un clic à un endroit de la carte et le personnage doit s’y rendre en empruntant le chemin le plus court tout en évitant les obstacles et les autres personnages. Le problème réside dans le temps de calcul de ce chemin : il faut qu’il soit quasiment imperceptible pour un joueur afin d’assurer la fluidité de l’exécution et ne pas être aga¸cant à la longue. La recherche de chemin en robotique mobile a également fait l’objet de nombreux travaux. Les recherches de chemin sont souvent réalisées sur un quadrillage représentant la surface (deux dimensions donc) de l’environnement. Lorsqu’un obstacle se trouve sur une case, cette dernière est « bloquée » et ne peut donc être empruntée.

L’idée majeure pour améliorer les méthodes provient d’une constatation : certaines recherches peuvent n’être que peu différentes des précédentes. En conséquence, pour accélérer le calcul d’un nouveau chemin, on va réutiliser les résultats acquis lors des précédents déplacements.

Dans un premier temps, les chercheurs ont tenté d’adapter directement les algorithmes de recherche optimaux [Nils 80, Jarv 85] pour les porter dans des architectures dynamiques. Les expérimentations sont alors effectuées sur des robots autonomes [Zeli 92] qui vont tenter de rejoindre un point objectif : si une incohérence est détectée, le robot va replanifier son itinéraire en effectuant une nouvelle recherche. Ces méthodes de force brute sont optimales, mais globalement inefficaces, particulièrement pour les environnements de grande taille pour lequels la recherche peut prendre beaucoup de temps. D’autres algorithmes ont donc été élaborés pour améliorer leurs performances en termes de besoins temps réel, à savoir rapidité d’exécution et/ou espace mémoire. Il en résulte deux grandes familles, développées parallèlement dans la seconde moitié des années 80, que nous présentons maintenant.

2.2.3.3.a Les algorithmes `a heuristique temps-r´eel

La première famille d’algorithmes regroupe les recherches dites à heuristique temps-réel. L’idée de départ est qu’une recherche type A⋆ _{doit attendre la fin de l’exécution pour déli-}

vrer la solution optimale, ce qui peut s’avérer dispendieux pour des environnements de grande taille. Or pourquoi attendre la fin de l’exécution pour qu’un robot commence à se déplacer ? Pour accélérer l’exécution, les algorithmes à heuristique temps-réel font le choix de ne considérer qu’un environnement de taille finie, limitée par un horizon ou une profondeur de recherche. Les chercheurs proposent différents algorithmes [Lume 86, Pirz 90] mais le premier faisant vraiment référence est RTA⋆_{(pour Real-Time A}⋆_{) [Korf 87, Korf 88], amélioré par la suite : LRTA}⋆ _(Lear-

ning RTA⋆_{) [Korf 90] avec m´ethode d’apprentissage, RTAA}⋆ _{(Real-Time Adaptive A}⋆_{) [Koen 06]}

puis GAA⋆ _{(Generalized Adaptive A}⋆_{) [Sun 08] impl´ementant une mise `}_{a jour des heuristiques...}

Ces méthodes ont été largement dérivées et ont démontré leur efficacité sur d’autres types de problèmes [Koen 98], comme le 24-puzzle ou encore les problèmes de planification de tâches...

Contrairement aux algorithmes à heuristique incrémentale décrits ci-après, le chemin ainsi défini peut se révéler sous-optimal, car l’espace de recherche ne va pas être considéré de manière globale. En revanche, pour des applications temps réel exigeant une forte réactivité ou engageant de nombreux agents (par exemple dans le cas du déplacement d’une « armée » dans un jeu vidéo), ces méthodes présentent une grande efficacité.

2.2.3.3.b Les algorithmes `a heuristique incr´ementale

Pour faire face à la surcharge de calcul ou d’utilisation mémoire, de nombreux algorithmes ont vu le jour, dont la performance est atteinte au détriment de l’optimalité de la solution. L’algorithme D⋆ _{(pour Dynamic A}⋆_{) [Sten 94] va s’imposer en 1994 comme la première grande}

référence face aux problèmes dynamiques. Il sera amélioré pour être dérivé notamment en Fo- cussed D⋆ _{[Sten 95] puis en D}⋆ _{Lite [Koen 02a], le dernier permettant une simplification de}

l’ex´ecution.

Les algorithmes (Focussed) D⋆ _{et D}⋆ _{Lite sont applicables `}_{a plusieurs cas de figure. On peut}

les mettre en œuvre dans les cas o`u l’environnement est totalement inconnu (d´etection locale `

a l’aide de capteurs), connu `a priori (on dispose de la carte de la zone, mais on doit faire face `

a l’incertitude : obstacles mobiles, accès condamnés...) ou partiellement connu (zones d’ombre). Ils ont la capacité de réutiliser les données des recherches précédemment réalisées en conservant en mémoire la liste ouverte élaborée par une recherche type A⋆_{. Plus particulièrement, D}⋆ _Lite

s’appuie sur l’algorithme LPA⋆ _{(Lifelong Planning A}⋆_{) [Koen 02b]. LPA}⋆ _{effectue une premi`ere}

recherche à la manière d’A⋆ _{et attend une mise `}_{a jour des informations. Si au cours du dépla-}

cement une incohérence (différence entre la fonction de coût attendue lors du déplacement le long de l’itinéraire et celle effectivement détectée) survient, alors un mécanisme de propagation permet d’actualiser les valeurs de coût des nœuds candidats pour la recherche. Récemment, un autre algorithme incrémental plus efficace que LPA⋆ _{a été mis au point : Fringe-Saving A}⋆

[Koen 07]. Cet algorithme a fait l’objet, tout comme LPA⋆_{, d’une d´erivation pour ˆetre appli-}

cable aux environnements dynamiques. Issu de D⋆ _{Lite, Dynamic Fringe-Saving A}⋆ _{[Koen 09]}

a ainsi été créé. Basé sur un algorithme incrémental plus efficace, il surpasse logiquement son prédécesseur : le gain annoncé est un facteur 2,5 en temps d’exécution.

2.2.4 Algorithmes pour le probl`eme de plus court chemin sous contraintes

Le problème de plus court chemin sous contraintes consiste, comme précédemment, à trouver un chemin pour aller d’un sommet A à un sommet B dans un graphe, mais en prenant cette fois en compte une seconde métrique (autre que le coût) associée aux arêtes du graphe. La résolution doit garantir que la somme des valeurs de cette métrique le long du chemin est inférieure à une valeur plafond (voir la formalisation de ce problème en section 1.3.3). Il est `

a noter qu’un problème sous contraintes multiplicatives peut être ramené à un problème sous contraintes additives, en travaillant avec la valeur logarithmique des pondérations. Quant au problème de contraintes min/max, il est résolu avec un simple algorithme de plus court chemin une fois les arêtes invalides supprimées.

Pour gérer l’introduction d’une contrainte additive, des approches basées sur des heuristiques intégrées à un algorithme de plus court chemin de type Dijkstra ou Bellman-Ford [Kort 00] (alternative à Dijkstra, moins performante mais capable de traiter des problèmes avec pondéra- tions négatives, dès lors qu’aucun cycle négatif n’est détecté) ont été expérimentées. Les travaux exploitant cette approche [Ravi 02] montrent cependant des performances assez variables en comparaison des méthodes de résolution spécifiques présentées ci-après. Étant démontré par [Wang 96] que le problème est NP-complet (même dans le cas de graphes acycliques), plusieurs approches d’approximation ont été développées. Elles sont de deux types : les approches géomé- triques et les approches algébriques, présentées ci-dessous. En troisième lieu, nous présentons les approches du problème généralisé à k métriques de contraintes.

Dans le document Des métaheuristiques pour le guidage d’un solveur de contraintes dédié à la planification automatisée de véhicules (Page 40-42)