• Aucun résultat trouvé

État de l'art

2.3 Apprentissage et exploitation de modèles pour représenter l'espacel'espace

La représentation de l'espace d'un agent est un élément essentiel dans la génération de com-portements dans des environnements ouverts. Cette section résume les formalisations et modèles décrivant la représentation de l'espace, ainsi que les implémentations chez des agents arti-ciels. La grande majorité de ces travaux concernent l'étude d'un seul type d'espace. Les travaux sont regroupés en fonction de l'espace concerné : espace péri-personnel, espace extra-personnel, navigation dans l'espace lointain. Nous listerons également les travaux portant sur l'étude des propriétés d'une représentation de l'espace, telle la permanence de l'objet, et les modèles cognitifs de l'espace.

2.3.1 Espace péri-personnel

Dans le domaine de la robotique développementale, on retrouve un grand nombre de travaux sur l'étude de l'émergence du Body Schema, celui-ci étant considéré comme essentiel pour perme-ttre à un agent d'interagir avec son environnement [62]. Une partie de ces travaux s'étend égale-ment à l'espace directeégale-ment atteignable par l'agent, et permettent la génération d'une structure caractérisant l'espace autour de l'agent. Ces travaux restent cependant limités à l'espace proche de l'agent et ne permettent pas de générer des comportements spatiaux.

2.3. Apprentissage et exploitation de modèles pour représenter l'espace Dans l'approche proposée par R. Detry et al. [31], le système détermine les positions de l'es-pace à partir desquelles un bras robotique peut saisir un objet, à partir d'informations visuelles. Ce système permet ainsi à un agent de saisir un objet sans présupposés sur cet objet. Notons cependant que les positions sont dénies en simulant un modèle corporel prédéni du robot. Cette approche ne génère pas des comportements dans l'espace.

Certains travaux concernent la façon dont les multiples modalités sensorielles (visuelles, tac-tiles et proprioceptives) peuvent encoder l'espace. Fuke, Ogino et Asada [38][37], et Chinellato et al. [23] proposent des modèles permettant de générer un lien implicite entre une position de l'espace visuel et les positions atteintes par le bras d'un robot simulé. Le premier modèle permet, en outre, de localiser les stimuli tactiles dans cette représentation, y compris les stimuli situés en dehors de l'espace visuel de l'agent. Ces approches permettent de générer un modèle de l'espace qui ne repose pas sur un référentiel cartésien, mais ne peuvent pas être utilisées pour générer des comportements impliquant des déplacements dans l'espace.

D'autres modèles concernent l'apprentissage et l'exploitation de modèles permettant de car-actériser l'espace proche et son contenu dans le but d'agir sur l'environnement. Pierce et Kuipper [106] proposent une approche permettant à un agent de construire une représentation de son pro-pre système sensoriel dans l'espace, utilisé pour dénir les déplacements associés aux commandes motrices. Cette représentation se base sur les similarités des valeurs fournies par les capteurs. Le modèle généré est ensuite utilisée pour la navigation de l'agent dans son environnement, no-tamment pour éviter les collisions. Dans notre approche, les stimuli sensoriels sont positionnés les uns par rapport aux autres par les interactions qui permettent de passer d'un stimulus à un autre. Il n'est donc plus nécessaire de dénir les déplacements de l'agent puisque la structure caractérisant l'espace est déjà basée sur ces informations.

2.3.2 Espace extra-personnel

Contrairement à l'espace péri-personnel, peu d'études ont été menées sur l'espace extra-personnel d'action. Je regroupe ici les méthodes utilisées pour permettre à un agent de représen-ter l'espace qui l'entoure, et de naviguer dans son environnement. Nous nous limireprésen-terons aux approches basées sur la localisation des objets en référentiel égocentré.

Kawamura et al. [70] proposent le modèle de l'Ego-Sphère. Ce modèle consiste à projeter des points d'intérêt sur une sphère centrée sur l'agent. Les points d'intérêt sont localisés en coordon-nées polaires sur la sphère. La position d'un robot peut ainsi être caractérisée par un ensemble de points d'intérêt, et les déplacements par des variations de coordonnées. L'agent se déplace pour rapprocher la position de ces points vers l'état observable d'un point de l'environnement déni comme la position à atteindre. L'agent prend ainsi en compte l'ensemble de l'environnement qu'il perçoit pour dénir sa position dans l'environnement. Cependant, la distance des points d'intérêt n'est pas dénie, ce qui ne permet pas de localisation d'un objet dans l'espace.

La neural map proposée par Lagoudakis et Maida [75] dénit une mémoire égocentrée de portée limitée, qui génère une carte des stimuli issus du système sensoriel de l'agent, et donne la

Chapitre 2. État de l'art

direction d'un but à atteindre, quelle que soit sa distance. La mémoire est constituée de n÷uds, positions élémentaires sur cette carte, associés à des positions de l'espace égocentré, et liés par des liens. Ces liens permettent, d'une part, de déplacer les informations des stimuli d'un n÷uds vers un autre lorsque l'agent se déplace, et d'autre part, de calculer les déplacements vers un but. La neural map nécessite de pré-dénir les liens entre les n÷uds. Il est également nécessaire de donner une signication a priori aux stimuli :dans l'implémentation proposée par l'auteur, les stimuli sont dénis par des télémètres donnant la distance et la position des obstacles à éviter. Cette approche dière également de l'approche développementale par le fait qu'un but doit être déni.

2.3.3 Permanence de l'objet

Chez les êtres vivants, la permanence de l'objet est la compréhension que les objets détectés dans l'environnement continuent d'exister même lorsque l'on ne peut pas interagir directement avec eux. Cette notion a été dénie pour la première fois par Piaget en 1954 [105]. La persistance de l'objet est primordiale dans la compréhension de l'espace puisque l'agent ne peut le percevoir dans sa globalité. Les travaux suivants portent sur l'étude et l'implémentation de mécanismes permettant d'attribuer cette capacité à un agent articiel.

Mareshal et al. [80] proposent un modèle prédictif qui apprend à prédire l'image d'un objet sur une rétine articielle en fonction des positions passées de l'image de cet objet sur la rétine. Ces prédictions permettent de suivre un objet et d'estimer sa position lorsque l'objet est masqué ("eet tunnel"). Notons toutefois que le modèle est très simple :la projection de l'objet a toujours la même taille et se déplace à vitesse constante sur la rétine. Ce modèle ne peut donc pas être utilisé pour suivre un objet dans l'espace. On peut noter que ces auteurs estiment que la persistance de l'objet repose sur deux mécanismes distincts, pour reconnaître les objets et pour les suivre dans l'espace. Cette distinction se retrouve dans nos mécanismes de mémoire spatiale. Hande Çelikkanat, Erol “ahin et Sinan Kalkan [21] proposent une approche basée sur le Slow Feature Analysis. Cette méthode extrait d'un signal sensoriel les informations qui varient le moins tout en étant porteuses d'informations. Cette approche permet d'estimer la position d'un objet en mouvement, même lorsqu'il est masqué, et détecte le changement d'objets. Cependant, les expérimentations sont limitées à des décors xes dans lesquels l'objet à suivre se déplace. Il n'est pas possible d'extraire d'autres informations sur l'objet mobile que sa position sur l'image. Le fait que le mécanisme n'interagisse pas avec l'environnement empêche l'émergence d'une forme de compréhension des éléments présents dans l'environnement. Ce mécanisme ne peut donc pas être utilisé pour générer des comportements spatiaux.

2.3.4 Modèles cognitifs de l'espace

Un modèle mental de l'espace consiste en une structure permettant à un agent d'organiser ses connaissances dans l'espace et d'eectuer des simulations de son comportement. Jona Boed-dinghaus et al. [14], proposent un modèle dans lequel l'espace est représenté par une matrice.

2.4. État de l'art de la navigation basée sur des connaissances acquises par l'expérience On donne un ensemble de relation spatiales entre des objets (à droite de, à gauche de...). Le sys-tème, basé sur l'architecture cognitive ACT-R [4], détermine la position relative des objets dans le modèle mental. Ce modèle reste cependant limité à l'organisation d'éléments dans l'espace à partir d'un ensemble de relations donné, et ne permet pas l'exploitation de cette organisation dans le but de générer des comportements.

Erdem Erdemir et al. [35] proposent une approche dans laquelle un robot humanoïde (con-stitué d'un torse muni de deux bras) apprend à dénir les mouvements qu'il peut eectuer en présence d'objets pouvant faire obstacle à ses mouvements. Le robot peut eectuer des simu-lations de comportements permettant d'atteindre une certaine position avec ses bras, à partir des aordances détectées dans l'espace proche, ce qui lui permet de simuler diérentes stratégies avant d'eectuer le mouvement. Cette approche nécessite de découvrir les points de collision dans l'espace pour dénir une carte des aordances, ce qui implique que les objets soient statiques par rapport à l'agent. Ce mécanisme ne peut donc pas être utilisé pour générer des déplacements de l'agent dans l'espace.

2.4 État de l'art de la navigation basée sur des connaissances