• Aucun résultat trouvé

8.1 Indépendance entre l'agent et l'environnement

Conformément aux spécications dénies par le modèle du Radical Interactionism (RI), décrit au chapitre 4, la communication entre l'agent et l'environnement ne s'eectue que par l'échange d'interactions primitives. Les interactions sont implémentées sous la forme de structures com-prenant une action, une perception et une valeur de satisfaction. Le système de décision n'a jamais accès aux actions et perceptions d'une interaction. Les interactions intentions sont trans-mises par le système de décision à une interface qui applique le scheme sensorimoteur et contrôle son exécution. Les interactions énactées sont reconstituées par cette interface, qui détermine l'in-teraction énactée à partir de l'action de l'inl'in-teraction intention et de la perception observée à la n de l'interaction agent-environnement. L'interaction énactée est ensuite envoyée au système de décision de l'agent.

8.2 Mécanismes de construction de structures pour la prise de

connaissance de l'environnement

Les signatures d'interaction et les fonctions de certitude de succès et d'échec constituent un système prédictif permettant d'évaluer la faisabilité d'une interaction. Cette prédiction est eectuée en se basant sur un ensemble d'interactions caractérisant l'environnement intégré par l'agent.

Nous avons déni la signature d'interaction comme une structure permettant de caractériser un contexte d'éléments de l'environnement par la façon dont l'agent peut l'expérimenter par le biais de ses interactions. Elle permet ainsi de générer un lien entre les interactions qui permettent de considérer un objet et l'interaction aordée par cet objet. L'agent peut ainsi constituer des modèles exploitables d'objets à partir d'interactions, sans qu'aucune autre information que les

Chapitre 8. Choix d'implémentation pour la validation interactions qu'il énacte ne soit nécessaire.

L'implémentation des signatures d'interaction à base de neurones articiels permet d'extraire du vecteur d'entrée les entrées pertinentes pour prédire la valeur de sortie. La signature permet ainsi de dénir une association forte entre une interaction et les interactions qui permettent de prédire le résultat de son énaction éventuelle. Les signatures d'interaction sont constituées d'un vecteur générant une association orientée entre une interaction et l'ensemble d'interactions primitives qui permettent de prédire le résultat de son énaction.

Cette propriété donne au système une capacité à prédire le résultat des interactions du cycle de décision suivant. On peut s'attendre à ce que le système puisse regrouper des interactions liées à un même objet de l'espace, si ces interactions permettent de prédire le résultat d'une même interaction.

La prédiction sur la faisabilité d'une interaction s'eectue par l'utilisation des fonctions de certitudes de succès et d'échec. Ces fonctions se basent sur la présence ou l'absence de la signature d'une interaction dans le contexte interactionnel courant. Le système met à jour les signatures des interactions énactées à partir des contextes interactionnels passés. L'apprentissage s'eectue uniquement par l'expérience que l'agent a avec son environnement par le biais de ses interactions.

8.3 Mécanisme de construction de la Mémoire Spatiale

Dans un premier temps, ce mécanisme doit permettre la construction d'une structure inté-grant l'espace qu'il peut observer, c'est-à-dire les positions de l'espace où une interaction peut être énactée. Notons que dans le modèle SRI, la topologie de l'espace est dénie a priori (hypothèse du tectum optique). La construction de cette topologie repose sur l'utilisation des signatures d'interactions apprises par le mécanisme de construction de structures pour la prise de connais-sance de l'environnement. L'émergence de la structure intégrant l'espace observable repose en eet sur les associations dénis par les signatures d'interaction.

La seconde partie de ce mécanisme doit permettre la construction d'une structure intégrant l'espace global et permettre de "suivre" les objets détectés. L'algorithme intégrant la topologie de l'espace global utilise des structures similaires aux signatures d'interaction. Celles-ci génèrent une association forte entre une région de l'espace et les régions qui permettent de prédire la présence d'un objet dans cette région. Ces associations permettent de lier des positions de l'espace par un mouvement qui permet de passer de l'une à l'autre par le biais de structures appelées lieux composites. L'aspect séquentiel des lieux composites permet de dénir des régions de l'espace non observable et d'établir des liens entre ces régions, caractérisés par les interactions qui permettent de passer d'une région à une autre. L'agent peut ainsi caractériser la topologie de l'espace sans que celle-ci n'ait besoin d'être dénie a priori.

Les positions de l'espaces peuvent être dénies de deux façons : dans l'approche RI, les po-sitions sont dénies par des séquences d'interactions primitives. Chaque position est dénie par la séquence d'interactions primitives qui permet d'atteindre cette position. Si le système se base sur le modèle SRI, on peut utiliser des positions dénies par leurs coordonnées en référentiel

8.4. Mécanismes d'exploitation de la Mémoire Spatiale égocentré. Nous dénissons un lieu comme un ensemble de positions de l'espace pour lesquelles l'interaction permettant de s'en rapprocher et la distance, dénie par le nombre minimal d'in-teractions primitives à énacter pour l'atteindre, ou par sa distance géométrique par rapport à l'agent dans le cas du modèle SRI, sont similaires.

Une instance d'objet est dénie par l'interaction qu'elle peut aorder, et une position dans l'espace. Cette position est dénie par l'ensemble des lieux et lieux composites qui contiennent cette instance d'objet. Dénir ainsi une instance d'objet permet de dénir comment s'en rap-procher, ainsi que son inuence (liée à sa distance).

8.4 Mécanismes d'exploitation de la Mémoire Spatiale

8.4.1 Espace péri-personnel

L'espace proche est caractérisé par des séquences d'interactions appelées interactions com-posites. Une interaction composite est constitué de deux séquences d'interactions. La seconde séquence permet de caractériser la présence de l'objet qui aorde l'interaction composite (puisque la possibilité d'énacter une séquence d'interactions est liée à la présence de l'objet qui aorde cette séquence dans l'environnement). La première séquence caractérise la suite d'interactions que l'agent doit eectuer pour atteindre cet objet, indépendamment de la possibilité de l'énacter (puisque la présence d'un objet est indépendante de son accessibilité), et dénit ainsi une position dans l'espace conforme à l'espace représentatif de Poincaré [107].

Comme chaque interaction composite permet de caractériser la présence (ou l'absence) d'un objet à une certaine position de l'espace, il devient possible de caractériser la conguration de l'environnement proche de l'agent à l'aide de l'ensemble des interactions composites considérées comme possible. Un tel modèle de l'environnement ne nécessite aucune autre information que les interactions et leurs signatures.

Le système de suivi des objets repose sur l'aspect séquentiel des interactions composites. En eet, une interaction composite caractérise la position d'un objet par la séquence d'interactions qui permet de l'atteindre. Ainsi, si l'agent enacte la première interaction de cette séquence (dans le but d'atteindre l'objet ou non), alors l'objet est toujours présent, et à une position caractérisée par les interactions suivantes de la séquence initiale. L'objet et sa position peuvent dont être caractérisés par une nouvelle interaction composite. Le système de suivi des objets repose ainsi sur les propriétés des interactions composites et ne nécessite pas d'apprentissage.

8.4.2 Espace extra-personnel

L'agent prend en compte l'ensemble des instances d'objet détectées dans son environnement. Comme nous l'avons vu précédemment, chaque instance est caractérisée par des interactions permettant de s'en approcher ou de s'en éloigner, ainsi qu'une "distance" qui permet de dénir son inuence dans les décisions de l'agent.

Chapitre 8. Choix d'implémentation pour la validation

L'agent tient compte dans un premier temps des interactions qu'il peut eectuer, c'est-à-dire considérées comme énactables d'après les informations fournies par le mécanisme de construc-tion de structures pour la prise de connaissance de l'environnement. La sélecconstruc-tion de l'interac-tion intenl'interac-tion du cycle de décision suivant se base sur la valeur de satisfacl'interac-tion des interacl'interac-tions possibles. Cependant, l'agent doit également tenir compte des aordances présentes dans son environnement an de maximiser sa valeur de satisfaction à moyen terme. On ajoute donc, aux valeurs de satisfaction, une valeur d'utilité dénie par le rapprochement des instances d'objet permis par l'énaction des interactions.