Présentation générale de la méthode d'élaboration des contributions

3.1 Introduction aux contributions

L'objectif de cette thèse est de dépasser les limites observées avec le mécanisme séquentiel IMOSHEM (Chapitre 1). Je propose un modèle permettant à un agent articiel de naviguer dans un environnement ouvert et continu. Ce modèle permet de construire et d'exploiter un contexte spatial construit au travers des interactions entre l'agent et son environnement.

Nous adoptons un modèle cognitif implémentant des théories de la psychologie qui implique que l'action et la perception ne sont pas séparées a priori, appelé Radical Interactionism (RI) [43]. Le modèle RI permet de considérer un agent indépendant de tout présupposé sur l'envi-ronnement : contrairement aux modèles classiques (par exemple, le modèle POMDP [7]), il ne se base pas sur la notion d'état de l'environnement, mais uniquement sur la notion d'interaction de l'agent avec son environnement. L'agent ne cherche pas à atteindre un but ou à eectuer une tâche prédénie, mais est dirigé par une motivation intrinsèque, associée à ses interactions.

L'implémentation du modèle RI nous a conduit à repenser la conception d'un robot basé sur ce modèle. En eet, les robots nécessitent des systèmes sensoriels et moteurs "équilibrés" pour respecter le principe de balance écologique, et ainsi permettre une implémentation de l'approche sensorimotrice du RI. Le terme balance écologique a été proposé par Pfeifer [100] pour caractériser le fait que les possibilités oertes par les capteurs et les actionneurs doivent être équilibrées pour permettre une approche sensorimotrice. Il est plus facile de construire un robot à partir de son système interactionnel plutôt que d'adapter le système interactionnel à un système sensoriel et moteur existant. Les agents robotiques utilisés pour nos expérimentations sont développés selon cette approche.

Je propose un système permettant à un agent articiel de générer dans un premier temps des modèles implicites des éléments qui composent son environnement, en se basant sur ses in-teractions. Le système permet ensuite de construire des structures caractérisant l'espace proche (péri-personnel) et lointain (extra-personnel d'action). Les mécanismes permettant de construire

Chapitre 3. Présentation générale de la méthode d'élaboration des contributions

les structures caractérisant ces deux espaces sont très similaires, et non exclusifs, ce qui rend leur utilisation simultanée possible. De plus, le mécanisme lié à l'espace lointain utilise les connais-sances acquises par le système lié à l'espace proche, et utilise des principes similaires, montrant que ces deux systèmes sont fortement liés.

Ces mécanismes permettent la construction d'une connaissance de l'espace et des objets en accord avec l'approche Radical Interactionism. Je me suis eorcé de supprimer les préconceptions à la fois sur les objets présents dans l'environnement, et sur la structure de l'espace. Dans la littérature, la question de l'émergence de la notion d'objets à partir des aordances a été étudiée. Cependant, cette connaissance n'est utilisée que dans le but de déterminer les actions immédi-atement faisables. Nous proposons que l'agent utilise d'une part cette connaissance émergente sur les objets pour dénir son environnement en termes d'interactions futures, et d'autre part pour mémoriser et suivre les interactions potentiellement énactables.

3.2 Méthode de validation des mécanismes

Les propriétés des algorithmes mis en ÷uvre pour implémenter les diérents mécanismes de mon système ont été testées au cours de trois expérimentations. Chacune d'elle met en évidence le fonctionnement d'un ensemble de processus sur un système fonctionnel, en supposant, lorsque c'est nécessaire, le fonctionnement des autres. Les trois expérimentations permettent de couvrir l'ensemble des processus.

3.2.1 Analyse des résultats et évaluation des mécanismes

Les mécanismes sont évalués en utilisant les critères décrits au chapitre 1. Cependant, on ne cherche pas seulement à évaluer les comportements de l'agent. Nous analysons également les connaissances apprises par l'agent. Ces informations nous permettent en eet de décrire comment l'agent dénit son environnement au travers de ses interactions. L'implémentation du premier processus (voir chapitre 5) permet d'observer, d'un point de vue extérieur, les modèles implicites des objets construits par l'agent et leurs propriétés associées en observant les groupes d'interactions qu'il forme. Dans le cas d'un agent évoluant dans un environnement discret, il est possible de dénir des modèles théoriques des objets auxquels nous pourrons comparer les modèles générés par l'agent. En revanche, dans le cas d'un agent évoluant dans un environnement continu, et plus encore, dans le cas d'un robot, l'étude des modèles ne pourra être que qualitative. Il sera en revanche possible, dans les deux cas, d'eectuer des comparaisons entre les modèles émergents des objets liés aux diérentes interactions.

Étant donné la nature parallèle et bi-dimensionnelle (nos agents évoluent dans des environ-nements à deux dimensions) des informations spatiales que nous voulons étudier, nous ne pour-rons pas nous baser sur les outils utilisés pour le mécanisme IMOSHEM pour acher les traces de nos agents. Dans les chapitres 9 à 11, les traces et les structures apprises par les agents seront achées d'une façon spécique à chaque expérimentation, pour faciliter la lecture et l'analyse

3.2. Méthode de validation des mécanismes des résultats.

3.2.2 Environnements de test

Les expérimentations ont été menées dans deux environnements de tests. Le premier est un environnement simulé. Le second est une plate-forme robotique, utilisée pour tester nos mécan-ismes dans un environnement bruité.

Pour les expérimentations en environnement simulé, nous nous sommes basés sur une version modiée de l'environnement Vacuum [112]. Cette version permet les tests dans un environnement "continu", bien que l'agent puisse être restreint à une grille pour les expérimentations en envi-ronnement discret. Le robot est une plate-forme développée à partir de Lego Mindstorm pour implémenter le système interactionnel de l'agent. Le système de décision est identique à celui utilisé pour le système simulé. Le robot contient un programme lui permettant d'exécuter les interactions issues du système de décision, et constitue ainsi une interface entre le système de décision et l'environnement réel.

Chapitre 4

Dans le document Mécanismes d’apprentissage développemental et intrinsèquement motivés en intelligence artificielle : étude des mécanismes d'intégration de l'espace environnemental (Page 50-54)