Modèles hiérarchiques de la planification

2.2 Organisation hiérarchique temporelle de la planification

2.2.2 Modèles hiérarchiques de la planification

De nombreuses études ont montré que, même dans les faits les plus simples de la vie de tous les jours, une structure hiérarchique peut être observée : chaque objectif est composé de sous-objectifs eux-mêmes décomposables à nouveau, etc. Un exemple particulièrement étudié (Cooper et Shallice, 2000 [51]) consiste en l’objectif de se préparer le matin. Celui-ci peut être décomposé dans les sous objectifs : se laver, s’habiller, déjeuner. L’objectif de déjeuner peut être décomposé en sous-objectifs préparer et consommer le café, préparer et consommer une tartine de confiture. A nouveau, préparer et consommer le café peut être décomposé en différent niveaux de sous objectifs jusqu’à atteindre le niveau d’actions élémentaires : prendre une cuiller, verser, boire, . . . On voit ainsi qu’on peut décomposer sous forme d’un arbre un comportement dirigé vers un but. Notons que cet arbre n’est pas strict, dans le sens où plusieurs étapes pourraient être interverties ou effectuées en même temps ou d’une autre manière ; de même que d’autres comportements pourraient utiliser des sous-parties de cet arbre.

Bien que la structure hiérarchique de ces comportements soit largement acceptée par de nombreux auteurs (Cooper et Shallice, 2000 [51] ; Botvinick et Plaut, 2004 [27] par exemple), la question de l’implémentation de ce type de comportements hiérarchiques nourrit une large polémique, en particulier entre les deux équipes citées précédemment. Rapidement, Cooper et Shallice (2000 [51], 2006 [52] [53]) argumentent pour une représentation hiérar- chique explicite des objectifs et sous-objectifs et de leur résolution à l’aide de schémas. Au contraire, Botvinick et Plaut (2004 [27], 2006 [29]) plaident pour une représentation implicite de la hiérarchie de ces séquences d’actions. L’outil essentiel d’évaluation des deux modèles concurrents (voir figure 2.1, page 69) est la capacité à répliquer les données compor- tementales observées, testées sur la tâche de faire du café ou du thé. Au delà de l’exécution correcte de ces tâches dans différents contextes et avec différents moyens, le type d’erreurs effectuées par le modèle bruité (pour représenter soit une distraction habituelle, soit un syndrome de désorganisation) est comparé à ce qui est observé empiriquement.

Le modèle proposé par Cooper et Shallice, 2000 [51], repose sur une représentation explicite de la structure hiérarchique d’une tâche. Cette représentation se fait sous forme d’arbre, dont les nœuds représentent soit des (sous-) objectifs, soit des schémas. Un schéma est défini

comme un moyen d’atteindre un objectif. Au niveau le plus faible, c’est une action simple (feuille de l’arbre) ; autrement, c’est un sous-arbre. La structure de l’arbre est définie en dur dans le modèle. L’activation de nœuds de l’arbre dépend de cinq types de connexions : – influence top-down, de telle sorte qu’un schéma hiérarchiquement plus haut (faire du

café) peut activer un schéma plus bas (faire chauffer de l’eau),

– influence de l’environnement, de telle sorte qu’un système de gating est en place : un schéma n’est activé que si certaines préconditions sont remplies et si l’objectif n’est pas atteint,

– influence latérale, de telle sorte à implémenter un ‘winner take all’ (une seule unité active au même niveau hiérarchique) : on observe alors des séquences d’actions, plutôt que plusieurs à la fois,

– auto influence, pour le maintien en mémoire de travail, – bruit.

Les simulations montrent que ce modèle parvient à effectuer des séquences d’actions et à re- produire les erreurs observées empiriquement. Les limitations soulevées suggèrent l’absence d’implémentation plausible de ce modèle, notamment pour les gating units permettant de contrôler le début (conditions pour effectuer un schéma) et la fin (obtention de l’objectif) d’une séquence. Par ailleurs, le fait que le codage de la hiérarchie de la tache soit effectué à la main pose le problème de l’acquisition de cette hiérarchie : comment est-elle apprise ? Botvinick et Plaut proposent en réponse à ce modèle, un modèle de type réseau de neurones (2004 [27]). Ce modèle est volontairement non hiérarchique. Il est muni d’une couche d’entrée (états actuels), connectée entièrement à une couche cachée de neurones très in- terconnectés, eux-mêmes connectés entièrement à une couche de sortie (actions) agissant sur l’environnement. Dans ce modèle, l’encodage de séquences d’actions est implicite et émergent. En effet, la présence de connexions récursives dans la couche cachée permet de faire persévérer des informations précédentes, encodant ainsi un contexte temporel ou envi- ronnemental nécessaire à l’implémentation d’une action au sein d’une séquence. Le réseau de neurones est soumis à un entrainement supervisé : séquences d’entrées et de sorties im- posées, apprentissage des forces de connexions par backpropagation de l’erreur observée. Les séquences d’actions sont alors encodées sous forme d’attracteurs dynamiques du réseau de neurones (au lieu de schémas ponctuels comme plus haut), représentant essentiellement

Figure 2.1 – _{Figure extraite de [28], [51], [52], [27]. A gauche (a,b), le modèle de planification}

explicitement hiérarchique de Cooper et Shallice ([51], [52]). A droite (c,d) le modèle implicitement hiérarchique de Botvinick et Plaut ( [28] [27]), reposant sur des attracteurs dynamiques internes (deux trajectoires pour deux tâches proches représentées en bas).

les statistiques de transition apprises lors de l’entraînement. De même que le précédent modèle, celui-ci permet d’effectuer des séquences d’actions. Il réplique certains résultats de production d’erreurs d’inattention ou du syndrome de désorganisation de l’action.

Si la polémique sur la nécessité de représenter ou non explicitement la structure hiérarchique de la planification du comportement n’est pas résolue, on peut en tout cas louer l’effort lié à la nécessité de pouvoir apprendre des hiérarchies fourni par Botvinick et Plaut.

On montrera par la suite plusieurs articles effectuant une tentative de rapprochement des aspects intéressants de chaque modèle – hiérarchie explicite, apprentissage possible, codage distribué plutôt que ponctuel.

En particulier, Botvinick, 2007 [28], modifie légèrement son précédent modèle pour tenir compte des données d’imagerie (voir section 2.3.2) indiquant l’existence de structures fonc- tionnelles hiérarchiques dans le cerveau, en particulier dans le cortex préfrontal. Il ajoute simplement une deuxième couche cachée de neurones, connectée de manière récurrente à elle-même et à l’autre couche cachée, mais non connectée à l’entrée et à la sortie. Il montre comme précédemment que, même sans encoder de structure hiérarchique explicite, le modèle parvient à effectuer une séquence de tâches (thé, café). Par contre, il montre que les neurones cachés sont plus sensibles au contexte de la tâche effectuée qu’au stimulus immédiat, et que cet effet est plus fort pour les neurones cachés les plus distaux (couche cachée non connectée aux entrées/sorties). Cette simulation propose une explication pour le rôle hiérar- chique du PFC dans le comportement (représenté par la couche distale). Cependant, cette simulation montre également que même avec seulement un (2004 [27]) ou deux (2007 [28]) niveaux hiérarchiques permis dans la structure du réseau de neurones, on peut effectuer une tâche de structure hiérarchique de profondeur plus grande que deux. Si l’introduction d’une possibilité de hiérarchie implique effectivement que celle-ci sera naturellement utilisée pour encoder une hiérarchie, celle-ci n’est pas indispensable au comportement séquentiel.

Dans le document en fr (Page 69-72)