• Aucun résultat trouvé

11.2.1 Session d’apprentissage

Performance et exploration

La performance moyenne lors de la session d’apprentissage s’élève à 80,2 % de réponses correctes (sem. 0,84). La proportion d’essais sans réponse est de 0,6% (sem. 0,08).

En début d’épisode, le taux de réponses correctes est d’environ 5% puis atteint un plateau d’environ 90% au bout d’une vingtaine d’essais (niveau de la chance : 25%).

En début d’épisode, le taux de réponses exploratoires est d’environ 15%, il atteint un pic d’environ 40% après 3 essais puis retourne à 10% (niveau de la chance : 50%).

Ajout de l’information contextuelle. Dans la figure 11.1, on compare les données comportementales de la session d’apprentissage (courbes rouges) avec les données comportementales de la session dite "récurrente" de l’expérience de Donoso, Collins et Kœchlin (courbes bleues) [74]. Dans ces deux sessions, trois combinaisons seulement sont présentées au sujet. Ce qui les différencie est la pré-sence d’information contextuelle dans notre protocole. Cet ajout ne modifie pas les performances asymptotiques : à la fin de l’épisode, les sujets ont appris la combinaison (les deux courbes atteignent la même asymptote). On observe en revanche une différence significative entre les deux courbes pendant environ les dix premiers essais après un changement d’épisode (et donc un changement de contexte). Plus précisément, on peut observer, sur la courbe d’apprentissage de l’expérience sans contexte, un plateau en tout début d’épisode. Ce plateau tra-duit une période de persévération systématique qui est absente dans l’expérience avec contextes. Cette absence de persévération se traduit également par une ex-ploration immédiate que l’on peut observer sur les courbes d’exex-ploration : dès le premier essais de l’épisode, l’exploration est relativement élevée.

Ces résultats confirment que, contexte présent ou non, les sujets sont ca-pables d’apprendre correctement un task-set au sein d’un épisode. Si le contexte apporte un effet, il est logique qu’il soit limité au début de l’épisode, et non à la fin, où la performance asymptotique est atteinte dans tous les cas. Ces données suggèrent ainsi que les sujets utilisent l’information contextuelle a priori pour guider leurs choix.

Effet du changement de contexte. Par ailleurs, si l’on observe le compor-tement des sujets lors d’un changement de contexte au milieu d’un épisode (au 27ème essai), alors que la combinaison n’a pas changé, on observe une légère diminution de la performance (voir flèches noires sur les figures 11.4 et 11.5).

11.2. COMPORTEMENT DES SUJETS 155 2 6 10 14 18 22 0.2 0.4 0.6 0.8 1 2 6 10 14 18 22 0.1 0.2 0.3 0.4 0.5

Proportion d'essais corrects

Proportion d'essais exploratoires

Numéro d'essai après un changement de contingences

Avec contextes (N = 48)

Sans contextes (N = 20)

Numéro d'essai après un changement de contingences

Figure11.1 – Résultats comportementaux pour la session d’apprentis-sage. Comparaison avec l’expérience sans contextes de Donoso, Collins et Kœ-chlin [74]. Les zones ombragées correspondent à l’erreur moyenne standard. La zone grisée correspond aux contingences précédentes.

Ce phénomène suggère un déplacement de l’attention vers le contexte, au détri-ment des performances, et/ou l’existence d’un biais de sensibilité au contexte, autrement dit une tendance à changer de comportement lors d’un changement de contexte (cet effet est traduit par le paramètre de biais de contexte δ du modèle PROBE).

Apprentissage à long terme

La figure 11.2 présente la proportion de réponses correctes par épisode en fonction du numéro d’épisode. On observe une augmentation significative de la performance au cours de la session d’apprentissage, passant d’environ 75% de bonnes réponses à presque 85% de bonnes réponses (r = 0.7, F = 61, p< 5.10−8). Cette évolution traduit un effet d’apprentissage à long terme. Etant donné que cet effet n’est pas observé dans l’expérience sans contextes [53], on peut en dé-duire que, dans notre expérience, les sujets ont appris certaines associations entre les contextes et les combinaisons correspondantes. En fin de session ils peuvent utiliser cette information pour retrouver plus rapidement la combinaison cor-recte.

5 10 15 20 25

0.6

0.7

0.8

0.9

1

Proportion d'essais corrects

Numéro d'épisode

Figure 11.2 – Apprentissage à long terme lors de la session d’appren-tissage.Les barres d’erreur correspondent à l’erreur moyenne standard.

Débriefing

Le débriefing reflète une variabilité comportementale très forte entre les su-jets. Après la session d’apprentissage, ce qu’on perçu les sujets de l’expérience va d’un extrême où ils ont correctement identifié trois combinaisons, six contextes et leurs associations, à l’autre extrême où ils ne se sont pas rendu compte que seul un nombre limité de combinaisons était utilisé ni que les textures en fond d’écran étaient informatives pour l’expérience.

Dans leur étude de 2012, Collins et Kœchlin parviennent à distinguer trois groupes de sujets sur la base des réponses au débriefing : un groupe d’exploiteurs "proactifs" qui ont retenu l’ensemble des associations et utilisent l’information contextuelle a priori pour réutiliser les task-sets appris ; un groupe d’exploiteurs "rétroactifs" qui n’ont pas retenu les associations entre les contextes et les com-binaisons mais sont en mesure de réutiliser les task-sets appris sur la base des renforcements ; et enfin un groupe d’explorateurs qui n’ont observé ni le nombre limité de combinaisons ni l’information portée par les contextes. Ces trois groupes sont également corrélés avec des valeurs de paramètres du modèle PROBE.

Dans le cas de notre expérience, nous avons observé, plutôt que des "caté-gories" de sujets, un continuum de comportements avec toutes les combinaisons possibles. Par conséquent, par la suite, nous n’avons pas effectué d’analyse de groupe sur la base de ce débriefing.

11.2. COMPORTEMENT DES SUJETS 157

11.2.2 Session test

La performance moyenne lors de la session test (les deux sessions d’IRM confondues) s’élève à 64,5% de réponses correctes (sem. 1,16). La proportion d’essais sans réponse est de 2 % (sem. 0,29). La diminution importante des per-formances dans cette session par rapport à la session d’apprentissage peut s’expli-quer d’une part par les changements de conditions expérimentales (expérience sur ordinateur dans le cas de la session d’apprentissage et dans l’IRM dans le cas de la session test), et d’autre part par la complexité accrue de la session test (davantage de combinaisons et de contextes, plusieurs conditions expérimentales).

Performance

Numéro d'essai après un changement de contingences

Proportion d'essais corrects

CombaConta CombaContn CombnConta CombnContn

Exploration

Proportion d'essais exploratoires

0.6 0.7 0.8 0.9 1 ancienne

combinaison combinaisonnouvelle

Taux de r éponses c or rec tes ancien contexte nouveau contexte * * *

Numéro d'essai après un changement de contingences 0.2 0.4 0.6 0.8 1 0.1 0.2 0.3 0.4 0.5 2 2 6 6 10 10 14 14 18 18 22 22 26 26

Figure11.3 – Résultats comportementaux pour la session test. Les zones ombragées et les barres d’erreur correspondent à l’erreur moyenne standard. La zone grisée correspond aux contingences précédentes. * p < 0.05.

D’après le modèles PROBE, les sujets peuvent utiliser deux types de stra-tégies : la récupération ou la création de task-sets, et l’on peut distinguer trois comportements adaptatifs distincts :

- La récupération "proactive", c’est-à-dire la réutilisation de task-sets pré-cédemment appris en association avec leur indice contextuel dès la présentation de cet indice ;

- La récupération "rétroactive", c’est-à-dire la réutilisation de task-sets pré-cédemment appris mais sans l’association avec leur indice contextuel, uniquement sur la base des renforcements reçus.

- L’exploration, c’est-à-dire la création d’un nouveau task-set, quel que soit le contexte, dès la détection d’un changement de contingences.

Ainsi, les quatre conditions de la session test nous permettent de tester la capacité des sujets à réutiliser des task-sets déjà appris ou d’en créer de nouveaux, dans des contextes nouveaux ou anciens. Les résultats obtenus nous permettent de dégager deux effets (voir figure 11.3) :

- Un effet combinaison : la performance est moins bonne dans les conditions où la combinaison est nouvelle (le task-set doit être créé, courbes roses et cyans) que dans les conditions où la combinaison est connue (le task-set peut être réuti-lisé, courbes bleues et vertes). L’exploration est également plus importante dans les conditions où le task-set doit être créé.

- Un effet contexte lors de la réutilisation de task-sets connus : en présence d’un contexte connu, les performances sont meilleures que lorsque le contexte est nouveau.