• Aucun résultat trouvé

Qualité de l’ajustement du modèle sur les données comportementales

11.3 Comportement du modèle PROBE

11.3.1 Qualité de l’ajustement du modèle sur les données comportementales

Session d’apprentissage

Les résultats de l’ajustement du modèle PROBE sur les données comporte-mentales de la session d’apprentissage sont illustrés dans la figure 11.4.

11.3. COMPORTEMENT DU MODÈLE PROBE 159 -3 1 5 9 13 17 21 25 29 33 37 41 45 49 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Performance moyenne

Numéro d'essai après un changement de contingences

Proportion d'essais corrects

Probabilité de sélection de l'action correcte

Sujets Modèle PROBE -3 1 5 9 13 17 21 25 29 33 37 41 45 49 0 0.1 0.2 0.3 0.4 0.5 Exploration

Numéro d'essai après un changement de contingences

Proportion d'essais exploratoires

Probabilité de sélection d'une action exploratoire

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Probabilité de sélection de l'action correcte

Fréquence de sélection de l'action correcte

A

B

C

Figure11.4 – Ajustement du modèle PROBE sur les données comporte-mentales de la session d’apprentissage.Les flèches noires indiquent un chan-gement de contexte au milieu d’un épisode (sans chanchan-gement de contingences). Les zones ombragées et les barres d’erreur correspondent à l’erreur moyenne stan-dard. La zone grisée correspond aux contingences précédentes.

A : Courbes d’apprentissage. Les prédictions du modèle PROBE (courbe bleue) semblent refléter fidèlement le comportement des sujets (courbe rouge). Le modèle rend même compte de la légère baisse de performance lors d’un change-ment de contexte au milieu de l’épisode (27ème essai, flèche noire).

B : Courbes d’exploration. Le modèle PROBE reproduit la forme globale de la courbe d’exploration des sujets. On observe cependant un écart de près de 10% entre les deux courbes : le modèle semble explorer significativement moins que les sujets lors des premiers essais de l’épisode. Ceci peut être expliqué par le phénomène de "réaction d’inhibition" (inhibition of return). Les sujets, lorsqu’ils quittent le task-set courant, inhibent la réutilisation de ce task-set, c’est-à-dire l’ensemble des associations stimulus-réponse qui lui correspondent. Ce qui n’est pas le cas du modèle (cette inhibition n’est pas implémentée). Les sujets auront donc davantage tendance à sélectionner des essais exploratoires que le modèle qui peut continuer à sélectionner des essais considérés comme de la persévération.

Notons que cet effet diminue au cours de la session (non montré). En effet, en début de session, lorsque le modèle entre en exploration, il crée un task-set probe. Ce task-set est initialement uniforme : toutes les actions ont la même probabilité d’être sélectionnées et le modèle contextuel a peu d’influence. En fin d’épisode, l’initialisation d’un probe est biaisée par deux effets :

(i) un effet de fréquence : le probe est initialement plus proche des task-sets qui ont été appris de façon récurrente. Certaines associations stimulus-action sont donc plus probables que d’autres ;

(ii) un effet du contexte : à la fin de a session, les associations entre contexte et combinaison ont pu être apprises ce qui biaise à nouveau le probe vers le task-setcorrespondant au contexte.

C : Graphique probabilités / fréquences. Ce graphique est une autre manière de représenter la qualité de l’ajustement du modèle. On trie les actions correctes en fonction de leur probabilité d’être sélectionnée tel que prédit par le modèle. Puis, pour chaque fenêtre de probabilité, on regarde la fréquence effective de sélection de l’action correcte. Par exemple, pour tous les essais où le modèle prédit que la sélection de l’action correcte est comprise entre 0 et 0.1, on regarde le nombre de fois où, pour ces essais, le sujet a effectivement sélectionné l’action correcte. Ainsi, si les prédictions du modèle sont correctes, les probabilités et les fréquences observées devrait être similaires. Les points de la courbe devraient donc s’aligner sur la diagonale principale, ce que nous observons effectivement.

paramètre α β � τ θ η κ δ

min 0.01 6 0.0001 0.01 -1.35 0.0003 5 0.21

max 0.92 94 0.2 0.49 2.53 1 829 1

moyenne 0.41 52 0.04 0.23 0.81 0.38 146 0.66 erreur standard 0.03 3 0.01 0.02 0.12 0.04 26 0.03 Table11.1 – Valeurs des paramètres du modèle PROBE ajustés sur les données de la session d’apprentissage.

11.3. COMPORTEMENT DU MODÈLE PROBE 161 Session test -3 1 5 9 13 17 21 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Performance moyenne

Numéro d'essai après un changement de contingences

Proportion d'essais corrects

Probabilité de sélection de l'action correcte

-3 1 5 9 13 17 21 25 0 0.1 0.2 0.3 0.4 0.5 Exploration

Numéro d'essai après un changement de contingences

Proportion d'essais exploratoires

Probabilité de sélection d'une action exploratoire

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

Probabilité de sélection de l'action correcte

Fréquence de sélection de l'action correcte

Sujets

Modèle PROBE

A

B

C

Figure11.5 – Ajustement du modèle PROBE sur les données compor-tementales de la session test. Les flèches noires indiquent un changement de contexte au milieu d’un épisode (sans changement de contingences). Les zones ombragées correspondent à l’erreur moyenne standard. La zone grisée correspond aux contingences précédentes.

La figure 11.5 représente les résultats de l’ajustement du modèle PROBE sur les données comportementales de la session test de la même façon que pour la session d’apprentissage.

Notons que l’effet "d’inhibition retour" sur les courbes d’apprentissage est moins fort que pour la session test. Ceci est sans doute lié au fait que la mémoire à long terme n’est pas vierge dès le début de la session ; et au nombre bien plus important de combinaisons et de contextes au cours de cette session.

Par ailleurs, sur la courbe de probabilités / fréquences, on peut observer que les prédictions du modèles semblent moins bonnes pour les probabilités très faibles et les probabilités très élevées. Ceci peut s’expliquer par les différentes conditions expérimentales de la session. Notons dans un premier temps que le modèle est meilleur que les sujets pour retenir et utiliser les associations entre contexte et task-sets, comme nous le verrons par la suite. Par conséquent :

- Dans la condition CombnConta, le modèle prédit une forte probabilité de sélection des actions correspondant au task-set ancien qu’il a associé au contexte ancien. Or ici le task-set est tout autre. Le modèle prédit donc une très faible probabilité de sélection de l’action correcte. Les sujets, quant à eux, sont moins conservateurs et peuvent sélectionner par hasard l’action correcte plus fréquem-ment que ce que prédit le modèle. Cependant, notons que ces cas sont assez rares, ce qui s’illustre d’ailleurs par la grande barre d’erreur du premier point du gra-phique.

- Dans la condition CombaConta, le modèle prédit à nouveau, dès la présen-tation du contexte, une très forte probabilité de sélection des actions correspon-dant au task-set ancien associé, qui, cette fois, est le task-set correct. Le modèle aura donc tendance à sélectionner l’action correcte dès le premier essai de l’épi-sode. Les sujets, en revanche, fournissent plus rarement une réponse correcte dès le premier essai. D’où un dernier point sur la courbe qui paraît être une moins bonne prédiction.

11.3. COMPORTEMENT DU MODÈLE PROBE 163 -3 1 5 9 13 17 21 25 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 SUJETS Performance

Numéro d'essai après un changement de contingences

Proportion d'essais corrects

CombaConta CombaContn CombnConta CombnContn -3 1 5 9 13 17 21 25 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 MODELE Performance

Numéro d'essai après un changement de contingences

Probabilité de sélection de l'action correcte

-3 1 5 9 13 17 21 25 0.1 0.2 0.3 0.4 0.5 Exploration

Numéro d'essai après un changement de contingences

Proportion d'essais exploratoires

-3 1 5 9 13 17 21 25 0.1 0.2 0.3 0.4 0.5 Exploration

Numéro d'essai après un changement de contingences

Probabilité de sélection d'une action exploratoire

Figure 11.6 – Résultat de l’ajustement du modèle PROBE pour les quatre conditions expérimentales de la session test.Les zones ombragées et les barres d’erreur correspondent à l’erreur moyenne standard. La zone grisée correspond aux contingences précédentes.

La figure 11.6 présente les résultats d’ajustement du modèle en dissociant les quatre conditions de la session test. Notons que l’ajustement du modèle a été effectué sur les courbes d’apprentissage moyennes, toutes conditions confondues. Il est donc logique d’observer un bon ajustement sur les courbes moyennes. Ce-pendant, rien ne prédit a priori que ce type d’ajustement permet de reproduire les effets des différentes conditions expérimentales. C’est toutefois ce que nous observons. Ceci permet de justifier de la qualité de l’ajustement du modèle et de sa pertinence.

Notons cependant que le modèle est légèrement meilleur que les sujets dans la condition CombaConta (le taux de réponses correctes lors du premier essai est

de l’ordre de 10% au dessus des sujets). Par ailleurs, sur les courbes d’explora-tion, le pic d’exploration apparait pour le modèle quasiment toujours un essai avant les sujets. Ces observations suggèrent que le modèle est légèrement plus rapide que les sujets. Cet effet peut s’expliquer par les contraintes du protocole expérimental. En effet, lors d’un changement d’épisode, le stimulus du premier essai apparaît en même temps que le changement de contexte. Il est possible que les sujets, contrairement au modèle, ne traitent pas ces deux informations simul-tanément. Il est possible qu’ils privilégient de traiter le stimulus en priorité pour fournir une réponse et prennent en compte le contexte, qui reste affiché tout au long de l’épisode, seulement au bout du deuxième essai ou plus.

paramètre α β � τ θ η κ δ

min 0.06 7 0.0001 0.05 -0.37 0.0003 2 0.13 max 1 92 0.34 0.45 2.34 0.97 352 0.94 moyenne 0.45 58 0.05 0.22 0.91 0.45 43 0.6 erreur standard 0.03 3 0.01 0.01 0.09 0.04 12 0.03 Table11.2 – Valeurs des paramètres du modèle PROBE ajustés sur les données de la session test.