• Aucun résultat trouvé

Les personnes âgées démontrent au test de Stroop un niveau d’interférence souvent plus élevé que celui des jeunes adultes (e.g. Comalli, Wapner & Werner, 1962; Davidson, Zacks &

Williams, 2003; Klein, Ponds, Houx & Jolles, 1997; Panek, Rush & Slade, 1984; Spieler, Balota

& Faust, 1996). L’intérêt pour les variations de l’effet d’interférence avec le vieillissement au test de Stroop est apparu vers le milieu des années 60 avec l’étude princeps de Comalli et collaborateurs (1962). Ces chercheurs ont administré le test de Stroop à des individus âgés de 7 à 80 ans (N = 235). En se fondant sur l’indice d’interférence classique (c.-à-d. différence de temps de réponse entre les items incongruents et les patchs de couleur calculée sur l’ensemble des items présentés), les chercheurs ont constaté que l’interférence couleur-mot totale de leurs 3 sous-groupes des âgés de 17 à 44 ans (48.0 sec; étendue 45.3 à 52.0 sec; n = 48) était plus basse que celle du groupe des âgés de 65 à 80 ans (96.2 sec; n = 15) et des 7 groupes d’enfants de 7 à 13 ans (91.2 sec; étendue 68.1 à 137.8 sec; n = 172). Dès lors, sur la base d’une valeur statistique de Fisher significative pour l’interaction entre niveaux d’âge et types d’items (F (20, 234) = 16.18, p<.01), Comalli et collaborateurs infèrent que le « changement développemental est statistiquement significatif » (p. 50). Enfin, dans leurs conclusions, ils assimilent, dans une visée qualifiée d’« heuristique » (p. 52), aux performances des enfants au test de Stroop, celles de groupe de « schizophrènes » (c.-à-d. selon eux un groupe « développementalement moins mature »), d’individus sous effet du LSD (c.-à-d. comportement « primitif » en lien avec la consommation de cette drogue), et du groupe des 65 à 80 ans. Ces différents groupes sont alors vus comme le reflet d’un état de « régression » du comportement au test en lien avec un manque de « maturité » de l’organisme. Le problème de cette interprétation des résultats, dont le côté très global et normatif peut aujourd’hui prêter à sourire, est que, à un niveau théorique, la seule influence envisagée sur le vieillissement cognitif est celle d’ordre biologique.

Les résultats de cette recherche de Comalli et collaborateurs occupent encore une place

centrale dans la littérature scientifique actuelle où elle est souvent citée comme une démonstration de l’augmentation du niveau d’interférence au Stroop au cours du vieillissement.

Outre sa mention fréquente dans la littérature sur les effets du vieillissement sur l’effet Stroop (Davidson et al., 2003; Graf, Uttl & Tuokko, 1995; Kieley & Hartley, 1997; Kwong See & Ryan, 1995; Li & Bosman, 1996; Salthouse & Meinz, 1995; Spieler et al., 1996; Weir, Bruun & Barber, 1997; West & Baylis, 1998), elle est citée en appui de théories globales du vieillissement cognitif (e.g. Hasher & Zacks, 1988) ou des soubassements cérébraux du déclin cognitif (e.g. West, 1996), dans des encyclopédies sur le vieillissement (e.g. Lustig & Hasher, 2001) ainsi que dans les revues de littérature sur l’effet Stroop (Jensen & Rohwer, 1966; MacLeod, 1991). A titre d’illustration, on mentionnera tout d’abord une étude de West et Baylis (1998) qui se réfère à l’étude de Comalli et collaborateurs (1962) comme une démonstration que l’« interference increased reliably between ages 20 to 80 years » (West & Baylis, 1998, p. 207). De son côté, MacLeod (1991), indique que les effets du vieillissement au test de Stroop sont bien « résumés » (p. 185) par Comalli et collaborateurs dont les résultats sont décrits de la manière suivante: «They saw young children and older adults as having relatively more difficulty in screening out interfering stimuli » (p. 185). Dans ces deux exemples, les chercheurs ne s’appuient pas uniquement sur les résultats de Comalli et collaborateurs mais partagent également leur hypothèse d’une origine essentiellement biologique des différences d’âge. Ainsi, West (1996) considère, dans une revue de question du rôle des soubassements cérébraux (principalement du cortex (pré)frontal) au cours du vieillissement, que les différences d’âge au test de Stroop sont

« presques universelles » (p. 287) et le reflet direct d’un fonctionnement cérébral déficitaire. De son côté, MacLeod (1991) suggère une interprétation biologique de la proximité des performances entre enfants et âgés en rapprochant ces résultats des recherches effectuées sur les différences entre groupes de jumeaux qui indiquent que ceux qui ont le patrimoine génétique le plus proche, à savoir les jumeaux monozygotes ont un niveau d’interférence au Stroop plus similaire que les jumeaux dizygotes. Dès lors, bien que remontant aux années 60, l’étude de Comalli et collaborateurs (1962) mérite un examen critique approfondi puisqu’elle n’est le plus souvent citée, dans les études plus récentes, non pas pour son intérêt historique mais en raison de sa validité empirique et par des chercheurs qui semblent partager une même explication, essentiellement biologique, des différences d’âge (voir à ce propos Hertzog, 1996). De plus, les caractéristiques du dispositif méthodologique utilisé (e.g. situation dans laquelle des données

sont récoltées, nature du test utilisé) sont très proches sur de nombreux points de celles adoptées dans les études plus actuelles. Tout d’abord, l’essentiel de la partie méthode consiste en une description des caractéristiques du test de Stroop utilisées (types d’items utilisés, nombres d’items, etc.) et de la procédure d’administration (instructions et ordre de présentation des blocs d’items). En revanche, seuls l’âge moyen et la taille de l’échantillon sont indiqués. Une brève remarque est par ailleurs faite sur la stratégie de recrutement des personnes âgées « par l’intermédiaire d’un club d’aînés » et des 17 à 44 ans par l’université et un collège du soir.

Aucune mention n’est faite d’autres caractéristiques de l’échantillon testé telles que le niveau d’éducation, l’état de santé ou le genre. Les quelques informations données laissent cependant à penser que les 17 à 44 ans étaient le groupe avec le plus haut niveau d’éducation. Or, cette variable est très influencée par le milieu, qui n’est pas pris en compte. Deuxièmement, seul le pattern moyen est décrit et aucune indication n’est donnée, dans le tableau descriptif des résultats, sur la variance des performances au sein de chaque groupe d’âge (par exemple écart-type). La seule mention relative à cette question se trouve dans une note de bas de page qui indique la présence d’une « hétérogénéité » (p. 50) des variances entre les différents groupes d’âge. Par exemple, les tableaux de description des résultats ne comportent que des temps de réponse moyens sans mention des déviations standards.

Au total, le dispositif expérimental utilisé ne permet pas la contradiction puisque seules les propriétés du test de Stroop sont décrites de manière précise alors que les caractéristiques des populations étudiées et/ou du milieu (e.g. éducation, catégorie socioprofessionnelle, etc.) ne sont pratiquement pas évoquées. Dès lors, en l’absence de toutes autres informations permettant d’examiner la nature des différences de groupes constatées, celles-ci sont attribuées à l’effet de facteurs biologiques dont l’influence est présupposée et ne peut être falsifiée (pour une discussion à ce propos voir Chalmers, 1987). Les problèmes liés aux comparaisons transversales entre groupes d’âge étaient pourtant déjà connus dans la littérature psychologique sur le vieillissement de l’époque et ont été régulièrement évoqués depuis (Baltes et al., 1980; Birren, 1960; Birren, Cunningham & Yamamoto, 1983; Botwinick, 1970; Schaie, 1988b; Shock, 1951).

Shock (1951) mentionnait, par exemple, déjà les difficultés liées à l’échantillonnage dans la première revue de littérature psychologique sur le vieillissement: « It is of considerable importance that the characteristics of the population, used be described in such terms that it can be precisely identified » (p. 366). Comme le souligne également Schaie (1988b), une description

détaillée de l’échantillon permet d’éviter d’attribuer à des changements dans la maturation des différences liées aux caractéristiques démographiques de l’échantillon ou à des effets de cohorte (voir aussi Baltes et al., 1980; Birren et al., 1983; Botvinick, 1970). Dès lors, comment expliquer que la validité de la recherche de Comalli et collaborateurs ait été si facilement acceptée et que cette étude soit aussi abondamment citée ? A notre sens, les biais et limites de l’étude sont considérés comme minimes au regard de son résultat principal, à savoir le niveau d’interférence plus élevé des âgés, qui confirme les attentes de déclin de beaucoup de chercheurs (voir Hertzog, 1996; Schaie, 1988a; Schaie, 1993).

A la suite de cette étude princeps, seuls quelques chercheurs ont examinés les différences d’âge dans le niveau d’interférence au Stroop. Par exemple, Panek et collaborateurs (1984) ont repris le même matériel de test de Comalli et collaborateurs. Ils retrouvent un niveau d’interférence supérieur des âgés relativement aux jeunes. Leur étude se distingue cependant par sa mise en évidence de différences qualitatives de traitement de l’information entre jeunes et âgés et par son plus grand intérêt pour les caractéristiques de l’échantillon (c.-à-d. genre, état de santé). Malgré cela, les jeunes étaient tous recrutés par l’intermédiaire d’un cours de psychologie et l’on peut supposer que leur niveau de formation était plus élevé que celui des âgés. Il faudra attendre les années 90 pour que l’intérêt d’une étude sur le vieillissement à l’aide du test Stroop soit renouvelé grâce à l’impact de la théorie sur le vieillissement cognitif de Hasher et Zacks (1988). L’existence d’un niveau d’interférence plus important chez les personnes âgées relativement aux jeunes adultes a alors été confirmée avec différentes versions du test (papier/crayon, informatisée avec une réponse manuelle ou vocale). Cependant, bien que le pattern général reste similaire, les études réalisées montrent que l’ampleur des différences d’âge varie selon le type de tâche. Ainsi, la version papier/crayon (le plus souvent administrée par une présentation des conditions par « bloc » d’items du même type) (e.g. Comalli et al., 1962;

Salthouse & Meinz, 1995), souvent utilisée dans les bilans cliniques et pour laquelle un temps total par blocs d’items est mesuré, montre une différence d’âge plus importante que la présentation informatisée et séquentielle (e.g. Spieler et al., 1996) qui permet d’obtenir un temps de réponse item par item (Ludwig, Borella, Tettamanti & de Ribaupierre, soumis; Verhaeghen &

de Meersman, 1998). Des études se sont ainsi directement intéressées à l’influence des caractéristiques du test de Stroop sur l’ampleur des différences d’âge (Borella, Delaloye, Lecerf, Renaud & de Ribaupierre, 2009; de Ribaupierre, Atzeni, Fagot, Jouffray, Lecerf & Ludwig,

2004; Hartley, 1993; West, 2004; West & Baylis, 1998).

West et Baylis (1998) ont, par exemple, modifié la proportion des items incongruents et ils ont observé: (a) un effet Stroop similaire pour les adultes jeunes et les âgés quand une faible proportion d’items incongruents était présentée dans la tâche et (b) un effet Stroop plus important pour les adultes âgés, relativement aux jeunes, quand la majorité des items étaient incongruents (West, 2004; West & Baylis, 1998). Ces résultats sont interprétés comme reflétant des différences dans les caractéristiques de la tâche (« task context ») qui ne sollicite pas de la même manière l’attention nécessaire à la dénomination de couleur. Celle-ci serait davantage sollicitée lorsque les items incongruents sont les plus nombreux. West et Baylis (1998) interprètent ces résultats comme le reflet d’une difficulté des adultes âgés à maintenir une stratégie de dénomination de couleur lorsqu’ils sont confronté à une tâche (« task context ») qui demande l’« adoption rigoureuse » (« strict adoption ») (p. 214) de cette stratégie afin d’avoir de bonnes performances dans la tâche. Sur la base des travaux de Kane et Engle (2003), avec les jeunes adultes, on s’attendrait cependant à ce que la version du test avec le plus d’items incongruents soit celle qui présente la différence d’âge la moins marquée. Malgré une interprétation discutable, ces résultats ont comme intérêt de montrer une variation de la taille des différences d’âge en fonction des caractéristiques de la tâche et du niveau de ressources attentionnelles nécessaires à son traitement (voir aussi Kramer, Humphrey, Larish, Logan & Strayer, 1994).

Des recherches complémentaires mettent en évidence d’autres sources de différences dans les performances des jeunes et des âgés au test de Stroop. Ces études montrent ainsi, que les profils d’apprentissage sont relativement similaires entre jeunes et âgés (Bürki, Dirk, Fagot, Ludwig & de Ribaupierre, 2008; Davidson et al., 2003; Dulaney & Rogers, 1994). Dulaney et Rogers (1994) notent cependant que les jeunes et les âgés diffèrent dans les stratégies qui sous-tendent cette réduction. Ils interprètent leurs résultats comme un effet de l’entraînement qui a favorisé chez les jeunes adultes une stratégie de « suppression de la lecture »16 des mots qui n’était pas présente chez les adultes âgés. Rush et collaborateurs (Rush, Panek & Russell, 1987;

1990; voir aussi Klein et al., 1997) ont par ailleurs montré que les personnes les plus âgées répondaient de manière plus précautionneuse au test de Stroop (précision favorisée aux dépens de

16 Dans leur article, les auteurs ne distinguent pas clairement les stratégies de suppression ou d’inhibition de la lecture. On peut ainsi se demander si les participants jeunes suppriment la mise en place de la lecture ou la représention du mot activée par la lecture (voir à ce propos Long & Pratt, 2002). L’inclusion d’une condition d’amorçage négatif au Stroop peut donner une indication sur la stratégie mise en place. En effet, la présence d’un effet d’amorçage négatif permet d’exclure une interprétation en termes de suppression de la lecture.

la vitesse). Ces deux études suggèrent donc que le plus fort niveau d’interférence des personnes âgées comparativement aux jeunes pourrait être en partie lié à des différences qualitatives dans la manière de répondre au test (voir aussi Botwinick, 1966; Schaie, 1974).

Dans l’ensemble, les études que nous venons de présenter montrent la présence d’une variabilité dans l’ampleur des différences d’âge selon les caractéristiques du test. D’autres recherches ont commencé à remettre en question l’idée même d’un niveau d’interférence plus élevé chez les personnes âgées au test de Stroop (Borella et al., 2009; de Ribaupierre et al., 2004;

Salthouse & Meinz, 1995; Verhaeghen & de Meersman, 1998). Salthouse et Meinz (1995) ont par exemple exploré les liens entre le niveau d’interférence au test de Stroop, la capacité en mémoire de travail et la vitesse de traitement. Ces chercheurs ont montré qu’une plus grande part de variance liée à l’âge dans l’interférence couleur-mot au test de Stroop était partagée avec la capacité en mémoire de travail et la vitesse de traitement. Ils trouvent en particulier que la variance liée à l’âge sur le niveau d’interférence couleur-mot est considérablement mais pas entièrement réduite lorsqu’un contrôle de la vitesse de traitement est effectué. Cette étude remet donc en question l’idée d’une différence entre jeunes et âgés spécifiquement liée au niveau d’interférence. Les différences mises en évidence dans les études sont alors vues comme le reflet de différences plus globales dans la vitesse de traitement des jeunes et des âgés. Deux critiques peuvent cependant être adressées à la démarche adoptée par cette étude. Une première critique tient à la centration exclusive de Salthouse sur les différences quantitatives entre jeunes et âgés et à son absence de considération pour les différences de stratégies de traitement. Par exemple, les erreurs commises au Stroop sont uniquement considérées, de manière indirecte, par leur effet de ralentissement des temps de réponse17. Ainsi, en accord avec l’accent exclusif mis par Salthouse sur la vitesse de traitement, seule cette dimension est considérée. Comme déjà mentionné, certaines études suggèrent (e.g. Rush et al., 1987), par exemple, que les personnes les plus âgées pourraient avoir une stratégie de traitement des items du Stroop plus précautionneuse, différente de celle des jeunes (voir aussi Ratcliff, Spieler & Gail, 2000). Une deuxième critique, plus centrale, porte sur la mise en place par Salthouse d’un dispositif de recherche qui favorise in fine une interprétation biologique des différences d’âge constatées et ne considère pas les explications alternatives de nature sociocontextuelles. Ainsi, dans cette étude de nombreux tests cognitifs,

17 Salthouse et Meinz (1995) indiquent que leurs participants ont fait peu d’erreurs mais ne donnent pas d’indications précises ou chiffrées à ce sujet. Le temps total de réponse calculé au Stroop n’est donc pas « pur » puisque les temps de réponse associés à des erreurs de dénomination de la couleur sont également pris en considération.

conçus comme des indicateurs du déclin biologique (voir Salthouse, 1996), sont administrés deux fois par souci de précision. Dans un même temps, l’influence possible de variables sociocontextuelles est presque absente et se limite au contrôle du niveau d’éducation et du genre.

Cela avec comme seul objectif de rendre possible la comparaison des performances entre les groupes d’âge. L’influence potentielle des facteurs sociaux n’est en revanche pas prise en compte dans l’analyse des résultats. En effet, Salthouse et Meinz (1995) mentionnent, par exemple, dans leur description des résultats, la présence d’un effet d’interaction entre le niveau d’éducation et l’âge sur une des mesures cognitives utilisées mais cette information n’est pas discutée. L’effet principal du niveau d’éducation sur pratiquement toutes les mesures cognitives administrées n’est pas davantage exploré. Ainsi, bien que techniquement plus sophistiquée, la démarche de Salthouse et Meinz est similaire à celle de l’étude princeps de Comalli et collaborateurs dans son insistance sur les origines biologiques des différences d’âge et son absence de prise en compte de l’influences de facteurs sociocontextuels, dont l’importance est pourtant soulignée (e.g. Salthouse

& Craik 2000). Dès lors, comme Comalli et collaborateurs, les différences d’âge constatées à l’aide de ce type de dispositif expérimental de recherche se voient attribuées in fine par Salthouse (e.g. Salthouse, 2004) à une origine biologique dont l’influence est présupposée.

Cette même période voit en 1998, la publication par Verhaeghen et de Meersman d’une méta-analyse de 19 études réalisées sur les différences d’âge au test de Stroop dont les résultats ne manquent pas d’étonner. L’objectif des chercheurs est double: premièrement de réaliser une méta-analyse des études publiées sur les différences entre jeunes et âgés sur le niveau d’interférence au test de Stroop (évalué à l’aide d’une différence moyenne standardisée entre une ligne de base et la condition interférente). Un second objectif est d’étudier, à l’aide d’analyses de Brinley, si un facteur général unique (c.-à-d. ralentissement généralisé) suffit à décrire la relation entre la performance des jeunes et des âgés en ligne de base et en condition interférente au test de Stroop. Les résultats ont montré que les groupes d’âgés et de jeunes ne se distinguaient pas, de manière statistiquement significative, sur l’effet d’interférence moyen calculé sur l’ensemble des études pour chaque groupe d’âge (c.-à-d. mesure de la taille d’effet = (condition interférente - ligne de base)/ deviation standardpooled). Ce qui permet à ces chercheurs de conclure de manière très radicale: « The main result from this analysis is obvious: The interference effect in the Stroop task appears not to be age sensitive » (p. 124).

Ces résultats, très provocants, qui s’opposaient aux interprétations généralement faites des

différences d’âge au test de Stroop, étaient d’autant plus surprenants que chacune des études incluses dans la méta-analyse, prise individuellement, avait montré une différence significative d’interférence entre jeunes et âgés. Cet apparent paradoxe se comprend au vu du niveau de l’hétérogénéité constatée (c.-à-d. mesurée par une statistique Q de Hedges et Holkin, 1985 cités par Verhaeghen et de Meersman, 1998) dans les performances de deux groupes d’âge au travers des différentes études. De ce fait, la valeur moyenne caculée pour l’interférence n’est pas un bon reflet des résultats de l’ensemble des études. Les tests de l’hétérogénéité suggèrent même (c.-à-d.

valeur de la statistique Q bien plus élevée pour les âgés) que la variance entre études est plus importance pour les âgés comparativement aux jeunes. A titre d’illustration, on peut mentionner le fait que l’étendue des temps dans la condition incongruente va de 707 à 2043 ms pour les âgés et de 657 à 1052 ms pour les jeunes. Afin d’expliquer cette très forte variabilité entre études, Verhaeghen et de Meersman (1998) invoquent exclusivement des raisons liées aux caractéristiques des tests utilisés et identifient trois variables modératrices; à savoir la condition contrôle utilisée (patchs de couleur vs mots neutres colorés ou symboles colorés), le mode de présentation des items (un par un vs en blocs d’items) ou la version du test (papier/crayon vs informatisée). Ils trouvent un effet principal de ces variables. Ainsi, les patchs de couleur produisaient un effet Stroop plus large que les autres types de condition contrôle, la présentation en bloc montrait un effet plus large que la présentation item par item, la présentation papier/crayon donnait lieu à un effet Stroop plus élevé que la présentation informatisée. Ces

valeur de la statistique Q bien plus élevée pour les âgés) que la variance entre études est plus importance pour les âgés comparativement aux jeunes. A titre d’illustration, on peut mentionner le fait que l’étendue des temps dans la condition incongruente va de 707 à 2043 ms pour les âgés et de 657 à 1052 ms pour les jeunes. Afin d’expliquer cette très forte variabilité entre études, Verhaeghen et de Meersman (1998) invoquent exclusivement des raisons liées aux caractéristiques des tests utilisés et identifient trois variables modératrices; à savoir la condition contrôle utilisée (patchs de couleur vs mots neutres colorés ou symboles colorés), le mode de présentation des items (un par un vs en blocs d’items) ou la version du test (papier/crayon vs informatisée). Ils trouvent un effet principal de ces variables. Ainsi, les patchs de couleur produisaient un effet Stroop plus large que les autres types de condition contrôle, la présentation en bloc montrait un effet plus large que la présentation item par item, la présentation papier/crayon donnait lieu à un effet Stroop plus élevé que la présentation informatisée. Ces