• Aucun résultat trouvé

Passage d’un niveau à l’autre de traitement et chunking : le modèle Chunk-

1.5. Processus automatiques et processus attentionnels

1.5.4. Passage d’un niveau à l’autre de traitement et chunking : le modèle Chunk-

Chunk-and-Pass

Nous voudrions terminer ce chapitre par la présentation d’un modèle de compréhension du langage qui tente d’expliquer la rapidité des processus en jeu que nous avons déjà soulignée

dans les paragraphes sur l’automatisation. Ce modèle est décrit dans un article de 2016 (Christiansen & Chater, 2016), The Now-or-Never bottleneck: A fundamental constraint on

language. L’entonnoir (bottleneck) dont il est question dans le titre est la difficulté qu’a notre

cerveau à traiter plus d’une poignée d’éléments à la fois (7±2 selon Miller, 1956, ou 4±1 selon Cowan, 2010), du fait de la capacité limitée de notre mémoire de travail. Pour expliquer le fonctionnement du modèle, Christiansen et Chater font le parallèle avec les techniques de mémorisation de longues suites de chiffres et donnent l’exemple du sujet S.F., étudié par Ericsson et al (1980). Au début de l’expérience, S.F., qui ne connaît aucune technique de mémorisation, échoue à mémoriser des suites de plus de 7 chiffres. Il apprend ensuite à grouper les chiffres par groupes de 3 ou 4, et peut alors mémoriser au moins 16 chiffres (en première approximation, 3 groupes de 4 chiffres et 4 chiffres isolés). Il arrive ensuite petit à petit à former des « super-groupes » de 3 ou 4 groupes, puis à structurer ces super-groupes, de sorte qu’il arrive à la fin de l’expérience (qui dure environ 230 heures sur un an et demi) à mémoriser près de 80 chiffres qui lui sont lus à haute voix à raison de 1 chiffre par seconde. Christiansen et Chater font l’hypothèse que les locuteurs font la même chose pour le langage et appellent leur modèle Chunk-and-Pass : dès qu’un ou plusieurs phonèmes (ou syllabes) sont reconnus dans le flux acoustique, ils sont regroupés (chunked) et passent au niveau supérieur (celui des groupements phonologiques). Dès qu’une suite de phonèmes ou syllabes est reconnue comme un mot, elle est regroupée et passe au niveau lexical, et dès qu’un groupe de mots est reconnu, il passe au niveau phrastique, et ainsi de suite. Cette capacité du cerveau à grouper des éléments pour créer des unités plus grandes qui permettent in fine de mémoriser plus d’éléments de base n’est pas une découverte récente : Ellis (2003) rappelle que le terme de chunk vient de l’article fondateur de George Miller (1956), The magical number seven plus

or minus two: some limits on our capacity for processing information. Dans cet article, Miller

montre que la limite de 7 éléments qui peuvent être conservés en mémoire de travail peut être levée à condition de « regrouper » ces éléments en suites d’éléments qui contiennent plus d’information. Ce regroupement (chunking) donne lieu naturellement à une organisation hiérarchisée :

[A] chunk is a unit of memory organization, formed by bringing together a set of already formed elements […] in memory and welding them together into a larger unit. Chunking implies the ability to build up such structures recursively, thus leading to a hierarchical organization of memory. (Newell 1990, p.7, cité par N. C. Ellis, 2003, p.

L’intérêt de ce recodage constant des niveaux inférieurs aux niveaux supérieurs est triple. Premièrement, il permet de limiter l’interférence entre les éléments déjà entendus (les phonèmes, par exemple) et ceux qui continuent à arriver à une vitesse soutenue (jusqu’à 20 phonèmes par seconde, cf. section 1.1.1). Si les groupes de phonèmes sont regroupés et passés au niveau lexical au fur et à mesure de leur reconnaissance, cela permet de libérer de l’attention pour traiter les nouveaux phonèmes qui arrivent. La nécessité de faire face à ce flux constant « oblige » en quelque sorte à adopter cette organisation hiérarchique. Deuxièmement, cela explique comment peut fonctionner l’analyse en parallèle des différents niveaux de traitement décrite plus haut : l’intégration des informations phonémiques, lexicales, syntaxiques, etc. se fait dès que ces informations sont disponibles, et le traitement d’une phrase ou d’un texte se produit par incréments successifs (et non une fois seulement que toutes les informations sont disponibles). Loin de compliquer les choses, cette analyse en cascade à différents niveaux est une façon de faire face à l’afflux constant de données acoustiques. Troisièmement, le regroupement d’unités permet d’expliquer en partie les variations individuelles en compréhension. La taille des groupes ainsi formés dépend en effet de l’expérience des sujets, dans la mesure où les unités fréquemment entendues ensemble ont plus tendance à être regroupées. Les auditeurs avec plus d’expérience auront donc tendance à utiliser de plus grands regroupements. McCauley et Christiansen (2015) ont d’ailleurs montré, avec des sujets adultes, que la capacité à regrouper était corrélée avec la compréhension de phrases complexes, et Jones (2012) a utilisé une modélisation informatique de données d’acquisition pour montrer que la capacité à regrouper (liée à l’exposition répétée) permettait d’expliquer ces données chez de jeunes enfants. Hilton (2009, p. 104) souligne d’ailleurs le lien entre ce processus de regroupement et la théorie des instances de Logan (1988), que nous avons déjà citée à propos de l’automatisation, et où les chunks sont récupérés directement en mémoire au lieu d’être décomposés à chaque fois.

Nous reproduisons en Figure 1.5 une représentation graphique du fonctionnement de ce modèle. On y retrouve l’organisation hiérarchique en niveaux successifs correspondant à des unités linguistiques de plus en plus grandes. La partie noircie de chacun des niveaux correspond à la fenêtre temporelle active à un instant donné : même si le nombre d’unités disponibles en mémoire de travail à chaque instant est sensiblement le même quel que soit le niveau, le fait que les unités soient plus grandes aux niveaux supérieurs implique qu’elles couvrent également une durée plus longue. Ceci correspond d’ailleurs aux résultats en imagerie cérébrale (Lerner et al., 2011), selon lesquels les fenêtres temporelles auxquelles les

zones corticales sont sensibles augmentent progressivement, depuis les zones qui réagissent aux premières informations sensorielles (moins d’une seconde) jusqu’aux zones qui répondent à l’écoute d’un paragraphe ou d’une histoire complète (de l’ordre d’une minute et plus).

Figure 1.5 - modèle Chunk and Pass d’après Christiansen et al. (2016), représentant l’organisation hiérarchique du traitement linguistique, dans laquelle les unités linguistiques reconnues sont regroupées en unités de plus en plus grandes et de plus en plus abstraites, depuis le flux acoustique jusqu’au modèle de discours. La partie noircie de chacun des niveaux correspond à la fenêtre temporelle active à l’instant t, qui est de plus en plus étendue à mesure

qu’on s’élève dans les niveaux. La partie droite du modèle montre que le système utilise ses connaissances linguistiques et extralinguistiques pour émettre des prédictions qui aident à traiter le flux entrant qui continue à

arriver (le terme « Production » est grisé car cette partie du modèle ne nous concerne pas directement).

Ce modèle permet ainsi d’intégrer de nombreux résultats que nous avons décrits précédemment. Tout d’abord, nous y retrouvons l’organisation hiérarchique du traitement linguistique déjà présenté avec les modèles d’Anderson (1995) et surtout de Cutler et Clifton (1999). Seuls trois niveaux sont illustrés sur la représentation graphique du modèle, mais Christiansen et Chater se disent « agnostiques » (p.7) quant au nombre de niveaux effectivement utilisés. Ensuite, nous retrouvons l’idée que les informations sont traitées dès qu’elles sont disponibles, au fur et à mesure de leur arrivée - c’est d’ailleurs justement ce qui motive l’organisation hiérarchique. Par ailleurs, le processus de regroupement d’unités d’un niveau à l’autre entraîne une perte de certaines informations de détail du niveau inférieur (ce que Christiansen et Chater appellent lossy chunking, ou « regroupement avec perte d’informations »), ce qui explique par exemple qu’après avoir compris un discours (niveau du

modèle de situation), nous nous souvenons de son sens mais pas des mots exacts entendus (niveaux lexical ou syntaxique). Enfin, le rôle des prédictions est essentiel, parce qu’elles permettent un traitement beaucoup plus rapide de l’information qui continue à arriver. Le modèle illustre les phénomènes que nous avons décrits dans les sections précédentes : les prédictions ont lieu à tous les niveaux de traitement7, du signal acoustique (prédictions sur le très court terme) jusqu’au niveau textuel (prédictions sur le long terme). Nous avons donc ajouté au modèle Pass-and-Chunk original une bulle (en haut à droite) pour préciser que les prédictions pouvaient être d’origine linguistique ou extralinguistique (visuelle, culturelle, encyclopédique, etc.).