• Aucun résultat trouvé

Chapitre 2. Le processus de lecture et de compréhension de texte

2.3. Compréhension de texte

Si l’on s’intéresse à la compréhension d'un texte, celui-ci doit être envisagé comme une unité de langage à part entière. En effet, une analyse de ses sous segments, par exemple phrase par phrase, serait insuffisante pour capter son sens. De plus, il est aussi nécessaire de prendre en compte les éléments déictiques, c'est à dire de relier le texte à son contexte énonciatif, afin de connaître la pleine mesure du texte (Coirier et al., 1996). Selon Gaonac’h et Fayol (2003), la compréhension de texte est une tâche dynamique, évoluant au fur et à mesure de la lecture. En effet, pour comprendre le texte à un point P, on mobilise la compréhension que l’on avait du texte au point P-1.

Gaonac’h et Fayol (2003) identifient cinq étapes dans le processus de compréhension : l’identification des mots, la reconnaissance du lexique, le traitement morphologique, le traitement syntaxique et l’identification de la structure textuelle. Ces étapes se réfèrent à deux dimensions, une dimension formelle, purement linguistique et une dimension sémantique, qui est situationnelle. C’est cette deuxième dimension que je vais maintenant aborder.

Kintsch (1988) a établi un modèle décrivant le processus de compréhension, nommé modèle de « construction-intégration ». Ce modèle distingue deux niveaux de représentation : le text-base (représentation basée sur le texte) et le situation model (modèle situationnel). Le niveau de représentation basé sur le texte s'appuie sur les informations explicites mentionnées par le texte tandis que le modèle situationnel est construit par l'assemblage des connaissances antérieures du lecteur et des informations du texte (Amadieu, Tricot, & Mariné, 2010). Suivant le modèle situationnel, le lecteur a besoin de connaissances préalables dans le domaine traité pour établir des connexions entre différentes parties du texte et ensuite faire des inférences, pour en déduire des informations supplémentaires.

De plus, le modèle de construction-intégration inclut deux niveaux structurels pour un texte : la microstructure et la macrostructure.

2.3.1. Microstructures et macrostructures

Le texte est un objet structuré, à la fois par les relations internes entre ses constituants et par l’intervention de schémas cognitifs de connaissances, généraux ou spécifiques. Selon le modèle d'organisation sémantique « construction-organisation » de Kintsch (1988), la signification d'un texte peut être décrite à plusieurs niveaux.

Au niveau local, on parle de microstructure. Il s'agit d'un réseau composé de propositions sémantiques, d'arguments et de relations entre ces différents éléments. Selon Coirier et al. (1996), la vitesse de lecture d'un texte est dépendante du nombre de propositions qu'il contient plutôt que de sa longueur. Plus le nombre de propositions est grand plus le temps de lecture sera long. Ce temps est également d'autant plus important que les propositions comportent d'arguments différents.

Pour décrire la signification du texte au niveau global, on parle de macrostructure. Une macrostructure regroupe plusieurs microstructures. Les macrostructures sont obtenues par l’application d’un ensemble de règles à partir des micro-structures, ces règles sont nommées : deletion, strong deletion, generalization et construction. Dans certains cas, une microstructure peut être acceptée telle quelle comme macrostructure du texte, on parle alors de « macrorègle zéro ». Après application des règles de manière récursive on obtient une synthèse du texte (Coirier et al., 1996). Cette théorie de représentation de la structure sémantique d’un texte est particulièrement intéressante dans le cadre du projet LICI car elle fonctionne comme un véritable algorithme de résumé de texte par simplification.

Selon la théorie de Halliday et Hasan, le texte est divisé en deux plans, le plan de la « texture » (les relations définissant la cohésion : pronoms, articles…) et le plan de la « structure » (les relations définissant la cohérence : unités thématiques, paragraphes, épisodes…) (Fulcher, 1989).

D’après Gaonac’h et Fayol (2003), les connaissances préalables des lecteurs ont un effet bénéfique sur leur capacité à traiter l’information, tout comme les capacités à se représenter le temps, l’espace ou encore les relations causales contenus dans le texte favorisent la compréhension. Cependant, ces performances sont limitées par les capacités de la mémoire de travail du lecteur.

La compréhension d’un texte est également dépendante de quatre aspects distincts selon Coirier et al. (1996) :

 Le contexte, social et matériel, c'est à dire l'objectif dans lequel l’énonciateur s'adresse au destinataire du texte ;

Le processus de lecture et de compréhension de texte

 Le type de texte, c'est à dire la forme de réalisation choisie ;

 Les connaissances cognitives extérieures au texte à mettre en œuvre ;

 Les opérations psycholinguistiques de transformation nécessaires pour passer des unités linguistiques lues à des représentations cognitives.

Ce dernier point correspond à un processus cognitif nommé « intégration sémantique ».

2.3.2. Intégration sémantique

L’intégration sémantique d'un texte est le processus de synthèse nécessaire pour passer de l’énoncé littéral à une forme de représentation sémantique de l'information (Coirier et al., 1996). La compréhension d'un texte, plus qu'une analyse linguistique de ses composants, consiste donc à la construction d'une représentation intégrative de la situation élaborée par le texte.

Au cours du parcours d’un texte, le lecteur transforme progressivement les énoncés rencontrés sous forme de phrase en une représentation sémantique. Jarvella (1971) a mis en place une expérimentation afin de comprendre le procédé de transformation des phrases en mémoire au cours de la tâche de la lecture. Il a montré que si l'on stoppe le lecteur à la fin d'une phrase et qu'on lui demande de restituer sous leur forme exacte autant de phrases du texte que possible, il ne peut restituer que la ou les deux dernières phrases qu’il a rencontrées. Les phrases précédentes ont déjà été traitées pour en extraire les informations principales et stockées en mémoire sous forme de schéma. En effet, même si le lecteur ne peut pas les restituer, il est capable de répondre correctement à des questions "vrai ou faux" concernant leurs contenus. De plus, il semble que la vitesse de lecture ralentit à la fin des phrases, de manière à ce que le lecteur puisse réaliser le processus d’intégration sémantique. Celui-ci est également facilité par la rencontre de certaines locutions, comme « next » ou « then ». Certains connecteurs, quant à eux, favorisent au contraire la conservation de l’énoncé sous sa forme littérale (Coirier et al., 1996).

2.3.2.1. Cycles d'intégration

L'intégration se fait, en mémoire de travail, par cycles. Le lecteur construit un graphe contenant les propositions importantes du texte tout au long de la lecture. Pour cela il fait appel à la stratégie du "bord d'attaque", en intégrant, au fur et à mesure, la proposition la plus récemment rencontrée au graphe. Certaines propositions sont conservées en mémoire à long terme. Le lecteur applique une des règles de construction que j'ai listées plus haut aux autres propositions.

De plus, pour établir le graphe du texte, le lecteur fait appel à ses connaissances générales. Il établit des schémas. Ceux-ci sont des représentations cognitives regroupant les informations décrivant un événement, un objet ou une situation. Enfin, le lecteur doit effectuer un certain nombre d'actions nécessaires à la bonne construction du graphe (Coirier et al., 1996) :

 assurer la cohérence du graphe en générant les inférences nécessaires à l'accès aux informations implicites;

 définir les relations qui contribuent à l'organisation structurelle de l'information;  définir le degré d'importance relative de chaque information;

 anticiper la structure ultérieure du texte et reconnaître si le texte est complet.

La génération d’inférences est un point très important de la construction de sens, elle est conditionnée, d'une part, par la bonne récupération des indices textuels utiles, et d'autre part, par la mobilisation des connaissances du lecteur stockées en mémoire à long terme. Un type de schéma, stocké en mémoire, est particulièrement sollicité par les lecteurs : le script.

2.3.2.2. Scripts

Le script est un schéma qui rassemble les connaissances générales sur un événement familier en une séquence d'actions définie. Par exemple, pour l'événement "manger au restaurant", l'ordre et l'importance des actions à accomplir sont connus (demander une table, lire le menu, commander, etc...). Ainsi, lorsque le lecteur rencontre dans le texte un événement pour lequel il possède un script, l’événement est associé à ce script déjà en mémoire à long terme. Cela implique une facilitation de l'intégration en mémoire mais peut également fausser la lecture puisque le lecteur normalise les événements sans tenir compte des intentions de l'auteur.

Tous les scripts connus du lecteur sont organisés dans des structures cognitives, semblables à des ontologies, dans lesquels ils sont liés entre eux par différents types de relation. Ces structures sont appelées MOP (memory organization packets) (Schank, 1999).

2.3.2.3. Superstructures textuelles et composants organisationnels

Une fois construit, le graphe d'un texte forme une superstructure. La superstructure d'un texte peut le représenter de façon séquentielle, avec un cadre, un thème, des complications, une résolution et une évaluation. Elle peut aussi le représenter par composition d'ensembles, chacun étant associé à des règles de réécriture, semblables à celles de la sémantique formelle. Par exemple, pour un article de presse (Coirier et al., 1996) :

 Article = Résumé + Compte Rendu  Résumé = Titre + Introduction

 Compte Rendu = Information + Opinion

Chaque élément pouvant à son tour être décomposé pour retrouver tout le contenu du texte initial.

Parallèlement, les composants organisationnels du texte sont aussi traités. Ils comprennent les coordonnants et subordonnants (et, mais, car, ...), le système anaphorique qui permet de

Le processus de lecture et de compréhension de texte

maintenir la cohésion du texte et la ponctuation qui permet d'établir le degré de distance entre les constituants sémantiques.

Les compétences linguistiques locales nécessaires au traitement des composants organisationnels sont importantes mais ne sont pas jugées déterminantes pour accéder au sens global du texte. De plus, les différences individuelles de performance en compréhension de texte proviendraient plus des différences dans la gestion de l’allocation des ressources que de la maitrise des processus de bas niveau (Coirier et al., 1996).

Evidemment cette remarque ne semble pas tenir dans le cas des lecteurs dyslexiques, probablement parce les processus de bas niveau, comme la tâche de reconnaissance des mots, mobilisent déjà toutes les ressources qui seraient normalement allouées au processus d'intégration sémantique. Or, la gestion de la mémoire de travail a un rôle primordial dans la compréhension de texte : puisque la mémoire est limitée, l'effacement de certaines données est obligatoire pour pouvoir procéder à la suite du traitement. C'est d'ailleurs ce processus d'effacement qui implique une intégration dynamique, par cycles récursifs, de l'information. Ces cycles effectués à l'échelle des propositions provoquent des rétroactions permanentes entre le modèle situationnel établi et les traitements de plus bas niveaux.

En plus de la charge de la mémoire de travail induite par les tâches de reconnaissances et l'intégration sémantique, une autre charge s'ajoute pendant l'exercice de lecture, il s'agit d'une charge métacognitive qui est nécessaire au contrôle et à la régulation des stratégies de compréhension du lecteur (Gaonac’h & Fayol, 2003b). Cette charge métacognitive de régulation des stratégies de compréhension sera sans doute moins importante si les lecteurs sont formés à la compréhension de texte. Un enseignement de la compréhension est possible en rendant explicite certaines étapes du processus, par exemple en repérant la structure du texte, en utilisant des organisateurs graphiques ou sémantiques, en se posant des questions sur le texte, en répondant à des questions sur le texte, en résumant le texte, etc. (Bianco, 2003). Toujours selon Bianco (2003), l'enseignement de la compréhension doit aussi être une formation au traitement des marques linguistiques de cohésion du texte, ce qui inclut les anaphores, les connecteurs et la ponctuation.

Selon Coirier et al. (1996), la charge cognitive induite par l'intégration sémantique peut toutefois être allégée par l’utilisation d’outils explicitant les relations causales, les relations structurelles, le thème du texte, ou encore, grâce à des outils permettant le repérage physique, par une mise en forme particulière, de l’information importante.

2.3.3. Mise en forme et éléments para-

textuels

Parmi les critères entrant en compte dans la facilité de compréhension d’un texte se trouvent la mise en forme et les éléments para-textuels. La mise en forme d'un texte peut être diverse, allant des basiques découpages en paragraphes, jusqu'à une mise en couleur, en passant par l'usage de différentes polices, des majuscules, du gras ou de l'italique. Les éléments para-textuels sont plus divers encore puisqu'il peut s'agir de métadonnées sur le texte ou sur l'auteur, il peut s'agir de références ou de liens hypertextes, ou encore, de figures, tableaux et schémas intégrés dans le corps du texte. La frontière est parfois mal définie entre mise en forme et éléments para-textuels et certains aspects du texte pourront être considérés comme appartenant indifféremment à l'une ou l'autre de ces catégories selon le contexte.

L'auteur d'un texte peut manier la mise en forme et contrôler les éléments para-textuels qu'il fournit afin de faciliter la lecture ou même de modifier le sens du texte. Par exemple, il peut mettre en valeur certains éléments textuels ou ajouter des informations supplémentaires, en dehors du corps du texte, qui réduisent les possibilités d'interprétations de ce dernier. Ce qui est très intéressant concernant ces paramètres c'est que des facilitations de lecture et des modifications du sens peuvent aussi être proposées par les distributeurs du texte (éditeurs, papier ou en ligne). Puis, la mise en forme et les éléments para-textuels peuvent à nouveau être modifiés ou augmentés dans l'interface de travail du lecteur lui-même. Lorsque cette interface est logicielle, elle peut comprendre des outils de transformation du texte avancés ou l'accès à des ressources extérieures (dictionnaires, autres textes, etc...). Lorsque cette interface est physique, le lecteur peut modifier le texte en surlignant des passages, en ajoutant des notes ou en accédant à des aides extérieures pour comprendre le texte, comme d'autres documents ou encore d'autres personnes présentes à ses côtés.

La mise en forme peut jouer un rôle important dans l’augmentation ou la diminution des difficultés de lecture, notamment chez les individus dyslexiques. Je reviendrai sur ce point dans les chapitres suivants et plus particulièrement dans le Chapitre 5.

D'après Dehaene (2007), notre système de traitement du texte est suffisamment entraîné pour ignorer les changements entre lettres minuscules et majuscules. La lecture reste fluide malgré les changements de représentation des lettres, et ce, même lorsque les deux casses sont utilisées aléatoirement dans un même mot. Il en va de même pour les variations de formes telle que l'italique, le gras ou le souligné.

Cependant, si ce n'est pas le cas chez les normo-lecteurs, les dyslexiques peuvent montrer des différences de performances en fonction de ces changements de formes, particulièrement selon la police de caractère, comme nous le verrons dans le point 5.2.4.

Le processus de lecture et de compréhension de texte

Un ensemble de recherches explore l'impact des changements de formes sur la perception des textes. Plutôt que d'utiliser les termes de "mise en forme" ou "éléments para-textuels", ces articles font référence au terme de "signal", en anglais. Les "signaux" sont définis comme une classe d'outils d'écriture qui permettent de mettre en valeur des parties du texte ou l'organisation du texte, sans en modifier le contenu (Lemarié, Lorch Jr., Eyrolle, & Virbel, 2008). Cette caractéristique peut être discutée car, un titre, par exemple est considéré comme un signal. Or, il arrive qu'un auteur donne un ton implicite à son texte grâce au titre, ou encore qu'il choisisse de ne pas répéter explicitement une information, qui était contenue dans le titre, dans le corps du texte.

La notion de signal, en plus d'inclure les éléments de mise en forme que j'ai listés plus haut comprend la présence, à l'intérieur du texte lui-même, d'indices structurels donnés par l'auteur. Par exemple, des expressions telles que "en conclusion" ou encore "évoqués ci- dessus" sont des signaux.

L'usage de "signaux" par l'auteur peut être considéré comme une reconnaissance de la difficulté d'interprétation de son texte par le lecteur. Les signaux sont alors des aides apportés par l'auteur au lecteur. Il semble donc intéressant d'utiliser ce genre de procédés pour aider les lecteurs en difficulté à comprendre des textes qui, dans un premier temps, n'avaient pas été jugés assez difficiles pour que des signaux particuliers leurs soient appliqués. Les principaux enjeux induits par cet usage de signaux vont être :

 ne pas surcharger le texte par trop de signaux (éviter que les signaux ne s'annulent ou deviennent si courants qu'ils sont ignorés)

 ne pas modifier le sens du texte par l'ajout de signaux (en mettant en valeur des éléments que l'auteur ne considère pas importants)