• Aucun résultat trouvé

La relation de causalité dans une approche multidimensionnelle de la compréhension de textes

Le premier chapitre présentait les principaux problèmes et approches concernant la définition de la causalité. Son but était de fournir au lecteur un contexte théorique suffisant pour comprendre et situer les approches de la causalité présentées dans le présent chapitre. Nous abordons ici la causalité sous l’angle de son rôle dans la compréhension de textes. La première partie du chapitre définit le champ de la compréhension de textes et présente les principales notions du domaine. Le modèle de situation est défini comme une représentation structurée faisant à la fois figure de produit et d’instrument de la compréhension de texte. Les dimensions de sa cohérence sont présentées. La question de leur représentation est abordée par la confrontation entre deux théories distinctes de la compréhension, à savoir le modèle d’indexation d’événements de Rolf Zwaan, et le modèle Construction-Intégration de Walter Kintsch. Au sujet du premier, on examine la question des unités et du format de la représentation des dimensions ; au sujet du second, on discute de la possibilité et de l’intelligibilité de la représentation des informations liées aux dimensions. L’analyse du modèle de Kintsch indique que la puissance expressive du modèle est en général sous-utilisée, du fait d’une difficulté de caractérisation des corrélats psychologiques aux paramètres mathématiques du modèle. Il est proposé une vue du modèle d’indexation qui le caractérise comme une recherche des dimensions par lesquelles le modèle de situation est une

représentation analogique. Dans la troisième partie du chapitre, le rôle des connexions causales dans le modèle de situation est étudié plus en détail. Nous décrivons en quoi la causalité est une dimension structurant le modèle de situation. Les principales données du traitement en ligne de la causalité sont présentées, puis finalement situées dans une classification qui permet de les mettre en rapport avec les approches philosophiques présentées au chapitre 1, et avec les hypothèses relatives au format des représentations.

II - 1 Compréhension, cohérence, et modèle de situation

Comprendre un texte, c’est en élaborer une représentation mentale cohérente. La mise en mémoire de cette représentation peut servir de nombreux buts : se rappeler, répéter, transmette, résumer, ou encore critiquer son contenu. Dans cette partie du chapitre, nous allons montrer que les représentations mentales du texte sont des entités structurées (cohérentes), et qu’il existe plusieurs niveaux de représentation. Nous mettrons notamment l’accent sur la notion de modèle de situation, qui est la représentation de la situation à laquelle réfère le texte, plutôt que la représentation de sa structure formelle ou de son contenu sémantique immédiat. Nous passerons finalement rapidement en revue les différents facteurs susceptibles d’influer sur le niveau et la qualité du modèle de situation. Il existe en effet plusieurs niveaux de compréhension, correspondant à des niveaux et degrés d’élaboration variables de la représentation du contenu d’un texte.

II - 1.1 Définition de la cohérence textuelle

Les linguistes définissent le texte (mot formé à partir du latin textere, « tramer », ou « entrelacer ») comme une « chaîne linguistique écrite ou parlée formant une unité communicationnelle » (Ducrot & Schaeffer, 1995, p.494). Le texte est une unité sémantique, et non une unité de forme, comme le sont la phrase ou le syntagme (Halliday & Hasan, 1994/1976). Le contrat implicite entre l’auteur et le lecteur est que les unités dont le texte est composé entretiennent des liens sémantiques. Les relations de cohérence entre phrases réalisent l’unité du texte (van Dijk, 1977). Une définition suffisamment exigeante de la compréhension d’un texte implique donc non seulement la représentation du sens individuel

de ses unités, mais aussi la représentation des relations de cohérence, celles qui font du texte un tout pertinent. C’est cette exigence qui conduit de nombreux auteurs à envisager la compréhension de textes comme une activité de résolution de problème : le problème à résoudre est d’établir les liens de cohérence entre les différentes unités du texte, en général les épisodes décrits par ses phrases (e.g. Black & Bower, 1980 ; Trabasso & Van den Broek, 1985; Fletcher & Bloom, 1988 ; Graesser, Singer & Trabasso, 1994 ; Trabasso & Magliano, 1996 ; Noordman & Vonk, 1998 ; Tapiero, 2000 ). La recherche de la nature et des types de relations de cohérence, de leurs relations hiérarchiques, de leur maintien en mémoire, et l’étude des processus par lesquels nous établissons la cohérence en lisant sont des questions fondamentales de la recherche sur la compréhension de textes. Avant de présenter les principales notions du domaine, nous allons d’abord illustrer ici par un exemple en quoi la compréhension est une tâche d’établissement de la cohérence. Puis nous préciserons la distinction entre cohérence et cohésion. Considérons la séquence de phrases suivante :

(1) Pierre versa son café dans sa tasse. (2) Machinalement, il y versa du lait. (3) Puis il a ajouta du sel au mélange. (4) Mathilde pouffa de rire.

S’il faut lire cette séquence de phrases comme un texte, et en élaborer une représentation unifiée, il est nécessaire d’identifier de nombreuses relations de cohérence. Nous en indiquons ici quelques unes.

(a) Dans (2), « Il » réfère à Pierre (mentionné dans (1)).

(b) Dans (2), l’adverbe de lieu « y » renvoie à la tasse de café de (1). (c) Dans (3) « Il » réfère à Pierre (mentionné dans (1)).

(d) Dans (3), « le mélange » désigne le café au lait.

(e) Dans (4), Mathilde est témoin de la scène décrite dans les trois phrases précédentes, et elle rit de l’étourderie de Pierre.

Les relations (a), (b), et (c) sont des relations de coréférence (les deux phrases partagent un même référent, Pierre et/ou la tasse). Ces trois relations sont signalées par la présence de marqueurs linguistiques de l’anaphore à résoudre (le pronom personnel ou l’adverbe de lieu). La relation (d) est aussi une relation de coréférence, mais elle n’est pas marquée syntaxiquement : c’est le sens du nom « mélange », et non sa fonction syntaxique qui nous indique que le mélange dont il s’agit est le café au lait (la cohérence aurait été différente si l’on avait substitué « ragoût » à « mélange »). Aucun élément du texte n’explicite la nature de la relation (e). La phrase (4) ne partage aucun référent ni aucun prédicat avec les phrases qui la précèdent. Pour établir la cohérence, il faut à la fois avoir une représentation de l’ensemble de la situation (Pierre mal réveillé, Mathilde présente qui le voit verser le sel), et recourir à des connaissances du monde (le café salé est infect, Mathilde pouffe sans doute en imaginant la tête de Pierre quand il y goûtera).

Cet exemple vise à illustrer trois faits relatifs à la cohérence. Le premier est que lorsque nous comprenons un texte, nous devons recourir à des élaborations pour établir des liens entre ses parties (ex. (a) ), en puisant parfois dans nos connaissances pour établir ces liens parfois complexes (ex. (e) ). C’est ce travail de mise en relation en vue d’établir la cohérence que l’on appelle inférence. Le second point est que certaines relations de cohérence sont signalées par des moyens linguistiques (ici, les relations (a), (b), et (c)), alors que d’autres ne le sont pas. Enfin, la cohérence ne se limite pas à la coréférence (relation (e)) : elle repose parfois sur une appréhension globale de la situation décrite par le texte. Avant de revenir plus en détail sur la causalité comme dimension de la cohérence de la représentation mentale du texte, nous présenterons la notion de modèle de situation et ses principaux modèles. Apportons ici deux précisions terminologiques. Le mot « inférence » peut désigner soit le processus d’établissement du lien, soit l’information qui fait le pont entre deux éléments du texte (par exemple, « Pierre va faire une drôle de tête »), ou encore l’information qu’il y a un lien entre les deux éléments du texte (le lien entre les deux est direct). Suivant Campion & Rossi (1999), nous réserverons le mot « inférence » à l’information faisant lien, et « production d’inférence », ou « élaboration d’inférence » au processus d’élaboration associé. D’autre part, on réserve en général le mot « cohésion » aux cohérences marquées linguistiquement, tandis que le mot « cohérence » désigne la catégorie plus générale des relations sémantiques entre phrases (van Dijk, 1977). Le terme d’explication est parfois utilisé pour désigner la mise en relation de l’information entrante avec des informations antérieures du texte (e.g. Trabasso & Magliano, 1996). Campion & Rossi (1999) qualifient ces inférences

de rétrogrades, par opposition aux inférences antérogrades, qui sont les élaborations prédictives. D’autres auteurs (e.g. Van den Broek, Lorch, Linderholm & Gustafson, 2001) utilisent le terme « explication » pour désigner la mise en relation de l’information entrante avec les connaissances, par opposition aux inférences rétrogrades, qui établissent des liens entre les informations du texte. Afin d’éviter la confusion, nous n’utiliserons le mot « explication » que dans une acception plus générale (cf. II - 1.4), et préciserons le cas échéant de quel type d’inférence nous voulons parler.

II - 1.2 Niveaux de représentation, modèle de situation

Au point précédent, nous avons utilisé l’expression « représentation mentale du texte ». Cette formulation ambiguë recouvre trois niveaux de représentation (van Dijk & Kintsch, 1983) qui se distinguent par leur position entre les deux pôles que constituent la surface du texte et la situation à laquelle ce dernier réfère. Avant de présenter les trois niveaux proposés par van Dijk et Kintsch, nous introduisons séparément leurs hypothèses concernant le format de la représentation et la nature de la cohérence, car ces hypothèses sont séparables de la notion de niveau de représentation. Nous présenterons ensuite les deux premiers niveaux (microstructure et macrostructure), qui sont des représentations du texte proprement dit, avant d’évoquer le modèle de situation, ou modèle mental, qui fait intervenir les connaissances propres du compreneur.

Le modèle de van Dijk & Kintsch propose que le sens du texte est représenté par des propositions, qui sont des entités amodales analogues aux prédicats de la logique du premier ordre, ou aux structures de la grammaire de cas. Les propositions sont des structures sémantiques à places fixes. On appelle arguments les entités qui instancient ces places. Les arguments sont soit d’autres propositions, soit des concepts (nœuds lexicaux ou groupes nominaux). La cohérence entre les propositions repose sur le partage d’arguments : deux propositions sont connectées entre elles si elles ont en commun un argument. Nous avons illustré au point précédent les limites de cette approche de la cohérence. La distinction que ces auteurs proposent entre microstructure, macrostructure et modèle de situation demeure une classification pertinente des types de cohérence, quelles que soient les hypothèses que l’on fait sur la nature des unités de représentation. Les notions de microstructure et macrostructure permettent d’opposer la cohérence locale à la cohérence globale, et la notion de modèle de

situation permet d’envisager la cohérence du texte, au-delà des unités textuelles, au niveau de la situation dont il est question dans le texte.

Le premier niveau, la microstructure, est la représentation la plus proche du texte verbatim. Elle englobe la surface même du texte (son lexique et sa syntaxe), et la base de texte, c’est-à-dire le sens des phrases dans ce qu’il a d’indépendant de sa surface (ce sens est représenté au format propositionnel selon van Dijk et Kintsch), et les inférences éventuelles qui permettent d’établir la cohérence locale, c’est-à-dire la cohérence entre phrases ou propositions adjacentes ou proches. La microstructure n’est pas hiérarchisée, son organisation est linéaire.

Le second niveau, la macrostructure, contient les idées principales du texte, hiérarchisées selon leur importance. La macrostructure est élaborée à partir de la microstructure selon les règles permettant de construire le sens global d’une séquence du discours à partir du sens exprimé localement par les phrases. Les trois règles sont la suppression (d’informations trop détaillées ou peu pertinentes), la généralisation (qui substitue à une séquence de propositions une macroproposition unique qui dérive de chacune), et la construction (qui substitue à une séquence de propositions une macroproposition unique qui dérive de l’ensemble). Ces macrorègles sont récursives (c’est-à-dire qu’elles s’appliquent à leur tour aux macropropositions), la hiérarchie résultante comporte donc plusieurs niveaux. La macrostructure reflète l’organisation globale du contenu sémantique du texte.

La distinction entre représentation du texte et représentation de la situation a émergé parallèlement, avec d’une part, la notion de modèle mental dans les travaux de Johnson-Laird (1983), et d’autre part la notion de modèle de situation chez van Dijk & Kintsch (1983). Si le premier a surtout mis l’accent sur l’aspect analogique des modèles mentaux et sur leur rôle dans la résolution de problèmes, les seconds ont élaboré la notion de modèle mental au service d’une théorie de la compréhension de texte (et dans ce domaine, les deux notions sont souvent utilisées de façon interchangeable). Les deux approches sont équivalentes en ce qu’elles affirment l’existence d’une représentation dont la structure et le contenu repose moins sur la structure et la formulation du discours lui-même que sur les caractéristiques de la situation ou du problème auquel le discours réfère. On peut définir le modèle de situation comme la représentation mentale des référents, relations, événements et actions auxquels le texte renvoie, ainsi que de l’ensemble de la situation à laquelle ils appartiennent. Le modèle de situation est épisodique, au sens où il renvoie à une occurrence situationnelle

singulière dans un monde possible, et non à une structure générale, à une catégorie de situations. Avec la notion de modèle de situation, ce n’est plus le texte et son contenu qui occupent la place centrale dans l’étude de la compréhension : c’est le compreneur. Le texte est vu comme un apport d’informations permettant au lecteur d’élaborer ou de mettre à jour une représentation qui lui est propre, et à l’élaboration de laquelle les informations du texte ne suffisent pas. Cette approche permet de rendre compte de la résolution par le compreneur des problèmes de coréférence, et de l’intégration de connaissances extérieures au texte, qui lui permettent d’en établir la cohérence. La perspective adoptée par le texte sur la situation n’est pas la seule possible, et le compreneur peut s’appuyer sur le modèle de situation pour s’en dégager (cet aspect est très important lorsque l’activité de compréhension a un but d’apprentissage ou d’évaluation critique). Dans une perspective plus large, Denhière & Baudet (1992) affirment que les modèles mentaux jouent le double rôle de représentation du monde et d’univers référentiel des expressions langagières. Par un effet en retour, les modèles mentaux jouent un rôle de structuration du réel.

Les observations expérimentales attestant d’un modèle de situation sont nombreuses (Zwaan & Radvansky, 1998 ; Kintsch, 1998 en présentent des revues). Dans l’une des plus anciennes, Bransford, Barclay & Franks (1972) ont fait écouter à leurs sujets des phrases du type de 1 ou 2 (ci-dessous), qui ont des structures syntaxiques identiques, et qui ne diffèrent que par un mot (le premier mot souligné).

1. Three turtles rested beside a floating log, and a fish swam beneath them.

(Trois tortues étaient posées à côté d’un tronc flottant, et un poisson est passé sous

elles)

2. Three turtles rested on a floating log, and a fish swam beneath them.

(Trois tortues étaient posées sur un tronc flottant, et un poisson est passé sous elles)

Les sujets étaient ensuite soumis à une tâche de reconnaissance (c’est-à-dire qu’ils devaient dire si une phrase qui leur était présentée avait été entendue auparavant). Les phrases de la tâche de reconnaissance comportaient à la fois les phrases d’origine et des phrases du type 1’ et 2’, respectivement identiques à 1 et 2, à l’exception de la modification du deuxième

mot souligné :

1’. Three turtles rested beside a floating log, and a fish swam beneath it.

(Trois tortues étaient posées à côté d’un tronc flottant, et un poisson est passé sous lui

[le tronc])

2’. Three turtles rested on a floating log, and a fish swam beneath it.

(Trois tortues étaient posées sur un tronc flottant, et un poisson est passé sous lui [le

tronc])

Du point de vue de la surface (lexique et syntaxe), 1’ et 2’ modifient 1 et 2 de façon identique. Mais la modification de 1 en 1’ modifie la situation, alors que 2 et 2’ rapportent à des structures situationnelles identiques. Les scores de reconnaissance de 2 et 2’ ne sont pas différents, alors que les scores de reconnaissance de 1 sont nettement supérieurs à ceux de 1’. La proportion de fausses reconnaissances est donc nettement supérieure dans la condition où la phrase présentée pour la reconnaissance correspondait à la même situation que la phrase entendue à l’apprentissage. Ainsi, à modification égale de la surface, les sujets sont plus enclins à confondre des formulations différentes lorsque ces dernières réfèrent à la même situation, ce qui appuie l’hypothèse que la représentation sur laquelle ils s’appuient comporte les informations qui leur permettent d’identifier la conformité de la phrase avec la situation, et que la formulation exacte peut avoir été oubliée.

A l’appui de la notion de perspective donnée par le texte sur la situation, Black, Turner & Bower (1979) ont montré l’existence d’un point de vue implicite. Selon ces auteurs, ce point de vue peut venir soit d’une « position de caméra » implicite dans le texte, soit d’une tendance du lecteur à s’identifier à un protagoniste (empathie). Pour ces deux types de points de vue, ils ont construit des couples de phrases dans lesquels la seconde phrase était cohérente ou non avec le point de vue établi par la première phrase. En voici des exemples (les crochets signalent la partie de la phrase qui varie) :

position de la caméra :

1. Bill was sitting in the living room reading the paper, (Bill lisait le journal assis dans le salon)

2. when John [came (version cohérente)] / [went (version incohérente)] into the living room. (quand John [vint]/[alla] au salon)

empathie :

1. Alan played a game of tennis with Liz (Alan a fait une partie de tennis avec Liz)

2. After winning, she [came up (cohérent)] / [went up (incohérent)] and shook his hand. (Après avoir gagné, elle est [venue] / [allée] lui serrer la main).

Pour les deux types de perspective, il apparaît que la version incohérente est lue plus lentement, et elle est jugée moins compréhensible. Dans une tâche de rappel, certains sujets qui ont lu la version incohérente écrivent la seconde phrase dans sa version cohérente ; cette erreur ne se produit pas en sens inverse.

A la suite de Schmalhofer & Glavanov (1986), Kintsch, Welsch, Schmalhofer & Zimny (1990) ont étudié la durée de vie des différents niveaux de représentation en mémoire. Les deux études reposaient sur une tâche de reconnaissance de phrases lues. Les phrases présentées étaient des phrases de l’énoncé original (niveau de surface), des paraphrases (niveau base de texte), ou des phrases présentant des informations inférées (niveau situation). Les résultats indiquent que la forme littérale du texte est oubliée très rapidement ; la mémoire de la base de texte décroît fortement avant de se stabiliser ; la mémoire du modèle de situation se maintient même après quatre jours.

II - 1.3 Structures de connaissances impliquées dans la cohérence

Les frontières entre les types de représentations décrites au point précédent ne sont pas parfaitement tranchées : il existe probablement un continuum de représentations empruntant par leur contenu ou leur structure plus ou moins à chacun des deux pôles que sont le texte et la situation. En fonction des auteurs, la macrostructure joue l’un des rôles suivants : une représentation reflétant directement la structure discursive du texte (van Dijk & Kintsch, 1983, qui l’intègrent à son tour dans une superstructure discursive) ; un support du modèle de situation (Kintsch, 1988, 1991) ; à un sens global du texte, qui sans être aussi riche que le modèle de situation, ne reflète pas forcément pour autant la structure discursive (Tapiero, 2000). Que le lecteur élabore une représentation du texte même, ou qu’il alimente un modèle de situation directement à partir du texte, il doit en tout cas s’appuyer sur des connaissances

Les notions de schéma (Minsky, 1975) et de script (Schank & Abelson, 1977) permettent de rendre compte de la facilité avec laquelle nous complétons et structurons les informations lacunaires du texte. L’idée commune à ces notions est que nos connaissances des situations usuelles sont constituées d’ensembles structurés, les schémas ou scripts, qui correspondent à des configurations prototypiques, à des modèles. Par exemple, le schéma du musée inclut les éléments suivants : un bâtiment fermé divisé en plusieurs salles, une billetterie située à l’entrée, un vestiaire, des tableaux accrochés sur les murs des salles, et des gardiens dans les salles. L’idée principale de la notion de schéma ou de script est que ces connaissances forment une unité mémorielle, et sont convoquées ensemble, composants et relations, dès qu’il est nécessaire de se représenter un musée. Si la notion de schéma est assez

Documents relatifs