3. Variation lexicale
4.5 Simplification des pss
4.5.2 Résultats de l’alignement
Le tableau
144.27 (cf. page suivante) fournit un extrait des résultats de l’alignement qui sont
présentés en entier dans l’annexe D.11. La ressource, qui compte 230 entrées au total, est
sauvegardée dans un fichier sous un format tabulé. Le verbe de chaquepss est aligné avec un
équivalent tiré de l’un des corpus non experts (for ou vul), et éventuellement avec un ou
plusieurs verbes synonymes qui n’ont pas pu rentrer dans le tableau 4.27 mais apparaissent en
annexe. Cette synonymie a été établie sur la base de notre compétence linguistique, à partir de
la fréquence des verbes en question (dans les corpus des non-experts) au sein despssconcernés
(cf. chapitre 3, section 3.5.1.2).
Le constat effectué à la section 4.1 par rapport aux choix préférentiels entre verbe et corpus
(grâce à la fréquence verbale) se confirme à travers les résultats de l’alignement des pss.
Certains verbes très récurrents dans le corpus des experts (cf. tableau 4.2) ont pour équivalents
14. Pour faciliter la lecture du tableau, les étiquettes des catégories metier et statut socialont été remplacées par le nom de leurs principaux référents, respectivementmédecinetpatient.
Tab. 4.27 – Quelques pss alignés avec leurs équivalents.
pss Équivalents
MEDECIN dépiste MALADIE MEDECIN identifie MALADIE
MEDECIN administre PCHIMIQUE MEDECIN donne PCHIMIQUE (à PATIENT)
MALADIE se traduit par MALADIE MALADIE se manifeste par MALADIE
MALADIE se produit MALADIE se manifeste (chez PATIENT)
FONCTION se présente comme MALADIE FONCTION se manifeste comme MALADIE
PATIENT pratique PROCEDURE PATIENT fait PROCEDURE
FONCTION est associée à FONCTION FONCTION est liée à FONCTION
PCHIMIQUE est poursuivi PATIENT (continue de) prendre PCHIMIQUE
PROCEDURE associe PCHIMIQUES PROCEDURE combine PCHIMIQUE
PCHIMIQUE est administré (MEDECIN) donne PCHIMIQUE (à PATIENT)
MALADIE s’accompagne de MALADIE MALADIE est suivie de MALADIE
PROCEDURE dépiste MALADIE PROCEDURE détecte MALADIE
MALADIE se développe à partir de ANATOMIE MALADIE commence dans ANATOMIE
ANATOMIE contrôle ANATOMIE ANATOMIE commande ANATOMIE
PROCEDURE relève de PROCEDURE PROCEDURE dépend de PROCEDURE
ORGVIVANT développe ANATOMIE ORGVIVANT forme ANATOMIE
FONCTION est observée chez PATIENT (MEDECIN) constate FONCTION chez PATIENT
PATIENT relève de MALADIE PATIENT souffre de MALADIE
PROCEDURE révèle MALADIE PROCEDURE montre MALADIE
PROCEDURE indique MALADIE PROCEDURE signale MALADIE
ANATOMIE traduit FONCTION en FONCTION ANATOMIE transforme FONCTION en FONCTION
MALADIE est traitée par PCHIMIQUE PCHIMIQUE soigne MALADIE
PROCEDURE impose PROCEDURE PROCEDURE passe par PROCEDURE
MEDECIN envisage PROCEDURE MEDECIN prévoit PROCEDURE
PROCEDURE est réalisée (MEDECIN) fait PROCEDURE
PATIENT présente FONCTION PATIENT manifeste/a FONCTION
MALADIE se développe MALADIE évolue
PROCEDURE abaisse FONCTION PROCEDURE baisse FONCTION
MALADIE est observée chez PATIENT MALADIE est rencontrée chez PATIENT
AGENT est développé AGENT est créé (par qqun)
PROCEDURE est réalisée chez PATIENT PROCEDURE est faite (par MEDECIN)
sur PATIENT
PROCEDURE est développée (MEDECIN) crée PROCEDURE
MALADIE s’accompagne de FONCTION MALADIE est suivie de FONCTION
PROCEDURE est pratiquée (MEDECIN) fait PROCEDURE
PROCEDURE est observée (MEDECIN) fait PROCEDURE
PCHIMIQUE est indiqué dans PROCEDURE (MEDECIN) conseille PCHIMIQUE
dans PROCEDURE
MALADIE est observée chez PATIENT (MEDECIN) découvre MALADIE
chez PATIENT
des prédicats dont la plus haute fréquence est enregistrée dans les corpus pour non-experts. Les
couples de verbesdépister-découvrir, administrer-donner, et présenter-souffrir illustrent cette
remarque. Ainsi, le verbe présenter, qui a une fréquence de 646 dans le corpus des experts,
apparaît le plus souvent dans le pss patient présenter maladie. Dans cet emploi, il a pour
équivalent non spécialisé le verbe souffrir, qui figure dans la liste des prédicats identifiés en
section 4.1 comme faisant partie des verbes les plus fréquents du corpus des non-experts (cf.
tableau 4.4).
En outre, l’alignement nous a permis d’observer la façon dont les verbes supports sont utilisés
dans le corpus des forums. Nous avons en effet constaté que les non-experts, eux aussi, utilisent
fréquemment les verbes supports, non pas dans des constructions à verbes supports comme le
font les experts, mais plutôt dans des contextes où les experts optent pour d’autres verbes :
— stasocial développemaladie vs.stasocial fait/subit maladie
— stasocial poursuit médicament vs.stasocial prend médicament
— metier administre médicament vs.metier donne médicamentà stasocial
La phase d’alignement des pssa également permis de découvrir un phénomène non identifié
dans les résultats de la section 4.1, qui pourtant signalait déjà l’attirance observée entre
certains corpus et des verbes spécifiques. En effet, les résultats de l’alignement fournissent des
éclaircissements par rapport aux différents modes d’utilisation des verbes par les non-experts et
les experts lorsqu’ils veulent exprimer des situations propres au domaine médical. Au-delà de ce
qui a été vu précédemment en ce qui concerne l’attraction corpus-verbe, la manière d’utiliser le
verbe différencie également le langage des experts de celui des non-experts. Certains prédicats
peuvent ainsi intervenir dans les deux corpus, mais la façon dont ils sont employés dans chaque
type de corpus marque la différence. L’intervention de certains verbes dans un pss, et surtout
dans un corpus particulier, n’est donc pas le fruit du hasard. En général, le choix du prédicat
verbal dépend non seulement du locuteur, mais surtout de ce qu’il désire exprimer, c’est-à-dire
la situation qu’il souhaite décrire. Or, les deux communautés que constituent les experts et
les non-experts utilisent des systèmes linguistiques différents. Chez les premiers, nous avons
affaire à un langage standardisé et partagé par l’ensemble de la communauté tandis que chez
les autres, le langage utilisé est très influencé par les paramètres socio-culturels qui caractérisent
le locuteur.
C’est la raison pour laquelle un verbe peut avoir des acceptions qui tendent à être privilégiées
au sein d’un corpus par rapport aux autres acceptions. Les choix préférentiels des corpus sont
capturés grâce au(x) pss dominant(s) dans les différents types de corpus. Cette remarque
générale est valable pour tous les verbes, autant les fort/peu fréquents dans un corpus particulier
que ceux ayant une fréquence relativement similaire dans l’ensemble des sous-corpus.
Prenons par exemplediagnostiquer et détecter. Ces verbes interviennent dans les deux corpus
principaux (pro etfor), avec des fréquences différentes. Dans la section 4.1.2, nous avons vu
que certains pss dominés par ces verbes sont très fréquents dans le corpus des experts, tandis
que dans le corpus des forums d’autrespssdominent. Cette variation fréquentielle au niveau des
pss des verbes selon le corpus montre que les experts et les non-experts ont chacun recours au
verbe diagnostiquer d’une façon spécifique, qui est illustrée par des pssparticuliers. Les experts
ont tendance à dire patient est diagnostiqué. Dans cet emploi, le verbe a pour synonyme
identifier, repérer. Alors que dans le corpus des forums, la plupart des occurrences du verbe
diagnostiquer correspondent à la construction suivante : médecin diagnostique maladie
chez patient. Dans ce pss, le verbe peut être remplacé par détecter, découvrir, observer,
qui instancient très souvent cette construction dans le corpus des forums. De la même façon,
les experts ont tendance à utiliser le pss patient est détecté par procédure. Chez les
non-experts, par contre, s’il faut automatiquement utiliser le verbedétecter pour décrire une
telle situation, ils seront plus enclins à direprocédure détecte maladie (chez patient).
Mais dans la réalité, pour décrire cette situation dans leur langage quotidien, les non-experts
opteraient plutôt pour un verbe commemontrer sous la syntaxe suivante : procéduremontre
maladie chez patient.
Nous avons donc affaire à un cas de figure où des verbes sont utilisés dans les deux corpus
principaux (expert et forum) mais avec des significations/syntaxes différentes, mises en évidence
grâce aux pss qui les accueillent. Cette remarque est d’une importance capitale car elle expose
l’une des principales divergences qui caractérisent les discours des experts et des non-experts en
ce qui concerne l’utilisation de verbes et d’autres unités linguistiques pour parler de concepts
médicaux. Chacun de nos deux groupes de protagonistes du domaine médical a un système
linguistique et terminologique qui lui est propre et qui est capturé dans ce travail à travers les
ensembles de pssverbaux qui constituent le discours de chaque type de locuteur. Ce constat
rejoint l’argument de Zeng-Treiler & Tse (2006) selon lequel les experts et les patients utilisent
parfois des expressions similaires ou identiques mais avec des interprétations différentes.
Tab. 4.28 – Récapitulatif du résultat de la simplification.
Nombre de pss Forme active Forme passive construction en « se »
230 112 92 26
Les données du tableau 4.27, qui ne présentent qu’un extrait des résultats de l’alignement,
permettent déjà de remarquer la forte présence des constructions passives parmi les pss à
simplifier, c’est-à-dire ceux qu’utilisent les experts. Le tableau 4.28 présente une répartition du
contenu de la ressource de simplification autour des types de constructions répertoriées. D’après
ce tableau, l’on dénombre au total 92 pss au passif, c’est-à-dire 40% de la ressource.Cette
précision concorde avec les résultats obtenus à la section 4.1.2 qui signalaient déjà la forte
inclination des experts pour la forme passive, plus particulièrement celle avec omission de l’agent.
De même, dans le deuxième chapitre de cette thèse (cf. section 2.1.3.1), nous avons vu que
l’emploi de la forme passive est une caractéristique des textes scientifiques et techniques. Nous
avons également vu que ce procédé est particulièrement prisé dans les textes médicaux. La
simplification de ce type de pss avec agent omis passe par la restitution de l’entité qui joue le
rôle d’agent et, si nécessaire, par une transformation de la construction vers la forme active
(comme dans l’exemple 49), pour une compréhension plus aisée. Lorsqu’un constituant est
restitué, nous le mettons entre parenthèse pour indiquer qu’il s’agit d’un ajout. Ce système
d’annotation est appliqué dans la ressource.
pchimique est poursuivi → (stasocial) continue de prendre pchimique
49) Si le nadolol est poursuivi jusqu’à l’accouchement, en informer l’équipe de la maternité
pour lui permettre d’adapter la surveillance du nouveau-né.
→ Si la patiente continue de prendre le nadolol jusqu’à l’accouchement, en informer
l’équipe de la maternité [...].
Au terme de l’alignement, 54 pssà la forme passive ont subi un ajout (restitution de l’agent
et/ou d’un autre élément), et plus de 60 ont subi une transformation vers la forme active.
Une analyse des résultats de l’alignement des pss permet de remarquer que dans certains
pss, plus particulièrement ceux impliquant les catégories comme fonction de l’organisme
et organisme vivant, le sens du verbe, et par conséquent l’équivalent (proposé pour la
sub-stitution), dépend des termes qui instancient les catégories Snomed en position d’arguments.
Plus précisément, le sens du verbe dépend du sous-type d’entités auxquelles ces termes font
référence. Par exemple, les pss
15fonction est activée etfonction est abaissée impliquent
tous les deux la catégorie des fonctions de l’organisme. Cependant, ils font référence à différents
sous-types de fonctions :
50) fonction est activée : le système rénineangiotensinealdostérone est activé et cette
activation limite la baisse de la pression artérielle.
51) fonction est abaissée :dans ce cas, la pression artérielle doit être abaissée en dessous
de 185 / 110 mmHg avant de débuter le traitement fibrinolytique.
Comme le montrent les exemples 50 et 51, le premier pssne peut être instancié que par des
noms renvoyant à des paramètres du corps tels que le poids, la tension, la pression artérielle, le
débit sanguin, etc. tandis que dans le deuxièmepss, il s’agit des molécules ou des systèmes
qui participent au bon fonctionnement du corps. Cette distinction qui caractérise les termes
d’une même catégorie Snomed est liée à la structuration interne des classes de la terminologie.
Comme nous l’avons expliqué lors de la description de la terminologie Snomed, certaines
catégories (organisme vivant, fonction de l’organisme, etc.) contiennent des termes dénotant
différents sous-types d’entités. Par exemple, la catégorie des organismes vivants contient des
noms d’animaux, de plantes, de bactéries et de virus. Cette absence de sous-catégorisation
débouche sur le constat que nous avons fait lors de l’alignement des pss. La sous-catégorisation
des termes des différentes classes de la terminologie Snomed permettrait à nospss d’offrir plus
de précision sur le plan sémantique.
La tâche d’alignement des pss nous a permis de faire une observation essentielle en ce qui
concerne la simplification de textes spécialisés pour un public de non-experts. La clé de la
simplification, c’est-à-dire la mise en relation des textes des experts avec ceux des non-experts
d’un domaine, est le point de vue sur lequel on focalise le texte simplifié. Fleischman (2003),
reprenant les travaux de Anspach (1988), considère le point de vue ou la voix comme une
caractéristique discursive des textes médicaux. En effet, les analyses faites sur les différents
corpus révèlent qu’au-delà des spécificités syntaxiques et sémantiques qui opposent les textes
écrits par les experts aux textes écrits par les non-experts, une différence fondamentale est le
point de vue de l’énonciateur. Par point de vue nous entendons la position dans laquelle se
place celui qui parle par rapport à ce qu’il dit : est-ce du point de vue du médecin ? Est-ce de
celui du patient ?
Différents types de marqueurs peuvent indiquer le point de vue dans un texte, entre autres les
pronoms personnels. Sans pour autant faire une étude de tous ces marqueurs dans notre corpus,
nous tenons à souligner que le corpus des forums dénombre 39 939 occurrences de pronoms
personnels, plus particulièrement les première et deuxième personnes du singulier, tandis que
chez les experts (pro), à peine 1000 occurrences ont été dénombrées. L’hypothèse généralement
émise en ce qui concerne les pronoms personnels est qu’ils sont spécifiques aux documents
pour non-experts. En effet, dans ces documents, les énonciateurs s’adressent directement à
leurs destinataires, alors que dans les documents scientifiques les auteurs privilégient un style
impersonnel. Dans une étude dont le but est la catégorisation des pages Web médicales selon
qu’elles distribuent des informations pour les experts ou pour les non-experts, Grabar et al.
(2007) constatent que les pronoms personnels à la première personne du singulier je, tu et du
pluriel (nous, vous) sont spécifiques aux textes des non-experts, tandis que dans les documents
scientifiques, l’utilisation de certains de ces pronoms relève de l’expression des questions qui
seraient directement posées aux patients.
Dans le corpus des forums, le point de vue transparaît également à travers la prédominance des
psscomplets du type sujet-verbe-complément(s), qui déploient tous les éléments syntaxiques
nécessaires pour que le lecteur puisse mieux cerner le sens du verbe et son contexte d’utilisation.
Les verbes découvrir et diagnostiquer, qui comptent respectivement 38 et 25 pss du type
médecin verbe maladiechez stasocial dans lefor, peuvent servir d’illustration grâce à
la récurrence de phrases telles que :
52) mon médecin m’a découvert/diagnostiqué une appendicite.
différente (types de pronoms), entre autres par la prépondérance de pss au passif (Biber
& Conrad, 2009 ; Todirascu et al., 2012) et d’autres constructions qui se caractérisent par
l’omission d’éléments syntaxiques tels que l’agent. La notion de point de vue est fortement liée
au type de texte. Ceci est d’autant plus vrai que certains éléments ici soulignés font partie des
caractéristiques mentionnées dans le chapitre 2 lors de la description des différents corpus (cf.
section 2.1.3.1).
Pour relier tout ce qui précède au travail de simplification, nous pouvons dire qu’au terme de
l’alignement, nous avons constaté que tous les procédés mis en application dans ce processus
ont contribué à changer le point de vue des pss spécialisés qui constituent les entrées de la
ressource. L’ensemble des transformations appliquées auxpss, sur les plans syntaxique et lexical,
ont contribué non seulement à réécrire cespss dans une syntaxe facilement compréhensible,
mais surtout à réorienter leur point de vue vers les principaux bénéficiaires de la ressource,
les non-experts. Dans le cadre de cette démarche, le choix des unités lexicales et/ou des
constructions a contribué à ce que des psséquivalents obtenus puissent décrire les situations
selon le point de vue des non-experts, afin que ces derniers puissent s’y identifier et comprendre
aisément les équivalents proposés comme résultats de la simplification.
Dans le document
Analyse contrastive des verbes dans des corpus médicaux et création d’une ressource verbale de simplification de textes
(Page 193-199)