PARTIE II : ÉTUDE EMPIRIQUE
Chapitre 7 : Extractions et études de collocations
7.1 Méthode d’extraction
Pour la recherche et l’extraction de patrons syntaxiques, les concordanciers AntConc et Monoconc ont été utilisés. Les recherches sont axées sur les mots-clés
du corpus. Il n’y a pas eu d’étiquetage en partie du discours parce que les erreurs de
Winbrill étaient trop nombreuses. C’est la raison pour laquelle il a semblé plus fiable de trouver les cooccurrences de termes clés du corpus.
L’extraction de patrons noms et adjectifs puis noms et verbes est faite en anglais, après quoi des équivalences en français sont recherchées. Pour les collocations N_ADJ en anglais, les types N_N sont également pris en compte, avec le deuxième nom qui a une fonction de modificateur.
Dans un premier temps, nous nous intéressons aux modificateurs qui viennent à droite des noms suivants : virus, tuberculose, hypertension et diagnostic.
Ensuite, les termes avec lesquels les adjectifs antirétroviral et préventif (ve)
apparaissent en collocations sont recensés. Pour virus :
Les premières occurrences à droite du mot dans le corpus français sont des
mots grammaticaux, (la préposition de compte le plus d’occurrences,
quarante-quatre (44) au total, v ingt-six (26) occurrences pour virus de
l’immunodéficience équivalent au patron N_ADJ (virus immunodéficitaire). Ce
156
nette préférence est à remarquer pour le patron N_N (immunodeficiency virus avec
quatre cent quatre [404] occurrences). La forme N_ADJ (immunodeficient virus)
n’apparaît pas malgré la vingtaine d’occurrences de immunodeficient.
Occurrences en anglais 4648 occurrences
Occurrences en français 370 occurrences
Principales collocations adjectivales et/ou équivalent en anglais
Immunodeficiency virus (404), influenza virus
(53), hepatitis virus (23) infectious virus (20). Principales collocations
adjectivales et/ou équivalent en français
Virus de l’immunodéficience (17), virus de l’herpès (12).
EXTRACTION.7.1 :N_ADJ ET N_N AVEC VIRUS Pour tuberculose/tuberculosis :
Occurrences en anglais 3956
Occurrences en français 1183
Principales collocations adjectivales et/ou équivalent en anglais
Pulmonary tuberculosis (66), resistant tuberculosis (29).
Principales collocations adjectivales et/ou équivalent en français
Tuberculose active (34) tuberculose latente
(18)tuberculose multirésistante (16),
tuberculose ultra-résistante (7), tuberculose pulmonaire (7), tuberculose
pharmacorésistante (3).
EXTRACTION.7.2 :COLLOCATIONS N_ADJ ET N_N AVEC TUBERCULOSE/TUBERCULOSIS
Les collocations adjectivales de tuberculose font apparaître les différents
types qu’on peut rencontrer : Pulmonary tuberculosis (66), entre autres. Le degré et
les formes de résistance de la maladie sont également relevés : tuberculose
multirésistante (16), tuberculose ultra-résistante (7), tuberculose pulmonaire
(7), tuberculose pharmacorésistante.
Pour hypertension :
Ce sont également les types d’hypertension qui sont relevés. Dans le corpus
anglais pulmonary hypertension (641) est plus fréquent alors que le corpus français
Occurrences en anglais 6431
Occurrences en français 366
Principales collocations adjectivales et/ou équivalent en anglais
pulmonary hypertension (641) essential hypertension (163), portal hypertension (146),
resistant hypertension (123), severe hypertension
(99), gestational hypertension (96), arterial hypertension (77).
Principales collocations adjectivales et/ou équivalent en français
hypertension artérielle (106), hypertension primaire (51), hypertension gestationnelle (10),
hypertension pulmonaire (10). EXTRACTION.7.3 :COLLOCATIONS N_ADJ ET N_N AVEC HYPERTENSION
Pour diagnostic/diagnosis (noses)
Occurrences en anglais 4123
Occurrences en français 247
Principales collocations
adjectivales et/ou équivalent en anglais
HIV diagnosis(noses) (232), differential diagnosis(noses) (81), early diagnosis(noses)
(74), clinical diagnosis(noses) (53) AIDS diagnosis (noses) (36), infant diagnosis (38), primary diagnosis(noses) (42.)
Principales collocations adjectivales et/ou équivalent en français
diagnostic précoce (23), diagnostic clinique (4),
diagnostic médical (4).
EXTRACTION.7.4 :COLLOCATIONS N_ADJ ET N_N AVEC DIAGNOSTIC/DIAGNOSIS
Après les choix opérés par les noms, le comportement de certains adjectifs révèle une préférence de cooccurrence avec certains noms.
Pour antirétroviral
L’adjectif apparaît en collocation principalement avec thérapie, traitement,
médicament.
Occurrences en Anglais 5467
Occurrences en Français 2291
Principales collocations nominales de
antiretroviral en anglais
Antiretroviral therapy (3125),
antiretroviral treatment (460),
158
antiretroviral medicines (202),
antiretroviral prophylaxis (148) Principales collocations nominales de
antirétroviral en français
Traitement(s) antirétroviral (l, aux)
(726), thérapie(s) antirétrovirale(s)
(651)médicament(s) antirétrovira
(l, aux) (14). EXTRACTION.7.5 :COLLOCATIONS N_ADJ AVEC ANTIRÉTROVIRAL
Pour préventif/preventive
Il y a nette préférence pour les noms thérapie, traitement et mesure, en ce qui concerne cet adjectif.
Occurrences en Anglais 550
Occurrences en Français 31
Principales collocations nominales de préventif en anglais
Preventive therapy (139), preventive intervention(s) (41) preventive measure(s) (32), preventive treatment
(27), preventive care (18) preventive medicine (8), preventive vaccine (15),
preventive strateg(y, ies) (13). Principales collocations nominales de
préventi(f, fs, ve, ves) en français
thérapie préventive (16), traitement préventif (4), mesure(s) préventive(s)
(2).
EXTRACTION.7.6 :DES COLLOCATIONS N_ADJ AVEC PRÉVENTIF/PREVENTIVE
Dans la démarche extractive, les collocations à base nominale ont été choisies. Ce choix s’explique par le fait que dans plusieurs études, la collocation nom_adjectif est envisagée sous l’angle du choix opéré par le substantif, celui-ci détermine la cooccurrence avec tel ou tel adjectif.
Dans le corpus, les adjectifs qui apparaissent le plus fréquemment sont :
cardiovasculaire, artérielle, génétique, physique, antirétroviraux. L’adjectif
cardiovasculaire apparaît avec maladie(s) le plus fréquemment (29 occurrences). Il y a également d’autres termes communément utilisés avec lesquels il apparaît :
prévention (3), risques (3), problèmes (2), etc. Artérielle n’est en cooccurrence
qu’avec tension et hypertension sur les trente-trois (33) occurrences. Même si dans
les textes d’articles scientifique antirétroviraux apparaît avec médicament, dans
ceux de vulgarisation l’occurrence n’apparaît qu’avec traitement. Génétique a une
occurrences de l’adjectif physique, sont quant à elles liées à l’activité motrice, sportive, comme en attestent les collocations : activité physique (10), exercice physique (9), effort physique (3).
Pour les collocations N_V, les termes qui apparaissent fréquemment dans le
corpus sont traitement(s) (89), virus (86), étude(s) (84), maladie(s) (73),
chercheur(s) (73), etc. Les verbes fréquemment conjugués sont tous au conditionnel (pouvoir, être, devoir, être, avoir). Traitement est en cooccurrence avec des adjectifs modificateurs ou encore des mots outils. Les verbes rester et être sont tout de même à relever même si c’est pour introduire des caractérisations. Le même constat peut être fait pour les occurrences de maladies.
Les verbes qui ont principalement pour sujet chercheur(s) sont : montrer,
démontrer, découvrir, examiner. Ce sont des verbes plus souvent conjugués au passé
composé qu’aux autres formes de conjugaison. En ce qui concerne étude(s), elle est
en fréquente cooccurrence avec les formes adjectivales du participe passé des verbes (publiée, menée, conduite, etc.). Ses cooccurrences avec des verbes qui sont à la
voix passive, sont les suivantes : Cette étude a été financée et partiellement appuyée
par…, Cette étude a été réalisée dans le cadre du Consortium…, Cette étude a été menée auprès de, etc.
Pour l’extraction de collocations à base verbale, la méthode suivante a été
retenue : à l’aide du concordancier MonoConc, une recherche générale qui porte sur
les verbes à l’infinitif et toutes leurs formes de conjugaisons possibles a été faite. Ensuite, un choix de candidats termes a été effectué sur la base de fréquence. Il ressort de ce tri les verbes suivants : évaluer, procurer, adminstrer, lutter,
contracter, examiner, prévenir, agir, diagnostiquer, intervenir, guérir, etc.
Pour les constructions à verbe support (CVS), nous avons pris en compte le verbe faire. Avec make (pour l’anglais) et faire pour le français ; les résultats sont présentés dans le tableau qui suit.
Pour les Constructions à verbe support (CVS) avec make et faire
CVS avec make make (a) decision(s) (20), make recommendation
(16), make choices (8), make a diagnosis (4),
CVS avec faire faire des choix (9), faire des recommandations
(2), faire un diagnostic (0).
EXTRACTION.7.7 :CONSTRUCTIONS À VERBE SUPPORT :MAKE ET FAIRE.
Avec seize (16) occurrences, make decisions apparaît plus fréquemment que
make a decision (4). Les décisions prises concernent plusieurs domaines médicaux (about their reproductivity, about infectiousness, about their own lives and
160
sexuality), elles s’inscrivent dans une dynamique de capacitation (peer mentorship help women make decisions (…), enable women living with the HIV make decisions (…), girls living with HIV must be empowered to make decisions(…). Une décision
est prise selon un ensemble de faits (results, information), à propos d’une pratique
ou d’un traitement (treatment, practice establishment).
Le verbe decide marque une nette préférence pour la préposition on (19)
plutôt que about (4). Il compte toutefois sur l’ensemble du corpus plus
d’occurrences (174) que la forme en CVS.
La CVS make recommendation(s) apparaît plus souvent au pluriel (15). Un
hapax est relevé pour le singulier. Par ailleurs, le verbe recommend (2834) reste tout de même beaucoup plus utilisé. La nuance sémantique est sensible également en
français puisque faire (une) recommandation(s) inclut un rapport léger non
contraignant entre locuteur et interlocuteur de sorte que la recommandation passe
même pour une proposition. Le verbe recommander tout en gardant cette idée de
proposition marque une certaine contrainte dans le sens de ce que l’on est tenu de faire dans une situation donnée.
Pour faire des recommendations deux (2) occurrences sont dénombrées
malgré la fréquence des formes verbales recommander (229). Aucune occurrence
n’est à relever pour faire un diagnostic, ni pour établir/effectuer un diagnostic
d’ailleurs.
Tout comme pour les deux précédents CVS, make diagnosis (4) reste moins
fréquent que le verbe to diagnose (2372). Il en est de même pour make choices qui a
huit (8) occurrences.
Il ressort de ces premiers constats que malgré l’intérêt généralement suscité
par les CVS, elles n’apparaissent pas fréquemment dans notre corpus. La variation
sémantique n’est pas très grande et peut être même parfois nulle, par rapport à la forme première du verbe support.