• Aucun résultat trouvé

Un courant important en traductologie s’est penché sur le processus or- ganisationnel déployé par le traducteur lorsqu’il produit une traduction. Une des méthodes expérimentales les plus utilisées repose sur le proto- cole de verbalisation, appelé aussi raisonnement à voix haute (think aloud protocol). Ce protocole consiste à demander au traducteur d’exprimer à voix haute toutes les pensées qui lui viennent à l’esprit dans l’exécution de sa tâche. Pour Durieux (1988), par exemple, toute activité de traduc- tion comprend une étape de lecture, de compréhension et d’écriture. Les connaissances, étant inhérentes à la compréhension du texte, jouent un rôle essentiel dans le travail du traducteur. Pour Daniel (1993), concrè- tement, l’acquisition de connaissances ad-hoc désigne la recherche docu- mentaire dans laquelle le traducteur utilise des outils extérieurs au texte à traduire pour acquérir les connaissances lui permettant de parvenir au niveau de compréhension requis du texte de départ et de ré-exprimer de manière adéquate le contenu de ce texte en langue d’arrivée (Daniel 1993, p. 76). En effet, des cogniticiens comme Van Dijk et al. (1983) expliquent que le lecteur construit diverses représentations à partir de la lecture du

5.3. Contexte 59

texte et qu’il comprend trois niveaux : la base de texte, les éléments les plus importants du texte et les « modèles de situation » auxquels renvoient les événements relatés dans les textes, ce qui pourraient correspondre dans notre cas aux CRC.

5.3

Contexte

Les banques terminologiques et les dictionnaires sont des ressources linguistiques précieuses qui facilitent l’accès aux connaissances des do- maines spécialisés. Ces ressources proposent généralement pour un terme à illustrer une définition, des exemples d’utilisation et d’autres termes en relation. Habituellement, le terme à illustrer est considéré comme « terme favori » et les autres termes reflètent des relations paradigmatiques comme la synonymie ou l’hyperonymie. La définition associée au terme favori est souvent de nature encyclopédique et les quelques exemples de contextes proposés, lorsqu’ils existent, ne couvrent qu’une partie des usages de ce terme favori (Bowker 2011). Des récents travaux laissent entendre que les banques terminologiques actuelles n’ont pas connu d’évolution depuis les années 60 (Bowker 2011). Elles contiennent trop peu d’informations contextuelles et les connaissances sur l’usage du terme sont assez limitées (p. ex. des exemples de collocations peuvent être indiqués mais cela n’est pas systématique). En outre, les définitions fournies par les dictionnaires comme les banques terminologiques sont généralement insuffisantes pour permettre la compréhension du terme.

D’après des expériences menées auprès d’apprentis traducteurs, Va- rantola (1998) détaille les informations que recherchent les traducteurs lorsqu’ils se tournent vers leurs sources de référence. Ces informations se décrivent comme suit :

”[...] they often want to know how the expression behaves gramma- tically and what of lexial, sentence, paragraph or text environment it normally occurs in. At a higher level, they wish to know whether the expression is appropriate for the context, subject field, text type or register in question.”1

(Varantola 1998, p. 181)

Ces informations renvoient donc à la notion de CRC pour les traduc- teurs. Une partie de ces informations est accessible à partir des entrées de dictionnaires. Cependant, Varantola (1998, p. 181) indique que les besoins des traducteurs sont en général plus importants qu’un simple accès aux entrées de dictionnaires, et qu’il est nécessaire d’avoir des contextes plus longs sans toutefois en préciser la longueur. Les corpus spécialisés repré- sentent un réservoir conséquent d’informations contextuelles pour ana- lyser le fonctionnement des termes. Cependant, tous les contextes dans lesquels les termes apparaissent ne sont pas utiles à leur compréhension.

1. « [...] ils souhaitent savoir comment l’expression se comporte grammaticalement et dans quel phrase, paragraphe ou texte syntaxique elle occurrent. À un niveau plus élevé, ils souhaite savoir quelle expression est approriée pour le contexte, le sujet du domaine, le type du texte ou le registre en question. »

60 Chapitre 5. Extraction de CRC monolingues

Dans ce cadre, les CRC jouent un rôle prépondérant dans la compréhen- sion des termes et renseignent sur leur fonctionnement en corpus de spé- cialité.

Dans la perspective d’aider à la traduction terminologique, nous sou- haitons proposer pour chaque terme à traduire (ou à sa traduction candi- date) des contextes contenant des connaissances conceptuelles et linguis- tiques qui l’illustrent dans un discours spécialisé. Nous postulons que ces contextes riches du point de vue des linguistes sont également utiles pour les traducteurs. Nous mettons en œuvre deux méthodes.

1. La première méthode s’appuie sur la définition classique des CRC. Elle exige la présence du terme à illustrer ainsi que des PC lexico- syntaxiques afin d’extraire des contextes permettant l’accès à la dimension conceptuelle du terme. Ces PC, intégrant également des termes du domaine, représentent des triplets (Terme1-Relation- Terme2). Il s’agit d’une représentation plus simple des RDF (Re- source Description Framework) souvent utilisés pour modéliser les liens entre les connaissances (Lassila et Swick 1999). Les PC exploi- tés ont pour but d’expliciter des relations définitoires du terme, telles que l’hyperonymie et la méronymie. En effet, savoir qu’un terme est en relation avec tel autre terme contribue déjà à le définir. Nous qualifions ces contextes de riches en connaissances conceptuelles (CRCC).

2. La seconde méthode exploite les collocations du terme visé comme un point d’ancrage pour identifier des contextes contenant des connaissances sur le fonctionnement linguistique du terme dans un usage spécialisé. En effet, les collocations peuvent être per- çues comme un voisinage typique renseignant sur l’usage du terme en question. Ces contextes sont désormais qualifiés de riches en connaissances linguistiques (CRCL).

Nous exploitons pour notre travail deux corpus comparable spéciali- sés de discours scientifiques, dans les domaines de la vulcanologie et du cancer du sein, et en deux langues : français et anglais.