• Aucun résultat trouvé

Dans ce chapitre, nous nous intéressons à la problématique d’aider à la révision en traduction spécialisée (de l’anglais vers le français) dans la- quelle les traductions ont initialement été attestées par le traducteur dans une étape de production. Dans un premier temps, nous présentons un prototype de concordancier bilingue qui permet de saisir un terme et sa traduction, et fournit des contextes riches en connaissances à partir de corpus comparables spécialisés. Dans un second temps, nous adoptons une approche contrastive d’expérimentation : partant d’une situation de base, dans laquelle le traducteur dispose d’un texte source et sa traduc- tion produite en amont, nous allons observer si la mise à disposition de ce nouveau prototype de concordanciers bilingues en corpus comparables spécialisés, aiderait à la correction des erreurs en révision et ainsi d’amé- liorer la qualité de la traduction.

7.3

Concordanciers bilingues

Il n’est pas rare qu’un même client sollicite le même service de traduc- tion pour traduire à des moments différents des documents distincts, mais qui renferment la même terminologie, voire plusieurs passages communs. Pour cette raison, la plupart des services de traduction archivent plus ou moins systématiquement les documents qu’ils produisent. Face à un nou- veau document à traduire, un traducteur disposant des textes apparentés, avec leurs traductions, pourra réutiliser ceux-ci à l’aide d’outils dédiés pour récupérer les traductions réciproques. Cette idée nous mène plus loin que la simple récupération de phrases traduites. Dans ce cas, l’outil qui permet d’observer les (paires de) termes et expressions et leurs tra- ductions dans leurs contextes « bilingues », serait une ressource précieuse pour les traducteurs (Bowker et Barlow 2004) : il s’agit des concordanciers bilingues.

7.3.1 Intérêt des concordanciers bilingues

Avant d’aborder le sujet des concordanciers bilingues, il est néces- saire de présenter les concordances monolingues (appelés également uni- lingues). Traditionnellement, un concordancier monolingue liste toutes les occurrences d’un mot donné en entrée. Chaque occurrence apparaît dans un segment de texte, typiquement au milieu. Celui-ci représente un « contexte » de l’occurrence, d’où le synonyme anglais keywords in context, ou KWIC. L’utilisation d’un concordancier devient particulièrement inté- ressante à partir du moment où la recherche manuelle d’occurrences de mots dans les corpus devient laborieuse. En effet, plus ce terme est fré- quent, plus le nombre de contextes devient difficile à manier et à consul- ter. Dans ce cas, le concordancier apporte une solution à ces problèmes, et permet un affichage et une sélection plus flexibles des contextes.

Les concordanciers bilingues sont similaires aux concordanciers mono- lingues. Ils permettent d’afficher, pour un terme (ou un mot) saisi, une

94 Chapitre 7. Extraction de CRC bilingues

paire de contextes qui sont des traductions réciproques. La mise en place d’un concordancier bilingue est plus complexe que celle d’un concordan- cier monolingue, d’autant plus qu’un problème de « contexte bilingue » se pose. Le concordancier monolingue affiche soit un nombre fixe de ca- ractères ou de mots au voisinage de l’occurrence du terme (ou du mot) en question, soit un contexte plus structuré, tel que la phrase ou le pa- ragraphe contenant cette occurrence. Si l’on souhaite afficher en supplé- ment la traduction de ce contexte, il faut être en mesure de la localiser exactement, ce qui n’est pas toujours possible pour une partie quelconque du texte. Ensuite, le laps de temps minimum requis pour localiser la tra- duction d’un contexte donné, même de façon approximative, est propor- tionnel à la taille des deux textes, de telle sorte qu’il n’est pas possible d’effectuer cette opération en temps réel. Il faut donc pré-calculer les cor- respondances et conserver cette information avec le texte, d’une manière qui assure des accès rapides.

7.3.2 Exemple de concordanciers

La plupart des concordanciers bilingues sont plutôt multilingues du fait qu’ils ne sont pas liés à des langues en particulier. Ils sont conçus pour fonctionner avec une ou plusieurs paires de langues. Ces outils permettent aux traducteurs en s’appuyant sur des corpus parallèles de « trouver des informations qui pourraient les aider à compléter une nouvelle traduc- tion » (Bowker et Barlow 2004). Parmi les concordanciers bilingues les plus connus sur le marché, nous citons :

— ParaConc (Barlow 2002) : sa méthode d’alignement prend la phrase comme unité de base, et s’appuie sur l’algorithme Gale-Church (Gale et Church 1993). ParaConc offre une fonction de recherche pour l’analyse de textes parallèles, ce qui permet d’observer les résultats de la recherche dans une mise en page KWIC dans les deux langues, pour trier les contextes et de passer d’une langue à l’autre.

— TransSearch (Bourdaillet et al. 2010) : est un service basé sur le Web qui prend également la phrase comme unité d’alignement. Il donne accès à une base de données de traduction contenant des millions de phrases traduites en anglais, en français et en espagnol. Tran- Search affiche les résultats en deux colonnes : une colonne contenant des textes sources dans lesquels le mot ou l’expression apparaît, et une seconde colonne contenant la traduction de ces phrases. Il s’agit d’un moteur de recherche qui pourrait être comparé à Google, mais appliqué à des textes sources avec leurs traductions.

— Find Bi-Text Advantage : Beetext Find a mis sur le marché trois ver- sions de ce concordancier : pour les freelancers, pour les traducteurs employés par de petites entreprises, et pour les traducteurs employés par de grandes entreprises. Cet outil permet à plusieurs utilisateurs de collaborer en même temps et d’afficher les documents dans leur mise en page d’origine en complément des contextes.

7.3. Concordanciers bilingues 95

7.3.3 Fonctionnement de concordanciers bilingues

Nous décrivons le fonctionnement des concordanciers bilingues en ré- férence à ParaConc qui est un exemple représentatif de cette catégorie d’outils. Pour pouvoir utiliser ParaConc, les textes sources et cibles doivent être alignés en amont. Un processus d’alignement semi-automatique est inclus dans le concordancier pour préparer des textes qui n’ont pas été préalablement alignés. La première partie de ce processus d’alignement se déroule en trois étapes : les textes sont tout d’abord alignés au niveau des titres, puis au niveau du paragraphe, et enfin au niveau de la phrase. Le logiciel se base également sur la structuration des fichiers pour aligner les paragraphes. L’alignement des phrases est effectué grâce à l’algorithme Gale-Church (Gale et Church 1993). Afin d’ajuster l’alignement, l’utilisa- teur a la possibilité d’examiner les segments alignés et de fusionner ou découper des segments particuliers, selon ses besoins. Les unités alignées restent affichées dans le texte qui les englobe.

Une fois que les textes sont alignés, le traducteur peut consulter le cor- pus et récupérer tous les exemples (i.e contextes) d’un mot ou d’une ex- pression à partir du corpus. Les lignes de concordance peuvent être triées de différentes manières (les contextes cibles ou sources d’abord) afin de regrouper les phrases similaires ensemble et faciliter le repérage de mo- dèles linguistiques. En cliquant sur une ligne de concordance, cela mettra en évidence cette ligne ainsi que le segment de texte correspondant. Il est également possible d’utiliser une fonctionnalité qui présente une liste de traductions candidates dans la fenêtre des résultats en langue cible. Ces traductions candidates peuvent être sélectionnées, elles seront ensuite mises en évidence dans les résultats. Enfin, des recherches plus avancées peuvent également être effectuées si nécessaire telles que : recherche d’ex- pressions régulières, selon la partie du discours, etc.

Bowker et Barlow (2004) affirment qu’il serait particulièrement inté- ressant pour les traducteurs de pouvoir effectuer une recherche parallèle, c’est-à-dire en leur permettant d’entrer à la fois un mot (ou un terme) en langue source, et son équivalent en langue cible, pour récupérer unique- ment les occurrences qui correspondent à ces deux entrées.

7.3.4 Limites des concordanciers bilingues

Selon Bowker et Barlow (2004), certaines limites sont souvent associées aux concordanciers bilingues : i) le statut linguistique de l’élément de la recherche ; et ii) le processus d’alignement.

Les concordanciers bilingues sont généralement conçus pour recher- cher des mots ou des expressions très courtes. Les limites concernant les mots simples portent sur le fait que certains concordanciers prennent en compte différentes formes du mot en question afin de proposer ses formes fléchies. Habituellement, cela génère un bruit plus ou moins important dans les contextes récoltés. Par exemple, la recherche de scor en corpus

96 Chapitre 7. Extraction de CRC bilingues

de vulcanologie pourrait donner scories et scorie, mais aussi score qui est moins intéressant. En outre, les expressions polylexicales sont graphique- ment respectées (recherche telle quelle) ce qui peut affecter la qualité des contextes obtenus. Par exemple, si l’on cherche volcan bouclier, ensuite vol- cans boucliers sur Linguee, les résultats seront différents.

Parfois, les concordanciers bilingues sont critiqués pour la qualité des contextes alignés qu’ils proposent. La plupart du temps, l’alignement est de type 1-1, c’est-à-dire qu’un contexte source est aligné avec un seul contexte cible. Dans certains cas, les contextes ne sont pas des traductions réciproques ou l’alignement n’est pas satisfaisant. Il serait alors intéres- sant de proposer à l’utilisateur d’autres alignements possibles (de type 1- n). Par ailleurs, les contextes proposés manquent de variétés linguistiques (ex. collocations) et d’informations provenant de domaines de spécialité. En pratique l’utilisation des concordanciers en traduction spécialisée né- cessite la sollicitation de ressources complémentaires telles que des dic- tionnaires, corpus, etc.