• Aucun résultat trouvé

Les technologies pour la traduction : outils et ressources Web

Chapitre I : Les modèles de l’opération traduisante

I.3 Les technologies pour la traduction : outils et ressources Web

La révolution informatique des dix dernières années a changé remarquablement le flux de travail dans presque tout secteur professionnel. Le monde de la traduction n’a bien sûr pas échappé à cette transformation générale.

Cette révolution a fourni le traducteur de nombreux outils, allant des logiciels de traduction automatique aux dictionnaires encyclopédiques sous forme de Wiki, aux forums de traducteurs en ligne, jusqu’aux systèmes de reconnaissance vocale permettant aux traducteurs d’enregistrer leurs traductions oralement. Mais la richesse des nouveaux outils n’est pas tout. Bien évidemment, ceux qui ont toujours été les outils du traducteurs, ont pris une forme renouvelée : le « traducteur-rat de bibliothèque » des années 90, perdu sous d’un tas de livres, de dictionnaires et d’encyclopédies, se retrouve aujourd’hui face à un ordinateur désormais indispensable dans lequel il stocke inévitablement tous ses travaux, il catalogue ses sources principales de référence en ligne et il installe la dernière version du logiciel de traduction assistée par ordinateur que toute entreprise demande. Si l’on veut, le « traducteur-rat de bibliothèque » s’est transformé en « cyber-traducteur », duquel on ne connaît ni la voix ni le visage, mais auquel on associe forcément une adresse électronique.

Plus précisément, les vieux glossaires bilingues ont évolué jusqu’à devenir de véritables bases de données multilingues, souvent créées soit par des équipes de terminologues spécialisées, soit de manière collaborative par les (cyber-)traducteurs. Grâce aux systèmes de traduction assistée par ordinateur (TAO), les traductions effectuées par le traducteur sont enregistrées dans ce que l’on appelle des « mémoires de traduction », c’est-à-dire des répertoires bilingues où le texte de départ et le texte d’arrivée correspondant sont réduits en unités de traduction formées essentiellement par une phrase du texte source associée à son équivalente en langue cible, fruit du travail précédent du traducteur. Ces mémoires constituent désormais un outil indispensable au métier du traducteur qui y fait référence également en tant que source de consultation où il peut vérifier, par exemple, comment une expression ou un terme donné a déjà été traduit au cours des traductions précédemment effectuées (soit par lui-même au fil des années, soit par d’autres traducteurs auquel le client avait fourni la même mémoire de traduction). Dans la pratique, la mémoire de traduction

83

remplace souvent le dictionnaire bilingue traditionnel. Bien sûr, il s’agit d’un outil très performant s’il est adopté pour la traduction de textes de spécialité, caractérisés par un taux de répétitions élevé ou, par exemple, par des formules standardisées, comme c’est le cas des manuels techniques, des recettes, des notices, des textes scientifiques hautement spécialisés, des textes juridiques, économiques ou médicaux. Ces textes sont en fait marqués par une terminologie très rigoureuse ainsi que par l’adoption de normes rédactionnelles à caractère figé. Voilà pourquoi aujourd’hui les modernes systèmes de traduction assistée par ordinateur prévoient également des applications internes consacrées à la création et à la gestion de répertoires terminologiques qui sont en mesure d’interagir avec l’environnement de traduction. Un exemple efficace de transformation de ce type

de logiciels TAO peut être symbolisé par l’évolution dans la conception du logiciel Trados119, de sa

version 2007 à sa version 2009 : la version 2007 offrait un logiciel TAO qui consistait en une série

d’applications distinctes, chacune avec sa propre fonction (il y avait par exemple Workbench pour

la création et la gestion de mémoires de traduction et WinAlign pour l’alignement de textes et de

leurs traductions), mais sa limite principale était son applicabilité à une quantité de formats limitée. Avec la version 2009, l’entreprise SDL offre au traducteur une véritable station de travail, compatible avec un grand nombre de formats, parmi lesquels le PDF et l’HTML. Trados, dans sa

version 2009, prend le nom de SDL Trados Studio 2009 en devenant pour le traducteur une

interface de gestion et de création de vrais projets de traduction qui ne sont pas simplement constitués de fichiers à traduire, mais où les fichiers à traduire sont associés à une ou à plusieurs mémoires de référence et à une base de données éventuelle qui concerne le domaine de spécialité en question. Le répertoire terminologique offre au traducteur un instrument de consultation où il peut prendre conscience des notions spécifiques au domaine de spécialité et de leur expression dans les langues de travail. D’ailleurs, parmi les plus récentes fonctions de la version 2011, Trados inclut l’intégration avec plusieurs systèmes de traduction automatique parmi lesquels Google Translate et Microsoft Translator.

Aujourd’hui, en fait, c’est le domaine de la traduction automatique qui contribue à l’ultérieure évolution du rôle du traducteur en tant qu’intermédiaire entre le client et la traduction automatique (rapide et économique) des documents à traduire. C’est ainsi que le traducteur se retrouve à jouer

aussi le rôle de post-éditeur120, souvent dans une situation générale de confusion.

119http://en.wikipedia.org/wiki/SDL_Trados (dernière date de consultation, 21/08/2014)

120 Anne-Marie Robert, « La post-édition : l’avenir incontournable du traducteur ? », Traduire [En ligne], 222 | 2010, mis en ligne le 12 novembre 2013, consulté le 21 août 2014. URL : http://traduire.revues.org/460 ; DOI : 10.4000/traduire.460

84

La transformation du traducteur professionnel implique également une révolution dans le domaine de la formation des futurs traducteurs : l’offre formative tente de suivre les évolutions de la demande du marché de travail qui augmente d’année en année le niveau des prérequis technologiques nécessaires à l’introduction du jeune traducteur dans la réalité de la profession.

C’est pourquoi l’on assiste à la naissance de plusieurs projets didactiques121 ayant pour

dénominateur commun l’intégration de systèmes de traduction assistée ou bien automatique en situation d’apprentissage de la traduction.

Dans son article122 « Traduction et technologie : état de la question », Margaret King analyse la

nature paradoxale de cette transformation du monde de la traduction, se focalisant en particulier sur l’évolution minime des théories qui sont à la base des technologies pour la traduction, mais qui pourtant provoquent des changements énormes dans la vie professionnelle du traducteur.

« La dernière fois que j’étais appelée à dresser un bilan des technologies liées à l’art de la traduction date d’environ dix ans. En préparant ce nouveau bilan, j’ai été frappée par un paradoxe : au niveau des théories sous-jacentes aux applications informatiques touchant à la traduction, je ne peux pas identifier de grands progrès, ni de changements révolutionnaires, mais force est de constater des changements énormes dans la vie quotidienne de nombreux traducteurs et dans la formation des traducteurs » King (2003 : 75)

L’autrice continue en reprenant les problèmes principaux dans l’application des technologies linguistiques à l’opération traduisante : l’élaboration de règles morphosyntaxiques ou sémantiques a mis en évidence les limites existant dans la modélisation informatique de la syntaxe d’une langue, ce qui d’ailleurs sur le plan sémantique, pose de nombreuses difficultés liées à la désambiguïsation nécessaire au logiciel par rapport au contexte. D’où, le problème principal qui encore aujourd’hui les informaticiens essayent de contourner : comment intégrer dans un logiciel les connaissances contextuelles nécessaire à son fonctionnement ?

« Il y a dix ans, la technologie reconnue en linguistique informatique était basée sur l’élaboration de jeux de règles censées décrire le comportement morphologique, syntaxique ou sémantique de la langue à traiter. […] La linguistique également connaissait ses limites : même s’il était possible de décrire presque complètement le processus de formation

121 Parmi d’autres:

Peraldi S., «La Post-édition à la portée du traducteur», Tralogy [En ligne], Tralogy I, Session 2 - Translation as a profession / Le métier du traducteur, mis à jour le : 21/05/2014,URL :

http://lodel.irevues.inist.fr/tralogy/index.php?id=107

Koletnik Korošec M. , «The Internet, Google Translate and Google Translator Toolkit », Tralogy [En ligne], Tralogy I, Session 3 - Training translators / La formation du traducteur, mis à jour le : 21/05/2014,URL :

http://lodel.irevues.inist.fr/tralogy/index.php?id=113

Rosemary E.H. Mitchell-Schuitevoerder , «Translation and technology in a project-based learning environment», Tralogy [En ligne], Session 3 - Training translators / La formation du traducteur, Tralogy I, mis à jour le : 21/05/2014,URL : http://lodel.irevues.inist.fr/tralogy/index.php?id=173

122 King M., « Traduction et technologie : état de la question », Revue française de linguistique appliquée 2/ 2003 (Vol. VIII), p. 75-89 URL : www.cairn.info/revue-francaise-de-linguistique-appliquee-2003-2-page-75.htm

85

des mots, au moins pour les langues de grande diffusion, il n’y avait pas – et il n’y a toujours pas – une description complète de la syntaxe d’aucune langue. Au niveau de la sémantique, l’ambiguïté omniprésente dans la langue semblait poser un problème quasi insurmontable […] Comment faire pour rendre disponible à un logiciel la même connaissance du contexte particulier ? Le gros du problème réside dans cette dernière phrase : si l’on regarde de près, pratiquement chaque phrase qu’on utilise contient des mots ambigus, ou est construite d’une façon qui permet plus d’une seule interprétation du vouloir dire. L’être humain puise dans toute son expérience chaque fois qu’il participe à l’activité de communication par la langue jusqu’au point où, la plupart du temps, il n’est même pas conscient des ambiguïtés potentielles. L’ordinateur ne vit pas […] et si l’on voulait qu’il en fasse semblant, il faudrait lui expliquer toutes les expériences possibles et tous les contextes possibles, exprimés en outre dans un langage formel dénué de toute possibilité de nuance ou d’interprétation multiple. Il n’est pas très surprenant que personne n’ait encore relevé le défi. Il est parfois possible, comme nous l’avons déjà remarqué en passant, d’éviter le problème en limitant soit le domaine de discours soit la richesse d’expression de la langue utilisée, soit les deux ». King (2003 : 76)

En l’absence de résolutions concrètes à ce problème d’intégration de connaissances, les experts ont poursuivi dans la création de règles de plus en plus complètes ainsi que dans l’alimentation de dictionnaires pour les traducteurs automatiques, ce qui n’a pas pour autant empêché la naissance de nouvelles expérimentations, tournées cette fois-ci envers la statistique :

« Dans les dix ans qui se sont écoulés, les constructeurs des systèmes ont eu le temps de créer des jeux de règles plus complets et, surtout, d’alimenter les dictionnaires qui sont la clé de voute de tout système « linguistique » de traduction automatique. […] Nous nous tournons maintenant vers les technologies qui étaient pour ainsi dire les technologies en voie de développement. Parmi celles-ci, celle qui a eu peut-être les conséquences les plus profondes au niveau de la vie quotidienne des traducteurs est l’élaboration de systèmes basés sur un calcul de probabilités ».

King (2003 : 77-78) L’étude de l’application de la probabilité a bientôt mis en lumière de nouvelles exigences en termes de puissance et de vitesse de calcul informatique. C’est le début de la collaboration entre la linguistique de corpus et le traitement automatique des langues (TAL), comme l’on peut lire dans l’illustration synthétique mais efficace de King concernant le principe de la probabilité.

« L’étude de corpus permet de calculer les probabilités de séquences de deux caractères (des bigrammes dans le jargon des études empiriques) relatives au corpus en question. Si le corpus est très grand et constitué d’une façon telle que toute une langue est bien représentée (au lieu de se contenter d’une partie seulement, par exemple, la langue de la documentation technique ou la langue des lycéens), on peut considérer les probabilités valables pour cette langue en général. Et si on peut calculer les probabilités pour des suites de deux caractères, on peut également calculer les probabilités des suites de trois (les trigrammes) ou de plus ». King (2003 : 80)

L’aperçu panoramique proposé par King s’élargit, ensuite, touchant le domaine de la traduction assistée par ordinateur (TAO). Il est intéressant de noter que le constat présenté par King à propos du paradoxe dans le progrès des technologies pour la traduction s’avère toujours actuel, même

86

aujourd’hui à une dizaine d’années de son apparition. Les outils caractérisant la pratique professionnelle du traducteur de nos jours, en fait, restent les mêmes : les mémoires de traduction, les alignements, la probabilité.

« Il s’agit des logiciels qui savent tirer bénéfice des archives de traductions déjà faites, connues sous le nom de

mémoires de traduction. […] Dès qu’une mémoire devient disponible, le logiciel compare un nouveau texte à traduire phrase par phrase avec les textes sources stockés dans la mémoire. Quand il trouve une phrase qui correspond plus ou moins exactement à une phrase déjà traduite, il recherche la traduction déjà faite et l’offre au traducteur comme traduction possible pour la phrase dans le nouveau texte. Ce processus n’a rien à faire avec la traduction automatique : le logiciel récupère des bribes de traduction faites par des traducteurs humains, et un traducteur humain décide de l’utilisation de la traduction offerte. […] Les premiers systèmes incluant la possibilité de consulter une mémoire de traduction sont apparus sur le marché en 1994. Parce qu’ils répondaient à un besoin réel dans la vie de beaucoup de traducteurs, ils se sont répandus rapidement. La formation des traducteurs a suivi ; l’école à Genève a incorporé les mémoires de traduction dans les cours post-grade en 1996, et à partir de 1998 chaque étudiant a eu la possibilité de se familiariser avec ces outils déjà au niveau de la licence. Evidemment, il y a un lien entre les systèmes de mémoire de traduction et les systèmes basés sur le calcul de probabilités en ce sens que les deux profitent des nouvelles possibilités de stocker et de traiter de grands ensembles de textes. Mais il y a un autre lien encore : certains des systèmes de mémoires de traduction permettent ce qu’on appelle une recherche floue, c’est-à-dire qu’au lieu de chercher une correspondance exacte entre deux mots ou deux phrase, on peut aussi rechercher des éléments plus ou moins semblables : la technique utilisée ressemble au calcul de probabilités ». King (2003 : 82-83)

Tout en reconnaissant cette apparente immutabilité des technologies linguistiques de base, il faut pourtant constater que si aucune de ces technologies ne disparaît, c’est au bénéfice de l’innovation qui procède vers la construction de systèmes de traduction hybrides, comme indiqué par Roland

Raoul Kouassi dans son article123 :

« Les logiciels de traduction automatique pratiquent de plus en plus des méthodes d’intégration de différents paradigmes pour l’efficacité des résultats. Ils combinent les paradigmes pour bénéficier des forces de chacun dans un système bien construit : c’est le modèle hybride. Systran, Google Translate et Bing Translator opèrent un système hybride ». Kouassi (2009 : 7)

En effet, l’on peut voir dans la contribution de Kouassi une réalisation de la tendance annoncée par King en 2003, ce qui fait preuve d’une avancée, malgré le paradoxe :

« La tendance actuelle est de créer des systèmes hybrides, qui utilisent et des règles et des informations statistiques […] L’élaboration de jeux de règles linguistiques exige un travail long et fastidieux. Par contre, si un corpus de textes

123 Kouassi Roland Raoul, « La problématique de la traduction automatique », Revue n. 4 du Laboratoire des théories et des modèles linguistiques LTML, Université du Cocody, ISSN 1997 4256, parution décembre 2009, pp. 1-30. http://www.ltml.ci/files/articles4/article_traduction_automatique.pdf

87

parallèles est disponible, la création rapide d’un nouveau système basé sur les théories statistiques semble faisable ». King (2003 : 87-88)