Notre prototype de traducteur automatique

Chapitre III : Pensée traductionnelle humaine et Pensée traductionnelle machine

III.2 Notre prototype de traducteur automatique

En vue de l’adoption d’un système de TA en situation d’enseignement/apprentissage de la

traduction, notre choix est retombé sur le logiciel Apertium¹⁶⁵, notamment sur un traducteur

automatique basé sur des règles.

Tout en étant bien conscients de l’existance d’autres systèmes déjà opérationnels pour notre paire de

langues de travail (italien-français)¹⁶⁶, nous avons préféré adopter Apertium en raison du grand

atout pédagogique représenté par la possibilité d’observer et d’adapter ses modules internes conformément à nos intérets pédagogiques.

D’ailleurs, contrairement aux systèmes de TA statistiques basés sur des phrases, des exemples ou des chunk, qui présentent à la base des unités linguistiques déjà prêtes, un système basé sur des règles permet à l’apprenti traducteur de travailler sur de véritables données linguistiques brutes organisées dans le cadre de deux sous-ensembles distincts, qui sont mis en relation conformément à

162 Baisa Vít, “Chunk-based Language Model and Machine Translation”, Masaryk University Faculty of Informatics, July 2011.

163 Pour une synthèse efficace des différentes methodes statistiques, voir Philippe Kohen « Statistical Machine Translation »: http://mt-archive.info/MTS-2007-Koehn-3.pdf

164 Hogan, C. and Frederking, R. 1998. An Evaluation of the Multi-engine MT Architecture. Lecture Notes in Computer Science, 1529 pp. 113-123.

Chang, J. and Su, K. 1997. Corpus-based statistics-oriented (CBSO) machine translation researches in Taiwan. AMTA (1997), pp. 165-173.

Hovy, E. 1996. Deepening wisdom or compromised principles?-the hybridization of statistical and symbolic MT systems. IEEE Expert, 11 (2), pp. 16-18.

165 Apertium, A free/open-source machine translation platform https://www.apertium.org/index.eng.html?dir=spa-por#translation (dernière date de consultation, 15/3/2015).

155

la chaîne opérationnelle du système. Dans le cadre d’un système de TA basé sur des règles, l’apprenti traducteur peut donc intervenir directement sur les données linguistiques et il peut s’approprier la démarche du système afin d’améliorer la qualité de ses prestations.

La description de son fonctionnement est illustrée dans les détails dans la documentation disponible

sur Internet¹⁶⁷. L’architecture d’Apertium a été conçue par le groupe Transducens de l’université

d’Alicante, sur la base de deux systèmes préexistants : InterNOSTRUM et Traductor Universia.

Comme expliqué par l’équipe de Mikel Forcada :

« It is a classical indirect translation system that uses a partial syntactic transfer strategy similar to the one used by some commercial MT systems for personal computers. The design of the system makes it possible to produce MT systems that are fast (translating tens of thousands of words per second on ordinary desktop computers) and that achieve results that are, in spite of the errors, reasonably intelligible and easily correctable» Forcada (2010: 5).

Ce qui ressort de la présentation de Forcada c’est notamment qu’Apertium a été conçu en tant que

traducteur automatique aboutissant à de prestations traductionnelles rapides qui ne visent pas l’exactitude propre au traducteur humain, mais qui sont raisonablement intelligibles et faciles à corriger.

Il s’agit en ce sens d’un système appartenant à la « Human-Aided Machine Translation » (HAMT),

selon le classement proposé par John Lehrberger et Laurent Bourbeau¹⁶⁸ qui distinguent parmi

« Machine-Aided Human Translation » (MAHT),« Human-Aided Machine Translation » (HAMT)

et Fully Automatic Machine Translation (FAMT) :

« In the case of HAMT the human translator supplies limited information to « fill out » the machine translation. After beign supplied with the necessary data by the translator, the machine completes the translation, producing a raw output suitable for human revision. This can be accomplished in several ways. The required human assistance may take place before machine processing begins, during the translation process, or afterward. […] The nees for some human assistance arises primarily from the fact that certain linguistic structures have proven extremely difficult to parse automatically and words with multiple meanings add to the difficulty. » Lehrberger et Laurent Bourbeau (1988: 7). Nous exposerons ci-dessous les éléments de l’architecture d’Apertium présentant un intérêt pour notre expérimentation didactique, sans aborder les détails de son fonctionnement interne moins pertinents aux fains de notre analyse, pour lesquels l’on renvoit le lecteur intéressé à la documentation détaillée fournie par Forcada.

167 Forcada Mikel L. et al, « Documentation of the Open-Source Shallow-Transfer Machine Translation Platform Apertium », Université d’Alicante, 2010, pp. 207. http://xixona.dlsi.ua.es/~fran/apertium2-documentation.pdf

168 Lehrberger J. et Bourbeau L., Machine Translation. Linguistic characteristics of MT systems and general methodology of evaluation, John Benjamins Publishing Company, Lingvisticae Investigationes Supplementa, 15, 1988 ISBN 978 90 272 3124 6, viii, pp. 240.

156

L’architecture d’Apertium est constituée par une chaîne de huit modules, comme illustré dans la figure ci-dessous (Forcada, 2010 : 6) :

Figure 11. Forcada: chaîne de traduction.

Les données linguistiques sont transmises sous le format XML en raison de l’interopérabilité propre à ce langage de programmation. Voici de-suite une description synthétique des fonctionnalités prévues par chaque module,

Selon Forcada (2010 : 6 à 9) :

- le de-formatter est le premier stade de traitement du texte source, ce module opère une séparation entre données linguistiques et les informations relatives au format en encapsulant ces dernières entres paranthèses carrées pour qu’elles soient traitées en tant qu’espaces blancs par la suite du traitement ;

- l’analyseur morphologique opère une tokénisation du texte source afin d’associer à

chaque forme superficielle (surface forms) sa forme lexicale correspondante, notamment son

lemme, sa catégorie lexicale (substantif, verbe, préposition, etc.) ainsi que les informations morphologiques (nombre, genre, personne, mode, temps etc.). À ce stade, le système prévoit également la disctinction entre lexème formé par une seule unité lexicale et les « multiword

lexical units », formées par plus qu’une unité lexicale. Les Multiwords peuvent être de

typologie différente par conséquent Apertium applique à chacune de ces variantes des tags spécifiques [Forcada (2010 : 43)] : le cas le plus simple à traiter est celui des multiwords sans inflection interne, où les unités lexicales sont invariables du point de vue orthographique ; un deuxième type est représenté par les « compound multiwords » pouvant

157

être composés par une ou plusieus unités lexicales, cette catégorie comprend par exemple les articles contractés (par exemple, « du = de + le ») ou l’union entre le pronom enclitique et le verbe ( par exemple, « allez-y » ou bien « puis-je ») ; le cas de multiword le plus compliqué est celui des multiwords avec inflection interne, où le système distingue parmi le lemme invariable et celui qui nécessite d’une inflection, comme par exemple « prenons au sérieux », ou le verbe nécessitera d’une inflection, contrairement à l’expression adverbiale « au sérieux » qui reste invariable.

- Le traitement de l’analyseur morphologique sert en tant qu’input pour le troisième module

qui opère un Post-tagging : ce module a l’objectif de gérer les ambiguïtés lexicales, il est

basé sur le modèle statistique « hidden Markov model »¹⁶⁹ qui désambïgue le lexème selon

son cotexte.

- Le module suivant, « lexical transfert module » (LTM) effectue le transfert de niveau

lexical en se basant sur le dictionnaire bilingue. Ce module interagit avec un deuxième

module « structural transfer module » (STM) qui est responsable du transfert de niveau

structurel. Le LTM restitue, à partir de la prise en compte des formes lexicales et des formes superficielles reçues (multiwords compris), la forme lexicale correspondant en langue cible. Le STM, en revanche, identifie et traite les « patterns », i.e. chunk ou phrases qui nécessitent d’un traitement particulier en raison de divergeances grammaticales entre les deux langues de travail : par exemple, un changement au niveau du genre et du nombre, un changement de l’ordre des mots ou de prépositions, etc. Ce module est généré par un fichier qui contient les règles de transfert décrivant l’action à accomplir en correspondance du pattern identifié. L’on peut donc avoir une règle pour le pattern « déterminant+nom » ou bien « déterminant+adjectif+nom » lorsque leurs structures en langue source nécessitent de changements en langue cible. Comme c’est le cas par exemple de l’italien admettant le déterminant devant un adjectif, alors qu’en français le déterminant est interdit : « La mia scuola » -> « Mon école », ce qui se traduirait ainsi en langage-machine : « déterminant + adjectif + nom » -> « adjectif + nom ».

En ce qui concerne le format des règles de transfert, traité par Forcada dans le chapitre III de sa

documentation (2010 : 79), il est intéressant de noter qu’une règle chez Apertium est constituée de

deux sections fondamentales :

1. la déclaration des éléments qui seront employés par la règle ;

169 Rabiner L.R., “A tutorial on hidden Markov models and selected applications in speech recognition”, Proceedings of the IEEE, Vol. 77, No. 2, February 1989, http://www.cs.ucsb.edu/~cs281b/papers/HMMs%20-%20Rabiner.pdf

158

2. la règle en elle-même.

Dans la première section, l’on déclare :

- les catégories lexicales associées aux formes lexicales qui seront traitées par la règle, pour

que la catégorie soit détectée par le pattern. C’est au linguiste de définir les catégories

lexicales qui, selon les besoins, peuvent être génériques (« substantifs », « adjectifs ») ou bien très spécifiques (« les déterminants démonstratifs féminins ») ;

- les attributs associés à chaque forme lexicale (genre, nombre etc.) s’avérant nécessaires aux

transformations structurelles requises (<section-def-attrs>). Il faut donc préciser le nom de l’attribut, « genre » par exemple, ainsi que les valeurs (« values ») associables, « féminin » ou « masculin » par exemple ;

- les variables globales contenant toutes les valeurs des attributs actifs dans la règle donnée ou

bien les valeurs qui seront transmises aux règles suivantes ;

- la définition des listes de « string », i.e. les suites de lemmes qui seront traitées en vue

d’associer aux lemmes les valeurs nécessaires à une transformation spécifique ;

- la définition de « macro-instructions » (<section-def-macros>), c’est-à-dire des instructions

qui sont employées très fréquemment et qui peuvent figurer dans plusieurs règles, comme pour l’accord en genre et nombre parmi les formes lexicales d’un pattern.

Dans la deuxième section, nous avons :

- la définition du pattern qui sera détecté (notamment le <pattern-item>), qui est décrit par la

séquence de catégories lexicales définies dans la première section (<section-def-cats>). Si une même séquence de formes lexicales est traitée par deux règles différentes, c’est d’abord la séquence la plus longue à être appliquée ; en cas de deux règles de la même longueur, ce sera la plus ancienne ;

- le traitement opéré par la règle, ce qui indique les actions à appliquer sur les formes

lexicales en langues source concernées par la règle ainsi que le pattern correspondant en langue cible (<out>). En cas de plusieurs transformations structurelles possibles, les règles permettent de tester (<choose> + <test>) celle qui est la plus pertinente, par l’application des éléments suivants : <when> pour déterminer l’une des options possibles et <otherwise> pour indiquer l’alternative optionnelle. D’ailleurs, afin de sélectionner à l’intérieur d’un pattern donné un élément spécifique sur la base de sa position dans le pattern (<pos> qui peut être égale à 1, 2, 3 etc.), l’on utilise l’élément <clip> qui permet de préciser a) si la sélection

159

s’opère en langue source ou en langue cible (side= ³VO޵RXVLGH ³WO޵ et b) par rapport à quel

attribut associé à la forme lexicale sélectionnée (genre, nombre etc.). De suite un exemple de règles de trasfert tiré de la documentation de Forcada :

Figure 12. Forcada: règle de transfert.

Comme la didascalie de la figure (2010 : 94) l’indique, il s’agit de la règle responsable de l’identification d’un pattern composé par un verbe + la préposition « à » : cette règle vérifie d’abord

si le verbe (indiqué dans lem) en langue source (sl) fait partie des lemmes compris dans la liste des

verbes d’état. En cas affirmatif, le lemme correspondant au deuxième lexème en langue cible (tl) devient « en ».

Pour continuer avec la description des modules suivant le module du transfert structurel, la chaîne continue par le module de :

160

- génération morphologique qui à partir de la forme lexicale en langue cible reçue par le module du transfert structurel, lui associe sa forme superficielle avec son inflection relative.

Le générateur morphologique est suivi par le « post-generator » qui s’occupe de la mise en

place d’opérations ortographiques en langue source, comme les contractions et

l’introduction d’un apostrophe. La chaîne se termine par le module « re-formatter » qui

rétablit l’information relative au format à l’intérieur du texte traduit, comme c’est le cas par exemple de la conversion du format textuel en format HTML.

- Avant d’être traitées par les règles de transfert, les données linguistiques en langue source et

en langue cible sont organisées dans les dictionnaires morphologiques, un pour chacune des

deux langues de travail, et dans le dictionnaire bilingue [Forcada (2010 : 21)]. Il existe aussi un troisième type de dictionnaire, notamment celui de la post-génération, qui contient les transformations orthographiques à prévoir en langue cible.

Figure 13. Forcada: direction de lecture.

Comme on peut le voir dans le tableau ci-dessus [Forcada (2010 : 23)], les dictionnaires morphologiques sont utilisés aussi bien par le module d’analyse morphologique que par le module de génération morphologique : il faut noter qu’un dictionnaire morphologique peut être lu par le système soit « de gauche à droite » afin d’en obtenir l’analyse morphologique, soit de « droite à gauche » pour en obtenir la génération morphologique. En ce qui concerne le dictionnaire bilingue, l’on peut spécifier (en suivant la même logique) la directionnalité du processus traductionnel : pour la paire de langue it-fr, la direction « gauche-droite » correspond à la traduction de l’italien au français, tandis que la direction « droite-gauche » correspond à la traduction du français à l’italien. Le dictionnaire de post-génération suit toujours la direction « gauche-droite ».

Ce qui est particulièrement intéressant aux fins de notre thèse, concerne la définition de « paradigmes » à l’intérieur des dictionnaires morphologiques monolingues. Comme indiqué par

161

Forcada (2010 : 30), un paradigme consiste en un petit dictionnaire qui présente les transformations régulières prévues par des parties de certains mots ou par certaines entrées précises (lexèmes, multiwords). Ce genre de transformations peut concerner par exemple la flexion, la déclinaison ou les conjugaisons.

Voici un exemple, Forcada (2010 : 31) : dans ce paradigme l’on retrouve l’inflexion morphologique prévue par les noms espagnols qui prennent les mêmes désinences que « abuelo », au féminin et au masculin du singulier et du pluriel.

Figure 14. Forcada: paradigme.

162

Le paradigme, en fait, correspond aux modèles d’inflexion, de conjugaison et de déclinaison que l’humain aussi apprend de manière inconsciente à travers le processus d’acquisition d’une langue et consciemment à travers le processus de formation en langue (maternelle et seconde). Il s’agit donc, tout comme les dictionnaires, de composants du système qui pourraient favoriser l’interaction homme-machine puisqu’ils ne s’éloignent pas excessivement de la pensée humaine.

En ce qui concerne le dictionnaire bilingue, l’on y retrouve les correspondances entre les entrées (<e>) en langue source et les entrées en langue cible.

Voici comment se présente une entrée du dictionnaire bilingue pouvant faire l’objet d’une traduction littérale, (Forcada, 2010 : 39) :

Figure 15. Forcada: dictionnaire bilingue.

Une entrée dans le dictionnaire bilingue (tout comme dans les dictionnaires monolingues) peut correspondre à un « multiwords ». Comme on peut le noter dans la figure suivante (Forcada, 2010 : 47), les éléments lexicaux composant le multiword sont délimités par <b/> et globalement le groupe (i.e. la séquence de lexème constituant le multiword) est délimité par <g> - </g>.

163

Voici, en revanche, une entrée bilingue pour laquelle il faut indiquer un changement au niveau du genre (Forcada, 2010 : 40) :

Figure 17. Forcada: entrée bilingue.

La logique du système veut que l’on indique systématiquement seules les informations pertinentes aux transformations à prévoir en langue cible, ce qui pourrait s’avérer utile pour une meilleure prise de conscience des particularités linguistiques concernant les langues de travail de l’apprenti traducteur.

Il faut préciser que, dans le but de permettre au système de gérer plusieurs traductions possibles en langue cible, dans le dictionnaire bilingue il faudra indiquer par rapport à quelle direction traductionnelle le système doit tenir compte de traduisants alternatifs (Forcada, 2010 : 37). L’on

indiquera « slr » (sense from left to right) lorsqu’il y aura plusieurs traduisants possibles à droite

pour un lemme donné à gauche ; par contre, l’on indiquera « srl » (sense from right to left) lorsqu’il

y aura plusieurs traduisants possibles à gauche pour un lemme donné à droite.

Voyons l’exemple de Forcada (2010 : 37-38) pour le cas de la traduction en catalan du verbe anglais « look » (i.e. voir, regarder, sembler) : le verbe « look » peut se traduire par « mirar » dans le sens de « view » (voir) ou par « semblar » dans le sens de « seem » (sembler).

164

Figure 18. Forcada: plusieurs traduisants.

En résumé, nous estimons que les composantes constitutives du fonctionnement interne à Apertium (i.e. la chaîne des modules, les dictionnaires monolingues et les paradigmes, le dictionnaire bilingue et les règles de trasfert structurel) se prêtent à une adoption en contexte d’enseignement/apprentissage de la traduction de niveau Master en raison de leur architecture séquentielle que l’on peut observer, manipuler selon les besoins didactiques et tester au niveau de ses prestations. Une telle architecture permet aux étudiants de comprendre quelles sont les étapes prévues par la « pensée traductionnelle machine » et finalement de s’approprier cette démarche au profit d’une meilleure systématisation de leurs connaissances linguistiques. L’interaction avec Apertium, par le moyen d’une interface permettant de cacher au mieux le langage XML pouvant compliquer la tâche des apprenants, va encourager la réflexion métalinguistique et métatraductionnelle leur permettant d’éclairer leurs connaissances et de les structurer afin que l’on puisse y avoir recours de manière plus efficace lorsque l’on traduit.

De plus, au-delà de la complexité relative à l’encodage des données linguistiques chez Apertium, nous estimons que l’organisation de ces données peut aisément être comprise par les étudiants de niveau Master, ayant déjà pu faire face pendant les années précédentes de leur formation en traduction aux multiples variables qu’il faut prendre en compte lorsque l’on traduit ainsi qu’aux différents types de pièges traductionnels que l’on peut rencontrer dans de genres textuels divers.

165

En ce sens, nous partageons l’observation de Baisa qui définit l’approche statistique en TA comme étant innaturel pour les humains puisque cette méthode n’est pas justifiée du point de vue linguistique :

« The principle of translation models in SMT is quite unnatural for humans as it is not motivated linguistically. A translator does not need to learn millions […] translated pairs of sentences.» Baisa (2011 : 16)

En fait, nous croyons que s’il est vrai qu’un traducteur n’a pas besoin d’apprendre de millions de paires de phrases traduites, il lui est en revanche utile d’apprendre à organiser ses connaissances dans le cadre d’une méthode traductionnelle qu’il pourra appliquer à tout projet de traduction. Ce manque d’apport méthodologique peut s’observer également en rapport avec l’utilisation de

mémoires de traduction, comme Claude Bédard¹⁷⁰ l’affirme dans son article :

« Le recyclage à grande échelle de phrases déjà traduites présente des risques. Faute de précautions adéquates (à tout le moins une relecture finale attentive), le texte traduit pourrait ressembler à une « salade de phrases » d’un goût douteux. Les risques de dérapage, en effet, sont variés :

x Discontinuités terminologiques entre des phrases provenant de dossiers différents – ou même, à l’intérieur d’un même dossier, de contextes différents.

x Erreurs terminologiques dues à des anaphores lexicales. Par exemple, dans la phrase Repair the valve, le mot

valve se traduit différemment selon le type d’appareil, lequel est probablement explicité dans une phrase précédente.

x Erreurs de déictique, dans le cas d’une phrase qui renvoie à l’extérieur d’elle-même, par exemple au moyen de pronoms.

x Toute circonstance fortuite à cause de laquelle une phrase prend un sens imprévu dans un nouveau contexte. x Enfin, étant donné l’effet multiplicateur d’une MT, toute phrase dont la traduction est douteuse ou erronée peut

avoir des effets à grande échelle ou à long terme.

Ces observations mettent en lumière le principe suivant : de la même manière que les mots, selon le principe énoncé par Jean Delisle, n’ont de sens qu’en contexte, on peut dire que dans une certaine mesure le message échappe aux phrases elles-mêmes.» (2000 : 2).

Contrairement aux outils statistiques et aux outils de la TAO (i.e. les mémoires de traduction), notre approche vise la prise de conscience de la part des apprentis traducteurs de la complexité de l’opération traduisante dans le but de l’acquisition d’une méthode traductionnelle cohérente et structurée.

170 Bédard Claude, « Mémoire de traduction cherche traducteur de phrases… », publié dans Traduire, no 186, 2000,

Dans le document Enseigner la traduction humaine en s'inspirant de la traduction automatique. (Page 164-176)