Classification des types de traduction - Traduction automatique neuronale et littérature : Adap

produisent des traductions de haute qualité : la traduction entièrement automatique de haute qualité ou TEAHQ. À l’autre se trouve la traduction humaine, qui ne com-porte aucune aide de la part de la machine. Entre ces deux types de traduction se situent la traduction automatique assistée par l’homme ou TAAH et la traduction humaine assistée par ordinateur ou THAO, qui sont généralement regroupées sous le terme de traduction assistée par ordinateur ou TAO (Hutchins et Somers, 1992).

L’objectif original de la recherche en TA consistait à produire des traductions auto-matiques de haute qualité sans aucune intervention humaine. Cependant, en 1952 Bar-Hillel a signalé lors d’une conférence que la possibilité de créer un système de traduction entièrement automatique était illusoire et, des années plus tard, il restait convaincu qu’un tel système de TA était en principe inatteignable. Au lieu de cela, l’objectif principal de la recherche en TA s’est tourné vers la traduction automatique assistée par l’homme, un but bien plus réaliste (Quah, 2006).

La THAO comprend l’utilisation d’outils informatiques comme supports pour les traducteurs professionnels, tels que les mémoires de traduction ou les bases termi-nologiques, tandis que la TAAH désigne l’utilisation de systèmes de TA pour pro-duire des traductions avec l’aide d’opérateurs humains avant, pendant ou après le traitement informatique. (Hutchins et Somers, 1992).

Compte tenu de la complexité des langues et des nombreux problèmes non résolus en ce qui concerne la traduction automatique, la TEAHQ, le Saint Graal de la TA, n’a été atteinte que pour des domaines très restreints dans lesquels des sous-langages bien définis sont utilisés, tels que les prévisions météorologiques ou les récapitula-tifs d’événements sporrécapitula-tifs. L’ensemble des phrases possibles dans ces domaines est

suffisamment restreint pour qu’il soit possible d’écrire des règles linguistiques qui saisissent toutes les possibilités de traduction (Koehn, 2010).

Il existe un consensus général sur l’impossibilité actuelle de développer des sys-tèmes entièrement automatiques capables de traduire à un niveau de qualité élevé sans assistance humaine à un certain stade ou sans contrôle ou restrictions sur la langue des textes. Il est possible d’avoir soit une traduction entièrement automa-tique, soit une traduction de haute qualité, mais pas les deux (Hutchins et Somers, 1992). Le but principal de la recherche reste la capacité de générer automatiquement des traductions, mais il n’est plus nécessaire que la qualité de la traduction soit éle-vée, mais plutôt qu’elle soit adaptée à un utilisation déterminé (Quah, 2006). La traduction automatique n’a pas besoin d’être parfaite pour être utile (Koehn, 2020).

Alors que dans la THAO le traducteur humain est celui qui est en charge de la traduction, dans la TAAH c’est le système qui est le véritable responsable de la tra-duction, avec une assistance humaine pour aider dans le processus si nécessaire. La participation humaine peut avoir lieu pendant, avant ou après le processus, c’est-à-dire de manière interactive, par pré-édition ou par post-édition.

Dans le cas des systèmes de TA interactifs, un humain est autorisé à corriger ou à sélectionner les équivalents appropriés pendant le processus de traduction automa-tique (Quah, 2006). La TA interactive peut prédire la traduction d’une phrase source donnée et le traducteur humain peut accepter ou corriger certaines des erreurs. Le texte modifié par le traducteur humain peut être utilisé par le système pour sug-gérer de nouvelles traductions améliorées avec les mêmes modèles de traduction dans un processus itératif jusqu’à ce que l’ensemble de la traduction soit accepté par l’humain (Toselli et al., 2011).

Le but de la pré-édition est d’agir sur le texte source avant de le soumettre à la TA dans le but d’écarter ce qui pourrait constituer un problème pour la machine. La pré-édition peut comporter l’ajout de marqueurs au texte pour aider la machine à résoudre des ambigüités. Elle peut également inclure la reformulation ou la rédac-tion du texte dans un langage contrôlé, à savoir un langage spécifiquement conçu pour être adapté aux capacités du système. Les règles du langage contrôlé portent sur des restrictions relatives à la complexité de la langue, la clarté sémantique du vocabulaire et l’explicitation des structures grammaticales (Lehrndorfer, 1996).

4.3 Degrés et standards de post-édition

La post-édition consiste à corriger l’output d’un système de TA en fonction d’une norme convenue : une correction légère dans le cas de textes destinés à l’assimi-lation et une correction complète dans le cas de textes destinés à la dissémination (Hutchins et Somers, 1992).

Les applications de la TA sont divisées en trois grandes catégories : assimilation, communication et dissémination.

L’utilisation la plus répandue de la TA est l’assimilation ou gisting, et consiste à rendre l’utilisateur capable de comprendre un texte et d’accéder aux informations qu’il contient. Dans ce cas, la traduction n’a pas besoin d’être parfaite pour trans-mettre le sens. La fonction de communication a lieu lorsque la traduction est desti-née à permettre la communication entre personnes. Il peut s’agir, par exemple, d’un échange par courrier électronique ou par téléphone. Dans ce cas, la traduction ne doit pas non plus être parfaite, mais elle doit permettre aux utilisateurs de com-prendre les informations qui leur sont transmises.

La fonction de dissémination comprend la production de traductions de qualité ac-ceptable pour la publication ; pas nécessairement des textes qui sont effectivement publiés, mais des textes de haute qualité. Dans ce cas, l’output brute des systèmes de TA est insuffisante, et pour obtenir une qualité publiable une intervention humaine est nécessaire, telle que la pré-édition de l’input, l’utilisation d’un langage contrôlé, la restriction du système à un domaine spécifique ou la post-édition du texte en sortie (Hutchins, 2005). Pour une PE légère, le post-éditeur effectue le minimum de modifications afin de produire une traduction de qualité suffisante pour l’assimila-tion ; dans le cas d’une PE complète, le post-éditeur effectue toutes les modifical’assimila-tions nécessaires pour obtenir une traduction de haute qualité, telle qu’elle était destinée à la publication.

D’après TAUS (2016), la post-édition légère, dite de qualité "suffisante", est défi-nie comme étant compréhensible et fidèle de sorte qu’elle transmet le sens du texte source, mais sans être nécessairement parfaite sur le plan grammatical ou stylis-tique. Dans le cas de la post-édition complète, également dénommée de "qualité pu-bliable", elle est censée atteindre une qualité similaire à celle que l’on attend d’une traduction humaine. Elle doit non seulement être compréhensible et fidèle, mais aussi être bonne du point de vue grammatical et stylistique.

Il n’existe pas des standards en matière de post-édition ou de lignes directrices lar-gement acceptées. Comme les besoins divergent, il semble que les lignes directrices ne seront jamais universelles ni standardisées. Toutefois, certaines lignes directrices en matière de post-édition sont suffisamment représentatives. L’une d’entre elles est proposée par TAUS.

TAUS a élaboré des lignes directrices en matière de PE en partenariat avec le CNGL, leCentre for Next Generation Localization, dans l’espoir que les organisations puissent utiliser ces lignes directrices comme référence et les adapter à leurs propres besoins.

Il s’agit de la première tentative d’élaboration de lignes directrices en matière de PE destinées à l’industrie et accessibles au public.

Les lignes directrices de TAUS souligne deux critères principaux qui déterminent l’effort nécessaire à la post-édition : la qualité de la production brute de la TA et la qualité attendue du document final. Ils ont ensuite proposé les lignes directrices en fonction des différents degrés de qualité attendue (Hu et Cadwell, 2016).

Conformément aux instructions figurant dans les lignes directrices de TAUS, le post-éditeur doit toujours s’assurer que la traduction est sémantiquement correcte et qu’aucune information n’a été omise ou ajoutée. Il doit également corriger tout contenu offensant ou inapproprié ainsi que les fautes d’orthographe. Enfin, il doit s’assurer d’utiliser le plus possible l’output de la TA. Si le texte a une fonction d’assi-milation et que le but consiste à atteindre une qualité dite "suffisante", le post-éditeur sera invité à ne pas tenir compte du style et de la fluidité du texte. En revanche, si un texte de haute qualité est attendu, le post-éditeur sera censé corriger la grammaire et la syntaxe, tenir compte de la terminologie, corriger la ponctuation et assurer la mise en page correcte du texte cible.

Les spécifications relatives à la qualité attendue du texte post-édité et au degré de post-édition sont bien évidemment liés dans une certaine mesure. Cependant, la qualité de la TA brute jouera également un rôle : si la TA est de très bonne qualité, une PE légère pourrait suffire à la rendre publiable, mais si la TA est très mauvaise, même une PE complète ne suffira pas à la rendre suffisamment bonne (TAUS, 2016).

Bien que les consignes de TAUS pour la post-édition complète visent à atteindre une qualité similaire à celle attendue d’une traduction humaine, l’importance du style est quelque peu négligée :

«This level of quality is generally defined as being [...] stylistically fine, though the style may not be as good as that achieved by a native-speaking human translator.» (TAUS, 2016)

Étant donné que le style est un aspect fondamental dans les textes littéraires, nous considérons que les consignes de TAUS ne sont pas appropriées pour notre étude.

De plus, les consignes de TAUS - tout comme les autres lignes directrices prévalentes (Hu et Cadwell, 2016) - ne sont pas pertinentes pour la prose littéraire et risquent de contredire les choix stylistiques faits par l’auteur, comme le non-respect des conven-tions de ponctuation ou d’orthographe, ou l’utilisation d’un langage offensif. Pour cette raison, nous avons décidé de ne pas utiliser de consignes de post-édition. La seule instruction de post-édition sera de veiller à transmettre le sens et, en même temps, à reproduire les effets stylistiques et littéraires du texte source, afin d’offrir au lecteur une expérience de lecture équivalente.

4.4 Effort de post-édition

Une considération essentielle pour déterminer la valeur de la post-édition en tant que pratique est l’effort que celle-ci implique, en particulier par rapport à la tra-duction humaine. Par conséquent, la manière dont l’effort de PE peut être mesuré, comment il se place par rapport à l’effort de traduction, et comment l’effort peut être réduit, sont des questions fondamentales pour la recherche en PE. Une grande par-tie de l’intérêt suscité dans le domaine, en particulier du côté de l’industrie, porte sur le potentiel de réduction du temps - et donc des coûts - grâce à la post-édition (Koponen, 2016).

Le temps de PE, soit le temps consacré à la correction des traductions automatiques, peut être perçu comme l’aspect le plus visible et le plus important d’un point de vue économique de l’effort de post-édition (Krings, 2001), mais il ne reflète qu’une partie de cet effort. Le temps de post-édition est déterminé par l’effort technique nécessaire pour les frappes au clavier et les clics de souris utilisés pour effectuer les corrections nécessaires, ainsi que par l’effort cognitif déployé pour détecter d’abord les erreurs et planifier les corrections. Ces trois dimensions, bien distinctes mais liées entre elles, constituent les aspects temporels, techniques et cognitifs de l’effort, tels que définis par Krings (2001) et que nous allons voir plus en détail dans la suite.

Effort temporel

Puisque la dimension temporelle de l’effort de PE est importante pour les contextes pratiques, le temps de PE a été un indicateur d’effort couramment utilisé. Dans la pratique, il est généralement le facteur déterminant pour savoir si la PE est rentable, et le temps de PE est souvent examiné par rapport au temps de traduction, en com-parant si l’utilisation de la PE entraîne un plus grand nombre de mots traduits dans un intervalle de temps donné (Plitt et Masselot, 2010). Cependant, la collecte de don-nées temporelles fiables n’est pas nécessairement facile dans les contextes de travail concrets : les outils spécialisés pour la collecte de données temporelles peuvent faire défaut, et les auto-évaluations des traducteurs ou des post-éditeurs peuvent ne pas être suffisamment détaillées (Moran et al., 2014).

Effort technique

L’effort technique de post-édition concerne les opérations physiques qui doivent être effectuées sur la traduction automatique pour corriger toute erreur ou défaut.

Cela comprend les suppressions, les insertions et les déplacements (Krings, 2001).

L’effort technique peut être mesuré par le nombre de frappes utilisées pour produire la traduction finale. En examinant le processus de PE à partir des frappes enregis-trées parkeylogging, on obtient des indications sur l’effort technique. La mesure des frappes utilisées par le post-éditeur nous indique l’effort de frappe nécessaire pour effectuer les corrections (Carl et al., 2011).

Une autre approche pour mesurer l’effort technique consiste à comparer la TA et sa version post éditée au moyen de métriques de distance d’édition telles que le HTER, afin de déterminer le nombre et le type de modifications apportées par le post-éditeur. Bien que le HTER reflète l’effort de PE dans une certaine mesure, des divergences entre les scores HTER et l’effort de PE ont été observées (Koponen et al., 2019).

Effort cognitif

L’effort cognitif de post-édition concerne le type et la portée des processus cognitifs qui doivent être activés afin de combler une déficience donnée dans une traduction automatique (Koponen, 2016). Il est à souligner que l’effort cognitif de post-édition ne peut être observé directement et que, parmi les trois dimensions de l’effort de PE,

Krings (2001) considère l’aspect cognitif comme le facteur prépondérant qui déter-mine l’effort de PE.

Une des premières approches pour mesurer l’effort de PE, notamment l’aspect cog-nitif, a fait appel au protocole Think Aloud, dans lequel les post-éditeurs rendent compte verbalement de leurs actions lors du processus de PE. Bien que la méthode Think Aloudait été largement utilisée dans la recherche portant sur le processus de traduction, certaines faiblesses ont été constatées. Penser à haute voix ne peut que capturer la partie consciente du traitement cognitif, et a pour effet de ralentir le pro-cessus et potentiellement même de modifier le traitement cognitif en cause (O’Brien, 2005).

Les pauses observées dans les données de keylogging lors de la PE ont attiré l’at-tention comme un moyen d’identifier les problèmes potentiels et, par conséquent, l’effort cognitif. Englund Dimitrova (2005) affirme que grâce aukeyloggingil serait possible de suivre des tendances concernant les pauses, la segmentation et les ré-visions, et donc de faire certaines inférences sur les processus cognitifs. Ce type de données permet de suivre, dans une certaine mesure, le moment où une décision est prise et de déterminer s’il y a des problèmes associés à celle-ci. De même, O’Brien (2005) présente une analyse de données qui montre une corrélation entre certains éléments du texte source identifiés comme potentiellement difficiles et les pauses, ce qui suggère une augmentation de l’effort cognitif.

Le développement de la technologie de suivi oculaire a rendu possible l’utilisation des données relatives au regard pour mesurer aussi l’effort cognitif. L’hypothèse sous-jacente veut que les mouvements des yeux reflètent les processus cérébraux pendant la lecture, et que l’endroit où le regard du lecteur se fixe indique le point focal de l’attention (Hyönä, 1995). En outre, les fixations de longue durée ou la sur-venance de multiples fixations au même endroit - par exemple, un mot - sont présu-mées indiquer une augmentation de l’effort cognitif (Carl et al., 2011).

Le but de la collecte de données pour mesurer l’effort de PE consiste, non seulement à déterminer la rentabilité de la PE, mais aussi à trouver des moyens de réduire cet effort. Identifier comment certaines caractéristiques spécifiques du source texte et de la TA influencent l’effort de PE pourrait aider à créer des solutions techniques pour réduire l’effort (Koponen, 2016).

4.5 Compétences nécessaires pour la post-édition

La post-édition est en général effectuée par des traducteurs. En effet, celle-ci re-pose en grande partie sur les compétences bilingues acquises au fil du temps, et les traducteurs possèdent ces compétences davantage que les non-traducteurs (Hut-chins, 2005). Cela semble refléter la perception générale, mais il y a des exceptions.

Par exemple, la possibilité de post-éditer la TA de façon monolingue - sans le texte source - était le point de départ présumé par les premiers chercheurs dont Edmund-son et Hayes (1958) et a été récemment examinée par Koehn (2010), Hu et al. (2011) et Mitchell et al. (2013).

Alors que les pionniers de la TA estimaient que toute personne connaissant la langue cible était en mesure de faire de la post-édition, on s’est rapidement aperçu que le post-éditeur devrait connaître la langue source pour pouvoir effectuer la tâche de post-édition. Cependant, les traducteurs qui apprennent à exercer la post-édition sont tenus de persévérer : dans un premier temps, la post-édition prend plus de temps que la traduction à partir de zéro. L’avantage des traducteurs agissant en tant que post-éditeurs - par opposition aux non-traducteurs - réside dans le fait qu’ils assurent un contrôle de la qualité. Le système de TA peut maintenir la cohérence terminologique et s’occuper des aspects répétitifs du texte, mais la qualité linguis-tique doit être assurée par le traducteur humain (Hutchins, 2005).

En revanche, le recours à des traducteurs en tant que post-éditeurs présente les in-convénients suivants : les traducteurs sont contraints de corriger systématiquement les mêmes erreurs mineures et, puisque le style de la TA produite est en général orienté vers la formulation de la langue source, le traducteur est obligé de modifier constamment la structure des phrases. Ces corrections et modifications à plusieurs reprises deviennent agaçantes pour le traducteur. La solution serait peut-être une formation spécifique pour les individus ayant une certaine expertise en traduction mais qui seraient prêts à acquérir les compétences nécessaires pour se spécialiser en tant que post-éditeurs (Hutchins, 2005).

Outre la maîtrise de la langue source et de la langue cible, ainsi qu’une bonne connaissance du domaine dont relève le texte à traduire un post-éditeur doit être capable de faire la distinction entre les retouches purement stylistiques et les correc-tions linguistiques indispensables (Seewald-Heeg, 2017). Le post-éditeur doit éga-lement veiller à préserver le plus possible de la TA brute, et ne modifier que les

éléments nécessaires au bon fonctionnement de la phrase, afin de maximiser le bé-néfice de la TA (Vasconcellos et Bostad, 1992).

De plus, un post-éditeur doit avoir une bonne compréhension de la TA et de ses ca-pacités, et garder à l’esprit que les erreurs commises par la machine sont différentes de celles du traducteur humain. Il doit également être capable de décider rapide-ment si une phrase doit être post-éditée ou si une retraduction se révèle plus conve-nable. Enfin, le post-éditeur doit être en mesure de fournir un retour d’information sur la qualité de la TA et le type d’erreurs constatées afin que les développeurs puissent optimiser le système (Seewald-Heeg, 2017).

4.6 Conclusion

La post-édition est avant tout déterminée par le but visé du point de vue de la qua-lité. Puisque dans cette étude nous comparons la traduction à partir de zéro avec

Dans le document Traduction automatique neuronale et littérature : Adaptation d’un système de traduction neuronal et analyse comparative de la traduction humaine et de la traduction automatique post-éditée (Page 58-0)