• Aucun résultat trouvé

2. La traduction automatique (TA)

2.4 La post-édition (PE)

2.4.5 Productivité et qualité attendues

La productivité est probablement le concept central de la post-édition. Selon O’Brien :

« [r]esearch has emerged in recent years to suggest that post-editing, for some language pairs and domains, but not all, can lead to higher productivity when compared with full human translation. » (2017, p. 320) De nombreuses recherches ont en effet soulevé des gains de productivité variant entre 20 % et 50 % et pouvant atteindre jusqu’à 131 % (O’Brien, 2017). Nous notons donc que les client·e·s s’attendent à ce qu’une post-édition soit forcément plus rapide qu’une traduction humaine (Guerberof & Moorkens, 2019). En effet, la post-édition est considérée comme rentable uniquement si l’effort de post-édition est inférieur à l’effort fourni lors d’une traduction humaine (Koehn, 2010).

Sachant cela, les traducteurs et traductrices qui doivent effectuer des tâches de post-édition sont amené·e·s à traduire plus de mots que leurs pairs : généralement, ils et elles doivent traiter environ 3 500 mots sources par jour, contre environ 2 000 pour un traducteur ou une traductrice qui effectue une traduction « conventionnelle » (Robert, 2013). Ces résultats corroborent les réponses d’un sondage mené dernièrement auprès de lecteurs et de lectrices par Diño (2019), où la moyenne était de 1 000 mots par jour pour la TH et entre 1 000 et 3 000 pour la PE. Notons que ces données sont indicatives et varieront nécessairement selon le type de post-édition demandé, les lieux de travail (agences ou organes officiels, par exemple) ou encore les mandats. Elles permettent néanmoins de donner une idée de la productivité attendue pour une tâche de post-édition.

Par ailleurs, la rémunération est généralement équivalente à une tâche de traduction, même si la quantité de travail délivrée est plus importante (Robert, 2013).

Concernant la qualité, il s’agit d’une notion vague, qui varie grandement selon les client·e·s et également selon les professionnel·le·s ou futur·e·s professionnel·le·s. Guerberof et Moorkens l’ont constaté lors de leurs discussions avec des étudiant·e·s :

29

« there are those who believe that quality can only mean perfect linguistic quality, those who are more focused on what the client wants, and even those who say that they cannot refrain from making corrections. » (2019, p. 226)

Certain·e·s client·e·s s’attendront donc à ce que la qualité soit tout aussi excellente que celle d’une traduction humaine, tandis que d’autres auront des exigences bien moins élevées (Saint-André, 2015). Généralement, ce sont ces critères qui détermineront si les traducteurs ou traductrices effectueront une post-édition minimale ou maximale (voir section 2.4.1).

Par ailleurs, nous constatons un revirement dans la recherche sur la post-édition : « [t]he main goal of post-editing research is no longer finding out whether or not post-editing can be used but rather finding out when it cannot be used, and how machine translation systems can be improved to better suit post-editors’ needs. » (Daems et al., 2015) Autrement dit, l’idée générale est désormais d’optimiser la tâche de post-édition en fonction des types de texte à traduire : si les post-éditeurs et post-éditrices prennent plus de temps à corriger un texte issu de la TA qu’à le traduire, il ne vaut pas la peine de le post-éditer. Il est donc essentiel de définir cet aspect avec ses client·e·s avant d’accepter tout mandat de post-édition.

30 2.4.6 Distinction PE – révision

Afin de mieux comprendre la méthodologie suivie lors de notre travail, il convient de faire la distinction entre post-édition et révision. Le processus de révision d’un texte (qui ne concerne pas uniquement la relecture d’une traduction) est présenté de la façon suivante par Bisaillon (2007, p. 45) (voir Figure 15) :

Figure 15 : Modèle de révision proposé par Bisaillon (2007, p. 45)

Jusque-là, les différents aspects exposés semblent relativement similaires au contexte de post-édition : la démarche comprend également des étapes de détection de problèmes et de corrections en conséquence. Toutefois, des différences existent bel et bien, notamment dans la définition même de « révision » :

« [a]ctivité qui consiste à comprendre et à évaluer un texte écrit par un auteur et à y apporter des modifications pouvant toucher les aspects informationnel, organisationnel ou formel dans le but d’améliorer la qualité du texte et l’efficacité communicationnelle. […] [Ces modifications] peuvent donc être mineures – et concerner un détail – ou majeures – et porter sur le contenu et l’organisation du texte. » (Bisaillon, 2007, p. 23)

31 Nous pouvons déjà remarquer que certains points diffèrent : dans le cas de la révision, le texte est « écrit par un auteur », tandis qu’il est issu d’un système automatique pour la PÉ ; les modifications effectuées peuvent « concerner un détail », tandis que celles effectuées en PE porteront principalement sur des erreurs considérées comme graves uniquement, en particulier dans le cas d’une PÉ minimale. Le niveau d’intervention est donc généralement plus important pour une révision que pour une post-édition, car aucune erreur ne devrait subsister une fois la tâche achevée (Horguelin, 1985).

De plus, les erreurs produites par un système automatique ne sont pas identiques à celles produites par un traducteur ou une traductrice (L’Homme, 2008). En effet, les erreurs varient en fonction des différents types de systèmes de TA (voir section 2.3). Le Tableau 3 classe les erreurs les plus fréquentes selon le type de système :

Systèmes basés sur les règles Systèmes basés sur les corpus Mot/terme sélectionné incorrect Ajouts

Liaison incorrecte (ex. : prépositions) Omissions

Sens toujours ambigu Majuscules non restituées

Omissions/erreurs de ponctuation

Certains segments très fluides, d’autres pas du tout

Tableau 3 : Types d'erreurs commises par les systèmes de TA, adapté de O'Brien (2010)

Notons que cette classification n’est pas exhaustive et qu’elle est proposée dans un but informatif exclusivement.

Cet aspect représente donc également une source de différence entre la post-édition et la révision : l’attention des post-éditeurs et des post-éditrices sera fixée sur certaines erreurs typiques de la TA, telles que les problèmes de sens, qui sont parfois difficiles à repérer, tandis que les réviseurs et réviseuses ont plus l’habitude de corriger des erreurs telles qu’un manque de clarté, des maladresses, même si des problèmes de sens peuvent également être issus d’une traduction humaine.

32 Enfin, les objectifs des professionnel·le·s sont également différents. Bisaillon en dénombre quatre pour la révision :

1. « respecter les règles ;

2. faciliter la compréhension du texte ;

3. rendre la formulation plus adéquate, plus claire et plus économique linguistiquement ;

4. rendre le texte plus agréable et plus facile à lire. » (2007, p. 56)

Le premier et le deuxième objectifs peuvent être valables pour la post-édition également, dans le sens où les normes de la langue cible doivent être respectées et le sens doit être préservé, ce qui passe par la compréhension du texte dans une certaine mesure. Toutefois, les troisième et quatrième n’entrent pas en ligne de compte selon les directives de PE, car ils vont à l’encontre des buts de la post-édition, soit de préserver la TA brute au maximum et de ne pas toucher au style.

2.4.7 Conclusion TA et PE

La traduction automatique a connu de nombreuses évolutions depuis son apparition au début du XXᵉ siècle. Les systèmes linguistiques ont été les premiers élaborés. Ils se fondent sur des règles et peuvent être de type direct ou indirect. Ensuite sont apparus les différents systèmes fondés sur les corpus : les systèmes basés sur l’exemple, les systèmes statistiques et les systèmes neuronaux. Ces derniers sont particulièrement étudiés à l’heure actuelle et sont considérés comme les plus performants sur le marché.

Concernant la post-édition, elle s’effectue sur une traduction produite par un système de TA. Elle peut être minimale ou maximale selon le niveau de qualité final souhaité : dans le premier cas, le sens est restitué mais le style peut être bancal ; dans le second, la qualité visée devrait être similaire à celle d’une traduction humaine.

La révision, quant à elle, est un processus de correction qui s’effectue sur un texte issu d’une traduction humaine et qui vise à corriger toutes les erreurs pouvant altérer la qualité du texte final, quel que soit leur type.

33

3. Enseignement et PE

Puisque la post-édition est une tâche relativement récente, le nombre de formations disponibles en la matière est plutôt faible, en particulier celles proposées dans un cadre universitaire. Én outre, peu d’études ont uniquement porté sur l’enseignement de la post-édition. La demande ne manque pas pourtant, comme l’expliquent Brunette et O’Brien :

« nous sommes convaincues de la nécessité de former des agents de post-édition à l’université. Par exemple, presque toutes les personnes observées par PostEd déplorent leur manque de préparation aux tâches de PE. » (2011, p. 6) En effet, il semble indispensable que les post-éditeurs et post-éditrices aient suivi un enseignement quelconque avant de se lancer (O’Brien, 2005).

Dans ce contexte, nous nous intéresserons aux recherches effectuées et aux cursus dispensés dans le domaine universitaire (section 3.1), puis aux formations disponibles dans le secteur professionnel (section 3.2).

3.1 Secteur universitaire

Daems et al. (2015) se sont penché·e·s sur la question de l’influence des types d’erreurs produites par la TA sur les indicateurs d’effort de post-édition. L’expérience a été conduite auprès d’étudiant·e·s en dernière année de master dont la langue maternelle était le néerlandais. Elle consistait à post-éditer des textes à l’aide d’un logiciel similaire à un outil de TAO. Les erreurs présentes dans ce corpus qui provenaient de la TA étaient réparties de la manière suivante (voir Figure 16) :

Figure 16 : Regroupement et nombre des types d'erreurs du corpus de TA (Daems et al., 2015, p. 7)

34 Nous observons que les catégories grammar and syntax et adequacy contiennent le plus grand nombre d’erreurs, ce qui rejoint les résultats que nous avons obtenus pour notre propre expérience (voir section 5.4.2). Daems et al. ont observé que les erreurs ayant trait à la grammaire et à l’ordre des mots étaient facilement repérées et corrigées, car les participant·e·s effectuaient un temps de pause plus court pour celles-ci. L’effort de post-édition semble donc moins important pour ces types d’erreurs que pour celles qui concernent la cohérence par exemple. Ces dernières demandent un plus gros effort de post-édition, car le post-éditeur ou la post-éditrice doit comprendre la logique sémantique du texte et effectuer les changements en conséquence ; l’effort cognitif pour ce processus est donc plus élevé. Si cette étude n’avait pas comme objectif premier d’utiliser ces résultats à des fins d’enseignement, il est tout de même intéressant d’observer que l’effort de post-édition varie en fonction des types d’erreurs, ce qui pourrait être pris en compte lors de l’élaboration d’un cours de post-édition. En effet, ces résultats permettront de mettre en garde les étudiant·e·s contre les types d’erreurs plus subtiles à repérer et à corriger.

Saint-André (2015) s’est intéressée aux compétences que les éditeurs et post-éditrices doivent posséder et si elles sont enseignées lors des cursus universitaires des étudiant·e·s. Des professionnel·le·s ont jugé que les compétences les plus utiles pour leur travail de post-édition étaient les suivantes (2015, p. 105) :

• « code • maîtrise de LC

• décider rapidement • repérer quoi modifier »

• repérer les différences

Sachant cela, ces professionnel·le·s ont été amené·e·s à déterminer quelles compétences ont été acquises lors de leur formation. Ils et elles en ont mentionné six qui ont été faiblement acquises (Saint-André, 2015, p. 128) :

• « mandat changeant • gestion du temps

• communication • capacité des outils

• programmer des macros • spécialisation en P[E] »

Notons qu’elles ont toutes trait aux aspects professionnels ou à l’informatique.

35 Quant aux « catégories » de compétences les plus utiles, ils et elles ont mentionné les quatre suivantes (Saint-André, 2015, p. 119) :

• « compétences en rédaction • compétences en traduction

• aspects professionnels • compétences en correction »

Il ressort de l’expérience que les compétences en rédaction et en traduction sont les mieux assimilées. Quant aux compétences en correction et aux connaissances spécialisées, elles sont généralement acquises lors de la formation. Toutefois, les compétences en informatique et les aspects professionnels sont largement moins bien assimilés. Saint-André conclut qu’il serait judicieux d’intégrer ces compétences à la formation des traducteurs et traductrices, même si un cours dédié exclusivement à la post-édition devrait rester optionnel selon elle. Élle ajoute qu’un enseignement inspiré d’une formation continue serait également une bonne alternative, car celui-ci encouragerait les jeunes traducteurs et traductrices à développer leurs connaissances de manière autonome. Nous pouvons donc en déduire que, dans le cadre d’une intégration de la post-édition à l’enseignement de la traduction, les compétences en informatique et les aspects professionnels ne devront pas être négligés (gestion du temps, communication, etc.), afin de préparer les étudiant·e·s au mieux pour leur future carrière.

Tomaszkiewicz (2019) a conduit une expérience auprès d’étudiant·e·s qui étaient inscrit·e·s en maîtrise de traduction professionnelle et spécialisée à l’Université Adam Mickiewicz de Poznań et qui suivaient le cours de traduction automatique proposé. Les étudiant·e·s ont effectué une tâche de post-édition sur un texte spécialisé traduit par Google Translate, ainsi qu’une tâche de traduction humaine. Il est ressorti de cette expérience que les suggestions de TA peuvent parfois brider la créativité des jeunes traducteurs et traductrices qui ont alors tendance à se fier à la TA. Aussi la chercheuse propose-t-elle de sensibiliser les étudiant·e·s à la confiance aveugle accordée à la TA et d’adapter la formation en post-édition au niveau des participant·e·s. Cette opinion rejoint celles des enseignant·e·s que nous avons interrogé·e·s (voir section 5.3).

Yamada (2019) s’est intéressé à l’influence de la traduction neuronale de Google sur l’effort de post-édition des étudiant·e·s, selon le même modèle d’expérience effectué précédemment sur la traduction statistique (Yamada, 2014). Les étudiant·e·s ont fourni de meilleures post-éditions de la TAN que de la TAS, mais l’effort cognitif ainsi que l’effort

36 de post-édition sont restés inchangés. Ces deux éléments ont été mesurés selon la perception des étudiant·e·s. En outre, ces derniers et dernières ont déclaré avoir ressenti un effort de post-édition similaire pour la TAN et la TAS, alors qu’ils et elles ont effectué moins de corrections pour la TAN. Ce phénomène est dû aux types d’erreurs commises par les systèmes neuronaux, qui sont relativement semblables à celles commises par les traducteurs et traductrices humain·e·s (voir section 2.4.6). Puisque la post-édition de la TAN nécessite les mêmes compétences qu’une traduction humaine, il semble qu’une formation en traduction soit nécessaire pour que les étudiant·e·s puissent être efficaces dans leur tâche de post-édition.

O’Brien (2005) a proposé un module d’enseignement en post-édition qui se divise en deux parties. La première est d’ordre théorique et traite des sujets suivants : introduction à la post-édition, introduction à la traduction automatique, introduction au langage contrôlé, gestion avancée de la terminologie, linguistique des textes avancée et notions élémentaires de programmation. La seconde est d’ordre pratique et a pour objectif de permettre aux étudiant·e·s d’acquérir de l’expérience en post-édition. Ils et elles sont encouragé·e·s à s’entraîner sur différents types de textes, différents types de systèmes, et ce dans toutes leurs langues de travail. Ils et elles pourront également se familiariser avec des outils de gestion de terminologie, des systèmes d’édition contrôlée ainsi que des outils d’analyse de corpus. Én outre, O’Brien conseille de proposer ce module aux étudiant·e·s inscrit·e·s en master plutôt qu’en bachelor, ce qui rejoint l’opinion des enseignant·e·s que nous avons interrogé·e·s (voir section 5.3).

Doherty et Moorkens (2013), quant à eux, ont proposé un module de cours de technologies de la traduction comprenant des travaux pratiques qui traitaient notamment des outils de TAO, des mémoires de traduction, ainsi que de la pré- et post-édition. Ils insistent sur l’importance d’intégrer des sessions en salle informatique dans l’enseignement des technologies, car les étudiant·e·s jouent ainsi un rôle actif plutôt que passif, ce qui leur permet de consolider leurs acquis. Par ailleurs, ils ont remarqué que l’attitude des participant·e·s vis-à-vis de la TA a une influence sur l’apprentissage : plus les étudiant·e·s perçoivent la technologie comme un avantage pour leur future carrière, plus ils et elles seront motivé·e·s pour approfondir leurs connaissances en la matière. Si le cours en question n’est pas consacré à la post-édition, ces observations sont tout de

37 même applicables à notre cas et pourront être utiles lors de l’élaboration éventuelle d’un plan de cours.

Par ailleurs, de nombreuses universités proposent désormais des formations en post-édition, souvent dans le cadre de maîtrises en traduction et/ou en localisation.

Guerberof et Moorkens (2019) détaillent le module de post-édition proposé depuis 2009 à l’Universitat Autònoma de Barcelona. Les étudiant·e·s sont amené·e·s à se familiariser avec les outils de PÉ et à repérer les types d’erreurs fréquemment commises par la TA. Én outre, ils et elles sont sensibilisé·e·s aux notions de productivité et de qualité (voir section 2.4.5). Les chercheurs suggèrent que la pratique de la post-édition est plus adaptée aux étudiant·e·s ayant déjà de solides connaissances en traduction et en révision, ce qui rejoint l’opinion des enseignant·e·s que nous avons interrogé·e·s (voir section 5.3).

Rossi (2017) mentionne un module de PE intégré dans un cours de traduction automatique à l’Université de Grenoble. Ce module était dispensé à la fin du cours de TA par un traducteur ou une traductrice professionnel·le qui proposait aux étudiant·e·s de travailler sur un projet concret.

Jia, Carl et Wang (2019) indiquent qu’un master en traduction et interprétation a été mis en place en 2007 en Chine. La création de ce programme a été difficile, notamment en raison du manque de professeur·e·s compétent·e·s, si bien qu’aucun cours de post-édition n’est proposé à ce jour au sein de ce cursus. En effet, comme le mentionnait Gambier (2012), le choix des enseignant·e·s est primordial, car il déterminera la qualité des cours qui seront proposés et donc les compétences que les étudiant·e·s pourront acquérir en suivant le programme. Par ailleurs, Jia et al. ont conduit une expérience de traduction et de post-édition avec des étudiant·e·s de première année divisé·e·s en deux groupes. L’un devait fournir un premier jet de traduction d’un texte et le second le post-éditer, et vice-versa. Les chercheurs et chercheuses ont observé que la post-édition était généralement effectuée plus rapidement que la traduction, particulièrement pour les textes spécialisés.

En outre, les étudiant·e·s ont démontré une attitude plutôt positive face aux tâches de post-édition, malgré leur manque de pratique en la matière.

Par ailleurs, la FTI propose deux masters basés sur la technologie de la traduction : la MATT (Maîtrise en traduction et technologies) et la MATIM (Maîtrise en traitement informatique multilingue). Des cours de traduction automatique sont dispensés, dont un

38 qui traite de la post-édition en détail. Notons que la PE est actuellement enseignée sous forme de cours optionnel et qu’elle ne fait pas partie des cours communs obligatoires.

Néanmoins, dès le semestre de printemps 2020, les cours de « Traduction et révision » s’intituleront « Traduction, révision et post-édition ». À terme, la PE sera donc effectivement abordée lors des cours de traduction de toutes les combinaisons linguistiques.

3.2 Secteur professionnel

Des formations en post-édition sont également dispensées par certaines entreprises renommées, notamment en version e-learning telle que proposée par le TAUS10. Le cours est divisé en six modules, dont un consacré à la post-édition qui aborde les points suivants :

• « Post-editing methodologies

• Rules & principles of post-editing

• Error typology

• Skills & competencies11 »

Notons que la typologie des erreurs fait partie intégrante de la formation et que celle-ci

Notons que la typologie des erreurs fait partie intégrante de la formation et que celle-ci