• Aucun résultat trouvé

Intégration de la post-édition dans un cours de traduction et révision : Étude de cas d'étudiant·e·s à la Faculté de traduction et d'interprétation

N/A
N/A
Protected

Academic year: 2022

Partager "Intégration de la post-édition dans un cours de traduction et révision : Étude de cas d'étudiant·e·s à la Faculté de traduction et d'interprétation"

Copied!
170
0
0

Texte intégral

(1)

Master

Reference

Intégration de la post-édition dans un cours de traduction et révision : Étude de cas d'étudiant·e·s à la Faculté de traduction et

d'interprétation

CASAS, Sandra

Abstract

Ce travail vise deux objectifs principaux : recueillir l'avis des étudiant·e·s et des enseignant·e·s sur l'intégration de la post-édition à la formation en traduction, et évaluer les différences entre les processus de post-édition et de révision pour trois types de texte (littéraire, économique et journalistique), dans le cadre d'un cours de traduction et révision proposé à la FTI. Nous avons conduit une expérience de révision et de post-édition qui comptait 7 étudiant·e·s en maîtrise et une traductrice professionnelle pour la combinaison anglais – français. Nous avons ensuite analysé les versions finales (PE et révision) et avons observé en particulier les fautes graves non repérées, le temps d'édition ainsi que l'effort d'édition fourni pour chaque texte.

CASAS, Sandra. Intégration de la post-édition dans un cours de traduction et révision : Étude de cas d'étudiant·e·s à la Faculté de traduction et d'interprétation. Master : Univ. Genève, 2020

Available at:

http://archive-ouverte.unige.ch/unige:131300

Disclaimer: layout of this document may differ from the published version.

1 / 1

(2)

SANDRA CASAS

Intégration de la post-édition dans un cours de traduction et révision

É tude de cas d’e tudiant·e·s a la Faculte de traduction et d’interpre tation

Directrice : Pierrette Bouillon Jurée : Mathilde Fontanet

Mémoire présenté à la Faculté de traduction et d’interprétation

(Département de traitement informatique multilingue) pour l’obtention de la Maîtrise universitaire en traduction, mention traduction et technologies

Université de Genève

Janvier 2020

(3)

I J’affirme avoir pris connaissance des documents d’information et de prévention du plagiat émis par l’Université de Genève et la Faculté de traduction et d’interprétation (notamment la Directive en matière de plagiat des étudiant-e-s, le Règlement d’études des Maîtrises universitaires en traduction et du Certificat complémentaire en traduction de la Faculté de traduction et d’interprétation ainsi que l’Aide-mémoire à l’intention des étudiants préparant un mémoire de Ma en traduction).

J’atteste que ce travail est le fruit d’un travail personnel et a été rédigé de manière autonome.

Je déclare que toutes les sources d’information utilisées sont citées de manière complète et précise, y compris les sources sur Internet.

Je suis consciente que le fait de ne pas citer une source ou de ne pas la citer correctement est constitutif de plagiat et que le plagiat est considéré comme une faute grave au sein de l’Université, passible de sanctions.

Au vu de ce qui précède, je déclare sur l’honneur que le présent travail est original.

Sandra Casas

Genève, le 20 décembre 2019

(4)

II

Remerciements

Je tiens à remercier particulièrement ma directrice de mémoire, Madame Pierrette Bouillon, qui a immédiatement accepté de me guider dans ce projet. Merci à elle pour sa disponibilité, son aide précieuse et son expertise.

Merci à Madame Mathilde Fontanet, qui a accepté d’être ma jurée et qui m’a accompagnée au cours de l’expérience avec les étudiant·e·s.

Merci aux enseignant·e·s qui ont pris le temps de me fournir les textes, les traductions ainsi que les corrections qui ont servi à la création des tâches de post-édition.

Merci aux participant·e·s pour leur bienveillance et leur application. Sans leur contribution, ce mémoire n’aurait pas lieu d’être.

Merci à mes proches pour leur soutien inestimable depuis le début de mes études et de la rédaction de ce mémoire.

Enfin, un merci tout particulier à Steve, Thomas, Silvia, Corentin et Ludovic pour leur disponibilité, leurs encouragements et leurs précieux conseils.

(5)

III

Table des matières

Remerciements... II Liste des illustrations ... VI Liste des tableaux ... VII Liste des abréviations ... VIII

1. Introduction ... 1

1.1 Objectifs ... 2

1.2 Méthodologie ... 3

1.3 Plan ... 4

2. La traduction automatique (TA) ... 5

2.1 Définition ... 5

2.2 Historique ... 6

2.3 Les différents systèmes ... 8

2.3.1 Les systèmes basés sur les règles ... 9

2.3.2 Les systèmes basés sur les corpus ... 12

2.3.2.1 L’approche basée sur les exemples ... 12

2.3.2.2 L’approche statistique ... 13

2.3.2.3 Les systèmes neuronaux ... 15

2.4 La post-édition (PE) ... 20

2.4.1 Définition et caractéristiques ... 21

2.4.2 Qui sont les post-éditeurs et post-éditrices ? ... 24

2.4.3 Compétences nécessaires pour la PE... 25

2.4.4 Étapes de la PE ... 26

2.4.5 Productivité et qualité attendues ... 28

2.4.6 Distinction PE – révision ... 30

2.4.7 Conclusion TA et PE ... 32

3. Enseignement et PE ... 33

3.1 Secteur universitaire ... 33

3.2 Secteur professionnel ... 38

3.3 Conclusion enseignement et PE ... 39

4. Méthodologie ... 40

4.1 Objectifs et questions de recherche ... 40

4.2 Logiciels utilisés pour l’expérience ... 41

4.2.1 DeepL ... 42

(6)

IV

4.2.2 MateCat ... 43

4.3 Démarche ... 46

4.3.1 Calendrier et participant·e·s ... 46

4.3.2 Choix des textes et traduction ... 47

4.3.3 Traduction des textes choisis ... 50

4.3.4 Préparation de MateCat ... 51

4.3.5 Déroulement de l’expérience ... 52

4.3.6 Contribution des enseignant·e·s ... 55

4.3.7 Données collectées ... 56

5. Analyse des résultats ... 57

5.1 Questionnaires préliminaires ... 57

5.1.1 Étudiant·e·s ... 57

5.1.2 Professionnelle ... 58

5.2 Questionnaires de satisfaction ... 59

5.2.1 Questionnaire de satisfaction : étudiant·e·s ... 60

5.2.2 Questionnaire de satisfaction : professionnelle ... 62

5.3 Questionnaire des enseignant·e·s ... 63

5.4 Données objectives ... 65

5.4.1 Analyse des données fournies par MateCat ... 65

5.4.1.1 Résultats des étudiant·e·s ... 66

5.4.1.2 Résultats de la professionnelle... 67

5.4.2 Analyse des tâches : erreurs corrigées ou omises ... 68

5.4.2.1 Texte littéraire ... 72

5.4.2.2 Texte économique ... 82

5.4.2.3 Texte journalistique ... 90

5.4.2.4 Conclusion de l’analyse ... 99

5.4.3 Test de reconnaissance TH – TA ...102

5.4.3.1 Conclusion test de reconnaissance TH – TA ...105

6. Conclusion ...106

6.1 Synthèse et questions de recherche ...106

6.2 Limites et perspectives ...110

7. Webographie ...112

8. Bibliographie ...113 Annexes ... I

(7)

V 1) Évaluation DeepL – ONUG ... I 2) PowerPoint de présentation du projet ... IV 3) Formulaire de consentement ... VII 4) Questionnaire 1 étudiant·e·s : connaissances préalables ... VIII 5) Questionnaire 1 professionnelle : connaissances préalables ... X 6) Questionnaire 2 étudiant·e·s : satisfaction ... XII 7) Questionnaire 2 professionnelle : satisfaction ... XIV 8) Questionnaire enseignant·e·s ... XVI 9) E-mail d’explication de l’expérience ... XVIII 10) Guide d’utilisation de MateCat ... XIX 11) TAUS Guidelines ... XXIV 12) Texte littéraire à réviser/post-éditer ... XXVIII 13) Texte économique à réviser/post-éditer ... XXIX 14) Texte journalistique à réviser/post-éditer ... XXX 15) Traduction texte littéraire A ... XXXI 16) Traduction texte littéraire B ... XXXII 17) Traduction texte économique A... XXXIII 18) Traduction texte économique B ... XXXIV 19) Traduction texte journalistique A ... XXXV 20) Traduction texte journalistique B ... XXXVI 21) Critères de révision... XXXVII 22) Résultats premier échantillon de participant·e·s ... XXXVIII

(8)

VI

Liste des illustrations

Figure 1 : Classification des types de traduction de Hutchins et Somers (1992), adapté

par Volkart (2018, p. 7) ... 5

Figure 2 : Triangle de Vauquois (Taghbalout, Ataa Allah, & El marraki, 2014, p. 2) ... 9

Figure 3 : Étapes systèmes directs (Quah, 2006, p. 70) ... 10

Figure 4 : Systèmes linguistiques par interlangue (Hutchins, 1992, p. 74) ... 10

Figure 5 : Systèmes par transfert (Jurafsky, 2000, p. 808) ... 11

Figure 6 : Fonctionnement systèmes basés sur les exemples (Quah, 2006, p. 81) ... 12

Figure 7 : Exemple d'architecture d'un système statistique (Quah, 2006, p. 78) ... 13

Figure 8 : Exemple probabilités systèmes statistiques (Koehn, 2010, p. 84) ... 14

Figure 9 : Fonctionnement encodeur (Forcada, 2017, p. 20) ... 16

Figure 10 : Fonctionnement du décodeur (Forcada, 2017, p. 21) ... 16

Figure 11 : Résultats évaluation systèmes de traduction automatiques (https://www.deepl.com/press.html, consulté le 20.03.2019) ... 17

Figure 12 : Fichier Excel évaluation DeepL ... 18

Figure 13 : Résulats évaluation DeepL - TAPTA4UN ... 19

Figure 14 : Résultats critères expression et sens ... 19

Figure 15 : Modèle de révision proposé par Bisaillon (2007, p. 45) ... 30

Figure 16 : Regroupement et nombre des types d'erreurs du corpus de TA (Daems et al., 2015, p. 7) ... 33

Figure 17: Interface options MateCat ... 43

Figure 18 : Interface options MateCat ... 43

Figure 19 : Paramétrage MateCat - mémoires de traduction ... 44

Figure 20 : Traduction finale TH-TA groupe A... 51

Figure 21 : Traduction finale TH-TA groupe B ... 51

Figure 22 : Interface traduction/révision MateCat ... 53

Figure 23 : Fichier Excel - test de reconnaissance TH-TA ... 54

Figure 24 : Utilité intégration TA (PE) – étudiant·e·s ... 61

Figure 25 : Fréquence PE enseignement - enseignant·e·s ... 64

Figure 26 : Exemple corrections - texte littéraire ... 68

Figure 27 : Catégories d'erreurs par texte analysé ... 71

Figure 28 : Nombre et type d'erreurs texte littéraire – TH et TA ... 72

Figure 29 : Nombre et type d'erreurs graves texte littéraire – TH et TA ... 73

Figure 30 : Nombre et type d'erreurs texte économique – TH et TA ... 82

Figure 31 : Nombre et type d'erreurs graves texte économique - TH et TA ... 83

Figure 32 : Nombre et type d'erreurs texte journalistique – TH et TA ... 90

Figure 33 : Nombre et type d'erreurs graves texte journalistique - TH et TA ... 91

Figure 34 : Résultats – test de reconnaissance ...103

Figure 35 : Test de reconnaissance - groupes A et B ...104

Figure 36 : Résumé erreurs graves repérées ...108

Figure 37 : Résumé total d'erreurs repérées ...109

(9)

VII

Liste des tableaux

Tableau 1 : Exemples PE de TAN minimale et maximale (Deneufbourg, 2019) ... 23

Tableau 2 : Compétences nécessaires à la PE (O’Brien, 2005 ; Saint-André, 2015) ... 25

Tableau 3 : Types d'erreurs commises par les systèmes de TA, adapté de O'Brien (2010) ... 31

Tableau 4 : Données fournies par MateCat ... 45

Tableau 5 : Detailed log fourni par MateCat ... 45

Tableau 6 : Répartition participant·e·s ... 47

Tableau 7 : Lien données recueillies et questions de recherche ... 56

Tableau 8 : Lien question de recherche et données collectées - questionnaire de satisfaction ... 59

Tableau 9 : Résultats MateCat étudiant·e·s - texte littéraire ... 66

Tableau 10 : Résultats MateCat étudiant·e·s - texte économique ... 66

Tableau 11 : Résultats MateCat étudiant·e·s - texte journalistique ... 66

Tableau 12 : Résultats MateCat professionnelle ... 67

Tableau 13 : Questions de recherches et données collectées - analyse des tâches ... 70

Tableau 14 : Corrections texte littéraire – post-édition ... 74

Tableau 15 : Texte littéraire post-édition – NS ... 74

Tableau 16 : Texte littéraire post-édition – FS ... 75

Tableau 17 : Texte littéraire post-édition – GL ... 76

Tableau 18 : Texte littéraire post-édition – MD et VOC ... 76

Tableau 19 : Texte littéraire post-édition - VOC ... 77

Tableau 20 : Corrections texte littéraire - révision ... 78

Tableau 21 : Texte littéraire révision - FS ... 78

Tableau 22 : Texte littéraire révision - O et OM ... 79

Tableau 23 : Texte littéraire révision – manque de clarté et GL ... 80

Tableau 24 : Corrections texte économique – post-édition ... 84

Tableau 25 : Texte économique post-édition – FS ... 85

Tableau 26 : Texte économique post-édition – GL ... 85

Tableau 27 : Texte économique post-édition – SYN ... 86

Tableau 28 : Texte économique post-édition - VOC et TER ... 87

Tableau 29 : Corrections texte économique – révision ... 88

Tableau 30 : Texte économique révision – TER ... 89

Tableau 31 : Corrections texte journalistique – post-édition ... 92

Tableau 32 : Texte journalistique post-édition – NS... 93

Tableau 33 : Texte journalistique post-édition - CS ... 94

Tableau 34 : Texte journalistique post-édition – FS ... 94

Tableau 35 : Texte journalistique post-édition – VOC ... 95

Tableau 36 : Traduction journalistique post-édition – SYN ... 95

Tableau 37 : Texte journalistique post-édition - O ... 96

Tableau 38 : Corrections texte journalistique – révision ... 96

Tableau 39 : Texte journalistique révision – FS ... 97

Tableau 40 : Texte journalistique révision – GL ... 98

Tableau 41 : Texte journalistique révision – O ... 98

Tableau 42 : Classement des erreurs graves des plus au moins repérées – PE ...100

(10)

VIII Tableau 43 : Classement des erreurs graves des plus au moins repérées – révision ...101 Tableau 44 : Question de recherche et données collectées - test de reconnaissance ...102 Tableau 45 : Résumé résultats MateCat ...107

Liste des abréviations

FTI Faculté de traduction et interprétation

MATCOM Maîtrise en traduction et communication spécialisée multilingue MATS Maîtrise en traduction spécialisée

MATT Maîtrise en traduction et technologie MT mémoire de traduction

PE post-édition

PEE post-editing effort

SMT statistical machine translation TA traduction automatique

TAAH traduction automatique assistée par l’humain TAN traduction automatique neuronale

TAO traduction assistée par ordinateur TAS traduction automatique statistique

TEAHQ traduction entièrement automatique de haute qualité

TH traduction humaine

THAO traduction humaine assistée par ordinateur TIM traitement informatique multilingue

(11)

1

1. Introduction

Le domaine des technologies de la traduction a toujours suscité de vives réactions du personnel de traduction, qu’elles soient positives ou négatives. Comme l’explique Gaspari (2001), les progrès enregistrés par la traduction automatique seront forcément critiqués par certain·e·s professionnel·le·s pour différentes raisons, telles que les doutes quant à l’avenir de leur métier. Ces craintes sont compréhensibles au vu de l’expansion qu’a connue la traduction automatique ces dernières années, notamment depuis l’arrivée des systèmes neuronaux sur le marché. En effet, en 2017 déjà, la traduction automatique produisait plus de 100 000 millions de mots par jour (Casacuberta Nolla & Peris Abril, 2017). Au vu de cette évolution, les services linguistiques sont de plus en plus nombreux à demander au personnel de traduction de corriger les textes produits par des systèmes de traduction automatique, tâche que l’on appelle « post-édition ». Il paraît donc indispensable que les traducteurs et traductrices prennent connaissance de ces changements et se renseignent sur les moyens d’intégrer la TA et la PE à leur travail quotidien. Néanmoins, un grand nombre de traducteurs et de traductrices expérimenté·e·s n’ont pas suivi de formation spécifique en traduction automatique ou en post-édition, car ces thématiques n’étaient pas encore dispensées. Encore aujourd’hui, les formations en traduction au niveau universitaire ne contiennent pas toutes des modules consacrés à la TA et à la PE. Et si ces modules sont proposés, ils ne sont généralement pas obligatoires. Le besoin de formation en post-édition se fait donc cruellement ressentir, en particulier pour la nouvelle génération de traducteurs et de traductrices, qui seront nécessairement confronté·e·s à la TA au cours de leur future carrière.

(12)

2 1.1 Objectifs

Ce mémoire vise deux objectifs principaux. Le premier consiste à évaluer dans quelle mesure la post-édition (PE) pourrait être intégrée à un cours de traduction « classique ».

En l’espèce, nous nous intéresserons au cours de « Traduction et révision EN/FR » donné à la Faculté de traduction et interprétation (FTI), dont l’intitulé sera modifié en

« Traduction, révision et post-édition EN/FR » dès le semestre de printemps 2020.

Concernant le déroulement d’un cours de ce type, les enseignant·e·s fournissent généralement des textes à l’avance qu’ils et elles mettent à disposition sur la plateforme Moodle ; dans notre cas, il peut s’agir de textes à traduire ou à réviser. Les étudiant·e·s les préparent et les traduisent individuellement et ont la possibilité de faire corriger leur travail. Celui-ci sera ensuite discuté en cours avec l’enseignant·e qui proposera des corrections, remarques ou suggestions fondées à la fois sur les travaux reçus et sur les propositions des étudiant·e·s présent·e·s. Nous chercherons à déterminer quel serait le meilleur moyen d’intégrer la PE dans un cours ayant ce type de configuration, à la fois pour les étudiant·e·s et pour les enseignant·e·s.

Le deuxième objectif concerne plus particulièrement le point de vue des étudiant·e·s sur la question et leurs aptitudes actuelles en post-édition. Puisqu’ils et elles seront principalement concerné·e·s par ce changement, il est important de prendre en compte leur opinion et de comprendre leur ressenti vis-à-vis de la post-édition de manière générale. Pour ce faire, nous nous appuierons entre autres sur leurs connaissances préalables et leur envie d’en apprendre davantage sur la PE à la suite de l’expérience effectuée dans le cadre de ce mémoire. Nous déterminerons aussi les éléments qu’il serait pertinent d’intégrer à l’enseignement de la PE, grâce à l’analyse des révisions et post- éditions effectuées lors de l’expérience.

(13)

3 1.2 Méthodologie

Nous avons d’abord créé des questionnaires préliminaires pour les participant·e·s, afin de déterminer leur profil (formations suivies, combinaison linguistique, etc.).

Nous avons ensuite conduit une expérience qui consistait à corriger des textes de types différents. Pour ce faire, nous avons fait appel à des étudiant·e·s ainsi qu’à une professionnelle. Leurs tâches consistaient à réviser des segments provenant de la traduction humaine et à post-éditer des segments provenant de la traduction automatique. Les participant·e·s ont effectué les corrections sans connaître la provenance des traductions proposées, afin qu’ils et elles ne se laissent pas influencer dans leur travail. Puis, nous avons analysé ces corrections en nous fondant sur les versions corrigées des textes fournies par les enseignant·e·s. Nous nous sommes concentrée sur les erreurs graves et avons passé en revue divers exemples issus de la post-édition et de la révision, afin de vérifier si toutes les modifications nécessaires avaient été effectuées. À la suite de l’expérience, les participant·e·s ont complété un test de reconnaissance, où ils et elles devaient déterminer l’origine des segments (TA ou TH).

Enfin, nous avons créé des questionnaires de satisfaction, où les participant·e·s pouvaient notamment exprimer leur avis sur l’expérience et sur l’intégration de la TA (post-édition) à l’enseignement de la traduction.

En suivant cette méthodologie, nous souhaitions répondre à deux principales questions de recherche :

Comment les étudiant·e·s et enseignant·e·s perçoivent-ils ou perçoivent-elles l’intégration de la post-édition à un cours de traduction et révision ?

Comment se « comportent » les étudiant·e·s face à une tâche de post-édition ?

(14)

4 1.3 Plan

Après avoir exposé nos objectifs pour ce mémoire, nous présenterons la traduction automatique au chapitre 2. Nous évoquerons l’histoire de la TA et distinguerons les différents types de systèmes. Enfin, nous nous intéresserons à la post-édition et détaillerons les étapes du processus.

Le chapitre 3 sera consacré à l’enseignement de la post-édition. Nous citerons certaines études universitaires conduites sur le sujet et mentionnerons des formations proposées dans diverses universités. Nous aborderons ensuite les modules d’enseignement dispensés dans le monde professionnel.

Nous exposerons la méthodologie de notre travail au chapitre 4. Nous présenterons les logiciels utilisés, puis nous détaillerons les étapes suivies pour notre expérience ainsi que les données collectées.

Le chapitre 5 comportera la plus grande partie de notre travail : l’analyse des résultats.

Nous présenterons d’abord les données subjectives, soit les réponses obtenues aux différents questionnaires. Nous passerons ensuite à l’analyse des données objectives qui serviront à comparer les post-éditions et les révisions effectuées par les participant·e·s, avant de dévoiler les résultats du test de reconnaissance des segments issus de la TA et de la TH.

Dans notre conclusion au chapitre 6, nous présenterons les résultats de notre expérience, nous évoquerons les limites de notre travail et nous proposerons différentes pistes de recherches qui pourront être conduites à l’avenir.

(15)

5

2. La traduction automatique (TA)

La traduction automatique est un domaine qui suscite de vives réactions de la part des professionnel·le·s et fait également l’objet de multiples études. En 2018 par exemple, le nombre de recherches disponibles sur la plateforme Google Scholar qui traitaient de près ou de loin de la traduction neuronale s’élevait à 6 000, soit près du double par rapport à 2017 (Diño, 2019).

Dans cette section, nous nous intéresserons à la traduction automatique dans son ensemble. Nous commencerons par définir celle-ci (section 2.1), nous retracerons brièvement son historique (section 2.2), puis nous citerons les différents types de systèmes (section 2.3) avant de passer à la post-édition (section 2.4).

2.1 Définition

Selon Bouillon et Clas, « [l]a traduction automatique (TA) se définit comme l’application de l’informatique à la traduction des textes d’une langue naturelle de départ (ou langue source LS) dans une langue d’arrivée (ou langue cible LC). » (1993, p. 15) Si l’on se base sur cette définition, la traduction automatique constitue un domaine relativement vaste qui, de ce fait, peut regrouper différents degrés d’automatisation du processus de traduction, tels que la TEAHQ (traduction entièrement automatique de haute qualité) ou la TAAH (traduction automatique assistée par l’homme) (Bouillon & Clas, 1993, p. 15).

Hutchins et Somers (1992) ont proposé une classification du domaine qui place ces différents types d’automatisation sur un axe et qui permet une meilleure visualisation du domaine (voir Figure 1) :

Figure 1 : Classification des types de traduction de Hutchins et Somers (1992), adapté par Volkart (2018, p. 7)

(16)

6 Plus un système est placé vers la gauche de l’axe, plus l’intervention de la machine est importante. Inversement, plus un système est placé vers la droite, plus l’intervention de l’humain est importante. La traduction automatique regroupe donc tous les types de traduction compris entre la TEAHQ et la TAAH. La TAO (traduction assistée par ordinateur), quant à elle, regroupe les systèmes dont l’automatisation « s’applique à des parties du processus ou à une tâche précise qui lui est associée » (L’Homme, 2008, p. 11), soit les systèmes compris entre la TAAH et la THAO (traduction humaine assistée par ordinateur).

2.2 Historique

Les prémices de la traduction automatique sont apparues au XVIIe siècle, où l’on mentionne l’idée de « dictionnaires mécaniques ». Descartes et Leibniz ont également réfléchi au concept « d’universalité » des langues et de la possibilité de les déchiffrer (Hutchins, 1992, p. 5). La volonté de communiquer avec des personnes issues des quatre coins du monde était donc déjà présente à cette époque, même si les moyens techniques n’étaient pas encore suffisamment développés pour surmonter les obstacles d’un tel projet.

En 1933, les premiers brevets ont été déposés par le franco-arménien George Artsouni et le russe Petr Smirnov-Troyanskii (Hutchins, 1992). Le premier a inventé un système sous forme de dispositif de stockage qui servirait à trouver des équivalents dans n’importe quelle langue. Le second a développé un projet en trois étapes : premièrement, un éditeur ou une éditrice, ne connaissant que la langue source, effectuerait une analyse de la

« logique » et de la syntaxe des mots à traduire ; ensuite, une machine transposerait ces séquences de langue source en langue cible ; enfin, un éditeur ou une éditrice, ne connaissant que la langue cible cette fois-ci, adapterait ces séquences aux normes et aux usages de sa langue (Hutchins, 1992).

C’est à partir des années 1950 que sont apparues les premières recherches, conduites par l’américain Warren Weaver (L’Homme, 2008). Les chercheurs et chercheuses de cette époque pensaient qu’un ordinateur réussirait un jour à surmonter les difficultés causées par le passage d’une langue à une autre, et qu’une traduction exclusivement automatique

(17)

7 serait donc possible. Les systèmes dits de première génération sont apparus à cette époque ; ils recouraient à une traduction mot-à-mot et ne possédaient pas de réelles connaissances linguistiques (Quah, 2006).

Malgré cette progression dans le domaine, l’enthousiasme général s’est essoufflé assez rapidement dès les années 1960 : les chercheurs et chercheuses ont pris conscience de la complexité que requiert l’automatisation du processus de traduction, puisque la traduction « fait appel non seulement à des connaissances linguistiques, mais aussi à des connaissances du monde. » (L’Homme, 2008, p. 13) En 1964, la commission américaine ALPAC (Automatic Language Processing Advisory Committee) a publié un rapport concernant l’état de la recherche en traduction automatique. Élle en a conclu que la TA coûtait plus cher que la TH et était de moins bonne qualité. Ainsi, il n’était pas nécessaire de poursuivre les recherches ; il valait mieux se concentrer sur le développement d’outils d’aide à la traduction. Ce rapport a été largement critiqué pour son manque d’objectivité, mais les fonds pour la recherche se sont tout de même taris, car l’influence de la commission était très importante aux États-Unis (Hutchins, 1992).

Malgré tout, certains groupes de recherche ont persévéré et ont obtenu de bons résultats, notamment celui à l’origine du système METEO au Canada proposant des « traductions presque parfaites de bulletins météorologiques de l’anglais au français » (L’Homme, 2008, p. 14).

Il faut attendre les années 1970 pour que la traduction automatique se retrouve à nouveau sous le feu des projecteurs grâce à plusieurs projets, notamment la création du système Systran et le lancement d’EUROTRA, projet de traduction automatique multilingue financé par la Communauté économique européenne (CEE) (Bouillon & Clas, 1993 ; L’Homme, 2008). La vision et les attentes de la traduction automatique ont alors changé : les chercheurs et chercheuses n’essayaient plus d’entraîner les systèmes à produire des traductions parfaites, mais se concentraient sur certains aspects spécifiques, tels que la « restriction à des sous-domaines de spécialité ou à des textes bien précis » (L’Homme, 2008, p. 15).

Durant les années 1980, les recherches se sont poursuivies, galvanisées par les progrès en linguistique informatique. Ces avancées auront notamment permis de développer les systèmes dits indirects (Quah, 2006) (voir section 2.3.1).

(18)

8 Les années 1990 ont marqué le développement de systèmes créés à partir de deux nouvelles approches fondées sur des corpus : l’une basée sur des méthodes statistiques et l’autre basée sur l’exemple (Quah, 2006). Durant cette même période, de nombreux changements ont complètement bouleversé la communication internationale, notamment l’apparition d’Internet et de systèmes de télécommunication avancés. Depuis, les recherches dans le domaine de la traduction automatique se sont multipliées et se sont élargies à d’autres thématiques, telles que la reconnaissance vocale (Quah, 2006).

Depuis les années 2000, la TA enregistre de nombreux progrès, notamment avec le lancement des systèmes de troisième génération, qui combinent les approches linguistiques et statistiques (Quah, 2006). Les systèmes neuronaux ont par ailleurs connu un véritable essor ces dernières années, ce qui a fortement changé le domaine de la traduction automatique. En outre, des nouveaux systèmes de TA gratuits et disponibles en ligne sont apparus, de même que des applications mobiles qui proposent même des services d’interprétation instantanée.

2.3 Les différents systèmes

Les systèmes de traduction automatique peuvent se classer dans différentes catégories selon les critères qui nous intéressent : paires de langue, direction ou types de connaissance utilisée (Bouillon & Clas, 1993). Nous nous intéresserons au mode de fonctionnement des systèmes, soit le type de données sur lesquelles ils se fondent pour produire une traduction. Nous pouvons citer les systèmes qui utilisent des règles linguistiques (règles syntaxiques, morphologie, etc.) et ceux qui ont recours à des données non linguistiques telles que des corpus (Bouillon & Clas, 1993).

Dans les sections suivantes, nous passerons brièvement en revue les caractéristiques des différents types de systèmes existants, en commençant par décrire les systèmes basés sur les règles (section 2.3.1), puis ceux basés sur les corpus (section 2.3.2).

(19)

9 2.3.1 Les systèmes basés sur les règles

Les systèmes linguistiques sont dotés de connaissances sur la langue et sont capables de détecter les mots, de déterminer leur catégorie grammaticale et leur variation flexionnelle, d’analyser la syntaxe et d’interpréter certaines informations sémantiques (L’Homme, 2008).

Le triangle de Vauquois est la représentation la plus utilisée pour décrire ce type de systèmes (voir Figure 2) :

Figure 2 : Triangle de Vauquois (Taghbalout, Ataa Allah, & El marraki, 2014, p. 2)

Comme l’explique L’Homme :

« Plus on analyse le texte source, plus la représentation intermédiaire est épurée et peut être réutilisée directement pour la génération du texte cible sans passer par un module de transfert proprement dit. Én revanche, lorsque l’analyse du texte source est sommaire (comme, par exemple, en traduction directe), un grand nombre de correspondances interlinguistiques doivent être formulées. » (2008, p. 258)

Cette catégorie regroupe deux types de systèmes principaux : les systèmes directs et les systèmes indirects.

• Les systèmes directs, parfois également appelés de première génération, sont bilingues et unidirectionnels ; la traduction s’effectue mot à mot à l’aide d’un dictionnaire bilingue et la compréhension s’arrête au niveau lexical (Bouillon & Clas, 1993).

(20)

10 Nous pouvons résumer les étapes suivies par ces systèmes de la façon suivante (voir Figure 3) :

Figure 3 : Étapes systèmes directs (Quah, 2006, p. 70)

• Quant aux systèmes indirects, dits de seconde génération, ils effectuent une analyse plus approfondie du texte source, mettant en relation les représentations contenues dans la source avec celles contenues dans la cible. Ces représentations sont d’ordre linguistique et contiennent les catégories grammaticales, les fonctions syntaxiques et parfois le sens des mots (Bouillon & Clas, 1993). Elles peuvent être traitées par deux approches différentes : par interlangue ou par transfert.

o L’approche par interlangue fonctionne en deux étapes : extraire la représentation commune à toutes les langues, puis produire une traduction à partir de cette même représentation (Bouillon & Clas, 1993). L’idée principale est donc de représenter toutes les phrases qui expriment la « même » idée de la même façon, quelle que soit la langue (Jurafsky, 2000).

Cette approche peut donc être schématisée de la manière suivante (voir Figure 4) :

Figure 4 : Systèmes linguistiques par interlangue (Hutchins, 1992, p. 74)

(21)

11 Un système par interlangue traduisant d’une langue A vers une langue B pourra donc utiliser la même représentation générée à partir de ces langues lorsqu’il traduira d’une langue A vers une langue C par exemple ; seules les règles et normes propres à chaque langue sont définies (L’Homme, 2008). Le problème posé par ce type d’approche est que l’interlangue ne sera jamais totalement indépendante des langues traitées : les distinctions importantes pour la traduction ne sont pas nécessairement identiques pour chaque langue. Aussi cette approche n’a-t-elle que rarement été utilisée par les systèmes commerciaux (L’Homme, 2008).

o L’approche par transfert fonctionne en trois étapes principales, qui peuvent être représentées selon le schéma suivant (voir Figure 5) :

Figure 5 : Systèmes par transfert (Jurafsky, 2000, p. 808)

1. L’analyse (parsing) : le logiciel extrait les informations dont il a besoin pour identifier le sens des mots et représenter les phrases (source language parse tree). Il se sert d’un dictionnaire pour repérer les mots, analyse la flexion et effectue une analyse syntaxique.

2. Le transfert (transfer) : le logiciel met en relation les informations qu’il a extraites du texte source avec celles dont il a besoin pour produire la représentation cible (target language parse tree).

3. La génération (generation) : le logiciel produit une traduction à partir de la représentation cible qui est conforme aux règles de la langue cible (L’Homme, 2008).

(22)

12 Les logiciels ayant recours à cette approche sont capables d’effectuer des analyses plus approfondies que celles des systèmes directs, mais leur paramétrage est dépendant des paires de langues avec lesquelles ils travaillent, contrairement au système par interlangue. (L’Homme, 2008)

2.3.2 Les systèmes basés sur les corpus

Les systèmes basés sur les corpus s’entraînent et se fondent sur des ensembles de textes et non des connaissances linguistiques, ils peuvent recourir à une approche basée sur l’exemple ou à une approche statistique (Bouillon & Clas, 1993). En outre, une nouvelle approche a fait son apparition : la traduction neuronale. Elle se base sur des réseaux de neurones et monopolise les recherches depuis son introduction (Diño, 2019).

2.3.2.1 L’approche basée sur les exemples

Les systèmes basés sur les exemples vont recourir à des exemples préexistants afin de fournir des traductions par analogie (Bouillon & Clas, 1993). Ils se fondent donc sur un corpus bilingue composé de segments sources alignés aux segments cibles correspondants que l’on appelle des « exemples ». Ils utilisent un algorithme qui compare l’exemple en langue source le plus proche de la phrase à traduire avec sa traduction en langue cible qui servira de point de départ pour la traduction (Quah, 2006).

Le fonctionnement de ces systèmes se déroule en trois étapes (voir Figure 6) :

Figure 6 : Fonctionnement systèmes basés sur les exemples (Quah, 2006, p. 81)

(23)

13 1. Comparaison des segments du nouveau texte source avec les exemples existants

extraits du corpus bilingue ;

2. Alignement des segments en question ;

3. Recombinaison de ces segments afin de générer le texte cible (Quah, 2006).

2.3.2.2 L’approche statistique

Les systèmes statistiques, quant à eux, extraient des probabilités des corpus bilingues qu’ils utilisent afin de générer la traduction (Bouillon & Clas, 1993). Ils ne se contentent pas de fournir une seule proposition de traduction qui est optimale : « [statistical machine translation] focuses on generating many thousands of hypothetical translations for the input string, and then working out which one of those is most likely. » (Hearne & Way, 2011, p. 2) Ils sont généralement conçus de la façon suivante (voir Figure 7) :

Figure 7 : Exemple d'architecture d'un système statistique (Quah, 2006, p. 78)

Selon Hearne et Way (2011), ces systèmes suivent deux types de processus :

1. L’entraînement : cette étape comprend l’extraction d’un modèle statistique de traduction (appelé « modèle de traduction ») à partir d’un corpus parallèle d’une part, et d’un modèle statistique de la langue cible (appelé « modèle de langue ») à partir d’un corpus monolingue d’autre part.

(24)

14 o Modèle de traduction : ce premier modèle contient un dictionnaire bilingue où chaque traduction possible d’un mot source, ou d’une séquence de mots sources, est accompagnée d’une probabilité calculée selon la fréquence d’apparition dans le corpus. Ces données sont présentées sous forme de table de traduction, comme illustré dans l’exemple suivant de Koehn (2010) (voir Figure 8) :

Figure 8 : Exemple probabilités systèmes statistiques (Koehn, 2010, p. 84)

Pour chaque unité lexicale de la langue source (« das » « Haus » « ist »

« klein »), toutes les traductions possibles sont classées selon leur probabilité. Dans le cas de la Figure 8, la traduction proposée sera donc the house is small.

o Modèle de langue : ce second modèle consiste en une base de données comprenant des séquences de mots de la langue cible (appelées aussi « n- grammes »), chacune également accompagnée d’une probabilité. Il permet donc d’évaluer si une séquence donnée est correcte en langue cible. En effet, le fond est certes très important lorsque l’on produit une traduction, mais la forme l’est tout autant. Ainsi, ce modèle sert à rendre la version cible aussi fluide que possible (Koehn, 2010).

2. Le décodage : cette étape traite la traduction comme un problème de recherche.

Selon la séquence à traduire, le système va rechercher, parmi toutes les traductions autorisées par le modèle de traduction, celle qui aura la probabilité générale la plus élevée selon les modèles de langage et de traduction (Hearne &

Way, 2011).

(25)

15 2.3.2.3 Les systèmes neuronaux

La traduction neuronale fonctionne sur le même principe que la traduction statistique.

Les systèmes neuronaux sont également entraînés sur des corpus qui contiennent des milliers de données et qui sont composés de segments source et cible (Forcada, 2017).

Dans un système neuronal, les mots et les phrases sont représentés sous forme numérique, à l’aide de vecteurs. Pour extraire ces représentations, ces systèmes utilisent de puissantes techniques d’apprentissage automatique, telles que les « réseaux neuronaux ». Ceux-ci sont composés de neurones artificiels interconnectés qui ont la capacité d’apprendre par l’expérience (Casacuberta Nolla & Peris Abril, 2017). Les neurones qui composent ces réseaux seront activés par stimulation (positive ou négative), ce qui va également affecter les autres neurones auxquels ils sont reliés (Forcada, 2017).

Ces activations serviront à créer des plongements lexicaux, soit des représentations vectorielles des mots. La traduction automatique sera générée à partir de ces représentations.

Forcada (2017) explique le fonctionnement de ces vecteurs en prenant l’exemple d’une pièce rectangulaire qui est parfaitement alignée aux points cardinaux. Tout point dans cette pièce pourrait être localisé à partir du coin sud-ouest de la pièce (soit « l’origine ») à l’aide de trois nombres : le nombre de centimètres côté nord, le nombre de centimètres côté est et le nombre de centimètres en hauteur. Les concepts de la langue (soit les mots, les phrases) peuvent également être placés dans cette même pièce. Les concepts similaires seraient idéalement proches et auraient donc des coordonnées semblables, tandis que les concepts opposés seraient très éloignés et auraient des coordonnées très différentes. La seule différence réside dans la complexité du langage : trois dimensions ne sont pas suffisantes pour encoder tous ces mots et toutes ces représentations.

Afin de produire ces représentations, les systèmes neuronaux doivent être entraînés sur des corpus aussi grands que possible. Lors de cette étape d’entraînement, les algorithmes effectueront des corrections jusqu’à obtenir la traduction la plus proche possible des traductions de référence, généralement produites par des professionnel·le·s (Forcada, 2017).

(26)

16 Lors du processus de traduction, les systèmes de TAN utilisent un système d’encodeur et de décodeur pour produire le texte cible. L’encodeur analyse le segment source en procédant mot par mot jusqu’à encoder le segment complet et le transformer en vecteur (Bahdanau, Cho, & Bengio, 2014), comme illustré dans la figure suivante pour la phrase

« My flight is delayed. » (voir Figure 9) :

Figure 9 : Fonctionnement encodeur (Forcada, 2017, p. 20)

Le décodeur utilise le vecteur produit par l’encodeur comme base (Bahdanau et al., 2014) dans sa recherche des traductions les plus probables pour chaque partie du segment, jusqu’à obtenir la traduction finale (voir Figure 10) :

Figure 10 : Fonctionnement du décodeur (Forcada, 2017, p. 21)

La révolution de ces systèmes réside dans la représentation de la phrase complète sous forme vectorielle. La traduction sera donc générée à partir de cette représentation, ce qui permet d’obtenir de bons résultats du point de vue du choix des mots, de la morphologie et des phrases dites « fractionnées » (comme dans le cas de l’allemand et des verbes à particule) (Koehn, 2016).

(27)

17 Grâce à cette nouvelle technologie neuronale, les traductions fournies par les systèmes de TAN semblent donc de meilleure qualité que celles fournies par les systèmes de TAS. En effet, de nombreuses études conduites avec des professionnel·le·s l’ont démontré, notamment celle menée par l’équipe de DeepL. Les traducteurs et traductrices préféreraient sensiblement les traductions de ce système à celles d’autres traducteurs automatiques1, comme le montrent les graphiques suivants présentés sur le site officiel2 (voir Figure 11) :

Figure 11 : Résultats évaluation systèmes de traduction automatiques (https://www.deepl.com/press.html, consulté le 20.03.2019)

Nous pouvons remarquer que ce système est considéré comme étant le plus performant quelle que soit la combinaison de langues concernée. Si nous nous penchons sur la combinaison EN-FR, soit celle qui correspond à notre expérience, nous constatons que DeepL surpasse de loin les autres systèmes. D’autres études l’ont également démontré, telles que celle de Volkart (2018) : l’effort de post-édition pour les segments issus de DeepL (système de TAN) était bien moins élevé que celui enregistré pour les segments issus du logiciel Microsoft Translator Hub – MTH (système de TAS).

En outre, une étude destinée uniquement à usage interne a été conduite dans le cadre professionnel de l’Office des Nations Unies de Genève et de New York en 2018. Elle portait sur une évaluation de deux logiciels de TA : DeepL et TAPTA4UN, un logiciel statistique interne. Ce dernier est à la disposition des traducteurs et des traductrices de l’ONU et a

1 https://www.letemps.ch/societe/deepl-meilleur-traducteur-automatique, consulté le 19.03.2019

2 https://www.deepl.com/press.html, consulté le 19.03.2019

(28)

18 été entraîné à l’aide d’un corpus de textes représentatifs des différents organes de l’Organisation.

La méthodologie de cette étude était la suivante : 1 000 segments issus de documents traités à l’ONU ont été sélectionnés et ont été traduits à l’aide des deux logiciels de TA ; l’ordre des traductions était aléatoire afin d’éviter de fausser les résultats (voir Annexes 1). Les participant·e·s étaient des collaborateurs ou collaboratrices professionnel·le·s de la traduction et/ou de la révision. L’évaluation s’est effectuée sur un fichier Excel qui se présentait de la façon suivante (voir Figure 12) :

Figure 12 : Fichier Excel évaluation DeepL

Dans la colonne « Segment » se trouvaient les segments sources. Dans les deuxième et cinquième colonnes, les segments cibles. Les colonnes « Expression », « Sens » et

« Préférence » servaient à évaluer chaque segment cible. Les critères d’évaluation étaient les suivants :

• Expression : il était demandé de noter la qualité de l’expression sur une échelle de 1 à 5, où 5=excellent, 4=bon, 3=passable, 2= non satisfaisant, 1=inutilisable.

• Sens : il était demandé de noter la restitution du sens sur une échelle de 1 à 5, où 5=le sens est intégralement restitué, 4=la plupart du sens est restituée, 3=une bonne partie du sens est restituée, 2=une faible partie du sens est restituée, 1=le sens n’est pas du tout restitué.

• Préférence : les participant·e·s devaient indiquer quelle traduction leur paraissait la meilleure en indiquant 1 ou 2 selon la colonne où se trouvait la traduction (1 pour la deuxième colonne et 2 pour la cinquième). Si la qualité des deux traductions était équivalente, les participant·e·s inscrivaient un 0.

(29)

19 Dans l’ensemble, les traductions proposées par DeepL ont été préférées à 62 % (voir Figure 13) :

Figure 13 : Résulats évaluation DeepL - TAPTA4UN

Concernant les critères d’évaluation, DeepL a obtenu de meilleures notes d’expression (Fluency) et de sens (Accuracy) que le second logiciel (voir Figure 14) :

Figure 14 : Résultats critères expression et sens

Il est intéressant de constater que même si le second logiciel a été entraîné à l’aide de textes de l’ONU, ce qui devrait être un avantage certain, DeepL est tout de même largement préféré par les participant·e·s. Nous remarquons donc que les résultats obtenus ici concordent avec ceux de l’étude menée par l’équipe de DeepL mentionnée plus haut. Nous tenons toutefois à préciser que l’étude conduite à l’ONU n’avait pas pour objectif d’être rendue publique et que les données présentées ici sont donnée à titre purement informatif.

(30)

20 Par ailleurs, la post-édition peut également jouer un rôle dans le processus d’entraînement des systèmes neuronaux : la mémoire de traduction du post-éditeur ou de la post-éditrice qui contient les données post-éditées peut être réintroduite dans le corpus d’entraînement afin que le système « apprenne » de ces changements (Diño, 2019). Même si les systèmes neuronaux sont plus performants que les autres types de systèmes, la tâche de post-édition reste et restera sensiblement la même, du moins dans un futur proche (Guerberof & Moorkens, 2019). Le seul aspect qui pourrait être modifié concerne le type d’erreurs commises par la TAN qui ressemblent davantage à celles de traducteurs et traductrices humain·e·s3 ; les post-éditeurs et post-éditrices devront donc s’éloigner des schémas d’erreurs que l’on retrouve habituellement dans les systèmes de TAS (voir section 2.4.6).

2.4 La post-édition (PE)

Intéressons-nous maintenant au point central de notre travail, la post-édition. Cette dernière s’est introduite dans le travail des traducteurs et des traductrices à la fin des années 1990. La qualité produite par les systèmes automatiques à cette période rendait la tâche particulièrement difficile (Guerberof & Moorkens, 2019). Désormais, la pratique de la post-édition est de plus en plus répandue, aussi bien dans les agences de traduction que dans les organes officiels. De plus, la qualité des traductions fournies automatiquement s’est nettement améliorée, notamment grâce au développement des systèmes neuronaux (voir section 2.3.2.3).

Dans cette section, nous définirons la tâche de post-édition ainsi que ses caractéristiques (section 2.4.1), nous tenterons de dresser le portrait d’un post-éditeur ou d’une post- éditrice (section 2.4.2), nous passerons en revue les différentes compétences nécessaires à cette pratique (section 2.4.3), nous détaillerons les étapes du processus (section 2.4.4), puis nous aborderons les concepts de productivité et de qualité (section 2.4.5) avant de distinguer la post-édition de la révision (section 2.4.6).

3 https://omniscien.com/riding-machine-translation-hype-cycle/, consulté le 14.06.2019

(31)

21 2.4.1 Définition et caractéristiques

Selon L’Homme, la post-édition se définit de la manière suivante : « [elle] consiste à corriger la traduction [automatique] brute afin de la rendre acceptable pour la diffusion. » (2008, p. 264) Il s’agit donc de retravailler une traduction qui a été produite par une machine, quelle qu’elle soit (linguistique, statistique ou encore neuronale) (voir section 2.3). Néanmoins, la post-édition peut également s’effectuer sur un texte cible provenant d’autres sources telles que des segments issus de mémoires de traduction (Saint-André, 2015).

Généralement, nous distinguons deux « types » principaux de post-édition :

Post-édition minimale (light post-editing ou « good enough » quality) : Selon les directives du TAUS4, elle doit être compréhensible (le contenu du message est préservé), et précise (le sens est identique à celui du texte source), mais le style peut être bancal. Les correcteurs et correctrices devraient viser les objectifs suivants :

o Restituer le sens du texte source ;

o Vérifier qu’aucune information n’a été ajoutée ou omise ;

o Retravailler certains passages pouvant être considérés comme inappropriés par la culture cible ;

o Maintenir le maximum de TA brute ;

o Vérifier que les règles d’orthographe sont respectées ; o Éviter de corriger le style.5

Ce type de post-édition ne sera donc pas adaptée à tous types de besoins : « Pour qu’une P[E] minimale convienne, la demande doit être urgente, et la circulation restreinte. De plus, le client [ou la cliente] doit savoir que le texte provient d’une TA suivie d’une P[E]. » (Saint-André, 2015, p. 30) Ainsi, une post-édition minimale peut être suffisante pour ceux et celles qui souhaiteraient simplement se faire une idée de la signification du texte source (Screen, 2019). Dans ce cas-là, le texte cible produit pourra atteindre cet objectif, même si la qualité n’est pas excellente.

4 https://www.taus.net/academy/best-practices/postedit-best-practices/machine-translation-post-editing- guidelines, consulté le 28.02.2019

5 idem

(32)

22

Post-édition maximale (full post-editing ou quality similar or equal to human translation) : toujours selon les mêmes directives6, elle doit être compréhensible (le message véhiculé est parfaitement clair) et exacte (le sens du texte cible est identique au texte source). Le style est correct et la qualité devrait être équivalente à celle fournie par un·e professionnel·le. Le texte est conforme aux règles de syntaxe, de grammaire et de ponctuation. Les correcteurs et correctrices devront s’assurer que les points suivants sont respectés :

o La traduction est correcte du point de vue de la grammaire, de la syntaxe et du sens ;

o La terminologie est correcte et les termes spécifiquement désignés par le client ou la cliente ne sont pas traduits ;

o La traduction ne comporte aucune omission et aucun ajout ; o Les possibles chocs culturels sont supprimés ;

o La TA brute a été maintenue au maximum ;

o Les règles de ponctuation, d’orthographe et de césure sont respectées ; o Le formatage est adapté.7

Ce type de post-édition est généralement recommandé pour tout texte officiel et/ou qui vise à être publié (Screen, 2019). Én effet, la qualité attendue d’une post- édition complète devrait être plus élevée que celle d’une post-édition minimale (Saint-André, 2015).

Les recommandations pour ces deux types de post-édition sont donc relativement semblables, notamment du point de vue du maintien de la TA brute. Cet aspect est particulièrement important, puisque la post-édition est bien une tâche de « révision » d’un texte produit automatiquement, et non une « (re)traduction ». De plus, le respect du sens est l’un des éléments qui doivent être le plus retravaillés dans les deux cas. La PE maximale, outre ces aspects, doit également tenir compte de toutes les règles régissant la langue cible (syntaxe, grammaire, ponctuation, orthographe, etc.). Comme il n’est fait aucune mention du style et de la fluidité en PE maximale, contrairement à la PE minimale,

6 https://www.taus.net/academy/best-practices/postedit-best-practices/machine-translation-post-editing- guidelines, consulté le 28.02.2019

7 idem

(33)

23 ces aspects seront probablement traités par les post-éditeurs et post-éditrices dans le but d’obtenir une qualité comparable à celle d’une traduction humaine.

Afin de mieux différencier ces deux types de post-édition, Deneufbourg (2019) présente les deux exemples concrets suivants (voir Tableau 1) :

N° exemple Texte source Texte cible

1 So our task here in Paris is to turn these achievements into an enduring framework for human progress.

Notre tâche aujourd’hui à Paris est donc de transformer ces réalisations en un cadre durable pour le progrès humain.

2 We stand united in solidarity not only to deliver justice to the terrorist network responsible for those attacks but to protect our people and uphold the enduring values that keep us strong and keep us free.

Nous sommes unis dans la solidarité non seulement pour rendre justice au réseau terroriste responsable de ces attentats, mais aussi pour protéger notre peuple et défendre les valeurs durables qui nous gardent forts et libres.

Tableau 1 : Exemples PE de TAN minimale et maximale (Deneufbourg, 2019)

Le segment 1 n’a pas besoin d’être modifié dans le cadre d’une PÉ minimale, car les lecteurs et lectrices sont capables de comprendre le message qui est véhiculé. Néanmoins, des corrections devront être apportées si une PE maximale est demandée, afin d’améliorer la fluidité de la version cible. Quant au segment 2, il doit être modifié dès la PE minimale, car il comporte un contre-sens, soit une erreur grave (voir section 5.4.2) :

« rendre justice » signifie « Reconnaître les droits, les mérites, la valeur de quelqu'un, de quelque chose8 » ; ici, le sens était plutôt celui de « faire justice de ».

Dans la pratique, la distinction entre PE minimale et maximale est parfois difficile à déterminer. Comme l’a constaté Deneufbourg (2019), les professionnel·le·s ont tendance à systématiquement corriger la TA, même dans le cadre d’une PÉ minimale, tandis que les étudiant·e·s sont plus susceptibles d’omettre des erreurs lors d’une PÉ maximale. Ce

8 https://www.cnrtl.fr/definition/justice, consulté le 13.06.2019

(34)

24 phénomène transparaît également dans notre expérience, comme nous le verrons à la section 5.4.2. Il paraît donc important d’établir un mandat de post-édition clair avec ses client·e·s plutôt que de convenir simplement d’une PÉ minimale ou maximale, afin d’évaluer plus efficacement le niveau réel d’intervention souhaité.

2.4.2 Qui sont les post-éditeurs et post-éditrices ?

La question ne semble pas encore résolue pour tous les acteurs et toutes les actrices du marché. Comme l’explique Saint-André, plusieurs options sont possibles : « des spécialistes du domaine, des linguistes, des assistants multilingues, des “personne[s]

sensibilisée[s] à l’art de la post-édition” ou même des bénévoles » (2015, p. 33‑34).

Néanmoins, plusieurs auteurs et autrices s’accordent à dire que le personnel de traduction est le plus à même d’effectuer cette tâche (Brunette & O’Brien, 2011). En effet, le TAUS9 mentionne que la post-édition bilingue est généralement confiée à un traducteur ou à une traductrice rémunéré·e (soit professionnel·le), mais que cette tâche peut également être attribuée à des expert·e·s bilingues ou à des volontaires selon les cas.

Si les traducteurs et traductrices semblent représenter les parfait·e·s candidat·e·s, le niveau d’expérience requis pour la post-édition ne constitue pas un consensus. Certain·e·s privilégient les traducteurs et traductrices expérimenté·e·s, car ils et elles sont généralement moins susceptibles d’être influencé·e·s par la TA. D’autres favoriseraient de jeunes professionnel·le·s, car ces derniers et dernières sont plus à l’aise dans l’utilisation d’outils informatiques qui sont indispensables au processus de post-édition (Saint-André, 2015).

Le choix final dépendra donc, d’une part, des préférences des client·e·s et de la politique de leur institution ou de leur entreprise et, d’autre part, du type de mandat dont il est question, du temps à disposition et de la formation suivie par les candidat·e·s.

9 https://www.taus.net/academy/best-practices/postedit-best-practices/machine-translation-post-editing- guidelines, consulté le 28.02.2019

(35)

25 2.4.3 Compétences nécessaires pour la PE

Les traducteurs et traductrices qui souhaiteraient s’adonner à la post-édition devront acquérir certaines compétences essentielles au préalable. En effet, cette tâche demande de solides connaissances dans plusieurs aspects de la langue et de la technologie notamment (O’Brien, 2005). Le Tableau 2 regroupe ces compétences dans trois catégories principales : les compétences linguistiques, les compétences informatiques, et les compétences générales et communicationnelles :

Compétences

« linguistiques »

Compétences

« informatiques »

Compétences

« générales » et

« communicationnelles » Maîtrise de la langue source Traitement de texte Solides connaissances de

domaines spécialisés Maîtrise de la langue cible Maîtrise des outils de TAO Maîtrise de la culture

source Notions de terminologie Connaissances en

traduction automatique

Maîtrise de la culture cible

Maîtrise de la traduction selon sa combinaison linguistique

Bases de données terminologiques

Compétences interpersonnelles

Notions de linguistique Création de dictionnaires pour la TA

Respect du mandat

Langage contrôlé Gestion du temps

Usage de macros Attitude positive envers la TA

Connaissances des outils de recherche documentaire

Résolution de problèmes

Tableau 2 : Compétences nécessaires à la PE (O’Brien, 2005 ; Saint-André, 2015)

(36)

26 Concernant les compétences linguistiques, nous pouvons remarquer que, comme pour la traduction, la maîtrise des langues source et cible est primordiale. En outre, certaines connaissances en terminologie et en linguistique sont souhaitables, car la TA est susceptible de commettre des erreurs qui appartiennent à ces catégories par exemple.

Pour ce qui est des compétences informatiques, des connaissances de tout type de logiciel ayant trait à la traduction et à sa gestion sont indispensables. En effet, les tâches de post- édition s’effectuent très fréquemment dans des logiciels de TAO (voir section 4.2.2). En outre, certaines connaissances en programmation peuvent être utiles afin d’améliorer les systèmes de TA à disposition.

Enfin, de nombreuses compétences ne concernant pas directement la traduction ou la post-édition sont nécessaires. Les post-éditeurs et post-éditrices doivent non seulement être doté·e·s d’une excellente culture générale, mais doivent également être capables de réaliser leur mandat en respectant les exigences de leurs client·e·s. En outre, ceux et celles ayant une attitude positive envers l’usage de la TA semblent être plus performant·e·s dans leur tâche que ceux et celles qui sont forcé·e·s d’y avoir recours (O’Brien, 2005).

Notons que la classification présentée ici est une version simplifiée et non exhaustive des compétences nécessaires à tout post-éditeur ou à toute post-éditrice ; l’ajout de sous- catégories permettrait de traiter ce sujet de manière plus approfondie. Afin de faciliter la visualisation des compétences, nous nous sommes volontairement tournée vers un classement plus modeste et généralisé.

2.4.4 Étapes de la PE

Avant même d’amorcer le processus de post-édition, les post-éditeurs et post-éditrices doivent prendre en compte plusieurs éléments qui concernent l’ensemble du projet :

1. Le client ou la cliente : quels sont les produits et services vendus et quel est le marché dans lequel il ou elle évolue ;

2. Le domaine : quel est le domaine auquel appartient le projet ;

3. La description des textes : quel est le contenu des types de texte à traduire ; 4. Le glossaire : quel est le type de glossaire fourni, s’il provient du client ou de la

cliente, s’il doit être mis à jour ou encore s’il a été utilisé par le système de TA ;

(37)

27 5. Le système de TA : quel système de TA a produit la traduction et quelle est

l’interaction entre la TA et la mémoire de traduction, s’il y en a une ;

6. La qualité de la TA : quel type d’évaluation de la TA doit être effectué (automatique ou manuel) pour déterminer la qualité fournie par le système.

(Torrejón & Rico, 2012, p. 170)

Une fois ces aspects analysés, les post-éditeurs et post-éditrices peuvent se lancer dans les corrections. Torrejón et Rico (2012, p. 168‑169) en décrivent les différentes étapes :

• Processus liés au texte source : lecture du texte source, soit entièrement soit par segments.

• Processus liés à la traduction automatique : lecture de la traduction issue de la TA et repérage des éléments qui demanderont une vérification dans le texte source et/ou une reformulation.

• Processus liés à la production du texte cible : production d’un nouveau texte à partir d’éléments déjà présents ou non, comprenant la correction de la TA selon les directives de PE et la cohérence terminologique et stylistique.

• Processus liés à l’évaluation du texte cible : évaluation positive ou négative de la TA et comparaison avec le texte source afin de déterminer si la qualité correspond aux attentes du client ou de la cliente.

• Processus liés au choix de références : choix de tous les supports qui seront utiles au processus de post-édition (dictionnaires, textes parallèles ou encore expert·e·s).

• Processus d’écriture : action d’écrire, d’insérer ou de supprimer des éléments, de reformuler certains segments.

• Processus liés aux tâches globales : gestion des tâches de post-édition, répartition du travail, assurance qualité des mémoires de traduction et collection d’exemples utiles à la formation de futur·e·s post-éditeurs et post-éditrices.

La post-édition est donc une tâche complexe, qui nécessite de nombreuses étapes d’ordre technique comme linguistique ; il ne s’agit pas simplement de corriger la traduction issue de la TA comme on pourrait le penser au premier abord. Le processus de post-édition dans son ensemble ressemble donc grandement à celui de la traduction. La différence

(38)

28 majeure réside dans l’étape même de correction du texte : les réviseurs et réviseuses se concentreront sur l’élimination de tous les types d’erreurs présentes et l’amélioration de la fluidité du texte ; tandis que les post-éditeurs et post-éditrices suivront les consignes provenant de leur mandat.

2.4.5 Productivité et qualité attendues

La productivité est probablement le concept central de la post-édition. Selon O’Brien :

« [r]esearch has emerged in recent years to suggest that post-editing, for some language pairs and domains, but not all, can lead to higher productivity when compared with full human translation. » (2017, p. 320) De nombreuses recherches ont en effet soulevé des gains de productivité variant entre 20 % et 50 % et pouvant atteindre jusqu’à 131 % (O’Brien, 2017). Nous notons donc que les client·e·s s’attendent à ce qu’une post-édition soit forcément plus rapide qu’une traduction humaine (Guerberof & Moorkens, 2019). En effet, la post-édition est considérée comme rentable uniquement si l’effort de post-édition est inférieur à l’effort fourni lors d’une traduction humaine (Koehn, 2010).

Sachant cela, les traducteurs et traductrices qui doivent effectuer des tâches de post- édition sont amené·e·s à traduire plus de mots que leurs pairs : généralement, ils et elles doivent traiter environ 3 500 mots sources par jour, contre environ 2 000 pour un traducteur ou une traductrice qui effectue une traduction « conventionnelle » (Robert, 2013). Ces résultats corroborent les réponses d’un sondage mené dernièrement auprès de lecteurs et de lectrices par Diño (2019), où la moyenne était de 1 000 mots par jour pour la TH et entre 1 000 et 3 000 pour la PE. Notons que ces données sont indicatives et varieront nécessairement selon le type de post-édition demandé, les lieux de travail (agences ou organes officiels, par exemple) ou encore les mandats. Elles permettent néanmoins de donner une idée de la productivité attendue pour une tâche de post-édition.

Par ailleurs, la rémunération est généralement équivalente à une tâche de traduction, même si la quantité de travail délivrée est plus importante (Robert, 2013).

Concernant la qualité, il s’agit d’une notion vague, qui varie grandement selon les client·e·s et également selon les professionnel·le·s ou futur·e·s professionnel·le·s. Guerberof et Moorkens l’ont constaté lors de leurs discussions avec des étudiant·e·s :

Références

Documents relatifs

O’Brien, 2009), l’auteur analyse la qualité au niveau linguistique des résultats d’un test sur la productivité de la post-édition, effectué sur des textes issus du

Dans cette section, nous allons présenter les deux méthodes principales d’évaluation des logiciels de traduction automatique. Il s’agit d’une étape très

Celles-ci peuvent certes se ressembler partiellement (certaines règles de rédaction et certains usages rhétoriques s’appliquent sur plusieurs aires linguistiques), mais il doit

Traduction de règles de construction des mots pour résoudre les problèmes d'incomplétude lexicale en traduction automatique - étude..

Quant à la troisième partie, elle est dévolue à l'analyse d'un échantillon d'erreurs de traduction révisées sous l'angle du style..

La problématique du présent travail découle d’un constat, valable tant dans la théorie que dans la pratique de la traduction publicitaire : dès les toutes

Ils en sont la démonstration vivante puisqu’ils travaillent depuis longtemps en post-édition sans avoir jamais reçu de formation (comme indiqué par eux-

Afin de répondre à cette question, ce travail se centre sur une étude comparative entre des étudiants en traduction (et jeunes traducteurs) et des étudiants en droit (et