• Aucun résultat trouvé

Traduction automatique et assistée

N/A
N/A
Protected

Academic year: 2022

Partager "Traduction automatique et assistée"

Copied!
29
0
0

Texte intégral

(1)

Traduction automatique et assistée

Damien Nouvel

(2)

Automatiser la traduction

Plan

1. Automatiser la traduction 2. Traduction automatique 3. Traduction assistée

(3)

Automatiser la traduction

Modèle pour la traduction

Langue source

Termes Dictionnaires Représentations Concepts / relations

Terminologies

Langue cible

(4)

Automatiser la traduction

Historique

§ Quelques dates clé

‚ «1799 : Pierre de Rosette

‚ «1930 : Machine de Trojanski

‚ «1946 : Traduction électronique (UK)

‚ «1960 : Triangle de Vauquois

‚ «1970 : Systran

‚ «1980 : EUROTRA

‚ «1985 : Reverso (Softissimo)

‚ «2000 : Corpus Europarl

‚ «2004 : Google translation service

‚ «2004 : OpenSubtitles (OPUS)

‚ «2010 : Linguee

‚ «2017 : DeepL

(5)

Automatiser la traduction

Complexités de la traduction

§ Diachronie : langues / dialectes / variantes

§ Deux dimensions de difficultés

‚ Trouver des correspondances entre termes (paradigmes)

Homonymes / synonymes

Tournures et emplois

Entités nommées (translittération)

‚ Constructions (syntagmes)

Syntagmes / expressions polylexicales

Constructions syntaxiques

Prise en compte de la pragmatique (discours) ?

§ Deux méthodes informatisées pour la traduction

‚ Traductionautomatiqueet post-édition

‚ Traductionassistée (mémoires de traduction) ñ Degré d’intervention humaine

(6)

Automatiser la traduction

Complexités de la traduction

§ Diachronie : langues / dialectes / variantes

§ Deux dimensions de difficultés

‚ Trouver des correspondances entre termes (paradigmes)

Homonymes / synonymes

Tournures et emplois

Entités nommées (translittération)

‚ Constructions (syntagmes)

Syntagmes / expressions polylexicales

Constructions syntaxiques

Prise en compte de la pragmatique (discours) ?

§ Deux méthodes informatisées pour la traduction

‚ Traductionautomatiqueet post-édition

‚ Traductionassistée (mémoires de traduction) ñ Degré d’intervention humaine

(7)

Automatiser la traduction

Complexités de la traduction

§ Diachronie : langues / dialectes / variantes

§ Deux dimensions de difficultés

‚ Trouver des correspondances entre termes (paradigmes)

Homonymes / synonymes

Tournures et emplois

Entités nommées (translittération)

‚ Constructions (syntagmes)

Syntagmes / expressions polylexicales

Constructions syntaxiques

Prise en compte de la pragmatique (discours) ?

§ Deux méthodes informatisées pour la traduction

‚ Traductionautomatiqueet post-édition

‚ Traductionassistée (mémoires de traduction) ñ Degré d’intervention humaine

(8)

Automatiser la traduction

Complexités de la traduction

§ Diachronie : langues / dialectes / variantes

§ Deux dimensions de difficultés

‚ Trouver des correspondances entre termes (paradigmes)

Homonymes / synonymes

Tournures et emplois

Entités nommées (translittération)

‚ Constructions (syntagmes)

Syntagmes / expressions polylexicales

Constructions syntaxiques

Prise en compte de la pragmatique (discours) ?

§ Deux méthodes informatisées pour la traduction

‚ Traductionautomatiqueet post-édition

‚ Traductionassistée (mémoires de traduction) ñ Degré d’intervention humaine

(9)

Automatiser la traduction

Complexités de la traduction

§ Diachronie : langues / dialectes / variantes

§ Deux dimensions de difficultés

‚ Trouver des correspondances entre termes (paradigmes)

Homonymes / synonymes

Tournures et emplois

Entités nommées (translittération)

‚ Constructions (syntagmes)

Syntagmes / expressions polylexicales

Constructions syntaxiques

Prise en compte de la pragmatique (discours) ?

§ Deux méthodes informatisées pour la traduction

‚ Traductionautomatiqueet post-édition

‚ Traductionassistée (mémoires de traduction)

ñ Degré d’intervention humaine

(10)

Automatiser la traduction

Complexités de la traduction

§ Diachronie : langues / dialectes / variantes

§ Deux dimensions de difficultés

‚ Trouver des correspondances entre termes (paradigmes)

Homonymes / synonymes

Tournures et emplois

Entités nommées (translittération)

‚ Constructions (syntagmes)

Syntagmes / expressions polylexicales

Constructions syntaxiques

Prise en compte de la pragmatique (discours) ?

§ Deux méthodes informatisées pour la traduction

‚ Traductionautomatiqueet post-édition

‚ Traductionassistée (mémoires de traduction) ñ Degré d’intervention humaine

(11)

Automatiser la traduction

Les approches

§ Selon le domaine

‚ Vocabulaire contrôlé (météo, transports, etc.)

‚ Langue générale

‚ Langue de spécialité (terminologie)

§ Selon la méthode de traduction

‚ Paires de langues («1502 = 22K)

‚ Langue pivot (carré : «150˚2 = 300)

§ Des corpus commeressources

Parallèles: alignement des phrases (bitext)

Comparables: alignement des sections / documents

(12)

Automatiser la traduction

Les approches

§ Selon le domaine

‚ Vocabulaire contrôlé (météo, transports, etc.)

‚ Langue générale

‚ Langue de spécialité (terminologie)

§ Selon la méthode de traduction

‚ Paires de langues («1502 = 22K)

‚ Langue pivot (carré : «150˚2 = 300)

§ Des corpus commeressources

Parallèles: alignement des phrases (bitext)

Comparables: alignement des sections / documents

(13)

Automatiser la traduction

Les approches

§ Selon le domaine

‚ Vocabulaire contrôlé (météo, transports, etc.)

‚ Langue générale

‚ Langue de spécialité (terminologie)

§ Selon la méthode de traduction

‚ Paires de langues («1502 = 22K)

‚ Langue pivot (carré : «150˚2 = 300)

§ Des corpus commeressources

Parallèles: alignement des phrases (bitext)

Comparables: alignement des sections / documents

(14)

Automatiser la traduction

Les approches

§ Selon le domaine

‚ Vocabulaire contrôlé (météo, transports, etc.)

‚ Langue générale

‚ Langue de spécialité (terminologie)

§ Selon la méthode de traduction

‚ Paires de langues («1502 = 22K)

‚ Langue pivot (carré : «150˚2 = 300)

§ Des corpus commeressources

Parallèles: alignement des phrases (bitext)

Comparables: alignement des sections / documents

(15)

Traduction automatique

Plan

1. Automatiser la traduction 2. Traduction automatique 3. Traduction assistée

(16)

Traduction automatique

Triangle de Vauquois

(17)

Traduction automatique

Traduire segment à segment

§ Impossible de tenir compte de tout le texte … ñ Il faut segmenter / structurer

‚ Énoncés

‚ Propositions

‚ Syntagmes

‚ Mots

ñ Meilleure hypothèse de traduction par recherche de segments ñ Difficultés avec les dépendances (accords, anaphores, etc.)

(18)

Traduction automatique

Traduire segment à segment

§ Impossible de tenir compte de tout le texte … ñ Il faut segmenter / structurer

‚ Énoncés

‚ Propositions

‚ Syntagmes

‚ Mots

ñ Meilleure hypothèse de traduction par recherche de segments ñ Difficultés avec les dépendances (accords, anaphores, etc.)

(19)

Traduction automatique

Exploitation de ressources

§ Chaque ressource a ses avantages et inconvénients

‚ Lexiques bilingues

ñ Traductionmot-à-mot et ambiguë

‚ Corpus parallèles

ñ Précis mais peucouvrants

‚ Corpus comparables ñ Plus couvrants

‚ Analyses linguistiques (morpho-syntaxe, syntaxe, sémantique) ñ Vérification des constructions (accords, etc.)

ñ Il faut réordonner les mots (réagencer les phrases)

§ Moteurs de traduction

‚ Par règlesspécifiées par des humains

Statistiquesà partir des données (corpus)

Hybrides(combinaison d’approches)

(20)

Traduction automatique

Exploitation de ressources

§ Chaque ressource a ses avantages et inconvénients

‚ Lexiques bilingues

ñ Traductionmot-à-mot et ambiguë

‚ Corpus parallèles

ñ Précis mais peucouvrants

‚ Corpus comparables ñ Plus couvrants

‚ Analyses linguistiques (morpho-syntaxe, syntaxe, sémantique) ñ Vérification des constructions (accords, etc.)

ñ Il faut réordonner les mots (réagencer les phrases)

§ Moteurs de traduction

‚ Par règlesspécifiées par des humains

Statistiquesà partir des données (corpus)

Hybrides(combinaison d’approches)

(21)

Traduction automatique

Exploitation de ressources

§ Chaque ressource a ses avantages et inconvénients

‚ Lexiques bilingues

ñ Traductionmot-à-mot et ambiguë

‚ Corpus parallèles

ñ Précis mais peucouvrants

‚ Corpus comparables ñ Plus couvrants

‚ Analyses linguistiques (morpho-syntaxe, syntaxe, sémantique) ñ Vérification des constructions (accords, etc.)

ñ Il faut réordonner les mots (réagencer les phrases)

§ Moteurs de traduction

‚ Par règlesspécifiées par des humains

Statistiquesà partir des données (corpus)

Hybrides(combinaison d’approches)

(22)

Traduction automatique

Exploitation de ressources

§ Chaque ressource a ses avantages et inconvénients

‚ Lexiques bilingues

ñ Traductionmot-à-mot et ambiguë

‚ Corpus parallèles

ñ Précis mais peucouvrants

‚ Corpus comparables ñ Plus couvrants

‚ Analyses linguistiques (morpho-syntaxe, syntaxe, sémantique) ñ Vérification des constructions (accords, etc.)

ñ Il faut réordonner les mots (réagencer les phrases)

§ Moteurs de traduction

‚ Par règlesspécifiées par des humains

Statistiquesà partir des données (corpus)

Hybrides(combinaison d’approches)

(23)

Traduction automatique

Exploitation de ressources

§ Chaque ressource a ses avantages et inconvénients

‚ Lexiques bilingues

ñ Traductionmot-à-mot et ambiguë

‚ Corpus parallèles

ñ Précis mais peucouvrants

‚ Corpus comparables ñ Plus couvrants

‚ Analyses linguistiques (morpho-syntaxe, syntaxe, sémantique) ñ Vérification des constructions (accords, etc.)

ñ Il faut réordonner les mots (réagencer les phrases)

§ Moteurs de traduction

‚ Par règlesspécifiées par des humains

Statistiquesà partir des données (corpus)

Hybrides(combinaison d’approches)

(24)

Traduction automatique

Exploitation de ressources

§ Chaque ressource a ses avantages et inconvénients

‚ Lexiques bilingues

ñ Traductionmot-à-mot et ambiguë

‚ Corpus parallèles

ñ Précis mais peucouvrants

‚ Corpus comparables ñ Plus couvrants

‚ Analyses linguistiques (morpho-syntaxe, syntaxe, sémantique) ñ Vérification des constructions (accords, etc.)

ñ Il faut réordonner les mots (réagencer les phrases)

§ Moteurs de traduction

‚ Par règlesspécifiées par des humains

Statistiquesà partir des données (corpus)

Hybrides(combinaison d’approches)

(25)

Traduction automatique

Quelques moteurs en ligne

§ Google Traduction : https://translate.google.fr

§ Linguee : https://www.linguee.fr

§ Deepl (Linguee) : https://www.deepl.com/translator

§ Reverso (Soft.) : www.reverso.net/text_translation.aspx

§ Systran : https://demo-pnmt.systran.net

(26)

Traduction automatique

TP alignement

§ Extraction de dictionnaires bilingues

‚ Récupérez des textes alignés

http://opus.nlpl.eu/OpenSubtitles

‚ Écrire un programme pyton qui

Ouvre le fichier de données

Recherche les correspondances entre mots alignés

Recherche tous les correspondances entre mots

Affiche les correspondances fréquentes

‚ Appliquez ce programme à

http://www.statmt.org/europarl/

(27)

Traduction assistée

Plan

1. Automatiser la traduction 2. Traduction automatique 3. Traduction assistée

(28)

Traduction assistée

Approches

§ Traduction automatique

Post-édition (correction)

ñ Quelle efficacité, quels biais de traduction ?

§ Mémoires de traduction

‚ Assistants de rédaction pour la traduction

‚ Plus ou moins personnalisés/ mutualisés

‚ Approche parsegments (séquences de mots)

‚ Contrôle de la cohérencedes traductions ñ Logiciels professionnels (SDL Trados)

(29)

Traduction assistée

Approches

§ Traduction automatique

Post-édition (correction)

ñ Quelle efficacité, quels biais de traduction ?

§ Mémoires de traduction

‚ Assistants de rédaction pour la traduction

‚ Plus ou moins personnalisés/ mutualisés

‚ Approche parsegments (séquences de mots)

‚ Contrôle de la cohérencedes traductions ñ Logiciels professionnels (SDL Trados)

Références

Documents relatifs

In this setting, we dene a toolbox, a olle tion of nets that we shall ombine for interpreting pro esses, and a few asso iated redu tions, derived from the basi redu tion rules

Si d’après Bannour la linguistique générale saurait représenter un modèle de référence pour une épistémologie de la traduction, la réponse présentée par Guidère

1. Traduction mot à mot du texte source vers le texte cible 2. Modification de l'ordre des mots traduits dans le texte cible.. Trois approches..

mettant en oeuvre un modèle concret d’analyse à partir du niveau syntaxique pour le russe et l’ébauche d’un modèle analogue pour le japonais et enfin un

La différence de vision sur le traduire des trois traducteurs se voit même au niveau des petites unités de traduction. 67), la solution trouvée par Iorgulescu est économique

Dans le cas de l’Odyssée, nous avons pu déterminer que les éléments qui semblaient être les plus stables d’une traduction à l’autre, se trouvant donc à la

ñ Quelle efficacité, quels biais de traduction. § Mémoires

Dans la mesure où tous ces phénomènes sont caractérisés par une différence interlangagière entre anglais original et français original (voir ci-dessus), il serait assez