• Aucun résultat trouvé

2.2 Architecture des systèmes de traduction automatique

2.2.1 Systèmes linguistiques

2.2.1.2 Systèmes maximalistes

Les systèmes maximalistes, appelés également systèmes indirects, tentent d’aller plus loin dans la compréhension de la phrase, c’est-à-dire qu’ils ne s’arrêtent pas au niveau lexical, mais font une analyse syntaxique complète avec une grammaire et représentent la phrase, par exemple à l’aide d’un arbre syntagmatique. La traduction ne se fait plus mot à mot, car le système extrait la représentation syntaxique de la phrase et met en correspondance cette représentation, comme dans l’exemple ci-dessous :

Figure 2 : Exemple de représentations syntaxiques en anglais et en français

Les représentations syntaxiques, plus abstraites, facilitent le passage entre les langues et les informations rendent explicites plus d’informations pour le transfert. Par exemple, dans une phrase telle que I miss London, il devient possible d’inverser le sujet et l’objet de la phrase, ce qui donnerait Londres me manque, et non Je manque Londres.

Il y a principalement deux types de systèmes maximalistes, qui diffèrent par le niveau d’abstraction de la représentation syntaxique : ceux par transfert et ceux par interlangue.

2.2.1.2.1 Systèmes maximalistes par transfert

Les systèmes par transfert se fondent sur les connaissances des différences qui existent entre deux langues, et lient les mots et structures de la langue source à ceux de la langue cible (Arnold, 1994, p. 64), avec des représentations spécifiques à chaque langue. Ces systèmes fonctionnent en trois étapes distinctes : l’analyse, le transfert et la génération (Jurafsky et Martin, 2009, p. 906).

La première étape, l’analyse, se fait avec une grammaire et un lexique de la langue source pour extraire la représentation syntaxique complète de la phrase, qui est spécifique à chaque langue donnée. Nous pouvons illustrer le fonctionnement avec la phrase précédente John takes the apple, dont la représentation syntaxique est comme suit :

Figure 3 : Exemple de représentation syntaxique en anglais

L’étape de transfert est la transformation de la représentation syntaxique de la langue source en représentation syntaxique de la langue cible (Jurafsky et Martin, 2009, p. 906). Cette opération se réalise avec des règles de transfert (et avec un dictionnaire bilingue).

Figure 4 : Exemple de représentation syntaxique en français

Finalement, la dernière étape, celle de la génération, prend la représentation syntaxique de la langue cible créée lors du transfert et génère une phrase cible. Cette étape est faite elle aussi avec une grammaire et un lexique de la langue cible.

La séparation des connaissances monolingues (analyse) et bilingues (transfert) permet aux systèmes par transfert d’être plus modulables et plus simples à maintenir car, par exemple, tous les systèmes qui partent du français auront à disposition le même lexique source et il est possible de réutiliser plus d’informations. Toutefois, ce type de système n’est pas sans inconvénient, à savoir qu’il est nécessaire de définir pour chaque paire de langue des règles de transfert (Jurafsky et Martin, 2009, p. 909).

2.2.1.2.2 Systèmes maximalistes par interlangue

Les systèmes maximalistes par interlangue, contrairement à ceux par transfert, ne se basent pas sur les représentations syntaxiques des phrases mais sur une interlangue, indépendante des

langues, qui regroupe tous les concepts d’une langue. L’interlangue représente donc toutes les phrases qui ont le même sens de la même façon, quelle que soit la langue dans laquelle elles ont été écrites à l’origine. La traduction se fait en deux étapes : extraction de l’interlangue et génération à partir de l’interlangue de la phrase en langue cible (Jurafsky et Martin, 2009, p.

909). La traduction avec des systèmes par interlangue requiert une ontologie, c’est-à-dire une base de connaissances qui contient tous les concepts communs à toutes les langues, ou comme la définissent Jurafsky et Martin « the appropriate inventory of concepts and relations for an interlingua » (2000, p. 813).

Dans les systèmes par interlangue, il n’y a plus d’étape de transfert. L’analyse est plus poussée, et la génération peut se faire en se passant des transformations syntaxiques (Jurafsky et Martin, 2009, p. 910). S’il n’y a pas l’étape de transfert, il n’y a pas non plus d’informations bilingues, et l’on évite les descriptions explicites des relations entre les mots en langue source et les mots en langue cible, car la traduction se fait en mettant en correspondance les concepts répertoriés dans l’ontologie, qui est indépendante des langues (Jurafsky et Martin, 2000, p. 813).

Les systèmes par interlangue requièrent un niveau extrêmement élevé d’analyse sur la sémantique d’un domaine et la formalisation dans une ontologie. Ils sont généralement utilisés dans des sous-domaines ou des domaines très simples, tels que l’aviation ou les réservations de restaurants, où la définition de la base de données détermine les entités possibles et leurs relations (Jurafsky et Martin, 2009, p. 910).

L’un des principaux problèmes de l’interlangue est d’inventorier tous les concepts et de les distinguer lors de l’analyse. Par exemple, en japonais, on fait une distinction entre le grand frère et le petit frère : on est donc obligé de définir deux concepts et de choisir entre les deux, même si cette distinction ne se fait peut-être pas selon la langue cible : en français, par exemple, la traduction sera toujours la même : frère. En effet, ce mot est désambiguïsé par la suite en ajoutant l’un ou l’autre adjectif (grand ou petit) (Jurafsky et Martin, 2009, p. 910).

Un autre problème est la granularité de l’interlangue : en traduisant les concepts et non plus les mots, il est très probable que la même représentation conduise à la même traduction.

Prenons par exemple ces trois phrases (Arnold, 1994, p. 82) : It was the printer that was serviced yesterday.

It was yesterday that the printer was serviced.

The printer was serviced yesterday.

L’interlangue contient trois concepts : un pour le prédicat (to be serviced), un pour le thème (the printer) et un pour le temps (yesterday). Toutefois, comment peut-elle indiquer que la traduction de ces trois phrases devra être différente, vu que l’emphase est placée sur les différents mots qui les composent, si la seule connaissance qu’elle possède sont les concepts qui forment la phrase et les relations sémantiques ? Quel type de connaissances faudrait-il intégrer dans l’interlangue, pour qu’elle traduise de trois manières différentes ces trois phrases ?

Dans la prochaine section, nous expliquerons le fonctionnement des systèmes statistiques et les différents modèles, et ensuite les systèmes statistiques neuronaux (Section 2.2.2.1).