• Aucun résultat trouvé

Traduction Automatique et texte juridique arabe en Algérie

N/A
N/A
Protected

Academic year: 2022

Partager "Traduction Automatique et texte juridique arabe en Algérie"

Copied!
22
0
0

Texte intégral

(1)

11

Traduction Automatique et texte juridique arabe en Algérie

BOUHADIBA Farouk Université d’Oran

Résumé :

De par ses caractéristiques morpho-phonologiques, morphosyntaxiques, lexicales et autres systèmes et sous-systèmes de son fonctionnement, la langue arabe représente un système de non-concaténation (ou non-enchaînement des morphèmes). Elle diffère dans ce sens des langues Indo-européennes – à systèmes de concaténation – et demeure pour ainsi dire, une langue assez complexe à gérer dans le domaine du Traitement Automatique des Langues (TAL). Ceci, surtout lorsqu’il s’agit de traduire automatiquement des faits de langue porteurs d’éléments culturels propres à cette langue.

L’une des difficultés premières dans l’automation et la nu- mérisation de la langue arabe a été, à premier abord, l’instabilité de ses caractères graphiques, sa segmentation et sa modélisation. Ses diacritiques tels que l’allongement vocalique, l’allongement consonantique (gémination), l’emphase et sur- tout l’absence de vocalisation (voyellation) de ses consonnes (connue en Grammaire arabe sous le terme de ‘harakât’ ou

‘mouvements consonantiques’ et ‘sukun’ ‘absence de mouve- ment consonantique’) représentaient autant de sources de diffi- cultés dans sa programmation.

Cette question de la représentation graphique de la langue arabe sur ordinateur a été soulevée dès les années 70. Certaines de ces difficultés ont trouvé solution puisqu’il est tout à fait possible de nos jours de procéder au traitement automatique de textes arabes, de faire appel à des dictionnaires et vérificateurs électroniques d’orthographe en arabe, voire même d’envoyer des messages en arabe sur Internet et à travers la téléphonie mobile. Ceci est révélateur de grands pas franchis depuis les balbutiements des années 70 face à la complexité, voire même l’impossibilité - disait-on- de procéder au traitement de l’écrit

(2)

12

arabe et plus tard de la reconnaissance de la parole par ordina- teur.

Dans cet article, nous utilisons l’expression «texte juridique arabe» au lieu de «texte juridique en arabe» pour distinguer les textes juridiques rédigés en arabe selon la juridiction arabo- musulmane (voir infra) des textes juridiques d’origines di- verses (français, anglais, espagnol, etc.) et traduits en langue arabe.

La recherche sur les origines et la filiation des langues à des fins de traduction de textes –anciens, surtout- est assez vaste.

La philologie et la linguistique comparée ont relevé des simili- tudes et des différences entre plusieurs langues. Les langues d’origine Indo-européennes représentaient ainsi un domaine de prédilection où des comparaisons étaient établies à plusieurs niveaux d’analyse (phonétique, phonologique, morphologique, syntaxique, lexical, sémantique, etc.). Le but étant de classifier et de catégoriser les langues selon leurs origines et leurs (degré de) parentés. Les études actuelles dans la fouille de texte (data mining) semblent moins investies dans la traduction par ordina- teur d’ensembles phraséologiques tels que les proverbes et les dictons ou bien les textes juridiques arabes.

Nous essayerons d’examiner le texte juridique arabe à tra- vers des prototypes de jugements rédigés en arabe en Algérie.

Ceci pour essayer de comprendre comment le Traitement Au- tomatique des Langues Naturelles (TALN) peut-il s’accaparer du sens de ces textes qui sont souvent porteurs de différences culturelles. De ce fait, la question serait de voir si la machine pourrait prendre en charge des faits culturels propres à chaque langue qui sont incorporés dans le texte juridique et qui se ma- nifestent à travers le mot ou l’expression.

A cet effet, deux notions nous serviront de base pour la compréhension de ces différences, à savoir :

(3)

13

a. La relativité linguistique (ou « Linguistic Relativity»)1 telle que développée chez W. Von Humbolt, reprise dans l’hypothèse de Sapir et Whorf2 et selon laquelle la pensée est soumise à la vision du monde à travers le langage – language shapes thought –. Cette vision du monde à travers le langage diffère d’une langue à une autre. Les natifs d’une langue don- née perçoivent donc la réalité selon leur culture ou « force propre » que véhicule leur langue.

b. Les Universaux du langage tels que définis chez N. Choms- ky (1964, 1965) en termes de « Language Universals »3 pour expliquer que les langues partagent des traits communs tels que le genre et le nombre.

Ainsi, en mettant en relief les éléments universels du langage, on pourrait parvenir à une meilleure compréhension du fonc- tionnement du langage et par conséquent aboutir à une vision plus claire de la relation langage/pensée, langage/société.

Ces deux visions du langage représentent deux tendances: les Relativistes et les Universalistes. Elles semblent, à premier abord, contradictoires. En fait, elles convergent en ce sens

1 Concept développé au 19ème siècle par des penseurs tels que W. Von Humbolt et selon lequel le langage est l’expression de ‘l’esprit d’une nation’, de sa vision du Monde et de sa perception de la réalité. Concept repris et développé au 20ème siècle à travers la fameuse Hypothèse de Sapir et Whorf et plus récemment par le courant cognitiviste selon lequel le langage influence des processus cognitifs (Casasanto, D.

2008; Drivoniko et.al. (2007).

2 . Edward Sapir: Lauenburg, Allemagne, 1884 - New Haven, Connecticut, 1939 Linguiste américain. Il a dégagé la notion de phonème et proposé une nouvelle typologie des langues, fondée sur des critères formels (syntaxe et sémantique) et non plus historiques. C'est l'un des initiateurs du courant structuraliste.

Benjamin Lee Whorf : Winthrop, Massachusetts, 1897 - Wethersfield, Connecticut, 1941. Linguiste américain. Disciple d’E. Sapir, il a émis l'hypothèse que le langage est en relation causale avec le système de représentation du monde. Le Petit La- rousse, 2009

3. Dans le courant cognitiviste et la Théorie universaliste, Chomsky (1964, 1965) a développé le concept de « Language universals » pour stimuler la recherche d’une Grammaire Universelle (Universal Grammar)».

(4)

14

qu’elles ont comme dénominateur commun le langage et la pensée. Les Relativistes insistent sur les idiosyncrasies (irrégu- larités) que l’on retrouve dans les langues et les différents dis- positifs qui les gouvernent alors que les Universalistes insis- tent sur les traits et systèmes communs aux langues. Ceci re- présente en fait le premier stade de l’acte traductif.

La traduction est basée, à notre sens, sur des hypothèses tirées implicitement de ces deux visions du langage humain. La ge- nèse même de la traduction présuppose l'existence de certains paramètres universels qui rendent toutes les langues tradui- sibles. Certains éléments inhérents ou propres à chaque langue deviennent idiosyncratiques et posent le problème de l’intraduisibilité / l’intraductibilité. Par conséquent, une traduc- tion totale, juste, fiable, ou parfaite ne semble pas, en fin de parcours, une opération possible et réalisable. Il existe par contre différentes stratégies de la traduction telles que la trans- position culturelle pour gérer des cas d’exotisme ou de calque, la transplantation, l’emprunt culturel, la translitération, la compensation, la traduction par omission -comme pour le cas des doublets sémantiques en arabe-, l’addition, l’équivalence et toute une batterie de stratagèmes auxquels pourrait faire appel le traducteur humain -par opposition au traducteur machine4- pour aboutir à une représentation adé- quate de l’intention de l’auteur du texte source sous forme d’intention du traducteur du texte cible.

Selon Steiner, G. (1975:149) la logique des relativistes sous- entend qu’aucun acte complet de traduction entre différentes champs sémantiques n’est possible et que toute traduction n’est qu’approximative et ontologiquement réductrice du sens.

D’autre part, une grammaire universelle postulera que l’inter-

4 . Le terme ‘traducteur machine’ est utilisé pour désigner l’ensemble des opérations à des fins de traduction automatique et dictionnairique tels que les algorithmes, les systèmes filtres, les systèmes experts, la segmentation, la modélisation, etc.

(5)

15

traduisibilité dans les langues naturelles est possible de par la nature même de la Proto-Langue (Proto-language), source ou Mère de toutes les langues.

Catford, J.C. (1965) met l’accent sur l'aspect situationnel et contextuel en présentant le concept d’équivalence en traduc- tion. Par conséquent, le texte de la Langue Source (SL)5 et ce- lui de la Langue Cible (TL) doivent être en rapport étroit avec les traits pertinents et fonctionnels d’une situation (contexte) donnée afin d’aboutir à l’équivalence en traduction. Nida, E.

(1964) explique que la reproduction du message de la Langue Source (SL) doit être reflétée par l’équivalent le plus proche de la Langue Cible (TL). Ainsi, c’est la conservation du message plutôt que la conversion de la forme et de la structure du texte qui devrait être visée dans l’acte traductif.

1. La Traduction Automatique (TA)

Ce n’est qu’après la Seconde Guerre Mondiale que la TA s’est développée de manière observable. L’Université de Geor- getown (USA) a réalisé une traduction entièrement automa- tique en 1954. Le projet portait sur une soixantaine de phrases figées en russe et traduites en anglais. Cette première expé- rience a déclenché une recherche accélérée grâce à des fonds de soutien pour la recherche en TA. Malgré de lourds investis- sements financiers, le progrès dans ce domaine restait limité.

Le rapport de 1966 du Comité Consultatif sur le Traitement Automatique du Langage, ALPAC (Automatic Language Pro- cessing Advisory Committee) a été plus que négatif quant aux progrès de la TA aux Etats-Unis. Ceci a réduit au maximum les subventions allouées dans ce domaine. L’euphorie des années cinquantes s’est alors transformée en désagrément amer et en de profondes illusions (from euphoria to bitter criticism).

5 . SL renvoie à Source Language (en anglais) par opposition au TL (Target Lan- guage) ou Langue Cible (en français).

(6)

16

Ce n’est que bien plus tard que les développements de l’informatique, des statistiques et de la linguistique computa- tionnelle des années 80 ont permis la conception de plusieurs modèles de traduction automatique mis à la disposition du grand public sur le marché de l’informatique. Ces programmes et outils informatiques à des fins de TA présentaient des défail- lances. Ils ont été raffinés et rendus plus performants au fil des ans et ils sont accessibles à divers utilisateurs et organismes tels que la CEE qui utilise une version adaptée (users-need) du système commercial SYSTRAN pour traduire un grand nombre de documents à usage interne. Microsoft a développé à son tour un système hybride de la TA dans l’élaboration d'une base de données de soutien technique Anglais-Espagnol. Le système a été conçu par le groupe de recherche «Natural Lan- guage» de Microsoft (2003). Ceci a été suivi par l’élaboration d’un système de traduction automatique Anglais-Japonais sur la base de systèmes Anglais-Français et Anglais-Allemands développés auparavant6. On retrouve actuellement ces logiciels sur le marché de l’informatique sous forme de produits finis ou bien sous forme de prototypes de traducteurs et de diction- naires mis en ligne au service du grand public.

2. La TA, le TAL, le TALN et le TALA

La Traduction Automatique (TA) est un terme englobant qui réfère à l’automation de la langue en général. Elle se ramifie en Traitement Automatique des Langues (TAL) et ce suite au dé- veloppement des technologies des langues, puis en Traitement Automatique des Langues Naturelles (TALN) pour distinguer ces dernières des langues dites artificielles. TALA – une rami- fication récente du TAL/TALN- réfère au Traitement Automa- tique de la Langue Arabe. La TA, le TAL, le TALN et le TA- LA dérivent de la linguistique l'informatique (Computational

6 .cf. Ghenimi, A. (2007 : 18)

(7)

17

Linguistics) à des fins de conception et d’élaboration de logi- ciels de traduction de textes et de reconnaissance vocale.

A l’origine, la TA se basait essentiellement sur la substitution de mots atomiques d’une langue par des mots ou cognats (équivalents) dans d’autres langues. En utilisant des techniques de fouille de textes grâce à la Linguistique de corpus (Corpus Linguistics) et aux Statistiques entre autres, des traductions plus complexes pouvaient être effectuées moyennant une meil- leure manipulation et une bonne maîtrise des différences typo- logiques entre les langues naturelles, l'identification d'expres- sions et d’idiomes communs à deux ou plusieurs langues et en procédant à l'isolement des différences entre les langues. Ce- pendant et malgré la rapidité de la traduction machine qui est le résultat de l’implication de compétences transversales et multi- disciplinaires en linguistique, en informatique, en mathéma- tiques et en statistiques, entre autres, les systèmes actuels ne peuvent offrir le même rendement avec la même qualité que le traducteur humain. Ceci est d’autant plus évident lorsqu’il s’agit de traduire des documents spécifiques tels que le texte juridique. Il existe, certes, sur le marché de la programmation informatique (software) des dictionnaires spécialisés perfor- mants et des traducteurs automatiques très itératifs qui sont d’une aide précieuse pour le traducteur humain. Tout comme il existe des programmes de rédaction technique dans des do- maines sensibles tels que celui de la santé et de la sécurité (pu- blique, routière, industrielle, ferroviaire, aérienne, etc.) par exemple. Des logiciels de traduction automatique tels que le SYSTRAN, IBM, NASHQ, POWER TRANSLATOR et autres tiennent compte de la spécificité du domaine grâce à leurs dic- tionnaires par domaine et ils améliorent ainsi le rendement du traducteur humain en limitant au maximum le facteur temps nécessaire à l’opération de traduction. Des techniques nou- velles et particulièrement efficaces font appel aux décisions (sélections, instructions) de l’utilisateur. Le rendement dans la

(8)

18

traduction peut ainsi être amélioré qualitativement et quantita- tivement lorsque l’utilisateur agit sur le système (le logiciel) en identifiant les mots segments dans le texte qui ont la fonction de nom propres par exemple. Avec l'aide de ces techniques, la TA s’est révélée utile comme outil pour aider les traducteurs humains. Elle peut même, dans certains cas, produire le rende- ment escompté. Mais cela est très rare et dépend essentielle- ment des systèmes filtres et des systèmes experts du logiciel en question.

La Traduction Automatique, parfois dénommée TAO (Tra- duction Assistée par Ordinateur), qui représentait initialement un objectif plutôt difficile à atteindre, offre de nos jours des programmes accessibles à tout un chacun et elle aboutit à des résultats de meilleure qualité qu’auparavant. Des traducteurs automatiques et dictionnaires électroniques (sous forme de produits finis ou en ligne) sont disponibles dans des domaines de spécialités aussi variés que celui de la santé, de la sécurité, du droit juridique, de la chimie, de l’architecture, etc.7

De façon très générale, le processus de la reconnaissance tex- tuelle en vue de la traduction se fait essentiellement sur la base d’un décodage de la signification du texte source et d’un enco- dage de cette signification dans la langue cible à travers une batterie d’algorithmes et de paramètres morphosyntaxiques et mathématiques. Ce procédé simple en apparence suscite des opérations cognitives très complexes. Ainsi, pour décoder la signification du texte source dans sa totalité, le traducteur doit interpréter et analyser tous les dispositifs du texte. Ceci exige une connaissance détaillée de la syntaxe des langues à traduire et de leur sémantique, entre autres, ainsi que la culture des langues en question avant de procéder au décodage et à

7. Cf. à ce sujet, Hutchins, W. J. & Somers, H. (1992): Introduction to Machine Translation (London : Academic Press).

(9)

19

l’encodage. C’est là, précisément que réside tout le défi dans la traduction automatique. Comment pourrait-on programmer un ordinateur pour "saisir" ces données sous-jacentes d’un texte (tel que le fait le traducteur humain) et "créer" un nouveau texte dans la langue cible avec la même signification.

Il existe plusieurs systèmes pour aboutir à une automation des langues tels que la Traduction automatique à base de diction- naires électroniques ou Dictionary-Based Machine Translation (DBMT). Celle-ci utilise des bases d’entrées lexicales. Les mots sont traduits comme dans un dictionnaire au format pa- pier. Ils sont présentés sous forme de mot-à-mot et sont généra- lement démunis de corrélation particulière quant à la significa- tion des mots de la Langue Source par rapport à ceux de la Langue Cible.

La Traduction automatique par Statistiques ou Statistical Machine Translation (SMT) est un autre procédé d’automation des langues. Son but est de produire des traductions en utilisant des méthodes statistiques basées sur des corpus bilingues de textes. Il s’agirait dans ce cas d’élaborer des corpus de textes spécifiques bilingues pour aboutir à des résultats probants.

La Traduction automatique à base d’exemples ou Example - Based Machine Translation (EBMT) se caractérise par l’utilisation d'un corpus bilingue en tant que base de données principale. C'est essentiellement une traduction par analogie et elle peut être considérée comme l’application de l’approche du raisonnement au cas par cas.

La Traduction automatique inter-langue ou Interlingual Ma- chine Translation fonctionne à base de règles génératrices.

Ainsi, le texte à traduire est transformé en une représentation qui est indépendante de la langue source et de langue cible. Le texte de la langue cible est alors généré à partir de cette repré- sentation intermédiaire.

Il existe également des prototypes de traducteurs développés dans des universités et centres de recherche en TAL. Le Centre

(10)

20

Lucien Tesnière de Besançon, par exemple, a développé des dictionnaires et traducteurs automatiques tels que le Multilin- gual Co-built Dictionnary (MultiCodict) ou le Labelgram.

Le système que nous essayons de développer actuellement est basé sur un composant instruit de génération de langue en utilisant des bases de données avec une mémoire de traduction d’un millier de phrases et ce dans les domaines des Hydrocar- bures et du Tourisme.8

3. Quelques aspects de la segmentation en arabe

Nous essayerons dans ce qui suit de mentionner brièvement des phases que nous jugeons nécessaires à la segmentation et à la modélisation de la langue arabe et ce par rapport aux caracté- ristiques et fonctionnements d’autres langues. La comparaison lexicologique est l’une des bases qui permettent de mieux saisir les différences et similitudes de la langue arabe par rapport à d’autres langues.

A titre d’exemple, l’anglais possède des unités lexicologiques pour les articles {a, an, the} ou bien l’ensemble vide {} pour l’indéfini pluriel, des prépositions {in, on, out, and, about, …}, des pronoms non affixés {I, You, Him, Her, …} et des auxi- liaires et modaux {Be, Have, Can, May, …} comme marqueurs du temps et de l'aspect. L’arabe génère certaines de ces fonc- tions soit en liant les mots et morphèmes affixés (préfixés, in- fixés, suffixés) et en les incorporant à d’autres formes telles que les noms et les verbes, soit en séparant ces derniers. Ceci étant gouverné par des règles morphosyntaxiques qui opèrent dans la langue. Nous optons pour une segmentation où les in- flexions par exemple sont comptabilisées comme des unités lexicologiques indépendantes. Ainsi, l’article indéfini en arabe est représenté par l’ensemble vide {Ø}. Une forme arabe isolée

8 . cf. BOUHADIBA, F. & ROUABHI, M., RML6, 2008 : 111-141

(11)

21

telle que

ﺩﹶﻟﻭ

/walad(un)/9 (vocalisée) que l’on retrouve dans un texte non vocalisé sous la forme graphique

ﺩﻟﻭ

et qui ne serait reconnue comme telle, c’est-à-dire ‘un garçon’ que si l’on in- sérait dans la chaine la structure {Ø +

ﺩﻟﻭ

} afin de ne pas con- fondre cette dernière avec d’autres formes isolées telles que le passif َ

ﺩِﻟﻭ

‘il est / fut né’ ou le causatif

ﺩﱠﻟﻭ

َ ‘générer’ par exemple.

Il en est de même pour les pronoms personnels implicites comme dans

ﹸﺕ ﺒﹶﺘﹶﻜ ( ﺎـﻨﺃ )

/(anâ) katabt(u)/ ‘J’ai écrit’ que nous comptabilisons comme deux unités lexicales indépendantes même si le pronom personnel

ﺎـﻨﺃ

n’apparait pas dans le texte mais il est sous entendu comme dans la phrase

ﺔ ﺼﻘﻟﺍ ﺕﺒﺘﻜ

/katabtu l qia(ta) /‘J’ai écrit l’histoire (le conte)’10.

Une autre caractéristique de l’arabe par rapport l’anglais c’est la profusion de noms pour désigner un concept alors que l’anglais contient un plus grand nombre d'adjectifs que l’arabe.

La comparaison syntaxique permet également de mieux saisir les différences et similitudes entre l’arabe et d’autres langues.

Le nombre d’unités syntaxiques (grammaticales) est plus élevé en anglais. L’arabe a tendance à utiliser des coordinations syndétiques et asyndétiques là où l’anglais fait appel à des phrases mixtes et complexes avec divers procédés de coordina- tion.

La coordination en arabe représente un dispositif très productif alors que le système de ponctuation est employé de façon non fonctionnelle. Nous citerons, à titre d’exemples, des cas tels que celui du wāw qui exprime la simultanéité en arabe là où le

9 . Les parenthèses à l’intérieur de la représentation phonologique indiquent la forme pausale en arabe et l’on entend [walad].

10 . Nous ne pouvons, dans le cadre de cet article, détailler les procédures qui nous permettent de comptabiliser des unités lexicologiques indépendantes. Ceci fera l’objet d’un prochain article dans ce sens.

(12)

22

français et l’anglais utilisent d’autres constructions grammati- cales sans le «et» ou le «and». Ainsi, une phrase arabe telle que {qâaaha wa âa} (Mustafa Lutfi Al-Manfaluti, 1952: 236) ne se traduit pas en français par «*Il l’a interrompue et il a crié» ou en anglais par « *He interrupted her and he shouted » mais par «Il l’a interrompue tout en criant» et «He interrupted her, shouting …» respectivement. Nous remarquons que l’anglais utilise une virgule pour indiquer la simultanéité dans les actions là où le français a recours à la double préposition

« tout en ».

4. Quelques aspects du texte juridique

La loi est une profession où chaque mot est supposé être por- teur d’un sens bien particulier, voire même précis. Les disposi- tifs généraux de la langue légale qui s'appliquent à l’arabe, à l’anglais ou au français sont résumés comme suit :

- Le discours législatif est différent de la langue écrite sur le plan lexical et sur le plan de la construction de phrases qui sont généralement très longues. La différence entre l’arabe et le français ou l’anglais sur ce dispositif est que l’arabe utilise moins de ponctuation (non fonctionnelle en arabe) alors que les deux autres langues usent de la ponctuation comme mécanisme fonctionnel et producteur de sens dans la langue.

- La profusion de phrases longues et complexes est due non seulement à l’archaïsme du discours juridique mais aussi et surtout dans un but d’éviter toute ambiguïté dans les textes du procès en plaçant le maximum d’information et de données sur une unité phraséologique particulière.

- Un autre dispositif typique relie ensembles des mots ou des expressions par coordination : {et, ou, …} en français {and, or, …} en anglais et {waw} en arabe.

- Une profusion dans l’utilisation de structures phrastiques peu communes ou très rarement utilisées par les natifs des deux

(13)

23 langues.

- La loi est toujours exprimée d'une façon impersonnelle afin de s'adresser à plusieurs instances (le législateur, l’exécutif, le mandatant, la sentence, la Cour, le Juge, l’Avocat, etc.

- Le texte juridique évite en général toute allégorie, réso- nance, allitération, exotisme, synonymie, sens allusif, méta- phore et autres aspects du langage humain pour éviter toute ambiguïté ou toute équivoque dans la lecture du procès.

- Des sources religieuses en tant que sources bien fondées, sont généralement présentes dans le texte juridique. Il s’agirait d’instruire la machine en vue d’une traduction automatique dans ce sens.

- Le texte juridique est, par définition, un texte conservateur, donc non susceptible de changement du fait que la phraséolo- gie a déjà été testée, approuvée et appliquée dans la juridiction.

Sur le plan grammatical, l’une des particularités du texte juri- dique anglais est qu’il est basé sur des modaux tels que {can, could, may might, will, …} et dont les nuances en anglais sont parfois difficiles à traduire en arabe même pour un traducteur averti. La traduction du texte juridique de l’arabe vers le fran- çais (ou vice-versa) et encore plus de l’arabe vers l’anglais (ou vice-versa) doit surtout prendre en charge des problèmes étroi- tement liés à la nature de la langue légale et aux dispositifs spécifiques des systèmes légaux des langues française et arabe ou anglaise et arabe. Ceci apparaît souvent dans des jugements arrêtés en France, aux Etats Unis ou en Grande Bretagne (di- vorces par exemple) à traduire en arabe et inversement.

A prime abord, ces spécificités du texte juridique de chaque langue en question se manifestent dans la constitution même d’un jugement donné. A titre d’exemple, citons le cas des faits, des attendus et de la décision. Les faits sont généralement

(14)

24

traduits en arabe par

ﻊﺌﺎـﻗﻭﻟﺃ

‘al waqâi’11, les attendus par

ﺕﺎﻴﺜﻴﺤﻟﺃ

‘al ajijât’ du fait que la copule arabe

ﺙ ﻴﺤ

{aju}

et l’expression

ﻥﺃ ﺙﻴﺤ

{aju anna} (vu que, étant donné, etc.) sont très productives dans le corps d’un jugement donné

ﻡﹾﻜﺤ

‘ukm’ et la décision devient

ﻕﻭﻁﻨﻤﻟﺃ

‘al manûq’ parce qu’elle est produite oralement.

En voici quelques exemples :

ﻥﺎـﻴﺒ ﺍ ﻊﺌﺎـﻗﻭ ﺓﻭﻋﺩﻟ

ﺍ ﻊﺌﺎﻗﻭﻟ :

ﺒ ﺔﻀﻴﺭﻌ ﺔﻴﺤﺎﺘﺘﻓﺍ

ﺎﺘﺒ ﻲﻨﺩﻤﻟﺍ ﻡﺴﻘﻟﺍ ﻁﺒﻀ ﺔﺒﺎﺘﻜ ﻯﺩﻟ ﺔﻋﺍﺫﻤ ﺦﻴﺭ

...

ﻲﻋﺩﻤﻟﺍ ﻊﻓﺭ ...

ﺎﺘﺴﻷﺍ ﻪﻠﻴﻜﻭ ﺔﻁﻴﺴﻭﺒ ﻡﺎﺼﺨﻠﻟ ﺭﺸﺎﺒﻤﻟﺍ ﺫ

...

ﺕﻴﺒﺜﺘ ﺎﻬﻋﻭﻀﻭﻤ ﻪﺴﻔﻨﺒ ﻡﺎﺼﺨﻠﻟ ﺭﺸﺎﺒﻤﻟﺍ ﻪﻴﻠﻋ ﻲﻋﺩﻤﻟﺍ ﺩﻀ ﺓﻭﻋﺩﺒ ﻫ ﻲﻅﻔﺤﺘ ﺯﺠﺤ ﺫ

ﺎﻬﺼﱠﺨﻠﻤ ﺍ ...

Que nous transcrivons ci-dessous :

bajân waqâi addawa

Les faits : bi aria iftitâijja mudâa ladâ kitâbat ab al qism al madani bitarî …. rafaa al muddai …… al mubâir lil iâm biwasîati wakîlihi al usta …. bidawa idda al muddai alaih al mubâir liliâm bi nafsihi mawuuha tabît az taaffui hâa mulaauha…

En donnant le texte arabe ci-dessous, ce dernier est traduit en français par des outils de traduction sur le Net de la façon sui- vante :

11 . Nous utilisons les symboles phonétiques de l’API (IPA) dans nos exemples.

(15)

25



: ... ﺦﻴﺭﺎﺘﺒ ﻲﻨﺩﻤﻟﺍ ﻡﺴﻘﻟﺍ ﻁﺒﻀ ﺔﺒﺎﺘﻜ ﻯﺩﻟ ﺔﻋﺍﺫﻤ ﺔﻴﺤﺎﺘﺘﻓﺍ ﺔﻀﻴﺭﻌﺒ

ﻊﻓﺭ ﻲﻋﺩﻤﻟﺍ ...

ﺭﺸﺎﺒﻤﻟﺍ ﻡﺎﺼﺨﻠﻟ

ﺔﻁﻴﺴﻭﺒ ﻪﻠﻴﻜﻭ

ﺫﺎﺘﺴﻷﺍ ...

ﺓﻭﻋﺩﺒ

ﺩﻀ ﻲﻋﺩﻤﻟﺍ ﻪﻴﻠﻋ

ﺭﺸﺎﺒﻤﻟﺍ ﻡﺎﺼﺨﻠﻟ

ﻪﺴﻔﻨﺒ ﺎﻬﻋﻭﻀﻭﻤ ﺕﻴﺒﺜﺘ

ﺯﺠﺤ ﻲﻅﻔﺤﺘ ﺍﺫﻫ

ﺎﻬﺼﱠﺨﻠﻤ

...

Exposé des faits de l'appel Faits:

Pétition écrit une section de contrôle éditorial diffusé sur ci- vile... Le demandeur ... Argument direct à l'argument et son agent, M. ... Contre le défendeur invité à diriger son propre thème querelle de fixation de cette synthèse installés ...

que nous traduisons par:

Résumé des faits

Suite à une requête déposée auprès du Greffe de la Section Ci- vile en date du ….. sous le N° …. , le défendeur a déposé par son avocat le Professeur ….. une plainte à l’encontre du défen- dant lui-même dont le sujet est la mise en conservation provi- soire dont voici le contenu …

En traduisant ce texte arabe en Anglais, ces outils nous produi- sent :

Statement of the facts of the call Facts:

Petition in writing an editorial broadcast control section on civil ... The plaintiff... Direct argument for argument and his agent, Mr. ... Against the defendant invited to direct his own quarrel theme installed attachment summary of this...

Systran (version 6 avec la sélection du dictionnaire juridique) nous produit la ‘traduction’ suivante:

Following a request deposited auprès of Greffe of Sec- tion Civile on….>. .> under N° ...., the defendant deposited by its lawyer the professor….>. .> a complaint with opposi- tion of the defendant itself whose subject is the setting in provisional conservation of which here contents…

(16)

26

Les attendus: bada l mudâwala qânûnan ayu anna maw- du annizâ al marû jadûru awla tabît al adz attaaffi l wâriala …..





 

ﺩﻌﺒ لﻭﺤ ﺭﻭﺩﻴ ﺡﻭﺭﻁﻤﻟﺃ ﻉﺍﺯﹶﻨﻟﺍ ﻉﻭﻀﻭﻤ ﻥﺃ ﺙﻴﺤ ﺎﻨﻭﻨﺎـﻗ ﺔﻟﻭﺍﺩﻤﻟﺍ

ﻰﻠﻋ ﺙﺭﺍﻭﻟﺍ ﻲﻅﻔﺤﺘﻟﺍ ﺯﺠﺤﻟﺍ ﺕﻴﺒﺜﺘ ...

Traduit en français (par nous-mêmes) par : Après avoir lu l’affaire en délibéré dont le sujet du conflit en présence tourne autour de la conservation provisoire concernant ……

ِ

Cet extrait de texte juridique arabe est traduit en français par des outils de traduction sur le Net comme suit :

Attendus

Ensuite après avoir lu les affaires dessus de délibéré au sujet des dont le sujet du conflit en présence tourne autour de la con- servation temporaire...

Systran (version 6 avec dictionnaire juridique) le traduit en anglais comme suit:

Waited

Afterwards to have read the business in deliberated of which the subject of the involved conflict turn around the provi- sional conservation concerning……

La decision: akamat al makama falan fil mawâd al ma- danijja ukman alânijjan uurijjan wab tidâijjan …

1. qabûl addawa aklan

2. al ukmu bi tabît al adz attaaffui al wârial….

:   ﺎﻤﻜﺤ ﺔﻴﻨﺩﻤﻟﺍ ﺩﺍﻭﻤﻟﺍ ﻲﻓ ﻼﺼﻓ ﺔﻤﻜﺤﻤﻟﺍ ﺕﻤﻜﺤ ﺎﻴﺭﻭﻀﺤ ﺎﻴﻨﻼﻋ

ﻴﺌﺍﺩﺘﺒﺍﻭ ﺎ ...

1 لﻭﺒﻗ . ﻼﻜﺸ ﺓﻭﻋﺩﻟﺍ

2

ﻰﻠﻋ ﺙﺭﺍﻭﻟﺍ ﻲﻅﻔﺤﺘﻟﺍ ﺯﺠﺤﻟﺍ ﺕﻴﺒﺜﺘﺒ ﻡﻜﺤﻟﺃ .

...

(17)

27

Traduit en français (par nous-mêmes) :

Le Tribunal a décidé en matière de droit civil et en procès pu- blique et ce en présence des parties concernées et en premier ressort :

1. L’affaire recevable en la forme

2. Confirmation des mesures conservatoires provisoires con- cernant….

ِ

Cet extrait de texte juridique arabe est traduit en français par des outils de traduction sur le Net comme suit :

Parlé / Oral

La cour décidée en ce qui concerne la loi civile et dans le pu- blic de procès et ceci en présence des pièces concernées et dans la première ressource:

1. Les affaires admissibles sous la forme

2. Confirmation de C des mesures d'académies S temporaire au sujet de....

Traduit en Anglais par Systran version 6 avec dictionnaire juridique :

Decision

The Court decided out of matter of civil law and in lawsuit public and this in the presence of the parts concerned and in the first resort:

1. The admissible business in the form

2. Confirmation of academies measurements concerning....

Ces exemples sont révélateurs, nous semble-t-il, non seulement des irrégularités dans les correspondances plus spécialement aux niveaux syntaxique et lexical entre les langues en question mais aussi de la difficulté dans la transposition d’un texte char- gé de tout un poids culturel, traditionnel et civilisationnel vers un texte n’ayant pas nécessairement les mêmes références so- cioculturelles et autres que même l’humain trouve parfois diffi- ciles à traduire. Qu’en serait-il alors pour la machine? Nous remarquons, à titre d’exemple, que dans les traductions de l’arabe vers le français ou l’anglais, l’article défini de l’arabe

(18)

28

est parfois omis et ce surtout lorsqu’il fait partie d’un mot isolé tel que

ﻊﺌﺎﻗﻭﻟ ﺍ

traduit en français par Faits et en Anglais par Facts (voir supra les exemples de

ﺕﺎﻴﺜﻴﺤﻟ ﺍ

et de

ﻕﻭﻁﻨﻤﻟ ﺍ

). Ceci n’empêche pas pour autant des tentatives de recherche dans ce domaine pour instruire la machine à procéder à des prototypes de traduction de textes juridiques.

Le système TACT (Traduction Automatique Centre Tesnière, France) par exemple est un système de traduction automatique français-arabe12 de textes juridiques. Appliqué au domaine du droit, ce traducteur automatique arrive à générer le type de tra- duction suivante:

l'ordre administratif connaît des litiges relatifs à l'organisation et au fonctionnement des services publics et aux contrats administratifs

يرادﻹا مﺎﻈﻨﻟا تﺎﻋاﺰﻨﻟا ﻲﻓ ﻢﻜﺤﯾ

تﺎﻄﺒﺗﺮﻤﻟا ﻟا ﺔﯿﻟآ و ﻢﯿﻈﻨﺘﻟﺎﺑ

ﺎﻣﺪﺨ ت ﻟا ﺎﻌ ﺔﻣ

يرادﻹا دﻮﻘﻌﻟﺎﺑو Nous avons été maintes fois surpris de constater que pour pas- ser d’une langue à une autre certains systèmes empruntaient une 3ème langue qui est souvent l’anglais; ce qui fait que les résultats ne peuvent pas être nécessairement en adéquation entre SL et TL en passant par une langue intermédiaire (l’anglais). Par exemple, pour le mot « libre » en français ou

« free » en anglais, nous avons trouvé dix neuf entrées lexi- cales dans la fouille de textes juridiques arabes. Ceci en plus du sens commun de

ﺭﺤ

. Il s’agirait donc de répertorier ces diffé- rentes entrées lexicales arabe, de situer ou de localiser les con- textes dans lesquels elles sont suceptibles d’apparaitre et d’instruire la machine dans ce sens. Tâche tout à fait réalisable par une recherche lexicographique et sémantique dans ce do- maine.

12 . Cf. «ALSHARAF,H. et al. (2004)»

(19)

29

Pour conclure, nous dirons simplement, que si l’on veut de bonnes traductions automatiques, il faudrait se limiter à un do- maine précis. De plus, notre expérience nous a montré que les systèmes doivent être conçus de façon unidirectionnelle dans un premier temps et seulement ensuite l’on pourrait envisager de travailler dans l’autre sens, ce qui nécessite inévitablement la création d’un nouveau système. Si l’on cherche des résultats de qualité, l’analyse de la langue source devrait se faire en fonction de la langue cible, en sachant que ces analyses ne sont pas forcément réversibles.

(20)

30 Références:

ALSHARAF , H., CARDEY, S., GREENFIELD, P. (2004): «French to Arabic Machine Translation: the Specificity of Language Couples », Actes de The European Association for Machine Translation (EAMT) Ninth Workshop, Malta, 26-27 April 2004, Foundation for International Studies, University of Malta, pp.11-17.

ACHECHE,S. (1999) : «Système de traduction semi-automatique des termes

relatifs au TAL (Traitement Automatique des Langues)», Mémoire de Maî- trise d'anglais mention Industries de la Langue, Besançon, 1999.

BOUHADIBA, F. & ROUABHI, M. (2008) : A propos

d’un Dictionnaire Electronique Arabe /Anglais/ Français dans le Domaine des Hydrocarbures, Revue Maghrébine des Langues, pp. 111-141. Univer- sité d’Oran, Algérie.

CARDEY,S.,GREENFIELD,P. (2001): « The analysis and design of comput- erised lexicons », in Lexis in Contrast (B. Altenberg & S. Granger eds.), Benjamins, pp. 231-249

CARDEY,S.,GREENFIELD,P. (2005) : « Systemic Linguistics with Applica- tions », Proceedings of the 9th International Symposium on Social Commu- nication, Santiago de Cuba, January 24-28, 2005, Actas II, pp. 649-653 CASASANTO,DANIEL (2008), "Who's Afraid of the Big Bad Whorf? Cros- slinguistic Differences in Temporal Language and Thought", Language Learning 58 (1): 79

COOK, VIVIAN & BENEDETTA BASSETTI (2010), Language and Bilingual Cognition, Hove: Psychology Press

CATFORD, J.C. (1965): A Linguistic Theory of Translation, London, Ox- ford University Press.1965)

CHAN NG,R. (1999) : « Prototype informatisé de dictionnaire du tourisme français-espagnol

CHOMSKY, N. (1964) : Current Issues in Linguistic Theory, The Hague : Mouton

CHOMSKY, N. (1965) : Aspects of the Theory of Syntax, Cambridge, Mass. M.I.T. Press.

(21)

31

CHOMSKY, N. (1968) : Language and Mind, New York : Harcourt Brace.

CHOMSKY, N. (1971) : Selected Writings, edited by Allen, J.P.B. and Van Buren, P. London, Oxford University Press.

DRIVONIKOU, G. V., P. KAY,T. REGIER, R. B. IVRY, A. L. GILBERT, A. FRANKLIN & I. R. L. DAVIES (2007): "Further evidence that Whor- fian effects are stronger in the right visual field than the left", Proceedings of the National Academy of the Sciences USA. 104 (3), pp. 1097–1102 FISHMAN, J.A. (1978), "Positive bilingualism: Some overlooked ratio- nales and forefathers", in J. E. Alatis (Ed.), International dimensions of bilingual education, Washington, D.C.: Georgetown University Press, pp. 42–52.

FISHMAN, J.A. (1982), "Whorfianism of the third kind: Ethnolinguistic diversity as a worldwide societal asset", Language in Society 11, pp. 1–22 FRANK, MICHAEL C.; EVERETT, DANIEL L.; FEDORENKO, EVELI- NA; GIBSON, EDWARD (2008), “Number as a Cognitive Technology:

evidence from Pirahã language and cognition” Cognition 108 (3), pp. 819- 824.

GHENIMI, A. (2007): Conception d’un modèle de traduction Arabe- Français appliqué au domaine des Mathématiques, Thèse de Doctorat, Centre Lucien Tesnière, Université de Franche Comté, Besançon, France.

GUMPERZ,JOHN,&STEPHEN LEVINSON EDS. (1996), Rethinking Linguistic Relativity, Cambridge: Cambridge University Press

HUTCHINS, W. J. & SOMERS, H. (1992): Introduction to Machine Trans- lation. London: Academic Press.

NIDA, Eugene A. (1964): Towards a Science of Translating, Leiden, E.J.

Brill.

SAPIR, E. (1983), David G. Mandelbaum, ed., Selected Writings of Ed- ward Sapir in Language, Culture, and Personality, University of California Press

(22)

32

STEINER, George (1975): After Babel: Aspects of Language and Transla- tion, London, OUP

WHORF, B. (1956), John B. Carroll (ed.), ed., Language, Thought, and Reality: Selected Writings of Benjamin Lee Whorf, MIT Press

Références

Documents relatifs

Le processus de traduction d’une forme verbale en tunisien en une forme verbale MSA se décompose en trois étapes : l’analyse morphologique à l’aide de l’outil MAGEAD adapté

Cette présentation devra, bien entendu, être suivie de votre conclusion dans laquelle vous nous exposerez vos conseils pour en profi ter au mieux?. Suggestion de plan

Le programme de la 1re et 2e année comporte trois UEF : l’anglais (10,5 ECTS), l'arabe (10,5 ECTS) et les sciences sociales * (6 ECTS) + une option (3 ECTS) qui peut être

Oxford Bookworms, stage 6, The Joy Luck Club + complete the exercises at the end of

En résumé, les candidats s'en sortent mieux en contraction de texte qu'en thème car dans le premier cas, le candidat a plus de facilité à contourner les

Dans nos travaux, deux types de corpus ont été utilisés : des corpus monolingues pour la tâche de détection des EN et des corpus bilingues pour la tâche de

Il en résulte donc (1) une automaticité linguistique dans les correspondances- calque naissant de la parfaite connaissance des langues objet de traduction sans recourt à

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des