• Aucun résultat trouvé

La notion d’unité de traduction

Chapitre III : Pensée traductionnelle humaine et Pensée traductionnelle machine

III.4 L’interaction homme-machine en traduction

III.4.2 La notion d’unité de traduction

Nous avons décidé d’analyser la notion d’unité de traduction parce que nous estimons qu’il est intéressant de noter comment, d’un côté les études neurolinguistiques et psychocognitives et de

176

l’autre côté les études en traduction automatique et en TAL, se sont appropriées la conception de « ségmentation » du discours, strictement liée à la notion d’unité de traduction.

La ségmentation consiste à découper le discours (ou bien le « texte », dans sa forme écrite) en unités sémantiques que l’on associe normalement à des phrases ou à des propositions. Il s’agit, en TA et en TAO, de l’opération automatique qui permet d’aligner les textes et leurs traductions existantes dans le but de créer un « bitexte » composé du texte de départ ségmenté qui est aligné et donc connecté à la ségmentation correspondante effectuée dans le texte d’arrivée. De tels bitextes peuvent notamment être implémentés dans des mémoires de traductions ou bien en tant que corpus parallèles destinés à la traduction basée sur des statistiques (comme Google Translate).

Ce que l’on appelle généralement « segment », plus précisement correpond à une unité

d’information que l’on appelle en psychologie cognitive et en TAL un « chunk »179, un concept qui

nait de l’étude de la capacité de la mémoire humaine à court terme comme le montre les études de

Miller (1956)180.

Comme précisé par Robinet Vivien181 dans sa thèse de doctorat (2009 : 10) :

« Un chunk est généralement défini en termes qualitatifs et non pas en termes quantitatifs. Gobet et al. (2001) définissent un chunk comme étant une collection d’éléments entretenant de fortes associations entre eux, et de faibles associations avec les autres éléments. Ainsi, un chunk ne représente pas nécessairement une quantité d’information fixe[notre soulignement] telle qu’elle pourrait être mesurée par un algorithme de compression, mais plutôt une quantité d’information cognitive, dépendante des connaissances possédées » Robinet (2009 :10)

La propriété principale des chunk consiste en la formation d’unités d’information à différents

niveaux de complexité, tout comme Baisa Vít le souligne dans son article182 :

« The chunks […] have one important property which is well known for biological neurons: they connect together forming other chunks which may play role of a unit. The unit connects with other units and so on from lower to higher levels. » Baisa (2011 : 7)

179 « Le mécanisme de chunking est couramment utilisé en psychologie cognitive dans des domaines aussi variés que l’apprentissage de grammaires artificielles, la segmentation de mots ou la modélisation de la mémoire à court terme. Il est à la base de nombreux modèles cognitifs computationnels » Robinet (2009 : V).

180 Miller, G.A., (1956) “The magical number seven, plus or minus two : some limits on our capacity for processing information”. The psychological review, 63, 81-97.

Baddeley, Alan « The magical number seven: Still magic after all these years?» Psychological Review, Vol 101(2), Apr 1994, 353-356. http://dx.doi.org/10.1037/0033-295X.101.2.353

181 Robinet Vivien (2009), « Modélisation cognitive computationnelle de l’apprentissage inductif de chunks basée sur la théorie algorithmique de l’information » Institut Polytechnique de Grenoble.. http://www.theses.fr/2009INPG0108

182 Baisa Vít (2011), « Chunk-based Language Model and Machine Translation », Masaryk University Faculty of Informatics, July 2011.

177

Cette propriété définissant le chunk comme unité pouvant être constituée par d’autres unités hiérarchiquement inférieures ou bien pouvant appartenir à une unité hiérarchiquement supérieure

peut être observée également chez l’adoption que Paradis fait du processus de chunking en

interprétation simultanée (1994 : 325), ce qu’il illustre dans la figure ci-dessous présentée.

Figure 20. Paradis : segmentation en interprétation simultanée.

Au cours du processus d’interprétation simultanée, l’interprète coupe le message reçu en « chunks » correspondant à de phrases et/ou des unités sémantiques. L’on enchaîne donc : la réception du chunk par la mémoire échoïque, le décodage linguistique de celui-ci, l’élaboration de sa signification, l’encodage en L2 et la production de sa traduction, ce qui est retenu par la mémoire échoïque qui monitore son équivalence par rapport à l’input de départ.

En ce qui concerne spécifiquement la traduction, les études cognitives qui se donnent pour objectif l’analyse des unités de traduction, se basent sur les techniques déjà évoquées dans le Chapitre II (p. 121) de « eye-tracking » et « key-logging ».

178

Du point de vue cognitif, par conséquent, l’unité de traduction se définit par rapport à des critères

d’analyse rigoureux que Michael Karl et Martin Kay décrivent dans leur article183 :

« Une UT [Unité de Traduction] est définie comme l’unité sur laquelle l’attention du traducteur se focalise. L’attention pouvant être dirigée vers la compréhension du texte source (ST) ou la production du texte cible (TT), ou les deux, le mouvement des yeux et le rythme de frappe des traducteurs sont tous deux analysés ». Karl et Kay (2011 : 952). En ce sens, les unités de traduction sont étudiées en tenant compte de :

« 1) writing activities to produce a chunk of TT [Target Text] within a certain lapse of time;

2) reading activities of the ST [Source Text], sufficient to gather what translation(s) should be produced; and

3) the ST segment(s) of which the produced TT is a translation.» Karl et Kay (2011 : 954).

Les auteurs précisent (2011 : 953) qu’il existe une vaste littérature sur le sujet de la ségmentation en

traduction où l’on peut distinguer entre : la recherche sur les processus de traduction humaine visant

les segments de base des opérations traduisantes, et la recherche sur les produits de la traduction

visant l’identification de correspondances entre les paires de textes résultant du processus traductionnel.

En revanche, au centre des études cognitives sur l’unité de traduction, tout en retrouvant leur focus principal au niveau de l’enquête sur le processus traductionnel, se situe l’intérêt envers l’attention et le processus de sélection opéré par le traducteur. L’ expérimentation décrite dans l’article de Karl et Kay a impliqué la participation d’un groupe de traducteurs professionnels et d’un groupe d’apprentis traducteurs : la différence principale enregistrée au sein des deux groupes consiste en une allocation différente de l’attention. À cet égard, les auteurs expliquent que :

« Attention is considered to be the “select allocation of cognitive processing resources” (Anderson 2000: 47). Whereas, at some times the focus of a translator’s attention will switch back and forth between understanding the ST and production of the TT, at other times it may be focused on the two tasks simultaneously. Accordingly, there are two different kinds of attention that might play a role in translation:

– Alternating attention: This refers to the mental flexibility that allows individuals to shift their focus of attention and move between tasks with different cognitive requirements;

– Divided attention: This refers to the ability to respond simultaneously to multiple tasks or multiple task demands. It represents a higher level of attention.

183 Karl M. Kay M. (2011), « Gazing and Typing Activities during Translation: A Comparative Study of Translation Units of Professional and Student Translators », Meta : journal des traducteurs / Meta: Translators' Journal, vol. 56, n° 4, p. 952-975.

179

Below we will investigate the amount of alternating and divided attention found in student and professional translators. We show that the former type of behavior is prevalent in novices, while divided attention predominates in that of experienced translators, especially those who are touch typists. The cognitive process of coordinating reading and writing activities and transforming ST meaning into TT expressions is more demanding for students than for professionals.» Karl et Kay (2011: 954-955).

Au sein des études cognitives, l’opposition entre processus traductionnel séquentiel et processus traductionnel parallèle trouve une explication possible : les deux processus sont attestés chez les traducteurs, mais c’est leur niveau d’expertise a determiner laquelle des deux modalités est mise en place, tout comme indiqué par la théorie neurolinguistique de Paradis. Pourtant, comme souligné par les auteurs dans leurs conclusions (2011 : 973), la définition d’unité de traduction d’un point de vue cognitif nécessite encore de réflexions ultérieures en raison de ses multiples propriétés que l’on devrait notamment étudier dans le cadre d’un « inventaire des opérations cognitives » qui sont à la base du traitement des unités de traduction, ce qui constitue une future piste de recherche.

L’étude des propriétés des unités de traduction fait d’ailleurs l’objet des études neurolinguistiques qui ont investigué le traitement cérébral de différents types d’unités de traduction, comme García l’indique dans son article de 2013 (voir plus haut p. 151) :

« In the last twenty years, a number of neuroimaging studies have been conducted to measure brain activity patterns during translation. However, the evidence thus obtained has not been hitherto systematically reviewed […] The studies are organized in terms of the type of translation unit employed in each case, namely: single words, isolated sentences, and supra-sentential texts –i.e., texts longer than one sentence. » García (2013: 372).

Le manque de systémicité évoqué par l’auteur dérive du fait que les modalités des expériments décrits ne sont pas les mêmes : le processus de traduction en lui-même ne correpond pas (interprétation simultanée, traduction à vue, traduction active, traduction passive) et les participants impliqués présentent des profils différents (locuteurs bilingues, traducteurs professionnels, interprètes). Toutefois, ce qui légitime l’analyse de ce répertoire d’expérimentations et qui d’ailleurs s’avère particulièrement intéressant aux fins de notre analyse, concerne la prise en compte de l’unité de traduction offerte par l’auteur en tant que variable organisationnelle :

« […] by considering translation units as a key organizing variable [notre soulignement], their integrative analysis reveals general patterns. » García (2013: 378).

D’après les expériments présentés, les aires cérébrales impliquées dans le processus traductionnel varient selon le type d’unité de traduction traitée (mots isolés, phrases isolées ou paragraphes supra-phrastiques) et selon la directionnalité du processus traductionnel (active, i.e. vers la langue étrangère ou passive, i.e. vers la langue maternelle).

180

En ce qui concerne la difference entre la traduction au niveau lexical et la traduction au niveau de la phrase, l’auteur indique que dans les deux cas ce sont les aires cérébrales de l’hémisphère gauche (HG) qui sont activées soit de manière exclusive soit de manière prépondérante. Dans les deux directions du processus, la traduction lexicale active les structures cérébrales postérieures de manière plus importante par rapport à la traduction phrastique. Par contre, l’aire de Broca est apparemment activée dans les deux types de traduction, indépendamment de la directionnalité du processus.

Au sujet de la différence entre traduction phrastique et traduction supra-phrastique, les deux semblent activer de manière différente les structures frontobasales, notamment des parties de la région de Broca. Ces différences sont peut-être imputables aux différentes modalités expérimentées dans les études citées, ou bien aux techniques diverses employées ou encore du degré non homogène de l’expertise des traducteurs/interprètes ayant participé (2013 : 378).

Pourtant, ce qui ressort de ces études c’est notamment que :

ƒ le traitement au niveau de la phrase a un impact sur le niveau d’activation des équivalents

lexicaux entre les langues184 :

ƒ il existe une difference cognitive fondamentale entre la traduction au niveau lexical

(indépendante du contexte, i.e. une opération de décodage-encodage qui peut être émulée

par la machine) et la traduction du discours, un processus dépendant du contexte qui paraît

exclusivement humain (2013 : 379) ;

ƒ les différences enregistrées au niveau de l’activation des régions cérébrales185 s’avèrent

compatibles avec le modèle de Michel Paradis basé sur l’intégration entre processus déclaratifs et procéduraux (que nous avons décrite à la page 106), ce qui indique qu’une partie des circuits impliqués en traduction sont représentés au niveau des mêmes aires macroanatomiques que celles activées dans le processus exclusif en L1 ou L2 ;

ƒ le rôle de l’hémisphère droit nécessite de recherches ultérieures afin d’être cerné.

Bien que chez l’humain la détermination et le traitement des unités de traduction nécessite de recherches ultérieures ainsi que d’une meilleure systématicité au sein des études neuro-cognitives, l’on peut tout de même identifier un point de rencontre entre la notion de segment-« machine » et

184 « there is evidence that sentence context modulates the level of coactivation between lexical equivalents across languages » García (2013: 378 ).

185 « while frontobasal activations –especially in and around Broca’s area– were observed for all translation units, 2 temporal regions were differentially activated only in word translation tasks. On the contrary, task-distinctive activations in sentence and suprasentential-text translation occurred only in frontobasal areas » García (2013: 379 ).

181

celle d’unité de sens « humaine », les deux étant référables aux fins d’une analyse comparée en

terme de « chunk », i.e. en terme d’unité d’information.

Or, tout comme indiqué par García dans son article, la traduction d’un texte s’avère plus complexe pour la machine par rapport à la traduction de mots ou de phrases isolées en raison de la dépendance inévitable du discours textuel de son contexte communicatif, dont l’humain est aujourd’hui le seul capable de traiter la multiplicité des variables communicatives associées. Donc, bien évidemment, l’information que la machine est en mesure de traiter est bien plus limitée par rapport à celle que l’humain arrive à prendre en compte, cette limite correspondant au fait que l’information-machine se réduit à de l’information de nature (inter)linguistique, alors que l’information-humaine comprend, quant à elle, également l’ensemble des données situationnelles et communicatives issues de la pragmatique du discours concerné.

De toute façon, nous verrons qu’en phase d’Analyse Préalable des compétences chez nos participants humains, le relevé de leurs faiblesses linguistiques et traductionnelles ne se situe pas seulement au niveau discursif, mais également aux niveaux morphologique, lexical, terminologique et morphosyntaxique. Pour cette raison, au cours de nos activités expérimentales d’interaction entre nos apprentis traducteurs humains et notre traducteur automatique prototypique, nous nous intéresserons à l’apport induit par cette interaction tout en tenant compte de manière systématique de tous les niveaux d’analyse linguistique observés : morphologie, lexique, terminologie, morphosyntaxe, discours, sémantique (Chapitre IV).