• Aucun résultat trouvé

Langue naturelle vs langue traduite : observation du corpus

fiches lexicographiques bilingues Annick Farina, Riccardo Billero

3. Langue naturelle vs langue traduite : observation du corpus

La différence de fréquence de mots ou de collocations présents dans des corpus comparables contenant des textes français en « langue naturelle » et des textes qui proviennent d’une traduction en français peuvent nous permettre de repérer des formes choisies sous l’influence de la langue source. 3.1 Fréquence zéro dans les textes en langue naturelle

Nous avons comparé la liste des mots présents dans le sous-corpus LBC de textes de vulgarisation écrits en français contenant 270.000 mots avec un corpus non intégré à la base pour le moment de textes de même type mais en traduction 93.000 mots en réalisant une liste des mots présents exclusivement dans le sous-corpus « en traduction ».

- fautes

La majorité des formes rencontrées sont assimilables à des fautes : absence d’accent (cloitre), influence de l’orthographe italienne le français (baroche), « francisation » excessive au niveau orthographique (Caliari) ou par l’utilisation d’une traduction française là où l’usage préconise la forme italienne (Sainte-Réparate désigne en français la personne ou la cathédrale de Nice mais pas l’église Santa Reparata de Florence, la forme française n’est attestée nulle part dans la base LBC) ou l’inverse (Giove n’est jamais utilisé en italien dans notre corpus, où il est traduit par Jupiter), utilisation de mots qui n’ont rien à voir avec la description du patrimoine florentin, probablement parce qu’ils correspondent à un sens du mot-source qui s’applique à d’autres contextes (coursive dans une description du Dôme de Florence, ou panonceau pour se référer aux compartiments des portes du Paradis). Ce genre d’erreurs ne donne pas lieu à la réalisation d’une information ciblée à l’intérieur des dictionnaires sauf dans le cas d’une grande fréquence de l’erreur (par ex. pour panonceau présent dans plusieurs sources avec un total de 8 occurrences mais pas coursive qui n’a qu’une attestation).

- nivellement

On peut distinguer des formes qui correspondent à une différence « pragmatique » ou stylistique entre français et italien qui ne nous intéressent pas d’un point de vue lexicographique, comme l’utilisation de mentionnons dans plusieurs textes en traduction qui ne se retrouve dans aucun des textes de la base complète, ou de certaines formes du passé-simple (décora, succéda) qui ne sont pas utilisées dans les textes de vulgarisation en français « naturel ». Il s’agit de formes qui correspondent à des normes différentes relatives aux types de texte du corpus : une analyse plus approfondie pourrait probablement nous permettre d’observer un usage peu ou pas attesté du « nous » dans les guides touristiques, et l’usage peu fréquent de formes au passé-simple par rapport au passé-composé ou au présent, etc.

Ce qui nous intéresse beaucoup plus dans cette comparaison c’est de repérer des formes qui, tout en étant parfaitement « correctes » en français, peuvent être considérées comme hors contexte par rapport aux usages attestés dans le même type de contexte en langue naturelle. La différence dans l’usage d’un mot non attesté peut faire l’effet d’un « anachronisme » (différence dans la fréquence d’usage en synchronie). C’est le cas par exemple de l’adjectif grand- ducal et du participe passé paraphé dont les équivalents italiens sont plus fréquents dans la langue d’aujourd’hui que ne le sont leurs traductions littérales françaises. L’écart dans le registre peut aussi s’appliquer dans le cas d’une différence de « technicité ». L’adjectif autographe présent dans plusieurs sources de vulgarisation en traduction est absent des textes de même type de notre corpus en langue naturelle, mais on en trouve quelques occurrences dans des textes plus spécialisés du corpus général. La différence de registre donnera lieu à un marquage différencié entre lemme en langue source et sa traduction attestée.

3.2 Différence de fréquence dans les textes-source par rapport aux textes-cible Pour illustrer les phénomènes de simplification, nous avons interrogé deux sous-corpus de notre base LBC constitués de 51 vies de l’ouvrage Le vite de' più eccellenti pittori, scultori e architettori de G. Vasari (1568) et de leurs traductions en français (traduction Leclanché-Weiss, 1900). Ne pouvant encore nous baser sur des statistiques provenant des bases parallèles de traduction (pour la description de ces bases cfr. Zotti 2017), nous nous sommes concentrés sur des mots français qui avaient une grande fréquence en comparant cette fréquence à celle du mot le plus proche en italien (même sens, mêmes traits distinctifs). Ceci nous a permis de relever des écarts de fréquence qui nous pousseront à une étude plus approfondie dans le but de définir des réseaux analogiques dans les deux langues qui nous donnent la possibilité de proposer des liens de traduction permettant d’éviter une perte de précision. Tableau a par exemple une fréquence de 2232 par million de mots dans notre sous-corpus français tandis que quadro a une fréquence de 793 par million de mots dans le sous-corpus italien contenant les mêmes textes en langue originale. Un grand nombre d’hyponymes de quadro sont en effet traduits par tableau en français. Si cette perte est probablement compensée par l’ajout de traits distinctifs qui accompagnent le mot, nous retenons que le traducteur ne pourrait que gagner en précision si nous lui proposions d’autres formes pour rendre le sens de ces différents hyponymes. 4. Conclusion

La comparaison de résultats qui concernent la fréquence de formes à l’intérieur du corpus LBC nous a permis d’illustrer l’utilisation de différents

sous-corpus pour orienter l’information tant descriptive que normative que nous souhaitons fournir dans la partie bilingue de nos dictionnaires LBC. « Nous considèrerons, même si cela reste à démontrer […] qu’une sur- ou une sous-représentation d’un phénomène linguistique donné peut correspondre à une violation de la contrainte d’usage […] et qu’une bonne traduction se doit de tendre vers une homogénéisation entre la langue originale et la langue traduite. » (Loock et al. 2013 : sp)

L’application de méthodes visant à la vérification de la qualité des traductions et la création d’outils qui se basent sur des analyses critiques de traductions existantes, en les comparant, en particulier, à des productions qui ne passent pas par la médiation d’une autre langue devrait permettre une optimisation du caractère naturel des textes traduits et de la précision, objectif essentiel pour la diffusion d’une information de qualité.

Bibliographie

Baker M. (1993). Corpus Linguistics and Translation studies. Implications and Applications. In Baker M. and al. editors, Text and Technology, Amsterdam/Philadelphie, Benjamins, pp.233–250.

Billero R., Nicolas Martinez, M.C. (2017). Nuove risorse per la ricerca del lessico del patrimonio culturale: corpora multilingue LBC. In CHIMERA Romance Corpora and Linguistic Studies, Vol.4, No. 2, pp 203-216, ISSN: 2386-2629, 2017

Farina A. (2016). Le portail lexicographique du Lessico plurilingue dei Beni Culturali, outil pour le professionnel, instrument de divulgation du savoir patrimonial et atelier didactique, PUBLIF@RUM, vol. 24

http://publifarum.farum.it/ezine_articles.php?id=335

Farina A. (2014). Descrivere e tradurre il patrimonio gastronomico italiano: le proposte del Lessico plurilingue dei Beni Culturali. In Chessa F. and De Giovanni C., La terminologia dell'agroalimentare, Milan, Franco Angeli, pp. 55-66.

Frawley W. (1984). Prolegomenon to a theory of translation. In Frawley W. editor, Translation: Literary, Linguistic and Philosophical Perspectives, Newark, Univ. of Delaware Press : 159-175

Loock R., Mariaule M. and Oster C. (2013). Traductologie de corpus et qualité : étude de cas. Tralogy - Session 5 - Assessing Quality in MT / Mesure de la qualité en TA http://lodel.irevues.inist.fr/tralogy/index.php?id=188 Johansson S. and Hofland K. (1994). Towards an English-Norwegian parallel

corpus. In Fries U. and al. editors, Creating and using English language corpora, Amsterdam, Rodopi pp. 25-37.

Loock R. (2016), La Traductologie de corpus. Villeneuve-d'Ascq. Presses Universitaires Septentrion.

Uszkoreit H., Burchardt A. and Lommel A. (2013). A New Model of

Translation Quality Assessment Tralogy - Session 5 - Assessing Quality in MT / Mesure de la qualité en TA

http://lodel.irevues.inist.fr/tralogy/index.php?id=319

Zotti V. (2017). L’integrazione di corpora paralleli di traduzione alla descrizione lessicografica della lingua dell’arte : l’esempio delle traduzioni francesi delle Vite di Vasari. In Zotti V., Pano A. editors, Informatica Umanistica. Risorse e strumenti per lo studio del lessico dei beni culturali. Firenze University Press.

Il rapporto tra famiglie di anziani non autosufficienti