• Aucun résultat trouvé

Colonne 1 : Les items anglais

4.1. Les inputs anglais

4.1.1. Colonne 1 : Les items anglais

J’ai d’abord listé tous les items que j’ai pu trouver qui se terminaient en anglais par une voyelle (simple ou diphtonguée) suivie d’une coda occlusive (voisée ou non-voisée) en combinant les données de Kang (2003b) et de Baker (2008), tirées dans les deux cas de la liste officielle de

71

l’Institut National pour la Langue Coréenne (NIKL 1991). Leurs données étaient accessibles sous forme de liste :

- en annexe de son article pour Kang (2003b), organisées par nature de la voyelle pré-finale, puis par coda, puis selon que l’adaptation en coréen avait une épenthèse, un doublon ou pas d’épenthèse :

Fig. 10 : Aperçu de la base de données de Kang (2003b)

- sous forme de liste sur un fichier Word extrait de son lien en ligne pour Baker (2008), transcrit selon les normes HML :

Fig. 11 : Aperçu de la base de données de Baker (2008)

J’ai intégré ces items manuellement à mon fichier tabulé.

Comme cette liste datait de 2008 au plus tard et ne répertoriait que des items reconnus

officiellement, je l’ai mise à jour à l’aide du script En2Ko8. Ce script avait pour commande de

chercher un item anglais sur Wikipédia, de scanner tous les liens de la page Wikipédia et de lister les pages coréennes correspondantes, incluant ainsi des noms communs, des noms propres ou des noms de marque récents. J’ai intégré uniquement des items qui pouvaient être considérés

8 A ce sujet je remercie très chaleureusement Laurent Roussarie, qui a créé ce script expressément pour ce travail de thèse.

72

comme des unités lexicales (noms, verbes, adjectifs, adverbes…) mais j’ai aussi inclus des noms propres (personnes, lieux, noms de marques…).

La base de données finale comprend 1937 items.

Dès cette première colonne, plusieurs problèmes méthodologiques se sont posés quant aux items que j’ai choisis d’entrer dans la base de données.

D’abord, j’ai repris des items de Kang (2003b) et Baker (2008) dont l’origine anglophone est parfois douteuse car certains items ont pu entrer dans la langue sans passer par l’anglais, notamment les toponymes ou les mots désignant des pratiques culturelles qui ne viennent pas originellement d’un pays anglophone. D’autres ont pu entrer en coréen via l’anglais mais provenir au départ d’une autre langue, notamment du français, ce qui peut avoir des effets sur la prononciation par exemple.

Ensuite, j’ai, pour ma part, choisi d’intégrer aussi les noms propres. Mais peut-on vraiment les considérer comme des emprunts ?

Dans la mesure où ce sont des mots utilisés, pour les plus connus, régulièrement par les locuteurs natifs de l’anglais, et répondant souvent à ses contraintes phonologiques, la question qui se pose n’est pas tant de savoir si on peut les considérer comme des unités lexicales que de savoir si leur processus d’intégration est analogue à celui des noms communs, et si la catégorisation en noms propres ou communs est un critère à retenir du point de vue phonologique. La question de savoir si ces noms ont intégré le coréen via l’oral ou via l’écrit est également difficile à trancher, comme pour les autres items, et ce critère ne sera donc pas retenu pour les exclure. De plus, s’il est possible que ces mots aient intégré le coréen via des bilingues (traducteurs d’émissions de télévision par exemple…), il n’en reste pas moins qu’ils sont utilisés aujourd’hui indifféremment par les bilingues et par les monolingues.

Je n’ai donc pas exclu les noms propres, mais il faut garder à l’esprit qu’ils posent notamment un gros problème de prosodie : a-t-on l’habitude de les utiliser d’un bloc, prénom puis nom ? Ou y a-t-il une préférence sur certaines personnes à ne dire que leur prénom ou que leur nom de famille ? La question est un tout petit peu moins problématique pour les toponymes, mais elle se pose également et n’en reste pas moins délicate pour l’ensemble des analyses.

Enfin, un des problèmes posés par cette base de données est la très grande variété des items qu’elle contient, d’un point de vue morpho-syntaxique (la base de données comprend des noms, des verbes, des adverbes, des sigles, etc.) mais aussi d’un point de vue lexical (puisque le

73

vocabulaire appartient à des domaines variés comme la gastronomie, le sport, le jargon scientifique…).

L’intégration dans la base de données du jargon technique en particulier a été épineuse. Se pose d’abord la question de la fréquence puisque ces mots sont à priori utilisés de manière fréquente par un tout petit groupe très spécialisé. En effet, un mot technique comme torque par exemple, qui vient de la physique quantique, est peu connu du grand public, mais cela signifie-t-il que son adaptation sera différente des mots plus répandus, comme cake ou coat par exemple ? C’est possible, car la communauté qui emprunte du jargon est généralement anglophone, et, de surcroît, emprunte peut-être ces items via l’écrit, dans les publications scientifiques, plutôt que via l’oral. Cependant, rien n’indique que du vocabulaire plus généraliste n’ait pas intégré la langue de cette façon aussi – ou, inversement, que ce vocabulaire scientifique, s’il est probablement connu et pratiqué par des anglicistes, n’ait pas intégré le coréen par l’oral, lors de conférences internationales par exemple, et ne soit pas utilisé ensuite par des locuteurs monolingues.

Si un écrémage est possible, il m’a paru peu recommandé. En effet, avec un terme comme

torque, la définition aurait pu permettre de l’écarter des analyses de façon assez nette. Mais de

nombreux autres items sont ambigus, et la question se pose alors de savoir s’ils viennent du jargon scientifique ou de la communauté large. En l’absence de réponse, mieux vaut ne pas supprimer des items scientifiques en en laissant d’autres : mieux vaut tous les conserver, et prendre les résultats avec la précaution qu’ils méritent. D’autant que le fait de limiter les analyses du chapitre 5 aux items monosyllabiques a également permis de limiter le nombre de ce type d’items, qui sont généralement plurimorphémiques et polysyllabiques (aerodynamic,

anastigmatic, apochromatic, biochip, biofeedback, etc.).