• Aucun résultat trouvé

Les niveaux d’adaptation phonologique

I. Arrière-plan théorique

2. Pourquoi modéliser la détente ?

2.1. L’adaptation phonologique des emprunts

2.1.3. Les niveaux d’adaptation phonologique

L’adaptation phonologique est donc le processus qui consiste à traiter une séquence – phonétique selon les uns, partisans de l’hypothèse dite « perceptuelle » (Silverman 1992, Yip 1993, Peperkamp & Dupoux 2001, 2003, Peperkamp et al. 2008), déjà phonologique selon

31

les autres, partisans de l’hypothèse que j’appellerai « bilingue » (Paradis & LaCharité 1997, LaCharité & Paradis 2000, 2005, Shinohara et al. 2011) – de telle sorte qu’elle soit mise en conformité avec les contraintes phonologiques de la langue d’accueil. Cette adaptation peut être de trois ordres : d’abord, et de façon assez évidente, elle peut se faire au niveau phonémique lui-même, la séquence d’origine étant ramenée à la séquence des phonèmes « les plus proches » ; mais elle peut aussi se faire au niveau syllabique et au niveau accentuel.

2.1.3.1.L’adaptation au niveau phonémique

Ce premier type d’adaptation phonologique est sans doute celui auquel on est amené à penser en premier. En effet, c’est le niveau le plus intuitif : lorsqu’un son n’existe pas dans une langue, alors il est adapté en fonction du son « le plus proche » dans la langue d’accueil.

Les phonèmes

Le son le plus proche peut être, de fait, le « même » phonème. Ainsi, le phonème /p/ de l’anglais est généralement restitué, en français, avec le phonème /p/ de cette langue, et inversement : <iPad> se prononce respectivement [aɪpæd] et [ajpad], <prêt-à-porter>, [pɾɛtapɔɾˈteɪ] et [pʁɛtapɔʁte]5.

Cependant, les anglicistes s’accorderont à souligner, avec les phonéticiens, que /p/ en anglais est souvent réalisé aspiré : [pʰ]. Par conséquent, il n’y aurait pas d’identité entre le [p] du français et le [pʰ] de l’anglais. De plus, les apports de la théorie dite du Réalisme Laryngal (Iverson & Salmons 1995, 1999, 2003a,b, 2007 ; Avery 1996) amènent à penser que cette aspiration est un trait distinctif en anglais, ce qui exclurait que le voisement le soit aussi, alors qu'en français c'est le voisement qui est distinctif, et non l’aspiration. Il s'ensuit qu'en anglais on a /ph/ : /p/ et en français /p/ : /b/, d'où il découle que le véritable appariement, si ces oppositions étaient privatives, serait que l’anglais <b> non aspiré correspond en fait au français <p> non voisé – ce qui n’est pas, on vient de le voir, l’adaptation choisie par les locuteurs. Ce qu’on désigne comme de la « ressemblance », voire comme une identité, peut donc poser problème même dans les cas les plus simples, non marqués, et ce parce qu'il faut toujours considérer la question dans le cadre d'un système.

En effet, si les deux phonèmes du français et de l’anglais paraissent similaires, ils ne sont en aucun cas les mêmes. Plusieurs arguments permettent de les distinguer. D’abord, comme on

5 Afin d’éviter ici des discussions satellites inutiles, je précise que j’ai choisi pour ces exemples la transcription phonétique du Collins Dictionary en ligne. La justesse de ces transcriptions est douteuse, mais suffisante pour mon propos central.

32

vient de le voir, ils n’ont pas les mêmes allophones, c’est-à-dire pas les mêmes réalisations phonétiques, ni, comme on vient de l’exposer avec le réalisme laryngal, les mêmes traits. Mais surtout, ils ne s’opposent pas aux mêmes autres phonèmes : /t/ en français s’oppose à /d/ qui est voisé, à /n/ qui est nasal, et à /s/ et /z/ qui sont fricatifs, tandis qu’en anglais, /t/ et /d/ s’opposent aussi à /θ/ et /ð/. Ainsi, si les phonèmes /t/ et /d/ semblent similaires sur des critères articulatoires et / ou acoustiques, en aucun cas ils ne seront effectivement les mêmes puisqu’ils appartiennent à des systèmes différents et ne s’opposent pas aux mêmes autres phonèmes. Dès lors, le /p/ du français et le /p/ de l’anglais, pour similaires qu’ils paraissent, ne sont pas non plus le même phonème.

Il en va de même à fortiori lorsque, comme il arrive très souvent, le phonème « n’existe pas » dans la langue emprunteuse au sens où celle-ci n’en offre pas une contrepartie similaire. Ceci est en fait un cas extrême du cas de figure précédent : si l’anglais /p/ par exemple n’existe pas en français, il trouve cependant une correspondance assez univoque avec le français /p/, mais il peut aussi arriver qu’un phonème n’ait pas de correspondance évidente. Il doit dès lors être adapté de façon apparemment plus indirecte. C’est ainsi qu’une langue qui n’a pas de fricatives dentales [θ] ou [ð] les adaptera avec le son qui lui est « le plus proche » : en français, ce son devrait être la fricative la plus proche, même si, sous l’influence de l’orthographe probablement, elle est parfois adaptée avec l’occlusive la plus proche. En l’occurrence, le point d’articulation le plus proche des dents en français est le bourrelet alvéolaire, et c’est ainsi que ces sons illicites seront adaptés en [s], [z], voire [t], comme en témoigne cet échantillon d’exemples tiré du français métropolitain standard :

Item Anglais (phonétique) Français (phonétique)

noms communs

correct thinking kəˈrɛkt ˈθɪŋkɪŋ koʁɛkt siŋkiŋ

death metal dɛθ ˈmɛtəl dɛs metal

thriller ˈθrɪlə srilœʁ

Locutions

in the pocket ɪn ðə ˈpɒkɪt in zə pokɛt

finger in the nose ˈfɪŋɡə ɪn ðə nəʊz fiŋœʁ in zə noz

on the rocks ɑn ðə rɒks ɔn zə ʁɔks

Noms propres

Kenneth ˈkɛnɪθ kenɛt / kenɛs

Gotham (City) ˈɡɒθəm gotam

33

Big Brother ˈbrʌðə bʁɔzəʁ

Smith & Weston smɪθ smis

Marianne Faithful ˈfeɪθfʊl fɛjsful

Othello oʊˈθɛloʊ otelo

Black Sabbath blæk ˈsæbəθ blak sabat

Monty Python ˈmɒntɪ ˈpaɪθən mõti pitõ

Timothy Dalton ˈtɪməθɪ ˈdɔːltən timoti daltɔn

Tab. 1 : Adaptation des emprunts anglais en français

Le même phénomène se produit dans les emprunts que le français fait à l’arabe, par exemple : l’occlusive uvulaire [q] n’existe pas dans notre langue, aussi elle sera adaptée avec l’occlusive la plus proche qui, en français, est l’occlusive vélaire [k]. Ainsi l’arabe [qahwa] a donné le français [kafe] mais aussi l’argot [kawa], le [qurˀan] est devenu le [korɑ̃] et la ville de [alqaahira] est devenu [ləkɛʁ]. Weinreich (1953) évoquait déjà cette question, puisqu’il supposait deux types d’adaptation phonologique :

- d’une part la sous-différenciation (underdifferenciation), par exemple /k/ et /q/ de l’arabe devenus tous deux une seule unité /k/ en français ou en espagnol ;

- et la sur-différenciation (overdifferenciation) – ce qui se passe par exemple lorsque le français adapte le même phonème de l’anglais /θ/ de deux façons différentes, tantôt /t/, tantôt /s/.

Enfin, le « son le plus proche » est parfois l’absence pure et simple de phonème. C’est ainsi que la fricative laryngale [h] disparait en français : l’anglais [hɪt] se prononce [it], l’allemand [baʊhaʊs] se prononce [baoaos]. Il se peut néanmoins que ce même phonème [h] soit adapté avec une occlusive glottale : [Ɂit] et [baoɁaos].

La question majeure que pose donc ce type d’adaptation est de savoir ce qui fait qu’un son est considéré comme « plus proche » d’un autre. On l’a vu, un phone peut être adapté avec le même phone, avec un phone différent mais considéré comme proche, et parfois même avec rien, la position vide étant alors considérée comme l’adaptation la « plus proche ».

Similarité et adéquation

Se pose alors la question de la similarité : qu’est-ce qui fait que deux « sons » sont considérés comme similaires ? C’est notamment la problématique centrale de Cohen (2010). Dans cet article, l’auteur centre son propos sur l’idée que l’analyse de l’adaptation doit reposer sur le

34

concept de « similarité ». Néanmoins, comme il le note très justement, la notion même de similarité est abstraite et vague :

“the notion of similarity is often treated abstractly, without a model for its evaluation and quantification.” (Cohen 2010)

Il propose donc de lui donner une définition plus claire, plus précise et, finalement, plus matérielle. Pour ce faire, il revient sur l’adaptation des voyelles de l’anglais dans les emprunts en hébreu, et ce sur la base d’un modèle essentiellement perceptuel.

L’adaptation purement perceptuelle, par opposition aux adaptations influencées par l’orthographe, est plus complexe qu’il n’y parait. On y constate deux phénomènes :

1) l’adaptation de deux voyelles-inputs en une seule voyelle-output – cas de sous-différenciation ;

2) et l’inverse : l’adaptation d’une seule voyelle-input en deux voyelles-outputs – cas de sur-différenciation.

Pour expliquer cela, Cohen rappelle d’abord que les distinctions entre voyelles sont différemment perceptibles par le locuteur de l’hébreu, notamment selon leur environnement immédiat, à cause des variations de réalisation consécutives de leurs contextes distributionnels. S’appuyant sur des données de corpus et des données expérimentales, Cohen (2010) explique ensuite comment modéliser concrètement les similarités et les différences entre phones – et ce dans le cadre d’une théorie de l’optimalité revisitée appelée Stochastic OT, où les contraintes peuvent se superposer et ainsi expliquer la variation (pas un seul output pour un seul input mais plusieurs à la fois). Il part de l’idée de Steriade (2001) et d’autres selon laquelle la perception est catégorielle par nature. Dès lors, les locuteurs d’une langue évaluent les objets entendus (ici des voyelles) et les « rangent » dans la catégorie qui s’en rapproche le plus selon leurs propriétés acoustiques :

“…listeners compare incoming auditory tokens to the values they are most used to, i. e. the means or prototypes of the vowels of their language.” (Cohen 2010)

Pour calculer cette similitude des objets entendus avec les objets connus (les voyelles de l’anglais par rapport aux voyelles de l’hébreu), l’auteur utilise l’échelle de Bark qui permet de calculer les différences mesurables (just noticeable differences ou jnds) suivant le calcul : “ΔI/I=k (ΔI=difference threshold, I=initial stimulus, k=constant). It has been found that the jnd for vowel formants (F1, F2, F3 etc.) is 0.3 Bark (Kewley-Port 2001)”. C’est-à-dire que le seuil différentiel divisé par le stimulus initial équivaut à une constante. Suivant ce calcul, Bark aurait montré que la constante des formants (ou harmoniques) de la langue est de 0,3 Bark.

35

Ainsi, dans un tableau optimaliste, plus la différence est grande, plus elle est classée haut dans la hiérarchie, et plus sa violation est évitée :

“The tokens least similar (i.e. with the largest jnd distances) to the incoming token are eliminated one by one, until a single candidate remains. This candidate is the most harmonic, optimal candidate.” (Cohen 2010)

Schématiquement, cela signifie que, pour un input anglais, toutes les voyelles de l’hébreu sont des candidats potentiels, qui seront éliminés suivant leur distance en termes acoustiques avec l’input. Par exemple, pour l’anglais [æ], le locuteur de l’hébreu peut choisir une de ces cinq voyelles pour l’adapter : soit [u], soit [o], soit [a], soit [i], soit [e]. Pour le décider, il va comparer les formants de [æ] et leur distance avec les formants de ses voyelles : Cohen calcule que la jnd pour [æ] est de 9,38 pour le premier formant (F1) et de 20,24 pour le deuxième (F2). Il en tire un tableau que je schématise ici :

[æ] Δjnd→ F2 *o 15.54 F2 *u 14.82 F2 *a 10.97 F1 *i 7.35 F1 *u 6.79 Etc… o * ! u * ! * a * ! i * ! → e

Tab. 2 : Comment computer l’adaptation d’une voyelle selon la jnd

Il s’ensuit que les voyelles potentielles [u], [o], [a] et [i] sont éliminées parce qu’un de leurs formants, soit 1 soit 2, implique une différence avec l’input (ou Δjnd) trop élevée. L’output qui empêche le moins la ressemblance grâce à un indice différentiel minimal est l’output [e], qui est donc celui que choisit le locuteur de l’hébreu pour adapter le [æ] de l’anglais.

L’intérêt de cette théorie est d’être basée sur la perception, et d’être adaptable à la fois aux emprunts et aux mots natifs, et d’être mesurable, quantifiable et prédictive :

“In such a way, the perception of auditory events (both native and non-native) is measurable and quantifiable, and perception-based adaptation patterns of L2 into L1 can thus be predicted.” (Cohen 2010).

Néanmoins, si élégante que soit la démonstration, l’auteur prend soin de reconnaître qu’il y a une différence nécessaire entre ses items et les emprunts naturels, due notamment à la multiplicité des sources de ces derniers :

“The difference between real-life vowel adaptation and experimental data is that the former is affected by multiple input sources in addition to perception.” (Cohen 2010)

Force est de noter que ce qu’on appelle aussi le mapping, c’est-à-dire l’appariement d’un segment effectivement entendu à la catégorie qui paraît la plus proche dans la langue emprunteuse, est une très vaste question, qui recouvre également toutes les questions de

36

perception, même en-dehors de la seule problématique des emprunts. De plus, cet appariement peut être biaisé par au moins deux choses : la graphie (Vendelin & Peperkamp 2006) et le bilinguisme (Shinohara et al. 2011).

Les traits

Enfin, on ne peut se contenter de dire que l’adaptation s’applique uniquement à ramener un son qui n’existe pas dans un inventaire phonémique à un son qui y existe. En effet, il existe des langues qui n’ont pas, dans leur inventaire phonémique, certaines consonnes ou certaines voyelles, mais les acceptent pour certains mots. C’est que l’adaptation passe par des traits. Par exemple, le français standard a incorporé dans son inventaire la nasale vélaire qu’on trouve dans les emprunts marketing, parking, Ming, etc. Il disposait déjà du trait [nasal] (dans les consonnes /m/ et /n/ mais aussi dans toutes les voyelles nasales) et du trait vélaire (dans les phonèmes /k/ et /g/), et n’a fait que créer une nouvelle combinaison de ces deux traits.

Quant à l’arabe maghrébin moderne, il n’a pas de voyelles /e/ et /o/. Pourtant, cette langue adapte des emprunts au français tels que [filosofi], [ʒoɣrafija] ou [laser]. Ici, l’adaptation phonémique est indirecte. En effet, si l’arabe ne possède pas les phonèmes /o/ et /e/, il possède en revanche des consonnes dites « emphatiques » qui ont pour effet d’abaisser les voyelles hautes environnantes. De là à penser que l’adaptation conduise à créer de nouveaux phonèmes /e/ et /o/ par l'ajout aux /i/ et /u/ natifs de la mélodie emphatique d'origine consonantique, il n’y a qu’un pas.

La question qui se pose alors est de savoir pourquoi les traits tantôt peuvent être recombinés, tantôt non. Par exemple, l’anglais possède les traits [palatal], puisqu’il possède un /i/, et [arrondi], puisqu’il possède un /u/. Néanmoins, les emprunts au français comprenant un /y/, comme par exemple luge ou début, ne sont pas adaptés avec un [y], combinaison de ces deux traits, mais :

1) soit en sacrifiant l’un des deux traits, comme dans [luːʒ],

2) soit en linéarisant ces deux traits, avec une séquence [ju] : [ˈdeɪbjuː].

Ce procédé d’adaptation par réaménagement des combinaisons de traits peut laisser place à l’émergence pure et simple d’un trait afin d’imiter le son d’origine. Ainsi, en allemand, par exemple, les traits [coronal] et [fricatif] existent déjà, mais pas [dental] ; néanmoins, un mot comme thriller a été adapté en [θrilɐ], avec une fricative dentale. Mais ce dernier phénomène suppose une grande proximité, géographique ou culturelle, avec la langue source, et ne sera sans doute pas le fait de tous les locuteurs. Ce type d’adaptation, qui fait émerger dans la langue

37

de nouvelles combinaisons de traits, pourrait être une des sources de l’émergence, à terme, de nouveaux phonèmes.

2.1.3.2.L’adaptation au niveau syllabique

Le deuxième grand type d’adaptation phonologique concerne la syllabe. Typologiquement parlant, les syllabes ne sont pas réparties également dans les langues du monde. Les langues qui possèdent des structures syllabiques plus complexes, avec des hiatus et des groupes consonantiques (comme le français par exemple), auront nécessairement aussi, dans leur inventaire, les plus simples. En l’occurrence, la syllabe la plus simple, et donc celle que toutes les langues possèdent, est la syllabe canonique, dite non-marquée, composée d’une attaque, en général consonantique, suivie d’un noyau, en général vocalique (CV). Partant, plus les syllabes ajoutent ou retirent des éléments à cette structure, et plus la syllabe est marquée. Ainsi, on considère que toute langue qui possède une syllabe VC possède nécessairement les syllabes CVC et V, et qu’une langue qui possède au moins CVC ou V possède nécessairement CV, tandis qu’une langue qui possède CV ne possède pas nécessairement les autres types de syllabes :

CVC

CV >> et / ou >> VC V

Fig. 3 : Hiérarchie des types syllabiques du moins au plus marqué

Plus précisément encore, on pourrait schématiser la hiérarchie des syllabes à travers les langues du monde, à l’instar de Blevins (1995) ou Levelt & Van de Vijver (2004), comme suit :

38

Cette réalité typologique est un problème pour l’adaptation des emprunts. Bien sûr, le fait qu’une langue à syllabes complexes emprunte à une langue à syllabes simples n’est guère un problème, puisque les syllabes simples sont aussi présentes dans son inventaire. En revanche, il arrive régulièrement que des langues qui ne possèdent que des syllabes simples empruntent à des langues possédant des syllabes plus complexes, comme le français ou l’anglais, dont la syllabe la plus complexe est du type CCCVCC : strict.

Pour remédier à ce problème structural, les langues emprunteuses peuvent avoir recours à deux types de stratégies : la suppression de segments (en anglais segment deletion) ou l’ajout de segments (qu’on appelle une épenthèse, en anglais epenthesis).

L’exemple le plus canonique à cet égard est le cas du japonais, où les groupes consonantiques sont prohibés, et les seules syllabes autorisées sont CV, V et CVC à condition que la coda soit une nasale ([m], [n] ou [ŋ] en fonction de la consonne qui suit). Or le japonais est la langue d’une population extrêmement francophile et américanophile. Dès lors, il a emprunté à ces deux dernières langues un nombre impressionnant de mots, qui va toujours croissant.

Ce qu’il y a d’intéressant dans ce cas particulier, c’est que le japonais a recours aux deux types d’adaptation. Par exemple, pour le mot toilet (de l’anglais [ˈtɔɪlɪt]), le japonais est confronté à une coda illicite : le [t] final ne peut être laissé tel quel. Dès lors, le japonais peut choisir 1) soit de supprimer tout bonnement ce segment, ce qui donnerait [toiɾe] ; 2) soit d’ajouter une voyelle après lui, ce qui donnerait [toiɾetto]. De même, le français prêt-à-porter, [pʀɛtapɔʀte], pourrait être adapté par la suppression d’au moins un segment, ce qui donnerait [pɯɾetapoote], ou par épenthèse, ce qui donnerait [pɯɾetapoɾɯte]. En l’occurrence, les deux possibilités pour ces deux cas sont attestées en japonais.

Le japonais préfère néanmoins l’épenthèse à la suppression de segments, et les cas de suppression sont relativement rares, ou du moins minoritaires. Ainsi, le japonais remédie à l’existence de groupes consonantiques (comme dans a. croissant, [kʁwasã]) et de codas (comme dans b. café-terrasse, [kafeteʁas]), voire de codas complexes (comme dans c. milk, [miɫk]), en insérant une voyelle par défaut :

(1) a. croissant : k ʁ w a s ã C V C V C V C V k ɯ ɾ ɯ w a s a n b. café-terrasse k a f e t e ʁ a s C V C V C V C V C V k a f e t e ɾ a s ɯ

39

c. milk : m i ɫ k

C V C V C V m i ɾ ɯ k ɯ

Quant à la nature de cette voyelle par défaut, elle peut varier à travers les langues. Dans le cas du japonais, c’est la « voyelle vide », ou schwa, qui est généralement choisie : la voyelle vélaire haute non-arrondie [ɯ], qui peut éventuellement s’abaisser en [o] devant une alvéolaire (laquelle évite ainsi l’affrication).

En français, la voyelle épenthétique est également le schwa, qui prend alors la forme d’une voyelle centrale à arrondissement variable notée [ə] par commodité, tandis qu’ailleurs, elle peut être une voyelle d’avant [i] ou [e] comme c’est le cas par exemple du portugais brésilien (Mattoso Câmara 1941, 1975) ou de l’espagnol (Alarcos Llorach 1965).

Dans d’autres langues, la voyelle choisie est la copie d’une voyelle voisine dans le mot, comme, par exemple, en touvain, une langue altaïque (Harrison 1999), ou en wolof (Ka 1985, Sy 2013). En swahili et en tswana, deux langues bantoues décrites par Batibo (1996), la voyelle épenthétique semble pouvoir suivre plusieurs stratégies : une insertion par défaut, en l’occurrence d’une voyelle basse, mais aussi l’assimilation consonantique et l’harmonie vocalique, deux processus également utilisés en rennell-bellona, une langue austronésienne (Brasington 1978, 1981).

Sur le vaste sujet des voyelles épenthétiques, on peut consulter Broselow (2015), Uffmann (2006, 2007) ou Hall (2006, 2011)…

2.1.3.3.L’adaptation au niveau accentuel

Enfin, lorsqu’un mot intègre une langue, il va de soi qu’il est soumis à ses règles accentuelles. Par exemple, dépourvu d’accent lexical, le français accentue très strictement tous ses mots sur la dernière syllabe accentuable lorsqu’ils correspondent à un groupe – une syllabe accentuable étant une syllabe qui comprend une voyelle autre que le schwa. C’est ainsi que des mots comme l’anglais management, [ˈmænɪdʒmənt] ou l’italien pizza, ['pittsa], tous deux accentués sur la première syllabe, se retrouvent, en français métropolitain, accentués sur la dernière syllabe : [manaʤ'mɛnt] et [pi'ʣa].

Ce dernier niveau d’adaptation varie lui aussi selon les langues et, dans celles qui ont un accent lexical mobile, où la place de l’accent peut faire changer le sens du mot, comme c’est le cas de l’anglais par exemple, les emprunts peuvent être sujets à variation. Ainsi, l’emprunt au français

garage peut être prononcé avec un accent final, pour imiter le français ([gəˈrɑʒ]), ou avec un

40