• Aucun résultat trouvé

2. Différentes définitions de la nasalité

2.5 Définition acoustique de la nasalité

Les consonnes nasales peuvent être définies comme ayant en commun une concentration de l’énergie dans la région 250-300 Hz. Cette concentration est plus élevée en fréquence et en intensité que la barre de voisement des occlusives et fricatives voisées. Il y a présence d’énergie dans les fréquences moyennes (contrairement aux occlusives) et une énergie réduite dans les fréquences plus hautes. /m/ et /n/ se distinguent des consonnes occlusives voisées /b/ et /d/ par la présence de formants dans les fréquences moyennes et par plus d’énergie dans les basses fréquences. Les fréquences naturelles sont relativement stables

et il a été montré qu’elles se produisent dans la région de 250 à 300 Hz, 1000 Hz, 2000 Hz et 3000 Hz (Fant, 1960 ; Fujimura, 1962 ; Stevens, 2000).

L’acoustique des consonnes nasales est plutôt bien décrite grâce à des travaux comme ceux de Fujimura (1962) : le conduit principal est le conduit qui va de la glotte aux narines, et la cavité buccale est mise en dérivation. Le flux d’air ne passe que par un conduit. La forme de la cavité buccale dépend du lieu de constriction de la consonne, labiale, dento-alvéolaire ou vélaire, les résonances et les antirésonances nasales créées dependent de la configuration (essentiellement la longueur) de la cavité buccale, longue dans le cas de /m/ et la plus courte dans le cas de la nasale vélaire. Il existe donc une différence de position des antiformants entre les consonnes nasales. Le zéro est situé entre 750 Hz et 1250 Hz pour /m/ et entre 1450 Hz et 2200 Hz pour /n/ et au-dessus de 3000 Hz pour /ŋ/ (Fujimura, 1962). La fréquence des antiformants varie inversement avec la longueur de la cavité orale (Fant, 1960), ce qui explique qu’elle est plus élevée pour la vélaire que pour la coronale (la cavité orale est plus courte), et la plus basse pour la labiale /m/ (la cavité orale est plus longue).

Figure 16 : Spectrogramme de /m/ et /n/ prononcés devant le phonème /a/ (Amelot, 2004 p.

27)

Les voyelles nasales phonologiques ou nasalisées phonétiquement (dans le cas d’un contexte de consonnes nasales) ont un spectre plus compliqué que les consonnes nasales, ou du moins plus difficilement modélisable car la configuration des voyelles varie à l’infini. Ce spectre est composé de formants venant de la cavité nasale et de formants et d’antiformants venant de la cavité orale. Quand les deux cavités sont séparées, les paires de formants et antiformants de la cavité nasale se neutralisent et n’ont pas d’effet sur les formants de la cavité buccale. Comme le couplage augmente, les paires de formants et antiformants de la cavité nasale se séparent de plus en plus et s’ajoutent au spectre de la cavité orale et cela crée un spectre très complexe qui varie dans le temps, avec le degré de magnitude du couplage (House et Stevens 1956 ; Fant 1960 ; Stevens 1997 ; Maeda 1993). C’est la région du premier formant qui change le plus acoustiquement quand on parle de la nasalité des voyelles (House, 1957). Selon Delattre (1954), la nasalité vocalique est caractérisée du point de vue acoustique par une faible intensité du premier formant, vers 250 Hz et l’apparition d’un formant vers 2000 Hz qui est d’autant plus faible que la voyelle est plus ouverte. De nombreux changements se voient aussi sur le spectre de la nasale au niveau du troisième et quatrième formant. On observera sur la figure ci-dessous l’affaiblissement du premier formant et la « disparition » du troisième formant buccal dans les trois cas, due à la présence d’un antiformant nasal.

Figure 17 : Spectrogramme des syllabes françaises « ban, bin, bon » : la ligne rouge indique approximativement le point dans le temps où la voyelle nasale devient très nasalisée acoustiquement. La première partie de la voyelle est phonétiquement orale. Les logatomes ont été prononcés par une locutrice de français native. (Clements et al., 2015)

En 1982 et 1993, Maeda, à l’aide d’une modélisation, insiste sur une tendance globale à l’aplatissement du spectre dans la zone du premier et second formant (de 200 à 2000 Hz), ce qui serait une caractéristique commune à plusieurs timbres nasals. Le modèle propose une augmentation de l’aire vélopharyngée proportionnellement à l’affaiblissement de l’aire du passage oral. Elle est déterminée par la position articulatoire pour la production de la voyelle.

Pour identifier la nasalisation, Maeda (1993) a identifié quatre types différents de modification spectrale qui varient selon la voyelle :

1) Cas d’une voyelle nasalisée avec un formant nasal en dessous de 400 Hz. Les voyelles ayant un F1 (oral) en dessous de 400 Hz, auront un formant nasal au dessus de F1.

C’est le cas pour la voyelle /i/ par exemple. Pour la voyelle /i/, l’antiformant est accompagné par une antirésonance dans les hautes fréquences. La région de F2 est relativement stable pour /i/.

Figure 18 : Identification des formants oraux (Fn), nasals (NFn) et des anti-formants nasals (Zn) après modélisation de la voyelle /i/, (Maeda, 2000, cours SL444 sur la nasalité)

Figure 19 : Spectres des voyelles /i/ dans /bib/ à gauche et /i/ dans /mim/ à droite, spectres extraits au début des voyelles. Syllabes prononcées par la locutrice 1 d’ourdou.

2) Dans le cas de la voyelle /u/, la première résonance est basse, et sa basse fréquence est due à l’arrondissement des lèvres et le recul de la langue qui allongent la cavité antérieure.

L’affaiblissement des pics de F1 et F2 n’est pas significatif. Le couplage de la paire antiformant et formant nasal implique une modification autour de 2000 Hz et des changement de F3, créant ce que Jacqueline Vaissière appelle, l’œil nasal (une absence de présence d’énergie entre 2000 et 3000 Hz).

Figure 20 : Identification des formants oraux (Fn), nasals (NFn) et des anti-formants nasals (Zn) après modélisation de la voyelle /u/ (Maeda, 2000, cours SL444)

Figure 21 : Spectres des voyelles /u/ dans /bub/ à gauche et /u/ dans /mum/ à droite. Spectres extraits au début des voyelles. Syllabes prononcées par la locutrice 1 d’ourdou.

3) Les voyelles ayant un F1 au-dessus de 400 Hz auront un F1 affecté par l’antiformant qui se situe vers 400 Hz. On observe une différence entre les voyelles antérieures et postérieures.

Les voyelles antérieures ont une fréquence de F2 supérieure au premier antiformant (Z1) et le F2 ne sera pas alors affecté par cet antiformant (Z1). Le Z1 affaiblira le pic du F1.

Figure 22 : Identification des formants oraux (Fn), nasals (NFn) et des anti-formants nasals (Zn) après modélisation de la voyelle /ɛ/ (Maeda, 2000, cours SL444).

Figure 23 : Spectres des voyelles /a/ dans /bab/ à gauche et /a/ dans /mam/ à droite. Spectres extraits au début des voyelles. Syllabes prononcées par la locutrice 1 d’ourdou.

4) F1 et F2 peuvent être influencées par Z1 dans le cas des voyelles postérieures. On peut observer un affaiblissement du pic F2 pour la voyelle /o/. On observera des modifications dans la région du F3 à cause du second antiformant.

Figure 24 : Identification des formants oraux (Fn), nasals (NFn) et des anti-formants nasals (Zn) après modélisation des voyelles (o) Maeda (2000, cours SL444)

A la question : Est-ce le trait nasal a un comportement quantique ? La réponse est complexe.

Les traits ont été définis soit dans le domaine articulatoire (Chomsky et Halle 1968), soit dans le domaine acoustique ou auditif (Jakobson et al., 1952). Les rapports entre les modifications du conduit vocal et les paramètres acoustiques qui leurs sont associés ne sont pas monotoniques et les rapports entre les paramètres acoustiques et les réponses auditives qui leur sont associées ne sont pas toujours linéaires.

La théorie ‘quantique’ des traits est développée par Stevens (1972). Selon cette théorie, ce sont les régions de stabilité acoustique ou auditive dégagées qui définissent les traits distinctifs et l’inventaire de sons de chaque langue est ainsi construit.

Figure 25 : a) rapports entre articulatoire et acoustique; b) rapports entre acoustique et audition (Stevens, 1972 p. 64)

Pour certains types de paramètres articulatoires, il y a des plages de valeurs pour lesquelles le signal acoustique a des attributs bien définis (I, III), et ces plages sont délimitées par des régions dans lesquelles les propriétés du signal sont relativement sensibles aux perturbations dans l'articulation (II). Les attributs acoustiques du signal à l’intérieur de l’une de ces régions qui ressemblent aux plateaux (« plateau-like regions ») semblent définir les corrélats acoustiques d’un trait phonétique (Stevens, 1972 p. 64).

On peut dire que l’étude acoustique des voyelles nasales et nasalisées est très compliquée à cause du couplage progressif de la cavité orale et de la cavité nasale. Des résultats quantitatifs significatifs sont difficiles à obtenir. On verra dans la suite tous les instruments possibles pour étudier la nasalité vocalique.