• Aucun résultat trouvé

Disponible à / Available at permalink :

N/A
N/A
Protected

Academic year: 2021

Partager "Disponible à / Available at permalink :"

Copied!
380
0
0

Texte intégral

(1)

- - -

- - -

Dépôt Institutionnel de l’Université libre de Bruxelles / Université libre de Bruxelles Institutional Repository

Thèse de doctorat/ PhD Thesis Citation APA:

Serniclaes, W. (1986). Etude expérimentale de la perception du trait de voisement des occlusives du français (Unpublished doctoral dissertation).

Université libre de Bruxelles, Faculté des Sciences psychologiques et de l'éducation, Bruxelles.

Disponible à / Available at permalink : https://dipot.ulb.ac.be/dspace/bitstream/2013/213529/1/367cb8ba-ebea-46ea-97ea-a29210b3ea3a.txt

(English version below)

Cette thèse de doctorat a été numérisée par l’Université libre de Bruxelles. L’auteur qui s’opposerait à sa mise en ligne dans DI-fusion est invité à prendre contact avec l’Université (di-fusion@ulb.be).

Dans le cas où une version électronique native de la thèse existe, l’Université ne peut garantir que la présente version numérisée soit identique à la version électronique native, ni qu’elle soit la version officielle définitive de la thèse.

DI-fusion, le Dépôt Institutionnel de l’Université libre de Bruxelles, recueille la production scientifique de l’Université, mise à disposition en libre accès autant que possible. Les œuvres accessibles dans DI-fusion sont protégées par la législation belge relative aux droits d'auteur et aux droits voisins. Toute personne peut, sans avoir à demander l’autorisation de l’auteur ou de l’ayant-droit, à des fins d’usage privé ou à des fins d’illustration de l’enseignement ou de recherche scientifique, dans la mesure justifiée par le but non lucratif poursuivi, lire, télécharger ou reproduire sur papier ou sur tout autre support, les articles ou des fragments d’autres œuvres, disponibles dans DI-fusion, pour autant que :

Le nom des auteurs, le titre et la référence bibliographique complète soient cités;

L’identifiant unique attribué aux métadonnées dans DI-fusion (permalink) soit indiqué;

Le contenu ne soit pas modifié.

L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé pour donner accès à l’œuvre. Toute autre utilisation non mentionnée ci-dessus nécessite l’autorisation de l’auteur de l’œuvre ou de l’ayant droit.

--- English Version ---

This Ph.D. thesis has been digitized by Université libre de Bruxelles. The author who would disagree on its online availability in DI-fusion is invited to contact the University (di-fusion@ulb.be).

If a native electronic version of the thesis exists, the University can guarantee neither that the present digitized version is identical to the native electronic version, nor that it is the definitive official version of the thesis.

DI-fusion is the Institutional Repository of Université libre de Bruxelles; it collects the research output of the University, available on open access as much as possible. The works included in DI-fusion are protected by the Belgian legislation relating to authors’ rights and neighbouring rights.

Any user may, without prior permission from the authors or copyright owners, for private usage or for educational or scientific research purposes, to the extent justified by the non-profit activity, read, download or reproduce on paper or on any other media, the articles or fragments of other works, available in DI-fusion, provided:

The authors, title and full bibliographic details are credited in any copy;

The unique identifier (permalink) for the original metadata page in DI-fusion is indicated;

The content is not changed in any way.

It is not permitted to store the work in another database in order to provide access to it; the unique identifier (permalink) indicated above must always be used to provide access to the work. Any other use not mentioned above requires the authors’ or copyright owners’ permission.

(2)

UNIVERSITE LIBRE DE BRUXELLES INSTITUT DE PHONETIQUE

ETUDE EXPERIMENTALE DE LA

PERCEPTION DU TRAIT DE VOISEMENT DES OCCLUSIVES DU FRANÇAIS

Dissertation préparée sous la direction de MM. les professeurs

Paul Bertelson et Max Wajskop pour l'obtention du grade de

Docteur en Sciences Psychologiques

Faculté des Sciences Psychologiques et Pédagogiques

par Willy SERNICLAES

Année académique 1986-1987

(3)

UNIVERSITE LIBRE DE BRUXELLES INSTITUT DE PHONETIQUE

ETUDE EXPERIMENTALE DE LA

PERCEPTION DU TRAIT DE VOISEMENT DES OCCLUSIVES DU FRANÇAIS

Dissertation préparée sous la direction de MM. les professeurs

Paul Bertelson et Max Wajskop pour l'obtention du grade de

Docteur en Sciences Psychologiques

Faculté des Sciences Psychologiques et Pédagogiques

par Willy SERNICLAES

G95.739

Année académique 1986-1987

(4)

Je remercie vivement:

M. le Professeur Max Wajskop pour m’avoir initié aux recherches en phonétique et pour l’appui constant qu’il m’a apporté dans la réalisation de ce travail.

M. le Professeur Paul Bertelson pour la confiance qu’il m’a accordée et dont les avis m’ont permis de clarifier de nombreux points.

Mon collègue Paul Jospa qui m’a fourni en toutes circonstances l’appui logistique indispensable dans la réalisation des expériences.

MM. Roger Van Marcke et Georges Carayannis qui m’ont également beaucoup aidé dans le montage expérimental.

Mon collègue Renaud Beeckmans dont les suggestions m’ont toujours aidé de manière très efficace.

Mes collègues Marco Saerens et Jean Schoentgen pour leur soutien .

Sans oublier tous ceux qui m’ont aidé et encouragé de diverses manières» et notamment:

Jésus Alegria» Pierre Bejster» Frédéric Janssens»

Monique Radeau» Jean—Marie Ramlot et Gaëlle Serniclaes.

Enfin» je remercie tout particulièrement Cécile Houard

pour ses nombreux encouragements et les longues heures

qu’elle a consacrées au traitement» parfois combien

hasardeux» du texte qui suit.

(5)

TABLE DES MATIERES Chapitre 1 Introduction Générale

1.1 Les traits phonétiques

1.1.1 Les traits dans le cadre linguistique 1 1.1.2 Les traits distinctifs du français S 1.1.3 Les traits dans la communication parlée 13 1.2 Production du voisement des consonnes occlusives

1.2.1 Production des occlusives orales 23 1.2.2 Différences interlinguistiques dans la 33 production du voisement

1.2.3 Production du VOT et d’autres indices associés au timing laryngé

1.2.3.1 Facteurs articulatoires impliqués 39 dans la production du VOT

1.2.3.2 Variations intracatégorielles du VOT 42 1.2.3.3 Indices acoustiques associés au timing 44 laryngé en anglais

1.2.4 Conclusions 47

1.3 Perception du voisement

1.3.1 Perception des traits phonétiques. 50 Aspects généraux

1.3.2 Différences inter1inguistiques dans 65 la perception du voisement

1.3.3 Variations contextuelles dans la perception 70 du VOT en anglais

1.3.4 Diversité des indices perceptifs en anglais 74 1.3.4.1 Fréquence initiale du Fl 75

1.3.4.2 FO initiale 78

1.3.4.3 Amplitude du bruit d’aspiration 80 1.3.4.4 Approche quantitative des relations 83

entre production et perception du VOT

1.3.4.5 Poids perceptifs des indices 85

1.3.4.6 Conclusions 91

1.3.5 Relations entre variabilité contextuelle 92 et diversité des indices

1.3.6 Comparaisons psychoacoustiques

1.3.6.1 Chez l’homme 100

1.3.6.2 Comparaison avec d’autres mammifères 106

(6)

1.3.7 Développement de la perception du voisement 1.3.7.1 Capacités de discrimination du 111 nourisson

1.3.7.2 Développement du processus 117 d’identification

1.3.8 Conclusions 121

1.4 Objectifs

1.4.1 Objectifs 123

1.4.2 Démarche 125

Chapitre 2 Mesures acoustiques d^indices de

voisement pour les occlusives pr évocal i gués du fran-^ais

2.1 Introduction 127

2.2 Procédure 129

2.3 Résultats et comparaison avec d'autres 132 travaux

2.4 Discussion

2.4.1 Production du VOT en français 142 2.4.2 Production des indices associés au VOT 148 2.4.3 Comparaison avec l'anglais 151 2.5 Indices supplémentaires en positions 154

intervocalique et postvocalique

2.6 Conclusions 158

Chapitre 3 Expériences de perception

3.1 Méthode 161

3.2 Comparaison entre les effets du prévoisement 165 et du VOT positif_______ Expérience I

3.3 Différences inter1inguistiques dans le 179 traitement du VOT positif_____ Expérience II

3.4 Recherche des facteurs contextuels et des 195 autres indices____ Expérience III

3.5 Effet du contexte syllabique sur la 207 frontière VOT_____ Expérience IV

3.6 Effets de la FO et de la durée 218 des transitions_____ Expérience V

3.7 Comparaisons entre les effets de la durée 227 des transitions formantiques» de la durée de la

transition d'intensité et de la durée du bruit d'explosion______ Expérience VI

page b

(7)

3.8 Effets de la fréquence du Fl» de la durée 237 et de la direction des transitions de F2 et F3

______ Expérience VII

3.9 Récapitulation des résultats perceptifs

3.9.1 Indices perceptifs en position 250 prévocalique

3.9.2 Indices perceptifs en position médiane 261 Chapitre 4 Discussion générale et conclusions

4.1 Intégration perceptive du prévoisement et 266 du délai de voisement

4.2 Intégration du VOT et des autres indices 273

4.3 Conclusions 280

GLOSSAIRE Notes Annexes

B i bliographie

(8)

Chapitra 1 Introduction générale

1.1 Les traits distinctifs

1.1.1 Les traits dans le cadre 1Inauistique

L’analyse phonologique réduit les multiples différences acoustiques entre les mots d’une langue à quelques oppositions élémentaires» ou traits distinctifs. Les

traits sont des marques discriminatives sans contenu sémantique propre. Ils ne sont pas définis en termes d’oppositions sémantiques mais bien en termes d’oppositions phonétiques (Jakobson et al.» 1952).

La mise an évidence des traits distinctifs comporte deux étapes. La première étape consiste à découper les mots» ou plus précisément les mots et les portions de mots qui restent porteurs de signification (les morphèmes)» en segments linguistiques élémentaires» ou phonèmes. La seconde

étape consiste à rechercher des oppositions phonétiques élémentaires entre les phonèmes pour spécifier les traits distinctifs.

Le point de départ de la procédure de détermination des phonèmes repose sur le jugement perceptif des locuteurs de la langue considérée. Las morphèmes sont subdivisés en des segments qui peuvent être perçus de manière distincte. Les locuteurs francophones s’accordent pour diviser le mot ’cri’»

p.ex.» en 3 segments perceptifs: un son Ekl identique à celui que l’on trouve à l’initiale dans ’qui’» un £R1 identique au son initial dans ’ris’ et un son [il comme dans le mot ’y’.

Les [k»R»il sont des phones. Le test de commutation

page 1

(9)

permet ensuite de décider si deux phones appartiennent ou non à la même classe phonémique. Selon Troubetzkoy (1939): i f two sounds occur exactly in the same position and cannot be

interchanged without a change in the meaning of the word or without rendering the word unrecognizable» the two sounds are the phonetic realizations of two different phonèmes' (p. 62 in Fudge»1973). Donc» Ckl> [R3 et lil correspondent à des phonèmes différents (/k/»/R/»/i/) car on ne peut pas les

interchanger dans le même environnement sans modifier le sens du mot ('qui' -> 'ris'? 'marque' -> 'mari'» 'mars'~>

'maïs') ou le rendre méconnaissable ('quel'-> >f-'rel'»

’arc’-> +=’ari’» 'encore' -> i+i’encoT').

Le test de commutation ne débouche pas souvent sur des résultats négatifs. Ceci vient du fait que les différences intraphonémiques sont généralement imperceptibles. Il y a deux sortes d’exceptions: les variantes libres et les variantes combinatoires (Troubetzkoy» 1939) . Les variantes libres sont liées à des différences de style d’élocution» de sociolecte ou de dialecte. Dans différentes langues européennes» la distinction entre le IR3 grasseyé (uvulaire) et le Cri roulé (alvéolaire) n'est pas phonémique. En français» le CRI constitue la norme tandis que le Irl est une variante dialectale ou stylistique. Les variantes combinatoires» ou al Iophones» sont en distribution

complémentaire» ce qui veut dire qu’ils ne s’opposent jamais

dans le même environnement. Les différences entre

allophones sont difficilement perceptibles pour le locuteur

naïf. La consonne initiale dans 'qui' se prononce en

plaçant le dos de la langue à l’avant du palais (/k/ palatal

ou /c/) tandis que dans 'cou' le dos de la langue se place à

l’arrière du palais (ou vélum: /k/ vélaire). La différence

(10)

entre /k/ et /•:/ n’est pas spontanément perceptible pour un locuteur francophone» mais bien pour le locuteur du tchèque»

p.ex.» langue dans laquelle l’opposition /k/-/c/ est phonémique (Jakobson et al.»1952» p .33) .

Les traits distinctifs sont des classes d’oppositions phonétiques minimales entre phonèmes. A chaque trait correspond une opposition phonétique élémentaire qui ne peut pas être scindée en d’autres oppositions» plus fines et dotées d’un pouvoir distinctif indépendant au sein de la langue considérée. Les traits sont des propriétés relationnelles: à chaque trait correspond un rapport constant qui» selon Jakobson Halle (1956; pp. 113-114 in Jakobson » 1963)» peut être mis en évidence avec des mesures acoustiques ou articulatoires.

Pour mettre les traits en évidence» on recherche des oppositions phonétiques minimales entre paires de mots. En français» ’bon - son’ n’est pas une paire minimale car il y a 3 différences articulatoires entre les phones en position

initiale et chaque différence peut jouer un rOle distinctif indépendant: le mode d’articulation» le lieu d’articulation et le voisement. La production d’un /b/ fait intervenir une occlusion du conduit vocal tandis que pour un /s/ il y a constriction du conduit. Un /b/ se prononce aux lèvres tandis qu’un /s/ se prononce dans la région alvéo- dentale. La P r 0 d U c t i

0

n d ’ un /b/ s’accompagne de vibrâtions des cordes vocales ce qui n’est pas 1e cas pour /s/ . Chaque trait peut être utilisé de manière autonome: dans ’bon - vont ’ » p.ex.»

pour le mode d’ ar t i culation; dans ’ bon - don’» p.ex.» pour le lieu d’articulation ; dans ’bon - pont’ pour le voisement.

Le trait est défini par une propriété phoné tique i nvar iante dans 1’ensemble des paires mini mal es

page 3

(11)

correspondantes. En termes acoustiques ces invariants sont!

_ pour le mode d'articulation» la durée du segment de bruit» plus long pour les fricatives que pour les occlusives.

_ pour la distinction de lieu 1abial-dental» la répartition de l'énergie » sur des fréquences plus graves pour les labiales.

_ pour 1e voisement» le point de départ des vibrations périodiques» anticipé pour les voisées.

L'examen de paires minimales permet d'assigner à chaque trait une constante acoustique ou articulatoire. Ceci ne veut pas dire que le trait se manifeste par un seul indice constant. Pour chaque trait» les indices acoustiques sont multiples et ils varient d’après le contexte des traits simultanés et adjacents. C’est précisément parce qu’il y a variabilité contextuelle que le trait est défini en termes de rapport ou de différence. Selon Jakobson Halle (1956): "Peu importe de combien les consonnes de 'tôt' diffèrent l’une de l’autre génétiquement et acoustiquement: elles ont toutes deux un registre élevé par opposition aux deux labiales de

’pop’» et toutes deux présentent une diffusion de l’énergie par comparaison à la plus grands concentration de l’énergie dans les deux consonnes de ’cock’." (p.ll4 in Jakobson » 1963) . Enfin» la multiplicité des indices offre un certain nombre de degrés de liberté dans le choix des constantes relationnelles. Les transitions de fréquence» p.ex.»

fournissent des indices alternatifs pour spécifier les oppositions de mode d’articulation» de lieu et de voisement.

La distinction entre consonnes et voyelles a un statut particulier. Il s’agit d’une distinction fondamentale»

commune à l’ensemble des langues» et qui repose sur le fait

que les voyelles» contrairement aux consonnes » peuvent

(12)

isolément constituer des syllabes. Mais il n'y a pas de définition stricte du trait de vocalisme en terme d’opposition phonétique (Jakobson Waugh» 1979> p .85) .

L’opposition phonétique associée au trait distinctif peut disparaftre dans certains environnements. Un exemple classique est fourni par le dévoisement des obstruentes

(fricatives et occlusives) de l’allemand en position finale.

Le mot ’Bund’ (’traité’) se prononce tbuntl et il a dès lors la même forme phonétique que le mot ’bunt’ ('coloré’). On pourrait faire l’hypothèse que ces homonymes ont la même représentation phonologique (/bunt/)» ce qui est la solution retenue par la linguistique structurale (Bloch»1941 cité par Fudge»1973» p.ll). Mais ceci n’est pas satisfaisant sur le plan morphologique car dans les formes infléchies de ’Bund’

l’occlusive finale devient voisée (/bundes/. . . ) . Les cas d’assimilation du voisement soulèvent un problème semblable.

Deux obstruentes qui se succèdent directement dans un énoncé appartiennent toujours à la même catégorie de voisement.

L’assimilation traverse les frontières morphémiques» ce qui peut avoir pour conséquence de modifier la valeur du trait.

En français» oCi l’assimilation est régressive» une obstruente sourde en position finale (/fJ dans 'chef’) devient voisée lorsqu’elle précède une voisée ( devient /vJ dans ’chef de gare’) et» symétriquement» une voisée en finale (/b7 dans ’robe’) devient sourde devant une sourde (devient dans 'robe sale’). Si la représentation phonologique du mot n’est pas dissociée de sa réalisation phonétique» la valeur attribuée au voisement dépendrait du contexte. Pour résoudre ce problème» la linguistique générâtive considère que la représentation phonologique d’un morphème ne correspond pas nécéssairement à sa forme phonétique (Chomsky

page 5

(13)

Halle» 1973 J pp.ll5 et suiv.). Dans cette optique»

l'assimilation de voisement provient de l'application d'une règle de génération qui transcrit la représentation phonologique profonde en une forme phonétique appropriée au contexte (Bibeau»1975» pp.93 et 112),

Dire que le trait peut éventuellement prendre des valeurs opposées aux niveaux phonologique et phonétique ne veut pas nécéssairement dire que les traits sont différents à chaque niveau. Pour que le système de traits distinctifs reste viable dans ces conditions» il faut que les règles de génération phonologiques permettent de faire les prédictions phonétiques adéquates. Ceci peut poser des problèmes» mais ne fournit pas d'argument logique pour dira que les traits sont différents. Mais» pour tenir compte du fait que la valeur du Trait dépend du niveau considéré» il est commode d’utiliser le terme "trait phoné tique" pour désigner la valeur

phonétique du trait» tandis que la terme "t rait

□honolOQique" fait référence à sa valeur phonologique (Sorin Sern i claes» 1978) . De même» on utilise le terme

"phone" pour désigner le segment obtenu par combinaison de traits phonétiques» tandis que le terme de phonème

s'applique aux combinaisons de traits phonologiques (Gleitman h. Roz i n» 1977) .

D'après Chomsky h. Halle (1973): "Les traits phonétiques peuvent être caractérisés comme des échelles physiques

décrivant les aspects de l'acte de parole qui peuvent être

contrôlés de façon indépendante tels que la vocalicité» la

nasal ité» le voisement» la glottalisation . Il y a donc autant

de traits phonétiques pue d'aspects sous contrôle

partiellement indépendant. C’est en ce sens que l'on peut

dire que la totalité des traits phonétiques représente les

(14)

capacités de production de la parole de l’appareil vocal h umain.“ (p . 11S) .

Cette définition me paratt satisfaisante mais? pour éviter toute ambiguïté? il faut attirer l’attention sur le fait que les traits phonétiques ne correspondent pas nécéssairement à des capacités de production élémentaires. Le voisement et la tension articul atoire? p.ex.? peuvent éventuellement se regrouper de manière spécifique? selon la langue considérée? pour former un seul trait phonétique

(Fischer-Jargensen? 1972).

Les traits phonétiques ne peuvent pas jouer de rôle linguistique sans distinetivité perceptive: "... pour être fonctionnelles au niveau de la grammaire? les propriétés phonétiques doivent être capables de préserver la différence des réalisations."(Lindblom?1973?p.7). Il y a vraisemblablement des prédispositions perceptives? chez l’enfant prélinguistique? pour percevoir les traits phonétiques (Eimas et al.?1971; Sec. 131 et 137). Les recherches sur la production et la perception de la parole chez l’individu adulte montrent cependant que? dans certains cas? c’est l’intégration motrice des potentialités vocales qui engendre las tabi1 it é per ceptive. Les traits phonétiques peuvent dès 1 0 rs être considérés comme des couplages

fonc tionnels e n t r e d i m e n s i ons motrices dans 1 e cadre d’un système linguistique.

page 7

(15)

12

1.1.2 Les traits distinctifs du français

En 1952» Jakobson» Fant ?< Halle présentent un système de traits distinctifs. Ce sont des traits universels: ils permettent d’obtenir les distinctions entre morphèmes dans l’ensemble des langues» sur base des données disponibles à l’époque. Le nombre des traits pertinents au sein de chaque langue est un sous-ensemble du système général.

Les 2 traits fondamentaux concernent la distinction consonne / voyelle. Les voyelles sont produites avec une ouverture du conduit vocal suffisamment large pour éviter la formation de bruit fricatif» tandis que les consonnes sont produites avec une fermeture complète (occlusives) ou partielle (fricatives) de la cavité buccale. Cette définition n’est cependant pas entièrement satisfaisante car elle classe les liquides (/!/ et /r/) parmi les voyelles. Les liquides ne s’accompagnent pas de bruit fricatif mais elles ont d’autres caractéristiques en commun avec les consonnes. C’est pourquoi on utilise 2 traits pour exprimer la distinction consonne / voyelle» les liquides étant à la fois consonantiques et vocaliques .

J Les 10 autres traits du système proposé par Jakobson et al.(1952) sont soit des traits consonantiques secondaires (de mode d’articulation et de voisement)» soit des traits de résonance (de lieu d’articulation» de tension et de nasalité)» ces derniers étant communs aux consonnes et aux voyel1 es .

Le système proposé par Chomsky " Halle (1968) comprend

25 traits. La complexification du système provient en partie

(16)

de l’extension de la base de données phonétiques. On y trouve» p.ex.» 2 traits laryngés supplémentaires» la constriction glottale et la pression subglottale» qui viennent s’ajouter au voisement pour rendre compte des différences inter1inguistiques dans l’utilisation du larynx.

Mais ce n’est pas seulement l’extension des données qui a contribué à augmenter le nombre de traits. La conception du système a changé. Ce n’est plus un système de traits distinctifs mais bien un système de traits phonétiques (cf.

supra Sec.1.1) et il doit dès lors incorporer des propriétés phonétiques qui» tout en étant manifestement sous contrôle moteur indépendant» n’ont pas de fonction distinctive dans les langues oCi elles ont été mises en évidence. Ceci est notamment le cas pour les mouvements de succion du type des clics qui accompagnent la production de consonnes labiovélaires dans certaines langues africaines

(Ladefoged»1964). De telles propriétés phonétiques peuvent être considérées comme étant potentiellement distinctives et doivent dès lors être incluses dans le système universel

(Fromkin » 1979» p .325) .

Il y a plusieurs descriptions différentes des traits distinctifs du français. Le système proposé par Malmberg (1971a) s’inscrit avec certaines nuances dans le cadre proposé par Jakobson et al. (1952). La description des phonèmes se fait A l’aide de S traits dont la plupart sont binaires et spécifiés en termes acoustiques. Dans le tableau des consonnes de Martinet (196S; 1970)» les traits sont spécifiés en termes articulatoires et les lieux d’articulation sont présentés sur des échelles A plusieurs niveaux. Le système proposé par Bibeau (1975) se situe dans le cadre de Chomsky ?< Halle (1963) . Voyelles et consonnes

page 9

(17)

L- 3 --- )OTl<te5 tnt- /ttm

/ «

n

i

fUVtlâ' OU

' atx6 ovni OK0.t mnJa-i OXO.L MùSnt

(V X é. (^) t 2

l

esj a.

h tâ-tkt. 0/H

(T^f) (ce) (Si)

jtuit fâb jtOj jUuA. dm.

(U) (jb O (:>) A/

D Cob)

oui jecb jex-t

d/a^t

>Hen lû.Lia.L'st

la.Uâ.L'St' V

LaLùiJcSt. , Û

aiuki

^

Xaiûbl 5eanA ûtnlÂÙ

RiiaJjb- Ytlaîit Uki

Véc^&

ûtn/âL fkJjtJi’

Vt'laitl P

yyt5 t toj

ii cas

h haS

cL JjL

§

^atS

ynt

ma Mon. il

S Aa>

! chat

v’a

%

A l A

tb nat

O^t

/fLeuiel'

• Oce-lnSLj-

f

Æt

CAitt'j-

Tab.1.1 Phonèmes et traits distinctifs du français.

Le système phonémique minimal comporte 10 voyelles et 16

consonnes. Le système maximal comporte 9 éléments

supplémentaires» en voie d'al 1ophonIsatI on. Ils sont mis

entre parenthèses dans le tableau. Les traits distinctifs

sont spécifiés en termes artI cul atoIres. Les voyelles sont

représentées avec 4 traltss le degré d’ouverture du conduit

vocal» la position de la langue sur l’axe avant-arrière» la

protrusion des lèvres et la présence-absence d'une oijverture

de la valve nasale. Pour simplifier la description» les

traits choisis pour les consonnes sont partiellement

différents. Les consonnes sont représentées avec les 4 traits

suivants! le lieu et le mode d’articulation» la nasal lté et

le volsement.

(18)

sont décrites avec 14 traits binaires.

L’avantage des traits binaires vient du fait qu’ils sont spécifiés en termes d’oppositions phonétiques indépendantes.

Cependant? certaines dimensions phonétiques? comme le degré d’ouverture vocalique? se présentent comme des échelles à plusieurs degrés qu’il serait artificiel de vouloir décomposer en distinctions binaires.

Il est possible d’utiliser les mêmes traits pour spécifier les lieux d’articulation vocaliques et consonantiques. Mais le lieu d’occlusion ou de constriction de la consonne n’intervient dès lors pas directement dans la spécification du trait? ce qui n’est pas satisfaisant.

Les phonèmes et traits distinctifs du français sont présentés dans le Tab.1.1. Le système phonémique minimal comporte 10 voyelles? et 16 consonnes. Le système maximal comporte 9 phonèmes supplémentaires qui sont en voie d’al 1ophonisation . Les distinctions entre /H -y/ (dans suer-suë)? ainsi que celles de type oui-ouïe (w-u)?

’brin-brun’ (£ -et) et ’lache-lâche (a-a. ) tendent à d i spara-ftre complètement (Mar t i ne t ? 1970; B i beau? 1975) . Certaines parmi ces distinctions restent présentes mais elles se distribuent de manière complémentaire en fonction des traits adjacents. Ceci est notamment le cas pour la différence de durée entre les deux /a/ qui est corrélée avec le voisement de la consonne postvocalique (Note 1). Les distinctions de type ’cOte-cotte’ (o-O )? Jeûne-Jeune

(d-oe)? et ’sais-ses’ (e-£) ont pratiquement disparu en français standard (Malmberg?1971a; voir cpdt Monnot?1977 cité par 6o11fried? 1984) mais elles restent présentes dans certains dialectes ( notamment en Belgique; Note 1).

Les traits utilisés dans le Tab.1.1 sont spécifiés en

page 10

(19)

termes articulatoires et choisis de sorte à obtenir une description aussi économique que possible. Les voyelles sont représentées avec 4 traits! le degré d'ouverture du conduit vocal J la position de la langue sur l'axe avant-arrière, la protrusion des lèvres (labialité) et la présence-absence d’une ouverture de la valve nasale.

Las phonèmes /j. 4 .w/. ou "glides". sont des semi-consonnes. Les glides se caractérisent par un degré de fermeture plus faible que celui des voyelles fermées mais qui reste insuffisant pour engendrer un bruit fricatif. Dans le Tab.1.1. les glides sont mis en parallèle avec les voyelles car ils tendent progressivement à devenir des allophones de /i.y.u/ (Martinetr1970) .

Les consonnes sont décrites avec 4 traits: le lieu d’articulation, le mode d’articulation. la nasalité et le voisement. Les distinctions de lieu sont spécifiées d’après le point d’occlusion ou de constriction : aux lèvres pour les labiales. entra la pointe de langue et les alvéoles dentaires pour les dentales, entre le dos de la langue et le palais ou la vélum (palais mou) pour les palatovélaires.

Occlusives. fricatives et liquides se distinguent d’après le mode d’obstruction du conduit oral: complet pour les occlusives. partiel avec une légère ouverture centrale pour les fricatives, partiel avec une ouverture intermittente (R) ou latérale (1) pour les liquides. La nasalité provient . comme pour les voyelles, d’une ouverture de la valve nasale.

La distinction de voisement repose sur la présence / absence de vibrations laryngées durant la phase d’occlusion ou de constriction du conduit.

Le français fournit au moins un exemple de couplage

entre traits phonétiques: le trait de stridence

(20)

( "str i ijent-mel 1 ow" J angl . ’sin-thin') se confond avec la distinction occlusive-fricative (Jakobson et al.»1952; p.25»

ed. 1969). On a émis l’hypothèse que le trait de voisement ne fait pas seulement intervenir le larynx. La durée de la consonne est plus longue lorsqu’elle est sourde» ce qui proviendrait d’un accrotssement de la tension musculaire appliquée aux articulateurs supra-laryngés

(Fischer-Jorgensen» 1972). C’est une hypothèse controversée sur laquelle je reviendrai plus en détail par la suite. Mais avant de poursuivre» je voudrais attirer l’attention sur le fait que l’ensemble des distinctions phonémiques en voie d’al 1 ophonisation » qu’il s’agisse des oppositions de type e/

(dans certaines régions) .. .ou de celles de type i/j ont également été attribuées au trait de tension (Jakobson &

Halle»1961). Il ne serait dès lors pas étonnant que la contribution de la tension articulatoire aux oppositions de

type p/b soit également en cours d’évolution.

page 12

(21)

1.1.3 Les traits dans la communication parlée

La communication linguistique est basée sur une double articulation (Martinet>1970) . La première articulation permet de transmettre une infinité de messages par combinaison de mots en phrases. Sans grammaire» la langue ne permettrait pas d'échanger plus de messages qu'il n'y a de mots différents (quelques milliers). La deuxième articulation permet de composer les mots à l'aide d'un nombre restreint d'unités sans signification propre» ou phonèmes. Si chaque unité était transmise en bloc» le nombre de distinctions possibles se ramènerait aux oppositions que nous pouvons produire et percevoir de manière distincte. On assisterait à une

réduction drastique du vocabulaire qui» même si elle ne constitue pas une barrière infranchissable pour transmettre une infinité de messages» aurait pour conséquence d’alourdir considérablement la syntaxe (Liberman Studder t-Kennedy»

1973» pp.145-146).

Le véhicule de la communication parlée est un signal acoustique produit par un mouvement quasi continu des articulateurs du conduit vocal. Les mots et les phonèmes se succèdent sans discontinuer dans la production de la parole»

ce qui se traduit par le recouvrement des segments et la

variabilité des indices correspondants dans le signal

acoustique (Fant»1962; Lindblom»1963; Ohman»1966). Il n'y a

pas de relations biunivoques entre les segments du signal et

les phones» ni de relations stables entre les indices du

signal et les traits phonétiques. On peut dès lors se

demander si ces unités ont une réalité psychologique.

(22)

Différentes procédures ont été mises en oeuvre pour tenter de mettre en évidence la réalité psychologique des phones et des traits. L'analyse des erreurs de prononciation fournit des arguments en faveur de l'utilisation de ces unités dans le codage moteur des sons de la parole. L'analyse des erreurs d’identification et» surtout» des erreurs de mémorisation fournit des arguments en faveur de l'utilisation des traits dans le décodage perceptif.

Des corpus d'erreurs dans la production de la

parole ont été constitués par différents auteurs (pour une revue cf.: Fromkin» 1971; 1979). Les données sont» en général»

fournies par l'observation systématique des erreurs spontanées (p.ex.: Meringer S; Mayer» 1395)» mais elles peuvent également être recueillies dans un cadre expérimental

(Cohen » 1966) . Les erreurs phonémiques sont les plus fréquentes. Elles consistent soit à reproduire le même phone» en anticipant ou en persévérant» soit à transposer deux phones différents (Nooteboom»1969; Fromkin»1971) . Les erreurs phonémiques conservent généralement la position du phone dans le cadre syllabiques les consonnes sont remplacées par des consonnes dans la même position (initiale ou

finale) par rapport à la voyelle et les voyelles sont remplacées par des voyelles (McKay»1970). Lorsque les erreurs affectent des séquences de phones» celles qui consistent à modifier des mots ou des morphèmes sont plus fréquentes que celles qui se rapportent à des séquences sans signification

(Nooteboom»1969).

McKay (1970) examine les relations phonétiques entre phones dans les cas de transposition. Il constate que: (l) la

fréquence des transpositions entre consonnes augmente en fonction de la similitude phonétique» mesurée d'après le

page 14

(23)

nombre de traits qu’elles ont en commun (voir également!

Fromkin» 1979); (2) la valeur d’un trait reste inchangée dans des proportions supérieures au hasard» avec certaines réserves pour le lieu d’articulation. McKay attribue les similitudes phonétiques entre phones transposés à des erreurs de programmation temporelle des commandes motrices. Si à chaque trait correspondaient des commandes antagonistes entre lesquelles il y a des inhibitions réciproques» l’anticipation d’une commande pourrait provoquer une hyperexitation subséquente de la commande opposée. Cette hypothèse mérite d’étre retenue si l’on sait que l’écart entre phonèmes

transposés est» en général» de l’ordre de une à deux syllabes»

La diversité des erreurs de production se comprend si l’on fait l’hypothèse que la programmation temporelle des gestes articulatoires comporte plusieurs étapes correspondant à différents niveaux d’intégration (Lashley» 1951). La réalité motrice du trait n’exclut pas le phone. On peut difficilement rendre compte de certaines erreurs phonémiques sans postuler l’existence d’un niveau de codage spécifiquement phonémique. La substitution entre /p/ et /b/»

p.ex.» est plus fréquente que celle entre /p/ et /z/» mais il est rare que /p/ devienne /b/ sous l’influence d’un /z/

subséquent (Nooteboom»1969). Il pourrait y avoir une relation entre l’empan temporel des influences interphonémiques et le type d’erreur» phonémique ou phonétique» mais les données disponibles ne fournissent pas d’indications claires sur ce point .

De nombreux travaux ont eu pour objectif de mettre en évidence la réalité percep tive des traits à partir

d’erreurs d’identification. Dans l’expérience séminale de

(24)

Miller Nicely <1955)> 16 syllabes de type /consonne + a/»

prononcées par des locutrices anglophones» sont présentées soit sur fond de bruit, avec différents rapports signal/bruit, soit après avoir été filtrées à différentes fréquences de coupure. Les 16 consonnes sont des obstruantes qui diffèrent d’après le voisement, la nasalité, le lieu et le mode d’articulation. L’examen des erreurs d’identification, à l’aide des statistiques de la Théorie Mathématique de la Communication (Shannon Weaver, 1949) , montre que l’information transmise globalement correspond approximativement à la somme des informations transmises par les différents traits. Ceci montre que les différents traits sont transmis de manière largement indépendante. D’après Miller ?S/. Nicely (1955): "Some interaction or "cross talk" is to be expected, in the sense that knowing one feature may make some other feature easier to hear. However, the

impressive thing to us i»as that this cross talk was so small and that the features were perceived almost independently of one another"(p . 169 in Saporta,1961) . Les auteurs attirent cependant l’attention sur le fait que l’on ne peut pas obtenir un test rigoureux de l’additivité de l’information transmise par les différents traits en raison de leur redondance dans l’ensemble de syllabes utilisées dans l’expérience.

Mais il y a d’autres obstacles qui font que, même si l’on choisit un sous-groupe de stimuli dans lequel les traits ne sont pas redondants (p.ex.: les occlusives orales ou les occlusives voisées et les nasales), on ne peut pas obtenir un test exact de l’indépendance à partir des tâches d’identification de syllabes dans le bruit. D’une part, le bruit de fond et autres distort ions de l’environnement

page 16

(25)

affectent simultanément les corrélats acoustiques des différents traits. D’autre part» l’identification d’un trait dépend de divers indices dont certains interviennent également dans l’identification des autres traits (cf.Sec.1.3) . Le traitement des matrices de confusion à l’aide de méthodes d’analyse multidimensionnelle montre clairement que les tendances d’erreurs doivent être attribuées à des similitudes acoustiques. La méthode INDSCAL

(Carrol Chang? 1972) offre un intérêt particulier car la représentation des données se fait dans un espace oü l’orientation des axes perceptifs est déterminée de manière univoque. L’application de cette méthode aux données de Miller Nicely (1955) fait ressortir un axe perceptif déterminant qui correspond à une distinction triple entre obstruentes sourdesi voisées et nasales (Sol i Arab i e > 1979) . Les auteurs attribuent la conjonction des 2 traits à un indice acoustique commun ( le VOTs Lisker Abramson» 1964;

cf. Sec.12). De même? les autres dimensions perceptives mises en évidence dans ce travail correspondent davantage à des dimensions acoustiques qu’à des dimensions articulatoires . Le traitement des résultats d’identification de voyelles par la méthode INDSCAL aboutit à des conclusions semblables (Beeckmans» 197Sa). Les axes perceptifs qui se dégagent sont corrélés avec des indices acoustiques plutôt qu’avec des dimensions articul atoires . On ne peut pas tester l’indépendance perceptive entre les traits sans exercer un contrôle sur les valeurs acoustiques des divers indices pertinents. Ce problème est examiné dans la Sec.135.

Les erreurs d’identification ont été utilisées à des

fins différentes dans les expériences ultérieures. On a

essayé de départager différents systèmes de traits en se

(26)

basant sur les tendances d’erreur» ce qui a échoué en raison du manque de sélectivité des modèles appliqués au traitement des résultats (Wang B i Iger » 1973) . On a également tenté d’établir une hiérarchie entre les traits pour rendre compte des choix d’identification. Ainsi que je l’explique par la suite» les poids perceptifs des traits dépendent aussi des conditions d’écoute. Mais auparavant» J’examinerai d’autres arguments en faveur de la réalité perceptive des traits.

L’argument le plus convaincant est fourni par les expériences de mémorisation à court terme (Wickelgren»1966) . La tâche consiste à écouter une liste de syllabes» à reporter les syllabes par écrit» puis à les reproduire de mémoire de manière orale. La transcription permet de dissocier les erreurs de rappel des erreurs perceptives. Si l’on fait l’hypothèse que les stimuli sont mémorisés d’après les valeurs des traits distinctifs correspondants» les substitutions entre syllabes lors du rappel devraient augmenter en fonction du nombre de traits qu’ils partagent en commun. Wickelgren (1966) fournit un test de cette hypothèse pour des syllabes qui diffèrent d’après la consonne initiale.

L’auteur utilise 3 systèmes de traits pour prédire les intrusions dans le rappel à court terme. Il constate que les prédictions globales sont supérieures au hasard pour chaque système considéré» ce qui l’amène à conclure que"... recal 1 of a consonant means recall of a set of features that defines the consonant» and each feature is recalled at least semi independen11 y of the other features" (Wickelgren»1966»

p.397). Les résultats ne permettent cependant pas d’exclure un niveau de codage phonémique car» même si l’on obtenait une relation systématique entre les fréquences de substitution et le nombre de traits qui séparent les

page 18

(27)

consonnes» des intrusions interphonémiques pourraient s'ajouter indifférement à celles en provenance du codage par traits distinctifs.

Le rappel à court terme a également été utilisé pour tester la pertinence des traits vocaliques. Les résultats obtenus par Wickelgren (1965) suggèrent que les voyelles sont mémorisées par traits distinctifs» mais ceci n’a pas reçu de confirmation dans une expérience ultérieure (Sales et al.»196S). L’instabilité des résultats est spécifique aux voyelles» la pertinence des traits pour prédire les erreurs dans le rappel des consonnes ayant fait l’objet d’une confirmation (Cole et al.>1968).

La réalité perceptive du phone a été mise en question sur base de résultats obtenus dans les expériences de temps de réaction . Le fait que la latence de détection est plus brève pour les syllabes que pour les consonnes initiales (Savin Bever»1970) pourrait suggérer que l’intégration perceptive des traits se fait directement» ou d’abord» dans

le cadre syllabique. Mais le paradoxe ne s’arrête pas là puisque le T.R. diminue également lorsque l’on passe de la syllabe au mot et du mot à la phrase (Bever»1970). Selon Liberman ?< St udder t-Kennedy (1978) s "The solution to this Paradox was provided by Mch4e i 1 and Lindig (1973)» who showed that réaction times are» in fact» shorter for the items of i^jhich a list is composed or» in other words» for those items to which the experimental situation has drawn the listener’s attention (....). Rubin et al. (1976) hâve élaborâted these conclusions arguing that such monitoring experiments do not measure the time taken to process the targets perceptually»

but rather the time taken to bring them into

consciousness..." (p.l69).

(28)

Ceci s’accorde avec d’autres constatations. L’auditeur qui ne conna-tt pas l’écriture alphabétique ne peut pas» du moins spontanément» scinder une syllabe en ses constituants phonémiques (Alegria Zt Moraîs» 1979; MoraTs et al.» 1979).

Les difficultés d’accès conscient ne sont pas moins importantes dans le cas des traits et le degré d’accessibilité dépend du trait considéré.

L’expérience de Miller Zi Nicely (1955) suggère que la transmissibilité des traits de voisement et de nasalité dans le bruit dépasse celle des autres traits (cf. supra; Sol i Z<

Arabie» 1979) . L’intelligibilité relative des traits consonantiques dépend cependant des conditions d’écoute. Wang Bilger(1973) comparent les erreurs d’identification de consonnes dans deux conditionsî soit en présence de bruit masquant» soit avec réduction de l’intensité du signal.

L’intelligibilité des traits de nasalité et de voisement»

mesurée en pourcentage d’information transmise» dépasse celle des autres traits dans le bruit tandis qu’en dehors du bruit les différences d’intelligibilité tendent à s’inverser. Ceci suggère que les indices de nasalité et de voisement résistent mieux au bruit tandis que les indices de lieu et de mode d’articulation résistent davantage à la chute d’intensité.

L’importance relative des traits ne dépend pas seulement des conditions ambiantes mais également de la tâche expérimentale. Les poids perceptifs du voisement et de la nasalité sont relativement faibles lorsque l’on fait appel au jugement du locuteur pour établir le degré de similitude entre phones. Dans les espaces perceptifs obtenus à partir de jugements de similitude» les dimensions qui» d’après la disposition des phonèmes» correspondent aux traits de lieu et de mode d’articulation ont généralement plus de poids que

page 20

(29)

celles qui correspondent aux traits de nasalité et de voisement (Shepardj1972; Singh et al.>1972). Ceci signifie que les sujets tendent à faire abstraction des distinctions de nasalité et de voisement et à préserver les distinctions de lieu et de mode d'articulation pour évaluer les simi1 itudes interphonémiques .

Il semble également y avoir des différences d’accessibilité entre les traits pour apprendre ou découvrir des règles de classification de consonnes- Dans un paradigme de catégorisation> l’utilisation de certains traits (la stridence) et non d’autres (le voisement) permet d’améliorer la performance pav' rapport à un critère de classification arbitraire (LaRivière et al.>1974). Les locuteurs parviennent cependant à. utiliser le voisement peur répartir les consonnes en groupes à condition que leur attention sc i t> directement ou i ndirectement> attirée sur les différences de prononciation entre consonnes sourdes et voisées (Jenkins et al. >1963; Healey Lev i 11 > 1930) .

Une constatation phénoménologique d’ordre général est que l’extraction de sens à partir des signaux parlés a pour effet d’éloigner les caractéristiques phonétiques de notre monde conscient (Darwin>1976). Cette distanciation pourrait bien être une condition indispensable au rendement des traits dans la communication parlée. Fromkin (1971>p.l6) rappelle que les erreurs de prononciation sont contagieuses:

plus on les observe chez d’autres locuteurs> plus on a

tendance à en faire (Freud>1924) . Le fait que certains traits

(le lieu et le mode d’articulation) sont plus accessibles que

d’autres (le voisement et la nasalité) peut s’expliquer par

leur visibilité à partir des mouvements des lèvres et de la

mâchoire> ce qui pourrait aussi expliquer leur manque de

(30)

résistance au bruit (Miller N i cely . 1955) . L’intégration entre indices visuels et auditifs est certainement favorable à l’identification consciente et les différences de rendement entre les traits dans la communication sont propres aux circonstances dans lesquelles seuls les indices auditifs»

ou visuels» rentrent en jeu.

page 22

(31)

1 .2 PrQduc 1: i on du voisement des consonnes Qcclusives

1.2.1 Production des occlusives orales

Le signal acoustique de parole est produit par les muscles agissant sur les poumons» le larynx» les parois du pharynx et de la bouche» et les organes articulatoires (Fig.1.1). Partant des poumons » le flux d’air expiratoire produit de l’énergie acoustique en traversant le larynx et les cavités supérieures du conduit vocal. Il y a plusieurs types de sources sonores dans le conduit vocal. La source principale est quasi périodique» ou voisée. Elle est fournie par les mouvements cycliques d’ouverture et de fermeture des cordes vocales situées dans le 1arynx(Fig.1.2.). Les autres sources sont apériodiques. Ce sont des bruits générés par un écoulement turbulent de l’air dans 1 es c

0

n s t rietio n s di.

conduit vocal ou par une ouverture brusque d U c

0

n d U i t .

La production de vibrations laryngées repose sur 3 conditions. Il faut que les cartilages aryténoïdes soient suffisamment rapprochés pour permettre une fermeture de la glotte» que la pression de l’air pulmonaire soit supérieure à celle de l’air supra- glottique» et que le degré de tension des cordes vocales soit adapté à la différence de pression transglo11ique (van den Berg»1958; Ladefoged» 1973;

Stevens»1977) . Lorsque ces conditions sont réunies» les cordes vocales s’écartent d’abord sous la pression de l’air trachéal» puis se referment par succion (effet Bernoulli)»

s’écartent à nouveau dès que la pression infra-glottique

(32)

Fig.1.1 Le conduit vocal.

Le flux d’air expiratoire fournit de l’énergie acoustique en traversant les cavités vocales. Les mouvements cycliques de la glotte» située dans le larynx» fournissent une source d’énergie quasi-périodique ou volsée. Les gestes de la langue» des lèvres et de la mâchoire permettent»

d’une part» de modifier les fréquences de résonance du

pharynx et du conduit buccal» et d’autre part» d’engendrer de

l’énergie apériodique par constriction ou ouverture brusque

du conduit. Le voile du palais permet de contrôler le

passage de l’air par le nez.

(33)

Cârtllagg thvrotda ,

Cordes vocales

Cordes vocales en position respiratoire

Glotte Mliscles Crlco-Aryte-1

noldlen et Tliyro- L Arytenotdlen lattrauxi Cartilages Amenoldes"

' *

II n

11 il

n II

11 U

« ■ 'J “

Cordes vocales en position phonatoire

Fig.1.2 La source volsée.

La glotte est la partie de l’étage moyen du comprise entre les bords libres des cordes vocales

Inter1Igamenteuse) et» en arrière. entre aryténoïdes (glotte intercartI1agineuse) d’ouverture de la glotte dépend de la aryténoïdes. En position respiratoire. les

vers l’arrière la glotte. Les basculent

ouver ture rejoignent position

rétrécissemen t

complè t emen t maximale de vers 1’avan t phonatoire.

1aryn x (glot te les car tI1 âges

Le degré position des aryt éno ï des pour obtenir une

aryténoïdes se

pour mettre les cordes vocales en

c’est-à-dire pour obtenir le

nécéssaire à la production de vibrations

(34)

s’est reconstituée» etc... (Théorie Myoélastique de la Phonation! van den Berg>195S).

La fréquence des vibrations laryngées» ou fréquence fondamentale de la voix (FO)» dépend de facteurs mécaniques (la tension des cordes: Ladefoged»1973; Stevens»1977) et aérodynamiques (la pression subglo11ique : Fant»19S0»

PP.266-267) . Les différences anatomiques dans l’épaisseur et la longueur des cordes vocales sont à l’origine de larges variations interindividuel1 es dans la hauteur de la FO. Celle ci est de 120 Hz en moyenne chez l’homme» et de 210 Hz chez la femme» en frans:ais (Boë et al.» 1975).

Les caractéristiques acoustiques des sons voisés sont présentées dans la Fig.1.3. Dans une représentation spectrographique (Joos»194S; Met tas»1971)» les segments voisés se manifestent par des stries verticales» l’intervalle entre deux stries successives correspondant à une période de voix (1/FO). On voit que l’énergie ne se concentre pas sur la FO mais se répartit sur plusieurs bandes de fréquence appelées formants et qui proviennent des résonances supra-gl

0

ttiques. La présence de 3 formants principaux provient de la combinaison d’une source voisée avec une ouverture suffisamment large du conduit pour éviter la formation de bruit fricatif» ce qui est la configuration articulatOire typique des voyelles. Le spectre des segments vocaliques vaisés se caractérise par une chute de 6 dB par octave» ce qui fait que le formant le plus grave (Fl) est aussi le plus intense et que l’intensité relative des 2 autres formants (F2 et F3) dépend de leur localisation spectrale ( dans la Fi g.1.3 on a superposé un spectre avec une correction de +6 dB par octave sur le spectre non corrigé pour mieux faire apparattre les 3 formants).

page 24

(35)

I I , I I I 1

H__ ... ...■ .

A â. cL 0

F Ig.1.3 Segments voisés et sourds.

L'analyse spectrographI que» en temps (abaisse) -fréquence (ordonnée) -Intensité (noircissement)» du mot

'cadeau' montre les différences acoustiques entre segments de

parole. Les segments voisés se manifestent par des stries

verticales» l'Intervalle entre deux stries successives

correspondant à une période de voix (1/FO). Dans les segments

vocal Iques (/a/ et /o/)» l'énergie périodique se répartit sur

plusieurs bandes de fréquence» ou formants» dont les plus

visibles sont les Fl» F2» F3. Lorsque 1 'occlusion est

voisée (pour /d/)* l’énergie périodique se concentre sur le

Fl. L'occlusion sourde (pour /k/) est acoustiquement vide. La

détente de l’occlusion buccale provoque un bruit d’explosion

qui peut éventuellement être suivi par un bruit

d’aspiration» d’intensité relativement faible» s’il s’agit

d’une occlusive sourde (pour /k/) .

(36)

Le locateur peut adopter différents modes de vibrations des cordes vocales. Ceux-ci dépendent du degré d’écartement des arythénoîdes (Ladefoqed»1973) ? et de facteurs de régistre dont les corrélats physiologiques ne sont pas bien connus (Henderson>1977). Dans le mode de vibration usuel» les cordes vocales vibrent sur l’ensemble de leur longueur. La voix soufflée (breathy voice) est produite avec un écartement plus large des aryténoïdes qui» tout en n’étant que légèrement inférieur au degré d’ouverture utilisé pour les sons sourds (comme /h/ )» permet cependant à la partie antérieure des cordes vocales d’entrer en vibration. La voix crissante (creaky voice) est produite avec un degré d’écartement plus faible que celui de la voix normale» de telle sorte que seule une faible partie des cordes vocales ligamenteuses puisse vibrer (Fig.1.2).

La production des consonnes fait intervenir un mouvement de fermeture du conduit vocal. les occlusives orales /ptk»

bdg/ se caractérisent par une fermeture complète du conduit suivie d’une ouverture brusque. Lorsque l’occlusive se trouve en position initiale» le mouvement de fermeture du conduit ne laisse pas de traces acoustiques. Dans les autres positions»

le début de l’occlusion se manifeste par des transitions formantiques. Les seuls indices présents dans toutes les positions sont ceux fournis par la détente de l’occlusion» du moins dans une langue à syllabation ouverte comme le

français .

Le relâchement de l’occlusion se manifeste d’abord par un bruit transitoire. Le transitoire de détente est une sorte de flash acoustique engendré par la libération brusque de l’air comprimé durant l’occlusion (Fant» 1960»p . 13) . Le transitoire est ensuite remplacé graduellement par un bruit

page 25

(37)

de friction. La friction provient de l'écoulement turbulent de l’air dans les constrictions du conduit vocal. Le bruit de friction est relativement bref par comparaison avec celui des consonnes constrictives et il se superpose à la fin du bruit transitoire. La conjonction des bruits de détente et de friction» qui ne sont pas toujours nettement séparables dans les représentations acoustiques» forme ce que l’on appelle le bruit d’explosion. Lorsque l’occlusive se touve en position prévocalique » la constriction du conduit est suivie d’une transition d’ouverture. Celle-ci se manifeste par des modifications spectrales des 3 premiers formants pour autant que l’occlusive ne soit pas aspirée. Pour les aspirées»

seules les transitions des formants supérieurs (F2 et F3) sont visibles.

Les distinctions entre occlusives voisées (bdq)» sourdes

(ptk)» et aspirées (ph»th»kh) dépendent de la relation

temporelle entre le départ des vibrations laryngées et les

mouvements des ar t i cul at eurs supragl o 11 i ques (Lisker

Abramson»1964). Dans le cas des voisées» le départ des

vibrations périodiques intervient avant la détente de

l’occlusion et» sauf accident» les vibrations se poursuivent

sans discontinuer durant l’explosion et les transitions

vocaliques. La fermeture complète ou partielle du conduit

vocal durant l’occlusion et la constriction post-détente ont

pour conséquence de réduire l’amplitude des vibrations et

d’atténuer l’intensité des formants supérieurs au Fl

(Fi g.1.3). Pour les occlusives sourdes» le départ des

vibrations intervient à la fin du bruit d’explosion tandis

que pour les aspirées les vibrations ne commencent qu’après

le début des transitions formantiques. Les segments aspirés

se caractérisent par l’absence virtuelle de Fl» l’ouverture

(38)

de la glotte ayant pour conséquence d’élargir considérablement la largeur de bande de ce formantj et par la faible intensité des F2 et F3 (Fig.1.3). Les bruits d’aspiration sont également des bruits turbulents mais leur

intensité est nettement plus faible que celle des bruits de friction.

Le bruit d’explosion est un attribut acoustique propre aux occlusives orales car il provient nécéssairement de 1’interruption brusque d’une fermeture articulatoire complète du conduit vocal. Pour les autres catégories de consonnes ces deux caractéristiques articulatoires ne sont jamais réunies.

La fermeture articulatoire n’est que partielle pour les occlusives nasales» les fricatives et les liquides. Dans le cas des semi-consonnes» la fermeture articul atoire n’est pas complète et le relâchement est plus lent par rapport aux occlusives .

Les sons émis par les différentes sources sont filtrés de manière spécifique d’après la position des articulateurs supra-gl

0

11iques . Les mouvements de la langue» des lèvres et de la mâchoire modifient la géométrie du pharynx et de la bouche» ce qui s’accompagne de changements dans les fréquences de résonance du conduit vocal .Le voile du palais constitue une valve qui permet de contrôler le passage de l’air par le nez» celui-ci pouvant fournir un résonateur supplémentaire.

Les relations entre les fréquences des formants vocaliques et les caractéristiques résonnantes des cavités sont relativement complexes. La fréquence de chaque formant dépend de la forme globale du conduit vocal supralaryngé ( Fant»1960) et il n’y a» en outre» pas de relations biunivoques entre les configurations articulatoires et les

page 27

(39)

formants puisque différentes formes de conduit vocal peuvent éventuellement produire le même pattern formantique

<Lieberman » 1976) .

Le Fl a un intérêt particulier pour la production du voisement parce que la présence de ce formant dépend de l'état de la glotte (cf .Sec . 123) . La fréquence du Fl dépend essentiellement du degré de constriction du conduit vocal

(Fantjl960!! Stevens &c House7l961). La fréquence du Fl augmente lorsque la constriction buccale diminue» ce qui est le cas pour la voyelle /a/» dite ouverte» par rapport aux voyelles /i»y»u/» dites fermées. Pour les occlusives voisées»

la fréquence du Fl durant l'occlusion atteint la limite inférieure de 200 Hz» contre 750 Hz environ pour /a/ et 250-300 Hz pour les voyelles fermées.

Les relations entre les fréquences des formants et les

cavités vocales sont plus simples pour les consonnes. En

présence d'une forte constriction du conduit vocal» ce qui

est le cas pour les fricatives et lors de la détente des

occlusives» les fréquences des F2 et F3 dépendent de la

cavité située devant la constriction ou cavité de résonance

frontale ( CRF; Kuhn»1975) . Pour les occlusives labiales

/pb/» la CRF est quasi absente sauf si elles sont suivies par

des voyelles labialisées telles que /y»u/. Dans ces contextes

vocaliques» le bruit d'explosion est spectralement diffus

avec une prédominance de basses fréquences. Pour les dentales

/td/> la CRF est étroite ce qui engendre un bruit diffus dans

lequel l'énergie de haute fréquence prédomine. La CRF des

occlusives dorsolinguales /kg/ dépend largement du contexte

vocal ique. Un /k/ palatal» dans /ki/ par ex.» présente une

CRF étroite» tandis qu’un /k/ vêlaire» dans /ku/ par ex.» est

prononcé plus en arrière et présente une CRF plus large. Les

(40)

pal at

0

-vélaires se caractérisent par un bruit d’explosion spectralement compact» l’énergie se concentrant dans une zone de fréquence proche des F2 et F3 de la voyelle suivante.

Le lieu d’articulation de l’occlusive n’affecte pas seulement le spectre du bruit d’explosion mais également divers autres indices parmi lesquels la direction des transitions des F2 et F3. Ces indices ne sont pas très fiables car ils dépendent également du lieu d’articulation vocal i que (Fan t » 1969!! Kewl ey-Por t > 19S2) . La direction des transitions dépend nécéssairement du contexte vocalique et ce m^me lorsque l’articulation de la voyelle n’affecte pas le lieu d’occlusion. A cette variabilité intrinsèque viennent s’ajouter les effets de coarticulation. En cadre

intervocalique (VCV)> la coarticulation se manifeste par des changements de trajectoire des transitions initiales» en fonction de la voyelle finale» et des transitions finales» en fonction de la voyelle initiale (Ohman» 1966) . Pour des occlusives en position initiale» l’effet de l’articulation vocalique sur les fréquences initiales des formants (Lehiste 2< Pe t erson » 1961 ) provient également de la coar t i cul at i on (Fant»1969). On constate par ailleurs que les effets de la coarticulation sur les fréquences initiales des formants sont plus marqués pour les occlusives voisées que pour les sourdes

(Gay » 1979) .

La coarticulation n’affecte pas forcément les relations entre la forme globale du spectre du bruit d’explosion et le lieu d’articulation des occlusives. Selon Stevens et Blumstein (1978)» les variations contextuelles des formants fricatifs sont trop faibles pour modifier la forme globale du spectre de l’explosion (diffuse-grave pour les labiales»

diffuse-aigué pour les dentales et compacte pour les

page 29

(41)

vélaires)j ce qui amène ces auteurs a supposer qu'il existe des propriétés acoustiques relativement invariantes pour chaque lieu d'articulation.

D'autres auteurs ont attiré l'attention sur la complémentarité du spectre du bruit d’explosion et de la direction des transitions formantiques en tant qu’indicés de lieu d’articulation (Dorman et al.»1977). Ils constatent que»

pour chaque lieu d’articulation consonantique » l’énergie (duréeH'! i ntens i té) .jij bruit d’explosion est plus faible dans les contextes o»li l’étendue spectrale des transitions est plus large. Pour les labiales et les palato-vélaires.

l’énergie de l’explosion diminue. et l’étendue des transitions augmente. lorsque la voyelle suivante n’est pas labialisée (p.ex.: dans /pi.ti/ par rapport à /pu.tu/). Les effets de la labialisation vocalique jouent en sens inverse pour les dentales: l’explosion est plus forte et les

transitions sont moins étendues devant les voyelles non labialisées (p.ex.: dans /ti/ par rapport à /tu/). Ces variations complémentaires proviennent des effets des lieux d’articulation de l’occlusive et de la voyelle sur plusieurs facteurs articulatoires et notamment sur la vitesse de la transition d’ouverture. Ce dernier facteur est également à l’origine des variations contextuelles de la plupart des indices de voisement. L’examen des processus de production du trait de voisement (cf.Sec.123 et Chap .2) montre que. à l’instar de ce que l’on constate pour le lieu d’articulation, les changements de vitesse d’ouverture ont également pour conséquence d’introduire des relations complémentaires entre les valeurs acoustiques intracatégoriel1 es de certains

indices de voisement.

(42)

En résumé» la source sonore utilisée pour produire les voyelles est périodique et elle provient des mouvements cycliques des cordes vocales. La production des consonnes occlusives fait intervenir plusieurs types de sources apériodiques. La détente de l’occlusion se manifeste d’abord par un bruit d’explosion» formé par un mélange de sons transitoires et turbulents» qui est suivi par des transitions spectrales dont la durée est relativement brève par rapport à d’autres catégories de consonnes. Pour les occlusives voisées (bdg)» l’occlusion contient des vibrations périodiques et le bruit d’explosion est modulé par ces vibrations. Pour certaines catégories d’occlusives sourdes <ptk)» le bruit d’explosion est suivi d’un bruit d’aspiration qui provient de l’ouverture simultanée de la glotte et des cavités supragl

0

11iques .

Les sons émis par différentes sources sont filtrés de manière spécifique d’après la position des articulateurs supraglottiques . L’énergie se répartit sur plusieurs bandes de fréquences appellées formants. La fréquence du formant le plus grave (Fl) dépend essentiellement du degré de constriction du conduit vocal. La fréquence du Fl diminue en fonction du degré de fermeture vocalique (de /a/ vers /i»y»u/) et atteint sa limite inférieure durant l’occlusion des /bdg/. Les fréquences initiales des formants supérieurs (F2 et F3)» durant le bruit d’explosion» et la direction des transitions de ces formants dépendent des lieux d’articulation de l’occlusive et de la voyelle. Le spectre du bruit d’explosion fournit un indice de lieu d’occlusion plus fiable par comparaison avec la direction des transitions f ormant i qpaes. Ces 2 indices ont cependant le môme intérêt descriptif car» pour chaque lieu d’occlusion» l’énergie du

page 31

(43)

bruit d'explosion et l’étendue spectrale des varient de manière complémentaire en fonction vocalique.

J" y

tv.

■ ->r

?

r»'

transitions

du contexte

Références

Documents relatifs

Hormis les principales fibres de synthèse utilisées actuellement, les fibres de chrysotile présentent, de par leurs caractéristiques mé- caniques, un potentiel important d'agents

oeuvre commune. C'est la pratique surtout qui a suggéré l'idée et le fond du manuel. Là, sont réunies des remarques personnelles ti­ rées de l'expérience, rédigées sous forme

enfant ou un adolescent sur ses loisirs, il ne pensera pas à l'école, qui lui semble le plus souvent comme une contrainte, mais bien au temps dont il dispose librement après

lignes; mais on doit tenir compte du gonflement extraordinaire de la paroi anté- rieure du vajçin et du col de la vessie, qui avait disparu en grande partie après la délivrance et

résista pas longtemps à ces secousses nouvelles et sou- vent répétées, et il fut bientôt affect é du délire des ivre-.. Sa femme le fit contenir par plusieurs hommes;

Les il;l3tances I~2~4-&#34;5-6 sont beaucoup plus importantes dans le crâno ratle que dans le crâne femelle ; le gorille mâle possède donc une face plus développée que la femelle ;

L’œuvre ne peut être stockée dans une autre base de données dans le but d’y donner accès ; l’identifiant unique (permalink) indiqué ci-dessus doit toujours être utilisé

° Parallèlement, l'érosion des forces classiques des partemires de l'Alliance s'est poursuivie sans discontinuer pour des raisons diverses, de nature économique, de