et l'oreille
Nousdisposonspourparlerd'uninstrumentdemusiquecomplexe:leconduit
vocal.Celui-cis'organiseendeuxsous-systèmes(voirgure2.1):l'ungénèreune
ondesonore,lesecondlasculpte.Lepremiersystèmeestsub-glottal:l'ensemble
poumons/diaphragmepermet defairesouer del'airdans latrachée,qui fait
vibrerlelarynx.Lelarynxestunassemblagedecartilagesetdemuscles,quien
vibrantgénèreuneondesonore.Le songénéréestalors constituéd'une
multi-tudedefréquences.Lesecondsystème,supra-laryngeal,estuntubequis'étend
dularynxjusqu'auboutdeslèvresetdunez,oùilsediviseendeux.Lesorganes
de laglotte, levelum, lalangue (corps et extrémité),et leslèvres permettent
de modier la forme dece tube, en particulier sa longueur et son volume. Ce
changement de forme a pour conséquence d'atténuer ou d'amplier certaines
fréquencesdusignalsonore.Ainsi,laproductiondusonparleconduitvocalest
similaireàlaproductiond'unsonavecuneûte:onsoueàuneextrémité,ce
qui en passantdans le siet, produit unson composé de multitudes de
fré-quences,etquel'onmodieenbouchantlestroussurledessusdel'instrument,
cequimodiesaforme.Ainsi,parlerrevientàfairebougerlesdiérentsorganes
duconduitvocal.
Pour percevoir les sons,nous disposons de l'oreille, et en particulier de la
cochlée(gure2.2).Lacochléeestl'appareilquinouspermetdefaireuncertain
nombre demesures sur le son. Parmi ces mesures, il ya ladécomposition du
son en fréquences, ou harmoniques. En eet, chaque son complexe peut être
Fig.2.1 Leconduitvocalestorganiséendeuxsous-systèmes:lesystèmesub-glottal
quiproduitunesource sonore,etlesystèmesupra-laryngeal,dont laformemodiable
permetdesculpter cetteondesonore.(adapté de(Goldstein,2003b)).
et une amplitudedonnée.C'est ce qu'onappelleladécomposition enséries de
Fourieren mathématiques. La cochlée réalise une approximationde cette
dé-compositiongrâceàlamembranebasilaire.Celle-ciestd'épaisseurcroissante,et
làoùelleestne, ellerépondmieuxauxhautesfréquences,alorsquelàoùelle
estépaisseetlourde,ellerépondplutôtauxstimulationsdebassefréquence,
cor-respondantmieuxàsespropriétésinertielles(gure2.3).Descellulesnerveuses,
lescellulesciliées,sontreliéesàcettemembranepourrecueillirl'informationde
stimulation.Cetteinformationremontealorsparunsystèmedebresjusqu'au
Fig. 2.2 La cochlée, organe de perception de la parole. Sa membrane basilaire
permet defaireunedécompositiondusonen sériedeFourier,c'est-à-dire decalculer
l'amplitudede sesharmoniques.(adapté de (EscudieretSchwartz, 2000)).
2.2 Comment notrecerveau joue des instruments
de la parole: le point de vue de la phonologie
articulatoire
Dequellemanièrelesorganesduconduitvocalcontrôlent-ilsleuxsonore?
Quellessontlesreprésentationsquenotrecerveauutilisepourproduireunson?
Comment le lien entre la production et la perception est-il géré? C'est àces
question que la théorie de la phonologie articulatoire répond (Browman and
Goldstein,1986).Nousadoptonsce pointdevuedanscette thèse.
Leconceptcentraldelaphonologiearticulatoireestlegeste(gesture).Un
geste, unité d'action, est la coordination d'un certain nombre d'organes (e.g.
la langue, les lèvres) pour eectuer une constriction du conduit vocal. Une
constriction est une obstruction du passage de l'onde sonore. C'est un
rétré-cissementdutubevocal. Parexemple,lesmotsbateau, paramètre,mètre
commencent tous par une fermeture des lèvres. Un geste est spécié non pas
Fig.2.3 La membrane basilaireréalisela décomposition du signalenses
harmo-niques: elle est d'épaisseur croissante, et là où elle est ne, elle répond mieux aux
hautesfréquences, alorsquelàoù elleest épaisseetlourde,ellerépondplutôtaux
sti-mulationsdebasse fréquence,correspondantmieuxàsespropriétésinertielles.(adapté
de (EscudieretScwartz, 2000)).
àatteindre déniparune relation entre organes.Parexemple, l'ouverturedes
lèvres est une variable de constrictionqui peut être contrôlée grâce au
mou-vementdetrois organes: lalèvre inférieure, lalèvre supérieure et lamâchoire
(chacun étant contrôlé parun ensemble de muscles). Un objectif articulatoire
(une constrictiondénie parune relationentre organes) peut êtreréaliséepar
plusieurscombinaisonsdemouvementsdesorganes.
Les variables de constriction, ou systèmes constricteurs, qui sont utilisées
pour spécier les gestes sont: la positions du larynx, du velum, du corps de
la langue,de l'extrémité de lalangue,des lèvres. Chacunede sesvariables de
constriction peut être contrôléeparle déplacement de plusieursorganeset de
beaucoup demusclesqui lesactivent. Lagure2.4schématiseles variablesde
Fig.2.4 Lesvariables deconstrictionsontutiliséespourspécier lesgestes.
Cha-cunedesesvariablespeut êtrecontrôléeparledéplacement deplusieursorganesetde
beaucoup demusclesquiles activent.(adapté de(Goldstein,2003b)).
Chaqueconstricteurpeutproduiredes gestesdontlaconstrictionvarie
se-londeuxdimensionscontinues:lelieuetlamanière.Parmileslieux,c'est-à-dire
l'endroitdu conduit vocal où estréalisé le rétrécissement,on peutciter:
bila-bial,dental,alvéolaire,palatal,vélaire,uvulaireouencorepharyngal.Lagure
2.5 donne d'autresexemples. Parmiles manières deréaliser le rétrécissement,
il existelesstops(e.g. [d]),lesfricatives(e.g. [z])ouencorelesapproximants
(e.g.[r]).Onditdesgestesqu'ilssontconsonantiquess'ilsprovoquentun
rétré-cissement étroitoutotal, et qu'ilssont vocaliques, c'est-à-direquece sontdes
voyelles,s'ilsprovoquentunrétrécissementpluslarge.
Fig. 2.5 Les lieux de constriction vont du larynx jusqu'aux lèvres. (adapté de
(Escusdier etScwartz,2000)).
Nosvocalisationssontainsilacombinaisonparallèleet temporelledeplusieurs
gestes.Cettecombinaisonpeutêtrereprésentéegrâceàune partitiongestuelle
(gesturalscore),àl'imagedespartitionsmusicales.Lesgestesdescinqsystèmes
constricteurs(velum,extrémitédelalangue,corps delalangue,lèvres, glotte)
sontreprésentéssurcinqlignesdiérentes.Lesboîtesreprésententlesintervalles
de temps durantlesquels les gestesde chaque constricteursontactifs dans le
conduit vocal. Les étiquettes sur les boîtes indiquent le lieu et la manière de
constriction.Lagure2.6donneunexempledepartition gestuelle.
Certainsphonologistesutilisentleconceptdephonèmepourdécrirelessons
dans les mots. Ils supposent que l'on peut segmenter les mots en séquences
d'unités, appelées segmentsphonologiques (maisceux-ci ne correspondentpas
forcément aux lettres du mot quand on l'écrit). Ces unités sont caractérisées
parlefaitqu'ellespermettentdediérencierdeuxmotscommebaretpar.Il
Fig. 2.6 Un exemple de partition gestuelle: le mot pan en anglais.(adapté de
(Goldstein,2003b)).
unphonème peutêtre vucomme unensemblede gestes(souvent unseul)qui
revient de manière systématique dans de nombreux mots avec un schéma de
coordinationrégulier.Lagure2.7donnel'exempledelacorrespondanceentre
lapartitiongestuelledumotpanenanglaisetdesatranscriptionenphonèmes.
Lathéoriedelaphonologiearticulatoireproposequelesgestesainsiqueleur
coordinationsontreprésentésdanslecerveauàlafoispourcontrôlerla
produc-tion maisaussi pour percevoirles sons.Toutd'abord,quand nousproduisons
delaparole,cesontlesgestesquisontspéciés. Descommandessontenvoyées
auxorganesanque ceuxciréalisentlesconstrictionscorrespondantes.Ainsi,
laproductiondelaparoles'organiseendeuxniveaux:leniveaudescommandes
qui dénissent lapartition gestuelle, et leniveau dela réalisation.Le premier
niveau estintrinsèquementdiscret(maispasforcémentdigitalcommenous
al-lons bientôt le voir). Le second niveau est intrinsèquement continu, puisqu'il
Fig.2.7 Lacorrespondanceentreladescriptiondumotpanentermesdepartition
gestuelleetentermesdephonèmes.(adapté de(Goldstein,2003b)).
à ellereliée de manièredéterministemais complexe àcette trajectoire.En
ef-fet,laphysiqueduconduitvocalfaitquedenombreusescongurationsvocales
produisentlemêmeson,ouencorecertainescongurationsprochesdupointde
vuearticulatoiresonttrèsdiérentesdupointdevueacoustique.Lespropriétés
électro-mécaniquesdelacochléecompliquentencorelaformedelafonctionqui
faitcorrespondreuneperceptionàunprogrammemoteur.
Enfait,lesgestessontlesreprésentationsdelaparolequipermettentderelier
la perception et la production. En eet, selon la théorie motrice de la parole
(Liberman et Mattingly, 1985), le cerveau des locuteurs d'une langue, pour
percevoirunson,reconstruitlescongurationsdeconstrictionsquiontproduit
ceson.Ainsi,lecerveauseraitcapabledetranscrirelesreprésentationsauditives
fournies par lacochléeen représentationsgestuelles; il serait aussicapable de
transcrire les représentations gestuelles en représentations musculaires (pour
Fig.2.8 Lecerveau manipuletroisreprésentationsdanslaperceptionetla
produc-tionde laparole: lareprésentation acoustique, lareprésentation musculaire etla
re-présentationgestuelle,quiestcellequiestutiliséepourcatégoriserlessons.Lecerveau
est capable de passer d'une représentation àl'autre selon la théorie de laphonologie
articulatoire.(adapté de (Goldstein,2003b)).
organisation.
2.3 L'organisation du code de la parole:
univer-saux
La comparaisondes partitions gestuelles qui forment les mots montre des
régularités frappantes à la fois à l'intérieur d'une même langue et entre les
langues.
2.3.1 Le code de la parole est digital et compositionnel
Les vocalisationscomplexes quenous produisons sontcodées
phonémique-tèmes d'écriture,toutesleslangues humainesontunrépertoirede gesteset de
combinaisons degestes, les phonèmes, qui est petit par rapport au répertoire
de syllabes et dont les éléments sontsystématiquement ré-utilisés pour
fabri-quer ces syllabes.Dans les langues de labase de données
U P SID 451
(UCLAPhonologicalSegmentInventoryDatabase)élaboréeinitialementparMaddieson
(Maddieson, 1984),et quicontient451langues,lamoyenneest d'unetrentaine
de segmentsphonologiquesparlangue.Plus précisément,22consonneset cinq
voyellessontles tailles les plus fréquentes, comme le montrent les gures 2.9
et 2.10.Ornouspouvonsproduire unnombreconsidérablede phonèmes: tout
d'abord, les gestes peuvent faire varier l'emplacement de leur constriction de
manièrecontinuedepuislelarynxjusqu'auxlèvres;ilspeuventaussifairevarier
continûmentlamanière(c'est-à-direlaformeetledegréderétrécissement).
En-suite, commelesphonèmes sontdescombinaisonsde gestes,ilest évidentque
les possibilités combinatoiressontimmenses.D'ailleurs, il est des exemplesde
langues comme le!xu (famille khoisan) qui utilisent 141 phonèmes! (mais ces
langues sont très rares).Les phonèmes de la base de données UPSID sontau
totalaunombrede920.
Ce phénomène de ré-utilisation systématiquene s'arrête paslà. Les gestes
Fig. 2.9 Distribution des tailles des répertoires de voyelles dans les langues de
UPSID.(adapté de(EscudieretSchwartz, 2000)).
d'expliquerquelelieuetlaplacedeconstrictionquispécientungestepeuvent
variercontinûment.Ordansunelangue donnée,parmi touslesgestes,seulun
petit nombre de lieux et de manièresapparaît et est ré-utilisé(en variant les
combinaisonsbiensûr)pourlesformer.Lesgestespourraientpourtantavoirun
lieud'articulationquiestparticulieràchacun,toutenétantré-utilisésdansde
nombreusessyllabes,maiscen'estpaslecas.Parexemple,pourchaquemanière
d'articulation,95pourcentdeslanguesn'utilisentque3lieux.Leslanguesde6,
7ou8lieux necorrespondentqu'à15pourcentdeslangues.Plusdeprécisions
sontdonnéessurlagure2.11.
Ainsi,dansl'espacecontinudesgestespossibles,laparolesculptedesbriques
de basequ'elle ré-utilisedemanièresystématique. Elle digitalisele continuum
gestueletphonémique.Laparole,déjàdiscrètedupointdevuedesonmodede
contrôlequiimpliquedescommandespourspécierdesobjectifsarticulatoires,
estenplusdigitale(c'est-à-direquelesobjectifsarticulatoirespossiblesdansune
langue sontennombreniet petit, alorsquephysiquementilspourraientêtre
Fig.2.10 Distributiondestaillesdesrépertoiresdeconsonnesdansleslanguesde
UPSID.(adaptéde (EscudieretSchwartz, 2000)).
aspectssontremarquables,lepremierétantladiscrétisationdel'espacecontinu
desgestes,lesecond étantledoubleniveauderé-utilisationsystématique:
leslieuxet manièressontré-utiliséspourformerlesgestes,
lesgestesetleurscombinaisonssontré-utiliséspourformerlessyllabes.
2.3.2 Lecodedelaparoleestunsystèmede catégorisation
partagé par tous les membres d'une communauté
linguistique
Uneautre propriété dela paroleest lasuivante: d'unpoint de vue
phéno-ménal,tousleslocuteursd'unemêmelangueperçoiventetcatégorisentlessons
delamêmemanière.Cettepropriétéestremarquablecarchaquelangue dière
surce point.
Toutd'abord,laperceptiondelaparoleestmarquée parune unité
psycho-logique malgré sa grande variabilité. Diérents sons physiques associés à des
Fig. 2.11 Distribution des nombres de lieux et desmanières d'articulation dans
les languesd'UPSID: onvoit parexemple qu'alors quel'espace deslieuxpossibleest
trèsgrand,chaquelangue n'enutilisequetrèspeu,etdonclesré-utilise
systématique-ment(carlenombrede phonèmes estplusgrand quece nombre delieux).(adapté de
(EscudieretScwartz,2000)).
pondreaumêmesonpsychologique,commele[d]dansidi,adaouudu.Les
sonssontdiérentscarlesgestesquispécientle[d]sesuperposentauxgestes
qui spécientles [i], [a] et [u]: lesbuts articulatoires entrent temporairement
en compétition et les organes doivent faire un compromis pour les satisfaire
au mieux.Le résultat est que les spécications des gestesne sont pas
exacte-mentremplies,mais sontmodiées.C'est lephénomènedeco-articulation,qui
expliquelavariabilitésonoreetmotricedessons.Laco-articulationestun
phé-parole. Cependant, même si le niveau des commandes est invariant, le niveau
de leurréalisationcomportedesvariabilitésqui sontgérées demanièreprécise
et particulièreàchaquelangue.Dansunelanguedonnée,tousleslocuteurs
dé-cidentdelamême manièrequelssontlessonsqui sontdesvariantes dumême
phonèmeetquelssontceuxquisontdesvariantesdephonèmesdiérents.Cette
organisationdel'espacedessonsestculturellementspéciqueàchaquelangue.
Parexemple, les Japonais identient le [r] de read et le[l] de lead comme
étant desallophones,c'est-à-direqu'ils catégorisentces deuxsons dela même
manière,alorsquelesAnglaisontdeuxcatégoriesdistinctes.
Nonseulementles locuteursd'une mêmelangue partagentune manièrede
catégoriserlessonsquileurestspécique,maisilspartagentunemanièredeles
percevoir,dupoint de vuede la sensation,qui est diérente.Ceci est révélé
par l'eet perceptuel magnétique (Kuhl et al., 1992). Quand on demande à
dessujetsd'évaluerlasimilaritédedeuxphonèmes(suruneéchellede1à10),
etquecesphonèmesontunedistancedonnéeDdansunespacedemesures
phy-siques(e.g.lespectred'amplitudes),ons'aperçoitquequandlesdeuxphonèmes
appartiennentàlamêmecatégorie,alorslasimilaritédonnéeparlessujets est
inférieure à celle qu'ilsévaluentpour deux phonèmes qui n'appartiennentpas
Fig. 2.12 (Kuhl et al., 1992) a demandé à des sujets d'évaluer entre 1 et 10 la
similaritéde couples deconsonnesqu'elleleurfaisaitentendre,etquiétaientdes
va-riationscontinuesentrele/r/etle/l/(lesconsonnesétaientsuiviesdelavoyelle/a/),
etdontlesvaleurssontreprésentéesparlesrondsurlagureduhaut.Ungroupeétait
composé de sujet américain, l'autre de sujets japonais. Ilest possible de déduire des
résultatsunereprésentationgraphiquequireprésentelamanièresubjectivedontil
per-çoivent chaque voyelle.Cette carte deleur perception subjectiveest représentée en B
pour les américainset enC pour les japonais. On voitque les américainsperçoivent
subjectivementdeuxcatégoriessonoresdans ce continuum,alorsqueles japonaisn'en
perçoiventqu'une.Deplus,auxalentours,de/r/etde/l/pourlesaméricains,lessons
sontsubjectivementencoreplussimilairesqu'ils nelesontles unsdesautresmesurés
dansun espace physique.(adapté de(Kuhletal.,1992)).
mesurephysique. Pourrésumer,les diérencesperceptuelles intra-catégorielles
sontdiminuées,etlesdiérencesinter-catégoriellessontaugmentées.C'estune
sortededéformation perceptuelle, ouencored'illusionacoustique(perceptual
warping),danslaquellelescentresdescatégoriesattirentperceptuellementles
élémentsdelacatégoriecommedesaimants.Ceteetestencoreunefois
cultu-rellementspécique:lesdéformationsperceptuellessontparticulièresàchaque
Fig.2.13 Distributiondesconsonnesdans leslanguesdeUPSID.(adapté de
(Es-cudier etSchwartz,2000)).
2.3.3 Les régularités statistiques des répertoires de
pho-nèmes dans les langues humaines
Toutd'abord,l'étude statistiquedes langues montre des tendances
univer-selles qui caractérisent les répertoires de phonèmes et de gestes qui les
com-posent.Certainsphonèmessonttrèsfréquents,alorsqued'autressonttrèsrares:
87pourcentdeslanguesd'UPSIDcontiennentlesvoyelles[a],[i]et[u],alorsque
seulement5pourcentcontiennent[y],[oe]et[ui].Plusde90pourcentdeslangues
ont[t],[m]et [n]dansleurrépertoire,commelemontre letableaudelagure
2.13.Ilenestdemêmepourlesgestes,etenparticulierleslieuxetlesmanières
d'articulation:15pourcentdeslanguespossèdentlelieualvéodentaletbilabial,
alors que moins de 3 pourcentpossèdent leslieux rétroexeset uvulaires. De
même, 38 pourcentdes langues possèdentdes plosives,alors que 3.9pourcent
ontdesvibrantes.
Lesrégularitésnes'appliquentpasseulementauxphonèmespris
individuelle-ment,maisaussiàlastructuredesrépertoires.Celaveutdirequeparexemple,si
unsystèmecontientunevoyellepériphériquenon-labialiséed'unecertaine
hau-labialiséedelamêmehauteur,commele[aw]dehawkenanglais.Laprésence
de certainsphonèmes est donc corrélée àlaprésence d'autresphonèmes.
Cer-tainssystèmesdevoyellessontaussitrèsfréquents,alorsqued'autresplusrares.
Lesystèmede5voyelles/[i],[e],[a],[o],[u]/estceluide28pourcentdeslangues
commel'indiquelagure2.3.3.
Ily aaussidesrégularitésquirégissentlamanièredontlesphonèmes sont
combinés.Dansunelanguedonnée,touteslesséquencesdephonèmesdu
réper-toirenesontpasautorisées.Les locuteursontcetteconnaissance,et sion leur
demanded'inventerunmotnouveau,ilseracomposédeséquencesdephonèmes
non arbitraires(certainesne serontjamaisutilisées).Parexemple,en Anglais,
spink est unmotpossible,alors que npink ou ptink sontimpossibles. Là
encore, les règles qui régissent l'ordonnancement possible des phonèmes, qui
s'appellent laphonotactique, sont culturelleset particulières àchaquelangue.
EnBerbère,lesmotsprononcés[tgzmt]et[tkSmt]sontautorisés,alorsqu'ilsne
lesontpasenfrançais.Demanièregénérale,sionprend commecadrede
réfé-rencelasyllabe,quicomporteuncertainnombredeplaces,lesphonèmesd'une
langue ne peuvent apparaîtrequ'à certains endroits précis.Il y ades langues
commeleJaponaisoùlessyllabesnepeuventcomporterquedeuxphonèmes;les
consonnesnepeuventalorsapparaîtrequ'enpremièrepositionetlesvoyellesen
deuxièmeposition(onnotecessyllabesCV).Cesontparfoisaussilesgroupes,
ouclusters,dephonèmesquinepeuventprendrequecertainesplaces.
En outre, il y a des combinaisons de phonèmes qui sont statistiquement
préféréesauxautresdansleslangues dumonde. Toutesleslanguespermettent
d'utiliser des syllabes de types CV, alors que beaucoup n'autorisent pas de
clustersdeconsonnesendébutdesyllabes.Leslanguespréfèrentstatistiquement
lessyllabesde typeCV,puiscelles detypeCVC,puiscellesde typeCC,puis