• Aucun résultat trouvé

Les instruments de la parole

Dans le document a  gaiai de (Page 26-0)

et l'oreille

Nousdisposonspourparlerd'uninstrumentdemusiquecomplexe:leconduit

vocal.Celui-cis'organiseendeuxsous-systèmes(voirgure2.1):l'ungénèreune

ondesonore,lesecondlasculpte.Lepremiersystèmeestsub-glottal:l'ensemble

poumons/diaphragmepermet defairesouer del'airdans latrachée,qui fait

vibrerlelarynx.Lelarynxestunassemblagedecartilagesetdemuscles,quien

vibrantgénèreuneondesonore.Le songénéréestalors constituéd'une

multi-tudedefréquences.Lesecondsystème,supra-laryngeal,estuntubequis'étend

dularynxjusqu'auboutdeslèvresetdunez,oùilsediviseendeux.Lesorganes

de laglotte, levelum, lalangue (corps et extrémité),et leslèvres permettent

de modier la forme dece tube, en particulier sa longueur et son volume. Ce

changement de forme a pour conséquence d'atténuer ou d'amplier certaines

fréquencesdusignalsonore.Ainsi,laproductiondusonparleconduitvocalest

similaireàlaproductiond'unsonavecuneûte:onsoueàuneextrémité,ce

qui en passantdans le siet, produit unson composé de multitudes de

fré-quences,etquel'onmodieenbouchantlestroussurledessusdel'instrument,

cequimodiesaforme.Ainsi,parlerrevientàfairebougerlesdiérentsorganes

duconduitvocal.

Pour percevoir les sons,nous disposons de l'oreille, et en particulier de la

cochlée(gure2.2).Lacochléeestl'appareilquinouspermetdefaireuncertain

nombre demesures sur le son. Parmi ces mesures, il ya ladécomposition du

son en fréquences, ou harmoniques. En eet, chaque son complexe peut être

Fig.2.1 Leconduitvocalestorganiséendeuxsous-systèmes:lesystèmesub-glottal

quiproduitunesource sonore,etlesystèmesupra-laryngeal,dont laformemodiable

permetdesculpter cetteondesonore.(adapté de(Goldstein,2003b)).

et une amplitudedonnée.C'est ce qu'onappelleladécomposition enséries de

Fourieren mathématiques. La cochlée réalise une approximationde cette

dé-compositiongrâceàlamembranebasilaire.Celle-ciestd'épaisseurcroissante,et

làoùelleestne, ellerépondmieuxauxhautesfréquences,alorsquelàoùelle

estépaisseetlourde,ellerépondplutôtauxstimulationsdebassefréquence,

cor-respondantmieuxàsespropriétésinertielles(gure2.3).Descellulesnerveuses,

lescellulesciliées,sontreliéesàcettemembranepourrecueillirl'informationde

stimulation.Cetteinformationremontealorsparunsystèmedebresjusqu'au

Fig. 2.2 La cochlée, organe de perception de la parole. Sa membrane basilaire

permet defaireunedécompositiondusonen sériedeFourier,c'est-à-dire decalculer

l'amplitudede sesharmoniques.(adapté de (EscudieretSchwartz, 2000)).

2.2 Comment notrecerveau joue des instruments

de la parole: le point de vue de la phonologie

articulatoire

Dequellemanièrelesorganesduconduitvocalcontrôlent-ilsleuxsonore?

Quellessontlesreprésentationsquenotrecerveauutilisepourproduireunson?

Comment le lien entre la production et la perception est-il géré? C'est àces

question que la théorie de la phonologie articulatoire répond (Browman and

Goldstein,1986).Nousadoptonsce pointdevuedanscette thèse.

Leconceptcentraldelaphonologiearticulatoireestlegeste(gesture).Un

geste, unité d'action, est la coordination d'un certain nombre d'organes (e.g.

la langue, les lèvres) pour eectuer une constriction du conduit vocal. Une

constriction est une obstruction du passage de l'onde sonore. C'est un

rétré-cissementdutubevocal. Parexemple,lesmotsbateau, paramètre,mètre

commencent tous par une fermeture des lèvres. Un geste est spécié non pas

Fig.2.3 La membrane basilaireréalisela décomposition du signalenses

harmo-niques: elle est d'épaisseur croissante, et là où elle est ne, elle répond mieux aux

hautesfréquences, alorsquelàoù elleest épaisseetlourde,ellerépondplutôtaux

sti-mulationsdebasse fréquence,correspondantmieuxàsespropriétésinertielles.(adapté

de (EscudieretScwartz, 2000)).

àatteindre déniparune relation entre organes.Parexemple, l'ouverturedes

lèvres est une variable de constrictionqui peut être contrôlée grâce au

mou-vementdetrois organes: lalèvre inférieure, lalèvre supérieure et lamâchoire

(chacun étant contrôlé parun ensemble de muscles). Un objectif articulatoire

(une constrictiondénie parune relationentre organes) peut êtreréaliséepar

plusieurscombinaisonsdemouvementsdesorganes.

Les variables de constriction, ou systèmes constricteurs, qui sont utilisées

pour spécier les gestes sont: la positions du larynx, du velum, du corps de

la langue,de l'extrémité de lalangue,des lèvres. Chacunede sesvariables de

constriction peut être contrôléeparle déplacement de plusieursorganeset de

beaucoup demusclesqui lesactivent. Lagure2.4schématiseles variablesde

Fig.2.4 Lesvariables deconstrictionsontutiliséespourspécier lesgestes.

Cha-cunedesesvariablespeut êtrecontrôléeparledéplacement deplusieursorganesetde

beaucoup demusclesquiles activent.(adapté de(Goldstein,2003b)).

Chaqueconstricteurpeutproduiredes gestesdontlaconstrictionvarie

se-londeuxdimensionscontinues:lelieuetlamanière.Parmileslieux,c'est-à-dire

l'endroitdu conduit vocal où estréalisé le rétrécissement,on peutciter:

bila-bial,dental,alvéolaire,palatal,vélaire,uvulaireouencorepharyngal.Lagure

2.5 donne d'autresexemples. Parmiles manières deréaliser le rétrécissement,

il existelesstops(e.g. [d]),lesfricatives(e.g. [z])ouencorelesapproximants

(e.g.[r]).Onditdesgestesqu'ilssontconsonantiquess'ilsprovoquentun

rétré-cissement étroitoutotal, et qu'ilssont vocaliques, c'est-à-direquece sontdes

voyelles,s'ilsprovoquentunrétrécissementpluslarge.

Fig. 2.5 Les lieux de constriction vont du larynx jusqu'aux lèvres. (adapté de

(Escusdier etScwartz,2000)).

Nosvocalisationssontainsilacombinaisonparallèleet temporelledeplusieurs

gestes.Cettecombinaisonpeutêtrereprésentéegrâceàune partitiongestuelle

(gesturalscore),àl'imagedespartitionsmusicales.Lesgestesdescinqsystèmes

constricteurs(velum,extrémitédelalangue,corps delalangue,lèvres, glotte)

sontreprésentéssurcinqlignesdiérentes.Lesboîtesreprésententlesintervalles

de temps durantlesquels les gestesde chaque constricteursontactifs dans le

conduit vocal. Les étiquettes sur les boîtes indiquent le lieu et la manière de

constriction.Lagure2.6donneunexempledepartition gestuelle.

Certainsphonologistesutilisentleconceptdephonèmepourdécrirelessons

dans les mots. Ils supposent que l'on peut segmenter les mots en séquences

d'unités, appelées segmentsphonologiques (maisceux-ci ne correspondentpas

forcément aux lettres du mot quand on l'écrit). Ces unités sont caractérisées

parlefaitqu'ellespermettentdediérencierdeuxmotscommebaretpar.Il

Fig. 2.6 Un exemple de partition gestuelle: le mot pan en anglais.(adapté de

(Goldstein,2003b)).

unphonème peutêtre vucomme unensemblede gestes(souvent unseul)qui

revient de manière systématique dans de nombreux mots avec un schéma de

coordinationrégulier.Lagure2.7donnel'exempledelacorrespondanceentre

lapartitiongestuelledumotpanenanglaisetdesatranscriptionenphonèmes.

Lathéoriedelaphonologiearticulatoireproposequelesgestesainsiqueleur

coordinationsontreprésentésdanslecerveauàlafoispourcontrôlerla

produc-tion maisaussi pour percevoirles sons.Toutd'abord,quand nousproduisons

delaparole,cesontlesgestesquisontspéciés. Descommandessontenvoyées

auxorganesanque ceuxciréalisentlesconstrictionscorrespondantes.Ainsi,

laproductiondelaparoles'organiseendeuxniveaux:leniveaudescommandes

qui dénissent lapartition gestuelle, et leniveau dela réalisation.Le premier

niveau estintrinsèquementdiscret(maispasforcémentdigitalcommenous

al-lons bientôt le voir). Le second niveau est intrinsèquement continu, puisqu'il

Fig.2.7 Lacorrespondanceentreladescriptiondumotpanentermesdepartition

gestuelleetentermesdephonèmes.(adapté de(Goldstein,2003b)).

à ellereliée de manièredéterministemais complexe àcette trajectoire.En

ef-fet,laphysiqueduconduitvocalfaitquedenombreusescongurationsvocales

produisentlemêmeson,ouencorecertainescongurationsprochesdupointde

vuearticulatoiresonttrèsdiérentesdupointdevueacoustique.Lespropriétés

électro-mécaniquesdelacochléecompliquentencorelaformedelafonctionqui

faitcorrespondreuneperceptionàunprogrammemoteur.

Enfait,lesgestessontlesreprésentationsdelaparolequipermettentderelier

la perception et la production. En eet, selon la théorie motrice de la parole

(Liberman et Mattingly, 1985), le cerveau des locuteurs d'une langue, pour

percevoirunson,reconstruitlescongurationsdeconstrictionsquiontproduit

ceson.Ainsi,lecerveauseraitcapabledetranscrirelesreprésentationsauditives

fournies par lacochléeen représentationsgestuelles; il serait aussicapable de

transcrire les représentations gestuelles en représentations musculaires (pour

Fig.2.8 Lecerveau manipuletroisreprésentationsdanslaperceptionetla

produc-tionde laparole: lareprésentation acoustique, lareprésentation musculaire etla

re-présentationgestuelle,quiestcellequiestutiliséepourcatégoriserlessons.Lecerveau

est capable de passer d'une représentation àl'autre selon la théorie de laphonologie

articulatoire.(adapté de (Goldstein,2003b)).

organisation.

2.3 L'organisation du code de la parole:

univer-saux

La comparaisondes partitions gestuelles qui forment les mots montre des

régularités frappantes à la fois à l'intérieur d'une même langue et entre les

langues.

2.3.1 Le code de la parole est digital et compositionnel

Les vocalisationscomplexes quenous produisons sontcodées

phonémique-tèmes d'écriture,toutesleslangues humainesontunrépertoirede gesteset de

combinaisons degestes, les phonèmes, qui est petit par rapport au répertoire

de syllabes et dont les éléments sontsystématiquement ré-utilisés pour

fabri-quer ces syllabes.Dans les langues de labase de données

U P SID 451

(UCLA

PhonologicalSegmentInventoryDatabase)élaboréeinitialementparMaddieson

(Maddieson, 1984),et quicontient451langues,lamoyenneest d'unetrentaine

de segmentsphonologiquesparlangue.Plus précisément,22consonneset cinq

voyellessontles tailles les plus fréquentes, comme le montrent les gures 2.9

et 2.10.Ornouspouvonsproduire unnombreconsidérablede phonèmes: tout

d'abord, les gestes peuvent faire varier l'emplacement de leur constriction de

manièrecontinuedepuislelarynxjusqu'auxlèvres;ilspeuventaussifairevarier

continûmentlamanière(c'est-à-direlaformeetledegréderétrécissement).

En-suite, commelesphonèmes sontdescombinaisonsde gestes,ilest évidentque

les possibilités combinatoiressontimmenses.D'ailleurs, il est des exemplesde

langues comme le!xu (famille khoisan) qui utilisent 141 phonèmes! (mais ces

langues sont très rares).Les phonèmes de la base de données UPSID sontau

totalaunombrede920.

Ce phénomène de ré-utilisation systématiquene s'arrête paslà. Les gestes

Fig. 2.9 Distribution des tailles des répertoires de voyelles dans les langues de

UPSID.(adapté de(EscudieretSchwartz, 2000)).

d'expliquerquelelieuetlaplacedeconstrictionquispécientungestepeuvent

variercontinûment.Ordansunelangue donnée,parmi touslesgestes,seulun

petit nombre de lieux et de manièresapparaît et est ré-utilisé(en variant les

combinaisonsbiensûr)pourlesformer.Lesgestespourraientpourtantavoirun

lieud'articulationquiestparticulieràchacun,toutenétantré-utilisésdansde

nombreusessyllabes,maiscen'estpaslecas.Parexemple,pourchaquemanière

d'articulation,95pourcentdeslanguesn'utilisentque3lieux.Leslanguesde6,

7ou8lieux necorrespondentqu'à15pourcentdeslangues.Plusdeprécisions

sontdonnéessurlagure2.11.

Ainsi,dansl'espacecontinudesgestespossibles,laparolesculptedesbriques

de basequ'elle ré-utilisedemanièresystématique. Elle digitalisele continuum

gestueletphonémique.Laparole,déjàdiscrètedupointdevuedesonmodede

contrôlequiimpliquedescommandespourspécierdesobjectifsarticulatoires,

estenplusdigitale(c'est-à-direquelesobjectifsarticulatoirespossiblesdansune

langue sontennombreniet petit, alorsquephysiquementilspourraientêtre

Fig.2.10 Distributiondestaillesdesrépertoiresdeconsonnesdansleslanguesde

UPSID.(adaptéde (EscudieretSchwartz, 2000)).

aspectssontremarquables,lepremierétantladiscrétisationdel'espacecontinu

desgestes,lesecond étantledoubleniveauderé-utilisationsystématique:

leslieuxet manièressontré-utiliséspourformerlesgestes,

lesgestesetleurscombinaisonssontré-utiliséspourformerlessyllabes.

2.3.2 Lecodedelaparoleestunsystèmede catégorisation

partagé par tous les membres d'une communauté

linguistique

Uneautre propriété dela paroleest lasuivante: d'unpoint de vue

phéno-ménal,tousleslocuteursd'unemêmelangueperçoiventetcatégorisentlessons

delamêmemanière.Cettepropriétéestremarquablecarchaquelangue dière

surce point.

Toutd'abord,laperceptiondelaparoleestmarquée parune unité

psycho-logique malgré sa grande variabilité. Diérents sons physiques associés à des

Fig. 2.11 Distribution des nombres de lieux et desmanières d'articulation dans

les languesd'UPSID: onvoit parexemple qu'alors quel'espace deslieuxpossibleest

trèsgrand,chaquelangue n'enutilisequetrèspeu,etdonclesré-utilise

systématique-ment(carlenombrede phonèmes estplusgrand quece nombre delieux).(adapté de

(EscudieretScwartz,2000)).

pondreaumêmesonpsychologique,commele[d]dansidi,adaouudu.Les

sonssontdiérentscarlesgestesquispécientle[d]sesuperposentauxgestes

qui spécientles [i], [a] et [u]: lesbuts articulatoires entrent temporairement

en compétition et les organes doivent faire un compromis pour les satisfaire

au mieux.Le résultat est que les spécications des gestesne sont pas

exacte-mentremplies,mais sontmodiées.C'est lephénomènedeco-articulation,qui

expliquelavariabilitésonoreetmotricedessons.Laco-articulationestun

phé-parole. Cependant, même si le niveau des commandes est invariant, le niveau

de leurréalisationcomportedesvariabilitésqui sontgérées demanièreprécise

et particulièreàchaquelangue.Dansunelanguedonnée,tousleslocuteurs

dé-cidentdelamême manièrequelssontlessonsqui sontdesvariantes dumême

phonèmeetquelssontceuxquisontdesvariantesdephonèmesdiérents.Cette

organisationdel'espacedessonsestculturellementspéciqueàchaquelangue.

Parexemple, les Japonais identient le [r] de read et le[l] de lead comme

étant desallophones,c'est-à-direqu'ils catégorisentces deuxsons dela même

manière,alorsquelesAnglaisontdeuxcatégoriesdistinctes.

Nonseulementles locuteursd'une mêmelangue partagentune manièrede

catégoriserlessonsquileurestspécique,maisilspartagentunemanièredeles

percevoir,dupoint de vuede la sensation,qui est diérente.Ceci est révélé

par l'eet perceptuel magnétique (Kuhl et al., 1992). Quand on demande à

dessujetsd'évaluerlasimilaritédedeuxphonèmes(suruneéchellede1à10),

etquecesphonèmesontunedistancedonnéeDdansunespacedemesures

phy-siques(e.g.lespectred'amplitudes),ons'aperçoitquequandlesdeuxphonèmes

appartiennentàlamêmecatégorie,alorslasimilaritédonnéeparlessujets est

inférieure à celle qu'ilsévaluentpour deux phonèmes qui n'appartiennentpas

Fig. 2.12 (Kuhl et al., 1992) a demandé à des sujets d'évaluer entre 1 et 10 la

similaritéde couples deconsonnesqu'elleleurfaisaitentendre,etquiétaientdes

va-riationscontinuesentrele/r/etle/l/(lesconsonnesétaientsuiviesdelavoyelle/a/),

etdontlesvaleurssontreprésentéesparlesrondsurlagureduhaut.Ungroupeétait

composé de sujet américain, l'autre de sujets japonais. Ilest possible de déduire des

résultatsunereprésentationgraphiquequireprésentelamanièresubjectivedontil

per-çoivent chaque voyelle.Cette carte deleur perception subjectiveest représentée en B

pour les américainset enC pour les japonais. On voitque les américainsperçoivent

subjectivementdeuxcatégoriessonoresdans ce continuum,alorsqueles japonaisn'en

perçoiventqu'une.Deplus,auxalentours,de/r/etde/l/pourlesaméricains,lessons

sontsubjectivementencoreplussimilairesqu'ils nelesontles unsdesautresmesurés

dansun espace physique.(adapté de(Kuhletal.,1992)).

mesurephysique. Pourrésumer,les diérencesperceptuelles intra-catégorielles

sontdiminuées,etlesdiérencesinter-catégoriellessontaugmentées.C'estune

sortededéformation perceptuelle, ouencored'illusionacoustique(perceptual

warping),danslaquellelescentresdescatégoriesattirentperceptuellementles

élémentsdelacatégoriecommedesaimants.Ceteetestencoreunefois

cultu-rellementspécique:lesdéformationsperceptuellessontparticulièresàchaque

Fig.2.13 Distributiondesconsonnesdans leslanguesdeUPSID.(adapté de

(Es-cudier etSchwartz,2000)).

2.3.3 Les régularités statistiques des répertoires de

pho-nèmes dans les langues humaines

Toutd'abord,l'étude statistiquedes langues montre des tendances

univer-selles qui caractérisent les répertoires de phonèmes et de gestes qui les

com-posent.Certainsphonèmessonttrèsfréquents,alorsqued'autressonttrèsrares:

87pourcentdeslanguesd'UPSIDcontiennentlesvoyelles[a],[i]et[u],alorsque

seulement5pourcentcontiennent[y],[oe]et[ui].Plusde90pourcentdeslangues

ont[t],[m]et [n]dansleurrépertoire,commelemontre letableaudelagure

2.13.Ilenestdemêmepourlesgestes,etenparticulierleslieuxetlesmanières

d'articulation:15pourcentdeslanguespossèdentlelieualvéodentaletbilabial,

alors que moins de 3 pourcentpossèdent leslieux rétroexeset uvulaires. De

même, 38 pourcentdes langues possèdentdes plosives,alors que 3.9pourcent

ontdesvibrantes.

Lesrégularitésnes'appliquentpasseulementauxphonèmespris

individuelle-ment,maisaussiàlastructuredesrépertoires.Celaveutdirequeparexemple,si

unsystèmecontientunevoyellepériphériquenon-labialiséed'unecertaine

hau-labialiséedelamêmehauteur,commele[aw]dehawkenanglais.Laprésence

de certainsphonèmes est donc corrélée àlaprésence d'autresphonèmes.

Cer-tainssystèmesdevoyellessontaussitrèsfréquents,alorsqued'autresplusrares.

Lesystèmede5voyelles/[i],[e],[a],[o],[u]/estceluide28pourcentdeslangues

commel'indiquelagure2.3.3.

Ily aaussidesrégularitésquirégissentlamanièredontlesphonèmes sont

combinés.Dansunelanguedonnée,touteslesséquencesdephonèmesdu

réper-toirenesontpasautorisées.Les locuteursontcetteconnaissance,et sion leur

demanded'inventerunmotnouveau,ilseracomposédeséquencesdephonèmes

non arbitraires(certainesne serontjamaisutilisées).Parexemple,en Anglais,

spink est unmotpossible,alors que npink ou ptink sontimpossibles. Là

encore, les règles qui régissent l'ordonnancement possible des phonèmes, qui

s'appellent laphonotactique, sont culturelleset particulières àchaquelangue.

EnBerbère,lesmotsprononcés[tgzmt]et[tkSmt]sontautorisés,alorsqu'ilsne

lesontpasenfrançais.Demanièregénérale,sionprend commecadrede

réfé-rencelasyllabe,quicomporteuncertainnombredeplaces,lesphonèmesd'une

langue ne peuvent apparaîtrequ'à certains endroits précis.Il y ades langues

commeleJaponaisoùlessyllabesnepeuventcomporterquedeuxphonèmes;les

consonnesnepeuventalorsapparaîtrequ'enpremièrepositionetlesvoyellesen

deuxièmeposition(onnotecessyllabesCV).Cesontparfoisaussilesgroupes,

ouclusters,dephonèmesquinepeuventprendrequecertainesplaces.

En outre, il y a des combinaisons de phonèmes qui sont statistiquement

préféréesauxautresdansleslangues dumonde. Toutesleslanguespermettent

d'utiliser des syllabes de types CV, alors que beaucoup n'autorisent pas de

clustersdeconsonnesendébutdesyllabes.Leslanguespréfèrentstatistiquement

lessyllabesde typeCV,puiscelles detypeCVC,puiscellesde typeCC,puis

Dans le document a  gaiai de (Page 26-0)