II. Acoustique de la voix parlee
I 1 Notion de propagation d’un son 2 La longueur d’onde
3 Notion de diffraction 4 Notion de r´everb´eration
II 1 Notion de son complexe et de son pur 2 La corde vibrante
3 Fr´equences propres de la corde vibrante 4 Spectre d’un son harmonique
III 1 R´esonateurs acoustiques
2 Formants et r´esonance : Spectrogramme 3 Spectrogramme de voyelles
4 Spectrogramme de fricatives 5 Spectrogramme d’occlusives
6 Pr´esentation de cas : Voix sous h´elium
I.1 Notion de propagation d’un son
D´efinition : Une onde est une perturbation en mouvement qui transporte de l’´energie mais sans transport de mati`ere
Max
Max
+P
−P
P
acoustique0
λ
• A un instant donn´e, une onde acoustique correspond `a des variations locales de la densit´e (et donc de la pression).
• Ces variations locales de la pression se d´eplacent de proche en proche (effet domino).
• Les mol´ecules d’air ne font que
”vibrer” au voisinage de leurs positions
• La Pression acoustique correspond `a la variation de la pression par rapport `a la pression permanente i.e. la pression atmosph´erique : Pacoustique = P − Patm
• Une des caract´eristiques de l’onde est son amplitude maximum (PM ax).
• La p´eriode spatiale de l’onde de pression est la longueur d’onde λ (unit´e : m`etre)
I.2 Longueur d’onde et p´eriode
Position du probl`eme : Comment relier la p´eriode spatiale (λ) et temporelle (T)?
1 1
0
t
d
propagation d’une impulsion
• A l’instant t = 0 l’impulsion est `a l’origine
• A l’instant t1 l’impulsion s’est d´eplac´ee en d1
• Si l’onde a une c´el´erit´e c (m/s) ⇒ d1 = c.t1 Onde harmonique
• A la date t = T l’onde s’est d´eplac´ee d’une longueur d’onde λ
• La longueur d’onde et la p´eriode sont li´ees par la c´el´erit´e de l’onde dans le milieu
λ = cT
p
t=T t=0
cT ct
sens de propagation
λ
t>0
Bande passante de l’audible
Bande passante de l’oreille :
Fr´equence : 20 Hz ⇐⇒ 20 kHz
P´eriode : 50 µs ⇐⇒ 50 ms
Longueur d’onde : 17 mm ⇐⇒ 17 m
remarque : A 20◦C, c = 340 m/s.
Valeurs remarquables :
• Basse : f < 100 Hz
• Tr`eble : f > 2 kHz
Inaudible :
• Infrason :
F < 20Hz T > 50ms λ > 17m
• Les infrasons sont ressentis sous forme de vibrations.
• Utilis´es par les ´elephants pour communiquer.
• Ultrason :
F > 20kHz T < 50µs
λ < 17mm
• Utilis´es pour l’´echo-location par les chauves-souris.
• La propagation des sons d´epend de la longueur d’onde.
• Les sons sont “d´evi´es” diff´eremment par les objets selon leurs longueurs d’onde.
I.3 Notion de diffraction
Basse :
λ Source
Son direct
Son diffracte
00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 00000 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111 11111
L
λ ≃ L
• Les ondes sonores semblent “accrocher”
(diffracter) sur les objets.
• La diffraction d´epend de λ et des dimensions des objets.
• Elles sont per¸cues mˆeme en pr´esence d’un objet masquant.
Tr`eble :
Source
λ
Son direct
00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 11111111 11111111 11111111 11111111 11111111 11111111 11111111 11111111
λ ≪ L
• Les ondes sonores ne sont pas perturb´ees par les objets.
• Un objet masquant va arr´eter l’onde et emp´echer sa perception.
• On parle de son “d´etimbr´e” quand les hautes fr´equences sont att´enu´ees.
I.4 Notion de r´everb´eration
La r´everb´eration est la persistance d’un son dans un milieu apr`es l’interruption de la source sonore.
• Dans une salle, un son est diffus´e par les parois.
• Un auditeur per¸coit :
Le son direct Le son r´everb´er´e
• Le son r´everb´er´e d´epend : – Du volume de la salle – De l’absorption des parois
• Du fait de la persistance du son, on a un renforcement de l’intensit´e acoustique.
• Il est possible de cr´eer artificiellement un effet de r´everb´eration pour de la musique.
• Une grandeur permettant de le caract´eriser est le temps de r´everb´eration Tr
Formule de Sabine : Tr = 0,16.Vα.S
V : Volume de la pi`ece, S :Surface des parois, α : absorption des parois.
• Pour la voix parl´ee, il est pr´ef´erable d’avoir un Tr petit.
• Pour la musique, un plus grand Tr apporte de l’harmonie (´eglise).
II.1 Notion de son complexe et de son pur
Formes d’ondes:
• Impulsion : Front d’onde unique → onde de choc.
• Paquet d’ondes : Correspond `a un son “complexe”.
C’est la somme d’un grand nombre de sons purs.
Peut ˆetre p´eriodique ou non (cf “si”).
• Onde plane : Correspond `a un son “pur” ou harmonique.
• Train d’ondes : Correspond `a la modulation d’un son pur par un autre.
Notion de son complexe et d’harmoniques :
• Un son complexe quelconque (non p´eriodique) correspond `a la superposition de sons purs ayant des fr´equences sans liens entre elles.
• Un son complexe p´eriodique (par exemple un son voisi´e) ne fait intervenir que des sons purs `a des fr´equences donn´ees (on parle alors d’harmoniques).
• En particulier, les harmoniques des sons vois´es ont des fr´equences multiples d’un son pur de r´ef´erence, le fondamental.
II.2 La corde vibrante
• La corde est fix´ee `a ses deux extr´emit´es sur des supports.
• A l’instant initial, on d´eforme la corde` (Dans un piano, la corde est frapp´ee par un marteau).
• Cette d´eformation (ou ondes) se propage `a droite et `a gauche.
• Ces ondes sont ensuite r´efl´echies par les supports.
• Apr`es un grand nombre de r´eflexions, il apparaˆıt une onde stationnaire sur la corde.
La corde vibre sans d´eplacement apparent.
• Cette phase initiale avant l’apparition de l’onde stationnaire est tr`es courte (quelques ms).
• Le fait que la corde soit fix´ee impose des contraintes sur les caract´eristiques de l’onde.
• Aux extr´emit´es, l’amplitude de l’onde est obligatoirement nulle.
• Sur la corde, on ne peux avoir qu’un nombre entier de “d´eformations”.
• La longeur d’onde de l’onde g´en´er´ee sur la corde ne peux avoir que certaines valeurs li´ees `a la longeur de la corde.
II.3 Fr´equences propres de la corde
Condition sur λ : λ doit ˆetre un sous-multiple de 2 L (L longeur de la corde).
1 2
3=2L3 4
2
=L
=L
2eme harmonique fondamental
3eme harmonique 4eme harmonique
=2L
λ λ λ
λ
• Cons´equences : La corde ne peut vibrer qu’a certaines fr´equences.
• La plus basse fr´equence (f1 = c/2L) est appel´ee le fondamental.
• Les autres fr´equences possibles (ou harmoniques) sont un multiple de f1.
Fondamental λ1 = 2L f1 = c/2L 2eme harmonique λ2 = λ1/2 f2 = 2 × f1 3eme harmonique λ3 = λ1/3 f3 = 3 × f1 4emeharmonique λ4 = λ1/4 f4 = 4 × f1
... ... ...
• f1 d´epend de L et de c.
• c d´epend de la tension de la corde.
• c = p
tension/masse lin´eique
tension (N), masse lin´eique (kg/m)
Cons´equences :
• Si L augmente, f1 diminue.
• Si la tension augmente, c augmente et f1 augmente.
Extension aux sons vois´es
• Les sons vois´es sont constitu´es d’harmoniques (Leurs fr´equences sont multiples du fondamental).
• La p´eriode des harmoniques est un sous multiple de T.
• La fr´equence du fondamental (1ere harmonique) d´efinit la fr´equence de son.
• En effet, l’addition d’harmoniques au fondamental n’alt`ere pas sa fr´equence. Elles ne font que “rajouter des oscillations” sans affecter la p´eriodicit´e.
• Plus l’on rajoute d’harmoniques, plus l’on enrichit le timbre du son.
...
T
t t T/3
t T/4
f f f f
+ + +
=
1
2
3
4
T
t
t T/2
Time (s)
0 0.006032
-0.25 0.25
0
P (Pa)
-0.2 -0.1 0 0.1 0.2
0 0.0020.002 0.004
Son pur à 500Hz
Time (s)
0 0.006032
-0.44 0.4398
0
Son pur à 500Hz+1000Hz
P (Pa)
0.2
-0.2
0.002 0.004
Time (s)
0 0.006032
-0.6249 0.6249
0
Son pur à 500Hz+1000Hz+1500Hz
P (Pa)
-0.2 -0.4 0.4 0.2
0.004 0.002
II.4 Spectre d’un son harmonique
Spectre : Graphique repr´esentant l’amplitude (en dB) des diff´erentes harmoniques
• Le fondamental (f1) correspond au pic `a la plus basse fr´equence.
• Les autres pics apparaissant sont les harmoniques.
• L’amplitude des harmoniques tend `a d´ecroitre jusqu’`a devenir nulle.
Timbre ⇔ Richesse en harmoniques Hauteur ⇔ Fr´equence du fondamental
• Spectre du Do (C) de la 6eme octave (1046 Hz) d’un piano jou´e fortissimo (ff ) etpianissimo (pp).
• Le fortissimo a un timbre plus riche que le pianissimo.
• Les pics correspondant `a la 2eme, 3eme, 4eme et 5eme harmonique sont aux fr´equences : 2092 Hz, 3138 Hz, 4184 Hz et 5230 Hz.
III.1 R´esonateur acoustique
D´efinition : Syst`eme acoustique pouvant entrer en r´esonance `a des fr´equences propres donn´ees.
• Un r´esonateur n’est pas une source sonore.
• La r´esonance correspond `a une
“amplification” de la pression acoustique aux fr´equences de r´esonance.
• Un r´esonateur est passif, il n’apporte pas d’´energie.
• Exemples : Bouteille en verre, tuyaux d’orgues, flˆute.
• Les sons vois´es sont produits par la glotte et se propagent jusqu’aux l`evres.
• L’ensemble du tractus vocal correspond `a une succession de r´esonateurs.
• Il joue un rˆole de filtre en fr´equence sur le son produit par la glotte.
E xe m p le s :
[ i ]
ant´erieur r´etract´ee R´esonateur de Helmholtz + tuyau ouvert
F
1= 400 Hz
(Helmholtz)
F
2= 2500 Hz
(Tube ouvert)
[ a ]
ouverte
L1 L2
2 tuyaux ouvert-ferm´e
F
1= 1000 Hz
(Tube ouvert-ferm´e L1)
F
2= 1500 Hz
(Tube ouvert-ferm´e L2)
Principe d’un r´esonateur
Principe d’un tuyau ouvert : L’onde ´emise par la glotte subit une r´eflexion au niveau des l`evres.
glotte
Tractus vocal
lèvres
• Pour l’onde, le passage d’une r´egion de section finie (le tuyau) au milieu ext´erieur, correspond `a un changement de milieu.
• Cela correspond `a un changement d’imp´edance.
• Il se forme une onde stationnaire dans le tuyau.
• A l’extr´emit´e ouverte (l`evres) la pression acoustique doit tendre vers z´ero⇒ Noeud de pression.
• A l’extr´emit´e ferm´ee (glotte) la pression acoustique est maximum. ⇒ Ventre de pression.
• Cela impose des contraintes sur λ (li´ee `a la longueur du tuyau).
• sur la longueur du tuyau, l’onde a n´cessairement un 1/4 de λ en plus ou moins.
λ 3λ/4 λ λ λ/4
Fr´equences de r´esonance
Lien entre L et λ :
cas 1 : L = 14λ1 ⇔ λ1 = 4L cas 2 : L = 34λ2 ⇔ λ2 = 4L/3 cas 3 : L = 54λ3 ⇔ λ3 = 4 × L/5 F1 = 4Lc , F2 = 3 × F1 , F3 = 5 × F1
• F1, F2, ... sont les fr´equences de r´esonance.
• Elles ne caract´erisent pas la fr´equence d’un son.
• Ce sont les fr´equences pour lesquelles les sons seront renforc´es.
• Les sons vois´es conservent leur structure harmonique.
• Les harmoniques prochent de ces fr´equences de r´esonance sont renforc´ees.
• Les autres sont att´enu´ees.
Tuyau ouvert/ferm´e :
(longueur L)
bouche + pharynx
pression acoustique maximum
pression acoustique nulle
1
2
3
glotte lèvre
Mod`ele simplifi´e du tractus vocal pour une voyelle ouverte.
III.2 Formants et spectrogramme
Spectre d’un son vois´ e :
f (Hz) N (dB)
f3 f11
fondamental
f1
• Le son issu de la glotte fait apparaˆıtre des harmoniques.
filtrage du tractus
F1 F2 F3
f (Hz) N (dB)
• Le tractus vocal va filtrer ce son (filtrage selon la fr´equence).
Formants
f (Hz) N (dB)
• Le son produit se d´ecompose toujours en harmoniques mais leurs amplitudes ont ´et´e modul´ees selon leurs fr´equences ⇒ Formants.
s u r l e p i a n o
signal
spectre de bande large
spectre de bande étroite
Fo H2 H3 H4 formants
harmoniques
• Un spectrogramme repr´esente l’´evolution au cours du temps du spectre.
• Les variations d’amplitude apparaissent en “niveaux de gris”. noir → intense.
• “bande ´etroite” : Grande pr´ecision sur les fr´equences, les amplitudes sont nivel´ees.
• “bande large” : Grande pr´ecision sur les amplitudes, moins pr´ecis en fr´equence.
III.3 Spectrogramme de Voyelles
[ i ]
F1 = 400Hz F2 = 2500Hz F3 = 3000Hz
Frequence (Hz)
Temps (s) 0
500 1000 15002000 2500 3000 3500 4000 4500 50005500 6000 6500 7000 7500 8000
3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4
[si:] “bande large”
Frequence (Hz)
Temps (s) 0
500 1000 15002000 2500 3000 3500 4000 4500 50005500 6000 6500 7000 7500 8000
3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4
[si:] “bande ´etroite”
[ a ]
L1 L2
F1 = 1000Hz F2 = 1500Hz
F3 = 2500Hz Temps (s)
Frequence (Hz)
0 500 1000 1500 2000 25003000 3500 4000 4500 5000 5500 60006500 7000 7500 8000
0 500 1000 1500 2000 25003000 3500 4000 4500 5000 5500 60006500 7000 7500 8000
4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5 4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5
I
[fa:] “bande large”
Frequence (Hz)
Temps (s) 0
500 1000 1500 2000 25003000 3500 4000 4500 5000 5500 60006500 7000 7500 8000
4.6 4.7 4.8 4.9 5 5.1 5.2 5.3 5.4 5.5
[fa:] “bande ´etroite”
Diphtongue :
• Voyelle dont le point d’articulation varie pendant sa r´ealisation ⇒ variation du mode articulatoire.
• La structure formantique ´evolue au cours du temps.
• Exemple anglosaxons : “I” [IaIa]
bande large bande ´etroite
III.4 Spectrogramme de fricatives
R
post alv´eolaire
2,5kHz < Fr´es. < 5kHz
s
alv´eolaire
4kHz < Fr´es. < 8kHz
θ
dentale
Fr´es. ≃ 8kHz
f
labio dentale
Fr´es. > 10kHz
Frequency (Hz)
0 2.205·104
Sound pressure level (dB/Hz) -20
0 20
5000 10000 15000
Bruit rose
Time (s)
0 2
0 2·104
Frequency (Hz)
1 spectrogramme
• bruit : superposition d’une infinit´e de sons de diff´erentes fr´equences.
• Fricatives : ph´enom`ene turbulent cahotique donnant lieu `a du bruit.
• La cavit´e apr`es le point de friction joue un role de filtre (r´esonateur de Helmholtz).
• La fr´equence de r´esonance est inversement proportionelle au volume de la cavit´e.
Fr´es = 2πc q
A V×L
A,L : Aire et longueur du goulot, V : Volume cavit´e
III.5 Spectrogramme d’occlusives
• Obstruction suivie d’un relachement brutal
• Identification :
– Pr´esence d’une phase de silence (VOT)
– Relachement brutal sonore tr`es bref
– Transition des formants de la voyelle
“bab” “dad” “gag”
• La consonne, correspondant `a un silence, n’est pas identifiable telle quelle.
• C’est la voyelle qui nous renseigne sur la consonne.
• Selon la “trajectoire” des formants lors de la transition, on identifie le point d’articulation de l’occlusion initiale.
III.6 Voix sous h´elium
• La voix est modifi´ee lorsqu’on respire un m´elange air-h´elium.
• Les harmoniques ne sont pas modifi´ees :
f1 = 123Hz f2 = 246Hz f3 = 369Hz f4 = 492Hz
• Le fondamental d´epend de la longueur et de la tension des cordes vocales.
• f1 =c
corde/(2×Lcorde)
• Les formants sont modifi´es car ils d´ependent entre autre de la c´el´erit´e du gaz.
• F1 =cgaz/(4×Ltractus)
Time (s)
0 6.5
0 5000
Frequency (Hz)
0 1 2 3 4 5 6
0 1 2 3 4 5 6
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Time (s)
0 7.25
0 5000
Frequency (Hz)
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0 1 2 3 4 5 6 7
Time (s)
0.66 1.892
0 5000
Frequency (Hz)
pitch_in_air
Time (s)
0.6058 1.98
0 5000
Frequency (Hz)
pitch_in_helium
Time (s)
0.6058 1.98
0 5000
Frequency (Hz)
pitch_in_helium
Time (s)
0.66 1.892
0 500
Frequency (Hz)
Time (s)
0.6058 1.98
0 500
Frequency (Hz)
F1 = 605Hz F1 = 964Hz air : F2 = 970Hz helium : F2 = 1516Hz F3 = 2787Hz F3 = 3747Hz