• Aucun résultat trouvé

Modèle du conduit vocal sans pertes

Dans le document Disponible à / Available at permalink : (Page 61-72)

2. Le synthétiseur

2.5. Modèle du conduit vocal sans pertes

Kelly et Lochbaum (1962) ont développé un modèle numérique pour la synthèse de la parole en considérant le conduit vocal comme étant une concaténation d’un nombre fini de tubes élémentaires cylindriques de différentes sections et de même longueur. La figure 2.10 illustre cette approximation pour une forme arbitraire du conduit vocal. L’axe des abscisses x étant l’axe du conduit vocal.

En réalité, plus le nombre de tubes est grand, plus le modèle converge vers la forme réelle du conduit vocal. Dans notre modèle, le nombre des tubes est fixé par la longueur de chaque tube. Cette longueur est déterminée à son tour par la fréquence d’échantillonnage (Titze,

Figure 2.10 : Modélisation du conduit vocal.

Les fonctions d’aire des voyelles soutenues [a], [i] et [u], utilisées dans la suite, sont données dans la littérature (Story et al, 1996; Mrayati, 1976 ; Asi et Mrayati, 1993 et George, 1997). La figure 2.11 montre une représentation des trois fonctions d’aire qui correspondent aux voyelles [a], [i] et [u] d’un même locuteur (Story et ai, 1996). La fonction d’aire d’une même voyelle varie d’un locuteur à l’autre. La figure 2.12 montre les fonctions d’air de la voyelle [a] soutenue par trois locuteurs différents.

Le modèle du conduit vocal est excité par le signal glottique à une extrémité et rayonne le signal de parole par l’autre extrémité. Le signal rayonné aux lèvres est le résultat de la propagation du signal de l’excitation acoustique à partir de la glotte et tout au long du conduit.

Dans le paragraphe suivant, nous présentons les théories de propagation temporelle d’une onde acoustique dans un modèle simple en tubes du conduit vocal. Les pertes à l’intérieur du tube ne sont pas prises en considération et les pertes à la glotte et aux lèvres sont limitées à des pertes résistives.

[a] E U °0 5 10 15 20 25 30 35 40 45 en nombre de tubes [i] 50 E 2 O ^

■Jlllllllllllhii- _

j

U

i

10 E 5 ü 0 5 10 15 20 25 30 35 40 45 en nombre de tubes [U] 50 0 --0 ■11.______ ^lll

llh.„

5 10 15 20 25 30 35 40 45 50 en nombre de tubes

Figure 2.11 : Fonctions d’aire pour les voyelles [a], [i] et [u] d’un même locuteur (Story et al, 1996).

[a] par locuteur 1 (Story, 1996) 10

____■■■iiiiiillliiiiuiii

( in 3 5 10 15 20 25 30 35 en nombre de tubes

[a] par locuteur 2 (Mrayati, 1993)

40 45 I \j E 5 O 0

1

(3 5 10 15 20 25 30 35 40 45 10 0n nomDrs os iudbs [a] par locuteur 3 (Mrayati, 1993)

E 5

0

(

hiMdll..iillUllllllllllllllllllllllOl

3 5 10 15 20 25 30 35 40 45

en nombre de tubes

Figure 2.12 : Fonctions d’aire de la voyelle [a] pour trois locuteurs différents.

2.5.1. Propagation de l’onde acoustique dans le conduit vocal

L’étude de la propagation temporelle de l’onde acoustique dans le conduit vocal cylindrique repose sur des hypothèses de simplification. Étant donné la vitesse de propagation de l’onde acoustique, la longueur d’onde pour un signal de fréquence 100 Hz est égale à 3.5 mètres. Cette longueur d’onde est très grande par rapport au diamètre du conduit vocal qui ne dépasse pas les quelques centimètres. Dans ces conditions, nous supposons que l’onde est plane et se propage d’une manière unidimensionnelle et sans dispersion selon l’axe du conduit vocal (Benade, 1968).

L’étude de la propagation de l’onde acoustique plane dans le modèle discret du conduit vocal revient à l’étude de sa propagation dans des tubes cylindriques de même longueur mis bout à bout.

Dans ces conditions, la propagation de l’onde acoustique dans un tube cylindrique rigide, selon l’axe du conduit vocal, est gérée par les équations aux dérivées partielles suivantes :

Equation d’Euler (2.20): qui constitue une généralisation de la loi de Newton appliquée à un élément de cylindre.

dp _ P du dx S dt

Equation de continuité (2.21): qui traduit la conservation de la masse au cours du temps.

du _ S dp dx p.c^ dt

(

2

.

20

)

(

2

.

21

)

S est la section, c est la vitesse de propagation du son, t est le temps, JC est la distance, p est la pression longitudinale et u est le débit d’air dans le tube. De la dérivée de l’équation d’Euler par rapport à Jc et de l’équation de continuité par rapport au temps, on déduit l’équation d’onde en pression sous la forme (2.22).

dt^ dx^

La pression dépend du temps et de la position dans le tube. La solution générale de cette équation unidimensionnelle peut s’écrire sous la forme (2.23).

p{x, t) = p*{x-ct) + p~{x + et) (2.23) Les termes p*(jc- et) et p (jc+ et) sont interprétés respectivement comme la composante de pression acoustique qui se déplace dans le sens des jc croissants (onde progressive ‘aller’) et la composante de pression acoustique qui se déplace dans le sens opposé (onde progressive ‘retour’). 11 est à préciser que ces deux composantes ne sont

pas mesurables séparément. C’est leur somme p(x,t) qui peut être mesurée en un point quelconque du conduit vocal.

Vu que l’onde acoustique est à bande limitée, l’équation (2.23) peut être discrétisée selon la fréquence d’échantillonnage et un modèle à temps discret peut être établi. Les formes exactes des ondes de pression dans le conduit vocal dépendent des conditions limites à la glotte et aux lèvres qui seront détaillées dans la suite du chapitre.

2.5.2. Délai de propagation

D’une manière générale, si un système continu linéaire donne à la sortie un signal y'f'O retardé d’un délai temporel de valeur r par rapport à son signal d’entrée x(t) alors le signal y(t) s’exprime selon l’équation (2.24).

y{t) = x{t - t) (2.24)

y(n) = x(n - D) (2.25)

La discrétisation nécessite que le retard r soit égal à un nombre

2’

entier du pas d’échantillonnage 7^. Dans ce cas, D = — est un entier

'^s

positif et le signal de sortie est dit retardé par rapport au signal d’entrée de D échantillons. L’équation (2.24) se traduit dans le domaine discret par (2.25).

Pour un délai unitaire, le retard temporel r est égal à en secondes. Dans la suite, nous utilisons une fréquence d’échantillonnage égale à 88200 Hz pour simuler la propagation dans les conduits sous-glottique et vocal. Cette valeur est implicite dans le modèle de Story. La longueur d’un tube élémentaire du conduit vocal correspond à la distance que traverse l’onde acoustique pendant une durée . L’équation (2.26) exprime cette longueur en cm.

l = — :=cT^= - 0.396825 cm (2.26)

88200

2.5.3. Coefficient de réflexion à Injonction et équations

Dans ce paragraphe, nous étudions le phénomène de propagation à la jonction entre deux tubes cylindriques élémentaires. Dans une concaténation de tubes de même section, la pression acoustique se propage sans perturbations. Néanmoins, les tubes cylindriques modélisant le conduit vocal n’ont pas nécessairement la même section.

Si les sections de deux tubes adjacents sont différentes alors leurs impédances caractéristiques sont aussi différentes. Ceci est dû au fait que l’impédance caractéristique , qui est une propriété de l’air contenu à l’intérieur d’un tube cylindrique d’indice k, est inversement proportionnelle à sa section (2.27). a* est le rayon de la section , P est la masse volumique de l’air, c est la vitesse du son dans ce milieu.

Il en résulte qu’à la jonction entre deux tubes adjacents du conduit vocal, l’onde acoustique est perturbée à cause du changement brusque de l’impédance. Ceci implique la transmission d’une partie de la composante incidente de pression acoustique et la réflexion d’une deuxième partie (Vâlimàki, 1995).

2* p.c _ p.c (2.27)

La figure 2.13 montre la répartition des composantes de pression acoustique sur les extrémités des deux tubes cylindriques adjacents d’indices k et k+1 de même longueur / et de différentes sections et

5^^,. L’onde de pression acoustique traverse chaque tube pendant un délai temporel r . A l’extrémité droite du tube d’indice k, la composante de pression se propageant dans le sens des x croissants (t - r) est en retard de r par rapport à la composante p^{t) se propageant dans le même sens à l’extrémité gauche du même tube. Par contre, la composante de pression de retour p^ (/ + r) est en avance de r par rapport à la composante de retour (t) à gauche du tube d’indice k.

I I

h--- ►H--- ►!

Figure 2.13 : Composantes de pression acoustique incidentes et réfléchies à la jonction entre deux tubes élémentaires d’indices k et k+1.

Les composantes de pression transmises à partir de la jonction dépendent des composantes de pression incidentes à la même jonction ainsi que des impédances acoustiques des tubes k Qik^l. Dans la suite, les valeurs de pression transmises et réfléchies seront calculées en fonction des composantes incidentes en se basant sur les équations de continuité de la pression et du débit à la jonction.

Nous exprimons l'impédance comme le rapport de la pression acoustique par le débit d’air au même point dans le tube (2.28). Cette équation est une analogie de la loi d’Ohm dans la théorie des circuits électriques qui considère que l’impédance électrique est le rapport de la tension par le courant.

(2.28)

Les lois de la continuité de la pression et du débit d’air à la jonction entre deux tubes adjacents sont exprimées selon (2.29).

|m^(/,0 = m*+i(0,0

Nous avons déjà exprimé la pression acoustique en un point du tube k sous forme de la somme de deux composantes se propageant dans deux sens opposés (2.23). De la même manière, le débit d’air total en un point du tube s’exprime sous la forme de la différence entre la composante du flux se propageant dans les sens des x croissants et la composante du flux se propageant dans le sens inverse (2.30). Par substitution de (2.23) et de (2.30) dans (2.29), nous obtenons le système d’équations de (2.31) qui traduit les lois de continuité de la pression et du débit d’air.

M* (x, t) = ul (/ - r) - (t + r) = ^ [pI (/ - r) - {t + r)] (2.30)

^ [pI {t-r)- p; (t + r)] = [/?;,, (0 - (/)]

^^k ^k+\ (2.31)

p1

(^ -

î

’) +

Pk (( + ^) = Pm

(0 +

Pm

(0

La résolution de (2.31) permet d’établir les équations qui régissent les pressions transmise et réfléchie en fonction des pressions incidentes dans une jonction. L’expression de la composante transmise inconnue pl^^(t), en fonction des composantes incidentes connues pl{t-z) et p~^^^ (t), est obtenue par l’équation (2.32).

Pl.fi) pHi-1‘*'Pl.fi) (2.32) De la même manière, nous obtenons l’expression de la composante de pression réfléchie/?^(/ +r) en fonction des composantes incidentes

plit-T) etp;^,(0 par (2.33).

p:(.1*1)= Pi('-r) + Pi.,(!) (2.33)

En observant les équations (2.32) et (2.33), une simplification de la notation s’impose et nous définissons ainsi les coefficients de réflexion et de transmission et pour la jonction, et dans la direction de propagation des x croissants, par les équations (2.34) et (2.35). Etant donné que les sections des tubes ne peuvent pas être négatives, le coefficient est toujours inférieur à 1 en valeur absolue.

_ ^k+\ ^k ^k ■*■■^*+1 ^k + ^k*\ tk ^k +^*+1 25k+\ ^k + ^k+\ = i-n (2.34) (2.35)

A partir de (2.34) et (2.35), nous remarquons que si

autrement dit si 5* = , aucune réflexion ne se produit et l’onde est entièrement transmise. Après substitution des équations (2.34) et (2.35) dans (2.32) et (2.33), nous obtenons finalement le système d’équations temporelles (2.36).

(0 = (1 + )pI (^ - O - (t)

+ h pI (^ - r) + (1 - r, )pl^, (0

La transmission et la réflexion de l’onde de pression acoustique à la jonction d’indice k sont illustrées schématiquement par la cellule de la

Figure 2.14 : Cellule modélisant la dispersion de la pression acoustique à la jonction k.

Dans la suite, nous généralisons les modèles de propagation de Fonde acoustique dans un tube cylindrique élémentaire et à la jonction entre deux tubes à un modèle complet du conduit vocal composé de la concaténation de M tubes cylindriques. 11 s’agit de la mise en cascade de M-1 cellules comme le montre la figure 2.15. Cette mise en cascade est cernée par deux cellules simulant la réflexion à la glotte et aux lèvres. Entre deux cellules, nous introduisons un délai de propagation unitaire représenté par sa fonction de transfert en z.

Tubei

glotte

Tube^

Figure 2.15 : En haut : modèle par concaténation de tubes cylindriques. En bas : modèle complet du conduit vocal : mise en cascade de M

2.5.4. Conditions aux limites

Les conditions aux limites dans un modèle de conduit vocal sont déterminées à partir des coefficients de réflexion et de transmission calculés à la glotte et aux lèvres. Dans un modèle simple du conduit vocal, les pertes à la glotte et aux lèvres sont simulées à l’aide des pertes résistives. Les coefficients de réflexion et de transmission ont donc des valeurs réelles.

Conditions à la glotte

A l’extrémité du conduit vocal du côté de la glotte, la composante de pression (t), se propageant dans le conduit vocal dans le sens des x croissants, est la somme de la composante de l’excitation glottique et d’une partie de la composante de pression incidente à la glotte (2.37). Le coefficient r^ désigne la fraction de pression incidente à la glotte et qui a été réinjectée à l’intérieur du conduit vocal. L’autre partie sera transmise à l’intérieur de la trachée. Ce modèle est irréaliste. Des pertes à la glotte, qui dépendent de la fréquence, seront présentées aux paragraphes suivants.

*^1

(2.37) Conditions aux lèvres

Dans le cas où l’extrémité entre le dernier tube du conduit et le monde externe est fermée, l’impédance à l’extérieur du tube peut être considérée comme infinie-»oo. Le coefficient de réflexion est unitaire selon l’équation (2.38). Toute l’énergie est réfléchie vers l’intérieur du conduit sans aucune perte. Physiquement ce cas est irréel.

= lim = ]

'^rad + ^

(2.38) Dans le cas sans pertes, nous considérons qu’à l’extrémité du conduit, le dernier tube s’ouvre sur un espace infini d’impédance nulle. Le coefficient de réflexion est = -1. La valeur de la pression chute aux lèvres et s’annule. Aucun signal acoustique n’est alors capté à l’extérieur. Dans le modèle de transmission électrique équivalent, ceci correspond à un court-circuit. Dans la pratique, nous prenons = -0.9 pour que nous puissions mesurer la pression acoustique à la sortie des lèvres. L’équation qui gère la réflexion aux lèvres est donnée par (2.39).

PM(0 = r^.pL(t) (2.39)

En réalité, des pertes acoustiques par rayonnements aux lèvres doivent être considérées. Dans ce cas, l’impédance aux lèvres dépend de

la fréquence. On parle alors d’une fonction de réflexion, ou filtre de réflexion, à la place d’un simple coefficient de réflexion. Ce cas sera abordé dans la suite.

2.5.5. Réponse fréquentielle du conduit vocal

Nous avons utilisé dans la simulation les fonctions d’aire d’un même locuteur, proposées par Story, des voyelles [a], [1] et [u]. Nous avons implémenté le modèle discret de la propagation temporelle de fonde de pression dans le conduit vocal simple en nous basant sur les équations (2.40), (2.41) et (2.43) du paragraphe précédent. Le coefficient de réflexion aux lèvres est pris égal à -0.9. Le coefficient de réflexion à la glotte est pris égal à 0.95. La fréquence d’échantillonnage est fixée à 88200 Hz (sous-section 2.5.2). Nous avons excité le modèle par une impulsion au niveau de la glotte. Pour chaque forme du conduit vocal, nous avons obtenu le signal de sortie et calculé son spectre. Les trois spectres de la figure 2.16 correspondent respectivement aux réponses fréquentielles du conduit vocal pour les voyelles [a], [u] et [i] représentées sur la plage de fréquenees allant de 0 à 5 kHz.

40 20 0 -20 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 40 Voyelle "a" 20 0 20 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 4Q Voyelle "u" 20 0 -20 - - ---- ---0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000 Voyelle "i"

Figure 2.16 ; Réponses fréquentielles du conduit vocal pour les voyelles [a], [u] et [i]

Les maxima dans chaque spectre de la figure 2.16 correspondent aux formants de la voyelle simulée.

Dans le tableau 2.1, nous présentons les fréquences centrales en Hz des 5 premiers formants ainsi que leurs amplitudes en dB pour le modèle simple du conduit vocal.

Formants [al [U] [il

(Hz) (dB) (Hz) (dB) (Hz) (dB) Fl 806 32.85 258 34.55 224 34.16 F2 1205 29.97 1183 14.90 2490 33.01 F3 l'uni 32.60 2448 30.64 3577 33.62 F4 3417 24.05 3701 21.06 3989 36.50 F5 4563 30.09 4843 36.26 4800 36.35

Tableau 2.1 : Valeurs mesurées des fréquences centrales et des amplitudes des 5 premiers formants pour chaque voyelle [a], [u] et [i].

Dans le document Disponible à / Available at permalink : (Page 61-72)