m´ ethodes de d´ etection du vibrato et d’estimation de ses param`etres
14.1 Les sons r´ eels consid´ er´ es
Les deux signaux r´eels utilis´es sont l’extrait de flˆute flute.sf, pour lequel le vibrato est tr`es petit, ou inexistant, selon la note ; et l’extrait de voix chant´ee voiceP.sf, pour lequel le vibrato est tr`es grand, et pour lequel nous avons la pr´esence d’un tr´emolo qui perturbe les algorithmes d´ecrits dans les deux chapitres pr´ec´edents. Le trajet de f0 pour la flˆute et pour la voix chant´ee sont redonn´es, respectivement sur les figures 14.1 et 14.2. Les r´esultats pr´esent´es dans ce chapitre ont fait l’objet d’une communication : [RRD+99].
2 4 6 8 10 12 0 100 200 300 400 500 600 700
Fig. 14.1 – Trajet de f0 pour la flˆute. En abs-cisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz 5 10 15 20 25 0 100 200 300 400 500 600 700
Fig. 14.2 – Trajet de f0 pour la voix chant´ee. En abscisse : le temps en seconde ; en or-donn´ee : la fr´equence en Hz
14.2 M´ethode 2 : (( distorsion des enveloppes spectrales ))
Pour la d´etection du vibrato, l’´evolution temporelle de α et l’´evolution du (( flux )) sont ´etudi´ees. Voir les figures 14.3, 14.4, 14.5 et 14.6 pour les deux sons consid´er´es.
2 4 6 8 10 12 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1x 10 −3
Fig. 14.3 – D´etection du vibrato. R´esultats de la m´ethode 2 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : α
5 10 15 20 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1x 10 −3
Fig. 14.4 – D´etection du vibrato. R´esultats de la m´ethode 2 pour la voix chant´ee. En abs-cisse : le temps en seconde ; en ordonn´ee : α
2 4 6 8 10 12 0 20 40 60 80 100 120 140 160 180 200
Fig. 14.5 – D´etection du vibrato. R´esultats de la m´ethode 2 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : le (( flux ))
5 10 15 20 25 0 20 40 60 80 100 120 140 160 180 200
Fig. 14.6 – D´etection du vibrato. R´esultats de la m´ethode 2 pour la voix chant´ee. En abs-cisse : le temps en seconde ; en ordonn´ee : le (( flux ))
14.3 M´ethode 4 : (( pr´ediction ar ))
Pour la d´etection, l’´evolution temporelle de R est ´etudi´ee. Voir les figures 14.7 et 14.8 pour les deux sons consid´er´es.
2 4 6 8 10 12 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Fig. 14.7 – D´etection du vibrato. R´esultats de la m´ethode 4 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : R
5 10 15 20 25 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Fig. 14.8 – D´etection du vibrato. R´esultats de la m´ethode 4 pour la voix chant´ee. En abs-cisse : le temps en seconde ; en ordonn´ee : R
Pour l’estimation des param`etres du vibrato, voir les figures 14.9 et 14.10, o`u nous donnons les trajets de fvib trouv´es pour les deux sons consid´er´es (les droites horizontales repr´esentent la fr´equence du vibrato mesur´ee (( `a l’œil )) : barre horizontale `a 6 Hz). Nous donnons les r´esultats pour la flˆute bien que ce son ne soit quasi pas modul´e en fr´equence.
2 4 6 8 10 12 0 1 2 3 4 5 6 7 8 9 10
Fig. 14.9 – Estimation de la fr´equence du vibrato. R´esultats de la m´ethode 4 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz 5 10 15 20 25 0 1 2 3 4 5 6 7 8 9 10
Fig. 14.10 – Estimation de la fr´equence du vibrato. R´esultats de la m´ethode 4 pour la voix chant´ee. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz
14.4 M´ethode 5 : (( d´etection des minimums et maximums ))
Pour la d´etection, voir le tableau 13.1 page 122. Mais voir surtout les figures 14.11 et 14.12 pour les deux sons consid´er´es.
Pour l’estimation des param`etres du vibrato, voir les figures 14.13 et 14.14, o`u nous donnons les trajets de fvib trouv´es pour les deux sons consid´er´es (les droites horizontales repr´esentent la fr´equence du vibrato mesur´ee (( `a l’œil )) : barre horizontale `a 6 Hz). Nous donnons les r´esultats pour la flˆute bien que ce son ne soit quasi pas modul´e en fr´equence.
2 4 6 8 10 12 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
Fig. 14.11 – D´etection du vibrato. R´esultats de la m´ethode 5 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : pb
5 10 15 20 25 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
Fig. 14.12 – D´etection du vibrato. R´esultats de la m´ethode 5 pour la voix chant´ee. En abs-cisse : le temps en seconde ; en ordonn´ee : pb
2 4 6 8 10 12
0 5 10 15
Fig. 14.13 – Estimation de la fr´equence du vibrato. R´esultats de la m´ethode 5 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz 5 10 15 20 25 0 5 10 15
Fig. 14.14 – Estimation de la fr´equence du vibrato. R´esultats de la m´ethode 5 pour la voix chant´ee. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz
14.5 M´ethode 6 : M´ethode (( signal analytique ))
Pour la d´etection, l’´evolution temporelle de mod = |X| ˆ fc
0
est ´etudi´ee. Voir les figures 14.15 et 14.16 pour les deux sons consid´er´es.
2 4 6 8 10 12 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
Fig. 14.15 – D´etection du vibrato. R´esultats de la m´ethode 6 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : mod
5 10 15 20 25 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
Fig. 14.16 – D´etection du vibrato. R´esultats de la m´ethode 6 pour la voix chant´ee. En abs-cisse : le temps en seconde ; en ordonn´ee : mod
Pour l’estimation des param`etres du vibrato, voir les figures 14.17 et 14.18, o`u nous donnons les trajets de fvib trouv´es pour les deux sons consid´er´es (les droites horizontales repr´esentent la fr´equence du vibrato mesur´ee (( `a l’œil )) : barre horizontale `a 6 Hz). Nous donnons les r´esultats pour la flˆute bien que ce son ne soit quasi pas modul´e en fr´equence.
2 4 6 8 10 12
0 5 10 15
Fig. 14.17 – Estimation de la fr´equence du vibrato. R´esultats de la m´ethode 6 pour la flˆute. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz 5 10 15 20 25 0 5 10 15
Fig. 14.18 – Estimation de la fr´equence du vibrato. R´esultats de la m´ethode 6 pour la voix chant´ee. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz
Pour l’extrait de voix chant´ee, nous obtenons les r´esultats interm´ediaires (trajets de la fonda-mentale filtr´ee et du module) pr´esent´es sur les figures 14.19 et 14.20.
Les mˆemes courbes (voir 14.21 et 14.22) sont donn´ees dans le cas de la flˆute, o`u il n’y a du vibrato, du reste tr`es petit, que sur peu de notes. Nous voyons que le trajet du vibrato est beaucoup plus chahut´e pour la flˆute (ceci, sauf pour la note de plus de 2 secondes `a fc
0 = 347 Hz : le vibrato quoique petit est visible (( `a l’œil )), et il est aussi parfaitement estim´e avec cet algorithme) que pour la voix chant´ee : nous obtenons du bruit. De la mˆeme fa¸con, le module et le module relatif sont plus petits pour la flˆute que pour la voix chant´ee.
Pour l’exemple de la flˆute, nous constatons sur la figure 14.22 que le trajet du module peut ˆetre utilis´e pour d´etecter les transitions, lors de la segmentation en zones stables. Remarquons que
5 10 15 20 25 0 200 400 600 5 10 15 20 25 −40 −20 0 20 40 5 10 15 20 25 −40 −20 0 20 40
Fig. 14.19 – Trajets de f0, de f0 filtr´ee passe-bande et de f0 filtr´ee passe-bande puis filtr´ee par Hilbert. Extrait de voix chant´ee. En abs-cisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz 5 10 15 20 25 0 10 20 30 40 50 60 70 80 90 100
Fig. 14.20 – Trajet du module |X|. Extrait de voix chant´ee. En abscisse : le temps en seconde
2 4 6 8 10 12 200 400 600 2 4 6 8 10 12 −40 −20 0 20 40 2 4 6 8 10 12 −40 −20 0 20 40
Fig. 14.21 – Trajets de f0, de f0 filtr´ee passe-bande et de f0 filtr´ee passe-bande puis filtr´ee par Hilbert. Extrait de flˆute. En abscisse : le temps en seconde ; en ordonn´ee : la fr´equence en Hz 2 4 6 8 10 12 0 10 20 30 40 50 60 70 80 90 100
Fig. 14.22 – Trajet du module |X|. Extrait de flˆute. En abscisse : le temps en seconde
le module, contrairement `a fvib, n’est pas liss´e sur une fenˆetre d’analyse large de 0,35 seconde (filtrage de Kay). La fonction d’observation pour la segmentation en zones stables (voir le chapitre 2, page 11) est alors|X|.