HAL Id: jpa-00230490
https://hal.archives-ouvertes.fr/jpa-00230490
Submitted on 1 Jan 1990
HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.
L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
OPTIMISATION DES FILTRES D’UN VOCODEUR À CANAUX POUR LA CORRECTION DE LA PAROLE
HYPERBARE
A. Saadane, J. Malherbe
To cite this version:
A. Saadane, J. Malherbe. OPTIMISATION DES FILTRES D’UN VOCODEUR À CANAUX POUR
LA CORRECTION DE LA PAROLE HYPERBARE. Journal de Physique Colloques, 1990, 51 (C2),
pp.C2-793-C2-796. �10.1051/jphyscol:19902185�. �jpa-00230490�
COLLOQUE DE PHYSIQUE
Colloque C2, supplément au n°2. Tome 51, Février 1990 C2-793
1er Congrès Français d'Acoustique 1990
OPTIMISATION DES FILTRES D'UN VOCODEUR À CANAUX POUR LA CORRECTION DE LA PAROLE HYPERBARE
A. SAADANE et J.C. MALHERBE
Laboratoire d'Analyse des systèmes de Traitement de l'Information (LRSTI) ENSSAT, 6 Rue de Kérampont, F-22300 Lannion, France
Résumé - La p a r o l e produite- en plongée profonde, e t que nous q u a l i f i e r o n s d'hyperbare, présente une v a r i é t é de d i s t o r s i o n s qui l a rendent i n i n t e l l i g i b l e . Cet a r t i c l e propose une procédure d ' o p t i m i s a t i o n des f i l t r e s d'un vocodeur d e s t i n é à l a c o r r e c t i o n de c e t t e p a r o l e . I l p r é s e n t e , pour le choix des f i l t r e s passe-bande, c o n s t i t u a n t l ' a n a l y s e - s y n t h è s e , e t l'échelonnement de l e u r s fréquences c e n t r a l e s , une étude où r é s o l u t i o n , courbes spec- t r a l e s p l a t e s , réponses t r a n s i t o i r e s brèves e t d i s t o r s i o n s de r e t a r d de groupe servent de c r i t è r e s .
Abstract - Speech at great depths called hyperbaric features a variety of distortion phenomena which make it unintelligible. The article puts forward a process of optimiza- tion of the filters of a vocoder destined to correct a such speech. As far as the selec- tion of band pass filters for the analysis-synthesis and the spacing of their central frequencies are concerned it presents an investigation based on the following parameters ; resolution, flat spectral curves, short transient responses and group delay distortion.
1 - INTRODUCTION :
L'effet "Donald-Duck", caractérisant la parole hyperbare, est lié à la sensibilité de la fonction de transfert du conduit vocal aux paramètres physiques des mélanges respiratoires synthétiques (Héliox, Hydrox, Hydréliox). L'évolution en fonction de la profondeur de 2 de ces paramètres, la vitesse du son C et la masse volumique U, se traduit essentiellement par un déplacement des fréquences des formants. Ce déplacement, considéré en grande partie res- ponsable de l'inintelligibilité de la parole hyperbare, est modélisé par la loi de Fant- Lindquist IM
2 2 2 2 2 F^ = k F + k (U, /U - 1)F
h a h a o
avec F , F, = fréquence du même formant respectivement dans l'air et dans le mélange hyperbare
k = C, /C = rapport des vitesses du son dans les deux mélanges U, /U = rapport des masses volumiques des deux mélanges
F = fréquence de résonance du conduit vocal fermé aux lèvres (air, latm).
° 2 9
La composante non linéaire, k (U, /U - 1)F , affectant les faibles fréquences peut, en pre- mière approximation, être négligée. Une compression d'un rapport k de l'enveloppe spectrale restituera donc la position des formants, corrigeant ainsi la parole déformée.
2 - VOCODEUR A CANAUX
Une telle compression peut être réalisée par le vocodeur à canaux dont le synoptique est donné en figure 1. Dans cette structure, le signal hyperbare x, (t) est analysé par une batte- rie de N filtres passe-bande contigus.
Chaque filtre est caractérisé par sa bande passante Bi et sa fréquence centrale fi (1^ i\< N) . L'amplitude du spectre x, (t) résulte du redressement et du filtrage passe-bas qui suivent.
Les filtres de synthèse, paramétrés par fsi et Bsi, et les limiteurs dont la sortie est soit +1 soit -1 selon le signe de l'entrée, déterminent la structure fine de l'excitation. La modulation en amplitude des harmoniques de cette excitation par le spectre correspondant res- titue le signal dans la bande filtrée. Le signal corrigé x (t) s'obtient alors par sommation des signaux de sortie des derniers filtres passe-bande.
L'optimisation d'une telle structure passe par l'optimisation des filtres constituant 1'analyse-synthèse.
Article published online by EDP Sciences and available at http://dx.doi.org/10.1051/jphyscol:19902185
COLLOQUE DE PHYSIQUE
fillre passe bande 1
151
.
BS 1Fig 1: Synoptique d'un vocodeur à canaux
Fig 2: Evolution de Fo pour 3 échelonnements / 2 / A
?
- 3
-
FILTRES tAS5B-BANDE D'ANALYSE3
-
1:Bandes passantes et échelonnement: La séléction des bandes passantes et fréquences centrales de ces filtres résulte d'une étude comparative faite au C.N.E.T Lannion /2/ de trois échelonnements differents (fig 2 ) . Des tests d'écoute ont été réalisés et la nette préférencede l'échelonnement 3 s'expliquerait par le rapprochement de ce dernier, en basses fréquences du moins, de celui des bandes critiques de l'oreille (également représenté en fig 2 ) .
Toutefois il semble que l'échelonnement optimum ne tienne pas compte uniquement de l'oreille mais aussi du conduit vocal.
Basées sur ces considérations le tableau 1 donne les caractéristiques du banc choisi (indépen- damment du type de filtre). La progression arithmétique des AF permet une résolution plus fine dans le bas du spectre.
Compte tenu de la largeur du spectre hyperbare 31 filtres sont nécéssaires pour couvrir la bande 300Hz
-
12400Hz. Un 3ZeEe filtre élargit la bande à 13.1Kh.z permettant ainsi une meilleure fidélité au timbre.de filtres choisi
\+ .I ~ $ 1 1
-
go 110 130 150 170 190 210 230 250 270 290 310 330 350 370 3 9 0 410 430 450 470 490 510 530 550 570 590 610 630 650 670 690 7 1 0
Tableau 1 :Caractéristique du banc
I L a bdb
300 390
390 500
500 630
630 760
760 950
950 1140 1140 1350 1350 1580 1580 1630 1830 2100 2100 2390 2390 2700 2700 3030 3030 3380 3360 3750 3750 4140 4140 4550 4550 4980 4980 5430 5430 5900 5900 6390 6390 6900 6900 7430 7430 7980 7980 8550 8550 $140 9140 9750 9750 10360 10380 11030 11030 11700 117M) 12390 12390 13100 I U
$45 445 565 705 885 1045 1245 1465 1705 1965 2245 2545 2865 3205 3565 3945 4345 4765 5205 5665 6145 6645 7165 7705 8265 8845 9445 10065 10705 11365 12045 12745
.
8
.-
9 i
N
FO
E. i ,
-
-Ai !
+/
,+, 2 l-
i r,
3 5 4j r
6 7//++/+
6 9,./
/y* '*\ 10 11)p
12-1-
..--'a 13 14/ 15
1 6
~c."'
17 16 19- /- ,*/ys -
Echelonnement 1 20---
Echelonnement 2 21>.-/x-s
/
x-*-Echelonnement j 2 2 23/' 4 Bandes critiques 24 25
/'
de l'oreille 2627 28 29 3 0 3 1 3 2 IODw.ODm.01- ID. - . I O D - I I D O - w . a a r *
3
-
2: Choix du type de filtre: 3 critères determinent généralement le choix de ces filtres:-
les variations de l'intensité et de l'enveloppe spectrale des differents sons exigent une dynamique d'au moins 50dB /3/-
la réponse fréquentielle composite des differents filtres doit avoir une amplitude constante et une phase linéaire /4/-
les caractéristiques des filtres passe-bande doivent être un compromis entre une bonne réso- lution spectrale et une réponse transitoire rapide.Parmi les filtres R.I.1 ceux de Chebysheff et les elliptiques ne sont pas appropriés à une tep le application. Outre l'ondulation dans la bande passante qui les caractérise, ces filtres présentent une oscillation prolongée dans la réponse impulsionnelle; oscillation qui est à l'origine de l'effet de réverbération de la parole synthétique. Les figures 3, 4.et 5 montrent la convenance des filtres de Butterworth. Cependant l'attention particulière qu'il faut accor- der à la distorsion de leur retard de groupe, fig 6, pour satisfaire le deuxième critère constitue leur difficulté essentielle /5/.
Pig 3: Réponse idipulsionnelle d'un filtre Fig 5: Réponse impulsionnelle d'un passe-bas de Chebyshef f (geFe ordre, 120Hz) Butterworth (8Zme ordre, 120Wz)
Fig 4: Réponse impulsionnelle d'un filtre passe-bas elliptique (7e% ordre, 120Hz)
Fig 6: Retard de groupe d'un filtre de Butterworth (8e% ordre, 120Hz) La linéarité de la phase est assurée avec les filtres R.I.F. Les méthodes d'approximation
" ~ a r fenêtre" permettent à ces filtres d'approcher la réponse fréquentielle désirée avec une grande flexibilité. Le choix de la fenêtre de Hamming, par rapport aux autres fenêtres, se justifie par une meilleure séléctivité, une dissipation maximale d'energie dans le lobe prin- cipal et une atténuation du lobe secondaire d'env'iron 45dB. La figure 7 illustre une telle approximation. Compte tenu de la symétrie observée autour du point (wc, 0.5) il est légitime de penser que si une seule et même fenêtre est utilisée dans un banc de filtres alors les ondulations en bandes passantes et en bandes atténuées vont s'annihiler. La confirmation de ce raisonnement est donnée par la figure 8. Une ondulation crête à crête d'environ 1.5dB se manifeste aux hautes fréquences. Cette ondulation est insignifiante compte tenu de la faible sensibilité du système auditif aux fréquences élevées.
C2-796 COLLOQUE DE PHYSIQUE
Fig 7: Passe-bas résultant d'une approxi- mation par "fenêtre"
Fig 8: Réponse fréquentielle composite du banc d'analyse
4-- FILTRES PASSE-BANDE DE SYNTHESE
La détermination des fréquences centrales et des bandes passantes de ces filtres n'est
fonction que de la correction spectrale recherchée. La compression dans un rapport constant k de l'enveloppe spectrale du signal hyperbare est obtenue avec des filtres caractérisés, d'apré;
les notations de la figure 1,par £si = fi/k et Bsi = Bi/k pour 1 &SN
La réalisation de ces filtres est évidemment soumise aux mêmes critères que ceux des filtres d'analyse. Pour une profondeur de 150m par exemple f6/ donne en plus de la composition de 1'Héliox (3.1% d'oxygène et 96.9% d'hélium) le rapport k = 2.6 nécéssaire. La figure Y représente la réponse fréquentielle Composite du banc correspondant à ce cas.
5
-
CONCLUSIONLes filtres passe-bande d'analyse et de synthèse ont été discutés et désignés. Le principe exploite à la fois la linéarité de la phase des filtres R.1.F et la symétrie des régions de transitions résultant de l'approximation par une feîïêtre.
La spécification des filtres passe-bas d'analyse dépend du choix de leur bandes passantes.
Celles-ci doivent être suffisantes pour d'une part suivre les variations d'énergie dans la bande filtrée et d'autre part rejeter les fréquences ondulantes du signal redressé.
Des tests d'écoute effectués sur des échantillons de parole hyperbare corrigée donnent une intelligibilité satisfaisante. Le fait que l'extraction du fondamental soit élaborée à partir du signal hyperbare lui même présente, à l'audition des simulations, peu l'effet synthétique.
1
I 5
-
R.N. Golden: Vocoder filter design-BOL Practical considerations J.A.S.A 43 n4 68
L .
, 3 6 -
A. Saadane: Optimisation d'un vocodeir
c 1250 2500 3750 à canaux pour la correction de la parole
625 1875 3125 4375
F C Pen ~H. ~ ~ ~ ~ ~ hyperbare. Thèse tiniversité Rennes1 1989
DB
r '
Références bibliographiques:O - 1
-
G. Fant: Acoustic theory of speechI production lYrOUTON 1970 The HAGUE.
2
-
F. ZURCHER: Vocodeur à canaux-.O{ cours ENST-Br 4-8 février 1985
Fig Y: Réponse fréquentielle composite du banc de synthèse ( k = 2.6) 11
j -60-
3