• Aucun résultat trouvé

OPTIMISATION DES FILTRES D'UN VOCODEUR À CANAUX POUR LA CORRECTION DE LA PAROLE HYPERBARE

N/A
N/A
Protected

Academic year: 2021

Partager "OPTIMISATION DES FILTRES D'UN VOCODEUR À CANAUX POUR LA CORRECTION DE LA PAROLE HYPERBARE"

Copied!
5
0
0

Texte intégral

(1)

HAL Id: jpa-00230490

https://hal.archives-ouvertes.fr/jpa-00230490

Submitted on 1 Jan 1990

HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers.

L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

OPTIMISATION DES FILTRES D’UN VOCODEUR À CANAUX POUR LA CORRECTION DE LA PAROLE

HYPERBARE

A. Saadane, J. Malherbe

To cite this version:

A. Saadane, J. Malherbe. OPTIMISATION DES FILTRES D’UN VOCODEUR À CANAUX POUR

LA CORRECTION DE LA PAROLE HYPERBARE. Journal de Physique Colloques, 1990, 51 (C2),

pp.C2-793-C2-796. �10.1051/jphyscol:19902185�. �jpa-00230490�

(2)

COLLOQUE DE PHYSIQUE

Colloque C2, supplément au n°2. Tome 51, Février 1990 C2-793

1er Congrès Français d'Acoustique 1990

OPTIMISATION DES FILTRES D'UN VOCODEUR À CANAUX POUR LA CORRECTION DE LA PAROLE HYPERBARE

A. SAADANE et J.C. MALHERBE

Laboratoire d'Analyse des systèmes de Traitement de l'Information (LRSTI) ENSSAT, 6 Rue de Kérampont, F-22300 Lannion, France

Résumé - La p a r o l e produite- en plongée profonde, e t que nous q u a l i f i e r o n s d'hyperbare, présente une v a r i é t é de d i s t o r s i o n s qui l a rendent i n i n t e l l i g i b l e . Cet a r t i c l e propose une procédure d ' o p t i m i s a t i o n des f i l t r e s d'un vocodeur d e s t i n é à l a c o r r e c t i o n de c e t t e p a r o l e . I l p r é s e n t e , pour le choix des f i l t r e s passe-bande, c o n s t i t u a n t l ' a n a l y s e - s y n t h è s e , e t l'échelonnement de l e u r s fréquences c e n t r a l e s , une étude où r é s o l u t i o n , courbes spec- t r a l e s p l a t e s , réponses t r a n s i t o i r e s brèves e t d i s t o r s i o n s de r e t a r d de groupe servent de c r i t è r e s .

Abstract - Speech at great depths called hyperbaric features a variety of distortion phenomena which make it unintelligible. The article puts forward a process of optimiza- tion of the filters of a vocoder destined to correct a such speech. As far as the selec- tion of band pass filters for the analysis-synthesis and the spacing of their central frequencies are concerned it presents an investigation based on the following parameters ; resolution, flat spectral curves, short transient responses and group delay distortion.

1 - INTRODUCTION :

L'effet "Donald-Duck", caractérisant la parole hyperbare, est lié à la sensibilité de la fonction de transfert du conduit vocal aux paramètres physiques des mélanges respiratoires synthétiques (Héliox, Hydrox, Hydréliox). L'évolution en fonction de la profondeur de 2 de ces paramètres, la vitesse du son C et la masse volumique U, se traduit essentiellement par un déplacement des fréquences des formants. Ce déplacement, considéré en grande partie res- ponsable de l'inintelligibilité de la parole hyperbare, est modélisé par la loi de Fant- Lindquist IM

2 2 2 2 2 F^ = k F + k (U, /U - 1)F

h a h a o

avec F , F, = fréquence du même formant respectivement dans l'air et dans le mélange hyperbare

k = C, /C = rapport des vitesses du son dans les deux mélanges U, /U = rapport des masses volumiques des deux mélanges

F = fréquence de résonance du conduit vocal fermé aux lèvres (air, latm).

° 2 9

La composante non linéaire, k (U, /U - 1)F , affectant les faibles fréquences peut, en pre- mière approximation, être négligée. Une compression d'un rapport k de l'enveloppe spectrale restituera donc la position des formants, corrigeant ainsi la parole déformée.

2 - VOCODEUR A CANAUX

Une telle compression peut être réalisée par le vocodeur à canaux dont le synoptique est donné en figure 1. Dans cette structure, le signal hyperbare x, (t) est analysé par une batte- rie de N filtres passe-bande contigus.

Chaque filtre est caractérisé par sa bande passante Bi et sa fréquence centrale fi (1^ i\< N) . L'amplitude du spectre x, (t) résulte du redressement et du filtrage passe-bas qui suivent.

Les filtres de synthèse, paramétrés par fsi et Bsi, et les limiteurs dont la sortie est soit +1 soit -1 selon le signe de l'entrée, déterminent la structure fine de l'excitation. La modulation en amplitude des harmoniques de cette excitation par le spectre correspondant res- titue le signal dans la bande filtrée. Le signal corrigé x (t) s'obtient alors par sommation des signaux de sortie des derniers filtres passe-bande.

L'optimisation d'une telle structure passe par l'optimisation des filtres constituant 1'analyse-synthèse.

Article published online by EDP Sciences and available at http://dx.doi.org/10.1051/jphyscol:19902185

(3)

COLLOQUE DE PHYSIQUE

fillre passe bande 1

151

.

BS 1

Fig 1: Synoptique d'un vocodeur à canaux

Fig 2: Evolution de Fo pour 3 échelonnements / 2 / A

?

- 3

-

FILTRES tAS5B-BANDE D'ANALYSE

3

-

1:Bandes passantes et échelonnement: La séléction des bandes passantes et fréquences centrales de ces filtres résulte d'une étude comparative faite au C.N.E.T Lannion /2/ de trois échelonnements differents (fig 2 ) . Des tests d'écoute ont été réalisés et la nette préférence

de l'échelonnement 3 s'expliquerait par le rapprochement de ce dernier, en basses fréquences du moins, de celui des bandes critiques de l'oreille (également représenté en fig 2 ) .

Toutefois il semble que l'échelonnement optimum ne tienne pas compte uniquement de l'oreille mais aussi du conduit vocal.

Basées sur ces considérations le tableau 1 donne les caractéristiques du banc choisi (indépen- damment du type de filtre). La progression arithmétique des AF permet une résolution plus fine dans le bas du spectre.

Compte tenu de la largeur du spectre hyperbare 31 filtres sont nécéssaires pour couvrir la bande 300Hz

-

12400Hz. Un 3ZeEe filtre élargit la bande à 13.1Kh.z permettant ainsi une meilleure fidélité au timbre.

de filtres choisi

\+ .I ~ $ 1 1

-

go 110 130 150 170 190 210 230 250 270 290 310 330 350 370 3 9 0 410 430 450 470 490 510 530 550 570 590 610 630 650 670 690 7 1 0

Tableau 1 :Caractéristique du banc

I L a bdb

300 390

390 500

500 630

630 760

760 950

950 1140 1140 1350 1350 1580 1580 1630 1830 2100 2100 2390 2390 2700 2700 3030 3030 3380 3360 3750 3750 4140 4140 4550 4550 4980 4980 5430 5430 5900 5900 6390 6390 6900 6900 7430 7430 7980 7980 8550 8550 $140 9140 9750 9750 10360 10380 11030 11030 11700 117M) 12390 12390 13100 I U

$45 445 565 705 885 1045 1245 1465 1705 1965 2245 2545 2865 3205 3565 3945 4345 4765 5205 5665 6145 6645 7165 7705 8265 8845 9445 10065 10705 11365 12045 12745

.

8

.-

9 i

N

FO

E. i ,

-

-A

i !

+

/

,+, 2 l

-

i r,

3 5 4

j r

6 7

//++/+

6 9

,./

/y* '*\ 10 11

)p

12

-1-

..--'a 13 14

/ 15

1 6

~c."'

17 16 19

- /- ,*/ys -

Echelonnement 1 20

---

Echelonnement 2 21

>.-/x-s

/

x-*-Echelonnement j 2 2 23

/' 4 Bandes critiques 24 25

/'

de l'oreille 26

27 28 29 3 0 3 1 3 2 IODw.ODm.01- ID. - . I O D - I I D O - w . a a r *

(4)

3

-

2: Choix du type de filtre: 3 critères determinent généralement le choix de ces filtres:

-

les variations de l'intensité et de l'enveloppe spectrale des differents sons exigent une dynamique d'au moins 50dB /3/

-

la réponse fréquentielle composite des differents filtres doit avoir une amplitude constante et une phase linéaire /4/

-

les caractéristiques des filtres passe-bande doivent être un compromis entre une bonne réso- lution spectrale et une réponse transitoire rapide.

Parmi les filtres R.I.1 ceux de Chebysheff et les elliptiques ne sont pas appropriés à une tep le application. Outre l'ondulation dans la bande passante qui les caractérise, ces filtres présentent une oscillation prolongée dans la réponse impulsionnelle; oscillation qui est à l'origine de l'effet de réverbération de la parole synthétique. Les figures 3, 4.et 5 montrent la convenance des filtres de Butterworth. Cependant l'attention particulière qu'il faut accor- der à la distorsion de leur retard de groupe, fig 6, pour satisfaire le deuxième critère constitue leur difficulté essentielle /5/.

Pig 3: Réponse idipulsionnelle d'un filtre Fig 5: Réponse impulsionnelle d'un passe-bas de Chebyshef f (geFe ordre, 120Hz) Butterworth (8Zme ordre, 120Wz)

Fig 4: Réponse impulsionnelle d'un filtre passe-bas elliptique (7e% ordre, 120Hz)

Fig 6: Retard de groupe d'un filtre de Butterworth (8e% ordre, 120Hz) La linéarité de la phase est assurée avec les filtres R.I.F. Les méthodes d'approximation

" ~ a r fenêtre" permettent à ces filtres d'approcher la réponse fréquentielle désirée avec une grande flexibilité. Le choix de la fenêtre de Hamming, par rapport aux autres fenêtres, se justifie par une meilleure séléctivité, une dissipation maximale d'energie dans le lobe prin- cipal et une atténuation du lobe secondaire d'env'iron 45dB. La figure 7 illustre une telle approximation. Compte tenu de la symétrie observée autour du point (wc, 0.5) il est légitime de penser que si une seule et même fenêtre est utilisée dans un banc de filtres alors les ondulations en bandes passantes et en bandes atténuées vont s'annihiler. La confirmation de ce raisonnement est donnée par la figure 8. Une ondulation crête à crête d'environ 1.5dB se manifeste aux hautes fréquences. Cette ondulation est insignifiante compte tenu de la faible sensibilité du système auditif aux fréquences élevées.

(5)

C2-796 COLLOQUE DE PHYSIQUE

Fig 7: Passe-bas résultant d'une approxi- mation par "fenêtre"

Fig 8: Réponse fréquentielle composite du banc d'analyse

4-- FILTRES PASSE-BANDE DE SYNTHESE

La détermination des fréquences centrales et des bandes passantes de ces filtres n'est

fonction que de la correction spectrale recherchée. La compression dans un rapport constant k de l'enveloppe spectrale du signal hyperbare est obtenue avec des filtres caractérisés, d'apré;

les notations de la figure 1,par £si = fi/k et Bsi = Bi/k pour 1 &SN

La réalisation de ces filtres est évidemment soumise aux mêmes critères que ceux des filtres d'analyse. Pour une profondeur de 150m par exemple f6/ donne en plus de la composition de 1'Héliox (3.1% d'oxygène et 96.9% d'hélium) le rapport k = 2.6 nécéssaire. La figure Y représente la réponse fréquentielle Composite du banc correspondant à ce cas.

5

-

CONCLUSION

Les filtres passe-bande d'analyse et de synthèse ont été discutés et désignés. Le principe exploite à la fois la linéarité de la phase des filtres R.1.F et la symétrie des régions de transitions résultant de l'approximation par une feîïêtre.

La spécification des filtres passe-bas d'analyse dépend du choix de leur bandes passantes.

Celles-ci doivent être suffisantes pour d'une part suivre les variations d'énergie dans la bande filtrée et d'autre part rejeter les fréquences ondulantes du signal redressé.

Des tests d'écoute effectués sur des échantillons de parole hyperbare corrigée donnent une intelligibilité satisfaisante. Le fait que l'extraction du fondamental soit élaborée à partir du signal hyperbare lui même présente, à l'audition des simulations, peu l'effet synthétique.

1

I 5

-

R.N. Golden: Vocoder filter design

-BOL Practical considerations J.A.S.A 43 n4 68

L .

, 3

6

-

A. Saadane: Optimisation d'un vocodeir

c 1250 2500 3750 à canaux pour la correction de la parole

625 1875 3125 4375

F C Pen ~H. ~ ~ ~ ~ ~ hyperbare. Thèse tiniversité Rennes1 1989

DB

r '

Références bibliographiques:

O - 1

-

G. Fant: Acoustic theory of speech

I production lYrOUTON 1970 The HAGUE.

2

-

F. ZURCHER: Vocodeur à canaux

-.O{ cours ENST-Br 4-8 février 1985

Fig Y: Réponse fréquentielle composite du banc de synthèse ( k = 2.6) 11

j -60-

3

-

J.L. Flanagan: Speech analysis, syn- thesis and perception Spring-verlag 1972 4

-

R.W. Schaffer, L.R. Rabiner: Design of digital filter banks for speech Bell svstem technical.30~ Vol 50 n0lO 71

Références

Documents relatifs

En raison de leur faible taux de morbidité et de la précision de leurs résultats, la laparoscopie et la biopsie péritonéale sont les techniques les plus recommandées pour

Discover the genomic variants in the abomasal mucosa transcriptomes of Creole goats resistant or susceptible to Haemonchus contortus and characterized the

Ce logiciel repose donc sur un calcul géométrique plus ou moins complexe selon la nature et la combinaison des interactions considérées. Cependant, plus les

Il se penche sur le stockage haute pression de l’hydrogène pour des réservoirs de type IV où le liner, assurant uniquement la fonction d’étanchéité à

53 Figure 4.8 : Pic de qualité d’image en fonction du diamètre pupillaire pour les zones centrale et périphérique avec et sans aberration sphérique.. 53 Figure 4.9 :

Mean of CoP surface (A), CoP length in the medial–lateral axis (B) and CoP speed (C) for five different conditions (OKN + SVV: 80° left and 80° right, respectively, no OKN + SVV,

likelihood that children enter into the dialogue, express their opinions and provide..

Dans la première partie de l'étude l'effet prépondérant de la célérité du son et de la masse volumique du mélange respiratoire sur la fonction de transfert du conduit vocal