• Aucun résultat trouvé

Quelques filtres des prothèses audio

Dans le document Traitement du Signal (Page 31-38)

Les fabricants de prothèses auditives communiquent très peu sur le contenu des filtres et opérations de traitement du signal développés. Nous ne pouvons donc pas aborder ces types de filtres avec précision. Cette partie apporte une vue globale sur les opérations de traitement du signal utilisées dans les prothèses.

Une des difficultés principales consiste à traiter le signal audio en temps réel, c’est-à-dire le plus rapidement possible afin que le signal envoyé dans les oreilles corresponde avec celui reçu par la prothèse.

5.3.1 Amplificateur et compression

L’amplificateur simple modifie l’amplitude du signal, mais ne change rien à son spectre : toutes les fréquences sont amplifiées de manière identique. Par contre en fonction de la sensibilité fréquentielle d’un patient, on pourra augmenter certaines fréquences et en diminuer d’autres. Les personnes âgées perdent souvent de la sensibilité dans les fréquences élevées, un filtre qui leur sera adapté renforcera alors plus particulièrement ces fréquences.

5.3.2 Réduction de bruit

Un premier filtre peut être appliqué au signal entrant : filtre passe-haut de fréquence de coupure à 40Hz, ce qui permet de supprimer tous les bruits en BF.

Sinon, on peut également déterminer le spectre caractéristique du bruit que l’on souhaite supprimer pour ensuite le soustraire au signal sonore. On utilise pour cela le fait que le signal sonores(t) peut se décomposer comme la somme d’un signal résiduel r(t) et d’un bruitb(t) :

s(t) =r(t) +b(t) (85)

S(f) =R(f) +B(f) (86)

R(f) =S(f)−B(f) (87)

A partir d’une base de données de bruit caractéristiques, un micro-processeur peut sélectionner le bruit adapté à la situation courante et le soustraire dans le domaine fréquentiel au signal entrant.

Estimation du niveau de bruit Les algorithmes d’estimation du niveau de bruit sont très importants pour le filtrage du signal audio. Il s’agit d’estimer la densité spectrale de bruit, c’est-à-dire à la fois le niveau sonore et la répartition spectrale.

Dans ce type d’approche, le bruit est considéré comme stationnaire ou quasi-stationnaire, c’est-à-dire que que les statistiques du bruit de fond varient lentement par rapport à celles du signal source.

La parole est consitituée d’une alternance de sons et de silences, l’estimation du bruit peut donc se faire sur les périodes de silence. On suppose alors que le bruit de fond conserve les mêmes statistiques en dehors de ces périodes. Pour détecter les zones de silences et les zones de sons, on utilise un détecteur d’activité vocale basé à la fois sur le niveau sonore et le contenu spectral.

L’estimation du niveau de bruit peut également se faire de manière continue. On considère approximativement que toute hausse instantanée du niveau au-dessus de la valeur moyenne estimée du bruit témoigne de la présence de signal.

Rehaussement de la parole Dans un contexte mono-capteur, plusieurs solutions peuvent être envisagées : réduction paramètrique du bruit (très coûteux en calcul), utilisation de filtres en ondelettes ou analyse spectrale à court-terme. Cette dernière solution est très efficace pour réduire le bruit de fond.

5.3.3 Sélection de signaux

La sélection du type de signal peut se faire de manière manuelle par le malentendant (choix d’un programme) ou de manière automatique. Ce type d’opération consiste à extraire quelques informations caractéristiques du signal entrant afin de déterminer sa nature.

Par exemple, une détection de tempo peut renseigner : – pas de tempo défini : signal de parole,

Figure35 – Processus pour le rehaussement de la parole à partir d’une analyse spectrale à court terme [3]

Un signal de parole peut également se caractériser par une forte énergie entre 500Hz et 2000Hz.

Le rapportR= Energie[500−2000]

Energie[2000−8000]

peut ainsi permettre de classer le type de signaux. La sélection de signaux permet ensuite d’adapter le type de filtre utilisé dans la prothèse avec le signal d’entrée.

5.3.4 Annulation du retour acoustique

Supposons, pour commencer, qu’il n’y ait pas de retour acoustique entre l’écouteur et le microphone. Le système équivalent est illustré sur le schéma de la figure 9.1. La relation entre le signal source capté par le microphone,s0(t), et le signal émis par l’écouteur,y0(t), est une simple relation d’entrée/sortie en boucle ouverte (voir figure 34). Toutes les fonctions de transfert peuvent être considérées en première approche comme étant des filtres linéaires invariants.

Figure36 – Schéma de la prothèse auditive sans bouclage. A(z) est la fonction de transfert du microphone,B(z) celle de l’écouteur etG(z) la fonction de transfert discrète de la puce de traitement qui opère la compensation des pertes auditives.

[3]

La fonction de transfert du système sans bouclage s’écrit alors : H(z) = Y0(z)

S0(z) =A(z)·G(z)·B(z) (88)

Marie Tahon Page 32 / 45

Lorsqu’on prend en compte le retour acoustique, c’est comme si la sortie du microphone entrait également dans la chaîne de traitement (voir figure 35).

Figure 37 – Schéma de la prothèse auditive avec bouclage. [3]

C(z) étant la fonction de transfert du canal acoustique du chemin d’écho, on en déduit les relations suivantes :

X0(z) =S0(z) +U0(z) (89)

Y0(z) =A(z)·G(z)·B(z)×X0(z) (90)

U0(z) =C(z)·Y0(z) (91)

La fonction de transfert du système avec bouclage s’écrit alors : H(z) =Y0(z)

S0(z) = A(z)·G(z)·B(z)

1−A(z)·G(z)·B(z)·C(z) (92)

Il s’agit de l’équation d’un système en boucle fermée. Sous certaines conditions, ce système peut donc devenir instable et causer le phénomène de Larsen. On peut montrer qu’il existe un critère de stabilité de cette boucle fermée :

|G(z)A(z)B(z)C(z)|<1,∀z∈Γ où Γ est le cercle unité (93) Le bouclage acoustique peut également engendrer des distorsions du signal par rapport au signal traité idéalement.

Dans le but de compenser les pertes auditives d’un malentendant, la mission première d’une prothèse auditive est d’amplifier le signal. Cela induit nécessairement de fortes valeurs pour le facteur|G(z)|car les gains d’amplifications peuvent atteindre des valeurs proches de 75dB pour les surdités sévères. De même, pour le chemin d’écho,|C(z)| est d’autant plus important du fait :

– de la proximité entre les transducteurs électroacoustiques, – d’une éventuelle mauvaise étanchéité de l’embout et

– de la présence d’évents plus ou moins larges pour éviter l’effet d’occlusion.

Sans solutions adéquates, le seul moyen de se prévenir de l’effet Larsen serait donc de réduire le gain d’amplification de la prothèse. Or, si le gain est réduit en-dessous du seuil nécessaire pour compenser la hausse des seuils d’audibilité du malen-tendant, la prothèse ne remplit plus intégralement son rôle de réhabilitation.

Afin de favoriser la condition suffisante de stabilité (équation 93), deux stratégies principales sont envisageables pour la réduction du phénomène de bouclage. La première consiste à agir sur le chemin d’écho afin de réduire |C(z)|, la seconde contraint le gain de la prothèse afin de réduire|G(z)|.

Le premier type de solution repose en fait sur le travail de l’audioprothésiste. Sur ce point, son travail consiste à assurer une bonne étanchéité acoustique par une réalisation précise de l’embout auriculaire (pour une prothèse de type contour d’oreille) ou de la coque (pour une prothèse intra-auriculaire) par rapport au conduit auditif du malentendant.

Figure38 – Gabarit d’un filtre réjecteur. [3]

Dans certains systèmes analogiques ou dans certains systèmes numériques de première génération, un filtre réjecteur permet de réduire le phénomène de Larsen pour une fréquence fixe comme le représente la figure 36. Le réglage de la fréquence rejetée est effectuée par l’audioprothésiste lors de la mise en place de l’appareil. En pratique, ce réglage se fait selon les étapes suivantes :

1. l’embout auriculaire est introduit dans le conduit auditif du patient, 2. un phénomène de Larsen est alors généralement constaté,

3. l’audioprothésiste ajuste ensuite, pas à pas, la fréquence centrale de la bande rejetée jusqu’à la disparition du sifflement.

Les solutions les plus récentes utilisent des filtres réjecteurs adaptatifs plus robustes aux variations d’environnement, l’an-nulation d’écho par filtrage adaptatif. Il existe aussi des solutions permettant de limiter la fréquence d’accrochage (fréquence du Larsen) en faisant varier dans le temps la phase et le délai. Pour plus de précision sur ces méthodes, se reporter aux travaux de Thomas Fillon [3].

5.3.5 Localisation des sources

Dans un contexte multi-capteurs, deux ou trois microphones sont placés sur l’appareil et le rehaussement du signal est réalisé par traitement d’antenne en focalisant l’antenne acoustique ainsi formée dans une direction privilégiée. En général, le diagramme de directivité correspondant est fixe et privilégie les sources frontales car la source utile émane généralement d’un locuteur placé en face du malentendant.

Dans certaines prothèses très récentes, le traitement d’antenne est réalisé de manière adaptative afin que les lobes de réjec-tion du diagramme de directivité restent dans l’axe estimé de la source du bruit. Ce type de méthodes adaptatives estime la direction de la source de bruit pour réduire son influence et non celle de la source utile pour la privilégier. Elles reposent sur l’hypothèse que le bruit est quasi-stationnaire et lentement variable dans le temps relativement à la source utile qui est généralement non-stationnaire (signal de parole).

Dans ce cas le réhaussement de la parole est limité aux signaux provenant de sources frontales. Le malentendant doit donc se tourner vers la source. Ceci n’est pas particulièrement gênant lors d’une conversation, d’autant plus qu’un malenten-dant a naturellement tendance à s’aider de la lecture labiale pour améliorer sa compréhension. Néanmoins, dans d’autres situations le traitement se révèle peu naturel et ne prend pas en compte le cas où la source utile n’est pas dans la zone frontale.

Marie Tahon Page 34 / 45

6 La parole

Cet chapitre porte sur la voix, ses modes de production ainsi que sur la parole.

6.1 La voix

La voix est utilisée au quotidien. C’est à la fois un moyen de communication verbal et non-verbal et un instrument de musique. Chaque individu étant unique, chaque voix est unique. La voix est un sujet qui est abordé dans un grand nombre de disciplines :

– Linguistique

– Acoustique de la parole (analyse et synthèse) – Traitement automatique de la parole

– Chant, théâtre – Orthophonie – Phoniatrie – Communication – ...

6.1.1 Anatomie

Figure 39 – Appareil vocal vue d’ensemble (gauche) et vue du larynx (droite) [5]

CPDA 3

Traitement du Signal 2014-2015

6.1.2 Production du son

Le relâchement du diaphragme entraîne une expulsion de l’air (expiration passive), éventuellement aidé par les muscles expirateurs (expiration forcée). La forte pression sous les cordes vocales les forcent à s’ouvrir. L’air en passant crée une force de Bernoulli (augmentation de la vitesse et baisse de la pression) qui ferme les cordes vocales. Et ainsi de suite, un train de bouffées d’air est envoyé dans le conduit vocal.

Afin d’étudier le fonctionnement de la production de la voix, plusieurs méthodes peuvent être utilisées : Méthodes invasives (figure 38) :

– Laryngoscopie à miroir (1850) – Fibroscopie souple (1980)

Fig2 : Plages de fréquences

couvertes en moyenne par les mécanismes laryngés 1 et 2 chez l’homme et la femme.

Pour revenir à des aspects physiologiques, la différence importante entre ces deux mécnismes réside dans la participation ou non du muscle vocal à la vibration des cordes vocales. En M1, le muscle vocaliste va participer à la vibration des cordes vocales. On va avoir une vibration sur l’épaisseur du muscle. En M2, le muscle vocal, même s’il peut rester contracté, va se découpler de la phonation. On ne va plus avoir de vibration que sur les ligaments et sur la partie de muqueuse. Les cordes vocales seront par essence beaucoup plus fines.

2) Revue des méthodes de visualisation et d’analyse du mouvement des cordes vocales.

Disposer de méthodes de visualisation et de quantification du mouvement des cordes vocales est très intéressant afin de mieux comprendre la vibration des cordes vocales

L’observation du mouvement des cordes vocales en phonation a débuté à la fin du 19ème siècle avec l’invention, par M Garcia, du Laryngosope à miroir. (1850). Ce petit miroir, que l’on place au fond de la gorge, permet d’observer les cordes vocales. Les méthodes se sont ensuite perfectionnées et les années 80 ont été l’avènement de méthode de visualisation plus modernes basées sur l’endoscopie rigide (on introduit une caméra dans la bouche du locuteur ou du chanteur) ou sur l’endoscopie souple également appelée fibroscopie (on introduit un endoscope souple dans le nez du locuteur ou du chanteur).Pour visualiser le mouvement périodique des cordes vocales plus en détail, on utilise des méthodes basée sur la stroboscopie et la cinématographie ultrarapide.

Fig3 : Méthode de visualisation du mouvement des cordes vocales (Laryngoscope à miroir, fibroscopie)

L’avantage de la fibrosopie est de permettre la visualisation de toute sortes de phonation, en particulier du chant. Au contraire, avec un endoscope rigide, on ne va pouvoir examiner que certains types de phonation, en particulier seulement certaines voyelles qu’il est possible de produire avec la langue tirée vers l’extérieur. L’endoscopie rigide est très invasive mais fait preuve d’une meilleure précision au niveau des images.

d ’après Castellengo, 1991

Figure40 – Méthodes d’observation du fonctionnement des cordes vocales

Méthodes non invasives :Electroglottographie EGG (figure 39)

En conclusion, toutes ces méthodes très invasives permettent une très bonne visualisation du mouvement des cordes vocales mais rendent des mesures beaucoup plus difficiles.

C’est pourquoi on s’intéresse également à des méthodes non invasives.

La première, très utilisée par la communauté de la parole, est celle du filtrage inverse. Cette méthode se base sur l’hypothèse forte que la production vocale peut se modéliser par une source et un filtre afin de pouvoir, par des techniques de filtrage inverse, reconstituer le débit qui traverse la glotte au cours du temps.

Cependant, cette hypothèse forte n’est pas toujours valide dans certains cas. C’est pourquoi il est intéressant de trouver des méthodes à la fois non invasives, indirectes mais surtout qui ne se basent pas sur des modèles, c’est à dire qu’elles ne se basent sure aucune hypothèse préalable quant au mouvement des cordes vocales.

L’Electroglottographie en est une. Elle permet en effet d’avoir accès au contact entre les cordes vocales sans émettre d’hypothèse.

Le principe est le suivant : Deux électrodes sont attachées sur le cou du chanteur de part et d’autre de la glotte. Elles mesurent une différence de potentiel reliée à la résistance que le courant reçoit lorsqu’il traverse l’espace entre ces deux électrodes. Si la glotte est fermée, le courant va très facilement passer d’une électrode à l’autre. Le signal Egg va donc être très élevé. Quand la glotte est ouverte, le signal est plus faible, car le courant a plus de difficulté à passer d’une électrode à l’autre.

Fig4 : Principe de l’electroglottographie

3) Analyse et applications du signal Electroglottographique

Ce signal Egg est très intéressant car il nous permet d’avoir une mesure directe du contact entre les cordes vocales. Le contact correspond au sommet de la courbe verte de la figure 5, l’ouverture au contraire au bas de la courbe. On peut également s’intéresser à la dérivée de ce signal (en bleu), qui permet plutôt de mettre en avant des phénomènes de variations rapides de contact, en particulier à la fermeture ou à l’ouverture. Ces variations rapides sont repérées par des pics très marqués de ce signal dérivé du signal Egg. Les pics « positifs » très marqués vont être reliés aux instants de fermeture glottique, c’est à dire les instants où le débit va commencer à diminuer jusqu’à s’annuler. Les pics « négatifs » moins marqués sont reliés aux instants d’ouverture glottique, c’est à dire les instants où le débit va commencer à s’accélérer et à passer à travers la glotte.

Fig 8 : Définition du quotient ouvert par rapport à la période du signal Degg et aux instants d’ouverture et de fermeture glottique.

Nous avons fait des mesures en voix chantée, en particulier sur des glissandos. Ci-dessous est représenté un glissando chanté par un ténor.

Fig 9 : Relation entre mécanisme laryngé et quotient ouvert

On entend les ruptures correspondant au changement de mécanisme. Le chanteur commence à chanter en M1, passe en M2 puis revient en M1. On observe ces mêmes ruptures sur la courbe (verte) représentant la fréquence fondamentale. Le quotient ouvert (en bleu) en M1 a des valeurs relativement faibles (< 0, 5) et plus élevées en M2 (0.5< Oq<0.8) . On note également un saut de Oq comme un saut fréquence à la transition des deux mécanismes.

Cependant, chez les chanteurs qui arrivent à « lisser » perceptivement ces passages d’un mécanisme à l’autre, c’est à dire pour lesquels il n’y a pas de rupture perceptive ni fréquentielle, on constate quand même un saut important de Oq. Cela est une technique très bien contrôlée par les contre-ténor, dont un exemple est représenté ci-dessous.

OUVERTUR

A partir d’une mesure d’EGG (électro-glotto-graphie), on peut avoir accès à la forme d’onde de l’ouverture des cordes vocales. Cette mesure apporte un grand nombre d’information sur le son produit. C’est un signal périodique qui permet de déterminer la fréquence fondamentale du son émis. La forme de l’onde permet également de détecter des éventuelles pathologies.

Contrairement aux "anches faibles" (trompette, clarinette), les cordes vocales imposent leur fréquence de vibration et le conduit vocal ne les influence pas : "anche forte". Il se produit alors un son de fréquence fondamentale celle de vibration des cordes vocales qui est contrôlé uniquement par les muscles du larynx.

Il existe plusieurs modes de vibration des cordes vocales : – Mécanisme M0 : Fry

– Mécanisme M1 ou de ’poitrine’ (parole) : la quasi-totalité de la masse et de la longueur des cordes vocales est en vibration. L’ouverture et la fermeture des cordes ont la même durée

– Mécanisme M2 ou de ’tête’ : une fraction de la masse des cordes vibre. La fermeture est plus brève – Mécanisme M3 ou de sifflet (cri)

La mesure d’EGG permet de déterminer des voix pathologiques (nodules, corde paralysée, etc.)

Marie Tahon Page 36 / 45

CPDA 3

Traitement du Signal 2014-2015

28 de fermeture et d’ouverture.

Le patient est porteur d’un collier muni d’électrodes, posées de part et d‘autre du cartilage thyroïde, et d’un microphone.

Le signal électrique recueilli, (variation de l’impédance électrique des tissus du cou) produit une courbe d’ondes, visualisée sur un écran informatique ou sur un oscilloscope.

La fermeture est par convention représentée par la montée positive de gran-de amplitugran-de gran-de la courbe, l’ouverture complète correspond à une intensité minima et une amplitude nulle (fig. 28, 29).

La courbe d’ELG sera faite sur une voyelle tenue dans les mécanismes 1 et 2.

A partir de cette courbe, on peut calculer la fréquence fondamentale de la voix (inverse de la période).

Cette analyse électrolaryngographique renseigne sur la qualité de l’acco-lement, la durée respective des temps de fermeture et d’ouverture, la régu-larité des cycles vibratoires, dans des conditions physiologiques d’émission vocale.

Les appareils les plus utilisés sont le GFA, le laryngograph, le Key Elemetrics, qui analysent par ailleurs de très nombreux paramètres.

FIGURE 28 :

– En haut : aspect en stroboscopie.

– Au milieu : aspect correspondant sur une coupe frontale des cordes vocales.

– En bas : courbe d’onde en électrolaryngographie : I - début de l’accolement cordal (face inférieure) II -

III - fermeture complète

IV - début d’ouverture (face intérieure) VI - ouverture complète en mécanisme lourd.

Figure42 – Visualisation de la vibration des cordes vocales et débit d’air entre les cordes vocales associé [8].

Selon la hauteur:

Dans un mécanisme I ou lourd, (sons médium ou graves) :

le décollement des bords libres des cordes vocales va progresser de bas en haut, d’abord à la face inférieure de la corde vers la face supérieure. Il existe un décalage de phase. Le muscle vocal est contracté et vibre dans son ensemble.

Les temps de fermeture et d’ouverture sont à peu près d’égale durée.

L‘ondulation muqueuse est ample et parcourt toute la surface de la corde vocale (fig. 8).

Dans un mécanisme II ou léger (sons aigus) :

Les cordes vocales vont s’étirer sous l’action du ligament vocal, se tendre et donc s’amincir. Le muscle vocal est relâché. Seul le bord libre va vibrer et l’ondulation muqueuse est peu marquée. Il n’y a plus de décalage de phase.

Le temps de fermeture est plus bref (fig. 9).

Selon l‘intensité: elle est liée à la pression sous-glottique et à la qualité de l’accolement cordal, qui augmente avec l’intensité.

Dans un mécanisme I ou lourd, (sons médium ou graves) :

le décollement des bords libres des cordes vocales va progresser de bas en haut, d’abord à la face inférieure de la corde vers la face supérieure. Il existe un

le décollement des bords libres des cordes vocales va progresser de bas en haut, d’abord à la face inférieure de la corde vers la face supérieure. Il existe un

Dans le document Traitement du Signal (Page 31-38)

Documents relatifs