• Aucun résultat trouvé

comprend plusieurs logiciels répartis en modules Deux de ces

Les mesures objectives

Phonos 1 comprend plusieurs logiciels répartis en modules Deux de ces

modules permettent l'édition du signal de parole, une analyse spectrale, l'extraction de la fréquence fondamentale, une visualisation en temps réel de l'intensité, du rythme, de l'articulation des sons fricatifs, le temps maximum phonatoire et une représentation de la durée expiratoire.

Signalyse créé par Keller E, analyse tous les signaux acoustiques (sons,

parole, musique,…). Le signal offre une édition du signal de parole, l'extraction de la fréquence fondamentale, une analyse spectrale à long terme, un spectrogramme, un spectre moyenné, le cepstre, et l'étiquetage phonétique.

Spectra plus est un logiciel d'analyse spectrale créé par Cardot G, Peret Ph et

Patte J. Il s'applique dans l'enseignement, l'acoustique architecturale, la recherche médicale, l'O.R.L., la logopédie, l'audio-phonologie, la sonorisation professionnelle. On obtient l'enveloppe vocalique (amplitude en fonction du temps), le spectre, le spectre en 3 dimensions, et le sonagramme.

N-UNICE est un logiciel d'analyse acoustique et phonétique de la parole. Il

fournit spectre, spectrogramme, édition du signal de parole, courbe mélodique, courbe d'intensité et étiquetage phonétique.

O-WINSNORRI, logiciel d'étude de parole, est destiné à la recherche en

phonétique. Il permet l'édition du signal de parole, le spectrogramme, l'analyse spectrale, l'extraction de la fréquence fondamentale, la détection des formants et les étiquetages phonétiques.

C.E.C.I.L. est un logiciel destiné à l'analyse de la voix normale et pathologique.

Il permet d'obtenir le signal de parole, le spectre, le spectrogramme, la fréquence fondamentale, la courbe d'intensité, la courbe mélodique, la courbe du jitter et du shimmer.

Dr Speech est un logiciel d'analyse de la parole et d'évaluation de la qualité de

la voix. L'analyse quantitative et qualitative de la fonction vocale est réalisée par une édition du signal de parole, une analyse spectrale à long terme, la fréquence fondamentale, l'intensité, le shimmer, le jitter, l'évaluation du signal électroglottographique, le phonétogramme en temps réel et le spectrogramme.

PHONEVAL est un logiciel destiné à l'évaluation des voix pathologiques. Il a

été mis au point par Perrin E. Il présente un ensemble d'outils informatisés de traitement du signal de parole par le biais de l'analyse sonagraphique : l'analyse

spectrale, la détection de la fréquence fondamentale et de l'intensité ainsi que des mesures de perturbations soit le jitter et le shimmer.

SOUNDSCOPE a également un champ d'application très vaste puisqu'il

s'applique tant dans le domaine de la clinique que de la recherche , de l'enseignement et de l'industrie. Il fournit l'édition du signal de parole, le spectrogramme, la fréquence fondamentale, le jitter et le shimmer, le spectre, l'enveloppe d'amplitude et le rapport signal/bruit.

4.3. LES APPAREILS UTILISÉS DANS NOTRE RECHERCHE.

Les trois appareils que nous avons utilisés sont l'analyseur dynamique de signal de Hewlett Packard[117], le "Computer speech lab" de Kay Elemetrics [159, 160] et l'Evaluation vocale assistée des Laboratoires Parole et langage de Marseille [293, 296]. Nous en faisons une description détaillée aux points suivants.

4.3.1.

L’analyseur dynamique de signal de Hewlett Packard (modèle

3561A).

Ce modèle est un analyseur dynamique de signal. Ses capacités d’analyse sont puissantes. Adapté au secteur de la voix, cet instrument est devenu un outil courant d’analyse spectrale. Il offre une étendue fréquentielle d’analyse s’échelonnant de 0 à 100.000 Hz avec une plage dynamique de 80 dB et une précision en amplitude de 0.15 dB.

Figure 21 : Analyseur dynamique de signal Hewlett Packard modèle 3561 A18[117].

18 Mesures simultanées dans le domaine du temps et de la fréquence.

2 Plage de mesure de 100 kHz

3 "Moyennage" pour améliorer la précision. 4

Fonctionnement en programmation HP-IB. 5 Tracé numérique directe.

6 Dynamique de 80 dB, précision en amplitude de plus +/- 0.15 dB. 7.Zone de commande des marqueurs de précision.

4.3.1.1. L'analyse spectrale.

La parole résulte des actions du tractus vocal. Toute modification acoustique du signal devrait être le signe d’une modification des organes vocaux.

Le vibrateur produit le son, qui est filtré par le tractus vocal tant en fréquence qu'en amplitude. La muqueuse laryngée absorbe l'onde glottique. Les résonateurs renvoient l'énergie acoustique sous forme de fréquences et d'harmoniques. Pour chaque voyelle, le volume et la forme du tractus vocal changent ; les caractéristiques de résonance sont modifiées, ce qui influence l’amplitude spectrale.

En analyse spectrale, la quantité d'informations d'une émission simple telle que celle d’une voyelle est importante. Beaucoup d’études ont tenté de déterminer quels aspects ont du sens, quels autres peuvent être ignorés dans la recherche de conclusions relatives au comportement productif et perceptif.

Le théorème de Fourier fournit le raisonnement de base. La technique consiste en l’utilisation sophistiquée de filtrages électroniques. Le théorème de Fourier affirme que n’importe quelle forme ondulatoire périodique peut être divisée en une série d’ondes sinusoïdales de fréquences différentes, d'amplitudes variables et de rapports de phases divers. Les fréquences de ces composantes d’ondes sont toutes des multiples intégrales de la répétition du fondamental de l’onde de base et sont appelées des harmoniques. La méthode la plus habituelle consiste à filtrer le signal de parole avec des filtres passe-bandes. Un filtre passe-bande est celui qui transmet des fréquences à l’intérieur d’une étendue restreinte et neutralise des fréquences aiguës et basses. La largeur du filtre détermine l’ampleur de l’étendue des fréquences qu’on laissera passer. Les fréquences définissent les limites supérieures et inférieures du passe-bande. Ces limites sont appelées les fréquences de coupage du filtre (cutoff). Les filtres qui ont un passe-bande étroit peuvent résoudre des fréquences étroitement espacées mais leurs réponses sont lourdes et lentes. Des filtres à bandes larges répondent rapidement, leur temps de résolution est très court, mais la résolution de la fréquence est pauvre. Il y a toujours ainsi un compromis entre le temps et les fréquences. La résolution de l’un ou de l’autre peut être optimisée mais pas les deux. Cette résolution est importante, car elle signifie que l’utilisateur doit sélectionner des filtres afin de montrer ou des points fins au changement temporel en utilisant des passe-bandes larges, ou les fréquences précises des composantes du signal en utilisant des filtres à bandes étroites.

Le processus utilisé pour déterminer les composantes d’une onde est appelé analyse de Fourier. C’est une technique de division par laquelle une vibration complexe est divisée dans ses composantes de vibrations harmoniques simples.

Les algorithmes des ordinateurs demandent un temps très long de résolution. Pour pallier cette contrainte, l’analyse de Fourier à transformation rapide a simplifié et accéléré le processus de résolution. Le spectre est représenté par un graphe, l’axe horizontale affiche les fréquences, l’axe verticale affiche les amplitudes. Les ondes a- périodiques affichent un spectre continu.

Comme le spectre acoustique de la parole est le produit tant de la source vocale que des caractéristiques du filtrage du tractus vocal, l’analyse du spectre nous offre la possibilité d’observer tant le fonctionnement laryngé que les mouvements articulatoires. Les méthodes d’évaluation se basent d’abord sur les spectrogrammes et sur une autre forme d’analyse : l’analyse spectrale à long terme. Cette méthode consiste à prendre la moyenne de tous les sons constituant le spectre d’un échantillon relativement long. Des investigations nous montrent que ce type d’analyse est fort prometteur en tant qu’indice de la qualité vocale. Les quelques techniques discutées se révèlent utiles dans l’évaluation de la pathologie des cordes vocales.

La recherche sur les méthodes spectrographiques utilisées pour analyser la qualité vocale s’est concentrée spécialement sur la caractérisation et la quantification de l’énergie acoustique située entre les fréquences harmoniques. Le contenu harmonique du signal vocal est le résultat d’une interruption quasi périodique du flux d’air généré par les cordes vocales. L’énergie non harmonique (bruit) est la corrélation acoustique d’un flux transglottique turbulent ininterrompu. Les différents aspects du bruit de la source glottique peuvent être observés dans les spectrogrammes larges et étroits (Cornut (1991)[46]) où sont comparées les productions des sons normaux et des sons de voix enrouées. L’anormalité peut être observée dans l’espacement irrégulier des striations glottiques et dans l’environnement du bruit, évident dans l’analyse à bande large. Les différences entre les voix normales et enrouées sont plus apparentes dans les spectrogrammes à bande étroite. Cet effet est dû aux lignes claires des harmoniques vocaux.

Yanagihara et al (1967)[356] ont évalué des orateurs hommes et femmes ayant des degrés variables d’enrouement. La spectrographie à bande étroite des voyelles

soutenues [u], [o], [a], [e], [i] à une intensité et une hauteur moyennes a pu être catégorisée en 4 types qui corrélait bien avec le degré de sévérité de l’enrouement. Les catégories de cette spectrographie sont classées selon les critères suivants :