1.2 Production de la parole

(1)

Introduction

1.1 Pr´ eliminaires

L’analyse de la parole est pratiquée couramment dans le milieu clinique, afin d’évaluer les troubles de la parole des patients. Il s’agit d’un moyen d’évaluation non-invasif en vue de la documentation quantitative de la qualité de voix. Sou- vent, l’évaluation des troubles de la parole est effectuée de fa¸con subjective par les médecins. L’inconvénient est que les résultats peuvent varier en fonction du médecin et même pour un même médecin, selon le moment de l’examen. Afin d’améliorer l’efficacité des évaluations, des analyses objectives, fournies par des programmes informatiques, sont donc les bienvenues.

Cette thèse s’inscrit dans le cadre de la recherche d’indices acoustiques per- tinents pour l’analyse de la parole dans le domaine clinique. Des indices acous- tiques relatifs aux perturbations basse-fréquence du signal de parole sont pro- posés et appliqués à l’analyse de la parole de locuteurs atteints de la maladie de Parkinson. Les objectifs de ce travail sont développés dans ce chapitre, après une description du système de production de la parole et une présentation des analyses de la parole pratiquées dans le milieu clinique.

1.2 Production de la parole

1.2.1 Anatomie

L’anatomie du système de production de la parole est représenté à la figure 1.1. Le principe de production de la parole est le suivant. De l’air est expiré des poumons à travers les bronches, le larynx, le pharynx et la cavité orale ou la cavité nasale. Le pharynx et les cavités orale et nasale forment le conduit vocal.

Les variations de la pression de l’air aux lèvres et aux narines produisent le signal acoustique de parole. La plupart des sons sont déterminés conjointement par la pression de l’air à la sortie des poumons, par la vibration éventuelle des cordes vocales et par la forme du conduit vocal. Celle-ci est obtenue au moyen des muscles articulatoires qui fixent notamment la position du larynx, de la mˆ achoire, de la langue, des lèvres ou du voile du palais. Lorsque le voile

1

(2)

du palais ouvre l’entrée de la cavité nasale, cette dernière est acoustiquement couplée à la cavité orale et un son nasal peut être produit. Lorsque le voile du palais ferme l’entrée de la cavité nasale, on obtient un son oral.

Fig. 1.1 – Anatomie du syst`eme de production de la parole [87].

Il existe trois principaux types de sources sonores : Le premier est la vi-

bration des cordes vocales dans le larynx. L’air passe alors par bouff´ees, ce qui

produit le son. Le deuxi`eme est le passage turbulent de l’air dans une constric-

tion du conduit vocal. Enfin le troisi`eme est le bruit d’explosion, qui est produit

lors du relˆ achement de la pression accumul´ee en amont d’une occlusion dans le

conduit vocal. On distingue les sons vois´es lorsque la vibration des cordes vocales

intervient des sons non-vois´es ou sourds, lorsque les cordes vocales ne vibrent

pas. Pour les sons vois´es, la fr´equence fondamentale du signal d’excitation est

souvent appel´ee fr´equence phonatoire.

(3)

0 0.02 0.04 0.06 0.08 0.1 temps (s)

amplitude

0 1000 2000 3000 4000 5000

−4

−2 0 2 4 6 8

fréquence (Hz)

amplitude (log)

Fig. 1.2 – Signal temporel et spectre pour un son vois´e [a].

0 0.02 0.04 0.06 0.08 0.1

temps (s)

amplitude

0 2000 4000 6000 8000 10000

−4

−3

−2

−1 0 1 2 3

fréquence (Hz)

amplitude (log)

Fig. 1.3 – Signal temporel et spectre pour un son non vois´e [s].

Les figures 1.2 et 1.3 illustrent les signaux temporels et les spectres d’un son voisé [a] et d’un son non voisé [s]. La périodicité temporelle du son voisé se retrouve dans le spectre, o` u des pics fréquentiels sont visibles aux fréquences multiples de la fréquence phonatoire pour les basses fréquences. On n’observe pas de structure en harmoniques pour le son non voisé. On peut également voir que les spectres présentent une forme avec des maxima et des minima locaux. Ceux-ci sont des effets des fréquences de résonance et d’anti-résonance du conduit vocal et sont appelés formants et anti-formants. Les deux ou trois premiers formants permettent de différencier les voyelles.

1.2.2 Mod´ elisation de la production de la parole

Le mécanisme de production de la parole peut être modélisé comme une opération de filtrage linéaire [78]. Ce modèle est composé d’une source suivie d’un conduit vocal sans couplage entre ces deux parties. Il est illustré à la figure 1.4.

Pour les voyelles, la source est modélisée par un train d’ondes périodique dont la forme, caractérisée par G(z), simule la forme du signal glottique et dont la période est la durée d’un cycle glottique, T

0

. Pour les sons vois´es, le signal d’excitation est u(n) = !

k

δ(n − kT

0

), o` u T

0

est la durée du cycle vocal. Pour les sons non-voisés, le signal d’excitation u(n) est un bruit blanc de moyenne nulle et de variance unité.

Le conduit vocal est généralement modélisé par un filtre tous pˆ oles. On peut

(4)

Fig. 1.4 – Mod`ele de la production de la parole.

en effet montrer qu’un filtre tous pˆ oles modélise la fonction de transfert d’un système de tubes acoustiques concaténés excité par une onde plane, ce qui est une approximation raisonnable du conduit vocal pour les sons non nasaux [23].

La fonction de transfert tous pˆ oles a la forme

H (z) = H

0

1 + !

N

i=1

b(i)z

⁻ⁱ

. (1.1)

La fonction de transfert du rayonnement aux lèvres est modélisé par un filtre proche d’un filtre dérivateur :

R(z) = 1 − z

0

z

⁻¹

, z

0

≈ 1, z

0

< 1. (1.2) La valeur de z

0

est choisie légèrement inférieure à 1 afin de garantir la stabilité du filtre inverse R

⁻¹

(z), qui est rencontr´e dans certaines applications [23].

En résumé, pour des sons voisés, la transmittance globale entre le train d’impulsions de la figure 1.4 et le signal émis est T (z) = G(z)H (z)R(z). Pour des sons non voisés, la transmittance entre l’excitation et le signal émis est T(z) = H (z)R(z).

En pratique, la transmittance globale est souvent mod´elis´ee par un filtre tous pˆ oles :

T (z) = S(z)

U (z) (1.3)

= σ

1 + !

p

i=1

a(i)z

⁻ⁱ

= σ

A(z) . (1.4)

Dans cette expression, S(z) et U(z) d´esignent les transform´ees en z du signal

´emis et de l’excitation.

Ce mod`ele de production du signal vocal peut s’´ecrire dans le domaine tem- porel sous la forme suivante :

s(n) +

p

"

i=1

a(i)s(n − i) = σu(n). (1.5)

(5)

Cette relation exprime que chaque échantillon du signal est une combinaison linéaire des p échantillons qui le précèdent, à laquelle on ajoute le terme d’exci- tation.

Pour analyser des signaux de parole, l’excitation est omise. On obtient alors un modèle de prédiction linéaire

s(n) +

p

"

i=1

a(i)s(n − i) = 0, (1.6)

o` u les coefficients a(i) sont appel´es coefficients de pr´ediction.

Les coefficients de pr´ediction estim´es a

est

sont obtenus en minimisant l’erreur de pr´ediction

e(n) = s(n) − s

est

(n) (1.7)

=

p

"

i=0

a

est

(i)s(n − i), avec a

est

(0) = 1. (1.8) Pour l’estimation des coefficients de prédiction, on minimise généralement la variance de l’erreur de prédiction, !

n

e(n)

²

. Différentes variantes existent selon l’étendue de la sommation. On distingue notamment les méthodes basées sur l’autocorrélation ou sur la covariance du signal [23].

A posteriori, on peut interpréter l’erreur de prédiction comme étant égale au signal de source. On peut obtenir des informations sur la transmittance du conduit vocal à travers la réponse impulsionnelle du filtre de prédiction T(z) =

_A(z)^σ

, et sur la cyclicité (ou absence de cyclicité) du signal de source à travers le signal résiduel obtenu par filtrage inverse du signal de parole :

σu(n) = x(n) +

p

"

i=1

a

est

(i)x(n − i). (1.9)

1.3 Application clinique de l’analyse de la parole

Les troubles de la parole désignent une altération per¸cue du son de parole due aux conditions médicales du locuteur. Les indices vocaux de troubles de la parole sont des descripteurs numériques ou des mesures qui ont une pertinence clinique, qui résument des propriétés du signal de parole ou d’autres signaux obtenus de fa¸con non-invasive, et qui ont un lien avec la phonation en général, ou la voix en particulier, du locuteur.

Typiquement, l’estimation d’indices vocaux implique l’enregistrement de si- gnaux relatifs à la parole, le traitement de signal qui permet d’éliminer des propriétés non désirées ou non pertinentes du signal et d’obtenir des données décrivant la phonation, et le résumé des données cliniquement pertinentes au moyen de quelques nombres [86].

Les applications des indices vocaux de troubles de la parole sont les suivantes.

1. La documentation de l’´etat de la voix du patient au moyen d’un faible

nombre de descripteurs num´eriques, qui font partie de l’anamn`ese du pa-

tient.

(6)

2. L’évaluation de la fonction vocale. En plus de l’enregistrement d’indices acoustiques, l’évaluation peut inclure l’inspection visuelle et l’évaluation du mode de vibration des cordes vocales, l’enregistrement de données aérodynamiques, ainsi que l’évaluation auditive du signal de parole.

3. L’expertise, qui est similaire à l’évaluation, mais implique l’appréciation de la voix du patient par des experts.

4. Le suivi, c’est-à-dire la comparaison de la voix du patient avant et après une thérapie ou une opération chirurgicale, dans le but de documenter explicitement les améliorations ou dégradations de la voix du patient.

5. La comparaison de la voix du patient avec les voix de référence de lo- cuteurs idéalement appariés en genre et en âge. Des objectifs potentiels sont la caractérisation d’une maladie laryngée ou d’un handicap vocal en résumant les voix d’un groupe homogène de patients, et en le comparant avec un groupe de locuteurs normophoniques.

L’évaluation non-invasive de la parole n’est généralement pas suffisante pour

évaluer l’origine des troubles de la production de la parole du patient. Il est souvent nécessaire d’avoir recours à des procédures invasives afin d’étudier le fonctionnement de la phonation au niveau du larynx. Les raisons pour lesquelles les cliniciens analysent le signal de parole en plus des procédures invasives sont les suivantes.

– L’inspection visuelle du larynx nécessite l’introduction de conduits op- tiques dans les cavités vocales. La qualité de l’image obtenue dépend de la taille et du positionnement du capteur introduit. Même s’il n’y a pas d’anesthésie locale, la présence des conduits optiques et la nécessité de ne pas obstruer le champ de vision de la caméra influencent le mouvement du larynx et des articulateurs. Dans ces conditions, les locuteurs ne peuvent produire que des sons soutenus [19, 55].

– La correction de la qualité vocale peut être le but principal poursuivi par les cliniciens, car une voix anormale peut avoir une influence sur la com- munication orale, l’expression esthétique ou l’image que le locuteur a de lui-même. Certains experts estiment que les anomalies laryngées n’ont de pertinence clinique que lorsqu’elles causent des troubles de la parole, la seule exception étant le cas des stades précoces d’une maladie progres- sive [60].

– L’analyse de la parole est un moyen d’évaluation non-invasif, qui peut être utilisé pour le suivi de la voix du locuteur en dehors du milieu clinique.

La littérature est abondante au sujet des indices vocaux en relation avec des troubles de la parole. La diversité des publications reflète la diversité des choix concernant les pathologies ou handicaps étudiés, les symptˆ omes vocaux décrits, les tˆ aches effectuées par les locuteurs, les performances linguistiques, paralin- guistiques et extralinguistiques examinées, les capteurs utilisés, les données de parole enregistrées, ainsi que les indices descriptifs non acoustiques auxquels les indices acoustiques ont été corrélés.

Les indices acoustiques peuvent ˆetre class´es en fonction des symptˆ omes que

l’on souhaite qu’ils mettent en ´evidence. On peut classer les indices selon les

cat´egories suivantes :

(7)

– indices de coordination, qui se rapportent au déroulement temporel du début et de la fin du voisement, en relation avec des évènements supra- glottiques,

– indices prosodiques ou suprasegmentaux, qui caract´erisent l’intonation, la fluidit´e et le rythme de la parole,

– indices morphologiques, qui se rapportent aux propri´et´es de la forme du signal de source glottique,

– indices de dyspériodicité, qui décrivent les irrégularités des cycles vocaux.

1.3.1 Irr´ egularit´ es des cycles vocaux

Parmi les différents types d’indices acoustiques, nous nous intéressons aux perturbations de la régularité des durées des cycles vocaux. Les irrégularités des cycles vocaux sont souvent corrélées avec les troubles de la voix. Cependant, même chez des locuteurs normophoniques, la périodicité des signaux de parole voisés n’est pas parfaite, et ces irrégularités contribuent au caractère naturel de la voix.

Les irrégularités des cycles vocaux peuvent être liées au mode de vibration des cordes vocales. La vibration des vraies cordes vocales combinée avec le flux d’air pulsant forme un système dynamique non-linéaire qui peut adopter plu- sieurs régimes qui diffèrent qualitativement. On distingue généralement trois registres chez les locuteurs normophoniques : la voix craquée, la voix modale et la voix de fausset [41]. Les fréquences phonatoires et la qualité de voix diffèrent selon le registre. Il existe également d’autres régimes laryngés, pour lesquels les durées et formes des cycles adjacents diffèrent significativement.

Le jitter et le shimmer vocal sont les petites variations rapides des dur´ees et amplitudes des cycles vocaux [92]. Ces perturbations sont observ´ees d’un cycle

`a l’autre.

Le tremblement vocal, ou vocal tremor en anglais, désigne les modulations basse-fréquence (sous 15Hz) de la fréquence phonatoire ou de l’amplitude du cycle vocal [92]. On peut également observer du tremblement vocal dans les ca- ractéristiques spectrales du signal de parole [17]. Pour certains auteurs, le terme tremor a une définition plus spécifique et se réfère à une modulation à bande-

étroite à une fréquence unique [45, 101]. Chez les locuteurs normophoniques, le tremblement vocal est faible et parfois appelée microtremblement [84].

Le flux d’air turbulent traversant la glotte peut causer un bruit de turbulence audible. Ainsi le souffle dans la voix a souvent été lié à une fermeture courte ou incomplète de la glotte, permettant à l’air de s’échapper de fa¸con audible [92].

Le larynx comporte, en plus des vraies cordes vocales, des plis ventriculaires et ary-épiglottiques, qui de fa¸con générale ne sont pas supposés vibrer. Cepen- dant, certains locuteurs peuvent faire vibrer ces plis, volontairement ou non.

Enfin, certains locuteurs dysphoniques passent brusquement et involontaire-

ment d’un registre de parole à un autre, ou d’un régime régulier de vibration ` a un

régime moins régulier, présentent des dévoisements momentanés involontaires,

ou passent d’une octave `a une autre de fa¸con inattendue [6].

(8)

1.3.2 Tremblement vocal

Dans le cadre de ce travail, nous nous intéressons à un type d’irrégularité des cycles vocaux : le tremblement vocal.

On distingue le tremblement physiologique du tremblement pathologique. Le tremblement physiologique aurait pour principales causes des oscillations neu- rologiques ou mécaniques, le flux sanguin pulsant ou la respiration [30]. A cause de cette multitude de causes, on ne s’attend pas à ce que le tremblement physio- logique présente un pic de modulation unique [84]. Chez les locuteurs atteints de pathologies présentant du tremblement des membres, on peut s’attendre à ob- server du tremblement pathologique également dans la parole. Des exemples de ce type de pathologies sont la maladie de Parkinson, le tremblement essentiel ou le syndrome cérébelleux. Chez des locuteurs atteints de maladies neurologiques, il est également possible que les modulations basse-fréquence diffèrent de celles de locuteurs normophoniques, car une partie du tremblement physiologique a des causes neurologiques.

On distingue trois types de tremblements pathologiques, se produisant dans des gammes de fr´equences diff´erentes [22] :

– le tremblement d’action ou tremblement intentionnel se manifeste lors d’un mouvement intentionnel du patient et est pr´esent dans l’intervalle [1.5Hz,3Hz],

– le tremblement au repos apparaˆıt lorsque les muscles du patient sont relˆ achés et est observé dans la bande de fréquences [3Hz,7Hz],

– le tremblement d’attitude ou postural, qui se manifeste quand le patient adopte une posture, est observ´e dans la bande de fr´equences [8Hz,12Hz].

L’analyse du tremblement vocal nécessite le choix d’indices numériques ca- ractérisant l’amplitude de la modulation et sa distribution fréquentielle.

L’amplitude de modulation relative est définie comme l’écart-type de la va- riation de la fréquence phonatoire divisé par la fréquence phonatoire moyenne [84] ou par l’écart maximum par rapport à la fréquence phonatoire moyenne, divisé par la fréquence phonatoire moyenne [26, 84, 99].

La fréquence de modulation est plus complexe à caractériser. Dans le cas par- ticulier o` u il y a un pic prépondérant dans le spectre des modulations, la position fréquentielle de ce pic est un indice acceptable. Par contre, en présence de plu- sieurs pics fréquentiels d’amplitude non négligeables, la distribution fréquentielle de la modulation comporte plus d’information, et il est difficile de la caractériser par une valeur numérique unique. La fréquence de modulation a été estimée par l’inverse de la distance moyenne entre les maxima dans l’évolution temporelle de la fréquence phonatoire [26], par la fréquence du maximum du spectre de modulation [101], ou par la moyenne pondérée des fréquences statistiquement significatives du spectre de modulation [84].

1.3.3 Maladie de Parkinson et tremblement vocal

Dans le cadre de ce travail, nous appliquons des algorithmes d’estimation

du tremblement vocal `a des signaux soutenus par des locuteurs atteints de la

maladie de Parkinson.

(9)

La maladie de Parkinson est une maladie progressive et dégénérative du système nerveux central. C’est la maladie neurologique la plus commune [21].

Elle a pour symptˆ omes la rigidité, le tremblement au repos ([3Hz − 7Hz]) et de posture ([8Hz − 12Hz]), et un intervalle limité du mouvements des membres, du cou et de la tête. Des problèmes liés à la parole et à la déglutition sont fréquents : Hartelius et Svensson [39] ont étudié les symptˆ omes de 250 pa- tients atteints de la maladie de Parkinson. 70% des patients se considéraient comme souffrant d’altérations de la voix et de la parole en rapport avec leur maladie. Les problèmes liés à la parole étaient considérés comme le plus grand problème par 29% des patients. Des dysfonctionnements du larynx ont été ob- servés fréquemment [38,59]. Les problèmes aux muscles laryngés peuvent réduire la capacité à initier la phonation, à produire un volume adéquat, et à varier la fréquence phonatoire. Perez et al. [76] ont observé que parmi les patients qu’ils ont étudiés, une majorité présentent du tremblement du larynx dans les trois conditions étudiées : repos, fréquence phonatoire et volume sonore normaux, et voix forte.

Les troubles de la voix sont principalement ´evalu´es par perception auditive.

Chez les locuteurs atteints de la maladie de Parkinson, des indices perceptifs de qualité de voix pertinents sont le souffle, la raucité ou le tremblement. Holmes et al. [45] ont étudié des locuteurs atteints de la maladie de Parkinson. Ils ont observé du tremblement à bande étroite uniquement chez les locuteurs à un stade avancé de la maladie. Ziegler et Hoole [104] ont observé des troubles de la voix dus à la maladie de Parkinson dépendant du genre du locuteur, les hommes présentant principalement une fréquence phonatoire plus élevée et du souffle, tandis que les femmes avaient une voix tremblante avec une qualité de voix tendue.

Afin de compléter les informations obtenues par évaluation auditive, on sou- haite obtenir des mesures acoustiques. Plusieurs études ont été menées concer- nant les caractéristiques acoustiques de la voix de patients atteints de la ma- ladie de Parkinson [53, 54, 105]. Dans la plupart des études, pour des voyelles soutenues, on a observé des fréquences phonatoires moyennes dans la normale, mais des variations relatives de la fréquence phonatoire plus grandes que la normale [105], ce qui pourrait refléter une perte de contrˆ ole de l’activité mo- trice. Hirose et al. [44] ont étudié de nombreux indices acoustiques de patients souffrant de maladies neurologiques, incluant la maladie de Parkinson. Ils ont observé une plus grande variabilité de la fréquence phonatoire chez les locuteurs parkinsoniens par rapport à des locuteurs de contrˆ ole, tant pour les fluctuations rapides [16Hz,F

0

/2] que pour des variations lentes [0.1Hz,16Hz].

L’application de l’estimation des indices de modulation basse-fréquence à des locuteurs atteints de la maladie de Parkinson est intéressante pour les raisons suivantes.

Il y a peu d’études présentant des données concernant les modulations basse- fréquence de la fréquence phonatoire chez des locuteurs parkinsoniens [44, 99, 101]. La maladie de Parkinson est caractérisée par la présence d’un tremblement au repos et d’un tremblement de posture des membres du patient. On s’attend

`a ce que ces tremblements se retrouvent dans les modulations de leurs voix.

De plus, les probl`emes vocaux apparaissent pr´ecocement chez de nombreux pa-

tients parkinsoniens, souvent parmi les premiers symptˆ omes. Des informations

(10)

qui pourraient contribuer à améliorer la qualité de voix des patients sont sou- haitables. Il est par conséquent intéressant d’étudier l’effet de la maladie de Parkinson sur les indices de modulation vocale, et d’établir si ces indices per- mettent de distinguer les locuteurs normophoniques et parkinsoniens, ainsi que d’étudier l’évolution des indices au cours du traitement des patients.

De plus, les résultats des quelques études traitant du tremblement vocal chez des locuteurs atteints de la maladie de Parkinson sont difficiles à comparer. En effet, les résultats sont obtenus pour des locuteurs en cours de traitement. On s’attend donc à des différences entre le type de traitement et la sévérité des symptˆ omes vocaux des patients. Dans certaines études seulement, les voix de locuteurs présentent spécifiquement un tremblement vocal qui est perceptible à l’audition [101]. Des données supplémentaires pourraient simplifier la mise en

évidence de comportements globaux liés à la maladie de Parkinson.

1.4 Revue de la litt´ erature

Il existe peu d’études qui s’intéressent aux modulations vocales lentes. Celà peut s’expliquer par le fait que, bien que présentes dans tout type de parole, les variations lentes involontaires de la voix sont masquées par d’autres variations volontaires liées à la prosodie. Pour les mettre en évidence et les quantifier, il faut les isoler en analysant des voyelles soutenues. Dans une partie des études concernant les modulations vocales lentes, les locuteurs présentent un trem- blement vocal à bande étroite perceptible à l’oreille, que l’analyse acoustique permet de confirmer. Peu d’attention est portée aux modulations vocales basse- fréquence lorsqu’il n’y a pas (encore) de tremblement audible. Les études exis- tantes concernant le tremblement vocal traitent principalement des modulations de la fréquence phonatoire et de l’amplitude du signal de parole.

Certains auteurs ont étudié les voix de locuteurs présentant un tremblement pathologique, et les ont comparées à celles de locuteurs normophoniques de contrˆ ole, en se basant sur l’examen visuel des spectrogrammes [56, 58]. Dans la suite de cette section, nous présentons les études de la littérature selon le type de locuteurs analysés. Les tableaux 1.1 et 1.2 récapitulent ensuite les études principales, en fonction des indices caractérisant les modulations vocales de la fréquence phonatoire, et le tableau 1.3 des modulations des fréquences des for- mants ou de la forme du conduit vocal. Les études sont résumées au moyen du nombre de locuteurs étudiés, des méthodes d’estimation des modulations vocales, des indices analysés et des principales conclusions.

Locuteurs normophoniques ou l´ eg` erement dysphoniques Schoentgen a étudié le (micro-)tremblement de la fréquence phonatoire de 38 locuteurs nor- mophoniques et de 51 locuteurs légèrement dysphoniques (sans tremblememt pathologique), pour des voyelles [a], [i] et [u] [84]. La méthode d’analyse est basée sur le détection des durées des cycles vocaux par les maxima principaux, suivie par une analyse du spectre de la série de durées de cycles. Il a calculé deux indices de profondeur de modulation relative, l’écart maximal ou l’écart- type de la fréquence phonatoire divisé par la fréquence phonatoire moyenne.

Il a également calculé deux indices de fréquence de modulation, donnés par

(11)

la moyenne pondérée des fréquences des pics statistiquement significatifs du spectre de la série des durées de cycles ou de la fonction d’autocovariance empi- rique de la série de durées de cycles, dans la bande de fréquence [0.5Hz, 25Hz].

Il a observé que le micro-tremblement vocal en fréquence ne diffère pas entre les hommes et les femmes, entre les locuteurs normophoniques et légèrement dysphoniques, ni entre les différents timbres.

Locuteurs atteints de divers types de tremblements vocaux patholo- giques Ludlow et al. ont étudié le tremblement de la fréquence phonatoire et de l’enveloppe de voyelles soutenues [a] chez 9 locuteurs présentant divers types de tremblements vocaux et 20 locuteurs normophoniques [61]. Ils ont estimé la fréquence de modulation de fa¸con heuristique, et l’amplitude du tremblement de fa¸con relative au jitter. Ils ont observé que le tremblement vocal était présent aussi bien dans les variations de l’enveloppe du signal de parole que dans la fréquence phonatoire. Le pourcentage de variations de la fréquence phonatoire dˆ u au tremblement était plus important chez les patients que chez les locuteurs normophoniques.

Winholtz et Ramig ont développé un instrument de mesure du tremblement de l’intensité vocale et de la fréquence phonatoire [99]. Des indices de profondeur et de fréquence de modulation de l’intensité vocale et de la fréquence phonatoire sont calculés au moyen d’un démodulateur du signal analytique associé au signal de parole filtré passe-bas. La profondeur de modulation est donnée par l’écart maximum par rapport à la fréquence phonatoire moyenne divisé par la fréquence phonatoire moyenne, et la fréquence de modulation par une moyenne pondérée des pics spectraux dans la bande de fréquence [2.5 Hz, 25 Hz]. Le démodulateur est illustré pour des voyelles [a] produites par 12 locuteurs normophoniques, 12 locuteurs présentant un vibrato et 12 locuteurs présentant des tremblements vocaux pathologiques. Les intervalles inter-quartiles de la fréquence de modu- lation sont [5.5 Hz, 8 Hz] et [4.9 Hz,6.1 Hz], pour les hommes et les femmes normophoniques, et [4.0 Hz, 6.5 Hz] et [5.0 Hz,6.5 Hz], pour les hommes et les femmes présentant un tremblement pathologique. Les intervalles inter-quartiles de la profondeur de modulation sont [0.9 %, 1.8 %] et [0.8 %, 1.3 %], pour les hommes et les femmes normophoniques, et [3.4 %, 6 %] et [4.3 %, 10.7 %], pour les hommes et les femmes présentant un tremblement vocal pathologique. Les fréquences de modulation de la fréquence phonatoire ne sont pas statistique- ment différentes entre les groupes. L’amplitude de modulation de la fréquence phonatoire est statistiquement plus élevée chez les locuteurs présentant un trem- blement vocal ou un vibrato que chez les locuteurs de contrˆ ole.

Hirose et al. ont ´etudi´e de nombreux indices acoustiques chez des locuteurs

atteints de maladies neurologiques, dont 12 parkinsoniens, et 51 locuteurs de

contrˆ ole, pour des voyelles [a] d’une dur´ee d’une seconde [44]. La fr´equence

phonatoire a été estimée par l’inverse des durées de cycles obtenues en détectant

les pics principaux de chaque cycle glottique. Parmi les indices ´etudi´es, celui qui

concerne les modulations basse-fréquence de la fréquence phonatoire est l’énergie

basse-fr´equence dans l’intervalle [0.1Hz, 16Hz] des variations de la fr´equence

phonatoire, normalisée par rapport à la fréquence phonatoire moyenne. Ils ont

observ´e des variations plus importantes chez les locuteurs parkinsoniens que

chez les locuteurs de contrˆ ole.

(12)

Jiang et al. ont étudié le tremblement vocal de signaux acoustiques et aéro- dynamiques au cours de la production de voyelles soutenues par dix locuteurs atteints de différents tremblements pathologiques (cinq hommes et cinq femmes) et dix locuteurs normophoniques appariés [48]. Les modulations de l’intensité acoustique et du débit d’air ont été analysées sur des segments de signaux de deux secondes. La modulation de la fréquence phonatoire n’a pas été étudiée. Les six pics les plus dominants de chaque spectre de modulation ont été sélectionnés dans la bande de fréquence [0 Hz,30 Hz], et caractérisés par un rapport de proéminence défini comme le rapport de l’énergie du pic divisée par l’énergie totale de modulation. Les fréquences des pics ne permettent pas de distinguer les patients des locuteurs normophoniques. Les rapports de proéminence des pics de modulation de l’intensité acoustique étaient plus élevés chez les patients que chez les locuteurs normophoniques. Ils ont également observé plus fréquemment une corrélation positive et forte entre le contour d’intensité acoustique et le débit d’air chez les patients (90%) que chez les locuteurs normophoniques (40%).

Locuteurs pr´ esentant un syndrome c´ er´ ebelleux Ackermann et Ziegler ont étudié des voyelles soutenues et des fricatives non-voisées d’une locutrice atteinte d’un syndrome cérébelleux chronique et présentant un tremblement vocal audible, par l’intermédiaire de contours de l’intensité du signal, de contours de la fréquence phonatoire et de paramètres spectraux [1]. Pour les voyelles, les contours de la fréquence phonatoire et le spectre de modulation de la fréquence phonatoire ont montré des oscillations rythmiques intermittentes à une fréquen- ce proche de 3Hz. Aucun indice d’amplitude de modulation n’a été calculé.

Locuteurs avec une scl´ erose amyotrophique lat´ erale Aronson et al. [3]

ont appliqué le démodulateur développé par Winholtz et Ramig [99] à huit lo- cuteurs atteint de sclérose amyotrophique latérale présentant un tremblement vocal rapide et huit locuteurs témoins appariés en ˆ age et en genre. La modula- tion de la fréquence phonatoire a été étudiée sur base du spectre de Fourier de la trace de la fréquence phonatoire sur des fenêtres d’une seconde. Les amplitudes et les fréquences des pics spectraux dominants ont été identifiées dans la bande de fréquence de 1Hz à 25Hz par deux expérimentateurs. Les résultats ont montré qu’il y avait des combinaisons multiples d’amplitudes et de fréquences de mo- dulation chez les patients, tandis que chez les locuteurs témoins, la modulation

était uniformément faible. Les pics spectraux de modulation n’étaient pas claire- ment concentrés à une fréquence, mais l’amplitude de modulation était toujours plus importantes chez les patients que chez les locuteurs normophoniques. Tant chez les patients que chez les témoins, des pics spectraux proéminents ont été observés dans toute la bande de fréquences analysée. L’amplitude des pics spec- traux de la modulation en fréquence est comprise entre 17.7 et 637mV chez les patients, et entre 6.9 et 134.8mV chez les témoins.

Locuteurs atteints de tremblement vocal essentiel Plusieurs ´etudes

concernent le tremblement vocal essentiel [32], sa corr´elation avec l’activit´e

musculaire au niveau du larynx [28, 57], ainsi que l’effet du traitement sur le

tremblement vocal essentiel [42,97]. Dans ces ´etudes, le tremblement vocal est `a

(13)

bande étroite et perceptible à l’oreille. L’analyse du signal de parole est donc fa- cilitée. Des indices caractérisant la modulation basse-fréquence sont utilisés par Dromey et al., qui ont étudié l’influence de la fréquence phonatoire moyenne et du volume sonore chez dix locuteurs présentant un tremblement vocal essen- tiel [26]. L’estimation de la fréquence phonatoire était basée sur une analyse synchrone par autocorrélation. Les fréquences des modulations de la fréquence phonatoire et de l’amplitude de l’enveloppe du signal ont été estimées sur base des positions des maxima de la trace de la fréquence phonatoire et de l’enve- loppe du signal. Les profondeurs de modulation ont été estimées par la moyenne des écarts entre le maximum et le minimum entre deux pics successifs dans les traces, divisée par la moyenne. Dans les conditions normales de volume sonore et pour une fréquence phonatoire normale, les amplitudes de modulation de la fréquence phonatoire varient entre 3.4% et 18.2%, et les fréquences de modu- lation de la fréquence phonatoire sont comprises entre 3.2 Hz et 5.3 Hz. Les auteurs ont observé que pour des fréquences phonatoires élevées, les modula- tions de la fréquence phonatoire et de l’enveloppe du signal de parole étaient plus rapides. La modulation de l’enveloppe du signal de parole était plus rapide pour des signaux à volume élevé. Pour des fréquences phonatoires basses, la modulation de l’enveloppe du signal de parole avait diminué. Enfin, la variation de la fréquence phonatoire moyenne provoquait des changements importants du déphasage entre la modulation de l’enveloppe du signal de parole et la modula- tion de la fréquence phonatoire chez certains locuteurs, et pas d’effets apparents chez d’autres.

Locuteurs atteints de la maladie de Parkinson Yair et Gath ont déve- loppé une méthode basée sur un modèle de processus par points pour l’analyse du tremblement vocal dans les voyelles soutenues [101]. Les positions des pics principaux de chaque cycle vocal sont estimés au moyen de la fonction d’auto- corrélation du signal filtré passe-bas à 1500Hz, pour une fenêtre positionnée au passage par zéro précédant les pics principaux du cycle de parole. Le maximum de la fonction d’autocorrélation donne la durée du cycle et permet de déterminer le pic principal suivant et de positionner la fenêtre suivante au passage par zéro le précédant. La série de durées de cycles est ensuite modélisée comme un pro- cessus par points, permettant d’obtenir le spectre de puissance. Un atout de cette méthode est qu’il n’est pas nécessaire de rééchantillonner à pas constant la série des durées de cycles.

Yair et Gath ont appliqu´e cette analyse `a un corpus de voyelles [a] soutenues

par neuf locuteurs parkinsoniens et trois locuteurs contrˆ oles. Cette technique

d’analyse leur a permis de mettre en ´evidence un pic ´etroit dans le spectre de

la fr´equence phonatoire pour une fr´equence comprise entre 4 Hz et 6 Hz chez

chaque locuteur parkinsonien. La fr´equence et l’amplitude de ces variations ryth-

miques de la fréquence phonatoire correspondent à la fréquence et à l’amplitude

du tremblement au repos observ´e dans les mains de ces patients. Pour les lo-

cuteurs normophoniques, la plupart de l’´energie est concentr´ee sous 3Hz. Pour

les fréquences plus élevées, l’énergie est faible et répartie uniformément dans

l’intervalle de fr´equence. Pour les locuteurs parkinsoniens, l’analyse spectrale

de l’´electromyogramme des muscles de la main, et des mouvements de la main

enregistrés au moyen d’un accéléromètre montre que la fréquence de tremble-

ment estimée à partir du pic étroit dans le spectre de modulation correspond

(14)

à la fréquence du tremblement périphérique avec un coefficient de corrélation de .99. L’intensité du tremblement vocal, définie comme l’énergie contenue dans la bande spectrale [3.5Hz,7.5Hz], est corrélée avec le degré de tremblement des membres mesuré cliniquement, avec un coefficient de corrélation de 0.96.

Dans [33], Gath et Yair présentent une amélioration de leur méthode d’ana- lyse du tremblement de la fréquence phonatoire. Le but était de pouvoir mieux traiter des signaux courts, résultant de problèmes respiratoires du locuteur l’empêchant de produire une voyelle soutenue longue. La méthode est modifiée en ajoutant une contrainte paramétrique sur la forme du spectre de la série de durées de cycles. La solution est alors équivalente à celle obtenue par un modèle de prédiction linaire, avec la méthode de covariance, de la série de durées de cycles après rééchantillonnage de celle-ci à pas constant.

Dans [101], Yair et Gath ont également mentionné des résultats pour l’ana- lyse du tremblement vocal par l’intermédiaire des fréquences des formants, pour les même neuf locuteurs parkinsoniens. Pour obtenir celles-ci, une ana- lyse spectrale synchrone a été effectuée, au moyen de la méthode de prédiction linéaire d’ordre 16. La fenêtre d’analyse s’étend du passage par zéro suivant le pic principal de chaque cycle glottique jusqu’au passage par zéro précédent le pic principal du cycle glottique suivant. La série de fréquences de formants est rééchantillonnée à pas constant et son spectre de Fourier est calculé. L’obser- vation des spectres de modulation a montré que le premier formant est le plus affecté par le tremblement vocal. Pour tous les locuteurs parkinsoniens, des pics ont été observé à la même fréquence dans le spectre de modulation du premier formant et dans le spectre de modulation de la fréquence phonatoire. Cepen- dant, les spectres obtenus pour les modulations des formants sont plus bruités que les spectres de modulation de la fréquence phonatoire, et les pics y sont moins proéminents.

Dans le cadre de l’étude de la rigidité du conduit vocal de ces neuf locuteurs parkinsoniens et trois locuteurs de contrˆ ole, Gath et Yair ont estimé la forme du conduit vocal au moyen d’un modèle de tubes concaténés, et analysé les variations de ce conduit vocal au cours de la production de syllabes [la] [34].

Les sections des tubes ont ´et´e obtenues par une analyse synchrone ARMA [65].

Leurs hypoth`eses ´etaient que les variations de la section du tube correspondant

`a la pointe de la langue sont dues soit au tremblement pathologique, soit `a la ri-

gidit´e des muscles du locuteur. Les variations li´ees au tremblement pathologique

sont supposées avoir la même forme que le tremblement vocal détecté dans la

fréquence phonatoire, à un délai et à un facteur d’amplitude près. La rigidité est

caract´eris´ee par la surface sous le spectre des variations de la section du tube

correspondant à la pointe de la langue, après suppression des variations liées au

tremblement pathologique. Les ´energies spectrales estim´ees sont en accord avec

le degré de rigidité mesuré de fa¸con clinique chez les locuteurs parkinsoniens,

tandis que chez les locuteurs contrˆ ole, l’intensité des variations était négligeable.

(15)

1. 4. R E V U E D E L A L IT T ´E R A T U R E 15 Hirose et al.

(1995) [44]

12 Parkinsoniens 51 contrˆ oles

F

0

: d´etection des dur´ees de cycles modul. F

0

: spectre FFT de la s´erie F

0

énergie dans la bande de fréquence [0.1 Hz, 16 Hz], normalisée par rapport à F

0

moyenne Conclusion : Variations plus importantes chez les locuteurs parkinsoniens que chez les contrˆ oles.

Modulation caract´eris´ee de fa¸con heuristique ou par observation

Auteurs corpus M´ethodes d’estimation Indices

Ludlow et al.

(1986) [61]

9 patients avec TV F

0

: pas précisé fréquence de modulation de F

0

pourcentage des variations de F

0

dues au TV fr´equence de modulation de l’enveloppe pourcentage des variations de l’enveloppe dues au TV

20 normophoniques modul. F

0

: heuristique

Conclusion : TV dans les modulations de l’enveloppe et de la fr´equence phonatoire.

Ackermann et Ziegler (1991) [1]

1 locutrice avec syndrome c´er´ebelleux

F

0

: pas pr´ecis´e

modul. F

0

: spectre de la trace de F

0

observation du signal temporel de F

0

et de son spectre

Conclusion : Oscillations rythmiques intermittentes `a une fr´equence proche de 3 Hz.

Dromey et al.

(2002) [26]

10 TV essentiel F

0

: analyse synchrone bas´ee sur l’auto- corr´elation

fr´equence de modulation modul. F

0

: positions des pics dans la

trace de F

0

profondeur de modulation relative Conclusion : La fr´equence de modulation augmente lorsque la fr´equence phonatoire du locuteur augmente.

Modulation caractérisée par plusieurs pics spectraux proéminents

Auteurs Corpus M´ethodes d’estimation Indices

Aronson et al.

(1992) [3]

8 patients avec SLA, 8 contrˆ oles appari´es

F

0

: d´emodulation modul. F

0

: spectre FFT

fr´equences et amplitudes des pics dominants du spectre

Conclusions : (1) Variabilit´e des amplitudes et fr´equences de modulation en fonction des patients.

(2) Pas de pic spectral pr´epond´erant unique chez les patients.

(3) Amplitude de modulation plus importante chez les patients que chez les contrˆ oles.

Tab. 1.1 – Récapitulatif des résultats obtenus dans la littérature relatifs aux modulations de la fréquence phonatoire F

0

. (TV = tremble-

ment vocal)

(16)

16 C H A P IT R E 1. IN T R OD U C T Yair et Gath (1988) [101]

9 parkinsoniens 3 contrˆ oles

F

0

: d´etection des dur´ees de cycle modul. F

0

: spectre obtenu au moyen d’un mod`ele de processus par points

Fr´equence du pic principal du spectre de modulation

Energie du spectre dans la bande [3.5Hz,7.5Hz] ´ Conclusions :

(1) Pic ´etroit entre 4Hz et 6Hz dans le spectre de modulation des locuteurs Parkinsoniens.

(2) Fréquence du tremblement vocal corrélée avec la fréquence du tremblement des extrémités.

(3) Intensité du tremblement corrélée avec le degré du tremblement des extrémités estimé cliniquement.

Winholtz et Ramig (1992) [99]

12 normophoniques 12 patients avec TV 12 chanteurs avec vibrato

F

0

: d´emodulation

modul. F

0

: spectre FFT de F

0

dans la bande de fr´equence [2.5Hz,25Hz]

fr´equence de modulation profondeur de modulation

Conclusions :

(1) Les fr´equences de modulation ne sont pas statistiquement diff´erentes entre les trois groupes.

(2) Amplitude de modulation plus ´elev´ee chez les locuteurs avec TV que chez les normophoniques.

(3) Intervalles inter-quartiles de la fr´equence de modulation : [5.5 Hz, 8 Hz] et [4.9 Hz,6.1 Hz], pour les hommes et les femmes normophoniques, et [4.0 Hz, 6.5 Hz] et [5.0 Hz,6.5 Hz], pour les hommes et les femmes avec TV.

(4) Intervalles inter-quartiles de la profondeur de modulation : [0.9%, 1.8%] et [0.8%, 1.3%], pour les hommes et les femmes normophoniques, et [3.4%, 6%] et [4.3%, 10.7%], pour les hommes et les femmes ave TV.

Schoentgen (2002) [84]

38 normophoniques 51 l´eg`erement dys- phoniques (sans TV)

F

0

: dur´ees de cycles

modul. F

0

: dans la bande de fr´equence [0.5Hz,25Hz]

profondeur de modulation (2 indices) fr´equence de modulation (2 indices) Conclusions :

(1) Pas de diff´erence entre les voyelles, entre les genres ou entre les groupes de locuteurs.

(2) Intervalles inter-quartiles typiques de la profondeur et de la fr´equence de modulation : [0.4%, 1.3%] et [2.0, 4.7Hz].

Tab. 1.2 – Récapitulatif des résultats obtenus dans la littérature concernant les modulations de la fréquence phonatoire F

0

(suite).

(17)

R E V U E D E L A L IT T ´E R A T U R E 17

Auteurs locuteurs Méthodes d’estimation Indices étudiés

Yair et Gath (1988) [101]

9 parkinsoniens F

i

: analyse spectrale synchrone par LPC spectre de modulation 3 contrˆ oles modul. F

i

: spectre de la série rééchantillonnée des

fr´equences des formants Conclusions :

(1) F

1

le plus affect´e par le tremblement vocal.

(2) Mˆeme fr´equence des pics dans les spectres de modulation de F

1

et de F

0

chez les parkinsoniens, mais spectre de modulation de F

1

plus bruit´e.

Gath et Yair (1988) [34]

9 parkinsoniens analyse synchrone ARMA section du 7e tube sur 8

(en partant de la glotte) 3 contrˆ oles

Conclusions :

(1) Le tremblement du conduit vocal est dˆ u au tremblement pathologique ou `a la rigidit´e des muscles.

(2) Le tremblement pathologique du conduit vocal est fortement corrélé avec le tremblement vocal de la fréquence phonatoire, à un délai et à un facteur d’amplitude près.

Tab. 1.3 – Récapitulatif des résultats obtenus dans la littérature relatifs aux modulations de la fréquence des formants ou à la forme du

conduit vocal.

(18)

1.5 Objectifs de ce travail

Le but de ce travail est d’étudier et de quantifier le tremblement vocal, lié à la source vocale et au conduit vocal, à la fois chez des sujets normaux et des sujets présentant des troubles de la voix, tels que des patients atteints de la maladie de Parkinson. Pour cela, nous développons des algorithmes d’analyse et de mesure des effets du tremblement vocal sur le signal de parole. Ces algorithmes sont ensuite utilisés pour analyser des données vocales de locuteurs atteints de la maladie de Parkinson, en vue de démontrer la corrélation entre les résultats obtenus et la pathologie.

Nous souhaitons obtenir deux catégories d’indices caractéristiques du trem- blement vocal : les indices liés à la source vocale et les indices liés au conduit vocal.

D’une part, nous étudions le tremblement présent dans la fréquence du signal vocal. Nous ne nous intéressons pas aux variations de l’amplitude du signal de parole car celle-ci est influencée par la forme du conduit vocal et, par conséquent, ne reproduit pas la modulation de l’intensité du signal glottique. Par contre, la durée des cycles du signal de parole est quasi identique à celle du signal glottique, on peut donc mettre en évidence le tremblement lié à celui-ci.

D’autre part, nous nous intéressons au tremblement présent dans les fréquen- ces des formants du spectre de voyelles soutenues. En effet, l’enveloppe du spectre est principalement liée à la forme du conduit vocal. Les effets spectraux des modes propres du conduit vocal sont les formants. Nous nous intéressons à la variation en fréquence de ces derniers et non à leur variation en amplitude car celle-ci est influencée par la source et les pertes.

Nous souhaitons également calculer un conduit vocal acoustiquement équi- valent à partir des fréquences des formants. Ce conduit vocal équivalent permet une interprétation pseudo-anatomique du tremblement lié au conduit vocal.

Dans le cadre du développement de méthodes à la fois fiables et sensibles aux variations jusqu’à 15Hz, les possibilités qu’offrent la transformée en onde- lettes continue et les fréquences instantanées qui peuvent en être déduites sont

´etudi´ees.

L’application des méthodes d’analyse des modulations vocales à des cor- pora d’enregistrements de locuteurs parkinsoniens permet d’étudier l’effet de la maladie de Parkinson sur les indices de modulation vocale. ´ Etant donné que la maladie de Parkinson est caractérisée par la présence d’un tremblement au repos et d’un tremblement de posture des membres du patient, on souhaite examiner si ces tremblements sont également présents dans la voix des patients, et si leur

évolution reflète l’état de santé des patients.

Les sujets abord´es dans ce travail sont donc les suivants.

1. Caract´erisation des modulations vocales

(a) ´ Etude de méthodes d’analyse et de quantification des modulations de la fréquence phonatoire, des fréquences des formants et du conduit vocal acoustiquement équivalent.

(b) D´eveloppement de m´ethodes d’estimation des indices de modulation

vocale, pr´ecises et fiables afin de pouvoir analyser des signaux de

parole perturb´es.

(19)

2. ´ Etude de l’effet de la maladie de Parkinson sur les indices de modulation obtenus par les méthodes d’analyse développées. Les indices de modulation sont étudiés pour trois corpora.

(a) Analyse des indices de modulation pour un corpus de locuteurs at- teints de la maladie de Parkinson et de locuteurs normophoniques, afin d’obtenir des informations sur leur qualit´e de voix respectives et de tester si les indices de modulation permettent de diff´erencier les deux groupes de locuteurs.

(b) Analyse des indices de modulation pour un corpus de locuteurs at- teints de la maladie de Parkinson sous deux conditions d’enregistre- ment (sous médicaments ou en sevrage, avec implant cérébral branché ou éteint), afin d’examiner si ces conditions ont un effet sur les indices de modulation.

(c) Analyse des indices de modulation pour un corpus de locuteurs at- teints de la maladie de Parkinson avant et apr`es une th´erapie vocale LSVT [79], afin de tester si le traitement a un effet sur les indices de modulation.

1.6 Plan du travail

Le plan de ce travail est le suivant.

Le deuxième chapitre concerne la transformée en ondelettes continue, ainsi que le concept de fréquence instantanée. Nous présentons le formalisme de la transformée en ondelettes continue, ainsi que ses propriétés de distribution temps-fréquence. Nous présentons ensuite le concept de fréquence instantanée, ainsi que les méthodes existantes pour l’estimer. Enfin, nous montrons comment la fréquence instantanée basée sur une transformée en ondelettes peut être utile pour l’analyse de signaux de parole.

Le troisième chapitre présente l’analyse des modulations vocales dues à la source glottique à travers la fréquence phonatoire. Nous présentons d’abord des méthodes existantes d’estimation de la fréquence phonatoire, ainsi qu’une méthode basée sur des transformées en ondelettes continues. Ensuite, nous com- parons ces méthodes à l’aide de signaux synthétiques. Enfin, nous présentons des indices caractéristiques de la modulation de la fréquence phonatoire.

Le quatri`eme chapitre traite de l’analyse des modulations vocales dues au

conduit. Nous présentons d’abord l’étude des modulations des fréquences des

trois premiers formants. Cette partie comprend la pr´esentation de m´ethodes

existantes d’estimation des formants, ainsi que la pr´esentation d’une m´ethode

basée sur une transformée en ondelettes continue. Nous présentons également

des indices caract´eristiques de la modulation des fr´equences des formants. La

deuxième partie du chapitre est consacrée à l’étude du conduit vocal estimé à

partir des fréquences des formants. Deux méthodes sont envisagées pour obte-

nir un conduit formé par la concaténation de tubes élémentaires à partir des

fréquences des trois premiers formants : une méthode basée sur la prédiction

linéaire du signal de parole et une méthode basée sur une transformation ana-

lytique formants-sections droites du conduit. Nous montrons sur des signaux

(20)

synthétiques qu’aucune de ces deux méthodes ne permet de reconstituer la forme variable du conduit de départ. Finalement, nous présentons des indices caractérisant la forme évolutive du conduit obtenu.

Dans le cinquième chapitre, nous présentons les résultats de l’analyse des modulations pour trois corpora. Le premier corpus est composé de locuteurs at- teints de la maladie de Parkinson et de locuteurs témoins. Le deuxième corpus comporte des locuteurs atteints de la maladie de Parkinson dans deux condi- tions d’enregistrement différentes. Le troisième corpus est composé de locuteurs parkinsoniens enregistrés avant et après une thérapie vocale.