• Aucun résultat trouvé

1.2 Production de la parole

N/A
N/A
Protected

Academic year: 2021

Partager "1.2 Production de la parole"

Copied!
20
0
0

Texte intégral

(1)

Introduction

1.1 Pr´ eliminaires

L’analyse de la parole est pratiqu´ee couramment dans le milieu clinique, afin d’´evaluer les troubles de la parole des patients. Il s’agit d’un moyen d’´evaluation non-invasif en vue de la documentation quantitative de la qualit´e de voix. Sou- vent, l’´evaluation des troubles de la parole est effectu´ee de fa¸con subjective par les m´edecins. L’inconv´enient est que les r´esultats peuvent varier en fonction du m´edecin et mˆeme pour un mˆeme m´edecin, selon le moment de l’examen. Afin d’am´eliorer l’efficacit´e des ´evaluations, des analyses objectives, fournies par des programmes informatiques, sont donc les bienvenues.

Cette th`ese s’inscrit dans le cadre de la recherche d’indices acoustiques per- tinents pour l’analyse de la parole dans le domaine clinique. Des indices acous- tiques relatifs aux perturbations basse-fr´equence du signal de parole sont pro- pos´es et appliqu´es `a l’analyse de la parole de locuteurs atteints de la maladie de Parkinson. Les objectifs de ce travail sont d´evelopp´es dans ce chapitre, apr`es une description du syst`eme de production de la parole et une pr´esentation des analyses de la parole pratiqu´ees dans le milieu clinique.

1.2 Production de la parole

1.2.1 Anatomie

L’anatomie du syst`eme de production de la parole est repr´esent´e `a la figure 1.1. Le principe de production de la parole est le suivant. De l’air est expir´e des poumons `a travers les bronches, le larynx, le pharynx et la cavit´e orale ou la cavit´e nasale. Le pharynx et les cavit´es orale et nasale forment le conduit vocal.

Les variations de la pression de l’air aux l`evres et aux narines produisent le signal acoustique de parole. La plupart des sons sont d´etermin´es conjointement par la pression de l’air `a la sortie des poumons, par la vibration ´eventuelle des cordes vocales et par la forme du conduit vocal. Celle-ci est obtenue au moyen des muscles articulatoires qui fixent notamment la position du larynx, de la mˆ achoire, de la langue, des l`evres ou du voile du palais. Lorsque le voile

1

(2)

du palais ouvre l’entr´ee de la cavit´e nasale, cette derni`ere est acoustiquement coupl´ee `a la cavit´e orale et un son nasal peut ˆetre produit. Lorsque le voile du palais ferme l’entr´ee de la cavit´e nasale, on obtient un son oral.

Fig. 1.1 – Anatomie du syst`eme de production de la parole [87].

Il existe trois principaux types de sources sonores : Le premier est la vi-

bration des cordes vocales dans le larynx. L’air passe alors par bouff´ees, ce qui

produit le son. Le deuxi`eme est le passage turbulent de l’air dans une constric-

tion du conduit vocal. Enfin le troisi`eme est le bruit d’explosion, qui est produit

lors du relˆ achement de la pression accumul´ee en amont d’une occlusion dans le

conduit vocal. On distingue les sons vois´es lorsque la vibration des cordes vocales

intervient des sons non-vois´es ou sourds, lorsque les cordes vocales ne vibrent

pas. Pour les sons vois´es, la fr´equence fondamentale du signal d’excitation est

souvent appel´ee fr´equence phonatoire.

(3)

0 0.02 0.04 0.06 0.08 0.1 temps (s)

amplitude

0 1000 2000 3000 4000 5000

−4

−2 0 2 4 6 8

fréquence (Hz)

amplitude (log)

Fig. 1.2 – Signal temporel et spectre pour un son vois´e [a].

0 0.02 0.04 0.06 0.08 0.1

temps (s)

amplitude

0 2000 4000 6000 8000 10000

−4

−3

−2

−1 0 1 2 3

fréquence (Hz)

amplitude (log)

Fig. 1.3 – Signal temporel et spectre pour un son non vois´e [s].

Les figures 1.2 et 1.3 illustrent les signaux temporels et les spectres d’un son vois´e [a] et d’un son non vois´e [s]. La p´eriodicit´e temporelle du son vois´e se retrouve dans le spectre, o` u des pics fr´equentiels sont visibles aux fr´equences multiples de la fr´equence phonatoire pour les basses fr´equences. On n’observe pas de structure en harmoniques pour le son non vois´e. On peut ´egalement voir que les spectres pr´esentent une forme avec des maxima et des minima locaux. Ceux-ci sont des effets des fr´equences de r´esonance et d’anti-r´esonance du conduit vocal et sont appel´es formants et anti-formants. Les deux ou trois premiers formants permettent de diff´erencier les voyelles.

1.2.2 Mod´ elisation de la production de la parole

Le m´ecanisme de production de la parole peut ˆetre mod´elis´e comme une op´eration de filtrage lin´eaire [78]. Ce mod`ele est compos´e d’une source suivie d’un conduit vocal sans couplage entre ces deux parties. Il est illustr´e `a la figure 1.4.

Pour les voyelles, la source est mod´elis´ee par un train d’ondes p´eriodique dont la forme, caract´eris´ee par G(z), simule la forme du signal glottique et dont la p´eriode est la dur´ee d’un cycle glottique, T

0

. Pour les sons vois´es, le signal d’excitation est u(n) = !

k

δ(n − kT

0

), o` u T

0

est la dur´ee du cycle vocal. Pour les sons non-vois´es, le signal d’excitation u(n) est un bruit blanc de moyenne nulle et de variance unit´e.

Le conduit vocal est g´en´eralement mod´elis´e par un filtre tous pˆ oles. On peut

(4)

Fig. 1.4 – Mod`ele de la production de la parole.

en effet montrer qu’un filtre tous pˆ oles mod´elise la fonction de transfert d’un syst`eme de tubes acoustiques concat´en´es excit´e par une onde plane, ce qui est une approximation raisonnable du conduit vocal pour les sons non nasaux [23].

La fonction de transfert tous pˆ oles a la forme

H (z) = H

0

1 + !

N

i=1

b(i)z

i

. (1.1)

La fonction de transfert du rayonnement aux l`evres est mod´elis´e par un filtre proche d’un filtre d´erivateur :

R(z) = 1 − z

0

z

1

, z

0

≈ 1, z

0

< 1. (1.2) La valeur de z

0

est choisie l´eg`erement inf´erieure `a 1 afin de garantir la stabilit´e du filtre inverse R

1

(z), qui est rencontr´e dans certaines applications [23].

En r´esum´e, pour des sons vois´es, la transmittance globale entre le train d’impulsions de la figure 1.4 et le signal ´emis est T (z) = G(z)H (z)R(z). Pour des sons non vois´es, la transmittance entre l’excitation et le signal ´emis est T(z) = H (z)R(z).

En pratique, la transmittance globale est souvent mod´elis´ee par un filtre tous pˆ oles :

T (z) = S(z)

U (z) (1.3)

= σ

1 + !

p

i=1

a(i)z

i

= σ

A(z) . (1.4)

Dans cette expression, S(z) et U(z) d´esignent les transform´ees en z du signal

´emis et de l’excitation.

Ce mod`ele de production du signal vocal peut s’´ecrire dans le domaine tem- porel sous la forme suivante :

s(n) +

p

"

i=1

a(i)s(n − i) = σu(n). (1.5)

(5)

Cette relation exprime que chaque ´echantillon du signal est une combinaison lin´eaire des p ´echantillons qui le pr´ec`edent, `a laquelle on ajoute le terme d’exci- tation.

Pour analyser des signaux de parole, l’excitation est omise. On obtient alors un mod`ele de pr´ediction lin´eaire

s(n) +

p

"

i=1

a(i)s(n − i) = 0, (1.6)

o` u les coefficients a(i) sont appel´es coefficients de pr´ediction.

Les coefficients de pr´ediction estim´es a

est

sont obtenus en minimisant l’erreur de pr´ediction

e(n) = s(n) − s

est

(n) (1.7)

=

p

"

i=0

a

est

(i)s(n − i), avec a

est

(0) = 1. (1.8) Pour l’estimation des coefficients de pr´ediction, on minimise g´en´eralement la variance de l’erreur de pr´ediction, !

n

e(n)

2

. Diff´erentes variantes existent selon l’´etendue de la sommation. On distingue notamment les m´ethodes bas´ees sur l’autocorr´elation ou sur la covariance du signal [23].

A posteriori, on peut interpr´eter l’erreur de pr´ediction comme ´etant ´egale au signal de source. On peut obtenir des informations sur la transmittance du conduit vocal `a travers la r´eponse impulsionnelle du filtre de pr´ediction T(z) =

A(z)σ

, et sur la cyclicit´e (ou absence de cyclicit´e) du signal de source `a travers le signal r´esiduel obtenu par filtrage inverse du signal de parole :

σu(n) = x(n) +

p

"

i=1

a

est

(i)x(n − i). (1.9)

1.3 Application clinique de l’analyse de la parole

Les troubles de la parole d´esignent une alt´eration per¸cue du son de parole due aux conditions m´edicales du locuteur. Les indices vocaux de troubles de la parole sont des descripteurs num´eriques ou des mesures qui ont une pertinence clinique, qui r´esument des propri´et´es du signal de parole ou d’autres signaux obtenus de fa¸con non-invasive, et qui ont un lien avec la phonation en g´en´eral, ou la voix en particulier, du locuteur.

Typiquement, l’estimation d’indices vocaux implique l’enregistrement de si- gnaux relatifs `a la parole, le traitement de signal qui permet d’´eliminer des propri´et´es non d´esir´ees ou non pertinentes du signal et d’obtenir des donn´ees d´ecrivant la phonation, et le r´esum´e des donn´ees cliniquement pertinentes au moyen de quelques nombres [86].

Les applications des indices vocaux de troubles de la parole sont les suivantes.

1. La documentation de l’´etat de la voix du patient au moyen d’un faible

nombre de descripteurs num´eriques, qui font partie de l’anamn`ese du pa-

tient.

(6)

2. L’´evaluation de la fonction vocale. En plus de l’enregistrement d’indices acoustiques, l’´evaluation peut inclure l’inspection visuelle et l’´evaluation du mode de vibration des cordes vocales, l’enregistrement de donn´ees a´erodynamiques, ainsi que l’´evaluation auditive du signal de parole.

3. L’expertise, qui est similaire `a l’´evaluation, mais implique l’appr´eciation de la voix du patient par des experts.

4. Le suivi, c’est-`a-dire la comparaison de la voix du patient avant et apr`es une th´erapie ou une op´eration chirurgicale, dans le but de documenter explicitement les am´eliorations ou d´egradations de la voix du patient.

5. La comparaison de la voix du patient avec les voix de r´ef´erence de lo- cuteurs id´ealement appari´es en genre et en ˆage. Des objectifs potentiels sont la caract´erisation d’une maladie laryng´ee ou d’un handicap vocal en r´esumant les voix d’un groupe homog`ene de patients, et en le comparant avec un groupe de locuteurs normophoniques.

L’´evaluation non-invasive de la parole n’est g´en´eralement pas suffisante pour

´evaluer l’origine des troubles de la production de la parole du patient. Il est souvent n´ecessaire d’avoir recours `a des proc´edures invasives afin d’´etudier le fonctionnement de la phonation au niveau du larynx. Les raisons pour lesquelles les cliniciens analysent le signal de parole en plus des proc´edures invasives sont les suivantes.

– L’inspection visuelle du larynx n´ecessite l’introduction de conduits op- tiques dans les cavit´es vocales. La qualit´e de l’image obtenue d´epend de la taille et du positionnement du capteur introduit. Mˆeme s’il n’y a pas d’anesth´esie locale, la pr´esence des conduits optiques et la n´ecessit´e de ne pas obstruer le champ de vision de la cam´era influencent le mouvement du larynx et des articulateurs. Dans ces conditions, les locuteurs ne peuvent produire que des sons soutenus [19, 55].

– La correction de la qualit´e vocale peut ˆetre le but principal poursuivi par les cliniciens, car une voix anormale peut avoir une influence sur la com- munication orale, l’expression esth´etique ou l’image que le locuteur a de lui-mˆeme. Certains experts estiment que les anomalies laryng´ees n’ont de pertinence clinique que lorsqu’elles causent des troubles de la parole, la seule exception ´etant le cas des stades pr´ecoces d’une maladie progres- sive [60].

– L’analyse de la parole est un moyen d’´evaluation non-invasif, qui peut ˆetre utilis´e pour le suivi de la voix du locuteur en dehors du milieu clinique.

La litt´erature est abondante au sujet des indices vocaux en relation avec des troubles de la parole. La diversit´e des publications refl`ete la diversit´e des choix concernant les pathologies ou handicaps ´etudi´es, les symptˆ omes vocaux d´ecrits, les tˆ aches effectu´ees par les locuteurs, les performances linguistiques, paralin- guistiques et extralinguistiques examin´ees, les capteurs utilis´es, les donn´ees de parole enregistr´ees, ainsi que les indices descriptifs non acoustiques auxquels les indices acoustiques ont ´et´e corr´el´es.

Les indices acoustiques peuvent ˆetre class´es en fonction des symptˆ omes que

l’on souhaite qu’ils mettent en ´evidence. On peut classer les indices selon les

cat´egories suivantes :

(7)

– indices de coordination, qui se rapportent au d´eroulement temporel du d´ebut et de la fin du voisement, en relation avec des ´ev`enements supra- glottiques,

– indices prosodiques ou suprasegmentaux, qui caract´erisent l’intonation, la fluidit´e et le rythme de la parole,

– indices morphologiques, qui se rapportent aux propri´et´es de la forme du signal de source glottique,

– indices de dysp´eriodicit´e, qui d´ecrivent les irr´egularit´es des cycles vocaux.

1.3.1 Irr´ egularit´ es des cycles vocaux

Parmi les diff´erents types d’indices acoustiques, nous nous int´eressons aux perturbations de la r´egularit´e des dur´ees des cycles vocaux. Les irr´egularit´es des cycles vocaux sont souvent corr´el´ees avec les troubles de la voix. Cependant, mˆeme chez des locuteurs normophoniques, la p´eriodicit´e des signaux de parole vois´es n’est pas parfaite, et ces irr´egularit´es contribuent au caract`ere naturel de la voix.

Les irr´egularit´es des cycles vocaux peuvent ˆetre li´ees au mode de vibration des cordes vocales. La vibration des vraies cordes vocales combin´ee avec le flux d’air pulsant forme un syst`eme dynamique non-lin´eaire qui peut adopter plu- sieurs r´egimes qui diff`erent qualitativement. On distingue g´en´eralement trois registres chez les locuteurs normophoniques : la voix craqu´ee, la voix modale et la voix de fausset [41]. Les fr´equences phonatoires et la qualit´e de voix diff`erent selon le registre. Il existe ´egalement d’autres r´egimes laryng´es, pour lesquels les dur´ees et formes des cycles adjacents diff`erent significativement.

Le jitter et le shimmer vocal sont les petites variations rapides des dur´ees et amplitudes des cycles vocaux [92]. Ces perturbations sont observ´ees d’un cycle

`a l’autre.

Le tremblement vocal, ou vocal tremor en anglais, d´esigne les modulations basse-fr´equence (sous 15Hz) de la fr´equence phonatoire ou de l’amplitude du cycle vocal [92]. On peut ´egalement observer du tremblement vocal dans les ca- ract´eristiques spectrales du signal de parole [17]. Pour certains auteurs, le terme tremor a une d´efinition plus sp´ecifique et se r´ef`ere `a une modulation `a bande-

´etroite `a une fr´equence unique [45, 101]. Chez les locuteurs normophoniques, le tremblement vocal est faible et parfois appel´ee microtremblement [84].

Le flux d’air turbulent traversant la glotte peut causer un bruit de turbulence audible. Ainsi le souffle dans la voix a souvent ´et´e li´e `a une fermeture courte ou incompl`ete de la glotte, permettant `a l’air de s’´echapper de fa¸con audible [92].

Le larynx comporte, en plus des vraies cordes vocales, des plis ventriculaires et ary-´epiglottiques, qui de fa¸con g´en´erale ne sont pas suppos´es vibrer. Cepen- dant, certains locuteurs peuvent faire vibrer ces plis, volontairement ou non.

Enfin, certains locuteurs dysphoniques passent brusquement et involontaire-

ment d’un registre de parole `a un autre, ou d’un r´egime r´egulier de vibration ` a un

r´egime moins r´egulier, pr´esentent des d´evoisements momentan´es involontaires,

ou passent d’une octave `a une autre de fa¸con inattendue [6].

(8)

1.3.2 Tremblement vocal

Dans le cadre de ce travail, nous nous int´eressons `a un type d’irr´egularit´e des cycles vocaux : le tremblement vocal.

On distingue le tremblement physiologique du tremblement pathologique. Le tremblement physiologique aurait pour principales causes des oscillations neu- rologiques ou m´ecaniques, le flux sanguin pulsant ou la respiration [30]. A cause de cette multitude de causes, on ne s’attend pas `a ce que le tremblement physio- logique pr´esente un pic de modulation unique [84]. Chez les locuteurs atteints de pathologies pr´esentant du tremblement des membres, on peut s’attendre `a ob- server du tremblement pathologique ´egalement dans la parole. Des exemples de ce type de pathologies sont la maladie de Parkinson, le tremblement essentiel ou le syndrome c´er´ebelleux. Chez des locuteurs atteints de maladies neurologiques, il est ´egalement possible que les modulations basse-fr´equence diff`erent de celles de locuteurs normophoniques, car une partie du tremblement physiologique a des causes neurologiques.

On distingue trois types de tremblements pathologiques, se produisant dans des gammes de fr´equences diff´erentes [22] :

– le tremblement d’action ou tremblement intentionnel se manifeste lors d’un mouvement intentionnel du patient et est pr´esent dans l’intervalle [1.5Hz,3Hz],

– le tremblement au repos apparaˆıt lorsque les muscles du patient sont relˆ ach´es et est observ´e dans la bande de fr´equences [3Hz,7Hz],

– le tremblement d’attitude ou postural, qui se manifeste quand le patient adopte une posture, est observ´e dans la bande de fr´equences [8Hz,12Hz].

L’analyse du tremblement vocal n´ecessite le choix d’indices num´eriques ca- ract´erisant l’amplitude de la modulation et sa distribution fr´equentielle.

L’amplitude de modulation relative est d´efinie comme l’´ecart-type de la va- riation de la fr´equence phonatoire divis´e par la fr´equence phonatoire moyenne [84] ou par l’´ecart maximum par rapport `a la fr´equence phonatoire moyenne, divis´e par la fr´equence phonatoire moyenne [26, 84, 99].

La fr´equence de modulation est plus complexe `a caract´eriser. Dans le cas par- ticulier o` u il y a un pic pr´epond´erant dans le spectre des modulations, la position fr´equentielle de ce pic est un indice acceptable. Par contre, en pr´esence de plu- sieurs pics fr´equentiels d’amplitude non n´egligeables, la distribution fr´equentielle de la modulation comporte plus d’information, et il est difficile de la caract´eriser par une valeur num´erique unique. La fr´equence de modulation a ´et´e estim´ee par l’inverse de la distance moyenne entre les maxima dans l’´evolution temporelle de la fr´equence phonatoire [26], par la fr´equence du maximum du spectre de modulation [101], ou par la moyenne pond´er´ee des fr´equences statistiquement significatives du spectre de modulation [84].

1.3.3 Maladie de Parkinson et tremblement vocal

Dans le cadre de ce travail, nous appliquons des algorithmes d’estimation

du tremblement vocal `a des signaux soutenus par des locuteurs atteints de la

maladie de Parkinson.

(9)

La maladie de Parkinson est une maladie progressive et d´eg´en´erative du syst`eme nerveux central. C’est la maladie neurologique la plus commune [21].

Elle a pour symptˆ omes la rigidit´e, le tremblement au repos ([3Hz − 7Hz]) et de posture ([8Hz − 12Hz]), et un intervalle limit´e du mouvements des membres, du cou et de la tˆete. Des probl`emes li´es `a la parole et `a la d´eglutition sont fr´equents : Hartelius et Svensson [39] ont ´etudi´e les symptˆ omes de 250 pa- tients atteints de la maladie de Parkinson. 70% des patients se consid´eraient comme souffrant d’alt´erations de la voix et de la parole en rapport avec leur maladie. Les probl`emes li´es `a la parole ´etaient consid´er´es comme le plus grand probl`eme par 29% des patients. Des dysfonctionnements du larynx ont ´et´e ob- serv´es fr´equemment [38,59]. Les probl`emes aux muscles laryng´es peuvent r´eduire la capacit´e `a initier la phonation, `a produire un volume ad´equat, et `a varier la fr´equence phonatoire. Perez et al. [76] ont observ´e que parmi les patients qu’ils ont ´etudi´es, une majorit´e pr´esentent du tremblement du larynx dans les trois conditions ´etudi´ees : repos, fr´equence phonatoire et volume sonore normaux, et voix forte.

Les troubles de la voix sont principalement ´evalu´es par perception auditive.

Chez les locuteurs atteints de la maladie de Parkinson, des indices perceptifs de qualit´e de voix pertinents sont le souffle, la raucit´e ou le tremblement. Holmes et al. [45] ont ´etudi´e des locuteurs atteints de la maladie de Parkinson. Ils ont observ´e du tremblement `a bande ´etroite uniquement chez les locuteurs `a un stade avanc´e de la maladie. Ziegler et Hoole [104] ont observ´e des troubles de la voix dus `a la maladie de Parkinson d´ependant du genre du locuteur, les hommes pr´esentant principalement une fr´equence phonatoire plus ´elev´ee et du souffle, tandis que les femmes avaient une voix tremblante avec une qualit´e de voix tendue.

Afin de compl´eter les informations obtenues par ´evaluation auditive, on sou- haite obtenir des mesures acoustiques. Plusieurs ´etudes ont ´et´e men´ees concer- nant les caract´eristiques acoustiques de la voix de patients atteints de la ma- ladie de Parkinson [53, 54, 105]. Dans la plupart des ´etudes, pour des voyelles soutenues, on a observ´e des fr´equences phonatoires moyennes dans la normale, mais des variations relatives de la fr´equence phonatoire plus grandes que la normale [105], ce qui pourrait refl´eter une perte de contrˆ ole de l’activit´e mo- trice. Hirose et al. [44] ont ´etudi´e de nombreux indices acoustiques de patients souffrant de maladies neurologiques, incluant la maladie de Parkinson. Ils ont observ´e une plus grande variabilit´e de la fr´equence phonatoire chez les locuteurs parkinsoniens par rapport `a des locuteurs de contrˆ ole, tant pour les fluctuations rapides [16Hz,F

0

/2] que pour des variations lentes [0.1Hz,16Hz].

L’application de l’estimation des indices de modulation basse-fr´equence `a des locuteurs atteints de la maladie de Parkinson est int´eressante pour les raisons suivantes.

Il y a peu d’´etudes pr´esentant des donn´ees concernant les modulations basse- fr´equence de la fr´equence phonatoire chez des locuteurs parkinsoniens [44, 99, 101]. La maladie de Parkinson est caract´eris´ee par la pr´esence d’un tremblement au repos et d’un tremblement de posture des membres du patient. On s’attend

`a ce que ces tremblements se retrouvent dans les modulations de leurs voix.

De plus, les probl`emes vocaux apparaissent pr´ecocement chez de nombreux pa-

tients parkinsoniens, souvent parmi les premiers symptˆ omes. Des informations

(10)

qui pourraient contribuer `a am´eliorer la qualit´e de voix des patients sont sou- haitables. Il est par cons´equent int´eressant d’´etudier l’effet de la maladie de Parkinson sur les indices de modulation vocale, et d’´etablir si ces indices per- mettent de distinguer les locuteurs normophoniques et parkinsoniens, ainsi que d’´etudier l’´evolution des indices au cours du traitement des patients.

De plus, les r´esultats des quelques ´etudes traitant du tremblement vocal chez des locuteurs atteints de la maladie de Parkinson sont difficiles `a comparer. En effet, les r´esultats sont obtenus pour des locuteurs en cours de traitement. On s’attend donc `a des diff´erences entre le type de traitement et la s´ev´erit´e des symptˆ omes vocaux des patients. Dans certaines ´etudes seulement, les voix de locuteurs pr´esentent sp´ecifiquement un tremblement vocal qui est perceptible `a l’audition [101]. Des donn´ees suppl´ementaires pourraient simplifier la mise en

´evidence de comportements globaux li´es `a la maladie de Parkinson.

1.4 Revue de la litt´ erature

Il existe peu d’´etudes qui s’int´eressent aux modulations vocales lentes. Cel`a peut s’expliquer par le fait que, bien que pr´esentes dans tout type de parole, les variations lentes involontaires de la voix sont masqu´ees par d’autres variations volontaires li´ees `a la prosodie. Pour les mettre en ´evidence et les quantifier, il faut les isoler en analysant des voyelles soutenues. Dans une partie des ´etudes concernant les modulations vocales lentes, les locuteurs pr´esentent un trem- blement vocal `a bande ´etroite perceptible `a l’oreille, que l’analyse acoustique permet de confirmer. Peu d’attention est port´ee aux modulations vocales basse- fr´equence lorsqu’il n’y a pas (encore) de tremblement audible. Les ´etudes exis- tantes concernant le tremblement vocal traitent principalement des modulations de la fr´equence phonatoire et de l’amplitude du signal de parole.

Certains auteurs ont ´etudi´e les voix de locuteurs pr´esentant un tremblement pathologique, et les ont compar´ees `a celles de locuteurs normophoniques de contrˆ ole, en se basant sur l’examen visuel des spectrogrammes [56, 58]. Dans la suite de cette section, nous pr´esentons les ´etudes de la litt´erature selon le type de locuteurs analys´es. Les tableaux 1.1 et 1.2 r´ecapitulent ensuite les ´etudes principales, en fonction des indices caract´erisant les modulations vocales de la fr´equence phonatoire, et le tableau 1.3 des modulations des fr´equences des for- mants ou de la forme du conduit vocal. Les ´etudes sont r´esum´ees au moyen du nombre de locuteurs ´etudi´es, des m´ethodes d’estimation des modulations vocales, des indices analys´es et des principales conclusions.

Locuteurs normophoniques ou l´ eg` erement dysphoniques Schoentgen a ´etudi´e le (micro-)tremblement de la fr´equence phonatoire de 38 locuteurs nor- mophoniques et de 51 locuteurs l´eg`erement dysphoniques (sans tremblememt pathologique), pour des voyelles [a], [i] et [u] [84]. La m´ethode d’analyse est bas´ee sur le d´etection des dur´ees des cycles vocaux par les maxima principaux, suivie par une analyse du spectre de la s´erie de dur´ees de cycles. Il a calcul´e deux indices de profondeur de modulation relative, l’´ecart maximal ou l’´ecart- type de la fr´equence phonatoire divis´e par la fr´equence phonatoire moyenne.

Il a ´egalement calcul´e deux indices de fr´equence de modulation, donn´es par

(11)

la moyenne pond´er´ee des fr´equences des pics statistiquement significatifs du spectre de la s´erie des dur´ees de cycles ou de la fonction d’autocovariance empi- rique de la s´erie de dur´ees de cycles, dans la bande de fr´equence [0.5Hz, 25Hz].

Il a observ´e que le micro-tremblement vocal en fr´equence ne diff`ere pas entre les hommes et les femmes, entre les locuteurs normophoniques et l´eg`erement dysphoniques, ni entre les diff´erents timbres.

Locuteurs atteints de divers types de tremblements vocaux patholo- giques Ludlow et al. ont ´etudi´e le tremblement de la fr´equence phonatoire et de l’enveloppe de voyelles soutenues [a] chez 9 locuteurs pr´esentant divers types de tremblements vocaux et 20 locuteurs normophoniques [61]. Ils ont estim´e la fr´equence de modulation de fa¸con heuristique, et l’amplitude du tremblement de fa¸con relative au jitter. Ils ont observ´e que le tremblement vocal ´etait pr´esent aussi bien dans les variations de l’enveloppe du signal de parole que dans la fr´equence phonatoire. Le pourcentage de variations de la fr´equence phonatoire dˆ u au tremblement ´etait plus important chez les patients que chez les locuteurs normophoniques.

Winholtz et Ramig ont d´evelopp´e un instrument de mesure du tremblement de l’intensit´e vocale et de la fr´equence phonatoire [99]. Des indices de profondeur et de fr´equence de modulation de l’intensit´e vocale et de la fr´equence phonatoire sont calcul´es au moyen d’un d´emodulateur du signal analytique associ´e au signal de parole filtr´e passe-bas. La profondeur de modulation est donn´ee par l’´ecart maximum par rapport `a la fr´equence phonatoire moyenne divis´e par la fr´equence phonatoire moyenne, et la fr´equence de modulation par une moyenne pond´er´ee des pics spectraux dans la bande de fr´equence [2.5 Hz, 25 Hz]. Le d´emodulateur est illustr´e pour des voyelles [a] produites par 12 locuteurs normophoniques, 12 locuteurs pr´esentant un vibrato et 12 locuteurs pr´esentant des tremblements vocaux pathologiques. Les intervalles inter-quartiles de la fr´equence de modu- lation sont [5.5 Hz, 8 Hz] et [4.9 Hz,6.1 Hz], pour les hommes et les femmes normophoniques, et [4.0 Hz, 6.5 Hz] et [5.0 Hz,6.5 Hz], pour les hommes et les femmes pr´esentant un tremblement pathologique. Les intervalles inter-quartiles de la profondeur de modulation sont [0.9 %, 1.8 %] et [0.8 %, 1.3 %], pour les hommes et les femmes normophoniques, et [3.4 %, 6 %] et [4.3 %, 10.7 %], pour les hommes et les femmes pr´esentant un tremblement vocal pathologique. Les fr´equences de modulation de la fr´equence phonatoire ne sont pas statistique- ment diff´erentes entre les groupes. L’amplitude de modulation de la fr´equence phonatoire est statistiquement plus ´elev´ee chez les locuteurs pr´esentant un trem- blement vocal ou un vibrato que chez les locuteurs de contrˆ ole.

Hirose et al. ont ´etudi´e de nombreux indices acoustiques chez des locuteurs

atteints de maladies neurologiques, dont 12 parkinsoniens, et 51 locuteurs de

contrˆ ole, pour des voyelles [a] d’une dur´ee d’une seconde [44]. La fr´equence

phonatoire a ´et´e estim´ee par l’inverse des dur´ees de cycles obtenues en d´etectant

les pics principaux de chaque cycle glottique. Parmi les indices ´etudi´es, celui qui

concerne les modulations basse-fr´equence de la fr´equence phonatoire est l’´energie

basse-fr´equence dans l’intervalle [0.1Hz, 16Hz] des variations de la fr´equence

phonatoire, normalis´ee par rapport `a la fr´equence phonatoire moyenne. Ils ont

observ´e des variations plus importantes chez les locuteurs parkinsoniens que

chez les locuteurs de contrˆ ole.

(12)

Jiang et al. ont ´etudi´e le tremblement vocal de signaux acoustiques et a´ero- dynamiques au cours de la production de voyelles soutenues par dix locuteurs atteints de diff´erents tremblements pathologiques (cinq hommes et cinq femmes) et dix locuteurs normophoniques appari´es [48]. Les modulations de l’intensit´e acoustique et du d´ebit d’air ont ´et´e analys´ees sur des segments de signaux de deux secondes. La modulation de la fr´equence phonatoire n’a pas ´et´e ´etudi´ee. Les six pics les plus dominants de chaque spectre de modulation ont ´et´e s´electionn´es dans la bande de fr´equence [0 Hz,30 Hz], et caract´eris´es par un rapport de pro´eminence d´efini comme le rapport de l’´energie du pic divis´ee par l’´energie totale de modulation. Les fr´equences des pics ne permettent pas de distinguer les patients des locuteurs normophoniques. Les rapports de pro´eminence des pics de modulation de l’intensit´e acoustique ´etaient plus ´elev´es chez les patients que chez les locuteurs normophoniques. Ils ont ´egalement observ´e plus fr´equemment une corr´elation positive et forte entre le contour d’intensit´e acoustique et le d´ebit d’air chez les patients (90%) que chez les locuteurs normophoniques (40%).

Locuteurs pr´ esentant un syndrome c´ er´ ebelleux Ackermann et Ziegler ont ´etudi´e des voyelles soutenues et des fricatives non-vois´ees d’une locutrice atteinte d’un syndrome c´er´ebelleux chronique et pr´esentant un tremblement vocal audible, par l’interm´ediaire de contours de l’intensit´e du signal, de contours de la fr´equence phonatoire et de param`etres spectraux [1]. Pour les voyelles, les contours de la fr´equence phonatoire et le spectre de modulation de la fr´equence phonatoire ont montr´e des oscillations rythmiques intermittentes `a une fr´equen- ce proche de 3Hz. Aucun indice d’amplitude de modulation n’a ´et´e calcul´e.

Locuteurs avec une scl´ erose amyotrophique lat´ erale Aronson et al. [3]

ont appliqu´e le d´emodulateur d´evelopp´e par Winholtz et Ramig [99] `a huit lo- cuteurs atteint de scl´erose amyotrophique lat´erale pr´esentant un tremblement vocal rapide et huit locuteurs t´emoins appari´es en ˆ age et en genre. La modula- tion de la fr´equence phonatoire a ´et´e ´etudi´ee sur base du spectre de Fourier de la trace de la fr´equence phonatoire sur des fenˆetres d’une seconde. Les amplitudes et les fr´equences des pics spectraux dominants ont ´et´e identifi´ees dans la bande de fr´equence de 1Hz `a 25Hz par deux exp´erimentateurs. Les r´esultats ont montr´e qu’il y avait des combinaisons multiples d’amplitudes et de fr´equences de mo- dulation chez les patients, tandis que chez les locuteurs t´emoins, la modulation

´etait uniform´ement faible. Les pics spectraux de modulation n’´etaient pas claire- ment concentr´es `a une fr´equence, mais l’amplitude de modulation ´etait toujours plus importantes chez les patients que chez les locuteurs normophoniques. Tant chez les patients que chez les t´emoins, des pics spectraux pro´eminents ont ´et´e observ´es dans toute la bande de fr´equences analys´ee. L’amplitude des pics spec- traux de la modulation en fr´equence est comprise entre 17.7 et 637mV chez les patients, et entre 6.9 et 134.8mV chez les t´emoins.

Locuteurs atteints de tremblement vocal essentiel Plusieurs ´etudes

concernent le tremblement vocal essentiel [32], sa corr´elation avec l’activit´e

musculaire au niveau du larynx [28, 57], ainsi que l’effet du traitement sur le

tremblement vocal essentiel [42,97]. Dans ces ´etudes, le tremblement vocal est `a

(13)

bande ´etroite et perceptible `a l’oreille. L’analyse du signal de parole est donc fa- cilit´ee. Des indices caract´erisant la modulation basse-fr´equence sont utilis´es par Dromey et al., qui ont ´etudi´e l’influence de la fr´equence phonatoire moyenne et du volume sonore chez dix locuteurs pr´esentant un tremblement vocal essen- tiel [26]. L’estimation de la fr´equence phonatoire ´etait bas´ee sur une analyse synchrone par autocorr´elation. Les fr´equences des modulations de la fr´equence phonatoire et de l’amplitude de l’enveloppe du signal ont ´et´e estim´ees sur base des positions des maxima de la trace de la fr´equence phonatoire et de l’enve- loppe du signal. Les profondeurs de modulation ont ´et´e estim´ees par la moyenne des ´ecarts entre le maximum et le minimum entre deux pics successifs dans les traces, divis´ee par la moyenne. Dans les conditions normales de volume sonore et pour une fr´equence phonatoire normale, les amplitudes de modulation de la fr´equence phonatoire varient entre 3.4% et 18.2%, et les fr´equences de modu- lation de la fr´equence phonatoire sont comprises entre 3.2 Hz et 5.3 Hz. Les auteurs ont observ´e que pour des fr´equences phonatoires ´elev´ees, les modula- tions de la fr´equence phonatoire et de l’enveloppe du signal de parole ´etaient plus rapides. La modulation de l’enveloppe du signal de parole ´etait plus rapide pour des signaux `a volume ´elev´e. Pour des fr´equences phonatoires basses, la modulation de l’enveloppe du signal de parole avait diminu´e. Enfin, la variation de la fr´equence phonatoire moyenne provoquait des changements importants du d´ephasage entre la modulation de l’enveloppe du signal de parole et la modula- tion de la fr´equence phonatoire chez certains locuteurs, et pas d’effets apparents chez d’autres.

Locuteurs atteints de la maladie de Parkinson Yair et Gath ont d´eve- lopp´e une m´ethode bas´ee sur un mod`ele de processus par points pour l’analyse du tremblement vocal dans les voyelles soutenues [101]. Les positions des pics principaux de chaque cycle vocal sont estim´es au moyen de la fonction d’auto- corr´elation du signal filtr´e passe-bas `a 1500Hz, pour une fenˆetre positionn´ee au passage par z´ero pr´ec´edant les pics principaux du cycle de parole. Le maximum de la fonction d’autocorr´elation donne la dur´ee du cycle et permet de d´eterminer le pic principal suivant et de positionner la fenˆetre suivante au passage par z´ero le pr´ec´edant. La s´erie de dur´ees de cycles est ensuite mod´elis´ee comme un pro- cessus par points, permettant d’obtenir le spectre de puissance. Un atout de cette m´ethode est qu’il n’est pas n´ecessaire de r´e´echantillonner `a pas constant la s´erie des dur´ees de cycles.

Yair et Gath ont appliqu´e cette analyse `a un corpus de voyelles [a] soutenues

par neuf locuteurs parkinsoniens et trois locuteurs contrˆ oles. Cette technique

d’analyse leur a permis de mettre en ´evidence un pic ´etroit dans le spectre de

la fr´equence phonatoire pour une fr´equence comprise entre 4 Hz et 6 Hz chez

chaque locuteur parkinsonien. La fr´equence et l’amplitude de ces variations ryth-

miques de la fr´equence phonatoire correspondent `a la fr´equence et `a l’amplitude

du tremblement au repos observ´e dans les mains de ces patients. Pour les lo-

cuteurs normophoniques, la plupart de l’´energie est concentr´ee sous 3Hz. Pour

les fr´equences plus ´elev´ees, l’´energie est faible et r´epartie uniform´ement dans

l’intervalle de fr´equence. Pour les locuteurs parkinsoniens, l’analyse spectrale

de l’´electromyogramme des muscles de la main, et des mouvements de la main

enregistr´es au moyen d’un acc´el´erom`etre montre que la fr´equence de tremble-

ment estim´ee `a partir du pic ´etroit dans le spectre de modulation correspond

(14)

`a la fr´equence du tremblement p´eriph´erique avec un coefficient de corr´elation de .99. L’intensit´e du tremblement vocal, d´efinie comme l’´energie contenue dans la bande spectrale [3.5Hz,7.5Hz], est corr´el´ee avec le degr´e de tremblement des membres mesur´e cliniquement, avec un coefficient de corr´elation de 0.96.

Dans [33], Gath et Yair pr´esentent une am´elioration de leur m´ethode d’ana- lyse du tremblement de la fr´equence phonatoire. Le but ´etait de pouvoir mieux traiter des signaux courts, r´esultant de probl`emes respiratoires du locuteur l’empˆechant de produire une voyelle soutenue longue. La m´ethode est modifi´ee en ajoutant une contrainte param´etrique sur la forme du spectre de la s´erie de dur´ees de cycles. La solution est alors ´equivalente `a celle obtenue par un mod`ele de pr´ediction linaire, avec la m´ethode de covariance, de la s´erie de dur´ees de cycles apr`es r´e´echantillonnage de celle-ci `a pas constant.

Dans [101], Yair et Gath ont ´egalement mentionn´e des r´esultats pour l’ana- lyse du tremblement vocal par l’interm´ediaire des fr´equences des formants, pour les mˆeme neuf locuteurs parkinsoniens. Pour obtenir celles-ci, une ana- lyse spectrale synchrone a ´et´e effectu´ee, au moyen de la m´ethode de pr´ediction lin´eaire d’ordre 16. La fenˆetre d’analyse s’´etend du passage par z´ero suivant le pic principal de chaque cycle glottique jusqu’au passage par z´ero pr´ec´edent le pic principal du cycle glottique suivant. La s´erie de fr´equences de formants est r´e´echantillonn´ee `a pas constant et son spectre de Fourier est calcul´e. L’obser- vation des spectres de modulation a montr´e que le premier formant est le plus affect´e par le tremblement vocal. Pour tous les locuteurs parkinsoniens, des pics ont ´et´e observ´e `a la mˆeme fr´equence dans le spectre de modulation du premier formant et dans le spectre de modulation de la fr´equence phonatoire. Cepen- dant, les spectres obtenus pour les modulations des formants sont plus bruit´es que les spectres de modulation de la fr´equence phonatoire, et les pics y sont moins pro´eminents.

Dans le cadre de l’´etude de la rigidit´e du conduit vocal de ces neuf locuteurs parkinsoniens et trois locuteurs de contrˆ ole, Gath et Yair ont estim´e la forme du conduit vocal au moyen d’un mod`ele de tubes concat´en´es, et analys´e les variations de ce conduit vocal au cours de la production de syllabes [la] [34].

Les sections des tubes ont ´et´e obtenues par une analyse synchrone ARMA [65].

Leurs hypoth`eses ´etaient que les variations de la section du tube correspondant

`a la pointe de la langue sont dues soit au tremblement pathologique, soit `a la ri-

gidit´e des muscles du locuteur. Les variations li´ees au tremblement pathologique

sont suppos´ees avoir la mˆeme forme que le tremblement vocal d´etect´e dans la

fr´equence phonatoire, `a un d´elai et `a un facteur d’amplitude pr`es. La rigidit´e est

caract´eris´ee par la surface sous le spectre des variations de la section du tube

correspondant `a la pointe de la langue, apr`es suppression des variations li´ees au

tremblement pathologique. Les ´energies spectrales estim´ees sont en accord avec

le degr´e de rigidit´e mesur´e de fa¸con clinique chez les locuteurs parkinsoniens,

tandis que chez les locuteurs contrˆ ole, l’intensit´e des variations ´etait n´egligeable.

(15)

1. 4. R E V U E D E L A L IT T ´E R A T U R E 15 Hirose et al.

(1995) [44]

12 Parkinsoniens 51 contrˆ oles

F

0

: d´etection des dur´ees de cycles modul. F

0

: spectre FFT de la s´erie F

0

´energie dans la bande de fr´equence [0.1 Hz, 16 Hz], normalis´ee par rapport `a F

0

moyenne Conclusion : Variations plus importantes chez les locuteurs parkinsoniens que chez les contrˆ oles.

Modulation caract´eris´ee de fa¸con heuristique ou par observation

Auteurs corpus M´ethodes d’estimation Indices

Ludlow et al.

(1986) [61]

9 patients avec TV F

0

: pas pr´ecis´e fr´equence de modulation de F

0

pourcentage des variations de F

0

dues au TV fr´equence de modulation de l’enveloppe pourcentage des variations de l’enveloppe dues au TV

20 normophoniques modul. F

0

: heuristique

Conclusion : TV dans les modulations de l’enveloppe et de la fr´equence phonatoire.

Ackermann et Ziegler (1991) [1]

1 locutrice avec syndrome c´er´ebelleux

F

0

: pas pr´ecis´e

modul. F

0

: spectre de la trace de F

0

observation du signal temporel de F

0

et de son spectre

Conclusion : Oscillations rythmiques intermittentes `a une fr´equence proche de 3 Hz.

Dromey et al.

(2002) [26]

10 TV essentiel F

0

: analyse synchrone bas´ee sur l’auto- corr´elation

fr´equence de modulation modul. F

0

: positions des pics dans la

trace de F

0

profondeur de modulation relative Conclusion : La fr´equence de modulation augmente lorsque la fr´equence phonatoire du locuteur augmente.

Modulation caract´eris´ee par plusieurs pics spectraux pro´eminents

Auteurs Corpus M´ethodes d’estimation Indices

Aronson et al.

(1992) [3]

8 patients avec SLA, 8 contrˆ oles appari´es

F

0

: d´emodulation modul. F

0

: spectre FFT

fr´equences et amplitudes des pics dominants du spectre

Conclusions : (1) Variabilit´e des amplitudes et fr´equences de modulation en fonction des patients.

(2) Pas de pic spectral pr´epond´erant unique chez les patients.

(3) Amplitude de modulation plus importante chez les patients que chez les contrˆ oles.

Tab. 1.1 – R´ecapitulatif des r´esultats obtenus dans la litt´erature relatifs aux modulations de la fr´equence phonatoire F

0

. (TV = tremble-

ment vocal)

(16)

16 C H A P IT R E 1. IN T R OD U C T Yair et Gath (1988) [101]

9 parkinsoniens 3 contrˆ oles

F

0

: d´etection des dur´ees de cycle modul. F

0

: spectre obtenu au moyen d’un mod`ele de processus par points

Fr´equence du pic principal du spectre de modulation

Energie du spectre dans la bande [3.5Hz,7.5Hz] ´ Conclusions :

(1) Pic ´etroit entre 4Hz et 6Hz dans le spectre de modulation des locuteurs Parkinsoniens.

(2) Fr´equence du tremblement vocal corr´el´ee avec la fr´equence du tremblement des extr´emit´es.

(3) Intensit´e du tremblement corr´el´ee avec le degr´e du tremblement des extr´emit´es estim´e cliniquement.

Winholtz et Ramig (1992) [99]

12 normophoniques 12 patients avec TV 12 chanteurs avec vibrato

F

0

: d´emodulation

modul. F

0

: spectre FFT de F

0

dans la bande de fr´equence [2.5Hz,25Hz]

fr´equence de modulation profondeur de modulation

Conclusions :

(1) Les fr´equences de modulation ne sont pas statistiquement diff´erentes entre les trois groupes.

(2) Amplitude de modulation plus ´elev´ee chez les locuteurs avec TV que chez les normophoniques.

(3) Intervalles inter-quartiles de la fr´equence de modulation : [5.5 Hz, 8 Hz] et [4.9 Hz,6.1 Hz], pour les hommes et les femmes normophoniques, et [4.0 Hz, 6.5 Hz] et [5.0 Hz,6.5 Hz], pour les hommes et les femmes avec TV.

(4) Intervalles inter-quartiles de la profondeur de modulation : [0.9%, 1.8%] et [0.8%, 1.3%], pour les hommes et les femmes normophoniques, et [3.4%, 6%] et [4.3%, 10.7%], pour les hommes et les femmes ave TV.

Schoentgen (2002) [84]

38 normophoniques 51 l´eg`erement dys- phoniques (sans TV)

F

0

: dur´ees de cycles

modul. F

0

: dans la bande de fr´equence [0.5Hz,25Hz]

profondeur de modulation (2 indices) fr´equence de modulation (2 indices) Conclusions :

(1) Pas de diff´erence entre les voyelles, entre les genres ou entre les groupes de locuteurs.

(2) Intervalles inter-quartiles typiques de la profondeur et de la fr´equence de modulation : [0.4%, 1.3%] et [2.0, 4.7Hz].

Tab. 1.2 – R´ecapitulatif des r´esultats obtenus dans la litt´erature concernant les modulations de la fr´equence phonatoire F

0

(suite).

(17)

R E V U E D E L A L IT T ´E R A T U R E 17

Auteurs locuteurs M´ethodes d’estimation Indices ´etudi´es

Yair et Gath (1988) [101]

9 parkinsoniens F

i

: analyse spectrale synchrone par LPC spectre de modulation 3 contrˆ oles modul. F

i

: spectre de la s´erie r´e´echantillonn´ee des

fr´equences des formants Conclusions :

(1) F

1

le plus affect´e par le tremblement vocal.

(2) Mˆeme fr´equence des pics dans les spectres de modulation de F

1

et de F

0

chez les parkinsoniens, mais spectre de modulation de F

1

plus bruit´e.

Gath et Yair (1988) [34]

9 parkinsoniens analyse synchrone ARMA section du 7e tube sur 8

(en partant de la glotte) 3 contrˆ oles

Conclusions :

(1) Le tremblement du conduit vocal est dˆ u au tremblement pathologique ou `a la rigidit´e des muscles.

(2) Le tremblement pathologique du conduit vocal est fortement corr´el´e avec le tremblement vocal de la fr´equence phonatoire, `a un d´elai et `a un facteur d’amplitude pr`es.

Tab. 1.3 – R´ecapitulatif des r´esultats obtenus dans la litt´erature relatifs aux modulations de la fr´equence des formants ou `a la forme du

conduit vocal.

(18)

1.5 Objectifs de ce travail

Le but de ce travail est d’´etudier et de quantifier le tremblement vocal, li´e `a la source vocale et au conduit vocal, `a la fois chez des sujets normaux et des sujets pr´esentant des troubles de la voix, tels que des patients atteints de la maladie de Parkinson. Pour cela, nous d´eveloppons des algorithmes d’analyse et de mesure des effets du tremblement vocal sur le signal de parole. Ces algorithmes sont ensuite utilis´es pour analyser des donn´ees vocales de locuteurs atteints de la maladie de Parkinson, en vue de d´emontrer la corr´elation entre les r´esultats obtenus et la pathologie.

Nous souhaitons obtenir deux cat´egories d’indices caract´eristiques du trem- blement vocal : les indices li´es `a la source vocale et les indices li´es au conduit vocal.

D’une part, nous ´etudions le tremblement pr´esent dans la fr´equence du signal vocal. Nous ne nous int´eressons pas aux variations de l’amplitude du signal de parole car celle-ci est influenc´ee par la forme du conduit vocal et, par cons´equent, ne reproduit pas la modulation de l’intensit´e du signal glottique. Par contre, la dur´ee des cycles du signal de parole est quasi identique `a celle du signal glottique, on peut donc mettre en ´evidence le tremblement li´e `a celui-ci.

D’autre part, nous nous int´eressons au tremblement pr´esent dans les fr´equen- ces des formants du spectre de voyelles soutenues. En effet, l’enveloppe du spectre est principalement li´ee `a la forme du conduit vocal. Les effets spectraux des modes propres du conduit vocal sont les formants. Nous nous int´eressons `a la variation en fr´equence de ces derniers et non `a leur variation en amplitude car celle-ci est influenc´ee par la source et les pertes.

Nous souhaitons ´egalement calculer un conduit vocal acoustiquement ´equi- valent `a partir des fr´equences des formants. Ce conduit vocal ´equivalent permet une interpr´etation pseudo-anatomique du tremblement li´e au conduit vocal.

Dans le cadre du d´eveloppement de m´ethodes `a la fois fiables et sensibles aux variations jusqu’`a 15Hz, les possibilit´es qu’offrent la transform´ee en onde- lettes continue et les fr´equences instantan´ees qui peuvent en ˆetre d´eduites sont

´etudi´ees.

L’application des m´ethodes d’analyse des modulations vocales `a des cor- pora d’enregistrements de locuteurs parkinsoniens permet d’´etudier l’effet de la maladie de Parkinson sur les indices de modulation vocale. ´ Etant donn´e que la maladie de Parkinson est caract´eris´ee par la pr´esence d’un tremblement au repos et d’un tremblement de posture des membres du patient, on souhaite examiner si ces tremblements sont ´egalement pr´esents dans la voix des patients, et si leur

´evolution refl`ete l’´etat de sant´e des patients.

Les sujets abord´es dans ce travail sont donc les suivants.

1. Caract´erisation des modulations vocales

(a) ´ Etude de m´ethodes d’analyse et de quantification des modulations de la fr´equence phonatoire, des fr´equences des formants et du conduit vocal acoustiquement ´equivalent.

(b) D´eveloppement de m´ethodes d’estimation des indices de modulation

vocale, pr´ecises et fiables afin de pouvoir analyser des signaux de

parole perturb´es.

(19)

2. ´ Etude de l’effet de la maladie de Parkinson sur les indices de modulation obtenus par les m´ethodes d’analyse d´evelopp´ees. Les indices de modulation sont ´etudi´es pour trois corpora.

(a) Analyse des indices de modulation pour un corpus de locuteurs at- teints de la maladie de Parkinson et de locuteurs normophoniques, afin d’obtenir des informations sur leur qualit´e de voix respectives et de tester si les indices de modulation permettent de diff´erencier les deux groupes de locuteurs.

(b) Analyse des indices de modulation pour un corpus de locuteurs at- teints de la maladie de Parkinson sous deux conditions d’enregistre- ment (sous m´edicaments ou en sevrage, avec implant c´er´ebral branch´e ou ´eteint), afin d’examiner si ces conditions ont un effet sur les indices de modulation.

(c) Analyse des indices de modulation pour un corpus de locuteurs at- teints de la maladie de Parkinson avant et apr`es une th´erapie vocale LSVT [79], afin de tester si le traitement a un effet sur les indices de modulation.

1.6 Plan du travail

Le plan de ce travail est le suivant.

Le deuxi`eme chapitre concerne la transform´ee en ondelettes continue, ainsi que le concept de fr´equence instantan´ee. Nous pr´esentons le formalisme de la transform´ee en ondelettes continue, ainsi que ses propri´et´es de distribution temps-fr´equence. Nous pr´esentons ensuite le concept de fr´equence instantan´ee, ainsi que les m´ethodes existantes pour l’estimer. Enfin, nous montrons comment la fr´equence instantan´ee bas´ee sur une transform´ee en ondelettes peut ˆetre utile pour l’analyse de signaux de parole.

Le troisi`eme chapitre pr´esente l’analyse des modulations vocales dues `a la source glottique `a travers la fr´equence phonatoire. Nous pr´esentons d’abord des m´ethodes existantes d’estimation de la fr´equence phonatoire, ainsi qu’une m´ethode bas´ee sur des transform´ees en ondelettes continues. Ensuite, nous com- parons ces m´ethodes `a l’aide de signaux synth´etiques. Enfin, nous pr´esentons des indices caract´eristiques de la modulation de la fr´equence phonatoire.

Le quatri`eme chapitre traite de l’analyse des modulations vocales dues au

conduit. Nous pr´esentons d’abord l’´etude des modulations des fr´equences des

trois premiers formants. Cette partie comprend la pr´esentation de m´ethodes

existantes d’estimation des formants, ainsi que la pr´esentation d’une m´ethode

bas´ee sur une transform´ee en ondelettes continue. Nous pr´esentons ´egalement

des indices caract´eristiques de la modulation des fr´equences des formants. La

deuxi`eme partie du chapitre est consacr´ee `a l’´etude du conduit vocal estim´e `a

partir des fr´equences des formants. Deux m´ethodes sont envisag´ees pour obte-

nir un conduit form´e par la concat´enation de tubes ´el´ementaires `a partir des

fr´equences des trois premiers formants : une m´ethode bas´ee sur la pr´ediction

lin´eaire du signal de parole et une m´ethode bas´ee sur une transformation ana-

lytique formants-sections droites du conduit. Nous montrons sur des signaux

(20)

synth´etiques qu’aucune de ces deux m´ethodes ne permet de reconstituer la forme variable du conduit de d´epart. Finalement, nous pr´esentons des indices caract´erisant la forme ´evolutive du conduit obtenu.

Dans le cinqui`eme chapitre, nous pr´esentons les r´esultats de l’analyse des modulations pour trois corpora. Le premier corpus est compos´e de locuteurs at- teints de la maladie de Parkinson et de locuteurs t´emoins. Le deuxi`eme corpus comporte des locuteurs atteints de la maladie de Parkinson dans deux condi- tions d’enregistrement diff´erentes. Le troisi`eme corpus est compos´e de locuteurs parkinsoniens enregistr´es avant et apr`es une th´erapie vocale.

Enfin, le sixi`eme chapitre r´esume les conclusions de ce travail.

Références

Documents relatifs

[r]

(3) ´ Enoncer la r` egle de d´ ecision permettant de rejeter ou non l’hypoth` ese p = 0, 40, selon la valeur de la fr´ equence f des malades sauv´ es dans l’´ echantillon. (4)

(1) D´ eterminer l’intervalle de fluctuation au seuil de 95% de la fr´ equence des Anglais ayant les bleus ou verts dans les ´ echantillons de taille 100. (2) On a observ´ e

Une enquˆete sanitaire a pour objectif d’estimer la proportion de personnes qui respectent le calendrier de vaccinations pr´econis´e par le Haut Conseil de la Sant´e Publique.2.

Une enquˆ ete sanitaire a pour objectif d’estimer la proportion de personnes qui respectent le calendrier de vaccinations pr´ econis´ e par le Haut Conseil de la Sant´

` A l’aide d’un intervalle de fluctuation au seuil de 95%, d´ eterminer si le lyc´ ee Alexandre Dumas est repr´ esentatif de la population fran¸ caise2. Les r´ esultats

, n pourvu que le choix de l’´ echantillon soit fait au hasard (c’est-` a-dire comme un tirage au sort dans une urne avec remise) ; dans les sondages r´ eels, on utilise plutˆ ot

L’int´ egration donne donc un r´ esultat proche de