• Aucun résultat trouvé

Dans cette section, nous évoquerons les supports phonétiques disponibles dans l’étude des voix pathologiques. La plupart des recherches cliniques se basent essen- tiellement sur l’analyse de voyelles tenues, des syllabes ou des mots et, enfin, sur des phrases. Dans un premier temps, nous décrirons les études sur les voyelles tenues iso- lées, et en particulier les voyelles dites « cardinales »qui permettent principalement d’extraire certains paramètres essentiels puisque ce sont les voyelles les moins com- plexes d’un point de vue phonologique. Dans un second temps, nous montrerons la nécessité de coupler ces analyses avec des corpus plus larges portant sur la parole afin d’être au plus proche des situations de communication quotidiennes. Finalement, nous détaillerons le corpus enregistré, ainsi que les outils que nous avons utilisés pour son traitement.

4.3. Motivation d’un corpus clinique 95

4.3.1

Les voyelles tenues

Les voyelles longues et tenues représentent les performances vocales les plus stables. En effet, celles-ci peuvent être facilement réalisées, imitées et mesurées. D’un point de vue articulatoire, la production de voyelles nécessite un simple accolement entretenu des plis vocaux afin de maintenir le voisement. Cependant, De Krom (1994) note, pour les voix normales, que les seules modifications des différents paramètres acoustiques peuvent être relevées au niveau de l’attaque (onset) et de la fin de la voyelle (offset). Le temps d’établissement et l’arrêt du voisement requièrent une mise en place précise des articulateurs et en particulier des plis vocaux. L’auteur précise par conséquent que les mesures directes doivent être prises pendant la période la plus stable du segment. Pour les voix pathologiques, de Krom (1994) ajoute que les altérations du signal vocal n’interviennent pas uniquement sur la phase de pré-voisement et pendant la fin de la voyelle mais sur l’ensemble de la production de cette dernière.

En outre, comme nous le précisions plus haut, les voyelles permettent une analyse acoustique relativement simple. Les paramètres les plus fréquemment analysés sont

les variations de la fréquence fondamentale F0, le jitter (c’est-à-dire l’instabilité vibra-

toire de F0 d’un cycle à un autre), le shimmer (c’est-à-dire l’irrégularité en amplitude

des cycles vibratoires), le rapport harmoniques sur bruit (HNR), la richesse en harmo- niques, etc. (Hollien & al 1973). Finalement, les analyses acoustiques informatisées porteront donc principalement sur les parties stables et voisées des voyelles pour évi- ter de prendre en compte les attaques particulières de chaque locuteur (attaques dures ou soufflées, cf. De Krom 1994), et pour vérifier la régularité ou non du voisement (Hollien & al. 1973).

4.3.2

Corrélats acoustico-articulatoires des voyelles : un

argument dans le choix du protocole d’étude

Nous avons choisi d’étudier les voyelles [a], [i] et [u]. D’un point de vue articu- latoire, [i] est produit avec une articulation antérieure et une faible ouverture de la bouche, [u] est produit avec une articulation postérieure et une faible ouverture de la bouche et [a] est produit avec une ouverture maximale de la bouche. Dans la lignée de ses travaux sur la théorie source-filtre qui ont permis la mise en évidence de l’interdé- pendance entre niveaux articulatoires et acoustiques, Fant (1960) a proposé un modèle du conduit à quatre tubes afin d’étudier la relation entre fréquences de résonances et cavités lors de la production de voyelles. Ce modèle prédit et explique le lien entre les configurations particulières du conduit vocal et les fréquences de résonances — appe- lées formants— des voyelles. Ainsi, l’auteur a démontré que la structure formantique des voyelles était corrélée aux variations de volumes et de formes des cavités du trac- tus vocal (Kent 1993). Selon l’auteur, les modélisations des configurations vocaliques du conduit vocal pourraient se résumer selon trois paramètres : degré d’ouverture des lèvres, point d’articulation de la langue et labialisation.

Selon les représentations articulatoires traditionnelles, seuls les deux premiers for- mants (F1/F2) sont caractéristiques des voyelles. De manière générale, les valeurs for-

mantiques sont modifiées par la forme du conduit vocal. Néanmoins, certains restent plus sensibles aux mouvements des différents articulateurs. Ainsi, l’ouverture de la mandibule et/ou l’abaissement de la langue ont pour conséquence une augmentation de F1. De même, le F2 varie en fonction de la position de la langue et de la pro- trusion des lèvres lorsque la langue est en arrière. Néanmoins, certains ajustements compensatoires permettent d’obtenir les mêmes résultats acoustiques. En ce sens, la théorie quantique de Stevens (1989) stipule qu’il existe des régions dans le conduit vocal — dites « quantiques » — où une imprécision de l’articulation n’entraîne pas de changements acoustiques majeurs. Au contraire, il existe également des régions dites « d’instabilité » où de légères modifications dans l’articulation entraînent de fortes per- turbations dans le résultat acoustique.

D’un point de vue perceptif, Delattre (1958) pointe sur l’importance du F3 — en français du moins — pour établir des contrastes phonémiques. Ainsi selon lui, [i] et [y], deux voyelles fermées et antérieures, ne peuvent se distinguer par les valeurs uniques de F1 et F2. Seul le F3, qui est sensible à la longueur de la cavité antérieure lorsque la langue est en position antérieure, pourra les opposer. En effet, le jeu des lèvres est suffisant pour abaisser F3 et le regrouper avec F2 pour la production du [y] .

Finalement, le français semble favoriser les voyelles ayant une forte concentra- tion d’énergie dans une zone particulière du spectre. Cette proéminence d’énergie, conséquente à un rassemblement de deux formants, constitue la base de la théorie des

voyelles focales (Schwartz & al. 1997). Ainsi, la voyelle [i] montre une convergence

de F3/F4, la voyelle [y] montre un rapprochement de F2/F3 et la voyelle [u] est iden- tifiable au regroupement de F1/F2.

Les voyelles [i] et [u] représentent des voyelles cardinales et focales, nous avons donc fait le choix de conserver ces segments pour ces études acoustiques. En ce qui concerne la voyelle [a], celle-ci représente la voyelle la plus ouverte et implique par conséquent un F1 très élevé.

4.3.3

La parole en contexte

La parole, bien que non spontanée puisque composée de non-mots lus en ce qui nous concerne, présente l’avantage de refléter des situations de phonation normale. Elle requiert des tâches dynamiques et successives mettant en jeu l’ensemble des muscles laryngés. Ainsi, les phases d’adduction et d’abduction des plis vocaux, associées aux variations mélodiques, aux rapides transitions formantiques et aux événements linguis- tiques propres aux locuteurs sont caractéristiques de ce type de corpus (Schoentgen & al. 1998). La prise en compte de ces différents paramètres semble toutefois difficile. En effet nombre de ces corrélats sont difficilement identifiables et intimement liés les uns aux autres. Aussi, d’un point de vue segmental, il n’est pas toujours aisé de déter- miner le voisement d’un signal et l’articulation des sons prend souvent du temps dans la mise en place. De ce point de vue, Hammarberg & al. (1980) adoptent une vision plus large quant à l’utilisation de la parole comme support phonétique et préconisent l’étude unique des variations de hauteur et d’intensité pour qualifier la fonction vocale d’un sujet.

4.4. Pr´esentation succincte du corpus 97

En ce qui concerne la pathologie, Schoentgen & al. (1998) précisent que les cor- pus de parole peuvent distinguer les voix normales des voix pathologiques, mais que ces derniers sont insuffisants pour montrer l’existence d’une pathologie laryngée par- ticulière. Dans ce sens, De Krom (1994) précise que la situation de parole permet de mettre en évidence la pathologie de manière plus pertinente que l’analyse des voyelles tenues, mais l’analyse en est plus difficile à cause des nombreuses perturbations. Il ajoute que ces corpus de parole restent essentiels dans l’analyse clinique car les pa- tients présentant un trouble de la voix ne peuvent cacher leur dysphonie ou adopter un comportement compensatoire.