• Aucun résultat trouvé

La méthode perceptive reste la méthode la plus ancienne pour juger de la qualité d’une voix. Les premiers essais de classification de voix datent du XIXème siècle (Rush 1859). Morsomme et Estienne (2006) précisent également que l’oreille reste le premier évaluateur de la qualité de la voix, avant l’utilisation d’une instrumentation plus complexe. En effet, l’évaluation perceptive, bien que subjective, représente une référence à laquelle sont confrontées les autres mesures vocales (Klatt & Klatt 1990, Kreiman & al. 1993, Giovanni & al. 1996, entre autres).

3.4.1

Définition

L’évaluation perceptive consiste en un jugement propre d’un individu sur les qua- lités acoustiques d’une voix et à les comparer à une représentation personnelle de la normalité, le référent interne (Fex 1992). Cette notion de normalité, propre à l’auditeur, varie selon l’expérience de l’expérimentateur, la langue ou les facteurs socio-culturels (Kreiman & al. 1992, 1993). C’est donc une notion subjective et variable d’une culture à une autre. En effet, par exemple, une voix soufflée peut être un indice de pathologie pour certains mais une qualité de voix particulière dans le traitement linguistique pour d’autres. Ainsi, nous ne pouvons pas dire qu’il existe véritablement une voix de réfé- rence dite « normale ». Laver (1994) précise néanmoins que d’une manière générale, l’auditeur doit prendre en compte quatre principales composantes de la perception au- ditive pour différencier les éléments de la parole : la qualité, la durée, la hauteur et l’intensité.

Les échelles perceptives se sont succédées au cours du temps pour tenter de clas- sifier les voix pathologiques ou dysphoniques. Ces systèmes d’évaluation dépendent principalement des types de voix à analyser (normales ou pathologiques), de l’expé- rience de l’auditeur (naïf ou expert) et de l’objectif de l’expérience. A l’heure actuelle, nous savons qu’une analyse perceptive complète devrait comprendre une évaluation de la qualité de la voix, une évaluation de la qualité de la parole, son efficacité et son intelligibilité (Oates 2009).

3.4.2

Les types d’échelles

Afin de mieux se rendre compte de l’utilité des échelles proposées au fil du temps (points positifs et inconvénients), une rapide revue de la littérature de ces dernières sera réalisée avant de nous intéresser plus particulièrement à l’échelle GRBAS qui est la plus fréquemment utilisée de nos jours.

3.4.2.1 L’échelle d’Osgood

Cette échelle est la plus ancienne. Celle-ci se base sur un concept de binarisme sémantique qui permettait une quantification de grandeur. Ainsi, l’auteur avait éta- bli une liste de 50 paires d’adjectifs en opposition (propre-sale, dur-mou, grand-petit

3.4. Les analyses perceptives 67

etc.) regroupées en classes. Cette première échelle fut le point de départ des nom- breuses échelles bipolaires suivantes et l’introduction aux méthodes sémantiques dif- férentielles. Néanmoins, cette échelle fut rapidement abandonnée car de nombreux adjectifs utilisés ne rendent pas compte clairement de la qualité d’une voix (Osgood 1957).

3.4.2.2 L’échelle de Voiers

Cette échelle est basée sur quatre facteurs principaux pour évaluer la qualité de la voix et de la parole : l’intelligibilité, la raucité, la sonie et le débit syllabique (Voiers 1964).

3.4.2.3 L’échelle GRBAS

Cette échelle est née des travaux d’Isshiki & al. (1969) qui, partant de la méthode différentielle sémantique d’Osgood (1957), a permis d’extraire quatre paramètres per- tinents pour l’analyse de la voix : la raucité, le souffle, l’asthénie et le degré de sévérité de la dysphonie. En 1981, Hirano, à partir d’analyses spectrographiques supplémen- taires, a affiné les travaux de ses comparses et a mis en évidence cinq facteurs prin- cipaux pour qualifier une voix pathologique : le facteur G (Grade of voice abnormal) correspond au degré de dysphonie, le facteur R (Roughness) correspond à la raucité, le facteur B (Breathiness) correspond au caractère soufflé de la voix, le facteur A (As- thenic) correspond au caractère hypotonique de la voix, et enfin le facteur S (Strained quality) correspond à l’impression de serrage de la voix (cf. tableau 3.2). Chacun des facteurs est évalué sur une échelle de sévérité allant de 0 à 3 (où 0= normal, 1= lé- gérement altéré, 2= moyennement altéré, 3= sévèrement altéré) (Hirano 1981). Cette échelle simple et rapide est largement utilisée dans la pratique clinique quotidienne car ces facteurs principaux restent les plus pertinents pour l’évaluation de la qualité des voix pathologiques. Néanmoins, cette dernière ne rend pas compte des fonctions supra-laryngées, des indices temporels (débit) ou prosodiques (intonation, pauses, etc.) ou encore de certains facteurs d’instabilités. Ces limites ont conduit certains auteurs à remanier l’échelle GRBAS selon d’autres aspects. Dejonckere & al. (1993) ont pro- posé des compléments à cette échelle en y ajoutant des paramètres tels que : le temps maximum de phonation (TMP), l’étendue vocale, la puissance vocale maximale (in- tensité maximale sur un [a] tenu), le comptage maximal sur une expiration (le nombre maximal et intelligible sur l’expiration), le temps de comptage de 1 à 25 (le plus rapi- dement en restant toujours intelligible) et un test d’intelligibilité. A la fin des années 90, ce même groupe de chercheurs a proposé l’échelle GIRBAS où I (Instability) pré- voit les phases d’instabilités de qualité vocale dans le temps (Dejonckere & al. 1996, 1998). Enfin, dans sa thèse de doctorat, Crevier Buchman (1999) a démontré que des paramètres tels le voisement, la sonie, la hauteur, le débit et la mélodie semblent bien plus pertinents que l’échelle GRBAS dans l’étude perceptive post-opératoire de pa- tients traités par LPSC-CHEP (Crevier Buchman 1999).

Echelle Description

G Grade Degré de sévérité de la dysphonie.

R Roughness Raucité de la voix, en rapport avec une fluctuation

irrégulière et une aggravation de la hauteur

B Breathiness Impression de souffle dans la voix, en rapport avec une

incompétence glottique

A Asthenic Asthénie, en rapport avec un comportement hypotonique.

Voix faible, qui manque de puissance et d’intensité

S Strained Serrage laryngé et/ou supraglottique, en rapport avec un

comportement hypertonique. Voix aigüe et/ou bruit dans les hautes fréquences

Table 3.2 – L’échelle GRBAS (Hirano 1981).

3.4.2.4 L’échelle Laver’s Voice Profil Analysis Sheme (VPAS)

C’est une échelle qui se base sur une description phonétique de la qualité de la voix. Les caractéristiques de la voix sont comparées à une position articulatoire neutre ayant un corrélat physiologique et acoustique. L’évaluation des positions phonétiques se fait à l’écoute et en relation avec l’observation du locuteur (Laver 1980, 1994).

3.4.2.5 Le Stockholm Voice Evaluation Consensus Model (SVEC)

C’est une échelle qui est validée uniquement pour la langue suédoise. En effet, pour les auteurs, la qualité vocale dépend uniquement du contexte linguistique et culturel d’une population. Cette échelle se compose de 12 traits principaux (aphonie, souffle, tendue, détendue, rauque, raucité grave ou creaky, éraillée, cassures vocales, diplo- phonie, registre, hauteur et sonie) qui permettent de décrire parfaitement une voix pa- thologique suédoise. Cette méthode permet d’établir principalement des corrélations entre l’évaluation perceptive et certains paramètres acoustiques. Les auteurs préco- nisent que l’évaluation soit réalisée par des auditeurs experts, qui restent en perma- nence en contact avec des voix « de référence » afin de conserver une référence stable et identique pour tous les auditeurs (Hammarberg & Gauffin 1995).

3.4.3

Applications en pathologie

Nous avons donc démontré que l’ensemble de ces échelles met en évidence un nombre important de critères à prendre en considération dans l’analyse perceptive des voix pathologiques. Néanmoins, le nombre croissant d’échelles pose le problème de leurs subjectivités. En effet, le manque de fiabilité intra et inter-locuteurs associé au caractère aléatoire des choix des paramètres à prendre en compte sont des arguments contre la prise de position pour une échelle ou une autre. Dans ce sens, il est important de préciser qu’aucune étude à ce jour n’a jamais validé les traits les plus pertinents pour les voix pathologiques. En outre, nous avons montré que le jugement des audi-

3.5. Les auto´evaluations 69

teurs s’effectuait à partir d’une représentation personnelle de la normalité de la voix, à partir d’un référent interne (Fex 1992). Mais la question essentielle est de savoir à quel niveau se situe réellement la normalité et quelle est sa limite ? Finalement, l’ab- sence de définition des traits perceptifs pertinents des voix normales peut être un biais pour la fiabilité des jugements des voix pathologiques. En outre, les passations de tests de perception ne sont pas toujours standardisées, ce qui entache une fois de plus leur validité. Certains facteurs qui influencent la fiabilité de l’évaluation sont contrôlables : les échantillons vocaux présentés sont à l’appréciation de l’expérimentateur (voyelle tenue, phrases ou parole spontanée), les auditeurs sont variables d’une étude à une autre (jury naïf ou expert), les tâches d’écoute sont différentes selon les paramètres perceptifs à juger. A contrario, d’autres facteurs dépendent des auditeurs et ne sont pas contrôlables par l’expérimentateur : phénomènes de mémoire, diminution d’attention, fatigue, etc.

De notre point de vue, il est important de souligner que ces échelles perceptives ont été créées à partir d’échantillons vocaux de voix pathologiques où les deux plis vocaux ont été conservés. Ainsi, l’utilisation de ces dernières sur des voix après chirurgies par- tielles laryngées avec résection d’un ou des deux plis vocaux n’est qu’une application secondaire. En conséquence, elles ne sont ni fiables, ni valides en ce qui concerne ces types de voix. Ainsi, comme nous l’avons montré plus haut, de nombreux auteurs se sont basés sur les paramètres principaux développés par l’échelle GRBAS (Hirano 1981) pour en critiquer la fiabilité pour les voix après LPS. En 1999, Crevier Buch- man a mis en évidence l’inefficacité de cette échelle après LPS-CHEP. Cette recherche a démontré que seul le trait R était pertinent, et que l’échelle dans son intégralité ne permettait pas de qualifier l’évolution en postopératoire de 6 à 18 mois de ces voix (Crevier Buchman 1999). Aussi, de nombreux autre paramètres ont été évoqués pour une meilleure description perceptive de ces voix (Dejonckere & al. 1993).