• Aucun résultat trouvé

Mesures de perturbation de la voix

2.2. Propriétés acoustiques de la voix

2.2.3. Mesures de perturbation de la voix

La voix n’est pas un signal sonore simple ou « pur » (Figure 9A). Un son pur, c’est-à-dire un son simple, est caractérisé par une fréquence et une amplitude uniques qui demeurent constantes dans le temps (Fahy & Thompson, 2015). Par exemple, les diapasons et les appareils électroniques produisent des sons purs. Dans le cas de la voix humaine, le son émanant des plis vocaux est modifié selon la configuration des différents articulateurs de l’appareil phonatoire et sa possibilité de résonner dans les cavités orales ou nasales. En conséquence, le son de la voix acquiert une multitude de composantes dont les fréquences diffèrent de la fréquence fondamentale de départ. Ainsi, la voix est composée d’un ensemble riche d’harmoniques, c’est-à- dire des multiples entiers et plus aigus de la fréquence fondamentale (Figure 9B). Il est d’ailleurs possible d’observer la multiplicité des composantes sonores de la voix lorsque le signal vocal subit un grossissement important (Figure 9D). Une portion variable du signal vocal est également constituée de bruit, c’est-à-dire de sons qui dérangent et sont perçus négativement (Figure 9C). Les mesures de perturbation cycliques et la présence de bruit sont donc des caractéristiques importantes du signal vocal. En effet, ils révèlent l’instabilité de la vibration des plis vocaux, l’irrégularité de la fermeture glottique et l’adduction incomplète des plis vocaux (Tableau 2). Ces différents indices de stabilité permettent de quantifier la qualité de la voix et peuvent aider à la détection des troubles de la voix (Bocklet, Riedhammer, Nöth, Eysholdt, & Haderlein, 2012; Davis, 1978; Fonseca & Pereira, 2009; Kitajima, Tanabe, & Isshiki, 1975; Ludlow, Bassich, Connor, Coulter, & Lee, 1987;

18

Roy et al., 2013). Les mesures de perturbation de la voix les plus utilisées sont détaillées dans les sections suivantes.

Figure 9. Caractéristiques des sons et du signal vocal. Différents signaux sonores selon l’intensité (i), leur

période (p) et le temps (t). La vibration du son pur est caractérisée par une seule fréquence (A). À la même fréquence fondamentale que le son pur s‘ajoutent des harmoniques (fréquences plus aiguës et multiples entiers de la fréquence fondamentale) (B). Le bruit est caractérisé par une absence de fréquence caractéristique (C). De gauche à droite, le signal vocal d’une même voyelle /ɑ/ soutenue est grossi progressivement afin d’observer ses multiples composantes sonores (D). Figure adaptée à partir de l’image

par S. Blatrix, extraite de « Promenade autour de la cochlée » http://www.neuroreille.com/promenade, par R. Pujol et coll., NeurOreille © 1999/2007, Montpellier. Reproduite avec permission.

Propriétés acoustiques

de la voix Corrélats perceptuels(la voix semble…) Perturbation perturbationIndice de

Fréquence

Basse — Haute Grave — Aigu Hauteur Instabilité de la vibration des plis vocaux Jitter

Amplitude

Basse — Haute Faible — Forte Intensité Irrégularité de la fermeture glottique Shimmer

Harmonicité

Basse — Haute Rauque — Mélodieuse Bruit Adduction incomplète des plis vocaux

Harmonic-to-noise ratio (HNR)

Tableau 2. Mesures acoustiques communes des différentes propriétés de la voix.

La perturbation de la fréquence (connue sous le terme de jitter, qui signifie « fluctuation causée par de l’interférence ou un échec temporaire de la synchronisation ») est une mesure de la variabilité, cycle par cycle, de la fréquence fondamentale (Tableau 2). La perturbation de la fréquence fondamentale évalue les

19

irrégularités des mouvements de glotte. Elle est calculée à partir de la formule suivante : jitter (secondes) = Σ

i=2N |Ti - Ti-1| /(N-1) (Boersma, 2009), où T représente le temps et N le nombre de cycles étudiés. La fréquence

fondamentale de chaque cycle phonatoire est ainsi comparée à celle du prochain cycle. Puisque le jitter absolu extrait selon cette formule est influencé par la fréquence fondamentale de la personne (Orlikoff & Baken, 1990), un indice normalisé de jitter est généralement utilisé; par exemple, le « jitter local », calculé en tant que pourcentage de perturbation de la fréquence fondamentale selon la formule suivante : jitter = jitter (secondes)/période moyenne (secondes) (Boersma, 2009). Il existe toutefois des variations dans les formules mathématiques utilisées selon les auteurs (Maryn et al., 2009; Oğuz, Kiliç, & Şafak, 2011). Une valeur de 1 % à 2 % de jitter est associée à une perception d’âpreté et de raucité de la voix (Nicastri, Chiarella, Gallo, Catalano, & Cassandro, 2004; Oğuz et al., 2011).

La perturbation de l’amplitude (connue sous le terme de shimmer, qui signifie « mouvement » ou « image qui tremble ou vibre ») est une mesure de la variabilité, cycle par cycle, de l’amplitude (Tableau 2). La perturbation de l’amplitude évalue les irrégularités du coefficient de contact des plis vocaux (Maryn et al., 2009; Nicastri et al., 2004). Plus la fermeture glottique est irrégulière, plus grande est la perturbation de l’amplitude (Moore, 1968, 1971; Timcke et al., 1958). L’amplitude de chaque cycle phonatoire est ainsi comparée à celle du cycle suivant, afin de calculer la moyenne absolue des différences d’amplitude entre des périodes consécutives sur une base logarithmique. Le niveau de perturbation qui en résulte (« local shimmer ») ne dépasse généralement pas 0.35 dB SPL, sans quoi la voix est perçue comme étant instable et enrouée (Nicastri et al., 2004; Oğuz et al., 2011). D’autres indices tels que le quotient de perturbation de l’amplitude, défini par Takahashi et Koike puis revu par Davis, sont le résultat d’une moyenne de l’amplitude sur des séquences de trois, cinq ou 11 cycles selon une logique semblable, (Davis, 1978; Takahashi & Koike, 1975) mais sont moins fréquemment utilisés.

L’amplitude de la voix a un effet important sur les mesures de jitter et de shimmer. Par exemple, une voix de forte amplitude est associée à une vibration plus régulière des plis vocaux, et donc à une mesure de jitter plus faible (Brockmann, Drinnan, Storck, & Carding, 2011; Brockmann, Storck, Carding, & Drinnan, 2008). La fréquence fondamentale de la voix a également une influence sur les mesures de perturbation, puisque le jitter tend à diminuer alors que la fréquence fondamentale s’élève (Orlikoff & Baken, 1990). Il est donc important de tenir compte de ce facteur lors de la mesure et de l’analyse de la voix (Hillenbrand, 1987).

Finalement, le taux de bruit présent dans le signal vocal est directement lié à la qualité de la voix et représente la perte de force d’adduction des plis vocaux (Tableau 2). L’harmonicité est obtenue grâce au rapport direct entre l’énergie du bruit et l’énergie des harmoniques du segment vocal d’intérêt, en ratio harmonique sur bruit (« HNR ») ou en ratio bruit sur harmonique (« NHR »). Ainsi, une harmonicité de zéro dB signifie qu’il y a

20

autant d’énergie venant du bruit que des harmoniques dans le signal vocal. Le taux de bruit présent dans la voix représente le résultat des perturbations combinées de l’amplitude et de la fréquence, et corrèle fortement avec l’évaluation globale de l’enrouement de la voix (Yanagihara, 1967; Yumoto, Gould, & Baer, 1982; Yumoto, Sasaki, & Okamura, 1984). Donc, plus le signal vocal contient du bruit, et plus la voix est perçue comme étant rauque ou enrouée.