• Aucun résultat trouvé

4 Le protocole expérimental de l’étude acoustique

4.4. Recueil des données

Dans cette phase, nous avons pris en compte seules les productions qui ne sont perturbées ni par un bruit de l‟extérieur ni par un état physiologique anormal. Le recueil des données acoustiques a été fait sur PRAAT.

Les mesures ont été prises suivant les paramètres suivants : - La durée de la syllabe cible ;

- La durée du segment vocalique portant le ton ; - La tenue consonantique de /p/ ;

- La durée du VOT (Voice Onset Time)46 ;

- Le niveau de l'intensité aux points 0%, 20%, 40%, 60%, 80%, 100% de la durée totaledu segment vocalique portant le ton ;

- La fréquence fondamentale aux points 0%, 20%, 40%, 60%, 80%, 100% de la durée totaledu segment vocalique portant le ton ;

- La fréquence centrale de F1 aux points 0%, 20%, 40%, 60%, 80%, 100% de la durée totaledu segment vocalique portant le ton ;

- La fréquence centrale de F2 aux points 0%, 20%, 40%, 60%, 80%, 100% de la durée totaledu segment vocalique portant le ton ;

- La fréquence centrale de F3 aux points 0%, 20%, 40%, 60%, 80%, 100% de la durée totalede la voyelle portant le ton ;

- La fréquence centrale de F4 aux points 0%, 20%, 40%, 60%, 80%, 100% de la durée totaledu segment vocalique portant le ton ;

- Les largeurs de bandes formantiques F1, F2, F3, F4 dans le spectre du segment vocalique ;

- L‟intervalle temporel Δt entre les deux pics qui se situent respectivement dans deux phases voisines au même niveau de périodicité dans les signaux chuchotés.

46 VOT, l‟abbréviation de "Voiced Onset Time", connait deux définitions. L‟une est donnée par Klatt (1975) qui considère que le VOT correspond au temps entre le relâchement et le début de l‟état vocalique voisé (Klatt 1975). L‟autre est donnée par Lisker et Abramson (1967), plus largement utilisé que la première, qui définit le VOT comme la phase entre le relâchement dans la consonne et la mise en vibration des plis vocaux. Dans cette dernière définition, la mesure du VOT peut donc avoir une valeur positive, négative ou nulle. Il est prouvé que la valeur de VOT est influencée par le lieu d‟articulation (Lisker et Abramson 1967, Peterson et Lehiste, 1960, Stevens et al. 1986). Dans notre recherche, nous référons la définition du VOT de Klatt puisqu‟elle permet au VOT d‟avoir une valeur toujours positive.

105

Recueil des données dans les signaux acoustiques en voix modale

La figure 22 illustre les paramètres intrasegmentaux mesurés du signal acoustique de la séquence /ə_pā/ sur le ton 1, extrait de l‟énoncé /(j)í_kə_pā_tsɿ/ en voix modale. La tenue consonantique, indiquée par le crochet bleu horizontal dans cette figure, contient trois parties : VTT (Voice Termination Time)47 après /ə/, silence et VOT avant /a/.

Pour une raison de commodité, dans notre recherche, nous avons seulement pris en compte la durée du VOT ainsi que celle de la partie VTT+silence de la consonne.

Dans l‟analyse de la voix modale, la même opération a été effectuée sur tous les signaux en question.

Figure 22 : Paramètres intrasegmentaux du signal acoustique de la séquence /ə_pa/ sur le ton 1 en voix modale.

La figure 23 illustre les paramètres intrasegmentaux mesurés du signal acoustique de la voyelle /ā/ sur le ton 1, extrait de l‟énoncé /(j)í_kə_pā_tsɿ/ en voix modale. Nous avons divisé le segment vocalique en 5 parties à durée identique, à l‟aide de la fonction « Time step settings » de PRAAT.

Nous avons pris la mesure des valeurs des paramètres acoustiques aux frontières de chaque tranche, illustrées ci-dessous par les lignes bleus verticales dans la figure. La durée vocalique de /a/ correspond à celle de toute la partie visible du VVO48 au VVT49. Les valeurs de F0 (pitch) du signal acoustique correspondent à celles

47 VTT, l‟abréviation de "Voice Termination Time", est utilisé pour définir « le temps que mettent les cordes vocales pour s’arrêter de vibrer après closion ou constriction dans le conduit vocal » (Calliope et Fant 1989 : 127).

48 VVO, l‟abréviation de "Vocalic Voiced Onset", est l'événement « qui marque le début d'un état supraglottique vocalique associé à une exicitation nettement périodique, ce qui sera manifesté par une structure formantique bien définie » (Calliope et Fant 1989 : 123).

49 VVT, l‟abréviation de "Vocalic Voiced Termination", est l'événement « qui marque le début d'un état supraglottique vocalique associé à une exicitation nettement périodique, ce qui sera manifesté par une structure formantique bien définie » (Calliope et Fant 1989 : 123).

Tenue consonantique

106

marquées par les points bleus. Le contour de l‟intensité est marqué par la ligne jaune.

Les valeurs des quatre premiers formants de /a/ correspondent à celles marquées par les points rouges. Dans l‟analyse du spectre en voix modale, la même opération a été effectuée sur tous les signaux en question.

0% 20% 40% 60% 80% 100%

Figure 23 : Paramètres intrasegmentaux du signal acoustique de la voyelle /a/ sur le ton 1 en voix modale.

Recueil des données dans les signaux acoustiques en voix chuchotée

La figure 24 illustre les paramètres intrasegmentaux mesurés du signal acoustique de la séquence /ə_pā/ sur le ton 1, extrait de l‟énoncé /(j)í_kə_pā_tsɿ/ en voix chuchotée.

La tenue consonantique, indiquée par le crochet bleu horizontal dans cette figure, contient trois parties : une friction irrégulière à la place de VTT après /ə/, silence et une friction irrégulière à la place de VOT avant /a/. Sur les spectrogrammes, la friction irrégulière à la place de VTT couvre la partie du signal entre le début de la disparition d‟une structure formantique relativement stable et le début d‟une distribution égale de l‟énergie dans toutes les fréquences tandis que la friction irrégulière à la place de VOT couvre la zone entre la fin de la distribution égale de l‟énergie dans toutes les fréquences et l‟apparition d‟une structure formantique relativement stable dans le signal.

Par commodité, dans notre recherche, nous avons pris en compte seulement la durée de la deuxième friction irrégulière, celle à la place de VOT ainsi que la durée de la partie première friction+silence de la consonne. La même opération a été effectuée sur tous les signaux acoustiques en voix chuchotée.

F4 F3 F2 F1 F0

Intensité

107

Figure 24 : Paramètres intrasegmentaux du signal acoustique de la séquence /ə_pa/ sur le ton 1 en voix chuchotée.

La figure 25 illustre les paramètres intrasegmentaux mesurés du signal acoustique de la voyelle /ā/ sur le ton 1, extrait de l‟énoncé /(j)í_kə_pā_tsɿ/ en voix chuchotée. Nous avons divisé le segment vocalique en 5 parties à durée identique, comme ce que nous avons fait avec la voyelle en voix modale. Nous avons pris la mesure des valeurs des paramètres acoustiques au début, à la fin, ainsi qu‟à la frontière de deux tranches voisines. La durée vocalique de /a/ correspond à celle de toute la partie visible. Le contour de l‟intensité est marqué en ligne jaune et les valeurs des quatre premiers formants de /a/ correspondent à celles que les points rouges indiquent. Dans l‟analyse du spectre de la voix chuchotée, la même opération a été effectuée sur tous les signaux en question.

Figure 25 : Paramètres intrasegmentaux du signal acoustique de la voyelle /a/ sur le ton 1 en voix chuchotée.

Tenue consonantique

Intensité

F4 F3 F2 F1

108

Les intervalles temporels mentionnés ci-dessus correspondent aux évènements articulatoires spécifiques. Plus précisément, leur correspondance est comme suit :

- La durée du segment vocalique correspond à celle de la phase où la structure formantique s‟installe dans le signal de manière stable, que ce soit en voix modale ou en voix chuchotée.

- La durée du VTT correspond à l‟intervalle temporel entre la disparition de la stabilité dans la structure formantique et la disparition du voisement. En voix chuchotée, à la position du VTT est apparue une friction irrégulière. La durée de cette dernière correspond à l‟intervalle temporel entre la disparition de la structure formantique stable dans le bruit et la disparition du bruit.

- La durée du VOT correspond à l‟intervalle temporel entre le début du burst et l‟installation stable de la structure formantique dans le signal. En voix chuchotée, à la position du VOT est apparue une friction irrégulière. La durée de cette dernière correspond à l‟intervalle temporel entre le début du burst et l‟installation stable de la structure formantique.

Recueil des données de modulation dans les signaux en voix chuchotée

Comme il est mentionné dans la section 3.2., en raison des ajustements articulatoires, le segment vocalique peut être vu comme un bruit qui subit une modulation périodique. Ainsi dans l‟étude de l‟intelligibilité des tons chuchotés, il est pour nous nécessaire d‟analyser les données concernées par la modulation.

La figure 26 illustre les paramètres acoustiques concernées par la modulation, mesurées dans le spectre de la voyelle /a/ au ton 1, extrait d‟un enregistrement de l‟énoncé /(j)í_kə_pā_tsɿ/ en voix chuchotée. Nous avons pris non seulement des mesures des fréquences centrales des formants, comme ce qui est illustré dans la figure 25, mais également de celles des largeurs des bandes formantiques (indiquées par les branches rouges), et ce, dans les signaux acoustiques en voix modale ainsi que dans ceux en voix chuchotée.

109

Figure 26 : Paramètres acoustiques concernés par la modulation sinusoïdale dans le spectre de la voyelle /a/ au ton 1 en voix chuchotée.

La largeur d‟une bande formantique « définit comme la largeur entre les deux points situés à -6 dB autour du pic formantique » (Roads et al. 1999). Elle couvre toutes les fréquences harmoniques autour de la fréquence centrale de formant, et reflète la distribution de l'énergie à l‟échelle des fréquences à l‟intérieur d‟une bande formantique. A l‟aide de la fonction « Get …bandwidth » de Praat, nous avons pris les mesures des largeurs de bande des quatre premiers formants de la majorité des signaux.

L‟autre élément essentiel pour calculer le taux de modulation dans un son modulé, à part la largeur de bande, est la fréquence porteuse. À l‟aide de la fonction

« Pointprocess (periodic, peaks) » de Praat, nous avons observé une périodicité dans la partie vocalique dans la majorité des signaux, en voix chuchotée. Cette périodicité se manifeste davantage dans l‟analyse HNR (Harmonics-to-Noise-Ratio) des signaux chuchotés, réalisé à l‟aide de la fonction « Analyse periodicity – To Harmonicity (cc) » de Praat. La figure 27 illustre une comparaison de la périodicité détectée dans le spectre de la voyelle /a/ au ton 1, extrait d‟un enregistrement de l‟énoncé /(j)í_kə_pā_tsɿ/ dans les deux modes de phonation. Le cas du signal en voix modale se trouve à gauche, avec un maximum de HNR à 37 dB, et celui du signal en voix chuchotée se trouve à droite, avec un maximum de HNR à 31 dB. La périodicité du signal chuchoté n‟est pas aussi régulière que celle dans le signal en voix modale.

Largeur de bande

110

Figure 27 : Périodicité dans le signal de l‟énoncé /(j)ì_kə_pā_tsɿ/en voix modale (à gauche) et en voix chuchotée (à droite) (Sujet ZMY).

Nous nous concentrons sur le cas des signaux chuchotés. Dans l‟analyse PointProcess, les valeurs minimales et maximales du pitch ont été respectivement définies comme 50 Hz et 3000 Hz. Une telle configuration du pitch est censée trouver, dans la majorité des signaux, une périodicité dans les harmoniques dont l‟amplitude assure la perceptibilité de cette périodicité à l‟oreille50. La figure 28 illustre la périodicité détectée à une telle configuration dans le spectre de la voyelle /a/ au ton 1, extrait d‟un enregistrement de l‟énoncé /(j)ì_kə_pā_tsɿ/, en voix chuchotée. Les lignes bleues verticales dans cette figure indiquent les pics dans la périodicité. Les intervalles entre les pics ne sont donc pas égaux mais varient approximativement à un certain rythme.

La fréquence de ce rythme de variation est la fréquence porteuse (fm) que nous désirons mesurer. Malgré tout notre effort, nous avons eu de la peine à prendre des mesures de fm de manière directe. Ainsi pour estimer ses valeurs, nous avons pris des mesures de Δt, l‟intervalle temporel entre les deux pics qui se situent dans deux phases voisines, où les intervalles entre les pics sont à peu après similaires, comme ce que le crochet bleu horizontal indique dans cette figure. Δt est l‟équivalent de 1/fm. Par exemple, dans le signal que la figure 28 illustre, Δt mesuré est à environ 12 ms, alors fm doit être autour de 82 Hz.

50 Malgré tout, en voix chuchotée, l‟énergie qui se distribue dans la zone de fréquences inférieures à 3000 Hz est plus importante que celle dans la zone supérieure à 3000 Hz. Une telle configuration du pitch établie permet d‟éviter que Praat cherche la périodicité dans la zone au-dessus de 3000 Hz. Dans l‟étendue 50 Hz-3000Hz, la fréquence de périodicité que Praat confirme correspond souvent à F1 ou à F2 de la voyelle concernée.

111

Figure 28 : Périodicité dans le spectre de la voyelle /a/ au ton 1 en voix chuchotée (Sujet ZMY).

Documents relatifs