• Aucun résultat trouvé

Lien entre l’évolution formantique et le renforcement de l’énergie spectrale dans les médiums

Une adaptation visant à émerger du bruit ambiant ?

3. A DAPTATION EN FREQUENCES

3.2. Adaptation spectrale

3.2.2. Lien entre l’évolution formantique et le renforcement de l’énergie spectrale dans les médiums

Figure 86. Evolution dans le bruit de

la durée des fricatives non voisées (à gauche) et des voyelles (à droite) produites par les locuteurs et locutrices de la première base de données, pour 2 types de bruit (bruit blanc et bruit cocktail) à 86dB.

Pour conclure vis à vis de ces différentes explorations, la comparaison de l’évolution dans le bruit des fricatives non voisées (susceptibles d’être davantage masquées par le bruit blanc) et des voyelles (susceptibles d’être davantage masquées par le bruit cocktail) n’a pas montré de résultats allant dans le sens d’une stratégie de compensation de ce masquage ni au niveau spectral, ni au niveau de l’intensité globale, et pas non plus au niveau de la durée segmentale. Il ne semble pas exister pour les locuteurs de la BD1 de stratégies d’adaptation spectrale de la parole aux caractéristiques de l’environnement bruyant. En revanche, on observe globalement un renforcement de l’énergie de tous les segments dans les fréquences médium, que ces segments soient voisés ou bruités, et quel que soit le type de bruit. Nous avons également vu que ce renforcement de l’énergie ne montrait pas pour autant une très forte corrélation avec l’intensité vocale (cf. § 1.3.4). L’interprétation la plus plausible de ces différents éléments d’information est qu’il existe une stratégie générale de « timbrage » de la voix dans la zone sensible de l’oreille, indépendamment du type de bruit, de façon à renforcer l’énergie de la parole là où celle-ci est la mieux perçue par l’auditeur, de la même façon que les chanteurs lyriques renforcent l’énergie spectrale de leur voix autour de 3kHz (singing formant) pour émerger de l’orchestre (Sundberg 1972 [337]) ou que les acteurs renforcent l’énergie spectrale autour de 4kHz (Bele 2006 [23]).

3.2.2. Lien entre l’évolution formantique et le renforcement de l’énergie

spectrale dans les médiums

Puisque nous avons évoqué la notion de Singing Formant, il se trouve que Sundberg 1972 [337] propose que ce renforcement spectral soit réalisé par les chanteurs en rapprochant les 3èmes et 4èmes formants vocaliques. Cela nous amène à effectuer l’hypothèse que l’évolution du 3ème

formant observée dans le bruit chez certains locuteurs puisse être lié à cette stratégie de timbrage de la voix dans la zone sensible de l’oreille (2-4kHz). En examinant qualitativement un grand nombre de spectres moyennés, on observe effectivement que

- dans le cas de la voyelle [a], F3 tend à se rapprocher de F4 dans le bruit pour former un renforcement spectral autour de 3.5-4kHz (cf. Figure 87). La fréquence de F3 a donc tendance à augmenter.

- dans le cas de la voyelle [u], l’amplitude de F3 tend à être renforcée dans le bruit ou F3 tend à se rapprocher de F4 et F5 pour former un renforcement spectral autour de 4kHz (cf. Figure 87). La fréquence de F3 a donc tendance à rester constante dans le bruit ou à légèrement augmenter.

- enfin dans le cas du [i], on observe deux stratégies différentes : Dans certains cas, F2 et F3 fusionnent dans le bruit autour de 2.5kHz et F4 et F5 autour de 4.5kHz, dans d‘autres on remarque un rapprochement de F2, F3, F4 pour renforcer le spectre entre 2 et 4 kHz (cf. Figure 87). Dans tous les cas, la fréquence du F3 a alors tendance à diminuer.

3. ADAPTATION EN FREQUENCES

149

Figure 87. Exemple d’évolution dans le bruit du spectre moyenné sur les voyelles [a] (en haut à gauche), [u]

(en haut à droite) et [i] (en bas).

Nous avons donc cherché à explorer la corrélation entre la fréquence centrale du 3ème formant et le renforcement du spectre dans la zone sensible de l’oreille (entre 2 et 4kHz) par rapport à la zone du fondamental (entre 0 et 1kHz). Pour cela, nous avons tracé dans un même plan les valeurs du 3ème formant vocalique en fonction de la différence d’énergie spectrale entre ces deux zones (cf. Figure 88). Ces deux paramètres ont été mesurés

- dans la BD1 sur les syllabes des 16 mots cibles contenant un [a], un [i] ou un [u], prononcés dans chaque condition de bruit, et cela pour les 9 conditions (silence et 8 conditions de bruit à différents niveaux d’intensité). Cela représente donc au total 108 mesures par locuteur et locutrice pour les voyelles [a], 135 pour les [i] et 54 pour les [u].

- dans la BD2 sur la syllabe du déterminant [la] et sur les 1ères ou 2èmes syllabes [la] des 17 logatomes cibles prononcés en position initiale et finale de l’énoncé pour la condition de silence et de bruit cocktail, et seulement en position finale de l’énoncé pour la condition de bruit blanc. Cela représente donc au total 255 mesures par locutrice pour les voyelles [a]. Nous n’avons pas examiné les corrélations pour les autres voyelles [i] et [u] faute d’effectif suffisamment important pour ces voyelles.

Les coefficients de régression linéaire de ces données sont rapportés dans la colonne « En Absolu » du Tableau 23. Nous avons également tracé dans un même plan la différence entre chaque valeur mesurée dans les différentes conditions de bruit et sa valeur correspondante dans le silence. Les coefficients de régression linéaire de ces données sont également rapportés dans le Tableau 23, cette fois dans la colonne « En Evolution ».

Figure 88. Exemples pour une

locutrice (L1) et un locuteur (L5) de la corrélation entre leur 3ème formant et l’énergie spectrale de leur voix entre 2 et 4kHz par rapport à la zone [0-1kHz], pour les voyelles [i] produites en situation calme et bruyante. L’ensemble des figures pour tous les locuteurs et locutrices des deux bases de données sont consultables en Annexe Res6.

BD2

BD1

Tableau 23. La colonne « En Absolu » représente les coefficients de régression linéaire entre les valeurs du

3ème formant vocalique des voyelles [a], [i] et [u] et celles de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz], toutes conditions confondues de la BD1 (à gauche) et de la BD2 (à droite). La colonne « En Evolution » représente les coefficients de régression linéaire entre les valeurs d’évolution du silence au bruit du 3ème formant vocalique et la valeur d’évolution de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz].

L’examen de ces figures et des coefficients de régression linéaire montre peu de corrélation entre le 3ème formant vocalique et le renforcement de l’énergie spectrale dans la zone sensible de l’oreille, que ce soit dans l’absolu ou en évolution du silence au bruit. Cela se retrouve également au niveau des tendances globales d’évolution qui montrent autant de cas de diminution du 3ème formant avec le renforcement de l’énergie spectrale que d’augmentation conjointe du 3ème formant avec le renforcement de l’énergie spectrale (cf. Tableau 24). Ces résultats peuvent indiquer que le déplacement en fréquence du 3ème formant ne participe pas au renforcement spectral de la voix entre 2 et 4kHz. Les résultats de Lienard et al. 1999 [215] iraient dans ce sens puisque ces auteurs observent en voix forte un renforcement de l’énergie spectrale de la voix dans les médiums bien que le 2ème et le 3ème formant vocalique ne se déplacent pas en fréquence. En revanche, ces auteurs constatent une augmentation de l’amplitude de ces formants dans le bruit, indépendamment de tout rapprochement et de toute fusion.

BD1

Tableau 24. Pourcentage de cas où le 3ème formant vocalique augmente ou diminue conjointement à un

renforcement de l’énergie spectrale dans la zone sensible de l’oreille, pour chaque locuteur et locutrice de la 1ère base de données (à gauche) et de la 2ème base de données (à droite). La somme des deux colonnes ne correspond pas toujours à 100%. Il existe en effet quelques rares cas où l’énergie spectrale est moins renforcée avec le bruit dans la zone [2-4kHz] que dans la zone [0-1kHz]. L’effectif de ces cas correspond au pourcentage restant pour atteindre 100%.

[a] [i] [u]

En Absolu En Evolution En Absolu En Evolution En Absolu En Evolution L1 3.4 % 40.4 % -50.9 % -50.8 % 27.3 % -10.3 % L2 35.3 % 49.6 % -48.1 % -60.8 % 23.1 % 56.2 % L6 27.6 % 35.8 % -25.1 % -8.4 % -2.0 % 17.9 % L9 -37.6 % -10.1 % -20.5 % -16.4 % 14.4 % -23.2 % L10 50.2 % 13.6 % -19.6 % -16.1 % 54.4 % 36.3 % L3 28.2 % -19.7 % -19.6 % 26.2 % -22.1 % 7.4 % L4 16.5 % -29.3 % -2.8 % -3.3 % 28.2 % 10.5 % L5 -29.5 % -3.2 % -36.3 % -25.4 % -47.5 % -15.7 % L7 11.2 % -2.1 % -21.3 % -6.0 % 15.4 % 1.6 % L8 -11.9 % 1.8 % -34.2 % -13.6 % -12.8 % 12.3 % [a] En Absolu En Evolution L2 40.2 % -11.5 % L6 21.9 % -19.3 % L11 43.7 % 28.7 %

[a] [i] [u]

F3 diminue F3 augmente F3 diminueF3 augmenteF3 diminueF3 augmente L1 49.4 % 50.6 % 62.1 % 29.3 % 33.3 % 63.3 % L2 21.8 % 75.9 % 59.3 % 25.0 % 44.7 % 29.8 % L6 39.8 % 60.2 % 58.8 % 35.3 % 60.4 % 35.4 % L9 73.8 % 26.2 % 58.1 % 40.0 % 18.9 % 51.4 % L10 19.6 % 79.3 % 80.9 % 19.1 % 6.8 % 68.2 % L3 12.7 % 87.3 % 72.5 % 23.1 % 48.9 % 12.8 % L4 28.2 % 71.8 % 41.1 % 51.6 % 23.9 % 52.2 % L5 85.1 % 13.8 % 79.7 % 19.5 % 79.2 % 16.7 % L7 38.0 % 62.0 % 70.2 % 29.8 % 31.9 % 61.7 % L8 69.5 % 25.3 % 61.3 % 30.3 % 75.0 % 22.9 % [a] F3 diminue F3 augmente L2 26.0 % 74.0 % L6 17.3 % 82.7 % L11 25.0 % 75.0 % BD2

3. ADAPTATION EN FREQUENCES

151

3.2.3. Lien entre l’évolution des mouvements articulatoires et le

renforcement de l’énergie spectrale dans les médiums

Si l’augmentation de l’énergie de la voix dans les fréquences médium n’est pas uniquement liée à l’aplatissement de la pente spectrale de par l’augmentation de l’effort glottique, alors on peut raisonnablement émettre l’hypothèse que les articulateurs puissent jouer un rôle dans le renforcement du spectre observé entre 2 et 4kHz, ainsi que dans le renforcement spectral observé chez certains locuteurs entre 4 et 6kHz.

Une première idée consiste à envisager ce renforcement spectral du point de vue du rayonnement de la voix, et à considérer le conduit vocal comme un pavillon. On sait, d’après la théorie des pavillons, que l’augmentation de la surface d’ouverture du pavillon permet d’améliorer son rayonnement et s’accompagne d’une diminution de la fréquence critique du pavillon (cf. Annexe Met1). Nous explorerons donc dans un premier temps si l’augmentation de l’aire intéro-labiale observée dans le bruit peut être directement reliée aux renforcements du spectre existant dans le bruit entre 2 et 4kHz, ou entre 4 et 6 kHz (cf. Figure 87).

Une deuxième idée provient d’une autre interprétation du formant du chanteur également proposée par Sundberg 1972 [337] puis reprise par Dang et al. 1997 [61]. Ces auteurs proposent en effet que le renforcement du spectre autour de 3kHz soit lié à la fréquence de résonance des sinus piriformes (vers les 2-3kHz) ou des cavités pharyngées plus globales (vers les 3-3.5kHz), et contrôlable dans une certaine mesure par l’abaissement du larynx, provoquant un élargissement de cette cavité. Nous explorerons donc dans un deuxième temps si les mouvements verticaux du larynx sont corrélés au renforcement du spectre de la voix entre 2 et 4kHz.

3.2.3.1. L’aire intéro-labiale et le rayonnement de la voix

Pour explorer la potentielle corrélation entre le timbrage de la voix et l’aire intéro-labiale, nous avons tracé dans un même plan les valeurs d’aire intéro-labiale en fonction de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz]. Nous avons de la même manière tracé dans un même plan les valeurs d’aire intéro-labiale en fonction en fonction de la différence d’énergie spectrale entre la zone [4-6kHz] et la zone [0-1kHz] (cf. Figure 89). Ces trois paramètres ont été mesurés sur la syllabe du déterminant [la] et sur les 2 syllabes des 17 logatomes cibles de la BD2, prononcés en position initiale et finale de l’énoncé pour la condition de silence et de bruit cocktail, et seulement en position finale de l’énoncé pour la condition de bruit blanc. Cela représente donc au total 255 mesures par locutrice. Les coefficients de régression linéaire de ces données sont rapportés dans la colonne « En Absolu » du Tableau 25. Nous avons également tracé dans un même plan la différence entre chaque valeur mesurée dans les différentes conditions de bruit et sa valeur correspondante dans le silence. Les coefficients de régression linéaire de ces données sont également rapportés dans le Tableau 25, cette fois dans la colonne « En Evolution ».

Figure 89. Exemples pour une

locutrice de la corrélation entre ses valeurs d’aire intéro-labiale et le timbrage de sa voix dans les zones [2 -4kHz] et [4-6kHz] par rapport à la zone [0-1kHz], en situation calme et bruyante. L’ensemble des figures pour toutes les locutrices de la BD2 sont consultables en Annexe Res6.

L’examen de ces figures et des coefficients de régression linéaire montre une forte corrélation chez les 3 locutrices de BD2 entre l’aire intéro-labiale et la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz]. Une corrélation très forte est également observée entre l’aire intéro-labiale et la différence d’énergie spectrale entre la zone [4-6kHz] et la zone [0-1kHz], mais seulement pour les locutrices L6 et L11. En revanche, les évolutions de ces différents paramètres dans le bruit sont peu corrélées, bien qu’au niveau des tendances globales d’évolution l’aire intéro-labiale augmente dans tous les cas de façon conjointe à l’augmentation de l’énergie spectrale entre 2 et 4 kHz.

En ce qui concerne l’énergie entre 4 et 6 kHz, on retrouve que celle-ci augmente dans le bruit de façon conjointe à l’augmentation de l’aire intéro-labiale pour les locutrices L6 et L11, tandis que la locutrice L2 montre 36.5% de cas où son aire intéro-labiale augmente conjointement à une atténuation de l’énergie entre 4 et 6kHz par rapport à la zone [0-1kHz].

Tableau 25. La colonne « En Absolu » représente les coefficients de régression linéaire entre les valeurs de l’aire intéro-labiale et celles de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz], ou entre la zone [4-6kHz] et la zone [0-1kHz], toutes conditions confondues de la BD2. La colonne « En Evolution » représente les coefficients de régression linéaire entre les valeurs d’évolution du silence au bruit de l’aire intéro-labiale et les valeurs d’évolution de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz] ou entre la zone [4-6kHz] et la zone [0-1kHz].

En conclusion, l’augmentation de l’aire intéro-labiale semble assez liée à la stratégie de renforcement du spectre dans les fréquences médiums adoptée par les locuteurs pour émerger du bruit ambiant. Cela est également le cas pour les fréquences entre 4 et 6 kHz, mais seulement pour les locutrices L6 et L11.

3.2.3.2. Les mouvements verticaux du larynx et la résonance des cavités pharyngées Pour explorer la potentielle corrélation entre le timbrage de la voix et les mouvements verticaux du larynx, nous avons tracé dans un même plan les valeurs d’amplitude des mouvements verticaux du larynx en fonction de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz]. Nous avons procédé de la même manière pour la différence d’énergie spectrale entre la zone [4-6kHz] et la zone [0-1kHz] (cf. Figure 90). Ces trois paramètres ont été mesurés sur la syllabe du déterminant [la] et sur les 2 syllabes des 17 logatomes cibles de la BD2, prononcés en position initiale et finale de l’énoncé pour la condition de silence et de bruit cocktail, et seulement en position finale de l’énoncé pour la condition de bruit blanc. Cela représente donc au total 255 mesures par locutrice. Les coefficients de régression linéaire de ces données sont rapportés dans la colonne « En Absolu » du Tableau 26.

Figure 90. Exemples pour

une locutrice de la corrélation entre la hauteur de son larynx et le timbrage de sa voix dans les zones [2 -4kHz] et [4-6kHz] par rapport à la zone [0-1kHz], en situation calme et bruyante. L’ensemble des figures pour toutes les locutrices de la BD2 sont consultables en Annexe Res6.

Tableau 26. La colonne « En Absolu » représente les coefficients de régression linéaire entre les valeurs de l’amplitude des mouvements verticaux du larynx et celles de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz], ou entre la zone [4-6kHz] et la zone [0-1kHz], toutes conditions confondues de la BD2. La colonne « En Evolution » représente les coefficients de régression linéaire entre les valeurs d’évolution du silence au bruit de l’amplitude des mouvements verticaux du larynx et les valeurs d’évolution de la différence d’énergie spectrale entre la zone [2-4kHz] et la zone [0-1kHz] ou entre la zone [4-6kHz] et la zone [0-1kHz].

Renforcement [2-4 kHz] Renforcement [4-6 kHz] En Absolu En Evolution En Absolu En Evolution L2 68.2 % 11.8 % -6.5 % -7.5 %

L6 83.2 % 35.7 % 81.7 % 23.0 %

L11 87.7 % 50.5 % 80.3 % 31.1 %

Renforcement [2-4 kHz] Renforcement [4-6 kHz] En Absolu En Evolution En Absolu En Evolution L2 12.8 % -18.9 % -10.9 % -0.8 %

L6 66.1 % -29.0 % 65.6 % -5.4 %

3. ADAPTATION EN FREQUENCES

153

Nous avons également tracé dans un même plan la différence entre chaque valeur mesurée dans les différentes conditions de bruit et sa valeur correspondante dans le silence. Les coefficients de régression linéaire de ces données sont également rapportés dans le Tableau 26, cette fois dans la colonne « En Evolution ».

L’examen de ces figures et des coefficients de régression linéaire montre une forte corrélation entre l’amplitude des mouvements verticaux du larynx et le renforcement spectral de la voix entre 2 et 4kHz et entre 4 et 6 kHz, pour les locutrices L6 et L11 seulement. Cependant, cette corrélation ne va pas dans le sens de notre hypothèse puisqu’elle relie l’augmentation du timbrage de la voix avec l’élévation du larynx (cf. Tableau 27), ce qui est contraire à un élargissement de la cavité pharyngée. Par ailleurs, la locutrice L2 montre autant de cas où son larynx monte ou descend par rapport au silence, conjointement à une augmentation de l’énergie spectrale entre 2 et 4kHz, et entre 4 et 6kHz.

Renforcement spectral[2-4 kHz] Renforcement spectral [4-6kHz]

Tableau 27. Pourcentage de cas où le larynx monte ou descend dans le bruit par rapport au silence,

conjointement à un renforcement de l’énergie entre 2 et 4kHz (à gauche), ou entre 4 et 6 kHz (à droite), pour chaque locutrice de la 2ème base de données. La somme des deux colonnes d’un même tableau ne correspond pas toujours à 100%. Il existe en effet quelques rares cas où l’énergie spectrale est moins renforcée avec le bruit dans la zone [2-4kHz] que dans la zone [0-1kHz]. L’effectif de ces cas correspond au pourcentage restant pour atteindre 100%.

En conclusion, les mouvements verticaux du larynx ne sont pas du tout liés au timbrage de la voix pour la locutrice L2. Au contraire, ils y sont corrélés pour les locutrices L6 et L11, de façon contraire à ce que nous attendions : La hauteur du larynx et l’énergie spectrale semblent corrélées de façon indirecte du fait qu’elles sont toutes les deux liées à l’augmentation de l’effort vocal s’accompagnant chez ces locutrices à la fois d’un renforcement de l’énergie spectral dans les hautes fréquences et d’une montée du larynx. La montée du larynx accompagne très souvent l’augmentation de la fréquence fondamentale et est ainsi dépendant de la tension des cordes vocales (Yanagisawa et al. 1991 [380]). Par ailleurs, les mouvements verticaux du larynx peuvent participer activement à la production de consonnes glottales (Vaissière 1997 [358]). Celles ci n’existent pas en tant que phonème pour le français, mais certains locuteurs peuvent attaquer des voyelles ou des consonnes voisées en « coup de glotte ».

Larynx descend Larynx monte L2 36.5 % 26.9 %

L6 5.8 % 94.2 %

L11 2.9 % 97.1 %

Larynx descend Larynx monte L2 54.8 % 45.2 % L6 5.8 % 94.2 % L11 2.9 % 97.1 %

Outline

Documents relatifs