• Aucun résultat trouvé

Expérience utilisant la parole naturelle modifiée (expérience Nat)

Dans le document Td corrigé Table des matières - limsi pdf (Page 170-181)

DEUXIÈME PARTIE : LE RÔLE DE LA PROSODIE

6. Accents espagnol en italien et italien en espagnol

6.3. Expérience utilisant la parole naturelle modifiée (expérience Nat)

80 Matériel et méthodologie

Dans cette expérience, des bilingues espagnol-italien ont été enregistrés, et leur prosodie naturelle a été modifiée. Une expérience perceptive a été conduite auprès d’auditeurs natif de l’espagnol et de l’italien pour discerner ce qui est perçu lorsqu’on croise le segmental et la prosodie des différents locuteurs. Le corpus est le même que dans l’expérience Dip. Les phrases ont été lues avec trois répétitions par 3 bilingues (un natif de l’espagnol, une native de l’espagnol, une native de l’italien), 3 monolingues espagnols (deux hommes, une femme) et 3 monolingues italiens (deux hommes, une femme), qui n’ont pas participé à l’expérience Dip mais qui ont reçu les mêmes instructions. Les bilingues devaient lire les phrases une fois à l’italienne et une fois à l’espagnole. Comme il est très difficile d’évaluer le niveau de langue et le degré d’accent des bilingues dans leur L2, ces informations n’ont été déterminées qu’indirectement à travers l’expérience perceptive. D’ailleurs, le niveau de performance en L2 ne va pas nécessairement de pair avec une absence d’accent étranger. Les résultats de l’expérience devraient indiquer si, chez nos locuteurs bilingues, une langue dominante est identifiable et dans quelle mesure.

Tous les locuteurs étaient jeunes. La locutrice bilingue native de l’espagnol (EF2), qui était de Madrid, et la locutrice bilingue native de l’italien (IF2) vivaient à Pise. Le locuteur bilingue natif de l’espagnol (EM2) vivait à Madrid. En moyenne, ils parlaient leur L2 depuis dix ans, depuis l’âge de 17 ans. Les locuteurs monolingues italiens et espagnols dont les voix ont été utilisées étaient également soit de Pise soit de Madrid respectivement. Les enregistrements ont été faits dans la région de résidence des locuteurs ou en région parisienne, dans des chambres isolées acoustiquement, dans des conditions comparables à celles de l’expérience Dip.

Afin de recopier les paramètres prosodiques d’un locuteur sur un autre, un script a été écrit pour le logiciel PRAAT, lequel permet de manipuler et de resynthétiser le signal de parole à l’aide de l’algorithme PSOLA. Il suit le schéma suivant : extraction puis transplantation, phonème par phonème, des durées puis de la hauteur, comme illustré dans la partie droite de la figure 6.2.

Avant d’entamer cette phase, les phrases du corpus ont été segmentées en phonèmes et en pauses, en utilisant l’alignement automatique et en corrigeant éventuellement le résultat manuellement. La procédure, décrite dans les chapitres précédents, fait appel à un dictionnaire de prononciation et à des modèles acoustiques qui sont dépendants de la langue. Quant à la F0,

elle a été extraite grâce à PRAAT. La transposition des paramètres de durée et de hauteur revient à :

– vérifier que le nombre de segments est égal entre les deux phrases de la paire choisie ; – calculer des coefficients d’allongement ou de rétrécissement, pour chaque phonème ou

pause d’un locuteur par rapport à un autre ;

– construire pour chaque phonème ou pause de nouvelles durées, qui remplaceront les durées originales de chacune des phrases ;

– transposer la F0 d’une des phrases sur l’autre, et vice versa.

Pour chaque paire de phrases retenue, deux nouveaux stimuli sont ainsi obtenus — par exemple, une voix espagnole parlant avec une prosodie italienne et inversement.

81 Préparation et sélection des stimuli

Les voix des 3 bilingues (EF2, IF2 et EM2), d’un Espagnol monolingue (EM1) et d’un Italien monolingue (IM1) ont été utilisées pour cette expérience Nat. La combinatoire qui résulte de tous les croisements de prosodie possibles est élevée. Il a donc fallu faire des choix : pour chacune des 4 configurations (3 bilingues + 1 monolingue de chaque langue), 3 paires de phrases ont été sélectionnées (l’une « espagnole », l’autre « italienne »), de façon à éviter les recouvrements. Ainsi, une phrase d’une langue donnée n’est pas lue par différentes voix dans le test perceptif, afin d’en maximiser la diversité (cf. tableau 6.4). De la liste restent deux paires de phrases non-utilisées dans le test proprement dit, qui servent en début d’expérience et sur lesquelles les résultats ne sont pas comptés. En croisant voix et prosodie des 4  3 paires d’originaux, phrase par phrase, on obtient autant de croisements inter-langues. De plus, pour chacune des 4 3 versions espagnoles ou italiennes, nous avons croisé la voix originale avec la prosodie d’une même langue d’un autre locuteur. Pour ce faire, nous avons transplanté les patrons prosodiques des monolingues dont la voix n’était pas utilisée dans la génération des stimuli (un Espagnol, une Espagnole, un Italien et une Italienne) sur les voix des locuteurs EM2, EF2, IF2,IM1 et EM1 . Le but est de s’assurer que l’impression d’accent étranger provient plus du croisement de langue que des inévitables dégradations introduites par la manipulation du signal de parole. On aboutit ainsi, pour chaque langue, à 4  3 croisements intra-langue. En ajoutant une répétition des originaux, pour vérifier la cohérence des réponses, on arrive à un total de 100 stimuli : 4 stimuli avant de compter les résultats + 2  4  3 originaux+ 2  4  3 originaux répétés + 2  4  3 croisements inter-langues + 2  4  3 croisements inter-inter-langues.

N° Traduction française Locuteurs

Il/Elle a vu la maison du president américain, oui ou non ? Lentement, Marina chante « Coupe la bûche ».

Maria te le dira que je pardonne au médecin.

La mienne proteste tristement quand je bois tant de vin.

La personne qui vient sort/monte avec un alpiniste.

Locuteurs monolingues

(EM1, IM1)

1011

Un taxi, quelle surprise ! Un bus, quel phénomène !

Tableau 6.4 : phrases et locuteurs sélectionnés dans l’expérience Nat. Dans certains cas, le sens est différent en espagnol et en italien, mais le contexte rend les deux traductions acceptables.

82 Tests perceptifs

Le test perceptif se faisait par Internet, à travers l’interface utilisée notamment dans les chapitres 3 et 4. Une courte phase de familiarisation avec l’italien et l’espagnol précédait le test, comme dans l’expérience Dip. Suivaient les instructions, écrites en anglais, en espagnol et en italien : écouter avec un casque des phrases qui se disent de la même façon en espagnol et en italien, lues par des locuteurs plus ou moins bilingues et éventuellement modifiées acoustiquement. Il était alors demandé aux auditeurs de focaliser leur attention davantage sur l’accent étranger que sur d’éventuelles dégradations de l’enregistrement. Les sujets, qui ne devaient pas avoir de problème d’audition connu, n’étaient pas payés pour cette tâche. Des détails biographiques, leur âge, leur sexe, leur lieu de résidence et leur familiarité avec l’espagnol et l’italien leur étaient également demandée.

La tâche requise, pour les Espagnols et les Italiens, était la même que dans l’expérience Dip. Les auditeurs pouvaient écouter les phrases autant de fois qu’ils le voulaient, mais ne pouvaient pas revenir en arrière après avoir répondu. Les 96 stimuli du test même étaient présentés dans un ordre aléatoire qui changeait pour chaque auditeur. Chaque test durait environ 20 minutes.

83 Analyse acoustique du corpus

Les phrases du test lues par EF2, IF2, EM2, EM1 et IM1 duraient 2 secondes en moyenne : le débit était de 16 phonèmes/seconde pour les phrases italiennes et de 18 phonèmes/seconde pour les phrases espagnoles. Le rapport de durées entre phonèmes accentués et inaccentués est 1,4 pour l’italien, contre seulement 1,1 pour l’espagnol, ce qui est conforme avec l’expérience Dip. Les hauteurs moyennes et les registres de hauteur sont comparables entre les deux langues : 134 Hz, 13 demi-tons pour les voix masculines ; 232 Hz, 16 demi-tons pour les voix féminines. En conséquence, les phénomènes temporels semblent les plus pertinents pour discriminer l’espagnol et l’italien, ce qui n’exclut pas qu’un patron mélodique spécifique tel qu’une montée de continuation sur un proparoxyton puisse être typique de l’espagnol. Les réalisations phonétiques d’une structure prosodiques peuvent être propres à chaque langue [Martin, 2003] : pour la phrase de la figure 6.5, lue par la locutrice EF2, cette hypothèse sera confirmée perceptivement. Cette figure (comme la figure 6.6) correspond aux stimuli originaux : alors que l’italien donne un exemple d’accent H* suivi d’une montée LH-, l’espagnol montre simplement une montée à partir de la syllabe accentuée.

L’importance des patrons mélodiques dans la détection d’un accent étranger ne peut être démontrée à partir de si peu de données. Cependant, ce type de différences tonales a également été souligné dans des études sur le phrasé (phrasing) de langues romanes [Frota et al., 2007].

Figure 6.5 : début de la phrase AL TELEFONO, ANTONIO MANIFESTO POCA SIMPATIA lue par la locutrice EF2 à l’italienne (gauche) et à l’espagnole (droite).

En examinant la courbe de F0 des syllabes accentuées d’autres phrases, on observe des différences supplémentaires entre italien et espagnol. La courbe de F0 est montante en espagnol et descendante en italien (par exemple sur la syllabe /ri/ de la phrase 7). Dans d’autres phrases, la courbe de F0 de l’espagnol forme un plateau et celle de l’italien descend (par exemple sur la syllabe /ra/ de la phrase 11). Mais ces cas sont rares, non-systématiques et pas toujours validés perceptivement.

D’autres indices, segmentaux, plus ponctuels et parfois très subtils, trahissent aussi l’origine des locuteurs :

– le chuintement du /s/ en un [s] apical ainsi que la spirantisation du /d/ notamment en position intervocalique, chez les locuteurs espagnols (cf. § 5.4.2.1) ;

– la spirantisation de /k/ en italien et le raddoppiamento fonosintattico — par exemple le redoublement du [m] dans te lo dirà Maria « Maria te le dira ») — chez les Toscans ;

– des voyelles moyennes plus ouvertes dans certains mots italiens que dans leurs contreparties espagnoles.

(a)

Figure 6 : (a) /d/ de PRESIDENTE lu par EM2 à l’italienne (gauche) et à l’espagnole (droite) ; (b) /k/ de FANTASTICO lu par IF2 à l’italienne (gauche) et à l’espagnole (droite).

On peut voir dans les spectrogrammes de la figure 6.6 une différence de concentration d’énergie entre les /s/ italien et espagnol, ainsi qu’une absence d’occlusion dans le /d/ de presidente (réalisé [] à la castillane par EM2) et dans le /k/ de fantastico (« fantastique », réalisé [h] à la toscane par IF2). Des valeurs de formants ont été prélevées au milieu de certaines voyelles, avec les options standard de PRAAT : à titre d’illustration, IF2 a prononcé le premier /O/ de poco (« peu ») avec un F1 de 610 Hz en italien et de 470 Hz seulement en espagnol.

(b

84 Auditeurs

Les phrases du corpus, dont la prosodie était laissée telle quelle ou modifiée, ont été présentées à 40 auditeurs : 4 20 Italiens (6 hommes et 14 femmes de 30 ans en moyenne), et 20 Espagnols (9 hommes et 11 femmes de 31 ans en moyenne). Ils ont essentiellement été recrutés au sein de forums d’enseignants de langues romanes.

Les sujets italiens, pour la moitié d’entre eux étaient de Rome. Ils évaluaient leur familiarité avec l’espagnol comme faible pour 14 d’entre eux, comme moyenne pour 5 d’entre eux et comme bonne pour l’un d’entre eux.

Les sujets de langue maternelle espagnole étaient soit de Madrid soit de Barcelone et leurs environs. Ils évaluaient leur familiarité avec l’italien comme faible pour 9 d’entre eux, comme moyenne pour 8 d’entre eux, et comme bonne pour 3 d’entre eux.

85 Résultats

Les résultats de l’expérience Nat sont donnés dans le tableau 6.5. VePe0 et ViPi0

correspondent aux phrases originales avec voix et prosodie espagnoles/italiennes respectivement ; VePem et ViPim correspondent aux croisements intra-langues ; ViPe et VePi correspondent aux croisements inter-langues (de la même façon que dans l’expérience Dip).

Il y a une bonne corrélation entre les réponses données aux stimuli répétés (VePe0 et ViPi0) pour les auditeurs espagnols [r = 0,70] et italiens [r = 0,75]. Même si nous ne sommes pas en mesure de contrôler les conditions dans lesquelles les sujets ont passé le test, ceci montre qu’ils l’ont fait correctement.68 Nous avons trop peu de locuteurs pour étudier en profondeur les différences inter-locuteurs. Cependant, au sein des stimuli originaux, une certaine hiérarchie est respectée pour les deux groupes d’auditeurs : la L1 des locuteurs est la mieux reconnue chez les monolingues, suivis dans l’ordre par IF2, EF2 et EM2. La L1 des bilingues influence les choix des auditeurs : les bilingues natifs de l’espagnol sont souvent perçus comme espagnols même quand ils parlent italien. Mais s’ils n’avaient pas réussi à passer pour italiens, les réponses auraient été différentes.

68 Ceci apporte une réponse aux critiques et/ou réticences envers des tests perceptifs par Internet [Holm, 2008 : 18–19] — critique qui pouvait également s’appliquer aux expériences des chapitres 3 et 4 notamment.

Groupe

(sujets) Type

Réponses (%)

Espagnol Italien avec un accent espagnol

Espagnol avec un

accent italien Italien

Italiens

VePeo 22 66 5 7

VePem 24 64 5 7

ViPe 12 56 10 22

VePi 12 55 8 25

ViPio 5 32 11 52

ViPim 2 33 13 52

Espagnols

VePeo 64 9 21 6

VePem 69 12 14 5

ViPe 30 15 44 12

VePi 20 21 41 18

ViPio 16 13 42 29

ViPim 5 17 46 31

Tableau 6.5 : distribution des réponses pour les deux groupes de sujets de l’expérience Nat, en fonction du type de phrase — VePe0 (voix espagnole avec la prosodie espagnole originale), VePem (voix espagnole avec une prosodie espagnole modifiée), ViPe (voix italienne avec une prosodie espagnole), VePi (voix espagnole avec une prosodie italienne), ViPi0 (voix italienne avec la prosodie italienne originale), ViPim (voix italienne avec une prosodie italienne modifiée).

Figure 6.7 : réponses des auditeurs natifs de l’italien et de l’espagnol aux 12 phrases autres que les originales, comptées dans les résultats de l’expérience Nat. Les pourcentages sont donnés par rapport à 160 réponses.

Se focalisant sur tous les stimuli sauf les originaux, la figure 6.7 montre phrase par phrase les patrons de réponses des auditeurs italiens et espagnols. Contrairement à ce qui se passait pour l’expérience Dip, il y a une différence significative entre les phrases [χ²(1) = 58 ;

Espagnol

Iltalien avec un accent espagnol Espagnol avec un accent italien Italien

100%

50%

p < 0,001]. Ceci n’est pas surprenant dans la mesure où dans cette expérience Nat les phrases sont liées aux locuteurs. Si l’on examine les réponses aux stimuli provenant des monolingues (phrases 7–9), les profils sont similaires à ceux de l’expérience Dip. La proportion élevée de réponses « italien » pour les phrases 10–12, qui étaient prononcées par une locutrice native de l’italien (IF2). Cette proportion est symétrique de la proportion élevée de réponses

« espagnol » pour les phrases 1–3, qui étaient prononcées par une locutrice native de l’espagnol (EF2).La proportion élevée de réponses « italien » + « espagnol avec un accent italien » pour les phrases 10–12 est également symétrique de la proportion de réponses

« espagnol » + « italien avec un accent espagnol » pour les phrases 4–6, qui étaient lues par EM2. Ces différences de patrons pour la phrase 10 entre les représentations graphiques des figures 6.3 et 6.7 suggèrent également que le biais vient des locuteurs plutôt que des phrases.

La suite de ce chapitre aborde la question de savoir si la prosodie prime sur d’autres traits dans l’identification de la langue première de ces locuteurs.

85.1 Comparaison entre et au sein des groupes italien et espagnol

Dans la majorité des cas, les stimuli originaux et les croisements intra-langues VePe0

et VePem (ou ViPi0 et ViPim) ont reçu l’étiquette « espagnol » de la part des auditeurs espagnols (ou l’étiquette « italien » de la part des auditeurs italiens). Par conséquent, la détérioration introduite par la manipulation acoustique des stimuli n’a pas affecté l’identification de l’origine des locuteurs.

Les Espagnols ont reconnu les stimuli espagnols (VePeo et VePem) plus facilement que les stimuli italiens (ViPio et ViPim), de même que les Italiens ont reconnu les stimuli italiens plus facilement que les stimuli espagnols. Dans tous les autres cas, les Espagnols ont majoritairement répondu « espagnol un avec accent italien » et les Italiens « italien avec un accent espagnol ». En cela, les réponses des auditeurs espagnols et italiens sont symétriques.

Le côté artificiel des stimuli manipulés, qui peuvent engendrer une bizarrerie donnant une impression d’accent étranger, n’explique qu’en partie ce résultat : on l’observe autant, si ce n’est plus, avec les stimuli originaux. Cette tendance annexionniste à répondre « italien avec un accent espagnol » pour les Italiens, « espagnol avec un accent italien » pour les Espagnols, s’observait également avec la synthèse par diphones, notamment dans le cas des croisements inter-langues (cf. tableau 6.3). C’est pourquoi, comme en 6.2.5.3, nous avons additionné les réponses « espagnol » et « italien avec un accent espagnol » d’une part, « italien » et

« espagnol avec un accent italien » de l’autre. La figure 6.8 illustre, pour les deux groupes d’auditeurs, les pourcentages de stimuli jugés comme ayant un accent italien, en fonction du type de stimulus.

Les bâtonnets correspondant aux stimuli VePi et ViPe ont pratiquement la même hauteur. Les auditeurs italiens ont respectivement perçu les stimuli ViPe et VePi comme ayant un accent espagnol dans 68 % des cas (12 + 53) et 67 % des cas (12 + 55) ; les auditeurs espagnols ont respectivement perçu les stimuli ViPe et VePi comme ayant un accent italien dans 56 % des cas (44 + 12) et 59 % (41 + 18). La différence entre les évaluations des stimuli ViPe et VePi est significative [χ²(3) = 9,66 ; p < 0,05]. Pour la locutrice IF2, même, les stimuli VePi ont davantage reçu l’étiquette « italien » que les stimuli ViPe : ils ont été perçus comme de l’italien à plus de 50 % par chacun des deux groupes d’auditeurs. Mais les différences ne sont pas significatives d’après un test de ² : elles ne permettent donc pas de déduire si le facteur dominant dans la perception de l’accent espagnol/italien relève du segmental ou du suprasegmental. Au vu de ce résultat non-significatif des statistiques inférentielles, nous pouvons dire à défaut que, dans cette expérience Nat, la prosodie joue un rôle aussi important

ViPiVePi ViPeVePe

que la voix et l’articulation des phonèmes. D’autres analyses ont été effectuées pour tester ce résultat.

Figure 6.8 t pourcentages de réponses « italien » ou « espagnol avec un accent italien » données par les sujets italiens et espagnols, dans l’expérience Nat, en fonction du type de stimulus. ViPi et VePe correspondent aux croisements intra-langues.

85.2 Généralisation à d’autres auditeurs et à d’autres phrases

Pour pouvoir généraliser nos résultats à un échantillon d’individus plus large et à d’autres phrases, nous avons combiné les réponses des auditeurs (« espagnol » et « italien avec un accent espagnol » d’une part, « italien » et « espagnol avec un accent italien » d’autre part) comme dans l’expérience Dip (cf. § 6.2.5.3). Nous avons mené des ANOVA similaires à ce qui a été fait plus haut, avec le facteur aléatoire Sujet ou Phrase, et nous avons obtenu les mêmes patrons en termes de résultats significatifs — de même, en ne considérant que les stimuli modifiés (VePem, ViPe, VePi, et ViPim).

Comme dans l’expérience Dip, l’effet di Groupe d’auditeurs est significatif [F(1, 38) = 35,6 ; p < 0,001] : les Italiens, en effet, ont répondu plus souvent « italien avec un accent espagnol » et les Espagnols plus souvent « espagnol avec un accent italien ». Ce biais général (37 % de réponses de type « accent italien » pour les sujets italiens contre 51 % pour les sujets espagnols) apparaît clairement dans la distribution des réponses.

On observe également un effet du Type de stimulus [F(3, 114) = 113,3 ; p < 0,001], l’interaction Groupe  Type étant elle aussi significative [F(3, 114) = 6,1 ; p < 0,001]. Si on restreint l’analyse aux seuls croisements inter-langues, les stimuli VePi sont perçus comme ayant un accent italien significativement plus souvent que les stimuli ViPe [F(1, 38) = 9,8 ; p

< 0,001], et l’interaction entre Groupe et Type n’est pas significative. Ces résultats ne sont pas statistiquement significatifs pour les auditeurs italiens : pour ces sujets, la tendance est à un rôle équivalent de la prosodie et des traits segmentaux. Les résultats sont donc moins tranchés que dans l’expérience Dip. Cependant, les réponses aux stimuli croisés VePi et ViPe sont significativement différentes pour lesauditeurs espagnols [F(1, 19) = 11,7 ; p < 0,01].

taliens Espagnols

85.3 Discussion

On peut conclure, à partir des résultats de cette expérience Nat, qu’il y a une légère différence entre les stimuli ViPe et VePi. Les corrélats acoustiques de la structure prosodique restent donc importants pour identifier la langue première d’un locuteur. Même si la conclusion de l’expérience à base de synthèse par diphones n’est pas renforcée, elle n’est pas contredite. L’analyse statistique suggère que, lorsque des sujets écoutent des stimuli dont la prosodie provient d’une langue et le segmental provient d’une autre langue, la prosodie incline leur perception.

6.4. Conclusion

Deux expériences ont été relatées dans ce chapitre, chacune soumise à des auditeurs espagnols et italiens. L’expérience Dip, utilisant la synthèse par diphones pour croiser des paramètres segmentaux et suprasegmentaux de l’espagnol et de l’italien, suggère que les sujets sont plus influencés par la prosodie que par la voix et des caractéristiques phonémiques dans leur appréciation de l’accent étranger espagnol/italien. Une voix italienne avec une prosodie espagnole, par exemple, est jugée sonnant plus comme espagnol que comme italien ; elle est plus souvent associée à de l’italien avec un accent espagnol qu’à l’espagnol avec un accent italien. Les résultats globaux permettent donc l’interprétation suivante : dans des conditions où les énoncés sont proches, l’articulation des phonèmes aide à identifier l’origine (la langue première) du locuteur, mais la prosodie constitue un indice légèrement plus fiable.

Ce fort effet de la prosodie est confirmé pour les auditeurs espagnols. Il nécessite néanmoins

Ce fort effet de la prosodie est confirmé pour les auditeurs espagnols. Il nécessite néanmoins

Dans le document Td corrigé Table des matières - limsi pdf (Page 170-181)