• Aucun résultat trouvé

Les variables temporelles dans la production et la perception de la parole

N/A
N/A
Protected

Academic year: 2022

Partager "Les variables temporelles dans la production et la perception de la parole"

Copied!
282
0
0

Texte intégral

(1)

Thesis

Reference

Les variables temporelles dans la production et la perception de la parole

SCHWAB, Sandra

Abstract

Les recherches présentées dans ce travail portent sur plusieurs aspects liés aux variables temporelles, tant en production qu'en perception de la parole. Une première étude porte sur les variables temporelles du français et fournit une description détaillée de ces dernières en lecture. Une deuxième étude traite de la perception du débit en langue seconde et a pour but de vérifier empiriquement l'impression de rapidité que ressent un locuteur non-natif dans une langue étrangère. La troisième étude porte sur l'impact du débit sur la segmentation des mots et se donne pour objectif de vérifier l'hypothèse selon laquelle l'identification des frontières lexicales est plus difficile à un débit rapide qu'à un débit lent. Finalement, la dernière étude évalue l'importance du débit, plus précisément du nombre et de la durée des pauses, dans la compréhension et la qualité subjective de textes produits par le système de synthèse de la parole "FipsVox".

SCHWAB, Sandra. Les variables temporelles dans la production et la perception de la parole. Thèse de doctorat : Univ. Genève, 2007, no. L. 646

URN : urn:nbn:ch:unige-52164

DOI : 10.13097/archive-ouverte/unige:5216

Available at:

http://archive-ouverte.unige.ch/unige:5216

Disclaimer: layout of this document may differ from the published version.

(2)

L ES VARIABLES TEMPORELLES

DANS LA PRODUCTION ET LA PERCEPTION DE LA PAROLE

T

HESE

présentée à la Faculté des Lettres de l'Université de Genève

pour obtenir le grade de docteur ès Lettres par

Sandra SCHWAB

Directeurs: Prof. Eric Wehrli (Université de Genève, Suisse)

Prof. Uli H. Frauenfelder (Université de Genève, Suisse)

Jury: Prof. Jacques Moeschler (Université de Genève, Suisse), Président Prof. Noël Nguyen (Université de Provence, Aix-en-Provence, France) Dr. Brigitte Zellner Keller (Université de Lausanne, Suisse)

Thèse No 646 2007

(3)

professeurs Jacques MOESCHLER, président du jury; Eric WEHRLI (Unige) et Ueli FRAUENFELDER (FPSE), co-directeurs; Dr Brigitte ZELLNER KELLER (UNIL);

Noël NGUYEN (Université de Provence, Aix-en-Provence) autorise l’impression de la présente thèse, sans exprimer d’opinion sur les propositions qui y sont énoncées.

Genève, le 21 décembre, 2007 Thèse - 646 -

Le doyen: Eric WEHRLI

(4)

Ma plus grande gratitude va aux Professeurs Eric Wehrli et Uli Frauenfelder, sans qui ce travail n'aurait pas vu la fin. Je ne sais pas comment vous remercier d'avoir repris la direction de ma thèse et d'avoir cru en mon travail. Vous m'avez redonné confiance et l'énergie pour achever ma thèse. Mille mille mercis!

Je tiens également à remercier le Professeur François Grosjean pour tout ce qu'il m'a appris pendant mes années au LTLP, ainsi que pour le travail accompli ensemble. Il est regrettable que nous n'ayons pas pu terminer ce travail ensemble, mais sache que tu as toute ma reconnaissance pour le temps et les efforts que tu as consacrés à ma thèse.

Je tiens à remercier les membres du jury: Prof. Jacques Moeschler, Prof. Noël Nguyen, et Dr. Brigitte Zellner Keller. Merci, Brigitte, de m'avoir toujours encouragée lors de la rédaction de ce travail.

Un énorme (et plus encore!) merci à Isabelle! Sans toi, je n'en serais pas là aujourd'hui.

Merci pour ton soutien quand je voulais "être un canard" (et c'est arrivé bien souvent), pour nos longues discussions à propos de "vraie" science (quelle analyse on fait?) et un peu moins (on met un espace avant et après "="?). Te remercier en si peu de lignes pour tout ce que tu as fait pour moi est totalement impossible. Merci pour ton amitié tout simplement…

Mille mercis à mes "copines linguistes", Carole, Esther, Isabelle, Audrey pour la détente de nos moments Crêp', mais aussi pour tous vos conseils et vos encouragements quand j'étais un peu dépitée…

Merci à tous les membres du LTLP, en particulier à Emmanuelle et à Murielle, qui m'ont évité bien du travail, disons, un peu rébarbatif… Vive Endnote! Merci aussi à Lysiane qui a prêté sa voix aux enregistrements.

Merci aussi à mon père, l’expert bilingue français-allemand, qui a "gentiment" accepté de vérifier une grande partie des réponses rédigées en allemand.

Merci également à toute l'équipe du LATL et du département de linguistique, en particulier, à Arnaud et JP pour avoir réglé les problèmes informatiques concernant FipsVox et pour avoir répondu à toutes mes questions sur la synthèse de la parole. Merci

(5)

aussi à Antonio qui, sachant qu'un "cafecito" se transformerait certainement en un après-midi entier, n'a pas hésité à m'écouter déblatérer sur le débit.

Thanks to the Speech Perception Lab team at Northeastern University (Boston).

Especially, I would like to thank Professor Joanne Miller for the wonderful year I spent in her lab. Thanks for your kindness and your advice.

I also want to acknowledge Professors Rhea Eskew and Dave Desteno for answering my statistics questions, even when I was back in Switzerland. Your advice really helped me!

Thanks to the "wizard" Joe for always being available to solve all my computer problems.

Thank you, Eliza, for all the boring double-checking you had to do because of me, I am still so sorry about that, but very grateful!

Thanks to Tim for analyzing errors in Chapter 4.

Many thanks to Rachel for the funny cigarette breaks we had and for the great time in Vancouver.

Mike, thank you so so much! You made my stay in Boston terrific. Our coffee breaks and our aperos were always a welcome escape from my measurements!

Merci également à Michele, sans qui je n'aurais eu ni toit à Boston, ni stimuli pour l'expérience du chapitre 4!

Je tiens aussi à remercier tous les chercheurs que j'ai eu l'occasion de rencontrer tout au long de mes années de thèse pour leurs précieux conseils.

Mille mercis aux "yeux de lynx" de Carole, Audrey, Isabelle, Christopher, Barbara, Pierre, sans oublier Béatrice aux USA. Un plus grand merci encore aux "non-linguistes"

d'avoir accepté de vous initier à la psycholinguistique en relisant mon travail (c'est le comble pour certains d'entre vous!). Les variables temporelles n'ont plus de secrets pour vous!

(6)

Je remercie aussi tous mes sujets européens et américains, sans qui rien n'aurait été possible.

Je tiens également à remercier le Fond national suisse de la recherche scientifique de m'avoir octroyé une bourse "Jeune chercheur". J'ai passé à Boston une des années les plus enrichissantes de ma vie, tant au niveau professionnel que personnel.

Vielen Dank an SVOX, in besonderen an meinen Chef, Martin Reber, der sehr verständnisvoll war and mir Urlaub (natürlich für meine Dissertation) bewilligte, auch wenn bei SVOX "gerade alle Dämme brachen" (dixit Norman). Muchísimas gracias al

"latin corner" por vuestras bromas y buen humor. Durante estos momentos con vosotros casi olvidaba lo del "Problem Solving"!

Merci encore à Isabelle, Pierre, Françoise, Antonio et Lena, sans oublier Thierry, pour tous vos commentaires (et critiques!) pendant la préparation de la soutenance. Je vous dois vraiment beaucoup!

Pour finir, et c'est le plus important, merci mille fois à toux ceux qui ont entendu mes

"histoires de thèse" pendant toutes ces années… Merci de m'avoir supportée et encouragée pendant ces sept longues années quand je pensais que "faire une thèse n'était que pure folie" (c'est toujours ce que je pense d'ailleurs…). Désolée de ne pas vous dire merci de manière plus personnelle, mais je ne supporterais pas d'oublier quelqu'un…

Voilà, c'est fini…

(7)
(8)

T ABLE DES MATIERES

I

NTRODUCTION

... 1

C

HAPITRE

1. L

ES VARIABLES TEMPORELLES

... 7

1.1. INTRODUCTION... 7

1.2. DEFINITION DES VARIABLES TEMPORELLES... 8

1.2.1. VARIABLES PRIMAIRES... 8

Variables complexes... 9

Variables simples ... 10

1.2.2. VARIABLES SECONDAIRES... 11

1.2.3. RESUME... 12

1.3. FACTEURS INFLUENÇANT LA PRODUCTION DU DEBIT... 12

1.3.1. FACTEURS TEMPORELS... 12

1.3.2. FACTEURS LINGUISTIQUES ET COGNITIFS... 14

Facteurs linguistiques ... 14

Facteurs cognitifs... 15

1.3.3. FACTEURS SOCIOLINGUISTIQUES... 21

Facteurs liés aux variétés linguistiques ... 21

Facteurs sociaux et extralinguistiques... 24

1.3.4. FACTEURS INDIVIDUELS... 26

1.3.5. RESUME... 26

1.4. FACTEURS INFLUENÇANT LA PERCEPTION DU DEBIT... 28

1.4.1. FACTEURS TEMPORELS... 29

1.4.2. FACTEURS ACOUSTICO-PHONETIQUES... 30

1.4.3. FACTEURS LINGUISTIQUES ET COGNITIFS... 31

1.4.4. FACTEURS SOCIAUX ET EXTRALINGUISTIQUES... 32

1.4.5. PERCEPTION DES PAUSES SILENCIEUSES... 33

1.4.6. RESUME... 34

1.5. INFLUENCE DU DEBIT SUR LE TRAITEMENT DE LA PAROLE... 35

1.5.1. NIVEAUX SEGMENTAL ET SUPRASEGMENTAL... 35

1.5.2. NIVEAU LEXICAL... 38

1.5.3. COMPREHENSION ORALE... 39

1.6. OBJECTIFS DE CE TRAVAIL DE THESE... 44

(9)

C

HAPITRE

2. U

NE ANALYSE DES VARIABLES TEMPORELLES EN

LECTURE

... 47

2.1. INTRODUCTION... 47

2.2. METHODE... 50

2.2.1. SUJETS... 50

2.2.2. MATERIEL... 50

2.2.3. PROCEDURE... 50

2.2.4. ANALYSE DES DONNEES... 51

2.3. RESULTATS ET DISCUSSION... 53

2.3.1. VARIABLES COMPLEXES... 54

Vitesse de parole ... 54

Rapport temps d'articulation-temps de locution (RTATL)... 60

2.3.2. VARIABLES SIMPLES... 63

Vitesse d'articulation... 63

Longueur moyenne des suites sonores (nombre de pauses)... 66

Longueur moyenne des pauses (LMP) ... 70

2.3.3. CONTRIBUTION DES VARIABLES SIMPLES DANS LA VARIATION DE LA VITESSE DE PAROLE... 74

2.4. CONCLUSION... 76

C

HAPITRE

3. L

A PERCEPTION DU DEBIT EN LANGUE SECONDE

... 79

3.1. INTRODUCTION... 79

3.2. METHODE... 85

3.2.1. SUJETS... 85

3.2.2. MATERIEL... 86

3.2.3. PROCEDURE... 88

3.2.4. ANALYSE DES DONNEES... 89

3.3. RESULTATS ET DISCUSSION... 91

3.3.1. PERCEPTION DU DEBIT PAR LES NATIFS ET LES NON-NATIFS... 91

3.3.2. ROLE DE LA COMPREHENSION ORALE DANS LA PERCEPTION DU DEBIT PAR LES NON-NATIFS... 94

Compréhension en fonction du débit... 94

Relation entre le niveau de compréhension et l'estimation du débit.. 96

3.4. CONCLUSION... 97

(10)

C

HAPITRE

4. L'

EFFET DU DEBIT SUR L

'

IDENTIFICATION DES

FRONTIERES LEXICALES

... 101

4.1. INTRODUCTION... 101

4.1.1. IDENTIFICATION DES FRONTIERES LEXICALES... 102

Informations lexicales ... 103

Informations présentes dans la parole ... 105

Contribution des diverses sources d'informations ... 118

Rôle potentiel joué par le débit dans l'identification des frontières lexicales... 122

4.1.2. OBJECTIFS DE CETTE RECHERCHE... 122

4.2. ETUDE DE PRODUCTION... 124

4.2.1. METHODE... 124

Sujets ... 124

Matériel ... 124

Procédure ... 126

Analyse des données... 127

4.2.2. RESULTATS ET DISCUSSION... 127

Ensemble des productions... 127

Sélection des stimuli pour l'étude de perception ... 129

Analyse acoustique préliminaire des stimuli sélectionnés ... 131

4.3. ETUDE DE PERCEPTION... 139

4.3.1. METHODE... 139

Sujets ... 139

Matériel ... 139

Procédure ... 140

Analyse des données... 140

4.3.2. RESULTATS ET DISCUSSION... 141

Identification par type de structure... 142

Analyse des erreurs ... 148

4.4. CONCLUSION... 155

C

HAPITRE

5. L

ES PAUSES SILENCIEUSES DANS LA PAROLE DE SYNTHESE DE

F

IPS

V

OX

:

IMPACT SUR LA COMPREHENSION ORALE ET EVALUATION SUBJECTIVE

... 159

5.1. INTRODUCTION... 159

5.1.1. MODELISATION DU DEBIT ET DES PAUSES EN SYNTHESE DE LA PAROLE.... 160

5.1.2. LE SYSTEME DE PAROLE DE SYNTHESE FIPSVOX... 166

Description ... 166

(11)

Les variables temporelles dans le système FipsVox ... 171

Evaluation du système FipsVox ... 173

5.1.3. ROLE DES VARIABLES TEMPORELLES DANS LA COMPREHENSION DE LA PAROLE DE SYNTHESE... 174

5.1.4. OBJECTIFS DE CETTE RECHERCHE... 177

5.2. METHODE... 177

5.2.1. SUJETS... 177

5.2.2. MATERIEL... 178

Etude de production ... 178

Description de la version originale des textes ... 179

Description de la version modifiée des textes ... 179

Comparaison des deux versions de FipsVox... 181

Mesures acoustiques ... 182

5.2.3. PROCEDURE... 183

5.2.4. ANALYSE DES DONNEES... 184

5.3. RESULTATS ET DISCUSSION... 184

5.3.1. IMPACT DES PAUSES SILENCIEUSES SUR LA COMPREHENSION ORALE... 184

5.3.2. EVALUATION SUBJECTIVE DU SYSTEME DE SYNTHESE FIPSVOX... 189

Evaluation de l'intelligibilité... 189

Evaluation de la prosodie ... 190

Evaluation de la fatigue et de l'effort ... 191

Evaluation des caractéristiques humaines... 193

Evaluation globale ... 194

Analyse globale ... 195

Comparaison des deux versions... 195

Discussion ... 195

5.4. CONCLUSION... 197

C

ONCLUSION GENERALE

... 199

R

EFERENCES

... 211

A

NNEXES

... 233

(12)

T ABLE DES ILLUSTRATIONS T

ABLE DES FIGURES

Figure 1. Thèmes abordés dans le chapitre 1. ... 8 Figure 2. Décomposition du temps de locution... 9

Figure 3. Facteurs affectant la production du débit. Les facteurs en encadré feront l'objet d'une étude expérimentale dans la suite de ce travail de thèse. ... 27

Figure 4. Facteurs affectant la perception du débit. Les facteurs en encadré feront l'objet d'une étude expérimentale dans la suite de ce travail de thèse. ... 34

Figure 5. Distribution de la vitesse de parole aux débits lent, normal et rapide. Les centres de classes (de 15 syll/min) se trouvent en abscisse. ... 54

Figure 6. Distribution de l'accélération et du ralentissement de la vitesse de parole (en %).

Les centres de classes (de 5%) se trouvent en abscisse. ... 59

Figure 7. Distribution du RTATL aux débits lent, normal et rapide. Les centres de classes (de 5%) se trouvent en abscisse... 61

Figure 8. Distribution de la vitesse d'articulation aux débits lent, normal et rapide. Les centres de classes (de 0.5 syll/sec) se trouvent en abscisse. ... 64

Figure 9. Distribution de la longueur des suites sonores aux débits lent, normal et rapide.

Les centres de classes (de 7 syllabes) se trouvent en abscisse. ... 68

Figure 10. Distribution de la durée des pauses aux débits lent, normal et rapide. Les centres de classes (de 100 msec) se trouvent en abscisse. ... 71

Figure 11. Estimations moyennes (données brutes) des débits lent, normal et rapide par les deux groupes, natifs et non-natifs. L'erreur standard de la moyenne est indiquée au- dessus de chaque barre. ... 92

Figure 12. Estimations moyennes (exprimées en logarithmes) des débits lent, normal et rapide par les deux groupes, natifs et non-natifs. L'erreur standard de la moyenne est indiquée au-dessus de chaque barre... 93

Figure 13. Taux de compréhension des non-natifs aux débits lent, normal et rapide. L'erreur standard de la moyenne est indiquée au-dessus de chaque barre. ... 95

Figure 14. Distribution du taux de compréhension (en %) au débit normal (en haut), au débit lent (en bas à gauche) et au débit rapide (en bas à droite)... 96

Figure 15. Représentation hiérarchique des diverses sources d'informations lors de la segmentation lexicale (tirée de Mattys et al., 2005). ... 121

Figure 16. Distribution de la durée totale des séquences (n = 48, 23 hommes et 25 femmes, 36 séquences par sujet). Les centres de classes (de 45 msec) se trouvent en abscisse. .... 128 Figure 17. Durée totale des séquences produites à débit normal plutôt lent et à débit normal

plutôt rapide (8 locuteurs, 36 productions par locuteur)... 130

(13)

Figure 18. Durée totale des séquences (en msec) en fonction du débit (normal plutôt rapide et normal plutôt lent) et du type de structure (C#C, C#V, V#C et V#V). L’erreur standard de la moyenne est indiquée au-dessus de chaque barre. ... 131

Figure 19. Pourcentage d’identification correcte en fonction du débit normal rapide et normal lent. Les barres d’erreurs représentent l’erreur standard des données intra- sujets... 141

Figure 20. Pourcentage d’identification correcte en fonction du type de structure (C#C, C#V, V#C et V#V). Les barres d’erreurs représentent l’erreur standard des données intra-sujets. ... 143

Figure 21. Oscillogramme de la séquence C#C grape pail produite avec relâchement consonantique (A1) et sans relâchement consonantique (B1) et de la séquence V#C gray pale produite par les mêmes locuteurs (A2 et B2, respectivement). ... 153

Figure 22. Oscillogramme de la séquence C#V might ache sans relâchement consonantique (en haut) et de la séquence V#V my ache (en bas)... 154

Figure 23. Structure arborescente de la phrase Pour une raison inexpliquée, une fuite de gaz avait provoqué une explosion dans les égouts de la rue. ... 167

Figure 24. Formation des groupes accentuels (GA) de la phrase Pour une raison inexpliquée, une fuite de gaz avait provoqué une explosion dans les égouts de la rue.

Le nombre de syllabes se trouve entre parenthèses... 169

Figure 25. Formation des groupes intonatifs (GI) de la phrase Pour une raison inexpliquée, une fuite de gaz avait provoqué une explosion dans les égouts de la rue. Le nombre de syllabes se trouve entre parenthèses. ... 170

Figure 26. Représentation du registre, ainsi que de l’emplacement des syllabes (cercles noirs) dans le registre... 170

Figure 27. Taux de compréhension (en %) en fonction des trois textes entendus (TE1, TE2 et TE3) dans la version originale de FipsVox. L'erreur standard de la moyenne est indiquée au-dessus de chaque barre... 185

Figure 28. Taux de compréhension (en %) en fonction des deux versions entendues de FipsVox, originale et modifiée. L'erreur standard de la moyenne est indiquée au-dessus de chaque barre... 185

Figure 29. Evaluation de différents aspects de l’intelligibilité dans les deux versions de FipsVox, originale et modifiée. L'erreur standard de la moyenne est indiquée au-dessus de chaque barre... 190

Figure 30. Evaluation de différents aspects de la prosodie dans les deux versions de FipsVox, originale et modifiée. L'erreur standard de la moyenne est indiquée au-dessus de chaque barre... 191

Figure 31. Evaluation de différents aspects de la fatigue et de l’effort dans les deux versions de FipsVox, originale et modifiée. L'erreur standard de la moyenne est indiquée au- dessus de chaque barre. ... 192 Figure 32. Evaluation de différents aspects des caractéristiques humaines des deux versions

(14)

Figure 33. Evaluation de la qualité globale et de la compréhension globale des deux versions de FipsVox, originale et modifiée. L'erreur standard de la moyenne est indiquée au- dessus de chaque barre. ... 194

Figure 34. Nuage des points représentant la relation entre la longueur moyenne des pauses et le débit (à gauche), ainsi qu'entre la longueur moyenne des pauses et la vitesse d'articulation (à droite). ... 250

(15)

T

ABLE DES TABLEAUX

Tableau 1. Mesures de tendances centrales et de dispersion des variables primaires produites

en lecture. ... 56

Tableau 2. Comparaison des valeurs de tendance centrale (moyenne) pour les variables temporelles obtenues en français lors de diverses activités langagières... 57

Tableau 3. Coefficients de corrélation des rangs de Spearman calculés pour les variables temporelles issues de la lecture à débit normal. Un astérisque signifie que la corrélation est significative à p < 0.05, deux astérisques à p < 0.01 et trois astérisques à p < 0.001... 62

Tableau 4. Coefficients de corrélation des rangs de Spearman calculés pour les variables temporelles issues de la lecture à débit lent. Un astérisque signifie que la corrélation est significative à p < 0.05, deux astérisques à p < 0.01 et trois astérisques à p < 0.001. .. 62

Tableau 5. Coefficients de corrélation des rangs de Spearman calculés pour les variables temporelles issues de la lecture à débit rapide. Un astérisque signifie que la corrélation est significative à p < 0.05, deux astérisques à p < 0.01 et trois astérisques à p < 0.001. .. 62

Tableau 6. Contribution conjointe et influence unique de la modification de la vitesse d'articulation, de la longueur des suites sonores et de la durée des pauses lors de l'accélération et du ralentissement de la vitesse de parole... 75

Tableau 7. Valeurs de trois variables temporelles (débit, vitesse d'articulation et nombre de pauses) des textes expérimentaux (TE1, TE2, et T3, produits aux débits lent, normal et rapide) et des textes de compréhension (TC1 et TC2, produits uniquement à débit normal). ... 87

Tableau 8. Liste des séquences-test... 124

Tableau 9. Durée totale des séquences (en msec) aux débits normal plutôt rapide et normal plutôt lent et durée moyenne en fonction du type de structure (C#C, C#V, V#C et V#V)... 130

Tableau 10. Durée (en msec) des parties vocaliques 1 (premier mot) et 2 (deuxième mot), du silence de plosion, ainsi que du VOT (l'écart-type se trouve entre parenthèses), et résultats des tests-t non-appariés pour le type de structure V#C. ... 132

Tableau 11. Durée (en msec) des parties vocaliques 1 (premier mot) et 2 (deuxième mot), du silence de plosion, ainsi que du VOT de C2 (l'écart-type se trouve entre parenthèses), et résultats des tests-t non-appariés pour le type de structure C#C. ... 133

Tableau 12. Durée du silence de plosion (en msec) de la deuxième consonne (C2) en fonction de la présence de la première consonne (C1) et du débit (l'écart-type se trouve entre parenthèses). ... 134

Tableau 13. Schémas observés lors de la production de C#V... 135

Tableau 14. Schémas observés lors de la production de V#V. ... 136

Tableau 15. Nombre de réponses erronées attribuées à chaque type de structure... 149

(16)

Tableau 16. Proportion de chaque type d’erreur (en %) par rapport au nombre total d’erreurs à l’intérieur de chaque type de structure... 150

Tableau 17. Nombre d'emplacements des silences de la version originale de FipsVox, identiques à ceux de la version modifiée, supplémentaires et omis. ... 181

Tableau 18. Nombre de syllabes, vitesse d'articulation (syll/sec) et débit (en syll/min et en mots/min) pour chaque texte et chaque version. ... 182

Tableau 19. Nombre et durée moyenne des pauses silencieuses pour chaque texte et chaque version. Le nombre de pauses à des emplacements différents se trouve entre parenthèses. ... 183 Tableau 20. Nombre maximal de points par texte... 240

Tableau 21. Mesures de tendances centrales et de dispersion des variables temporelles de l'anglais produites en lecture. ... 247

Tableau 22. Coefficients de corrélation des rangs de Spearman calculés pour les variables temporelles issues de la lecture en anglais (n = 50). Un astérisque signifie que la corrélation est significative à p < 0.05, deux astérisques à p < 0.01 et trois astérisques à p < 0.001... 248

Tableau 23. Fréquence d'occurrence des séquences dans trois corpora (Google, Reuters et WSJ), ainsi que leur nombre total. ... 251

Tableau 24. Nombre d'erreurs observées en fonction de la séquence et du type de structure.

Les erreurs en gras (données brutes et pourcentages) suivent le schéma d'erreur décrit dans le chapitre 4. ... 252

Tableau 25. Durée de silences indiqués et mesurés dans les versions originale et modifiée de TE1 (les silences inter-phrastiques sont indiquées par (.) dans la colonne Emplacement des silences) et différence de durée entre les silences mesurés dans la version originale et modifiée... 258

Tableau 26. Durée des silences indiqués et mesurés dans les versions originale et modifiée de TE2 (les silences inter-phrastiques sont indiquées par (.) dans la colonne Emplacement des silences) et différence de durée entre les silences mesurés dans la version originale et modifiée. ... 259

Tableau 27. Durée des silences indiqués et mesurés dans les versions originale et modifiée de TE3 (les silences inter-phrastiques sont indiquées par (.) dans la colonne Emplacement des silences) et différence de durée entre les silences mesurés dans la version originale et modifiée. ... 260

Tableau 28. Tests statistiques (tests-t appariés bilatéraux) sur la durée des silences indiqués et mesurés. ... 261

Tableau 29. Moyenne des diverses évaluations pour les versions originale et modifiée, différence entre les deux versions et résultats des tests-t appariés unilatéraux (pour une population plus âgée). Un astérisque dans la colonne "Test-t" correspond à une différence significative au seuil de signification p < 0.05, deux astérisques au seuil p < 0.01, trois astérisques au seuil p < 0.001 et n.s signifie qu'il n'y a pas de différence significative. ... 263

(17)
(18)

A J ack y

(19)
(20)

Introduction

Comprendre un énoncé semble, à première vue, une opération relativement simple.

Dans une situation normale, l'auditeur n'éprouve généralement pas de difficultés de compréhension. Cependant, ce processus, à premier abord si trivial, est en réalité bien complexe. Premièrement, l'auditeur doit constamment faire face à l'extrême variabilité observée dans la parole. Cette variabilité peut être de nature acoustique (ex.:

coarticulation, variabilité spectrale), phonologique (ex.: assimilation, effacement du schwa en français), linguistique (ex.: lexique, syntaxe), sociolinguistique (ex.: accent régional) et/ou contextuelle (ex.: situation de parole). De ce fait, l'auditeur doit surmonter le problème potentiel engendré par la multitude de réalisations possibles pour un même énoncé. Le deuxième problème que peut rencontrer l'auditeur est causé par la continuité de la parole. Les mots à l'oral ne sont pas séparés par des "espaces" comme ils le sont à l'écrit. Ainsi, l'auditeur doit "segmenter" la parole continue, en isoler les unités discrètes afin d'accéder à leur signification. Finalement, la parole est "imparfaite".

Elle regorge de bruits parasites, de bruits de respiration, d'hésitations, de fragments de mots ou de phrases, etc. Toutefois, malgré la variabilité, la continuité et "l'imperfection"

de la parole, l'auditeur met en œuvre de manière automatique et rapide des mécanismes

(21)

inconscients, qui lui permettent de comprendre (plus ou moins) aisément le message transmis.

Le débit de parole (appelé également vitesse de parole ou vitesse d'élocution) contribue largement à la variabilité de la parole. En effet, il peut considérablement fluctuer non seulement d'un locuteur à l'autre, mais également au cours d'un énoncé produit par un même locuteur. Ce dernier peut également modifier son débit selon la situation dans laquelle il se trouve (ex.: entretien d'embauche, conversation entre amis, conférence, etc.) ou selon son état émotionnel (ex.: stress, fatigue, joie, tristesse, etc.).

L’intérêt suscité par le débit (et sa variabilité) est né dans les années soixante et depuis lors, son étude a été abordée sous de nombreux angles. Les chercheurs, au fil des ans, se sont penchés par exemple, sur sa description dans diverses langues et lors de différentes tâches, sur sa signification dans la production de la parole ou sur son rôle dans la perception de la parole. De nombreuses études ont également traité de l'influence qu'exerce le débit sur la compréhension, que cela soit en parole naturelle ou de synthèse.

Ainsi, le débit, vaste domaine de recherche tant en production qu'en perception de la parole, a fait et fait encore l'objet de nombreuses études dans diverses disciplines, telles que la psycholinguistique, la linguistique, l'apprentissage d'une langue seconde, ou le traitement du langage naturel.

Il convient ici de donner une brève définition du débit. Selon le dictionnaire du Trésor de la langue française1, le terme "débit" signifiait au XVIème siècle "action d'exposer, de raconter quelque chose", puis au XIXème, il a pris le sens de "quantité produite par unité de temps". La combinaison de ces deux définitions a mené aux définitions

"modernes" (et souvent figurées) suivantes: "manière plus ou moins rapide de s'exprimer oralement" (Trésor de la langue française) ou "rythme et qualité d'élocution"

(Dictionnaire de l'Académie française2).

Ainsi, on remarque que le débit s'apparente étroitement à la notion de rythme, et peut ainsi être considéré comme synonyme de "tempo", dont la définition est la suivante:

1 Voir http://atilf.atilf.fr/dendien/scripts/tlfiv5/visusel.exe?11;s=1086300255;r=1;nat=;sol=0;

2 Voir http://atilf.atilf.fr/Dendien/scripts/generic/showps.exe?p=main.txt;host=interface_academie9.txt

(22)

"allure de l'énoncé (lente, rapide, saccadée) qui est donnée par la fréquence de l'accent rythmique" (Trésor de la langue française).

Lorsque l'on se réfère à ces définitions, l'étude du débit s'inscrit alors dans le cadre plus général de l'étude de la prosodie. Cette dernière, domaine vaste et hétérogène, se caractérise principalement par trois paramètres acoustiques: la fréquence fondamentale (F0), l'amplitude et la durée segmentale. Découlant directement de la durée segmentale, le débit fait par conséquent partie de la famille des variables prosodiques. Ainsi, lorsque le chercheur étudie le débit, il est important qu'il ne l'examine pas uniquement de manière isolée, mais qu'il garde à l'esprit non seulement l'interdépendance des divers paramètres prosodiques (F0, amplitude et durée), mais également le fait que ces derniers n'existent jamais seuls et nécessitent toujours le support des éléments segmentaux et linguistiques (ex.: phones, mots, phrases). Aussi, l'interaction entre les variables prosodiques, ainsi que leur rapport de dépendance avec les éléments linguistiques qui leur servent de support, rendent l'étude du débit particulièrement intéressante et complexe.

Soulignons encore que le débit appartient, au même titre que la vitesse d'articulation ou les pauses, à la famille des variables dites temporelles. Ces dernières, simples ou complexes, peuvent entretenir d'étroites relations entre elles: le débit, par exemple, dépend de la vitesse d'articulation, du nombre ou de la durée des pauses. Ainsi, les recherches présentées dans ce travail ne portent pas uniquement sur le débit, mais traite de l'ensemble des variables temporelles et du lien qui les unit, tant en production qu'en perception.

Nous avons évoqué plus haut la grande diversité et la pluridisciplinarité de l'étude du débit (et des variables temporelles). Ainsi, en raison même de la nature variée des recherches possibles dans le domaine, les aspects traités dans ce travail sont également très diversifiés. Nous chercherons tout d'abord à déterminer quels sont les facteurs qui rendent le débit (et les variables temporelles en général) si variable. Ensuite, nous nous pencherons sur la perception du débit (et donc des variables temporelles), en tentant de dégager les facteurs susceptibles d'être responsables de l'impression de rapidité ou de lenteur que peut éprouver un auditeur en entendant un énoncé. Enfin, comme nous l'avons mentionné plus haut, la continuité de la parole peut rendre le "découpage" des unités d'un énoncé difficile. Nous examinerons ainsi le lien éventuel entre le débit et ce

(23)

"découpage". Plus précisément, nous tenterons de définir dans quelle mesure les variables temporelles affectent la compréhension de séquences pouvant présenter des ambiguïtés (ex.:/tami/ correspondant à grand ami ou grand tamis) ou de passages produits par une voix de synthèse.

Le premier chapitre, théorique, de ce travail présentera une revue de la littérature traitant des variables temporelles. Après une brève description de ces dernières, nous passerons en revue les travaux portant sur leur production et leur perception, plus précisément sur les facteurs déterminants pour les deux processus. Puis, nous présenterons les recherches examinant l'influence des variables temporelles sur le traitement de la parole3, au niveau segmental, suprasegmental, lexical et au niveau de la compréhension. Nous terminerons en exposant les objectifs des études de ce travail de recherche.

Les chapitres 2 et 3 présenteront deux études expérimentales portant sur la production et la perception des variables temporelles, respectivement. Dans le chapitre 2, nous examinerons la production des variables temporelles du français produites en lecture.

Outre une description détaillée de ces dernières, nous présenterons une comparaison de leur comportement à trois débits (lent, normal, rapide), ainsi qu'une comparaison avec d'autres recherches dans le domaine, que cela soit en lecture ou en parole spontanée.

Le chapitre 3 sera consacré à la perception des variables temporelles, plus précisément à la perception du débit en langue seconde. L'étude présentée dans ce chapitre visera à vérifier empiriquement l'impression de rapidité chez les non-natifs d'une langue qui rapportent souvent que le débit dans cette langue est plus rapide que dans leur langue maternelle. Nous examinerons également dans ce chapitre un "nouveau" facteur entrant en jeu dans la perception du débit – la compréhension orale –, facteur qui nous permettra de mieux comprendre la différence entre la perception du débit chez les natifs et les non-natifs.

3 Nous utiliserons, dans ce travail, l'expression "traitement de la parole" comme synonyme de "perception de la parole" par opposition à "production de la parole", et ce, afin d'éviter toute ambiguïté avec l'expression anglaise "speech perception", qui se réfère à l'analyse phonétique mise en œuvre lors du processus de compréhension.

(24)

Les chapitres 4 et 5 examineront le rôle joué par les variables temporelles lors du traitement de la parole. L'étude présentée dans le chapitre 4 portera sur l’impact du débit sur l'identification des frontières lexicales. Elle cherchera à vérifier l'hypothèse selon laquelle l'identification des frontières lexicales est plus difficile à un débit rapide qu'à un débit lent. Pour ce faire, elle se référera aux conclusions des recherches qui ont montré que, d'une part, des informations de différente nature entrent en jeu et contribuent conjointement à l'identification des frontières lexicales et que d'autre part, le débit affecte les caractéristiques acoustiques du signal sonore.

Dans le chapitre 5, nous étudierons, dans un premier temps, l’importance du débit, plus précisément du nombre et de la durée des pauses silencieuses, dans la compréhension de passages produits par le système de synthèse de la parole FipsVox (développé au Laboratoire d’analyse et de technologie du langage de l’Université de Genève). Nous effectuerons, dans un deuxième temps, une évaluation subjective de la qualité de la voix de FipsVox, évaluation inexistante jusqu'à présent. Enfin, nous discuterons, dans la conclusion générale, des principaux résultats et des implications de ce travail.

(25)
(26)

Chapitre 1

Les variables temporelles

1.1. Introduction

L'objectif de ce chapitre est de fournir au lecteur les bases théoriques nécessaires à la bonne compréhension des études présentées dans les chapitres suivants de ce travail.

Pour ce faire, nous présentons tout d'abord une description détaillée des variables temporelles (section 1.2), en suivant l'approche adoptée par Grosjean & Deschamps (1972), qui ont non seulement introduit le terme de "variables temporelles" dans le domaine, mais ont également proposé une répartition de ces dernières en variables primaires et secondaires. Nous passerons ensuite en revue divers facteurs susceptibles d'affecter la production du débit, dans le but de comprendre ce qui rend le débit si variable (section 1.3). Puis, nous examinerons les facteurs qui influencent la perception du débit (section 1.4). En effet, pour quelles raisons un auditeur a l'impression que son interlocuteur parle rapidement ou lentement? Enfin, nous nous pencherons sur

(27)

l'influence exercée par le débit lors du traitement de la parole, plus précisément au niveau segmental, suprasegmental, lexical et au niveau de la compréhension (section 1.5).

VARIABLES TEMPORELLES

(section 1.2)

Facteurs influençant la

PERCEPTION DU DÉBIT

(section 1.4)

INFLUENCE DU DÉBIT sur le traitement de la parole

(section 1.5) Facteurs influençant la

PRODUCTION DU DÉBIT

(section 1.3)

Figure 1. Thèmes abordés dans le chapitre 1.

La Figure 1 ci-dessus permet de bien distinguer les quatre thèmes abordés dans ce chapitre. Afin d'éviter toute ambiguïté, nous rendons le lecteur attentif au fait que la perception du débit, traitée dans la section 1.4, correspond à l'activité métalinguistique qu'accomplit l'auditeur confronté à un certain débit de parole. En d'autres termes, nous examinerons l'impression (de rapidité ou de lenteur) que peut ressentir un auditeur, lorsqu'il entend un certain débit. Le rôle joué par le débit lors de la perception de la parole (entre autres) sera, quant à lui, abordé dans la section 1.5.

1.2. Définition des variables temporelles

1.2.1. Variables primaires

Les variables primaires, contrairement aux variables secondaires, apparaissent automatiquement lorsque nous parlons. Selon Grosjean & Deschamps (1972), elles se divisent en deux classes: les variables complexes et les variables simples, les secondes provenant de la décomposition des premières.

(28)

Variables complexes

La vitesse de parole (appelée plus communément "débit"), première variable complexe, se calcule à partir du temps de locution. Puisque ce dernier se compose du temps d'articulation et du temps de pause (cf. Figure 2), la vitesse de parole traduit la vitesse générale de locution du locuteur et tient donc compte non seulement de la vitesse à laquelle le locuteur articule, mais également du temps de pause produit par celui-ci.

Figure 2. Décomposition du temps de locution.

Le débit s’exprime généralement en syll/min (Grosjean & Deschamps, 1972), mais parfois également en mots/min (Goldman-Eisler, 1968) ou en sons/sec (Gósy, 1991), et s'obtient selon l'Equation 1. Le temps de locution s'exprime ici en secondes.

Equation 1 60

_ _

_

_ ×

= Temps de locution syllables de

Nombre Débit

Notons encore que les syllabes prises en compte dans le calcul du débit (et de la vitesse d'articulation) peuvent correspondre aux syllabes phonologiques (forme canonique des mots, par exemple /smn/) ou phonétiques (forme réalisée par le locuteur, par exemple [smn]).

La deuxième variable complexe, le rapport temps d'articulation-temps de locution (RTATL), donne une indication quant au temps passé à articuler (et inversement à produire des pauses) lors d'une activité langagière. Il permet de déterminer quel phénomène (temps d'articulation ou temps de pause) joue le plus grand rôle dans l'accélération ou le ralentissement du débit, par exemple. Il s'exprime en pourcentage en appliquant l'Equation 2.

Temps de locution

Temps d'articulation Temps de pause

Nombre de pauses Longueur moyenne des pauses

(29)

Equation 2 100 _

_ '

_ ×

= Temps de locution on articulati d

Temps RTATL

Variables simples

La vitesse d'articulation (ou vitesse de phonation) est une première variable simple. Elle dépend uniquement du temps d'articulation (exprimé en secondes) et reflète donc la vitesse à laquelle un locuteur articule un énoncé, sans tenir compte des éventuelles pauses. Elle s'exprime généralement en syll/sec (parfois également en msec/syll), et s'obtient selon l'équation ci-dessous.

Equation 3

on articulati d

Temps

syllables de

Nombre on

articulati d

Vitesse

' _

_ ' _

_ =

Comme nous le constatons sur la Figure 2, le temps de pause est déterminé par deux variables simples: le nombre et la longueur moyenne des pauses. En ce qui concerne le nombre de pauses, Grosjean & Deschamps (1972) mettent en avant que ce dernier dépend fortement de la longueur de l'énoncé (un énoncé long tend à générer davantage de pauses qu'un énoncé court) et proposent donc d'étudier plutôt la longueur moyenne des suites sonores (LMSS), variable qui, elle, ne dépend pas de la longueur de l'énoncé.

La longueur moyenne des suites sonores correspond au nombre de syllabes émises entre deux pauses, ces syllabes pouvant constituer un mot, un groupe de mots, un syntagme, une phrase ou une série de phrases. Bien évidemment, la longueur moyenne des suites sonores dépend du nombre de suites sonores (cf. Equation 4), qui lui-même dépend du nombre de pauses. En effet, étant donné que tout énoncé commence et se termine par une suite sonore, le nombre de suites sonores d'un texte correspond toujours au nombre de pauses additionné de 1 (cf. Equation 5).

Equation 4

sonores suites

de Nombre

syllabes de

Nombre

LMSS _ _ _

_

= _

Equation 5 Nombre_de_suites_sonores=Nombres_de_ pauses+1

En somme, le nombre de pauses et la longueur moyenne des suites sonores constituent deux mesures pour un même phénomène, la deuxième présentant l'avantage de ne pas dépendre de la longueur de l’énoncé. Ainsi, de longues suites sonores révèlent que

(30)

l'énoncé contient peu de pauses, et inversement, de courtes suites sonores traduisent un grand nombre de pauses.

La longueur moyenne des pauses silencieuses (LMP) constitue la deuxième variable simple déterminante dans le calcul du temps de pause (cf. Figure 2). L’étude de cette variable nécessite une définition précise de ce qu'est une pause silencieuse. Pour certains chercheurs, tout silence de plus de 250 msec est considéré comme une pause silencieuse (Goldman-Eisler, 1968; Grosjean & Deschamps, 1975). Pour d'autres, la durée minimale d'une pause silencieuse est de 130 msec (Stuckenberg & O'Connell, 1988), ou de 100 msec (Riazantseva, 2001). D'autres encore (Duez, 1982) la définissent non pas par rapport à un seuil fixe, mais en fonction de chaque locuteur et du style de l'énoncé. En outre, les pauses silencieuses peuvent être de différente nature: pauses de respiration, simples arrêts à des emplacements syntaxiques précis, pauses d'hésitation, chaque type de pauses faisant l'objet de nombreuses études (Grosjean & Deschamps, 1975; Grosjean & Collins, 1979; Grosjean, 1980, par exemple).

1.2.2. Variables secondaires

Ces variables, appelées également phénomènes d'hésitation, n'apparaissent en général que rarement en lecture. Leur présence n'est donc pas automatiquement requise lorsque nous parlons. Les variables secondaires se divisent en quatre groupes: 1) les pauses remplies qui correspondent à tout procédé d'hésitation dans le langage: //, /m/, etc.;

2) les syllabes allongées qui consistent en un prolongement anormal des syllabes en fin de mots; 3) les répétitions (sans nouvelle signification), quelle que soit leur longueur; 4) les faux-départs qui correspondent à tout énoncé interrompu quelle que soit sa longueur.

Mentionnons encore que la plupart des études expérimentales que nous présentons dans les chapitres suivants porte sur les variables temporelles produites en lecture oralisée.

Etant donné que les variables secondaires ne sont que très peu présentes en lecture, elles ne feront donc pas l'objet d'une étude approfondie dans ce travail. Toutefois, le lecteur intéressé par les phénomènes de pauses remplies peut consulter, par exemple, les travaux sur le français de Candea (2000) ou de Duez (2001).

(31)

1.2.3. Résumé

En résumé, cette description des variables temporelles pose les jalons théoriques pour une meilleure compréhension des études présentées dans la suite de ce travail. Elle permet par ailleurs de mettre en évidence les diverses relations de dépendance (ou non) entre les différentes variables temporelles, relations que nous étudierons de manière approfondie au chapitre suivant. Enfin, une telle description nous amène à examiner dans la section suivante les facteurs susceptibles d'influencer la production du débit et de ses composantes (vitesse d'articulation, nombre et durée des pauses). A ce sujet, notons encore que, puisque le débit est une variable complexe qui inclut d'autres variables temporelles, nous utiliserons par la suite, pour des raisons de simplification, le terme "débit" comme synonyme de "débit et ses diverses composantes". Toutefois, si les études présentées traitent spécifiquement de certaines variables temporelles, nous préciserons à chaque fois desquelles il s'agit.

1.3. Facteurs influençant la production du débit

Le débit est très variable et sa production dépend d'un grand nombre de facteurs. En effet, il peut par exemple varier selon le locuteur, la situation et même à l'intérieur d'un énoncé produit par un même locuteur. A ce sujet, O'Connell & Kowal (1983) introduisent la notion de "multi-détermination" grâce à laquelle ils mettent en évidence la difficulté de rendre compte de tous les facteurs influençant le débit. Ils soulignent en outre que l'influence d'un facteur n'exclut pas celle d'autres facteurs.

Les facteurs affectant la production du débit étant très nombreux et particulièrement diversifiés, nous tentons ici de les regrouper en diverses catégories. Notons que cette liste n'est certainement pas exhaustive, et que la classification que nous adoptons ici n'est pas unique, mais ne poursuit que le but de rendre la lecture plus aisée.

1.3.1. Facteurs temporels

Rappelons que le débit est une variable complexe qui dépend de trois variables temporelles simples, à savoir la vitesse d'articulation, le nombre et la durée des pauses.

De ce fait, toute modification de ces dernières variables implique une variation au

(32)

niveau du débit. Selon Lane & Grosjean (1973), une variation de débit dépend d'une modification tant au niveau du temps d'articulation et que du temps de pause.

Cependant, les auteurs ont montré que, pour augmenter son débit, le locuteur changeait beaucoup moins son temps d'articulation que son temps de pause. En effet, le locuteur, désirant doubler son débit, passe deux fois moins de temps à produire des pauses. Ils ont par ailleurs noté que le locuteur, à qui on a demandé de varier son débit, ajoutait ou éliminait des pauses de même durée à des endroits syntaxiques stratégiques et qu'il modifiait nettement moins la durée de ses pauses. Le nombre de pauses semble donc être la variable dont dépend principalement le changement de débit. En d'autres termes, lorsque l'on demande à un locuteur de produire un débit lent, il intègre généralement dans son discours un plus grand nombre de pauses à des emplacements syntaxiques stratégiques (voir également Butcher, 1981).

Grosjean & Collins (1979), quant à eux, ont étudié la variation du débit en fonction des pauses respiratoires et non-respiratoires. Au niveau du nombre des pauses, les résultats ont montré que le nombre des deux types de pauses était similaire à un débit lent, alors que les pauses non-respiratoires diminuaient considérablement à un débit normal, pour presque disparaître à un débit rapide. En somme, la production de pauses n'était pas déterminée uniquement par le besoin de respirer: seul à un débit rapide, le besoin physiologique de respirer contrôlait l'apparition des pauses. En ce qui concerne la durée des pauses, il est apparu que, bien qu'elle diminue pour les deux types de pauses lors de l'accélération du débit, la durée des pauses de respiration restait deux fois plus longue que celle des pauses de non-respiration. Les auteurs ont expliqué leurs résultats par le fait que l'action d'inhaler (lors des pauses respiratoires) demande plus de temps que d'arrêter la phonation (lors des pauses non-respiratoires).

Notons encore que le ralentissement et l'accélération de débit ne doivent pas être considérés comme deux images miroir du même processus. En effet, selon la

"symmetry assumption" (Trouvain, 1999), si la diminution du débit implique un accroissement du nombre et de la durée des pauses, son augmentation entraînerait alors logiquement une diminution de ces deux variables. Toutefois, de nombreuses études ont montré que les mécanismes de ralentissement et d'accélération étaient différents (par exemple, Butcher, 1981, Trouvain, 1999). Nous nous pencherons sur cette question au chapitre 2 de ce travail, dans lequel nous examinerons la modification des diverses

(33)

variables temporelles lors du passage d'un débit normal à un débit lent et d'un débit normal à un débit rapide.

1.3.2. Facteurs linguistiques et cognitifs

Nous présentons ici divers facteurs linguistiques et cognitifs susceptibles d'affecter la production du débit. Soulignons que dans la plupart des cas, ces facteurs ont une incidence sur le débit produit par un même locuteur.

Facteurs linguistiques

Au niveau linguistique, il a été montré que des facteurs que l'on pourrait qualifier de

"structuraux" influencent la production du débit. Par exemple, la recherche de Tiffany (1980) a premièrement révélé que le débit des syllabes (en syll/sec et en phone/sec) variait en fonction de leur structure, le débit étant plus lent pour des structures plus complexes. En outre, plusieurs études ont montré que la longueur de l'énoncé revêtait une importance particulière dans la production du débit. Un énoncé long tend à être produit à un débit plus rapide qu'un énoncé court (Goldman-Eisler, 1954; Malécot, Johnston & Kizziar, 1972; Quené, 2005; Yuan, Liberman & Cieri, 2006). De même, la complexité syntaxique d'un énoncé semble influencer le débit auquel ce dernier est produit (Maner, Smith & Grayson, 2000), surtout au niveau de la durée des pauses (Cook, Smith & Lalljee, 1972; Grosjean, Grosjean & Lane, 1979; Krivokapic, in press).

En effet, plus le contexte syntaxique avoisinant la pause est complexe, plus cette dernière est longue (Ruder & Jensen, 1972). A ce sujet, Grosjean & Collins (1979) ont affirmé que le besoin de respirer ne contrôlait pas l'emplacement des pauses, mais qu'au contraire, la respiration s'ajustait aux emplacements syntaxiques des pauses. Pour le démontrer, ils en ont étudié la distribution linguistique et ont montré que le nombre de pauses respiratoires dépendait du débit et du statut linguistique de leur emplacement. En effet, elles apparaissaient notamment aux nœuds syntaxiques principaux (en fin de proposition, précédant une conjonction, etc.) mais également aux coupures syntaxiques mineures (à l'intérieur des syntagmes). Lorsque le débit augmentait, elles disparaissaient aux coupures mineures pour ne rester plus qu'en fin de proposition. La fréquence des pauses non respiratoires, quant à elle, était également déterminée par le débit et par le statut linguistique de leur emplacement. Apparaissant rarement en fin de proposition,

(34)

elles se trouvaient pour la plupart à des coupures syntaxiques moins importantes, et disparaissaient lorsque le débit s'accélérait. En d'autres termes, le locuteur préférait respirer aux nœuds linguistiques majeurs et produire des pauses sans respirer aux coupures moins importantes. Par ailleurs, la durée des deux types de pauses dépendait également de la syntaxe. Leur longueur diminuait en fonction de leur emplacement: plus l'emplacement était syntaxiquement important, plus la pause était longue.

Facteurs cognitifs

La production du débit est par ailleurs également fortement affectée par des paramètres cognitifs. En effet, l'effort cognitif requis par la tâche effectuée, le niveau de compétence dans la langue, ainsi que certaines pathologies du langage, sont susceptibles d'influencer la production du débit.

Effort cognitif

Le type de discours (parole spontanée, lecture, etc.) produit par le locuteur constitue un facteur crucial dans la production des variables temporelles. Défini par la tâche linguistique accomplie, il détermine l'effort cognitif mis en œuvre lors de l'activité langagière. Les chercheurs ont comparé les variables temporelles non seulement en lecture et en parole spontanée, mais également entre diverses productions en parole spontanée (ex.: interviews, descriptions d'images, etc.), et ce, dans le but de vérifier si la tâche, aisée ou contraignante au niveau cognitif (que ce soit en lecture ou en parole spontanée), engendrait un comportement différent des variables temporelles. Une tâche aisée est une activité langagière qui ne demande qu'un effort cognitif moindre (pas/peu de planification, comme en lecture par exemple), alors qu'une tâche contraignante requiert un effort cognitif considérable (ex.: planification indispensable, comme lors de la description d'images par exemple).

En ce qui concerne la comparaison entre la lecture et diverses productions en parole spontanée, les chercheurs ont mis en évidence de grandes différences dans la production des variables temporelles. L'étude de Hanley, Snidecor & Ringel (1966), par exemple, a fait apparaître un RTATL différent entre la lecture et la parole spontanée (conversation

(35)

à propos de l'avenir professionnel des locuteurs), les locuteurs ne pausant pas autant en lecture qu'en parole spontanée4. Barik (1977), lui aussi, est arrivé à la conclusion que des types de discours différents, et donc des tâches différentes (description d'images, lecture et conférence), engendraient un débit différent. Bien que des analyses statistiques soient impossibles en raison du nombre restreint de sujets pour chaque type de discours, nous pouvons noter que la description d'images, une tâche contraignante au niveau cognitif, entraînait un débit plus lent que la lecture ou la conférence par exemple, toutes deux étant des tâches particulièrement aisées (que cela soit en anglais ou en français).

Lucci (1983), quant à lui, s’est penché sur l’étude du débit et des pauses lors de diverses activités linguistiques en français: conférence, lecture et dialogue. Il a trouvé une différence de débit entre les trois activités, la lecture étant plus rapide que la conférence, elle-même plus rapide que le dialogue. De plus, il a souligné que le débit dans le dialogue chez un même locuteur se caractérisait par une certaine instabilité en comparaison avec la lecture et la conférence. Cette instabilité proviendrait d'une certaine variabilité non seulement dans le temps de pause, mais également dans la vitesse d'articulation. En outre, Lucci (1983) a également remarqué que les pauses en lecture marquaient les principales frontières syntaxiques, tandis que dans le dialogue et la conférence, elles apparaissaient plus régulièrement dans le discours, et ralentissaient ainsi le débit dans le but de faciliter l'encodage. Gustafson-Čapková & Megyesi (2001) et Shim, Chon & Ko (2005) sont également arrivés à cette conclusion pour le suédois et le coréen, respectivement.

En ce qui concerne les études comparant diverses productions en parole spontanée, les travaux de Goldman-Eisler (1968) et de Grosjean & Deschamps (1972, 1973, 1975) ont permis de souligner les différences au niveau de la production des variables temporelles lors de deux tâches: l'interview radiophonique (tâche aisée) et la description de dessins humoristiques (tâche contraignante). Que cela soit pour le français ou l’anglais, les résultats ont révélé une différence de vitesse de parole entre les deux tâches5. En outre,

4 Hanley et al. (1966) ne donnent cependant pas d’indications quant aux autres variables temporelles.

5 Les valeurs pour chaque variable temporelle du français se trouvent dans le Tableau 2 au chapitre 2.

(36)

les autres variables temporelles (complexes et simples) semblent également affectées par le type de discours. En effet, si l’on compare les résultats obtenus par Grosjean &

Deschamps (1972, 1973) pour le français, on note une différence au niveau du RTATL et au niveau des variables simples. En effet, la vitesse d’articulation est plus rapide en interview qu’en description. De plus, les suites sonores (mesure reflétant le nombre de pauses) sont plus longues lors des interviews que lors des descriptions, et les pauses silencieuses sont plus courtes lors des interviews que lors des descriptions. Pour finir, on constate également un comportement différent des variables secondaires lors des deux tâches. En somme, ces résultats font apparaître que le débit et les autres variables temporelles varient en fonction de la tâche, une tâche contraignante requérant un débit plus lent, une vitesse d’articulation plus lente, des suites sonores plus courtes et des pauses plus longues. Cette conclusion semble traduire que, contrairement à l’hypothèse émise par Goldman-Eisler (1968), les opérations cognitives mises en œuvre lors des diverses tâches linguistiques sont différentes.

Or, l’étude de Lass & Clegg (1973) semble contredire les résultats présentés ci-dessus.

En effet, les auteurs ont mesuré le débit produit lors de deux tâches (discours spontané et description d’images) en anglais et n’ont pas trouvé de différence. Le débit lors de la description d’images et du discours spontané était respectivement de 3.38 syll/sec (202.8 syll/min) et de 3.41 syll/sec (204.6 syll/min). Cependant, si l’on compare ces résultats avec ceux des recherches précédentes, on remarque que le débit rapporté par Lass & Clegg (1973) pour le discours spontané était nettement plus lent (204.6 syll/min) que celui obtenu par Grosjean & Deschamps (1975) pour l'anglais, qui était de 254.74 syll/min pour l’interview. Cette différence fait apparaître que les tâches dans les deux études ne sont peut-être pas comparables. En effet, la tâche dans Grosjean &

Deschamps (1975) était très peu contraignante: les locuteurs s’exprimaient spontanément sur leurs principaux centres d’intérêt ou sur leurs activités récentes. Par contre, dans l’étude de Lass & Clegg (1973), les locuteurs devaient parler d’un sujet qu’ils choisissaient parmi une liste de sujets de discussion. Etant donné qu’aucun détail n’est donné quant à la nature des thèmes proposés (cinéma, politique, sport, etc.), il est impossible d’affirmer que la tâche était peu contraignante pour la plupart des locuteurs.

Il se pourrait par conséquent que Lass & Clegg (1973) aient obtenu des débits similaires lors du discours spontané et de la description d’images, parce que leurs tâches étaient toutes deux contraignantes.

(37)

Duez (1982) s'est intéressée aux pauses dans trois types de discours spontané en français: discours politique, interview politique et interview informelle. Elle a souligné qu'étant donné que l'interview informelle était généralement peu préparée, elle engendrait des pauses plus nombreuses et plus longues que l'interview politique. Quant au discours politique, le temps de pause était nettement plus important que dans les deux autres types de discours. Elle a expliqué ses résultats en mettant en évidence la fonction stylistique des pauses dans le discours politique, une activité langagière bien particulière visant à persuader l'audience (voir également Deese (1980) pour une conclusion similaire).

Tauroza & Allison (1990) ont, quant à eux, mesuré le débit en anglais lors de quatre tâches: transmissions radiophoniques, conversations spontanées, interviews et conférences adressées à un public non-natif. Ils ont obtenu des résultats différents selon la mesure utilisée pour comparer les débits (mots/min ou syll/min). En effet, les mesures en mots/min ont montré un débit différent pour chaque type de parole (160.4 mots/min lors des transmissions radiophoniques, 208.7 mots/min lors des conversations, 187.0 mots/min lors des interviews et 141.7 mots/min lors des conférences). En revanche, les mesures en syll/min ont révélé que les transmissions (249.3 syll/min), les conversations (263.3 syll/min) et les interviews (250.9 syll/min) formaient un groupe homogène quant au débit et différaient des conférences (194.5 syll/min), résultat peu surprenant étant donné que les conférences étaient destinées à un public non-natif et que par conséquent, le débit en était ralenti. Il apparaît donc que les transmissions, les conversations et les interviews requéraient un effort cognitif similaire et que, par ailleurs, en comparaison avec les résultats de Grosjean & Deschamps (1975), elles constituaient toutes des tâches cognitives peu contraignantes. Les auteurs ont également souligné que la mesure du débit en mots/min ne semblait pas appropriée, étant donné la différence de longueur de mots dans les diverses productions étudiées.

Toujours en rapport avec l'effort cognitif requis par la tâche linguistique effectuée, Schilperoord & Sanders (1997) ont étudié le temps de pause à l'intérieur d'un énoncé (lettre professionnelle enregistrée par un avocat pour sa secrétaire) en fonction de la structure discursive de ce dernier. Ils ont montré qu'une relation existait entre la structure hiérarchique du discours (déterminée par le degré de transition entre les

Références

Documents relatifs

Je peux saisir les in{ormations essentielles et les comprendre dans des textes simples de la v¡e quotid¡enne, par exemple des brochures infomatives ou publi-

Pour actionner le levier de conduite pour la marche arrière, la courroie doit être tendue et la roue de friction séparée de la poulie de friction.. Si ces conditions

La fréquence fondamentale, calculée pour des locuteurs féminins du groupe UPP, est mesurée plus basse, en post-opératoire 2, que celle mesurée à partir des

L’étude empirique sur l’assimilation de voisement en français présentée dans cette thèse a pour principal objectif de démontrer que les deux mécanismes cognitifs proposés,

En travaillant avec la vidange en hauteur, prévoir une sécurité pour le collecteur à poussières en cas de perte brusque de pression dans le circuit hydraulique (suite à une

Il y a encore vingt ans, on tirait les rois uniquement le 6 janvier, mais aujourd’hui, on mange de la galette de façon quasi ininterrompue, du 2 au 15 janvier. Les boulangers

Tous les germanophones auront pourtant compris que d'un côté, on peut aller à Toulouse, et de l'autre côté, on peut y aller… aussi, ces quatre lettres (Auch) se prononçant

c’est là qu’habite Bent Osterman, le père de Sebastian et là-haut c’est la maison de Marianne Rosén, la mère de Lina, il y a un conflit au sein de la famille qui dure depuis