• Aucun résultat trouvé

Chapitre 5 Méthodologie

5.6 Classement des séquences préfabriquées

Une fois les SP identifiées, il est nécessaire de les classer. Là encore, la tâche est ardue pour le chercheur. Quelle typologie adopter et selon quels critères ? Dans le chapitre 1, nous avons distingué plusieurs catégories de SP. Une SP peut être une collocation (beurre rance), un syntagme attesté ou plus ou moins figé (de temps en temps), une phrase lexicale ayant une fonction pragmatique (ça va ? qu’est ce qui se passe ?) (Nattinger et DeCarrico, 1992 : 36), un patron qui admet des variations <plus…plus>, <non seulement…mais encore>, <de…

140

en…>. Une SP peut être une expression idiomatique conventionnelle ou pas, ou une

métaphore apprise et récupérée de façon holistique puisque ni la génération ni la traduction mot à mot d’une langue à l’autre n’est possible (avoir l’air, être en train de, avoir sommeil,

tant pis). Une séquence peut être une phrase ou une expression récurrente que le locuteur a

mémorisée. Elle semble donc relever de la mémorisation et donc de la récupération holistique à partir du lexique mental plutôt que de la génération ou création ou fabrication suite à l’application d’une règle grammaticale. Alors comment classer ces séquences qui correspondent finalement à des situations d’emploi diverses et qui ont des fonctions différentes dans le discours ?

En grammaire, le classement des mots ou unités simples se fait normalement et facilement en classes grammaticales. Il n’en est pas de même lorsqu’on parle de SP. Les séquences peuvent être a) des collocations construites autour d’un verbe (faire le pont), d’un nom (moteur à

essence), b) des phrases (les bons comptes font les bons amis), c) des phrases toutes faites non

verbales (à bientôt, sous peu). Les expressions peuvent être plus ou moins opaques et plus ou moins figées. On pourrait donc les classer en fonction de leur degré d’opacité sémantique. D’une part, les expressions sémantiquement transparentes et, d’autre part, les expressions sémantiquement opaques ; ou en fonction de leur degré de figement, les expressions soient totalement contraintes, soit semi-contraintes, soit libres.

Il serait possible aussi de les distinguer selon leur catégorie, c’est-à-dire comme nous l’avons fait dans notre partie théorique, en collocations, expressions conventionnelles et discursives, constructions, phrases idiomatiques, etc. Lorsqu’on étudie le langage préfabriqué en acquisition L2 et qu’on a des sujets de niveau débutant, on ne doit pas s’attendre à trouver des phrases idiomatiques ou figées comme, par exemple casser sa pipe ou une hirondelle ne fait

pas le printemps. Il serait donc improbable de classer les séquences selon les catégories de la

phraséologie (chapitre1), car en L2 on trouve très peu de séquences de ce type. Si on devait prendre en compte tous ces paramètres, il ne fait pas de doute que le classement serait complexe. S’il fallait classer les séquences polylexicales, il faudrait, en effet, avoir recours à des analyses linguistiques pointues (Pecman, 2004). Cependant nous avons précisé que notre recherche se situe en-dehors du cadre phraséologique traditionnel. Nous nous situons plutôt du côté des psycholinguistiques pour qui une séquence préfabriquée est une séquence qui répond à certains critères mais dont le rôle est de faciliter le traitement langagier.

Il ne faut donc pas négliger l’importance des recherches en psycholinguistique qui mettent l’accent sur le rôle des séquences pour un locuteur. L’on peut trouver chez un seul locuteur un

141

type de séquence qu’il pourra ou pas sur-employer et qui ne répondra pas toujours, et loin s’en faut, aux seuls critères de figement ou d’idiomaticité.

Doit-on alors classer les séquences selon leur forme (approche formelle) ou selon leur fonction (approche fonctionnelle) dans le discours ? Il n’est pas facile de choisir entre l’une ou l’autre approche car dans chaque cas on risque de trouver des SP qu’on ne peut ranger dans telle ou telle catégorie.

Nous avons donc identifié les SP selon une approche mixte, influencée par les recherches antérieures en L2 (Erman et Warren, 2000 ; Forsberg, 2006) et une approche plus récente (Cordier, 2013). Nous avons relevé dans le corpus les SP selon un certain nombre de critères tout en ayant à l’esprit le rôle qu’elles jouent dans le langage (facilitation du traitement langagier et meilleure fluidité). Aussi, pour notre corpus de productions orales L2, notre typologie sera à la fois formelle et fonctionnelle. Nous avons classé les séquences préfabriquées en trois grandes catégories (Annexes 3 et 4).

A. les séquences lexicales, SP lexicales (Forsberg, 2006) ou SP « référentielles » (Cordier, 2013) qui servent à nommer (objets, actions), à identifier les objets du monde, à exprimer le temps, l’espace ;

B. les séquences discursives qui se répartissent en deux sous-catégories.

i. les séquences qui servent a) à construire le discours, les organisateurs (au premier plan, au

début, à la fin), b) à relier des phrases (parce que) ou c) des parties du discours (et après),

ii. les séquences qu’on appelle « remplisseurs », utilisées comme stratégie pour gagner du temps (j’sais pas) et d’appui (islands of reliability, Dechert et al., 1984) pour avancer dans la production.

C. les séquences grammaticales qui comprennent des constructions de phrase

(sentence-builders, au sens de Nattinger et DeCarrico, 1992), composées d’une partie fixe et d’une

partie libre (je crois que + proposition, ou un groupe du type, à la fin de + GN, mais aussi des outils qui servent à relier les mots entre eux (à cause de).

Aussi, pour classer les séquences préfabriquées identifiées, nous avons adapté les typologies de Forsberg (2006, 2008) et de Cordier (2013). Forsberg s’est largement inspirée de la classification d’Erman et Warren (2000) en l’adaptant au français. Cordier ne suit pas exactement la même typologie même si l’on peut rapprocher la catégorie des SP référentielles à celle des SP lexicales de Forsberg, la catégorie des SP métadiscursives à celle des discursives. En revanche, la catégorie des SP grammaticales, beaucoup moins étendue chez Forsberg (2006), comprend la catégorie des constructions de phrases « sentence-builders »

142

chez Cordier (2013). Malgré quelques sous-catégories en commun, elles présentent des différences. L’ensemble des sentence-builders, terme emprunté à Nattinger et DeCarrico (1992) ou « cadres collocationnels » selon Bolly (2010), comprend toutes les constructions de phrases composées d’une partie fixe suivie d’une partie variable. Cordier se place, nous semble-t-il, dans une perspective plus constructionnelle. Nous pensons aussi que la catégorie grammaticale telle qu’elle apparaît chez Forsberg est ambiguë car elle comprend exclusivement les mots-outils reliant des mots entre eux, des adverbes de quantité ou des marqueurs d’aspect. Leur identification reste strictement grammaticale. Si nous avons choisi la terminologie de Forsberg, pour des raisons strictement pratiques, nous avons en revanche adopté en partie le classement de Cordier que nous avons adapté à notre corpus. Nous avons relevé aussi un certain nombre de séquences qui pourraient correspondre aux « paquets lexicaux » (lexical bundles) dont parle Biber et collègues (2004). Ces « paquets lexicaux » seront classés selon notre typologie en séquences lexicales il comprend pas pourquoi, ça

s’appelle, en séquences grammaticales “venir de + verbe” (je viens de voir), je pense que, je crois que, il peut pas, et en séquences discursives je sais pas quoi, ça y est.

Ce classement permet de ne pas entrer dans les distinctions purement descriptives de figement et d’idiomaticité, de collocations lexicales ou grammaticales - le point de vue adopté étant moins linguistique que psycholinguistique.

Nous présentons notre typologie qui comprend les trois grandes catégories de SP, lexicales, grammaticales et discursives annoncées.

5.6.1 Les SP lexicales

Conformément à Erman et Warren (2000) et Forsberg (2006), les séquences lexicales (SP lex) sont des séquences qui ont un contenu référentiel. Elles renvoient à une idée ou quelque chose que l’on a identifiée et que l’on peut se représenter. Elles ont un contenu extralinguistique. Nous avons classé les différentes SP lexicales d’un point de vue syntagmatique. On peut reconnaître des collocations lexicales classées en différents types de syntagmes. Nous donnons dans le tableau 3 suivant quelques exemples extraits de notre corpus.

Syntagmes nominaux journée de voyage, maison de campagne

Syntagmes adjectivaux étonné de, divisé en

Syntagmes verbaux faire la sieste, commencer à, se réveiller

Syntagmes adverbiaux en bois, à ce moment-là

Syntagmes prépositionnels à la maison, à l’intérieur

143

se passe

Tableau 3. Séquences lexicales 5.6.2 Les SP discursives

Les SP discursives (SP disc) n’ont pas de contenu propositionnel ni extralinguistique. En revanche, elles permettent d’organiser le discours et sont donc liées aux mots de contenu contrairement aux SP grammaticales (SP gram) que l’on trouve à l’intérieur des constructions syntaxiques et qui sont dépendantes de la structure dont elles participent. C’est ce que disent en substance Erman et Warren (2000 : 43) qui distinguent la préfabrication grammaticale de la préfabrication pragmatique, les séquences de type pragmatique apparaissant en-dehors de la structure grammaticale.66

En ce qui concerne les deux catégories proposées par ces auteurs, les remplisseurs et modificateurs et les organisateurs, la distinction n’est pas toujours facile à établir dans certains cas ; et il se peut que certaines formules puissent être classées dans les deux catégories selon le contexte où elles apparaissent. Les SP pragmatiques ou discursives organisent le discours : on trouve dans cette catégorie des connecteurs qui « sont des items qui servent à lier les propositions entre elles mais qui de ce fait ne font pas corps avec elles » (Riegel et al. 2004 : 617). On peut d’ailleurs à l’écrit les remplacer par la ponctuation (parce

que par deux points [:] par exemple).

Des catégories discursives de la typologie de Forsberg (2006), nous avons gardé les marqueurs textuels et les marqueurs autorégulateurs, les marqueurs interactifs étant sans pertinence pour nous étant donné qu’il n’y avait pas de tâche d’interaction. La séquence c’est, qui apparaît très fréquemment dans notre corpus, peut être classée dans les trois catégories, tout dépend du contexte d’emploi. C’est, séquence discursive est une séquence produite dans une intention discursive, soit répétée (c’est c’est) afin de trouver la bonne séquence, c’est

c’est drôle la conclusion, soit comme appui pour permettre la planification. Nous

développerons une section sur la séquence c’est dans le chapitre 9 consacré aux séquences sur-employées de notre corpus.

Les marqueurs textuels permettent de structurer l’énoncé, de marquer des liens entre les idées et de lier les énoncés entre eux. Les marqueurs textuels correspondent à la fonction d’organisation chez Raupach (1984). Fernandez (1994 : 31) les définit comme des particules qui « relient entre elles des parties du texte » par exemple des connecteurs de conjonction, des connecteurs adverbes.

66 Notre traduction de « Pragmatic prefabs […] differ from grammatical prefabs in that they may occur outside the syntactic structure. » (Erman et Warren, 2000 : 43).

144

Les discursives « autorégulateurs » (je pense, j’sais pas, etc.) n’ont pas de fonction dans la structuration du discours mais dans la planification. Elles permettent au locuteur de s’accorder une pause lexicale pour planifier ou pallier un manque lexical. Elles peuvent aussi être des îlots de sécurité (islands of reliability, Dechert, 1984) qui permettent de soutenir une certaine fluidité.

Ces séquences utilisées souvent à l’oral peuvent parfois devenir très présentes dans le discours d’un apprenant qui les utilisera de façon récurrente et idiosyncrasique, selon son niveau en L2. Elles servent à planifier le discours à la manière d’une pause remplie (euh, hein,

hum) et/ou à remplir un espace qui serait un vide autrement.

5.6.3 Les SP grammaticales et les constructions

Elles n’ont pas toutes un contenu extralinguistique à la différence des SP lexicales. Ce sont des mots fonctionnels qui a priori n’ont pas de sens de contenu, mais qui peuvent avoir un sens indéfini. Elles servent à organiser les mots dans le groupe syntagmatique. Dans cette catégorie sont classés les pronoms indéfinis (n’importe où, quelque chose, les uns les autres), des expressions de quantité ou de degré (

très) des marqueurs d’aspect (vient de, être en train de, va + Vinf). Contrairement aux SP

discursives qui sont liées à des mots de contenu, les SP grammaticales apparaissent à l’intérieur des constructions syntaxiques et sont dépendantes de la structure à laquelle elles participent. C’est ainsi que Erman et Warren (2000 : 43) distinguent la préfabrication grammaticale de la préfabrication discursive ou pragmatique.

Nous avons aussi classé des séquences qui peuvent, au regard de la grammaire constructionnelle, être considérées comme des constructions telles que « de fleur en fleur » où la construction de…en marque le déplacement d’un lieu à un autre, on peut remplacer fleur par d’autres unités (pays, ville, village, maison, etc.). Cependant, cette construction n’apparaît qu’une seule fois et dans le corpus natif.

Les formes du futur périphrastique « aller au présent + Infinitif » sont des SP grammaticales. Le verbe aller (se déplacer), qui a perdu son sens de mouvement et s’est grammaticalisé (Bolly, 2010), est considéré comme une construction véhiculant un sens, ici le futur proche. De nombreuses occurrences de cette construction à la troisième personne (il) va + V sont présentes dans le corpus. Bolly (2010) définit la grammaticalisation comme un phénomène diachronique où certaines unités lexicales vont, dans le temps, acquérir une fonction grammaticale. Par exemple, le mot latin « homo », être humain, s’est grammaticalisé en

145

pronom impersonnel « on » et certaines unités, comme le verbe de mouvement « aller », vont acquérir une fonction davantage grammaticale. Il forme ainsi un « cadre collocationnel » avec le verbe infinitif qui le suit et nous le considérerons donc comme une SP.

Les séquences du type « la fin de », « le début de » font partie de cette catégorie des constructions qui structurent la narration. C’est et il y a suivis d’un nom ont été classés dans cette catégorie des constructions à l’instar de Cordier (2013). Les structures qui introduisent des propositions, je pense que, et souvent adaptées au récit à la troisième personne, il pense

que, il sait que, il trouve que, ont été classées également dans la catégorie des constructions.

5.6.4 Les SP déviantes

Enfin, nous avons relevé à l’intérieur de ces trois catégories les « séquences déviantes » (Annexe 8), c’est-à-dire comportant divers types d’erreurs. Ces séquences faisant partie de l’interlangue des apprenants (Selinker, 1972), seront considérées comme des SP, et ce malgré leur forme déviante. Un même locuteur peut les produire une ou plusieurs fois dans sa production. D’après Forsberg (2006 : 60-61), on trouve deux types de SP déviantes ou interlangagières. Ce sont soit des combinaisons natives « utilisées de manière non native (la

Monique j’adore le tennis pour Monique adore le tennis) soit elles ont une combinaison

non-native et sont répétées dans cette même forme à plusieurs reprises. » Les séquences déviantes peuvent aussi provenir d’une erreur morphologique, lexicale, ou phonologique. Elles auraient été mémorisées sous une forme erronée.

Toutes les séquences idiosyncrasiques ou déviantes ont été relevées. Nous avons supposé que les productions erronées qui sont conformes à un ou plusieurs de nos critères étaient pertinentes pour notre recherche. Par exemple, rien n’empêche qu’une SP mal perçue de la part de l’apprenant puisse être mémorisée et récupérée de façon holistique par ce dernier (comment dire perçu comme *comment dit ; qu’est-ce qu’il se passe perçu comme *qu’est-ce

qu’il passe). Dans une étude très récente, Forsberg-Lundell et collègues (2014) utilisent le

critère de « déviances morphosyntaxiques » qui, associé à d’autres critères comme la longueur du segment de parole et l’utilisation de séquences préfabriquées, permet d’évaluer un type de locuteurs très avancés pouvant passer « pour des natifs » (near-native speakers).

Les SP déviantes ont été classées dans chaque catégorie (lexicale, discursive ou grammaticale) et n’ont pas fait l’objet d’une catégorie à part. Bien évidemment, une SP erronée peut aussi être due au stress causé par la situation du compte-rendu qui reste malgré tout artificiel, où l’apprenant devait parler devant un enregistreur tout en s’efforçant de

146

restituer l’histoire du mieux qu’il pouvait. Comme pour les autres SP, le facteur de la fréquence n’a pas été pris en compte dans le but de qualifier telle ou telle séquence comme déviante. Dans cette recherche même un hapax a été compté. Pour cela, il suffisait que la SP erronée rappelle sans difficulté la SP correcte. D’autre part, nous avons relevé chez nos sujets un suremploi de certaines séquences. On peut sans doute considérer que quelques séquences seront typiques des apprenants en fonction de leur L1 mais aussi de la façon dont ils ont acquis la langue, de l’enseignement qu’ils ont reçu, ou tout simplement des situations où ils les ont entendues. Nous signalons les séquences déviantes par un astérisque.