• Aucun résultat trouvé

Chapitre 1 Évolution historique et définitions

1.2 Universalité et ampleur du phénomène

1.2.1 Présence dans le discours oral et écrit

L’une des plus grandes contributions de la linguistique de corpus est, sans doute, d’avoir mis en avant que certains mots se trouvent fréquemment associés à d’autres, le plus souvent les mêmes. Les expériences sur des corpus de langue écrite ou orale ont permis d’extraire des suites de mots récurrentes, comme par exemple dans les discours politiques, et même dans des textes littéraires. Les domaines spécialisés, comme entre autres - la santé, l’informatique, l’ingénierie, l’aviation – regorgent d’expressions spécifiques. A l’oral, certains chercheurs ont montré aussi qu’en situation de production intense, les locuteurs font une utilisation quasi totale des séquences préfabriquées sur lesquelles ils s’appuient fortement pour parler en temps réel et parfois limité. Kuiper et Haago (1984) constatent que les commissaires-priseurs ont à leur disposition un répertoire de séquences, adaptées à chaque étape de la vente aux enchères, qui leur permet d’organiser en temps limité la vente avec un maximum d’efficacité. Les reportages sportifs (Kuiper, 1991) sont un exemple aussi très révélateur de la place des phrases toutes faites dans la langue. Les journalistes sportifs les utilisent pour commenter en temps réel et sous la contrainte du direct une partie de tennis, un match de football ou toute autre manifestation sportive.

Une large partie de la langue se trouve donc être préconstruite, c’est-à-dire composée d’ensembles de mots, aussi bien à l’oral qu’à l’écrit. C’est pourquoi des chercheurs (Pawley et Syder, 1983, Nattinger et DeCarrico, 1992 ; Hickey, 1993 ; Bardovi-Harlig, 2010 ; Wood, 2006 ; Yorio, 1989) ont reconnu l’importance des séquences « préfabriquées » dans le langage, que ce soit en langue maternelle (désormais L1) ou en langue étrangère (désormais L2) . En L1, les locuteurs font un usage plus ou moins important de formules déjà prêtes à l’emploi ou d’ensembles composés de mots préférés à d’autres équivalents. Et en effet, il semblerait étrange à un natif d’entendre « comment va l’état actuel de votre santé ? » à la place du rituel « comment allez-vous ? ». En L2, pour parler comme un natif, l’apprenant devra mémoriser un certain nombre d’expressions car « une grande partie de la capacité d’une

12 « La linguistique de corpus : une alternative [version abrégée] », Semen [En ligne], 27 | 2009, mis en ligne le 01 juin 2009, consulté le 05 juillet 2014. URL : http ://semen.revues.org/8914.

34

personne à se débrouiller avec la langue vient de la maîtrise d’expressions préfabriquées »13 (Fillmore, 1979 : 92). Ces expressions ne sont pas forcément des séquences idiomatiques ou figées, mais des séquences privilégiées des natifs parmi d’autres, tout aussi correctes linguistiquement (Pawley et Syder, 1983), considérées comme préfabriquées compte-tenu surtout de leur valeur socio-pragmatique. On trouve par exemple des formules liées à une situation « comment ça va ? joyeux anniversaire » ou des expressions comme « ça marche !

ça m’est égal », etc. Pawley et Syde

r (1983 : 213) estiment notamment à plusieurs centaines de milliers le nombre de séquences préfabriquées en L1 chez un locuteur anglais adulte. Jackendoff (1995), à partir d’un petit corpus de langue orale relevé lors d’une émission de TV, arrive à la conclusion que la proportion de séquences préfabriquées est égale sinon plus importante dans le lexique que celle des mots simples. Pour Mel’çûk (1993 : 83), les locuteurs experts de français produisent naturellement des expressions, appelées phrasèmes, qu’il estime à des dizaines de milliers. Il ne relève pas moins de vingt et une séquences dans une page et demie d’un célèbre journal, ce qui tend à démontrer l’importance du langage formulaïque aussi à l’écrit. En L1, Wray et Perkins (2000 : 1-2) évaluent à 70% la part du LP à l’oral. Erman et Warren (2000 : 37) trouvent, de leur côté, 58% de langage préfabriqué à l’oral, et 52,3% à l’écrit, (avec plus de formules discursives à l’oral et plus de séquences lexicales à l’écrit). Et trente pour cent des mots consistent en « paquets lexicaux » selon Biber et Conrad (1999). La part du langage préfabriqué représenterait environ un tiers de la production orale des locuteurs natifs lors d’une tâche non planifiée, soit précisément 32,29% du discours (Foster, 2001 : 85) en L1, et seulement la moitié, soit précisément 16,83% chez les locuteurs non-natifs pour la même tâche. Foster (2001) constate aussi que les locuteurs non-natifs utilisent plus de SP (17,23% vs 16,83%) lors d’une tâche planifiée et les locuteurs natifs moins (25,08% vs 32,29%), c’est-à-dire que les natifs s’appuient dans ce cas moins sur le LP et produisent un langage plus créatif. Mais Foster ne s’intéresse qu’à un type de SP, les phrases lexicalisées identifiées par des juges natifs.

Dans certaines études, en L2, on peut trouver des proportions plus grandes encore. Oppenheim (2000 : 228) estime, à partir d’un corpus oral, entre 48% et 80% (moyenne de 66%) la présence de « séquences récurrentes » dans le discours de locuteurs non-natifs, ce qui représente les deux tiers de leur production. Si les objectifs et donc les comptages ne sont pas

13 « […] I believe a very large portion of a person’s ability to get along in a language consists in the mastery of formulaic utterances. » (Fillmore, 1979 : 92)

35

tous les mêmes selon les chercheurs, ces chiffres montrent bien que le LP représente une part importante du discours aussi bien à l’oral qu’à l’écrit, en L1 et aussi dans une proportion à peine plus réduite en L2, chez des locuteurs très avancés. On peut sans doute expliquer les écarts de chiffres par des approches différentes du langage préfabriqué : par exemple, Biber et Conrad (1999), Biber (2004) ne recherchent qu’un type de séquences, « les paquets lexicaux » ou lexical bundles qui sont des blocs composés de trois ou quatre unités, quelque chose

comme, comme tu sais, plus ou moins, dans des textes avec des registres spécifiques ; alors

que d’autres chercheurs considèrent le LP dans son ensemble.

Notons que la plupart des recherches citées ont été entreprises sur des corpus en langue anglaise. Cependant, si le LP semble largement attesté en anglais et en français (Mel’çûk, 1993, 2011), à un certain niveau de maîtrise, il a également été observé dans de nombreuses langues (Conklin et Schmitt, 2008). Si on ne détient pas encore de preuve chiffrée que le LP soit un trait universel des langues, néanmoins, l’existence de ce phénomène langagier dans de nombreuses langues, souvent très éloignées comme l’hébreu et l’anglais par exemple, suggère que c’est un phénomène universel. Et même en langue des signes, des formes préfabriquées sont attestées, malgré un mode de transmission totalement différent des langues vocales. En effet, en langue des signes, il existe des signes lexicaux associant une forme à un sens et qui correspondent aux expressions préfabriquées de la langue vocale (Johnston et Schembri, 2010). Un signe se lexicalise lorsque dans une unité signée la forme est régulièrement associée à un sens (Johnston et Ferrara, 2013 : 229)14. Par exemple, la séquence maison du

handicap (mot composé) réunit en langue des signes française (LSF) deux signes maison et handicap qui sont réunis en un seul signe.15

1.2.2 La préfabrication : un vaste choix de termes

Si le langage préconstruit ou préfabriqué est largement attesté, il se trouve qu’il n’est pas si simple de le décrire précisément. En effet, les chercheurs dans ce domaine ne travaillent pas

14

« Specifically, lexicalization in SLs occurs when a signed unit acquires a clearly identifiable and replicable citation form which is regularly and strongly associated with a meaning. The meaning is unpredictable and/or more specific than that implied by the value (meaning) that each component may contribute to the overall form of the signed unit. » (Johnston et Ferrara, 2012 : 229)

15

Nous remercions vivement Brigitte Garcia, professeur à l’université Paris 8, pour nous avoir expliqué les grandes lignes de la LSF et le figement en LSF.

36

tous sur les mêmes types de séquences et ils n’utilisent pas une même terminologie pour les désigner. Ainsi, Wray (2002 : 9) recense plus de cinquante termes pour décrire le phénomène. Provenant du domaine de la linguistique, de la sociolinguistique, de la psycholinguistique et de la didactique des langues, voici pêle-mêle quelques termes qui ont été utilisés en anglais et en français pour référer à ces suites de mots - phrasillons (Tesnière, 1965) ; prefabricated

routines (Brown, 1973) ; holophrases (Corder, 1973) ; prefabricated patterns (Hakuta, 1974) ; preassembled speech (Bolinger, 1975) ; gambits (Keller, 1979) ; formulaic expressions, formulaic speech (Wong-Fillmore, 1979) ; conventionalized forms (Yorio, 1980) ; memorised sentences, lexicalised stems, sentence stems (Pawley et Syder, 1983) ; formulae (Raupach,

1984) ; composites (Cowie, 1988) ; formulaic chunks (Widdowson, 1989) ; multiword units (Sinclair, 1991) ; lexical phrases (Nattinger et DeCarrico, 1992) ; lexical chunks (Lewis, 1993) ; formulas (Ellis, 1994) ; phrasèmes (Mel’çûk, 1995) ; séquences figées (Mejri, 2004)

prefabs (Erman et Warren, 2000) ; formulaic language, formulaic sequences (Wray, 2002) ;

unités lexicales préconstruites (Grossmann et Tutin, 2003) ; séquences préfabriquées (Forsberg, 2006) ; unité de construction préformée (Schmäle, 2013).

Tous ces termes désignent des facettes du même phénomène et recouvrent un vaste domaine, parfois aux frontières du lexique et de la grammaire. Voici quelques exemples de séquences préfabriquées en français à l’oral comme à l’écrit, qui montrent la diversité et l’étendue du phénomène : Quoi qu’il en soit ; Aussi vieux que le monde ; A prendre et à laisser ; ça

marche ; bien à vous ; c’est ça ; je pense ; mais encore ; Tu connais la meilleure ? Ça jamais ! Suite à ma lettre du… Toutes mes félicitations ; Ah bon ? à votre tour ; grande tristesse ; sans foi ni loi ; roi maudit ; Qui peut le plus peut le moins ! Cette liste regroupe

aussi bien des collocations, des formules conventionnelles, des expressions phatiques, que des expressions ou phrases moins figées. Si tous ces termes renvoient à la notion de préfabrication, on peut cependant distinguer différents types de séquences que l’on regroupe sous le même terme, mais qui n’ont pas toutes la même fonction ni les mêmes critères d’identification. Pendant longtemps, la phraséologie s’est surtout intéressée au figement et à l’irrégularité syntaxique ou sémantique des expressions. Nous présentons dans la section suivante la phraséologie en linguistique française et sa relation au figement.