• Aucun résultat trouvé

3. COLLOCATIONS: CONCEPT, APPROCHES ET CRITÈRES DÉFINITOIRES

3.3. Collocation: critères définitoires

Dans un souci de précision conceptuelle et terminologique, nous présenterons ici quelques descriptions du phénomène collocationnel. Ainsi, nous commencerons par la définition de la collocation proposée par Calaque (2006) pour qui, contrairement à Sinclair (1996)119, le seul critère de fréquence de la collocation dans un corpus n'est pas définitoire, mais qui fond sa démarche aussi sur le degré de figement de ses constituants:

La collocation est définie comme un phénomène directement observable, par lequel certains mots apparaissent en cooccurrence dans un texte naturel avec une fréquence supérieure à celle du hasard. Les collocations se répartissent sur une échelle de contrainte qui va de l'expression figée comme attraper froid, à des combinaisons tout à fait ouvertes et nouvelles. (Calaque 2006)

La définition de Grossmann & Tutin (2003), prenant appuie sur des approches de Hausmann (1989) et Mel’čuk (1998), met en avant trois caractéristiques de la collocation: le caractère binaire, la dissymétrie de ses composants et sa cooccurrence restreinte. Sur le plan sémantique, Grossmann & Tutin (2003) regroupent les collocations en trois catégories se différant par leur degré de figement:

1) Les collocations opaques dont les « collocatifs » sont ininterprétables faute de transparence et prédictibilité (nid d'ange).

2) Les collocations transparentes dont les « collocatifs » sont interprétables, mais difficilement prédictibles (grièvement blessé, beau comme un astre).

3) Les collocations régulières dont le « collocatif » a un sens générique (grande tristesse) (Tutin & Grossmann 2002).

La définition de la collocation de Hausmann (1989), cherchant à opposer les combinaisons libres et les expressions figées, met l'accent, d'ailleurs, sur sa faible opacité sémantique:

La collocation se distingue de la combinaison libre (the book is useful, das Buch ist nützlich, le livre est utile) par la combinabilité restreinte (ou affinité) des mots combinés (feuilleter un livre vs acheter un livre). Elle se distingue des locutions (idioms, Redewendungen, par ex. monter un bateau à qn/jdn. durch den Kakao dringen/to pull sb’s legs) par son non-figement et par sa transparence (ibid.: 1010).

119

« A corpus is a collection of pieces of language that are selected and ordered according to explicit linguistic criteria in order to be used as a sample of the language. » (Sinclair 1996) [Un corpus est une collection de données langagières qui sont sélectionnées et organisées selon des critères linguistiques explicites pour servir d’échantillon au langage.]. Cette définition est élargie chez Habert (2000) car ce dernier ajoute « et extralinguistiques » (ibid.: 13).

Or, il nous semble important de signaler que l'idée de la « transparence » des collocations doit être manipulée avec précaution car, comme le souligne Cavalla (2009), dans la lignée de Binon & Verlinde (2003), le sens global de certaines collocations souvent n’est pas prédictible à partir du sens de ses constituants. Tel peut être le cas la collocation « transparente » célibataire endurci (Hausmann 1979, 1984), dont l'adjectif endurci ne signifie plus « rendre physiquement plus résistant, plus solide »120, mais « âgée ». Par conséquent, le problème de la compréhension des collocations concerne aussi bien les LNN que les natifs, puisque si ces derniers ne connaissent pas la collocation célibataire endurci, ils ne peuvent pas deviner, non plus, le sens de l'association de ces deux mots.

Si la majorité des linguistes s’accordent généralement sur la bipartition des collocations: Mel’čuk (2003) utilise même pour la collocation le terme d’« expression linguistique bipartite AB » (ibid.: 23), cette caractéristique n’est pas aussi évidente chez Cruse (1986) et Sinclair (1991). Ab hinc Sinclair mentionne:

Collocation is the occurrence of two or more words within a short space of each other. (ibid.: 170). [la collocation est une association de deux ou plus de mots qui ne sont pas très éloignés les uns des autres]121

Il n'existe pas, non plus, de consensus entre linguistes sur le critère « de la solidarité lexicale » des constituants de la collocation, mis en avant par F. de Saussure (1916) et Firth (1957, 1968). Mel’čuk (2003), par exemple, au contraire, souligne le fait que l’attirance entre les éléments n’est pas d’ordre linguistique. En prenant appui sur les phrasèmes: fort comme un

turc et jaloux comme un tigre, l’auteur mentionne qu’aucune restriction syntaxique ou

sémantique des « bases » fort et jaloux ne force le choix des « collocatifs » turc et tigre, respectivement (ibid.: 85). À cet égard, Mel’čuk (2003) précise:

La combinatoire lexicale restreinte constitue un élément fort problématique pour toute description dictionnairique et, par ricochet, pour la linguistique théorique. Le caractère capricieux et imprévisible de la cooccurrence lexicale est notoire. (ibid.: 23).

Or, des études comme l’étude diachronique du figement des trois collocations du quotidien (prendre un bain/des risques/la fuite) faite par Cavalla & Sorba (2014), montrent bien le contraire: dans la collocation « prendre un bain » on trouve une vraie relation sémantique entre les deux éléments. Pourtant, dans le cas de notre patron syntaxique Vcaus +

N_émot, le terme de « caractère capricieux et imprévisible »122

semble être bien mérité. Dans

120 Le TLFi: www.cnrtl.fr/lexicographie/endurci, consulté le 20-06-2016.

121

Traduction personnelle.

notre corpus, par exemple, la combinaison susciter DET colère a 129 occurrences, tandis que

susciter DET rage est un hapax. Ce qui est intéressant, c'est que la faible attirance entre les

deux lexies de cette dernière collocation se confirme dans le corpus Frantext où cette association est carrément absente.

Ainsi, dans la théorie de la « combinatoire » des mots de Mel’čuk (cf. Mel’čuk & Zholkovsky 1984, Mel’čuk & Clas 1984, Mel’čuk 1995, Mel’čuk et al. 1995), la combinatoire d'une lexie est déterminée par deux facteurs (appelés ainsi « zones »):

A) facteur d'ordre syntaxique comportant toutes les propriétés syntaxiques pouvant nous renseigner sur la façon dont la lexie définie le comportement syntaxique de ses collocatifs, B) facteur d'ordre lexical qui renvoie à ses cooccurrences privilégiées dans le même paradigme sémantique. (Mel’čuk et al. 1995)

La « zone » syntaxique vise la structure actancielle (ou valentielle) de la lexie, tandis que la « zone » lexicale renvoie à deux notions suivantes:

(A) « ampleur combinatoire » qui est un ensemble des « accompagnateurs spécifiques (lemmes) d’un mot-pivot » correspondant à son « potentiel combinatoire »,

(B) « profil combinatoire » qui correspond à « un environnement lexical d’un mot-pivot ». (Blumenthal 2009: 12-16)

Ces notions sont particulièrement utiles pour tous les types d'analyses sur de grands corpus informatisés (c'est qui est notre cas). La « combinatoire » syntaxique renvoie aux structures actantielles des lexies, tandis que la « combinatoire » lexicale regroupe toutes les cooccurrences lexicales privilégiées du mot clé (Novakova & Tutin 2009). C'est le cas de la relation de type nom-adjectif (une panique générale), de la relation de type verbe-nom (semer

la terreur) ou de la relation de type verbe-adverbe (aimer passionnément) (ibid.: 5). Ainsi, nous considérons que la « combinatoire » du N_émot correspond à l'ensemble des ses propriétés lexicales et syntaxiques et nous allons utiliser ce terme au cours de notre travail, notamment pour tout ce qui concerne les caractéristiques de notre patron syntaxique Vcaus +

N_émot.

L'approche de Cowie (2001) qui interprète la collocation comme un vaste éventail « d'alternances lexicales possibles », nécessitant d’être prise au sens large du terme, nous semble également intéressante pour notre étude. Dans cette perspective, les collocations se trouvent sur une échelle qui va de « restricted collocations » à « open collocations », c’est-à-dire d’un choix très restreint (exemple: grand ouvert ou une colère noire) au choix très large

des « collocatifs », c'est-à-dire de nombreux « partenaires » possibles (exemple: engouement

formidable/spectaculaire/fort/vif/énorme123.

Cowie présente ces relations dans le schéma suivant:

Figure 9: Collocation d’après Cowie (2001)124

Or, cette vision large de la collocation a été partiellement critiquée par Legallois & François (2006) qui considèrent que, selon ces dispositions, son extension peut recouvrir également un simple phénomène de cooccurrence. Et c’est la raison pour laquelle, malgré de nombreuses classifications linguistiques plaçant la collocation parmi d’autres phénomènes de figement (Sinclair 1987), certains chercheurs refusent même de la qualifier d’« unité de sens ». À titre d’exemple, nous pouvons citer ici G. Gross (2005: 48) qui met en évidence le caractère substituable de certaines collocations et leur capacité à former des variantes synonymiques, comme l'expression à verbe support donner un coup/flanquer un coup125, par

exemple. Mel’čuk et al. (1995), Tutin (2008), Mejri (2005), Augustyn (2009) au contraire, considèrent ce type de collocation (les collocations à verbe support) comme une expression à la limite du figement ou un « cas intermédiaire » entre la locution figée et une construction libre dont les caractéristiques ne sont pas homogènes. Ainsi, Augustyn (2009) propose, comme exemple, l'association caresser l’espoir (ibid.: 21) qui, comme le souligne l'auteure, est « à la limite du figement » (ibid.: 21).

Parmi de nombreuses théories sur les collocations, le modèle collocationnel de Hoey (2005), établi dans le cadre de la théorie de « l'amorçage lexical » (Lexical Priming Theory), nous semble extrêmement intéressant et, notamment, pour l'idée que la collocation est un principe structurant la langue en ce sens que l’emploi d’un mot ou d'un syntagme est géré par des unités dites « amorcées ». Ceci signifie, comme il a été dit plus haut, que son emploi est fortement pré-conditionné par ses usages co-textuels et contextuels « précédents » (cf. section 3.2.). Par conséquent, l’emploi d’un mot (ou d'un syntagme) reposent sur un savoir expérientiel individuel de chaque locuteur qui l'adaptent, à un moment donné, au contexte

123 Les exemples d'Augustyn (2009: 21).

124 Notre patron syntaxique s'inscrit bien dans cette conception.

125 En effet, ces deux lexies (donner, flanquer) ne partagent pas exactement les mêmes traits sémantiques, mais, comme le dit Galisson (1976): « On ne trouve pas de synonymes parfaits appartenant à la même classe, ayant la même distribution, donc interchangeables dans n'importe quels contextes » (ibid.: 543).

discursif spécifique. Pour décrire ce système, Hoey (2005) utilise un modèle distinguant plusieurs types « d'amorçage » d’un mot (ou d'une unité syntagmatique): d'un côté, il indique leur potentiel combinatoire et de l'autre, il souligne toutes les contraintes liées à la cohérence énonciative (« collocations textuelles », « associations sémantico-discursives ») et aux positions spécifiques de ces entités dans un texte donné (« colligations discursives ») (ibid.: 13). D'après cette théorie, les items lexicaux s'activent « en fonction de leur préférence ou aversion pour certaines fonctions ou environnement grammaticaux » (cf. aussi, entre autres, Novakova & Melnikova 2013 et Novakova 2015a et 2015b).

Il nous semble également intéressant de mentionner ici l'approche de Williams (2001) qui suggère d’appréhender la collocation en tant que phénomène dynamique « dont la signification est négociée et non figée » (ibid.: 3). Un autre point abordé par Williams (2003) et intéressant pour notre étude consiste dans le développement de la conception des

collocations statistiquement significatives et ce, dans la perspective contextualisme

britannique. L’auteur souligne que la collocation n’est pas définie, mais seulement évaluée par ce critère car « seules des mesures quantitatives peuvent révéler les faits de langage dans une masse de données » (ibid.: 37).

Dans notre étude, nous utilisons l'indice statistique de spécificité des cooccurrents des

lexies (la valeur de l'indice du log-likelihood126 de Manning & Schütze (1999)) qui permet de

calculer le degré de spécificité de l’association entre le mot pivot et son « collocatif ».

Notons encore que la multiplication et la complexité des approches associées au concept de « collocation » ont, à la fois, des avantages et des inconvénients: avantages, puisque en cherchant à établir notre propre démarche nous en avons un grand choix, inconvénients, puisque, suivant les objectifs visés, les descriptions, les typologies et les critères varient. Difficile à cerner sur des critères syntaxiques, sémantiques et/ou pragmatiques, la collocation pose des « problèmes intéressants pour la théorie linguistique » (Tutin 2008:1) offrant des perspectives particulièrement pertinentes pour les Sciences du Langage et, notamment pour le FLE. Nous allons développer cette idée dans le Chapitre 4.

De cette courte rétrospection et dans l’optique qui est la notre, l'approche large de la

collocation de Hausmann (1989) nous paraît la mieux adaptée à notre problématique127. Nous la présenterons dans la section suivante.

126 Log-likelihood est l'indice statistique de spécificité des cooccurrents des lexies (cf. aussi Blumenthal 2007 et 2012), dont son seuil a été fixé de 10,83. Toutes les cooccurrences prises en compte par Emolex présentent une valeur de significativité au moins égale à ce seuil. Dans la partie analytique de notre étude nous allons avoir régulièrement recours à ce paramètre.