• Aucun résultat trouvé

Objet et objectifs

Partie I Descriptions linguistiques…

Chapitre 2 - Ancrage théorique, données et méthodes

2.1 Linguistiques de corpus, vingt ans après

2.1.3 Objet et objectifs

Est-ce que l'approche sur corpus et l'approche par introspection travaillent sur le même objet ? Une partie de la réponse apportée par les linguistes de corpus est donnée dans un manuel de linguistique de corpus :

Corpus linguistics today is often understood as being a relatively new approach in linguistics that has to do with the empirical study of “real life” language use with the help of computers and electronic corpora. (Lüdeling & Kytö, 2008 : V)

Il s'agit donc d'étudier l'utilisation de la langue dans la vraie vie, pas de construire un modèle hypothétique de la compétence supposée d'un locuteur-auditeur idéal. Mais cette dernière visée ne convainc pas non plus tous les linguistes recourant à l'introspection, Corbin poursuit ainsi les objectifs qu'il assigne à l'introspection :

La démarche est donc analogique : on part de données indiscutables et on cherche jusqu'où il est envisageable d'étendre les régularités qu'elles suggèrent. Dans cette perspective, l'objet qu'on se propose d'approcher est certes encore LA langue, mais conçue cette fois comme la somme des énoncés dont on peut prédire qu'ils sont productibles par tout ou partie d'une communauté linguistique, et non plus de façon réductrice comme le plus petit dénominateur linguistique supposé commun à cette communauté : la compétence du « locuteur-auditeur idéal », dont Chomsky (1965 : 12) fait « l'objet premier de la théorie linguistique », est interprétée comme somme des compétences des locuteurs-auditeurs réels de la communauté, et non plus comme moyenne hypothétique de ces compétences, lecture qui n'est que trop répandue. (Corbin, 1980 : 155)

Je soulignerai avec un peu de malice qu'en évoquant des locuteurs-auditeurs réels et en se démarquant de l'idéal, Corbin fait le pas vers l'approche sur corpus qui forme trente ans plus tard une part de ses recherches14.

L'articulation entre les productions, c’est-à-dire l'usage de la langue, qui forment les observables à analyser, et ce qui derrière (ou au-dessus, selon la métaphore spatiale que l'on préfère) ces productions fait système, qui donc serait LA langue, semble être le point problématique de l'approche sur corpus. Sauf à déplacer la question en récusant cette dichotomie très saussurienne, ainsi que le propose Halliday, à travers une analogie avec le climat :

We are so accustomed to thinking about language and text in terms of dichotomies such as the Saussurean langue and parole, or Hjelmslev's system and process, that we tend to objectify the distinction: there is language as a system, an abstract potential, and there are spoken and written texts, which are instances of language in use. But the "system" and the "instance" are not two distinct phenomena. There is only one phenomenon here, the phenomenon of language: what we have are two different observers, looking at this phenomenon from different depths in time. If I may use once again the analogy drawn from the weather: the instance-observer is the weatherman, whose texts are the day-to-day weather patterns displaying variations in temperature, humidity, air pressure, wind direction and so on, all of which can be observed, recorded and measured. The system-observer is the climatologist, who models the total potential of a given climatic zone in terms of overall probabilities. What appears to the former as a long-term weather pattern becomes for the latter a defined climatic system. There is only one set of phenomena here: the meteorological processes of precipitation, movement of air masses and the like, which we observe in close-up, as text, or else in depth, as system. But one thing is clear: the more weather we observe, as instance-watchers, the better we shall perform as system-watchers when we turn to explaining the climate. (Halliday, 1992 : 66)

Le « système » ne serait pas autre chose qu'un changement d'échelle dans l'appréhension des phénomènes et il serait tout à fait valide de penser l'atteindre en collectant et assemblant les observations individuelles (les textes).

Stubbs (2001 : 243), à travers une autre analogie, va à peu près dans la même direction, en indiquant que le problème posé à la linguistique est au bout du compte un problème récurrent dans les sciences empiriques : la relation supposée entre des produits (observables) et un 14 Il a en effet constitué des ressources pour l'étude de la langue du football, en collaboration avec N. Gasiglia

processus (non directement observable). Il compare la linguistique à la géologie parce que cette dernière discipline est confrontée à la difficulté de retracer, à partir d'états de roches et de formations géologiques, un processus non atteignable du fait qu'il s'étend sur une période temporelle excédant l’expérience humaine directe. C'est cependant ce processus qui intéresse la géologie. D'une façon similaire, la linguistique est intéressée par un processus lui aussi inobservable, mais dans ce cas parce qu'il « s'étend » sur de nombreux locuteurs différents. Et de même que les produits géologiques peuvent avoir été influencés par l'environnement (climat, par exemple) tout en restant tout de même gouvernés par les mêmes grands processus généraux (érosion et sédimentation, par exemple), les produits linguistiques peuvent être influencés par l'environnement (le contexte sociolinguistique) mais restent gouvernés par de grands processus généraux (pour Stubbs, collocation et colligation, cette dernière étant une collocation au niveau grammatical et non simplement au niveau lexical).

Il ressort de cet examen un mouvement finalement similaire pour les deux grands types d'approches, qui me conduit à tenter de compléter et de mieux formuler ce que j'ai écrit en 2005. L'objectif de l'approche sur corpus n'est pas limité aux usages, il concerne bien l'appréhension de la langue comme système. C'est plutôt du côté de ce qu'est la langue, de ce qui la gouverne, et de sa place relativement aux autres composantes de ce qui fait de l'humain un humain que passe la ligne de partage entre une linguistique qui se fonde sur les corpus et une linguistique qui bâtit et manipule des exemples. Je ferai ici référence à Chafe (1992) qui oppose deux visions de la langue, desquelles découlent deux façons de concevoir et de mettre en œuvre le travail du linguiste. La langue peut être considérée au sein des aptitudes humaines comme un système autonome, « un module langagier indépendant » (on reconnaitra là une allusion à Chomsky et à ses propositions), ce qui implique :

Linguists with this belief feel joy whenever they discover a linguistic phenomenon they can characterize as arbitrary and unmotivated - one they can assign to the independent language module. (Chafe, 1992 : 80)

Mais il peut aussi être considéré que la langue est une part inséparable de l'activité mentale et prend place au sein de l'ensemble des fonctions cognitives, avec lesquelles elle est en étroite dépendance – on aura reconnu là la position des fonctionnalistes tels que M.A.K. Halliday. Dans ce paradigme,

[l]inguists who adhere to this integrated view feel joy whenever they discover a way in which some linguistic phenomenon can be characterized as motivated and functional - explainable within a larger, coherent picture of the mind. (Chafe, 1992 : 81)

La dualité ici évoquée projette des corrélations en termes de méthodes. Pour mettre en évidence les propriétés d'un système indépendamment de son utilisation et des fonctions qu'il remplit, expérimentations et manipulations sont tout à fait appropriées. On peut par exemple étudier la mécanique et les propriétés des corps en mouvement sans nécessairement envisager une machine particulière.

C'est d'ailleurs dans cette logique de dissociation du système et de son usage que se serait inscrit Chomsky, qui, d'après Léon, ne disqualifiait pas les études de corpus et le développement de modèles probabilistes de l'usage dès lors que la syntaxe n'était pas la cible :

Given the grammar of a language, one can study the use of the langage statistically in various ways; and the development of probabilistic models for the use of language

(as distinct from the syntactic structure of language) can be quite rewarding. (Chomsky, 1957, note 4: 17). Cité par (Léon, 2005 : 45)

Mais le problème qui se pose au linguiste – comme à nombre de scientifiques des sciences humaines – est double : d'une part, la déconnexion d'avec les situations authentiques conduit à une artificialité des résultats (l'inadéquation pragmatique de certains énoncés jette un doute sur la validité des théories élaborées à partir de leur examen), d'autre part, les résultats obtenus sont finalement assez pauvres et peu informatifs, c'est la critique assez radicale formulée par Buyssens (1969) à la réception des propositions de Chomsky, médiées en France à la fin des années 60 par N. Ruwet. Pour Buyssens, soit Chomsky est dans l'erreur, soit ses conclusions n'apportent pas grand-chose de plus que la tradition grammaticale qui l'a précédé. Il conclut par ces mots : « La linguistique n'a que faire de la discipline déductive de Chomsky ; elle souffre d'un recours insuffisant à la méthode inductive. » (Buyssens, 1969 : 857).

En effet, dès lors que le langage est pensé dans sa dimension sociale, cognitive et psychologique, la description linguistique doit obéir à un principe impérieux d'adéquation aux données et de plausibilité – un peu comme lorsque, ayant établi les lois du mouvement, on envisage le fait qu'il prend place dans un fluide (air ou eau, par exemple), lequel introduira des contraintes susceptibles d'amender les lois précédemment établies. L'adéquation aux données ne sera garantie que par le rassemblement d'un nombre suffisant de données et par l’établissement de régularités, l'approche sur corpus est ainsi cohérente avec cette conception.