• Aucun résultat trouvé

1. CORPUS ET CONCORDANCES

1.4. O BJECTIFS D ' UTILISATION D ' UN CORPUS

1.4.1. Objectifs "théoriques"

Pourquoi les linguistes utilisent-ils des corpus ? Teubert (2005) considère les données des corpus comme attestations ("testymony") de ce qui a été dit ou écrit. Il explique qu'elles relativisent Ŕ voire invalident Ŕ l'autorité de certaines définitions lexicales que l'on trouve dans des dictionnaires. Ces définitions ont été transmises et acceptées de façon parfois peu critique. Pourtant, l'évolution des langues appelle à une révision régulière des définitions lexicales. L'étude sur corpus donne en plus l'occasion de revoir les catégories grammaticales établies. Les résultats obtenus par l'exploration de grands corpus mettent en cause certaines des catégories, et ils peuvent permettre d'en formuler d'autres, plus adaptées à l'état actuel de la langue ou plus adaptées aux besoins de celui qui les utilise. Contrairement au courant du cognitivisme qui est basé sur des catégories grammaticales prédéfinies, la linguistique de

32 corpus a tendance à rester ouverte par rapport aux catégories. Travailler sur des corpus ou avec des corpus est donc potentiellement une activité de chercheur Ŕ et parfois de créateur Ŕ de références. Ceci semble s'appliquer aussi bien aux linguistes qu'aux enseignants et apprenants. Pour Rastier (2005), "la linguistique de corpus peut offrir les moyens théorique et technique d'étudier l'espace des normes". Il considère, comme Teubert (2005), l'espace des normes, qui est offert par les corpus, comme "chaînon manquant" entre langue et parole. Dans la lignée de Rastier, Mayaffre (2005) relie le thème de la conception et de l'utilisation des corpus aux débats de la linguistique contemporaine concernant la distinction entre théorie et empirie, démarche déductive et inductive, langue et parole. Le tableau ci-dessous illustre trois postures scientifiques que l'on peut adopter par rapport aux corpus. Les oppositions y sont présentées de façon plus stricte qu'elles ne le sont en réalité.

Tableau 4 – Postures vis-à-vis des corpus et leurs implications théoriques et méthodologiques.

Maingueneau (2008 : 10) oppose un "schéma général de l'énonciation (…), invariant à travers la multiplicité des actes d'énonciation", aux énonciations individuelles qui ont lieu un moment donné, à un endroit donné. Grâce à la juxtaposition d'actes d'énonciation individuels multiples, les corpus peuvent alors être considérés comme expression de ce schéma général.

Ceci n'est pas sans rappeler une des "clés pour la communication" proposées par Demaizière et Berthoud (1998) : "Les phénomènes locaux sont pertinents pour la compréhension des phénomènes globaux."

corpus sans théorie--- corpus utilisés pour créer la théorie --- théorie sans corpus parole--- parole/langue ---langue Les trois postures se traduisent par l'utilisation de corpus de niveaux différents :

corpus lexicographiques --- corpus textuels --- corpus phrastiques

("sacs de mots") (textes entiers) (phrases formulées par des linguistes) Les postures peuvent être rattachées à des théories et des méthodologies opposées.

Linguistique de corpus :

- linguistique descriptive ; Linguistique sur corpus : - linguistique théorique ;

- empirie (les données attestées) ; - théorie (le système grammatical) ;

- induction ; - déduction ;

- le corpus sert d'apport pour construire le savoir ;

- le corpus a une valeur heuristique.

- le corpus sert à valider et illustrer des hypothèses et théories qui existent déjà ; - le corpus a une valeur documentaire.

33

1.4.2. Objectifs "pratiques" ou la "théorie appliquée"

Habert, Nazarenko et Salem (1997 : 28) plaident en faveur d'une constitution de corpus et d'une annotation de ses données motivées par une application précise : "Un étiquetage est toujours orienté par une tâche." (Habert, Nazarenko et Salem, 1997 : 37). Quels peuvent être les objectifs "pratiques" qui motivent la constitution d'un corpus ?

Le Trésor de la langue française informatisé mentionne comme objectifs l'étude linguistique de textes et la recherche automatique d'informations.

(LING.) Ensemble de textes établi selon un principe de documentation exhaustive, un critère thématique ou exemplaire en vue de leur étude linguistique.

(ÉLECTRON., INFORM.) Ensemble de données exploitables dans une expérience d'analyse ou de recherche automatique d'informations.

Bernardini (2004 : 15) évoque deux possibilités d'utilisation des corpus. Premièrement, on peut se servir des descriptions de faits langagiers qu'offre un corpus pour comprendre des phénomènes concernant le fonctionnement linguistique. Deuxièmement, l'enseignant peut utiliser les corpus pour "influencer" les processus d'enseignement/apprentissage. Bernardini s'intéresse particulièrement à la deuxième utilisation. Elle propose de relever le défi de faire entrer les corpus dans les salles de classe et de les faire utiliser lors d'activités communicatives de type "résolution de problème" (communicative reasoning-gap activities).

Les corpus peuvent, à son avis, favoriser l'apprentissage incident et permettre aux apprenants de créer leurs propres références linguistiques (cf. 4.2.3.).

L'utilisation de corpus peut alors permettre de poursuivre les objectifs suivants :

- faire l'inventaire diachronique et/ou synchronique d'une langue (fonction documentaire) ; - faire une analyse linguistique de textes ;

- étudier l'espace des normes ;

- rechercher des informations, par exemple dans des situations de type "résolution de problème" ;

- apprendre une langue étrangère de façon incidente.

Un des objectifs principaux est l'étude de la langue et sa description qui résulte d'un travail qui n'est pas basé sur l'introspection, mais sur des énoncés attestés. Cette observation peut, entre autres, mener à la production de grammaires et de dictionnaires. Les objectifs d'analyse linguistique et de recherche d'informations peuvent intéresser aussi bien les linguistes que les apprenants d'une langue étrangère. En raison de ma perspective de didacticienne, le lien entre corpus et tâches m'intéresse particulièrement. En effet, les corpus permettent de proposer des

34

"open-end retrieval tasks" (Sinclair, 1996), donc des tâches d'exploration ou de recherche d'information. Le dernier objectif, étudier l'espace des normes, est un objectif théorique susceptible d'intéresser les chercheurs en linguistique et philologie davantage que les didacticiens. Néanmoins, je pense qu'il concerne aussi ces derniers, car il permet de repenser le statut de notions comme "règle" et "erreur" : leur pertinence peut être interrogée grâce à l'observation d'énoncés attestés. Les représentations des apprenants, mais aussi des enseignants, concernant la langue étrangère peuvent ainsi être mises à l'épreuve et, le cas échéant, être modifiées.