Réflexions autour du recueil des données en sciences du langage

Chapitre 3 – Construction d’une méthodologie

3.1 Réflexions autour du recueil des données en sciences du langage

Le recueil des données et la façon de concevoir leur fonction dans l’analyse constituent une étape centrale de la recherche en sciences du langage. La constitution de ce que l’on appelle communément corpus, mais dont le rôle diverge selon les objectifs suivis, oblige le chercheur à réfléchir à la manière dont il va sélectionner et réunir les données qui serviront de base à la description et à l’analyse du phénomène qu’il entreprend d’étudier. L’ensemble des données recueillies est censé être représentatif du phénomène en question, dont l’étendue dépasse nécessairement l’échantillon réuni. Lorsqu’il travaille sur un corpus, le chercheur « délimite, met en correspondance, organise des bribes d’énoncés plus ou moins longs et plus ou moins homogènes qu’il va soumettre à l’analyse » (Mazière 2005 : 11). Le chercheur doit alors disposer de critères méthodologiques précis qui guideront la construction du corpus.

Le recueil des données peut se faire de différentes manières selon les objectifs de recherche poursuivis et la fonction que l’on assigne au corpus :

Ce que l’on considère comme des données est entièrement fonction de ce que l’on se donne comme objectif de recherche.

Kerbrat-Orecchioni (2005 : 24)

175_{Dans le but de cerner ce phénomène sur la base du ressenti par le locuteur ordinaire dans le langage}

Ainsi, pour prendre l’exemple de la linguistique de terrain, les sociolinguistes et éthnométhodologues procèdent à une collecte de données naturelles, non-fabriquées, qu’ils obtiennent notamment à travers des observations participantes ou des enquêtes (semi-)directives (cf. Blanchet 2000) dans le but d’expliquer entre autres des corrélations entre un groupe social et le parler des gens. En pragmatique conversationnelle, Kerbrat-Orecchioni et Traverso (2008) examinent par exemple les interactions dans les petits commerces afin d’analyser différents actes de langage, objectif pour lequel elles ont recours à des enregistrements sur les sites examinés.

En syntaxe, on peut rassembler des phrases fabriquées si l’on cherche à décrire le fonctionnement d’une certaine structure dans un système linguistique particulier. En sémantique, Greimas (1995 [1966]), postule dans les années 1960 que le corpus devait satisfaire aux critères de la « représentativité », de « l’exhaustivité » et de « l’homogénéité » critères considérés aujourd’hui comme impossibles à atteindre. L’importance que l’analyse du discours attache par exemple aux phénomènes de l’interdiscours et de l’intertextualité remet en cause par leur définition même (de l’hétérogénéité énonciative) la notion de l’homogénéité. La prise en compte de l’interdiscours suppose en effet d’élargir l’analyse vers l’avant-texte, ce qui rend inopérable la notion de « corpus clos ». Le critère de l’exhaustivité est lui aussi difficile à satisfaire, sauf s’il s’agit par exemple de l’étude d’une certaine forme attestée chez un auteur dans un ouvrage précis. Même s’il est désormais possible de traiter un très grand nombre de données avec des outils informatiques de lexicométrie et qu’un tel recueil « constitue inévitablement un échantillon de plus en plus représentatif du langage traité » (Habert et al. 1997 : 146), il faut être conscient que l’on ne peut en aucun cas prétendre à une exhaustivité et représentativité complètes176 et qu’aucun traitement informatique de corpus, aussi efficace soit-il, ne peut appréhender « l’épaisseur dialogique » des mots, énoncés et discours. « L’impossible clôture du corpus » et sa « non-exhaustivité constitutive » (Moirand 2004) doivent donc être acceptées par le chercheur. Le seul critère pertinent qui guidera la constitution du corpus sera alors celui d’une adéquation avec les objectifs de recherche.

176_{Les ouvrages de Habert, Nazarenko et Salem (1997) ainsi que de Biber, Conrad et Reppen (2002)}

proposent des approches lexicométriques et quantitatives des données en discutant des questions de recherche spécifiques qui y sont associées.

3.1.1 Le recueil des données dans les études sur le VAGUE

Les approches qui traitent du VAGUE (l’approche philosophique et l’approche pragmatique, voir section 1.1 et 1.2.2) et qui appliquent une méthode déductive aux données à l’aide des catégories préétablies, poursuivent elles aussi des objectifs bien définis. L’approche philosophique tâche de comprendre l’essence du VAGUE (d’où vient-il ?) et de résoudre le « sorites paradox » ; l’approche pragmatique tente d’analyser le fonctionnement des conversations et discours malgré les expressions vagues ou essaie de démontrer en quoi un certain discours est vague. Les études de ce genre sont nombreuses et on les appellera « études d’application177 ».

Dans notre mémoire de Master de recherche en sciences du langage, l’analyse était consacrée aux « expressions vagues dans l’oral spontané » et nous avions procédé de la manière décrite ci-dessus. Nous avions enregistré des conversations spontanées entre amis et sélectionné un certain nombre de catégories d’observables (hedges, mots passe- partout, particules modales) qui avaient été préétablies et utilisées par d’autres chercheurs et traitées en rapport avec le phénomène du VAGUE (cf. Overstreet 2005, Mihatsch 2006, Channell 1994). Cette sélection avait ensuite permis d’analyser le fonctionnement des conversations spontanées contenant des expressions vagues. Nous nous étions ainsi appuyée sur les travaux pragmatiques cherchant à analyser le VAGUE en contexte et en usage.

Aujourd’hui, notre objectif de recherche a changé, tout en gardant le même sujet d’étude – le VAGUE, et exige par là une manière différente de recueillir les données. Il ne s’agit plus d’analyser le fonctionnement d’un discours à l’aide de formes du VAGUE, mais de cerner un concept plus ou moins bien délimité dans la littérature en prenant appui sur le jugement du locuteur ordinaire. Cette entreprise se situe alors à une étape préliminaire qui tente (dans le premier volet d’analyse, chapitre 4) d’établir les catégories d’observables de ce phénomène et qui l’éclaircit du point de vue du locuteur ordinaire dans le langage courant. Un des principaux objectifs poursuivis est alors de contribuer aux recherches sur le VAGUE en fournissant entre autres des catégories en supplément de celles déjà existantes dans le domaine. En essayant de décrire les sens que peuvent revêtir les termes vague/vage dans le discours quotidien, nous allons mener un travail portant en grande partie sur l’établissement de catégories, et non pas sur le fonctionnement d’un discours. Cette démarche explique également l’importance de la

177_{Puisqu’elles appliquent des catégories établies par d’autres chercheurs (Channell 1994, Crystal et}

Davy 1979, par exemple) telles que les approximators, placeholders, quantificateurs, etc. à un type de discours.

présente partie méthodologique visant à clarifier notre procédé. Ce travail se rapproche de ce fait (uniquement en ce qui concerne le recueil des données) de celui de Jacqueline Authier-Revuz (1992) sur la « non-coïncidence du dire » et « l’hétérogénéité énonciative ». L’auteure formule sa méthode de la manière suivante :

Il [le travail] vise d’abord à identifier, inventorier, classer et décrire les formes – linguistiques ou discursives – à travers lesquelles se réalise le dédoublement méta- énonciatif propre à cette configuration.

(Authier-Revuz 1992 : 12)

En établissant les catégories de cette « hétérogénéité énonciative », Authier-Revuz fournit pour ainsi dire les outils de travail (les catégories d’observables) aux autres chercheurs, qui les appliquent ensuite à des discours particuliers. Pour atteindre son objectif, elle procède à un recueil de données « au vol178 » en vue de classer les bribes d’énoncés ainsi obtenues dans les différentes catégories qu’elle établit au fur et à mesure.

Dans ce sens, notre travail se situe, lui aussi, en partie à cette étape préliminaire d’établissement de catégories puisque le corpus, qui s’organise à partir d’une forme langagière (vague/vage), cherche à mettre au jour des « faits » qui permettront de cerner le concept du VAGUE.

Dans la mesure où cette thèse examine cependant le VAGUE à travers le discours des locuteurs ordinaires qui emploient les mots vague/vage, il nous semble pertinent de nous arrêter un instant sur la méthode habituellement suivie en analyse du discours179 afin de mettre en relief les différences qui sous-tendent notre démarche à l’égard de la leur.

3.1.2 Travailler sur un discours – travailler sur un concept, quelle conséquence pour le corpus ?

Après avoir passé en revue un certain nombre de travaux scientifiques menés en analyse du discours (cf. Moirand 2007, 2004, Veniard 2007, Pugnière-Saavedra 2007, Tréguer- Felten 2009, Pordeus Ribeiro [travail en cours]), on peut retenir quatre termes emblématiques dans leur démarche méthodologique autour desquels se centre la

178_{C’est-à-dire, noter au passage dans un carnet toutes les productions verbales (orales ou écrites)}

contenant une occurrence de ce qu’on est en train d’analyser.

179

Notamment des travaux issus del’équipe de recherche Cediscor : Véniard (2007), Pugnière-Saavedra (2006), Tréguer-Felten (2010), Pordeus Ribeiro (travail en cours).

principale différence par rapport à l’approche de notre étude : catégorie descriptive, catégories d’observables, type de discours et objectif de recherche.

Les auteurs des travaux en question sélectionnent un type de discours (corpus de presse pour Veniard, Moirand et Pordeus Ribeiro, corpus télévisé pour Pugnière-Saavedra, des brochures d’entreprises pour Tréguer-Felten, etc.) et centrent leur analyse autour d’une catégorie descriptive telle que par exemple « la nomination » (pour Véniard, Moirand et Pordeus Ribeiro), le « discours rapporté » (Moirand), ou « l’humour » (Pugnière- Saavedra). Ils analysent ensuite un certain nombre d’observables dans la matérialité textuelle qui permettent d’appuyer la catégorie descriptive (pour la « nomination », par exemple, on observe les reformulations, les paradigmes désignationnels, la nomination des acteurs, etc. ; pour le « discours rapporté », on relève les citations, les îlots textuels, les allusions, etc. Moirand 2004 : « 8-9 »). Ces « moyens d’objectivisation » auxquels peut s’adosser la catégorie que l’on est en train d’analyser, permettent alors de confirmer certaines hypothèses ou d’accomplir des objectifs de recherche posés auparavant, tel que notamment celui de montrer la trajectoire des mots dans les discours médiatiques et leur caractéristique d’être « porteur de mémoire » (Moirand 2007 : 9) ou bien celui de révéler la « construction de l’événement en tant qu’entité langagière » (Véniard 2007 : 16). Il s’agit donc de travaux portant sur un type de discours particulier qui visent à analyser son fonctionnement à l’aide d’une entrée d’analyse et des observables associés à cette entrée. Ce qui importe, c’est le fait que les catégories d’observables, qu’il s’agisse de formes linguistiques ou discursives, soient en quelque sorte préexistantes : elles sont tirées de travaux théoriques consacrés à l’établissement de ces catégories. Certes, c’est au chercheur de sélectionner les « bons observables » et de les adapter à son objectif de recherche ainsi qu’au discours qu’il est en train d’analyser, mais il « fouille » pour ainsi dire dans un répertoire existant. Autrement dit, si l’analyse du « discours rapporté » dans la presse peut s’appuyer sur certains observables, c’est parce qu’il existe des recherches antérieures qui ont établi les catégories de « l’hétérogénéité énonciative » comme « l’allusion », « l’îlot textuel », etc. (cf. Authier-Revuz, 1992). L’apport de ces études est donc essentiel, dans la mesure où elles expliquent le fonctionnement de certains types de discours en appliquant et mettant à l’épreuve des catégories préexistantes.

Etant donné que notre objectif de recherche diffère de ceux poursuivis par les travaux habituellement menés en analyse du discours et par les approches logico-philosophiques et pragmatiques du VAGUE, la démarche méthodologique et la constitution du corpus doivent se faire différemment. On peut difficilement encore évoquer une « analyse de discours » puisqu’il s’agit essentiellement d’un travail portant sur un concept – un travail qui vise à élargir la définition du VAGUE en passant par une entrée lexicale

(vague/vage) dont nous essayons de cerner les différents sens (à travers l’établissement de catégories), les associations et les fonctions dans le discours quotidien.

Dans le document Le vague - De l’usage évaluatif d’un terme en français et en allemand à la reconstruction d’un concept (Page 132-137)