• Aucun résultat trouvé

critique du « mode d’usage de l’eau »

1.3.2. La méthode d’analyse textuelle Alceste

La conclusion des chapitres suivants présente les résultats d’une analyse textuelle de six documents (quatre pour l’Espagne, deux pour le Maroc)38 à partir de la méthode Alceste élaborée par Reinert (1995). En nous appuyant sur la présentation de Rousselière (2006), nous proposons une présentation succincte de cette méthode.

37 L’usage du dictaphone est circonscrit à l’enquête en Espagne, pour laquelle nous invoquions le problème

de la langue. Au Maroc, ce procédé était plus mal perçu et source de méfiance (notamment à cause du problème de l’anonymat vis-à-vis des autorités). Il a donc été abandonné rapidement.

38 Pour l’Espagne, il s’agit : du Libro blanco del agua en España (MMA, 1998), du Plan hidrológico

nacional, (MMA, 2000), du Plan hidrológico de la cuenca sur (CHSE, 1998a) et de la Ley 11/2005, de 22 de junio, por la que se modifica la Ley 10/2001, de 5 de julio, del Plan hidrológico nacional. Pour le Maroc, il

s’agit de l’Étude d’actualisation du Plan directeur d’aménagement intégré du bassin du Tensift (ABHT,

2007) et de l’Étude de révision du Plan directeur d’aménagement intégré des ressources en eau (PDAIRE)

1.3.2.1. Présentation générale d’Alceste

Situé dans la tradition « benzécriste » (Reinert, 1999) du nom du fondateur de l’analyse factorielle des correspondances multiples, Jean-Paul Benzécri, dont les premiers travaux datent du début des années 1960, Alceste39 est un logiciel de statistique textuelle dont l’objectif très général est d’étudier la distribution statistique des « mots-pleins » (mots porteurs de sens et distincts des « mots-outils » relatifs à la syntaxe) dans les « énoncés » d’un corpus donné (Coronini et de Looze, 2000). Il se démarque des autres logiciels et mobilise une méthode de classification descendante hiérarchique, procédure itérative qui permet de différencier plusieurs niveaux de partition sur l’ensemble des unités de contexte retenues et d’identifier des classes d’unités de profils contrastés. Ces classes sont appelées des « mondes lexicaux » (Reinert, 1995).

Une des caractéristiques d’Alceste, qui apparaît a priori cohérente avec notre méthodologie générale, repose sur la faible intervention préalable du chercheur (exceptés le « nettoyage » et la préparation du corpus). En cela, selon Jenny (1999), il appartient à l’ensemble des logiciels d’analyse textuelle dont le présupposé est explicitement « fréquentiste » et s’oppose aux logiciels dont le présupposé est qualifié d’« intuitionniste ». Dans sa controverse avec Reinert, l’auteur décrit les premiers comme visant à : « faire table rase des prénotions et “calculer en aveugle” sur

les fréquences d’occurrences pour assembler en classes les énoncés qui se ressemblent », tandis

que les seconds conduisent : « pour chaque chercheur à assumer ses “prénotions” et à s’y référer explicitement pour construire des classes d’énoncés qui font sens dans tel contexte de recherche

particulier » (Jenny, 1999 : 75).

Alceste se distingue fortement de l’analyse de contenu et son présupposé de « l’entrée lexicale »

conduit à réduire le discours : « à une juxtaposition de ses éléments constitutifs élémentaires, les

lexèmes » ; et appartient au paradigme des « mots-clés » : « qui gouvernent nos pensées bien

au-delà de l’activité documentaire où il a trouvé sa justification originelle » (Jenny, 1999 : 77). En

réponse à cette critique, Reinert (2003) justifie sa méthode en invoquant notamment les travaux du pragmaticien Charles Sander Pierce. Il pose alors pour hypothèse-axiome que le sens réside avant tout dans un mécanisme relevant « d’un niveau très archaïque dans tout énoncé par la simple cooccurrence des mots-pleins, par l’effet de résonance que le contenu introduit entre eux (aspect

associatif) » (Reinert, 2003 : 396). En résumé :

« Alceste privilégie ainsi la dimension pragmatique du langage, puisque la sélection des mots-pleins revient à se centrer sur la relation du signe à l’objet dont la référence à Peirce permet de tenir compte de ses deux aspects : objet immédiat que désigne le signe et objet dynamique qui est cause du signe, lequel est alors la trace des usages et des pratiques déposée dans le langage par le jeu même de leur répétition » (Defalvard, 2005 : 383).

39 Initialement pour « Analyse des lexèmes cooccurrents dans les énoncés simples d’un texte » puis pour

C’est pourquoi il apparaît qu’Alceste semble plus adapté aux analyses de textes, même de petite taille mais dans lesquels le « discours peut se déployer », qu’aux analyses de réponses courtes à des questions ouvertes pour lesquelles le mécanisme de répétition ne joue plus (Rousselière, 2006 : 117). Notons ici que le corpus que nous mobilisons permet de nous affranchir de ce problème.

1.3.2.2. Démarche de la méthode Alceste

À partir de l’identification des Unités de contexte initiales (UCI) qui sont les divisions naturelles du corpus (différentes réponses d’un entretien ouvert, différents entretiens, chapitres d’un livre, etc.),

Alceste segmente le corpus en Unités de contexte élémentaires (UCE) de taille équivalente. Les

UCE sont composées d’une ou plusieurs lignes de texte consécutives et constituent « l’unité statistique essentielle du logiciel ». Le logiciel va ensuite construire un « tableau lexical entier » (TLE) croisant ces énoncés (UCE) et les lexèmes obtenus à partir des mots-pleins lemmatisés (opération qui consiste à remplacer une forme textuelle par sa forme réduite standardisée). Le TLE, rempli par des « 0 » et des « 1 » en fonction de l’absence ou de la présence du mot-plein dans l’UCE considérée, est le résultat du calcul d’une « partition disjonctive de classes d’UCE telle que la variance inter-classe soit maximisée au détriment de la variance intra-classe quant aux lexèmes

que contiennent ces UCE » (Jenny, 1999 : 74) (Cf. Tableau 2). Enfin, des unités de contexte (UC)

sont calculées par concaténation des UCE (Cf. Tableau 3).

Tableau 2 : Tableau lexical entier

Avec : αij = {0,1} j = 1,…, m et i = 1,…, n.

Source : Rousselière (2006 : 115) d’après Defalvard (2005 : 385).

Tableau 3 : Partitionnement du corpus

Source : Image (2006 : 3).

Cette méthode vise à diviser le corpus en classes successives maximisant les oppositions jusqu’à ce que toute subdivision ne soit plus significative. En effet, le vocabulaire, ou « monde lexical » d’une classe n’apparaît spécifique que pour autant qu’il s’oppose à un autre vocabulaire (Defalvard, 2005 : 385). Afin de tester la « robustesse » et la « stabilité » des classes ainsi que leur

indépendance vis-à-vis du découpage initial, Alceste effectue deux classifications descendantes hiérarchiques successives avec des découpages en unités de contexte différents. Au final, chaque classe terminale renvoie à des mots-pleins les plus caractéristiques et dont la répétition dans les UCE dessine un « monde lexical » idéal-typique. En effet, « la présence simultanée des mots pleins

dans une même UCE est la trace possible de contenu » (Reinert, 2003 : 403). Le logiciel permet

ainsi de visualiser, sous forme d’arbre hiérarchique, les différentes classes, dont les profils peuvent être examinés à l’aide de la liste des mots et des UCE les plus significatifs. Cette significativité est appréciée à l’aune du Khi2, pris comme indicateur et non comme test statistique. Notons, pour conclure, que si le rôle du chercheur est limité en amont, il reste très important en aval pour interpréter les résultats et donner a posteriori une signification aux classes (Delavigne, 2004).

Section 2. Présentation générale des terrains d’enquête : Almeria,