COMPARAISON DE TECHNIQUES D'ANALYSE
DE DISCOURS SUR LA CONNAISSANCE
ET LA GESTION D'UNE FORÊT MÉDITERRANÉENNE
Mohamad CHEIKHO, Pierre CLÉMENT L.I.R.D.H.I.S.T., Université Claude Bernard - Lyon 1
MOTS-CLÉS: ÉDUCATIONÀL'ENVIRONNEMENT FOIŒT MÉDITERRANÉENNE
-PLURIDISCIPLINARITÉ - ANALYSE DE DISCOURS
RÉSUMÉ: Ce travail entretient un double rapport à la technologie:
(1)Son objet d'étude est une question sur l'environnement qui est à la charnière entre la recherche fondamentale, la recherche appliquée et les décisions plus techniques: comme toute question sur la technologie.
(2) Pour atteindre cet objectif,ilutilise des techniques d'analyse de données textuelles, qui sont ici comparées (notamment une analyse manuelle de contenu et une analyse lexicale informatisée : Alceste)
SUMMARY : This work contains a double link with technology :
.. Firstly, its research's object is situated among the fundamental research, the applied one and the technical decisions ; as in every environmental or healthy malters, and in the technical ones.
.. Secondly, to realize the above target, it uses different techniques of textual data' s analysis which are compared (particularly a manual method and a computerized one).
1. INTRODUCTION
Comme l'enseignement de la technologie, l'éducation
à
l'environnement est focalisée sur l'acquisition de savoir faire et d'attitudes liées à des pratiques sociales de référence, plus que sur la simple transmission de connaissances. D'autant plus que les connaissances sur l'environnement sont complexes, et souvent non stabilisées. Afin d'étudier ultérieurement les formations de futurs gestionnaires de la forêt méditerranéenne, nous avons entrepris un travail sur les conceptions qu'ont sur la pluridisciplinarité des responsables de programmes pluridisciplinaires de recherche et/ou de gestion d'une forêt méditerranéenne.Le
corpus recueilli pour ce travail est important (385 ()()() caractères au total pour Il entretiens). Nous avons utilisé pour l'étudier plusieurs techniques d'analyse de données textuelles.Laprésente communication a comme principal objectif de comparer les résultats obtenusàpartir de deux de ces techniques: une manuelle et autre informatisée.2. MÉTHODOLOGIE
Tableau(1) -Les personnes interrogées
Lieu de lIavail Spécialité, statut et responsabililé
G INRA d'Avignon, département de EnlOmologie, Directeur de recherche, recherche forestière, station de Responsable de la station
Malaucène Membre du conseil municioal
Q Facullé Saint-Jérôme de Marseille, B : Directeur de rechen:he (B+Q) LaboralOire d'écologie méditerranéenne Q :professeur honoraire.
Chen:heurs en
R INRA d'Avil!non chercheur
B CNRS La Rochelle HemélOlol!ie chercheur
F UNESCO, Programme MAB, SMAE Ingénieur maîlre environnement et (syndicat mixte d'aménagement du qualilé de vie, chef du projet, réserve de Mont Ventoux), CarpenlIas biosphère du Mont Ventoux X ONF d'Avignon, Section technique Ingénieur forestier, responsable de la
section technique
L ONF d'Avignon B : ingénieur forestier, directeur
(B+R) départemental
R : ingénieur forestier, adjoint de direction
p INRA d'Avignon, unilé de rechen:he Chen:heur en enlOmologie forestière Moteur du projet de recherche
pluri-disciolinaire Mont Ventoux (années 70) M INRA d'Avignon, unilé de recherche Directeur de l'unilé de recherche
forestière forestière, directeur de recherche, chercheur en amélioration des arbres forestiers
D INRA d'Avignon, Unité de recherche Chercheur en sylvicultureet modélisa-forestière tion de la croissance des arbres forestiers
(essentiellement des résineux) Responsable d'un projet pluridiscipli-naire récent sur le Mont VenlOux J CNRS, universilé de Montpellier Directeur de rechen:he au CNRS,
enseignant chercheur à l'Universilé de Montoellier soécialité omitholol!ue
Les personnes interrogées (tableau 1) sont celles qui ont assumé le plus de responsabilités durant ces dernières années dans les recherches menées sur le Mont Ventoux (àl'occasion de programmes de recherche pluridisciplinaires), ainsi que dans la gestion de la forêt sur ce site. La diversité des fonctions et des spécialités disciplinaires de ces personnes a été privilégiée en même temps que leur importance dans ces programmes. Chacun des Il entretiens a été effectué sur le lieu de travail de la personne interrogée, sauf dans deux cas où les entretiens ont été effectués par téléphone. Dans les entretiensQet L, deux personnes de la même équipe ont été interrogées en même temps (soit, au total, 13 personnes interrogées). Chaque entretien a été enregistré et a duré de 40 à 120 minutes. La totalité de ces enregistrements a été décryptée, pour former le corpus de base de ce travail (corpus assez volumineux: 385 000 caractères au total).
Plusieurs méthodes ont été utilisées pour l'analyser, dont deux sont présentées dans les lignes qui suivent:
- Une analyse manuelle de contenu, pour identifier les champs sémantiques
disciplinaires présents dans les discours:
Cette analyse de contenu est à la fois qualitative et quantitative (Robert et Bouillaguet, 1997). Pour identifier les champs sémantiques exprimés par la personne interrogée, une lecture attentive a été effectuée en mettant en marge de chaque entretien, ligne par ligne, les champs disciplinaires précis, identifiés à la fois par le lexique et le contenu exprimé. Ces champs, très précis au départ, ont ensuite été regroupés et catégorisés en classes plus globales, de façon à ce que l'importance de chaque classe puisse être quantifiée (par le pourcentage du nombre de lignes se rapportantàchaque classe au sein de l'ensemble de l'entretien). Seul un bilan global effectuéàpartir des 3 classes les plus larges ainsi déterminées, est présenté plus loin (figure 1).
• Une analyse lexico-sémantique informatisée (ALCESTE):
Le logiciel ALCESTE effectue une analyse à point de départ lexical de données textuelles. Réalisé par Max Reinert (nous avons utilisé la version CNRS 1993), il permet d'effectuer de manière automatique l'analyse d'entretiens, de questions ouvertes, d'enquêtes socio-économiques, de recueils de texte divers: œuvres littéraires, articles de revues, romans. Il met en œuvre des mécanismes d'analyse du sens. U L'objectif est d'obtenir un premier classement statistique des énoncés simples du corpus
étudié, en fonction de la distribution des mots dans ces énoncés afin d'en dégager les mots les plus caractéristiques (approche des mondes lexicaux) " (Reinert 1998).
• Comparaison des deux méthodes :
Elles sont toutes les deux à point de départ lexical et sémantique. Mais la première a pour objectif de catégoriser le contenu des discours en champs disciplinaires pré-définis, fOrtement inspirés des matières enseignéesà l'école ou à l'université. La seconde, en revanche, définit des mondes lexicaux sans a priori, uniquement à partir d'une approche lexicale informatisée: c'est le chercheur qui, au vu des mots et contenus significatifs de chaque classe ainsi définie, attribue du sens à chacune d'elles. Dans les deux cas, la fréquence relative, dans chaque entretien, des classes ainsi définies, permet de saisir les tendances principales de chacun de ces entretiens: en quoi se recoupent-elles ou
diffèrent-elles en fonction des deux méthodes utilisées?
3. RÉSULTATS
3.1 L'analyse manuelle des champs disciplinaires
La
figure1
montre que les trois catégories les plus globales défmiesà
l'issue de l'analyse de contenu sont présentes dans les Il entretiens mais en proportions différentes. TI est ainsi possible de repartir les personnes interrogées en trois groupes.- Groupe 1 (J, G, P, R,
Q
et B), où prédominent les sciences naturelles en général (biologie, géologie et écologie).- Groupe 11 (X, L et D), où prédominentla foresterie, l'agronomie et l'environnement (milieu naturel, paysage, etc.).
- Groupe
111
(M et F), où prédomine un discours qui relève des sciences humaines et sociales (économique, politique. sociale).M X D L B
a
R P G 0% 20% 40% 60% 80% 100%,.---,
n
Science hl.Jlléineetsociale.• I1lchercheaw1iquée. laêls. ;gronorrie.
I1lcherchef01damentale en sciercenaurel. tiololie. aèJllXlie. écollXlie.
Figure1 : les grands champs disciplinaires identifiés dans chacun des Il entretiens 3.2 L'analyse informatisée des mondes lexicaux (ALCESTE)
Nous avons utilisé dans notre travaille plan d'analyse standard qui comprend un module de contrôle de la stabilité des classes en fonction de la longueur des énoncés retenus dans l'analyse (Reinert 1998). Cette analyse a défini cinq classes de discours (Figure 2), qui sont plus ou moins présentes dans les onze entretiens étudiés.
Q
Chaque classe est identifiée à partir des termes qui la caractérisent: • Classe 01 : gestion forestière: gérer, aménagement, forestier, forêt, gestion...• Classe 02 : sciences fondamentales, écologie, enseignement : apprendre, transmettre, milieu, altitude, approche, caractériser, échantillon, étudier, mesurer, etc.
• Classe 03 : responsabilité politique ou écologiste: biosphère, réserve, décision, dossier, élu, ministère, politique, social, syndicat, UNESCO, etc.
• Classe 04 : responsabilités scientifiques: chercher, équipe, finance, groupe, laboratoire, programme, terrain, travailler, diplôme, pluridisciplinaire, etc.
• Classe OS : forêt et écologie végétale : peuplement, pin, biodiversité, cédraie, chêne, écosystème, hêtre, sapin, sylviculture, etc.
+---1---1---1---+---1---1---1----+ 171 1 .01
°
D 1 161 °L 1 151 M 1 141 1 131 1 121 1 111 1 lOI 1 91 °X 1 81 71 61 51 41 31 21 Il °G 1 1 0+---·04----+---·05---+axeFI Il 1 1 21 1 1 31 -roOF 41 1 1 51 1 1 61 1 1 71 1 1 81 1 1 91 1 0J 1 lOI 1 1 111 1 1 121 op 131 OB 1 141 1 1 0Q 161 1 OR 171 1 002 181 axeF2 1 +---1---1---1---+---1---1---1---+Figure2 :analyse factorielle des correspondances (AFC : plan Fl-F2) situant les11entretiens par rapport aux5 classes de mondes lexicaux définies par le logiciel ALCESTE (Dl à 05) QChaque entretien est proche de l'une ou de plusieurs de ces classes, soit directement, soit en observantlaprojection des points sur l'axe Flou sur l'axe F2. Ainsi l'axe FI oppose la classe 03 (responsabilités politiques: entretiens G, F et B) à la classe 05 (écologie végétale: X, D, L, Q,voire RetJ).Tandis que l'axe F2 oppose la classe 01 (gestion forestière: D, L, M, X) à la classe 02 (sciences fondamentales: R, Q, B, P, J).
La
classe 04 (responsabilité scientifique) est au centre de gravité, donc plus présente dans chaque entretien, mais plus particulièrement chez M, P, G, F et 1.4. DISCUSSION
Tableau 2 : Résumé de l'analyse manuelle de contenus (champs disciplinaires)
n-
Foresterie XLDIII - Sciences humaines&sociales
MF
Tableau
3 :
Résumé de l'analyse lexicale informatisée (mondes lexicaux)-02 - -05 - -01 - -03 - -
04-Sc. fond. écolol1.ie écolol1.ie vél1.étale l1.estion forestière resn. oolitioues 1reso. scientifioues
J P R, Q. B XLD{JR,Q) XLDM F G lB) MFPGJ
• Les résultats sont en grande partie concordants: ce qui est rassurant, et indique que le lexique disciplinaire est un indicateur des mondes lexicaux: ainsi le groupe 1 correspond largement aux mêmes entretiens que les classes 02 et 05; le groupe Il se superpose bienàla classe 01, etily de larges recoupements entre le groupe III et les classes 03 et 04.
• Les mondes lexicaux de l'analyse informatisée sont plus fins et plus pertinents : en particulier, le groupe III de l'analyse des champs disciplinaires n'était guère satisfaisant:ilregroupait en sciences humaines et sociales (SHS) des discours relevant de l'économie, du politique, du social, ... alors qu'aucun de ces acteurs n'était un spécialiste de SHS. Les classes 03 et 04 sont
à
cet égard plus pertinentes en identifiant et différenciant les responsabilités politiques d'une part et scientifiques de l'autre.La
classe 05 montre que les discours sur la gestion forestière empruntent aussi un langage d'écologie végétale (ce que l'analyse manuelle avait occulté), discours qui se différencient cependant de ceux des sciences fondamentales (pour lequel le groupe 1 correspond bien à la classe 02).• Quelques différences émergent ainsi dans la caractérisation de certains entretiens. Notamment pour trois acteurs: G, M, et D. Dans les trois cas, les tendances mises en évidence par l'analyse informatisée correspondent plus aux impressions que nous avions eues à la suite des entretiens. Cene plus grande finesse vient aussi de l'AFC (figure 2) qui permet de mieux situer les entretiens par rappon aux catégories de discours que ne le permet le graphe de la figure 1.
BIBLIOGRAPHIE
MAINGUENEAU D.,L'analyse du discours,Paris: Hachette, 1991.
REINERT M.,Alceste version 4.0 - Analyse