• Aucun résultat trouvé

3. méthode d’analyse des communications Par alceste

3.2. les PrinciPes fondamentaux de la méthodologie alceste

La méthodologie ALCESTE repose sur un traitement statistique effectué sur un corpus textuel Ce corpus est traité en trois grandes étapes successives qui permet- tent, tour à tour, d’identifier des unités de contexte (uc) qui sont un découpage du corpus original, d’identifier les « formes réduites » du vocabulaire contenu dans le corpus, puis de calculer les occurrences des formes préalablement identifiées par rapport aux uc, à l’aide d’une analyse statistique par classification descendante hiérarchique Chacune de ces étapes est décrite dans les paragraphes suivants, et illustrée d’exemples issus des corpus utilisés pour notre recherche

3.2.1. le découpage du corpus original

Le corpus original, qui correspond dans notre cas aux dialogues échangés au cours de réunions de projets ou aux contenus des courriels et des messages du forum, est découpé en uc selon deux méthodes La première méthode consiste à identifier des critè- res logico-syntaxiques utiles pour les orientations du chercheur Il peut s’agir de phrases, d’énoncés, de tours de parole, etc A l’aide d’un codage particulier (des lignes étoilées que nous décrivons plus loin), les uc sont imposées pour les besoins de la recherche La deuxième méthode effectue un découpage du corpus de façon purement statistique (découpage qui retiendra un nombre fixe d’occurrences), en tenant compte autant que possible des caractères délimiteurs comme les signes de ponctuation

Dans le cadre de notre recherche, c’est la première méthode qui a été retenue, en identifiant chaque tour de parole, chaque courriel ou chaque message du forum en tant qu’uc Les découpages non arbitraires représentent ainsi des unités de contexte élé-

-*Metier_Ergonome

C’est quoi, ça en fait, c’est l’écran ? -*Metier_Ingenieur

C’est l’écran. -*Metier_Ingenieur

C’est l’écran… C’est là-bas, enfin, c’est au fond, hein, c’est au fond. -*Metier_Ergonome

Avec des touches au dessus comme on a vu sur, euh… -*Metier_Ingenieur

C’est ça, dans la zone d’atteinte.

Dans notre exemple, nous avons reproduit les 5 premières uce d’une uci ca- ractérisée par plusieurs variables que nous avons identifiées, en accord avec le codage imposé par ALCESTE, par des mots étoilés (variable « métier » qui a pour modalités « ergonome » ou « ingénieur »)

3.2.2. la reconnaissance des formes

Une fois découpé, le corpus est traité par le logiciel ALCESTE qui identifie et réduit les mots du vocabulaire en des formes élémentaires (verbe à l’infinitif, mot au sin- gulier, etc ) Cette opération, qui s’appuie sur un dictionnaire intégré au logiciel, permet d’optimiser l’analyse des occurrences des termes

A noter que les formes écrites en majuscules sont exclues de l’analyse par AL- CESTE Cette particularité peut être utile lorsque certains mots, ou certaines indica- tions, ne concernent pas directement l’objet de la recherche Pour notre étude, nous avons identifié et exclu tous les noms de personne (afin de respecter l’anonymat) et les noms d’entreprise (pour des raisons de confidentialité)

3.2.3. le calcul des occurrences des formes

A l’issue de ces deux premières étapes, ALCESTE construit un tableau à double entrée comprenant, en abscisse, les uce délimitées et, en ordonnée, les formes élémentaires précédemment identifiées Le traitement statistique effectué est une classification descen-

dante hiérarchique (cdh) Le but est alors d’obtenir, à partir du corpus de base, un petit

nombre de classes définies par le maximum d’homogénéité intraclasses et d’opposition in- terclasses Pour ce faire, le logiciel procède par itération : la première étape consiste, à partir du corpus général, à chercher la partition en deux classes qui maximise le χ² des marges du tableau Ensuite, à chaque pas, l’opération est renouvelée pour la plus grande des classes restantes La procédure s’arrête lorsque le nombre d’itérations demandées est épuisé

Les résultats se présentent donc sous la forme de classes pour lesquelles le lo- giciel calcule la liste des formes et des mots d’origine les plus significativement présents La présence d’un terme dans une classe ne signifie pas que toutes les occurrences de ce terme appartiennent à cette classe Cela signifie que la corrélation statistique (en terme de χ²) entre ce terme et cette classe est plus forte que celle qu’il peut y avoir avec une autre classe

3.2.4. Présentation des résultats

ALCESTE propose plusieurs manières de présenter la répartition des classes identifiées par la cdh

On peut ainsi obtenir un arbre de la classification, appelé dendrogramme, qui est constitué des partitions successives du corpus les plus significatives Navarro et Mar- chand (1994) soulignent que ce découpage possède « un sens psychologique qui reste à attribuer en fonction des hypothèses du chercheur »

Figure 31 : Exemple de dendrogramme issu de l’analyse d’un corpus par

ALCESTE

Les résultats peuvent être aussi présentés sous la forme d’une projection fac- torielle des correspondances qui permet de visualiser sur des axes la distance entre les formes les plus significatives, les variables (c’est-à-dire le mots étoilés) ou les classes L’analyse factorielle des correspondances (afc) procède à une décomposition d’un tableau croisant les formes (en lignes) avec les classes issues de la cdh (en colonnes) Cette présen- tation des résultats se veut simplifiée et plus commode pour l’interprétation La lecture finale se fait sur des graphiques représentant des nuages de points caractéristiques des classes identifiées

les classes retenues par alceste constituent les principaux résultats d’analyse laissés à l’interprétation du chercheur les classes retenues

par alceste constituent les principaux résultats d’analyse laissés à l’interprétation du chercheur

Figure 32 : Exemple d’un graphique issu de l’analyse factorielle des

correspondances