• Aucun résultat trouvé

EXPLORATOIRE SUR LE CONTENU DU

S ECTION 1 – M ETHODOLOGIE DE L ’ ETUDE QUALITATIVE EXPLORATOIRE

2. Méthodologie d’analyse des données

2.1. Analyse de contenu manuelle

2.3.2. L’analyse cartographique des cooccurrences

L’étude d’un texte ou d’un discours et des mots le composant repose sur une analyse des occurrences mais également sur celle des cooccurrences (Tauveron, 2013). S’intéresser à la « cooccurrence généralisée » (Viprey, 2006) permet d’étudier les relations de cooccurrence existant entre les mots d’un même matériau, et ainsi de comprendre leur articulation.

La spatialisation des données offre une multitude d’analyses. La multiplication des graphes renforce à la fois l’exploration et la présentation des résultats (Plantin, 2013). Les logiciels offrent différents niveaux de granularité permettant au chercheur de centrer son analyse sur un phénomène, un nœud ou une communauté en particulier. Dans notre cas, notre attention ne s’est

X Y

Nœud

158 concentrée que sur un élément, la détection de communautés de mots, à savoir « des ensemble de mots qui ont tendance à être cooccurrents préférentiellement les uns avec les autres deux à deux, et à être moins cooccurrents avec d’autres mots appartenant à d’autres communautés » (Tauveron, 2013, p.123). Un graphe de cooccurrences (Véronis, 2004) permet de déterminer l’organisation modulaire du corpus. En d’autres termes, le contenu du matériau peut être découpé en classes de modularité ou communautés selon les liens que les mots entretiennent les uns par rapport aux autres. Cette méthodologie a l’avantage d’offrir la richesse de l’analyse de contenu et l’aspect visuel de la présentation des résultats de la spatialisation des données.

Afin de parvenir au résultat escompté et d’identifier les « partitions naturelles » du réseau (Blondel et al., 2008, p.3), nous recourons à l’algorithme de modularité de Blondel et al. (2008), parfois appelé « algorithme de Louvain », implémenté dans le logiciel Gephi. La modularité (Q) mesure la qualité du partitionnement des nœuds d'un graphe (Newman, 2006). Elle est comprise entre -1 et 1. Une valeur Q supérieure à .300 indique une structure de communautés significative, autrement dit, que les liens entre les nœuds ne sont pas le fruit du hasard. L’algorithme de modularité de Blondel et al. (2008) se fonde sur la répartition des liens entre les nœuds. Chacune des catégories identifiées doit être composée de nœuds qui partagent entre eux davantage de liens qu’ils n’en partagent avec les nœuds appartenant aux autres catégories (Chen et Ji, 2010). Au terme du processus, tous les nœuds doivent appartenir à une catégorie et une seule.

Le logiciel permet au chercheur d’abaisser ou d’augmenter la résolution de l’algorithme de modularité (Lambiotte, Delvenne et Barahona, 2009). La valeur donnée à ce paramètre permet de régler plus ou moins le nombre de communautés identifiées. Abaisser la valeur de la résolution permet d’obtenir des communautés plus petites et donc plus nombreuses et inversement lorsque la valeur de la résolution est augmentée. Nous avons fait le choix de conserver la résolution de base fixée à 1.0 qui est utilisée dans la plupart des recherches.

L’analyse de la modularité du graphe de cooccurrences fournit de manière automatique un découpage du matériau à analyser sur lequel le chercheur s’appuie par la suite dans sa tentative de recherche de sens et de cohérence aux classes de modularité identifiées par l’algorithme. Cette phase d’interprétation rejoint la finalité de l’analyse thématique puisque le chercheur tente de déceler une thématique centrale pour chacune des communautés proposées.

159 2.3.3. Le logiciel Gephi et la configuration d’analyse retenue

Gephi est un logiciel open source d'analyse et de visualisation de réseaux représentés sous forme de graphes (Bastian, Heymann et Jacomy, 2009). S'inspirant des trois logiciels de référence que sont Pajek, Guess et TouchGraph, Gephi est né en 2008 avec pour leitmotiv d’ouvrir l'analyse de réseaux au plus grand nombre. Le logiciel est capable d'importer un simple fichier Excel au format CSV composé des mots à analyser et de permettre leur visualisation dans une variété de formes selon l'algorithme que l'utilisateur souhaite appliquer.

Notre choix s’est tourné vers le logiciel Gephi pour plusieurs raisons. Tout d’abord, il existe une certaine compatibilité avec le logiciel d’analyse de données textuelles Tropes. En effet, à partir des résultats de l’analyse sémantique réalisée par le logiciel Tropes, Gephi est en mesure de créer des graphes de cooccurrences. Outre son interface plutôt conviviale et simple d'utilisation, Jacomy et al (2014) mettent également en avant la supériorité de Gephi en termes de performance et sa capacité à offrir à l'utilisateur une visualisation de la spatialisation de ses données en temps réel lui permettant d'affiner son travail en changeant facilement les paramètres de visualisation comme la taille des nœuds et des labels, les algorithmes de classification, etc. Par ailleurs, le module d’analyse statistique incorporé à Gephi permet la réalisation de graphes plus complets, ce qui n’est pas le cas d’autres logiciels comme VOSViewer (Leydesdorff et Rafols, 2012, p.330). Autre point fort du logiciel, la réactivité de l’association « Gephi Consortium » chargée du développement du logiciel et des membres de la communauté Gephi pour porter assistance aux utilisateurs47 (Bruns, 2012).

En fonction des algorithmes de spatialisation utilisés lors de l’élaboration d’un graphe, le même jeu de données peut parvenir à des représentations visuelles différentes. Nous avons fait le choix de recourir à l’algorithme de spatialisation des données Force Atlas 2. Il fonctionne notamment en espaçant les nœuds non connectés et en rapprochant ceux qui au contraire sont connectés ; la position d’un nœud ne valant que par sa position relative par rapport à un autre (Jacomy et al., 2011). Pour plus de lisibilité, nous lui avons également appliqué l’algorithme d’ajustement des labels afin d’éviter le chevauchement du nom des nœuds. Dans la mesure où nous nous interrogeons avant tout sur le contenu du souvenir plutôt que sur son organisation, nous avons fait le choix d’un graphe non orienté, le but étant d’identifier les mots utilisés ensemble plutôt

160 que de savoir que tel mot est utilisé avant tel autre mot. Ce choix se justifie aussi par le fait que le guide d’entretien fournit les thématiques à aborder mais qu’elles ne sont pas toujours abordées dans le même ordre dans tous les entretiens.

Nous avons opté pour une coloration des nœuds selon leur classe de modularité calculée à partir de l’algorithme de modularité de Blondel et al. (2008) qui compare la densité des liens à l’intérieur et entre les communautés. Chaque mot correspond à un nœud. La taille des nœuds peut varier selon plusieurs indicateurs (exemples : le degré, le degré pondéré, la centralité des vecteurs propres, la centralité d’intermédiarité, la classe de modularité, etc.). Nous avons fait le choix d’une représentation des nœuds selon leur fréquence d’apparition dans le texte. Autrement dit, les nœuds les plus gros sont ceux qui apparaissent le plus souvent dans les souvenirs d’expérience de magasinage. Lorsque deux mots sont employés ensemble, ils sont reliés par un lien. La taille des liens permet de prendre en compte la force de la relation unissant deux mots. Les mots les plus souvent employés ensemble par les répondants présentent les liens les plus épais.