• Aucun résultat trouvé

1.1.5. Méthodologie de la recherche

1.1.5.2. Les enquêtes et entretiens in situ

À l’échelle du département de Téra et des communes qui le constituent, nous avons complété le processus d’investigation par une série d’entretiens semi-directifs et une enquête, seules méthodes habilitées à la prise en compte des réalités du terrain au niveau local et aux pratiques socio-spatiales.

 Méthodologie des enquêtes, entretiens et l’analyse des données

L’enquête et l’entretien semi-directif sont des approches complémentaires qui font appel à une méthodologie statistique commune pour exploiter au mieux les contenus des informations collectées in situ. Nous verrons en détail plus bas les choix retenus pour fixer un échantillon représentatif tant du point de vue géographique que thématique.

Notons d’ores et déjà qu’à la différence de l’enquête, les entretiens semi-directifs consistent à sélectionner un nombre réduit d’individus (ici : autorités administratives et coutumières, responsables des services techniques, élus locaux, etc.) en fonction de critères de compétence et/ou d’administrations reconnus en rapport avec le sujet d’étude. À ce petit nombre sera donc demandée une grille d’investigation très poussée et complète (annexe 4).

À contrario, l’enquête repose sur un questionnaire moins fouillé, plus succinct mais elle concernera en revanche le plus grand nombre d’individus (400 dans le cas précis). On privilégie dès lors les questions fermées14 ou qualitatives qui se prêtent facilement à un codage adapté à une population importante. Les entretiens en revanche reposent sur un discours, de la sémantique approfondie qui nécessite une l’analyse du contenu poussée, exigeante et délicate à mener. En quelque sorte, il faut extraire la « substantifique moelle » du

14

52 discours pour le résumer en une liste de points saillants, d’idées clés qui composent dès lors un champ nouveau de variables qualitatives et quantitatives qui se prêtent au codage et donc à l’analyse des données. On peut dire qu’à une translation près, nous sommes en présence de matrices identiques tel que traduit dans la figure 1.1.23.

Figure 1.1.23 : les matrices issues de l’enquête et des entretiens

D’un point de vue statistique, outre la phase de dépouillement c’est-à-dire de description univariée, on se trouve face à deux matrices à n et m15 dimensions pour lesquelles on cherche une quelconque structure qui sous-tend l’organisation des données. On a recours à toute la batterie de la statistique déductive, les analyses : univariée ; bivariée ; multivariée de type variable indépendante et variables dépendantes ; multivariée plus global de type analyse factorielle en général. C’est la nature des données qui imposera in fine le choix des éléments statistiques comme le résume la figure 1.1.24.

15

53

Figure 1.1.24 : chaîne méthodologique de traitement de l’information Source : LAFFLY D. (2005)

Au-delà des méthodes statistiques on cherche à réduire le nombre de dimensions initiales du nuage de points formés par les données dans le but d’y voir plus clair, tout simplement. C’est-

54 à-dire déterminer comment les variables et les individus, au sens statistique, s’organisent mutuellement.

Dans le cas de l’enquête, le grand nombre d’individus assurent la meilleure représentativité des variables (questions) arrêtés à priori. On connait en premier le contenu thématique attendu et en second la ou les relations des individus à ce contenu avec comme garant de représentativité du nombre élevé de personnes enquêtées.

Dans le cas des entretiens on connait à l’inverse les personnes enquêtées, au nombre réduit, mais au « savoir » supposé « reconnu ». C’est de l’analyse du contenu de leur discours qu’un nombre important de variables sera déterminé pour fixer a posteriori la sémantique de la thématique. On compte comme garant la présupposée connaissance des interlocuteurs.

Enquêtes et entretiens sont des protocoles robustes complémentaires mais extrêmement délicats à mobiliser. Il est beaucoup plus difficile de mesurer une opinion qu’une distance, par exemple, mais cela n’empêche en rien d’y appliquer in situ une métrique statistique. Pour le questionnaire on tente généralement un test au cours d’un premier essai exploratoire.

Les méthodes présentées plus bas résument notre investigation statistique mais nécessiteraient un renvoi à des ouvrages spécialisés pour une formalisation rigoureuse de la mathématique mobilisée. De plus, nous avons focalisé l’analyse statistique sur les données issues de l’enquête, les entretiens sont pour l’heure exploités uniquement au niveau du discours.

 L’analyse univariée

Également appelée dépouillement ou tri à plat des enquêtes. On cherche à déterminer les caractéristiques propres à chaque variable :

- Quantitative (âge, poids, densité, taux, etc.)

On cherche à définir les paramètres statistiques qui permettent de mesurer au mieux les variables : position (minimum, maximum, moyenne arithmétique, etc.), amplitude (amplitude, interquartile, etc.), dispersion (variance, écart-type, etc.) et forme (coefficient d’asymétrie). On génère également des graphes donnant à « voir » la forme de la distribution :

55

Figure 1.2.25 : graphe de distribution de fréquences cumulées et boîtes à moustaches

- Qualitative (variable à choix unique, choix multiple avec ou sans préférence, etc.) On cherche à déterminer le nombre de modalités différentes. Pour chaque modalité, leur occurrence et/ou fréquence ainsi que les graphes suivants :

Secteur bâtons compilés bâtons

Figure 1.1.26 : représentations des occurrences

 Analyse bivariée

On distingue trois méthodes selon la nature des données mises en relation (cf. tableau .1.11). Toutes ont en commun la même question : existe-t-il un lien entre les variables et, si c’est le cas, quelle est sa représentativité voire sa forme ?

56 Quantitative Qualitative

Quantitative Régression ANOVA

Qualitative ANOVA Chi2

Tableau 1.1.1 : analyse bivariée

 Régression et ajustement polynomial

Bien que difficile à présenter en détail d’un point de vue mathématique, la méthode de régression s’explique assez facilement d’un point de vue graphique (figure 1.1.27). Si un lien statistique existe entre une variable X et une autre Y, ce lien doit se « voir » dans un graphique de type nuage de points. À l’inverse, s’il n’y a pas un lien entre les valeurs de X et celles de Y, là aussi, cela doit s’exprimer clairement d’un point de vue graphique.

57 La différence entre la valeur observée (X ou Y) et la valeur estimée ou théorique (X’ ou Y’) est appelée résidu, elle s’exprime graphiquement comme suit :

Figure 1.1.28 : graphe de résidu

La variable explicative est dite indépendante, la variable à expliquer est dite dépendante. Les résidus sont toujours perpendiculaires à la variable indépendante.

Une liaison linéaire signifie que les valeurs de la variable Y varient de manière croissante ou décroissante en même temps que varient les valeurs de la variable X. On traduit cela par une équation affine ou polynôme de degré 1 :

Y’ = a

1

X + b

1

ou X’ = a

2

Y + b

2

La position de la droite la plus significative est celle qui minimise le carré de la somme des résidus, c’est l’ajustement par le moindre carré.

Notons que les droites passent obligatoirement par les moyennes de X et de Y en statistique régressive linéaire. Le cosinus de l’angle

ά

formé entre les deux droites (X explique Y et Y explique X) correspond au coefficient de corrélation :

58

ά

0 90° 180°

cos

ά

1 0 - 1

graphe

Tableau 1.1.2 : coefficient de corrélation

L’intensité de la relation est donnée par le coefficient de détermination qui est le carré du coefficient de corrélation (exprimé de 0 à 1 ou de 0 à 100 %). On peut généraliser le raisonnement à des dimensions non linéaires lorsque la forme sur laquelle s’aligne les points est curviligne. On porte alors le polynôme de degré n :

degré 2 X’ = a1X² + b1X + б1

degré 3 X’ = a1X3 + b1X² + c1X1 + б 1

Les résidus sont calculés comme précédemment et on parle de coefficient de corrélation et de détermination non-linéaires.

 Analyse de Chi2

Avec deux variables qualitatives la solution retenue consiste en quelque sorte à prêcher le faux pour connaître le vrai. Il n’existe pas de méthode pour définir un lien statistique entre deux variables qualitatives mais on sait en revanche démontrer leur indépendance totale donnée par la formule suivante :

59