Comprendre les réponses par une liaison observée entre deux variables: les tris croisés

Considérations d'ordre méthodologique

1. Analyse des données en recherche quantitative

1.2. La statistique explicative ou inférentielle

1.2.1. Comprendre les réponses par une liaison observée entre deux variables: les tris croisés

L’analyse des relations entre les variables constitue le deuxième passage obligé après la description et l’agrégation des informations. En effet si la statistique descriptive permet de tracer un portrait synthétique de l’ensemble des données d’un échantillon, l’analyse statistique inférentielle vise à saisir la relation entre les caractéristiques d’une variable ou d’une population et celles observées dans une autre variable ou une autre population.

Les tableaux croisés, appelés aussi tableaux de dépendance ou tableaux de contingence, servent à vérifier les hypothèses formulées, à comprendre la distribution des comportements et opinions entre sous-groupes de répondants, ou encore à faire des associations entre réponses à des questions qualitatives.

L'analyse des relations entre les variables est un passage obligé: il faut que le chercheur réalise un tri croisé en prenant en compte simultanément deux variables et montre qu'il a bien vu ce qui est caché et qui lie les variables et produit le phénomène ou en justifie l'existence. Il doit être vigilant pour se souvenir qu'une variable peut en cacher une autre: une profession peut cacher un diplôme; un âge peut cacher des convictions ethniques ou religieuses.

La construction d'un tableau croisé implique qu'on observe en même temps les modalités de réponses à deux questions pour un répondant.

Chaque couple de réponses se situe dans une case du tableau; on totalise leur nombre dans chaque case.

Les variables à mettre en relation sont celles qui correspondent aux termes de l'hypothèse. Exemple: âge et croyance religieuse dans une hypothèse où ces deux variables sont mises en relation. Il s'agit pour l'essentiel de croiser deux variables et d'obtenir un tableau de contingence qui met en évidence la relation pouvant exister entre deux variables ou combinaisons de variables conformément à la manière dont ces relations ont été présupposées dans les hypothèses. Il s'agit de croiser des variables, d'établir les liens entre les variables pour pouvoir par la suite donner du sens à ces liaisons.

1^erexemple: Sexe et assiduité aux funérailles

On veut savoir si le sexe est un élément qui intervient dans l’assiduité aux funérailles. On établit le tableau suivant croisant la variable indépendante

« sexe » et la variable dépendante « assistance régulière aux funérailles ».

variable indépendante

L’effet de la variable indépendante sur la variable dépendante est approchée colonne par colonne où on considère le plus (ou les plus) fort(s) pourcentage(s). On observe sur ce tableau que des femmes vont plus souvent aux funérailles que les hommes qui, inversement sont plus nombreux à ne pas y aller. Le tableau confirme la relation entre le sexe et l’assiduité aux funérailles, en faveur des femmes.

2^erexemple: Niveau d’études et degré d’accord avec l’opinion sur la religion (« La religion, c’est l’amour des autres »)

En considérant les colonnes, on note que l’accord total s’accroit de la 1^ère année (58%) à la quatrième année-maitrise (83%), et inversement le «Plus tôt d’accord » décroit de la 1^èreannée (35%) à la maitrise, avec une chute de 13%. Le niveau d’étude a une incidence sur le degré d’accord, mais a peu

Variable indépendante

Niveau d’études

Variable dépendante Opinion sur la religion (en %) Tout à

d’effet sur le désaccord, en termes de « Plutôt pas d’accord » et « Pas du tout d’accord » : les pourcentages sont insignifiants.

Si l’on prend en considération le poids relatif des modalités de la variable dépendante, en faisant une lecture, ligne par ligne, on observe ceci : un accord total en maitrise à hauteur de 83% contre un « Plutôt d’accord » de 13%, donc l’accord total est 6 fois plus élevé que le « Plutôt d’accord» ; en 1^ère année, le rapport est en dessous de la moitié (58% et 35%) ; en 2^ème année on a un rapport de moitié (62% et 33%) ; et en licence un rapport de presque un tiers (69% et 26%).Ainsi, le niveau d’étude a une incidence sur le degré d’accord mais diversement.

Et pour vérifier si le hasard a pu donner la répartition telle qu'elle se présente sur le tableau (hypothèse d'indépendance) ou au contraire s'il y a une liaison notable entre les deux variables, on recourt à la technique statistique du test de l'hypothèse d'indépendance qu'est le X²(le khi - deux).

1.2.2 .Contrôler les relations entre plus de deux variables: analyse multivariée

L'analyse multivariée consiste à croiser simultanément plus de deux variables. Le croisement de deux variables permet de constater l'existence de relation entre variables, une association, mais n'autorise pas à parler en termes de cause à effet. D'ailleurs, il n'est pas toujours facile de décider quelle est la variable explicative (variable indépendante), et quelle est la variable à expliquer (variable dépendante) ; il y a aussi que les deux variables peuvent être toutes deux influencées par une troisième.

Pour être sûr qu'une liaison observée est une relation véritable, il faut passer par l'analyse multivariée et donc par le contrôle des variables: on introduit progressivement de nouvelles variables dans la relation à deux variables, pour examiner leurs effets. La nouvelle variable dont l'effet est contrôlé s'appelle la variable test.

L'analyse causale, si elle ne peut découvrir «la» cause du phénomène, peut révéler un ensemble complexe de facteurs interdépendants qui contribuent à expliquer ce phénomène. On peut par exemple étudier la probabilité de vote en fonction de variables explicatives comme l'orientation idéologique ou religieuse, l'âge, la profession, le patrimoine ...

Retenons que la relation entre deux variables (indépendante et dépendante) est susceptible d’être déterminée à son tour par d’autres variables, et en particulier celles que l’on peut contrôler dans le cadre de l’enquête, c'est-à-dire les variables de contrôles. On peut, de manière volontaire, introduire une variable test entre la variable indépendante et la variable dépendante pour vérifier son incidence sur la relation supposée.

1^er exemple: Milieu social et lecture des quotidiens Ivoiriens en fonction du sexe. On veut savoir si l’inégalité devant la lecture des quotidiens est la même quel que soit le sexe.

En considérant les colonnes, on constate que les lecteurs hommes de milieu supérieur lisent plus que les lecteurs hommes de milieu populaire. Les lectrices de milieu supérieur lisent plus que les lectrices de milieu populaire. Quel que soit le sexe, les lecteurs (hommes et femmes) de milieu supérieur (cadres) consacrent plus de temps à la lecture des quotidiens que les lecteurs de milieu populaire. On observe que les hommes lisent plus que les femmes en milieu supérieur (38%

contre 29%) comme en milieu populaire (22% contre 12%).

Le regard porté sur les lignes fait reconsidérer d’une certaine façon l’effet associé au milieu social de la famille, l’effet donc de la variable indépendante (milieu social) sur la variable dépendante (lecture de quotidiens). Il ressort que les lectrices de milieu populaire lisent proportionnellement moins (88% contre 12%) que les lecteurs du même milieu (78% contre 22%) ; que la différence entre les lecteurs de milieu supérieur (rapport de plus de la moitie 71% contre 29%) est plus grande qu’entre les lectrices du même milieu supérieur (le rapport est moins de la moitié, 62% contre 38%).

Quoi qu’il en soit, l’hypothèse d’une influence de milieu social sur la lecture des quotidiens n’est pas à rejeter, mais l’appartenance sexuelle est plus déterminante, au profit des hommes.

2^èmeexemple: Niveau d’études en fonction de l’écoute des émissions politiques et de l’âge.

On veut savoir si le niveau d’études (variable indépendante) a une incidence sur l’écoute des émissions politiques (variable dépendante). A toutes fins utiles, on associe à la variable indépendante la variable test qu’est l’âge. Et on se demande si l’âge joue un rôle différent aux deux niveaux d’instruction identifiés.

Variable indépendante Niveau d’études

Variable dépendante

Ecoutent des émissions politiques en (%) Ecoutent N’écoutent

En considérant les colonnes, l’une après l’autre, qui indiquent l’action de la variable indépendante, on observe que les personnes de niveau supérieur jusqu’à 40 ans et après 40 ans sont de celles qui écoutent le plus les émissions politiques ; inversement, les personnes de niveau inférieur, jusqu’à 40 ans et après 40 ans sont les plus nombreuses à ne pas écouter les émissions politiques. Donc au niveau d’instruction supérieur, l’intérêt est plus élevé chez les plus âgés (52% contre 32%) ; au niveau d’instruction inférieur, c’est le contraire, l’intérêt est plus faible chez les plus âgés (19%

contre 28%). L’âge introduit joue un rôle différent aux deux niveaux.

L’action de la variable indépendante doublée de celle de la variable test (âge) étant établie, il faut prendre en compte le poids relatif aux modalités de la variable dépendante. En faisant une lecture horizontale, ligne par ligne, on découvre ceci : l’écart entre les personnes de niveau supérieur jusqu’à 40 ans qui écoutent ou n’écoutent pas est plus important (environ de moitié : 68% contre 32%) ; au

niveau inférieur l’écart est relativement plus prononcé entre les personnes âgées, de plus de 40ans (81% et 19%), c'est-à-dire 4 fois plus élevé.

Dans tous les cas, on est ici dans le contexte d’une interaction entre les deux variables explicatives (indépendante et test) : présentes en même temps, elles permettent d’analyser correctement l’écoute des émissions politiques.

Pour expliquer que des résultats, des chiffres peuvent cacher d’autres faits et d’autres relations plus pertinentes, voici un tableau avec des données relatives au fait qu’on croit au mariage ou non. La préoccupation : y a-t-il une différence entre les hommes et les femmes ? On prend soin de faire entrer en ligne de compte la variabletest« activité professionnelle ».

3^èmeexemple :Sexe et « croire au mariage » en fonction de l’activité professionnelle

Les pourcentages montrent que si l’on se contente de comparer les hommes aux femmes on s’aperçoit que les femmes croient plus au mariage que les hommes. Si l’on tient compte de la variable test « activité professionnelle » qui découpe les deux catégories de personnes en actifs et en non actifs, on découvre que les femmes actives ont des taux similaires à ceux des garçons actifs (75% et 72%) et des taux différents de ceux des femmes au foyer (86%).

L’introduction de la variable test révèle donc que le fait de croire au mariage n’est pas directement lié au sexe, mais davantage à l’exercice ou non d’une activité professionnelle.

Pour aller plus loin, on peut recourir à des calculs statistiques réalisés informatiquement. Il est possible de créer des groupes homogènes et contrastés (typologies ou classifications) ou de résumer un grand nombre de variables liées entre elles par un «facteur» ou un nombre restreint de facteurs

(analyses factorielles) ou encore de présenter de façon synthétique et optimale des proximités entre modalités (analyse des correspondances).

Dans le document RECHERCHE ET METHODOLOGIE EN SCIENCES SOCIALES ET HUMAINES (Page 178-184)