Modèles sur trois variables catégorisées - Psychologie statistique avec R

L’approche par comparaison de modèles multinomiaux conditionnels vue à la sec-tion précédente se généralise sans problème à un nombre quelconque de groupes et par conséquent permet d’analyser les résultats d’études en plans factoriels. Nous avons déjà abordé ce type de problème dans le cadre des modèles binomiaux à la section 7.5. Le type de problème est celui de la comparaison de distributions catégorisées sur des groupes indépendants dans un plan factoriel.

Sexe Scolarité Pas heureux Plutôt heureux Très heureux

<12 40 131 82

H 12 21 116 61

13-16 14 112 55

≥17 3 27 27

<12 62 155 87

F 12 26 156 127

13-16 12 95 76

≥17 3 15 15

Tableau 8.2– Durée de scolarité et bonheur déclaré

L’étude américaine General Social Survey de 1977 (ICPSR, 1978) rapporte le ni-veau de bonheur auto déclaré de sujets (« pas heureux », « plutôt heureux », « très

heureux ») en relation avec la durée totale de la scolarité («<12années », « 12 années », « 13-16 années », «≥17années »). Les données sont dans le tableau 8.2.

Dans ce contexte, les questions qui se posent sont :

1. Y a-t-il une relation entre durée de scolarité et bonheur auto déclaré ? 2. Si oui, de quelle nature est-elle ?

3. La relation entre durée de scolarité et bonheur déclaré (quelle qu’elle soit) diﬀère-t-elle entre les hommes et les femmes ?

Dans ce contexte, la variable « Réponse » joue le rôle de variable dépendante et les variables Genre et Durée de scolarité le rôle de variables indépendantes. On souhaite se faire une idée de leurs influences respectives sur la réponse des sujets, mais aussi de leur interaction éventuelle : l’impact de la durée de scolarité sur le bonheur, si cette influence existe, peut n’être pas de même nature chez les hommes et les femmes par exemple. Plus encore, si interaction il y a, on souhaite pouvoir la définir précisément : l’effet de la durée de scolarité se différencie-t-il chez les hommes et les femmes sur quelques modalités de durée seulement ?

Pour pouvoir interpréter correctement les résultats de l’analyse qui suit, il est utile de se familiariser avec la forme à donner aux modèles conditionnels pour traduire certaines hypothèses simples (tableau 8.3).

Tableau 8.3– Durée de scolarité et bonheur déclaré

Le premier modèle (Ms) a tous ses paramètres libres. C’est le modèle saturé.

Il traduit l’hypothèse que les deux variables Genre et Durée ont un impact sur la distribution de la réponse. Toutes les distributions conditionnelles ligne sont donc différentes. Le deuxième modèle (M₂) pose 12 paramètres différents (dont 8 libres seulement car un paramètre par ligne est le complément à 1 des deux autres) pour les 4 distributions conditionnelles chez les hommes, et la même série de 4 distributions chez les femmes. Ce modèle correspond donc à une hypothèse d’absence d’effet de Genre sur la distribution des réponses, mais à la présence d’un effet de Durée de la scolarité. Le troisième modèle (M₁) pose la même distribution de réponse chez les hommes, pour les 4 durée de scolarité. Il suppose la même structure d’homogénéité chez les femmes, mais avec des paramètres différents. Ce modèle traduit donc l’hypothèse d’une absence d’effet de la Durée, mais d’un effet du Genre sur la distribution de la réponse. Le dernier modèle (Mh) pose la même distribution de réponse dans tous les groupes et traduit donc l’absence de tout effet expérimental pour les variables invoquées du plan d’étude.

On note que toutes nos hypothèses sont dans cette approche traduites par des contraintes d’égalitéen colonnes sur les paramètres. Comme nous l’avons vu, l’in-troduction de contraintes d’égalité en ligne dans un modèle multinomial sur une distribution est possible (voir sous-section 8.2.2) mais rarement signiﬁante dans un contexte de comparaison de groupes. Nous n’étudions pas ici cette possibilité supplémentaire des modèles multinomiaux.

Nous cherchons le meilleur modèle sur la structure intergroupe et il n’est pas nécessairement parmi ces 4 modèles simples. Il existe en effet de nombreux mo-dèles possibles (4140 exactement), obtenus en définissant des contraintes d’égalité différentes sur les 8 groupes de sujets. Ces contraintes d’égalité produisent des re-groupements de distributions en classes d’équivalence,qui n’ont aucune raison de respecter la structure factorielle poséea priori par le chercheur. La manipulation de facteurs par le chercheur est une pure commodité psychologique permettant de nommer des sources d’influence supposées, mais la modélisation peut fort bien faire émerger des structures où la dissociation des facteurs n’a plus guère de sens.

Les psychologues ont l’habitude de dire dans ces cas qu’il y a une interaction entre les facteurs. Il est très important de comprendre que si une telle « interaction » est détectée, cela indique que la définition des facteurs comme sources séparées n’a plus guère de sens (et parler d’interaction non plus du coup). On ne cherchera jamais dans ces cas à quantifier les importances relatives de chaque facteur, car elles ne sont plus séparables. Ici comme dans les modèles binomiaux (et dans les modèles gaussiens vus plus loin), il est définitivement plus simple et plus souple de concevoir ces modèles « factoriels » comme des comparaisons de distributions sur groupes indépendants. Cela permet d’envisager des découpages plus complexes de l’effet expérimental global.

Atelier 8.2 (Modèles multinomiaux factoriels) 1. Charger la librairieAtelieRpar la commande :library(AtelieR)

2. Lancer le moduleAtelier > Calculer > Inférence bayésienne sur table de contingence.

3. Saisir les données dans le champ « Données observées », séparées par des espaces ou des tabulations (voir ﬁg. 8.2), chaque ligne étant séparée par un retour-charriot (un simple copier-coller depuis un tableur fonctionne).

4. Tester pour commencer le modèle de l’homogénéitéM_h. On peut constater que son facteur de Bayes est égal à 1. C’est simplement parce que le facteur de Bayes calculé ici par défaut est justement celui du

Dans le document Psychologie statistique avec R (Page 198-0)