• Aucun résultat trouvé

Rapport de vraisemblance

Dans le document Psychologie statistique avec R (Page 64-70)

2.3 Lien de deux variables catégorisées

2.3.2 Rapport de vraisemblance

Le lograpport de cotes n’est utilisable que si l’une des deux variables (ayant souvent statut de variable dépendante) est simplement binaire (gaucher/droitier). Dans le cas général où l’on étudie la liaison de deux variables qualitatives à plus de deux modalités, on peut utiliser l’approche par rapport de vraisemblance4.

Nous abordons ici de manière purement descriptive cette statistique, à quoi nous donnerons une signification plus statistique plus loin, à partir d’une réflexion sur la notion d’indépendance statistiquede deux variables qualitatives. Dans l’exemple ci-dessus, nous dirons que la préférence latérale manuelle et le sexe sont des variables indépendantes l’une de l’autre si la fréquence vraie de gauchers est la même chez les garçons et chez les filles.

Ce n’est apparemment pas strictement le cas dans nos données, mais nous cher-chons à construire un indice d’association qui serait nul dans le cas de l’indépen-dance parfaite et d’autant plus élevé que les fréquences seraient très différentes.

Pour cela nous allons comparer le tableau des fréquences conditionnelles tel qu’il est observé, avec celui qu’on devrait observer si pour le même effectif total, nous avions égalité parfaite des fréquences.

Sur l’ensemble des deux groupes, garçons et filles, on note que la fréquence mar-ginale de gauchers est de :

fG= nG

N = 78 + 52

560 + 595 = 130

1155 0.11.

S’il n’y a pas de relation entre sexe et préférence manuelle, nous devrions avoir 11%

de gauchers dans les deux groupes. On peut superposer, au tableau des fréquences observées f dans l’étude, le tableau des fréquences f qui se déduit de l’hypo-thèse d’indépendance, pour faire éventuellement apparaître la divergence (ou la concordance) entre les deux :

4. Il est usuel en psychologie d’utiliser dans ces cas une statistique diteχ2 de Pearson. Elle ne sera pas présentée dans ce livre car son domaine d’application est beaucoup plus restreint que celui du rapport de vraisemblance et du facteur de Bayes, qui seront étudiés dans les chapitres 7 et 8.

Fréquences observées

Une manière commode de résumer l’écart entre données observées et données théo-riques est de les présenter sous forme de rapports de fréquences :

Genre/Latéralité Gauchers Droitiers

Plus les rapports de fréquences sont différents de 1, dans un sens ou dans l’autre, plus on peut dire que les variables sont liées l’une à l’autre (ou que l’on s’écarte de la situation d’indépendance). On peut aussi transformer log ces rapports de fréquences : les lograpports seront alors d’autant plus éloignés de 0 qu’il y a forte dépendance entre les variables. Cet écart est représenté ci-dessous pour une obser-vation :

Au final, pour construire une mesure numérique unique d’écart à l’indépendance qui intègre tous les lograpports, en les pondérant par les nombres d’observations concernées, on définit la mesure globale :

R=nG|MlnfG|M

fG|M +nD|MlnfD|M

fD|M +nG|FlnfG|F

fG|F +nD|FlnfD|F

fD|F, (2.1) qui a l’avantage de prendre en compte toutes les observations disponibles dans l’étude.

On appellerapport de vraisemblancecet indice global, qui est égal à 0 dans le cas de l’indépendance (empirique) parfaite, et d’autant plus grand en valeur absolue qu’on s’éloigne de la situation d’indépendance.

Sur notre exemple, on trouve :

R= (78×0.241)(482×0.034)(52×0.200) + (543×0.022)

3.915.

Cet indice global détecte une éventuelle liaison globale entre les deux variables, sans donner d’indication précise sur la localisation de cette liaison. On la fait apparaître en regardant les quatrecontributions au rapport de vraisemblance :

Genre/Latéralité Gauchers Droitiers

Masculin nG|MlnfG|Mf

G|M 18.72 nD|MlnfD|Mf

D|M ≈ −14.46 Féminin nG|FlnfG|Ff

G|F ≈ −10.4 nD|FlnfD|Ff D|F 10.86

Le signe de ces écarts révèle les cases où l’événement en question est surreprésenté (signe positif) ou sous-représenté (signe négatif) par rapport à ce qu’on attendrait sous l’hypothèse d’indépendance (ou d’égalité parfaite des fréquences de gauchers dans les deux groupes). L’événement « être gaucher » apparaît donc surreprésenté chez les garçons et sous-représenté chez les filles.

On note que si les deux fréquences étaient égales, les contributions seraient toutes nulles et le rapport de vraisemblance aussi. D’autres propriétés et applications importantes du rapport de vraisemblance seront vues à partir du chapitre 7.

Algèbre des événements

A. De Morgan (1806-1871)

Dans sa célèbre tâche de psychologie cognitive dite de « sé-lection de carte », Wason (1966) présente au sujet 4 cartes.

Chaque carte comporte un chiffre sur une face et une lettre sur l’autre. Les quatre faces apparentes montrent les sym-boles A, D, 4 et 7 respectivement. A propos de ces quatre cartes, on affirme que : « si une carte comporte une voyelle sur une face, alors elle comporte nécessairement un nombre pair sur l’autre face » (fig. 3.1). Mais on demande au sujet de vérifier que c’est bien le cas, sans exception, en procé-dant aux retournements de cartes nécessaires et suffisants.

Quelles cartes retourneriez-vous ?

Fig. 3.1 – Jeu de sélection de carte (Wason, 1966). Quelle(s) carte(s) faut-il re-tourner pour vérifier la véracité de l’affirmation « si une carte comporte une voyelle sur une face, alors elle comporte un nombre pair sur l’autre face » ?

Si vous avez choisi de retourner les cartes « A » et « 4 », sachez que 95% des sujets répondent comme vous... mais que ce n’est pas correct, pour des raisons que nous allons détailler. Cette erreur est très instructive, d’une part pour l’étude du fonctionnement cognitif spontané, mais aussi parce qu’elle peut nous rendre vigilant à la bonne manipulation des hypothèses du type « si... alors », qui sont au cœur de la démarche scientifique.

Nous nous intéressons dans ce chapitre à une algèbre spécifiquement dédiée à l’étude d’événements qualitatifs, dont on dit qu’ils sont « vrais » ou « faux », c’est-à-dire qu’ils se produisent ou non, dans un cadre appliqué ou expérimental. On doit à Kolmogorov les premières formalisations d’une telle algèbre, fondée sur la théorie des ensembles. Ces notions, de prime abord un peu abstraites, seront des outils précieux pour raisonner sur des hypothèses et construire certains de nos calculs de probabilité sur des données bien concrètes. Elles amèneront aussi en fin de chapitre une réponse simple au problème de la sélection de cartes de Wason.

3.1 Notion d’ensemble

Construire un modèle de probabilités pour un phénomène donné suppose avant tout de définir l’ensemble des événements qui caractérisent ce phénomène. Sur cet ensemble, nous serons amenés à examiner des événements ayant une valeur psychologique particulière. La théorie des ensembles fournit un cadre idéal pour pouvoir raisonner sur des éventualités.

Définition 3.1 (Ensemble)

Unensembleest une collection d’objets ou d’événements qu’on appelle les éléments de l’ensemble. En tant qu’éléments de cet ensemble, ces objets ou événements sont considérés comme identiques.

On peut définir un ensemble :

– soit en l’énumérant exhaustivement quand c’est possible. On écrit alors entre accolades et séparées par des virgules les éventualités. Exemple : les issues pos-sibles d’un tirage de dé sont{1,2,3,4,5,6};

– soit en spécifiant la propriété commune à tous les éléments de l’ensemble, si c’est possible. Exemple : l’ensemble des sujets de moins de 10 ans ;

– soit en donnant une règle de construction de l’ensemble. Exemple : l’ensemble des entiers naturelsN={0,1,2,3...}peut être construit itérativement en ajou-tant une unité au dernier élément déjà inclus.

On définit sur les ensembles plusieurs types de relations et d’opérations.

Appartenance

Siω(lire « petit omega ») est un élément d’un ensemble nomméΩ(lire « omega » ou « grand omega »), on écrit :ω∈Ω(«ωappartient àΩ»). On peut le représenter en traçant une surface fermée (un « diagramme de Venn ») à l’intérieur duquel un point vient symboliser l’élément (voir fig. 3.2).

Inclusion

On dit qu’un ensemble A est inclus dans un ensemble Ω si tous les éléments de A appartiennent àΩ. On écrit ω A ω Ω (« petit omega appartient à A implique petit omega appartient à Ω»). L’inclusion s’écritA⊂Ω(«A est inclus dansΩ»). On dit aussi queAest une partie ou un sous-ensemble deΩ.

On note que, d’après cette définition,Ωest inclus dans lui-même. Si on a simulta-némentA⊂ΩetΩ⊂A, alorsAetΩsont les mêmes ensembles et on écritA= Ω (définition d’une égalité sur les ensembles).

Fig. 3.2– Relations entre éléments, parties et ensembles. L’élément ωappartient à A et Aest inclus dansΩ. Les parties Aet A¯ sont complémentaires, les parties Aet B sont disjointes.

Ensemble vide

On appelleensemble vide l’ensemble qui ne contient pas d’élément. On le note∅.

Ensemble des parties

Pour tout ensemble, on peut définir l’ensemble de ses parties, noté℘(Ω). On peut en faire la liste exhaustive siΩ est fini. Par exemple, siΩ ={a, b, c}, ses parties sont,{a},{b},{c},{a, b},{a, c},{b, c}et {a, b, c}. On écrit :

℘(Ω) ={∅,{a},{b},{c},{a, b},{a, c},{b, c},{a, b, c}}.

On peut dénombrer cet ensemble des parties pour un ensemble fini en décomposant la construction des parties en plusieurs étapes : pour chaque élément, je décide de l’inclure ou non pour constituer une partie. Il y a donc à chaque élément deux issues possibles de choix et siΩcompte néléments, on pourra donc construire :

2×2×2×...×2

nfois

= 2n parties.

On vérifie qu’on a bien trouvé 23 = 8parties de l’ensemble Ω = {a, b, c}, dont l’ensemble vide (ou partie vide) et l’ensemble Ω lui-même (qu’on appelle aussi dans ce contexte la partie pleine).

Complémentaire

Soit A une partie de Ω. On appelle complémentaire de A par rapport à Ω, noté A¯ (prononcer « A-barre », ou « non-A »), l’ensemble de tous les éléments de Ω qui n’appartiennent pas à A. On note ω ∈A¯ ω /∈ Aω appartient à A¯ est équivalent àω n’appartient pas àA»). Symétriquement,Aest le complémentaire deA¯:A¯¯=A.

Puisqu’aucun élément de Ωne lui est extérieur, son complémentaire est vide. On écritΩ =¯ ∅.

Ensembles disjoints

Deux partiesAetBde℘(Ω)sontdisjointes si elles n’ont aucun élément commun.

Si les éléments deΩsont des éventualités, les ensembles disjoints correspondent à des événementsincompatibles.

Dans le document Psychologie statistique avec R (Page 64-70)