• Aucun résultat trouvé

Variable qualitative ordinale

Dans le document Psychologie statistique avec R (Page 23-26)

1.2 Structure de la mesure

1.2.2 Variable qualitative ordinale

La variable « Motivation » a pour ensemble de modalités UM OT = {a, b, c, d}. Les modalités de cette variable sont également symboliques, non numériques. Elle contient néanmoins une information plus riche que la variable précédente, car il existe une relation d’ordre au sein de ses modalités. Les degrés de motivation sont tels que a < b < c < d. Ces modalités viennent indiquer symboliquement des niveaux de motivation croissants, dont on peut supposer qu’une valeur numérique existe psychologiquement, mais que notre processus de mesure ne sait pas appré-hender autrement que sous la forme de réponses verbales, symboliques, ordonnées.

Définition 1.8 (Variable ordinale)

On appelle variable ordinale une variable dont l’ensemble des modalités est non numérique mais ordonné.

On choisit parfois en psychologie de présenter sous forme pseudo-numérique les modalités de variables ordinales. Par exemple, on pourrait représenter les quatre niveaux de motivation par les étiquettes « 1 », « 2 », « 3 » et « 4 ». Ces modalités n’en seraient pas pour autant numériques, et le calcul d’une somme ou d’une moyenne n’aurait strictement aucun sens sur de telles « valeurs ». Nous pourrions tout aussi bien coder en +, ++, +++, ++++ ou encore « 0 », « 1 », « 100 »,

« 36000 », où l’on voit que les écarts n’ont pas de sens numérique2.

2. C’est d’autant plus crucial à souligner que c’est une pratique courante en psychologie que de faire comme si de telles variables étaient numériques. Cela n’est cependant pas acceptable

Distributions

On peut condenser la suite des valeurs de réponse de motivation des patients sous la forme d’un tableau de distribution d’effectifs et de fréquences. La structure d’ordre permet par ailleurs de définir un nouveau type de comptage par cumul des effectifs ou des fréquences sur les modalités ordonnées.

Définition 1.9 (Effectif cumulé)

On appelle effectif cumuléNk à la modalitéuk le nombre d’observations de moda-lité égale ou inférieure àuk.

Le cumul peut aussi être réalisé sur les fréquences relatives.

Définition 1.10 (Fréquences cumulées)

On appelle fréquence cumulée Fk à la modalité uk la fréquence d’observations de modalité égale ou inférieure à uk.

Dans notre exemple, nous pourrions avoir un tableau de distribution de la forme :

uk a b c d

nk 150 300 200 100

fk 0.2000 0.4000 0.26 0.14

Nk 0 150 450 650 750

Fk 0 0.20 0.60 0.86 1.00

Ce tableau représente à la fois les effectifs, les fréquences, les effectifs cumulés et les fréquences cumulées pour les modalités de la variable « Motivation ». La valeur Nk = 650par exemple est obtenue en sommant les effectifs des modalités situées en dessous (à gauche) de la coupurec|d:650 = 150+300+200. On représente effectifs et fréquences cumulés au niveau des coupures intermodalités, pour indiquer que le cumul est à modalité courante (à gauche) incluse. Cette disposition servira aussi à simplifier le repérage de certaines statistiques qui s’appuient sur ces cumuls. On peut cumuler de la gauche vers la droite ou inversement : on parle alors d’effectifs ou de fréquences cumulés à gauche ou à droite respectivement.

Définition 1.11 (Distribution cumulée d’effectifs)

On appelle distribution cumulée d’effectifs (resp. de fréquences) l’application qui à chaque uk associe l’effectif cumuléNk (resp. la fréquence cumuléeFk).

La distribution cumulée de fréquences est aussi appeléefonction de répartition em-pirique. Le motempirique (qui signifie « observée sur des données ») est introduit ici pour distinguer cette fonction concrète de fonctions de répartition théoriques, que nous définirons dans le chapitre sur les probabilités.

sans modélisation appropriée.

Résumés

Si l’on cherche une modalité typique dans une distribution ordinale, il est possible de choisir le mode. La modalité de fréquence la plus élevée dans l’exemple ci-dessus estb, c’est-à-dire la réponse « plutôt pas motivé ». On dirait donc ici qu’on a affaire à un échantillon de patients globalement peu motivé au changement.

Mais on peut aussi tirer bénéfice de la structure d’ordre pour définir un indice de résumé (on dit aussi unindice de centralité) qui utilise l’information ordinale.

Définition 1.12 (Médiane)

On appelle médiane la modalité de la variable de fréquence cumulée 0.5.

La médiane est la modalité qui partage l’échantillon en deux parties égales. Par extension, on peut définir des valeurs repères, ou quantiles, associées à certaines valeurs cibles de fréquence cumulée.

Définition 1.13 (Quantile)

On appelle quantile d’ordre F la valeur de la variable qF de fréquence cumulée à gauche F.

Par exemple, les quantiles d’ordre 14, 12 et 34 sont classiquement appelésquartiles, car ils définissent des coupures laissant à leur gauche respectivement 25%, 50% et 75% des observations, et découpent ainsi l’échantillon en quarts.

La médiane sera donc notéeq1

2 (c’est-à-dire quantile d’ordre 0.5). Pour l’identifier, on cherche la coupure intermodalités de fréquence cumulée 0.5 :

– si on la trouve, la coupure trouvée est appeléecoupure médiane. Elle permet-trait de partager l’échantillon en deux parties exactement égales : les sujets peu motivés et les sujets motivés ;

– si on ne trouve pas exactement la valeur de cumul 0.5, on identifie les deux coupures dont les cumuls sont les plus proches de cette valeur idéale. La modalité encadrée par ces deux coupures est appeléemodalité médiane. Elle représente une autre valeur typique qui résume la distribution.

Dans la cas présent, on ne trouve pas la valeur Fk = 0.5 et les cumuls les plus proches sont 0.20 et 0.60, correspondant aux coupuresa|b etb|c, qui encadrent la modalitéb. La modalitéb est donc médiane pour cet échantillon.

Sur cet échantillon, le mode est égal à la médiane. Il n’en sera pas toujours ainsi.

Représentation graphique

La représentation graphique associée au tableau de distribution d’effectifs ou de fréquences d’une variable ordinale est le diagramme en bâtons (voir fig. 1.3). Dans cette représentation en deux axes :

– l’axe horizontal n’a pas de sens numérique (ce n’est pas une abscisse), mais a un sens ordinal. On peut ajouter une flèche à droite à cet axe, car les modalités ne sont pas permutables. Les intervalles entre les modalités n’ont cependant pas de sens numérique et les fixer constants n’est qu’une commodité graphique ;

– l’axe vertical permet de repérer les effectifs ou les fréquences par modalités.

Comme effectifs et fréquences sont simplement des changements d’échelles l’un pour l’autre, on peut représenter les deux sous la forme d’un seul graphique à deux axes verticaux, à gauche et à droite.

La représentation graphique associée au tableau de distribution cumulée d’effectifs ou de fréquences est un diagramme en bâtons adoptant les mêmes conventions que le diagramme de distribution. Les bâtons représentent cette fois-ci les effectifs et fréquences cumulés.

Fig. 1.3– Diagrammes de distribution et de répartition (variable ordinale) On peut repérer graphiquement la modalité médiane sur le graphique de fonction de répartition : il suffit de tracer un segment horizontal à hauteur de la fréquence cumulée 0.5 et d’observer quel bâton il vient rencontrer. La médiane est la modalité correspondante.

Dans le document Psychologie statistique avec R (Page 23-26)