Une extension du test de la médiane :

Exemple 7 : radiographies

1 Une extension du test de la médiane :

Etant donnés k échantillons indépendants, pas nécessairement de la même taille, le test de la médiane sert à tester si tous les groupes ont été tirés de la même population, ou au moins de populations qui ont la même médiane. On ne peut faire ce test que lorsque la variable qui a été mesurée est réelle ou a des valeurs ordonnées.

Pour appliquer cette méthode, on commence par calculer la médiane globale M de l'ensemble de toutes les observations, obtenue en considérant les k

échantillons comme s'il s'agissait d'un seul. On classe alors chaque valeur observée par rapport à M et on la remplace par un + si elle est supérieure et par un - si elle est inférieure.

Pour chacun des k échantillons, cela donne deux scores:

- Le nombre des + . (Le nombre des valeurs supérieures à M) - Le nombre des - . (Le nombre des valeurs inférieures à M)

On peut alors représenter les observations ainsi dichotomisées par un tableau à k lignes et deux colonnes où figurent les fréquences des plus et des moins dans chacun des k échantillons.

Pour teste l'hypothèse que les k groupes proviennent de la même population, au moins en ce qui concerne les médianes, on calcule la valeur de la statistique suivante

χ2 = ∑i j (Oij - Eij)²/ Eij

où Oij est le nombre des observations qui se trouvent à l'intersection de la ligne i et de la colonne j et Eij l'espérance de cet effectif sous l'hypothèse Ho . C'est la statistique habituelle du chi 2 d'ajustement appliquée à notre cas où r = 2, c'est à dire que j = 1, 2, i varie de 1 à k, et dont la loi est approximativement celle d'un chi 2 à (k - 1) (r - 1) = k - 1 degrés de liberté. La valeur de Eij est égale à la moitié de l'effectif total dans le groupe j, soit Eij = nj / 2, car si la médiane est la

C. Huber

même pour tous les échantillons, on a en moyenne autant de + que de - dans chaque échantillon.

Remarque

Dans le cas où certaines des valeurs observées sont exactement égales à la médiane globale, il n'est pas correct de considérer que Eij = nj / 2, car la probabilité d'être inférieur ou égal à m a pour estimateur 0. 1 / n , la fréquence relative dans l'échantillon global des valeurs inférieures ou égales à M, qui est supérieure à 1/2. Cela revient à appliquer la technique habituelle qui veut que Eij = Oi. O.j / n , le produit du total de ligne par le total de colonne, divisé par le total général n, l'effectif global.

Exemple

Un chercheur dans un centre de santé publique veut étudier l'influence du degré d'instruction de la mère sur le soin avec lequel elle assure la surveillance médicale de son enfant. Dans ce but, il considère le niveau maximum de culture atteint par la mère, mesuré par le diplôme le plus élevé, et par conséquent le nombre d'années d'études que cela suppose, et le nombre de visites de contrôle médical effectuées pour l'enfant au cours de ses deux premières années.

Niveau d'instruction de la mère

Ecole Collège Lycée premier cycle licence maîtrise élémentaire (bac) d'université ou au-delà

4 2 2 9 2 2

3 4 0 4 4 6

0 1 4 2 5

7 6 3 3 2

1 3 8

2 0 0

0 2 5

3 5 2

5 1 1

1 2 7

1 6

Le tableau ci-dessus est obtenu de la manière suivante:

Parmi les 528 naissances enregistrées dans une grande maternité pendant une période donnée, il tire dans la liste alphabétique une sur 12 d'entre elles, ce qui lui donne 44 couples (mère-enfant) pour lesquels il a les deux informations précédentes. On distingue 6 groupes de mères ayant le même niveau d'instruction : l'école élémentaire, le collège, jusqu'en troisième, le lycée, jusqu'à l'obtention du bac, le premier cycle des universités, la licence et enfin la maîtrise ou au-delà.

L'hypothèse nulle Ho est qu'il n'y a pas de différence en ce qui concerne le nombre des visites de contrôle en fonction du degré d'instruction de la mère. On a donc 6 échantillons indépendants. Si on les regroupe, on trouve pour médiane globale du nombre des visites M = 2.5, valeur qui laisse 22 observations à sa gauche et 22 à sa droite. Les scores dans chacun des groupes donnent donc le tableau suivant.

Niveau d'instruction de la mère

C. Huber

Ecole Collège Lycée premier cycle licence maîtrise Total (élémentaire) (bac) (d'université) (ou au-delà) Nbre de mères

dont les visites 5 4 7 3 2 1 22

sont plus fréquen-

tes que la médiane. 5 5,5 6,5 2 2 1

Nbre de mères

dont les visites 5 7 6 1 2 1 22

sont moins fréquen

tes que la médiane 5 5,5 6,5 2 2 1

Total 10 11 13 4 4 2 44

Les effectifs en italiques représentent les effectifs "calculés", les Eij , alors que les effectifs observés, les Oïj sont indiqués en caractères ordinaires.

On constate alors qu'on ne peut pas effectuer un test de chi 2 car un grand nombre de cases ont un effectif inférieur à 5. Cependant, comme les groupes qui contiennent trop peu d'observations

concernent les trois niveaux d'instruction les plus élevés, on peut les regrouper pour en faire un seul : celui des mères qui ont fait des études universitaires, quel qu'en soit le niveau. Après regroupement cela donne le tableau suivant

Niveau d'instruction de la mère

Ecole Collège Lycée Etudes universitaires Total élémentaire (bac)

Nbre de mères

dont les visites 5 4 7 6 22

sont plus fréquen

tes que la médiane. 5 5,5 6,5 5

Nbre de mères

dont les visites 5 7 6 4 22

sont moins fréquen-

tes que la médiane 5 5,5 6,5 5

Total 10 11 13 10 44

Comme tous les effectifs théoriques (en italique), sont maintenant supérieurs à 5, on peut effectuer un test du chi 2 sur ce tableau, ce qui donne:

χ2 = (Oij - Eij)²/Eij = (5 - 5) ²/ 5 + (4 - 5.5) ²/ 5.5 +..+ (4 - 5) ²/ 5

= 1,295 .

Comme il reste 4 classes, le nombre de degrés de liberté est égal à 3.

Or la probabilité pour qu'un chi 2 à trois degrés de liberté dépasse cette valeur est égale, d'après la table, à une valeur comprise entre 0,70 et 0,80. On ne peut donc pas rejeter

C. Huber

l'hypothèse nulle selon laquelle le nombre des visites médicales de contrôle pour les enfants entre 0 et 2 ans est indépendante du niveau d'instruction de la mère.

2 Analyse de la variance non paramétrique : Test de Kruskal-Wallis.

On se souvient que l'analyse de variance classique, qui teste l'égalité des moyennes dans plusieurs populations, suppose que toutes les variables aléatoires concernées sont normales (on dit aussi parfois gaussiennes). Si rien ne permet de faire cette hypothèse de normalité, on peut tester cette hypothèse d'égalité des moyennes grâce au test de Kruskal-Wallis explicité ci-dessous.

On remarquera que le test précédent permettait de tester l'égalité des médianes.

Les données consistent donc en k échantillons indépendants issus de populations différentes, dont on se demande si elles ont la même moyenne. On ne fait pas l'hypothèse de normalité comme en analyse de variance classique, mais on suppose que les lois sont continues (pour éviter les ex-aequo). Bien sûr, il faut que les grandeurs mesurées le soient sur une échelle ordinale.

Notons nj la taille du j^ème échantillon, j = 1, ..., k, et n le nombre total des

observations n = E nj . On ordonne toutes les valeurs dans leur ensemble ( n en tout) et on remplace chaque observation par son rang : 1 pour la plus petite, 2 pour la suivante, etc.., n pour la plus grande. A chacun des k échantillons, on fait ensuite correspondre son score obtenu comme la somme des rangs des observations qui le composent: soit Rj ce score. La statistique de Kruskal-Wallis est ainsi définie

12 Rj2

K-W =

_______ ∑ ( _ )

^{- 3}^{(n + 1)}

n (n + 1) j n_j

On peut démontrer que lorsqu'il y a suffisamment d'observations (plus de 5 cas dans chacun des groupes, pour prendre l'approximation habituelle), cette statistique est approximativement distribuée, si Ho est vraie comme un chi 2 à k - 1 degrés de liberté.

Dans le cas où k =3 et le nombre des sujets dans chacun des trois échantillons est inférieur à 5, on dispose de tables qui donnent les valeurs critiques exactes pour la statistique K-W.

Exemple 1

Un obstétricien se demande si le fait que la mère fume a une influence sur le poids du nouveau-né. Les mères sont divisées en 8 catégories par ordre croissant de quantité de cigarettes fumées par jour, et le poids des nouveau-nés est exprimé en kilos. On obtient le tableau suivant:

1 2 3 4 5 6 7 8

C. Huber

4,5 4,3 4,2 3,6 4,1 3,6 3,5 3,0

3,8 4,6 4,3 3,6 3,9 3,2 3,4 3,8

4,2 3,6 4,2 3,9 4,1 3,2 4,0 4,3

4,5 4,1 3,9 3,0 3,5 3,5 2,5 3,2

3,3 4,2 4,3 3,0 2,2 5,4

3,4 4,3 3,5 3,1 2,2 4,6

3,0 3,9 3,6 2,9

2,6 4,4 3,8 4,3

4,2 3,8

4,2 1,1

K-W = (12 / 56 (56 + 1)) ∑ ( Rj 2 / nj ) - 3 (56+1) Ce qui donne, d'après le tableau des rangs ci-dessous

K-W = (12 / 56 (56 + 1)) ( 216,5 ² /8 + 414² /10 + 277,5 ² /8+ 105, 5 ² /6 + 122 ² /4 + 72 ² /4 + 317 ² /10) - 3x57

= 18,464.

Cette statistique suit une loi qui est à peu près un chi 2 à k- 1 7 degrés de liberté.

Or, d'après la table PHo(χ2 > 18,464) < 0,02. On rejette donc Ho .

Rangs des poids de naissance

1 2 3 4 5 6 7 8

52,5 47,5 41,0 23,0 36,0 23,0 18,5 8,5 27,5 54,5 47,5 23,0 31,5 12,5 15,5 27,5 41,0 23,0 41,1 31,5 36,0 12,5 34,0 47,5 52,5 36,0 31,5 8,5 18,5 18,5 4,0 41,0

14,0 41,0 47,5 8,5 2,5 56,0

15,5 47,5 18,5 11,0 2,5 54,5

8,5 31,5 23,0 6,0

5,0 51,0 27,5 47,5

41,0 27,5

41,0 1,0

De telle sorte que :

Rl = 216,5 R2 = 414,0 R3 = 277,5 R4 = 105,5

R5 =122,0

R6 =71,5

R7 =72,0

R8 = 317,0 Remarque

C. Huber

Cependant, on remarque qu'il y a beaucoup d'ex-aequo, ce qui est contraire à l'hypothèse que l'on fait toujours lorsqu'on veut se servir des rangs l'hypothèse de continuité de la loi sous-jacente, qui interdit les ex-aequo pourvu que la mesure soit très précise. En effet les mesures ici ne sont pas d'une très grande précision et elles provoquent l'apparition de pas mal d'ex-aequo.

On sait que si l'on fait la correction pour tenir compte des ex-aequo, on obtiendra une valeur de K-W plus grande et donc un test plus significatif : on dit que le test sans correction est conservatif. Pour faire la correction, il faut diviser K-W par la statistique suivante :

1 - (∑ T )/ (n³ - n)

où la sommation a lieu sur toutes les séries d'ex-aequo, et T = t³ où t est le nombre des ex-aequo dans la série. Les premiers ex-aequo apparaissent dans la série 8 où il y a deux ex-aequo de rang 2,5 . Donc dans ce cas, t = 2 et T = 8 - 2 = 6. Les ex-aequo suivants ont le rang 8,5 et sont au nombre de 4, ce qui donne pour la valeur de T correspondante: 43 - 4 = 60.

On a ainsi 13 groupes d'ex-aequo : il y a

- 5 groupes de 2 ex-aequo, donnant T = 6 et ET = 30 - 1 groupe de 3, qui donne T = 24,

- 4 groupes de 4, qui donnent T = 60 et ET = 240, - 1 groupe de 5, donant T = 120,

- 1 groupe de 6, donnant T = 2 10, - 1 groupe de 7 donnant T = 336.

Donc 1 - (∑ T )/ (n³ - n) = 0,9945, et K-W corrigé vaut 18,464 / 0,9945 = 18,566. Et la probabilité pm un chi 2 à 7 degrés de liberté de dépasser cette valeur est inférieure à 0,0 1, et on rejette donc l'hypothèse nulle avec encore plus de conviction que précédemment.

C. Huber

B - Tests non paramétriques pour k échantillons liés.

analyse de la variance à deux facteurs.

- Test de Cochran réponses binaires.

- Test de Friedman réponses ordinales.

Si l'on veut utiliser un test de comparaison de deux échantillons pour comparer k échantillons, on aura des difficultés pour deux raisons

- D'une part, il faudra effectuer un très grand nombre de tests; par exemple si k = 5, il faudra faire 10 tests, le nombre des combinaisons de 5 objets pris deux par deux.

- D'autre part, si chacun de ces tests est fait au niveau 5 %, le résultat obtenu ne le sera pas avec ce même niveau. On peut prouver que le niveau passe alors à 40 %.

On va voir maintenant deux tests non pararnétriques destinés à remplacer l'analyse de variance à deux facteurs lorsqu'on n'a pas l'hypothèse de normalité.

1 Le test de Cochran :

Le test de Mac Nemar pour deux échantillons peut être étendu au cas où ron a plus de deux échantillons. Voici deux exemples de circonstances dans lesquelles on peut employer un test de ce type :

1) On a plusieurs (n) groupes de (k) sujets comparables (on dit "appariés") qui répondent à une même question dans des circonstances différentes. Par exemple, de deux médicaments qui entrent en compétition pour assurer le même service (on peut penser à l'aspirine et à l'ergotamine pour supprimer les maux de tête par exemple), on leur demande lequel ils préfèrent, avant une campagne publicitaire pour l'un des deux, après une telle campagne, après un scandale impliquant le mauvais usage de l'un des deux produits, etc... .

S'il y a k circonstances différentes, on a k échantillons, qui sont liés puisque ce sont des sujets appariés qui répondent

2) On relève, sur n sujets, la présence ou l'absence de k symptômes : on a alors k échantillons qui sont liés car il sagit des mêmes sujets.

Dans ces deux cas, on a k échantillons liés de réponses dichotomiques et le test de Cochran peut être employé.

Les données peuvent être rangées dans un tableau à n lignes et k colonnes, et on veut tester que la fréquence des réponses d'une certaine sorte est la même dans chacune des k colonnes, ou plutôt que les différences peuvent être imputées au hasard seul.

En notant:

- Gj le nombre total de "succès" dans la jème colonne,

C. Huber

- Li le nombre total de "succès" dans la ième ligne, - G la moyenne des Gj ,

la statistique de Cochran est ainsi définie

∑ ∑

∑

= =

−

= _n

1 i

2 2 k

j G) G (

i i

1 j

L L

k 1) -k(k

L'indice de colonne j varie de 1 à k et l'indice de ligne i de 1 à n.

Cochran a montré que cette statistique est approximativement distribuée comme un chi 2 à k - 1 degrés de liberté.

Une formule équivalente à la précédente, mais plus fàcüe à calculer est la suivante

Q = { (k-1)[ k ∑ Gj²- (∑ Gj )²] } / { k ∑ Li - ∑ Li2

}

Exemple

Une interview est conduite auprès de 18 personnes, la question posée étant "De ces deux médicaments, lequel utilisez vous de préférence en telle circonstance ? ", la réponse étant codée 1 s'il s'agit du premier et 0 s'il s'agit du second. On obtient le tableau suivant:

Numéro Interview 1 Interview 2 Interview 3 L_i Li 2

1 2 3

1 0 0 0 0 0

2 1 1 0 2 4

3 0 1 0 1 1

4 0 0 0 0 0

5 1 0 0 1 1

6 1 1 0 2 4

7 1 1 0 2 4

8 0 1 0 1 1

9 1 0 0 1 1

10 0 0 0 0 0

il 1 1 1 3 9

12 1 1 1 3 9

13 1 1 0 2 4

14 1 1 0 2 4

15 1 1 0 2 4

16 1 1 1 3 9

17 1 1 0 2 4

18 1 1 0 2 4

C. Huber

G₁ = 13 G₂ = 13 G3=3 ∑ L_i = 29 ∑ Li² = 63

Il en résulte que Q = 16,7. Or d'après la table, la probabilité que Q égale ou dépasse une telle valeur est inférieure à 10-3 puisque sa loi est approximativement un chi 2 à k- 1 = 2 degrés de liberté.

2 Le test de Friedman

Lorsque les données consistent en k échantillons liés de valeurs ordinales, le test de Friedman permet de tester si ces k échantillons peuvent être considérés comme provenant &une même population. Il permet donc de fàire une analyse de variance à deux facteurs fondée sur les rangs. Comme les k échantillons sont liés, les échantillons ont tous la même taille, n et l'appariement entre les échantillons fait que les sujets vont k par k, soit qu'il y ait effectivement.

- n ensembles de k sujets appariés,

- n sujets , chacun sous k conditions différentes ( auto-appariement).

Exemple 1 :

On étudie le délai de disparition &une affection de l'épiderme après remploi de l'une ou l'autre de 4 différentes thérapies, dont dieux consistent en l'application de pommade et deux en l'absorption par voie orale &un certain produit Les observations sont les suivantes sur n = 3 groupes de 4 personnes.

Thérapie

I 11 III IV

Groupe A 7 9 4 1

Groupe B 8 6 5 2

Groupe C 6 9 1 2

A l'intérieur de chaque ligne, on ordonne les valeurs par ordre croissant et on remplace chacune &elles par son rang, obtenant ainsi le tableau suivant

Thérapie

I 11 III IV

Groupe A 3 4 2 1

Groupe B 4 3 2 1

Groupe C 3 4 1 2

R1 = 10 R2 = 11 R3 =5 R4 = 4

Si l'hypothèse nulle est vraie, la répartition des rangs dans chacune des colonne doit être la même. C'est à dire que l'on doit s'attendre à avoir la même fréquence de 1, 2, 3 et 4 dans chacune des colonnes, ce qui a pour conséquence que la somme des rangs dans chacune des colonnes devrait être à peu près la même.

En notant R, la somme des rangs de la colonne i, la statistique de Friedman est la suivante:

C. Huber

Fr² = 12

nk(k +1) R_i²

i=1

∑

k ⁻^3n(k⁺¹⁾

Cette statistique a une loi qui, sous l'hypothèse Ho , est approximativement celle du chi 2 à k -1 degrés de liberté pourvu que n et k soient suffisamment grands. Ici, n n'est pas très grand

puisqu'il ne vaut que 3.

Aussi on utilise la table exacte pour les petites valeurs de n et k, et on trouve Fr² = 7,4 , donc P_Ho( Fr² ≥7,4) = 0,033.

Aussi rejette-t-on l'hypothèse Ho.

Exemple 2 :

On s'intéresse au délai nécessaire à l'élimination des traces dans le sang d'un médicament, pour une même dose, lorsque on utilise trois différents modes d'administration.

Pour cela, on choisit 18 groupes de 3 personnes appariées sur le sexe, l'âge, le poids et la gravité de la maladie traitée par ce médicament, et on note le temps nécessaire à l'élimination de ce produit dans le sang après la prise du produit.

On obtient le tableau d'observations suivant.

Type d'administration

I II III

1 1 3 2

2 2 3 1

3 1 3 2

4 1 2 3

5 3 1 2

6 2 3 1

7 3 2 1

8 1 3 2

9 3 1 2

10 3 1 2

il 2 3 1

12 2 3 1

13 3 2 1

14 2 3 1

15 2,5 2,5 1

16 3 2 1

17 3 2 1

18 2 3 1

R1 = 39,5 R2 = 42,5 R3 = 26,0

C. Huber

Par suite Fr² = 8,4 pour un nombre de degrés de liberté égal à k - 1 = 3 - 1 = 2. La probabilité qu'un chi 2 à 2 ddl égale ou dépasse cette valeur est comprise entre 0,01 et 0,02. Le test est donc significatif avec un degré de signification inférieur à 2 % et on rejette Ho.

C. Huber

Exercices ⁵⁷

EXERCICES ET PROBLEMES

1 - Exercices de Révision sur le Calcul des Probabilités 1 Urne

Trouver, en fonction de r, la probabilité pour que, de r chiffres tirés au hasard de {0, 1, 2, ...,9}, l'un après l'autre, avec remise, il n'y en ait pas deux qui soient égaux (r < 10).

Indication : On pourra commencer par supposer que r = 2, puis r = 3 , puis généraliser.

Dans le document Bases : Probabilités, Estimation et Tests. (Page 47-58)

Exemple 7 : radiographies

1 Une extension du test de la médiane :

___________ ∑ ( _____ )

∑ ∑

∑

∑

_______ ∑ ( _ )