• Aucun résultat trouvé

1 ère par tie Tests non par amétr iques pour un ou deux échantillons

N/A
N/A
Protected

Academic year: 2022

Partager "1 ère par tie Tests non par amétr iques pour un ou deux échantillons"

Copied!
16
0
0

Texte intégral

(1)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests non-par amétr iques Myr iam Maum y-Ber trand 1 & Mar ie Chion 1

1

IRMA, Univ ersité de Str asbourg Str asbourg, Fr ance Master 1

re

Année 2019-2020

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

1 ère par tie Tests non par amétr iques pour un ou deux échantillons

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests non libres de distr ib ution Cer tains tests statistiques ne sont valab les que sous cer taines conditions concer nant la distr ib ution de la ou les var iab le(s). Ex emples Le test de Student impose que les deux var iab les sont issues d’une distr ib ution nor male ,l’analyse de la var iance également.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests libres de distr ib ution D’autres tests au contr aire sont valab les indépendamment de toute distr ib ution. Nous les appelons les tests « libres de distr ib ution » (distr ib ution-free tests). Ex emples C’est le cas du test du Khi-deux, du test des signes ,ou du test du coefficient de Spear man.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(2)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests par amétr iques Cer tains tests ont pour but de montrer une égalité sur cer tains par amètres :ce sont les tests par amétr iques . Ex emples de par amètres

1

La mo yenne (test de compar aison de deux mo yennes ou plus),

2

la var iance (test de compar aison de deux var iances ou plus),

3

etc.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests non par amétr iques D’autres tests testent des hypothèses plus génér ales :ce sont les tests non par amétr iques . Ex emples

1

Une égalité de lois ,

2

l’indépendance entre deux var iab les qualitativ es ,

3

etc.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Une question naturelle :quel test choisir ? Habituellement, les tests par amétr iques sont plus puissants . P ar conséquent, ils seront choisis plutôt que les tests non par amétr iques . De même les tests non libres sont génér alement plus efficaces que les tests libres .Cependant, ils sont aussi plus contr aignants ,car il faut vér ifier les conditions d’application qui sont plus nombreuses dans ce cas . On choisir a génér alement un test libre ou non par amétr ique lorsque

1

les conditions d’application du test ne sont pas vér ifiées

2

ou il est impossib le de vér ifier ces conditions .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des signes per met de tester l’h ypothèse suiv ante : H 0 : m e = 0 ou de façon équiv alente P ( X i > 0 ) = 1 / 2 contre H 1 : m e 6 = 0 ou de façon équiv alente P ( X i > 0 ) 6 = 1 / 2.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(3)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Remarques

1

La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al. Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) < 1 / 2. Ou H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) > 1 / 2.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Remarques

2

Lorsque m 0 est un nombre réel, ce test per met de tester plus génér alement l’h ypothèse nulle H 0 : m e = m 0 contre H 1 : m e 6 = m 0 . La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : m e = m 0 contre H 1 : m e < m 0 . ou H 0 : m e = m 0 contre H 1 : m e > m 0 .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Pour cela il suffit de considérer l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − m 0 et nous sommes ramenés au test précédent.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(4)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Statistique du test La statistique S + n du test des signes de l’échantillon se définit par le nombre de var iab les aléatoires X i ,1 6 i 6 n ,qui prennent une valeur positiv e ou encore S + n = n X i = 1 1 { X

i

> 0 } . Remarque La loi de la statistique S + n ne dépend pas de la loi contin ue F X .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 40. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi binomiale ,le plus gr and nombre entier k α tel que P ( H

0

) S + n 6 k α 6 α / 2. Alors nous décidons : ( si S + n , obs / ∈ ] k α ; nk α [ H 1 est vraie , si S + n , obs ∈ ] k α ; nk α [ H 0 est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test (suite) Second cas : La taille n est supér ieure ou égale à 40. La statistique S + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 S + n + 1 − n √ n ·

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test (suite) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H

0

) ( − c < Z n < c ) = 1 − α .Alors nous décidons : si Z n , obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(5)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Remarques

1

Le niv eau de signification réel du test est alors égal à 2 P S + n 6 k α qui est génér alement différent de α .

2

Dans le cas où il y a des ex æquo dans les données ,le protocole ne change pas .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Méthode Pour traiter ce prob lème la méthode recommandée est la suiv ante :les éliminer et se ramener à un jeu de données de taille n 0 ,où n 0 est le nombre d’obser vations non nulles ,puis le traiter comme ci-dessus .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés Il est admis que des prématurés nés av ec une masse de 2,15 kg arr iv ent à une masse de 2,80 kg en un mois s’ils sont nourr is av ec du lait mater nel. 12 nourr issons pesant appro ximativ ement 2,15 kg à la naissance ont été nourr is av ec un lait sensé remplacer le lait mater nel. Les gains de masse en kilog rammes ,notés x i ,ont été de 0 , 55 ; 0 , 62 ; 0 , 54 ; 0 , 58 ; 0 , 63 ; 0 , 64 ; 0 , 60 ; 0 , 62 ; 0 , 59 ; 0 , 67 ; 0 , 62 ; 0 , 61 . Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de masse des nourr issons ?

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés Compte ten u du faib le eff ectif de l’échantillon, nous décidons de tester l’h ypothèse nulle : H 0 : m e = m 0 = 2 , 80 kg contre H 1 : m e 6 = m 0 = 2 , 80 kg .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(6)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés : Première méthode à la main » Nous allons d’abord transf or mer les données obser vées x 1 ,. .. , x 12 en un échantillon y 1 ,. .. , y 12 .P our cela, nous calculons les y i av ec la for m ule suiv ante : y i = 2 , 15 + x i − 2 , 80. Nous av ons donc la suite de données suiv antes : − 0 , 10 ; − 0 , 03 ; − 0 , 11 ; − 0 , 07 ; − 0 , 02 ; − 0 , 01 − 0 , 05 ; − 0 , 03 ; − 0 , 06 ; + 0 , 02 ; − 0 , 03 ; − 0 , 04 . Nous en déduisons que S + 12 , obs = 1. Il ne reste plus qu’à déter miner le plus gr and nombre entier k α tel que P ( H

0

) S + 12 6 k α 6 0 , 025 .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés : Première méthode à la main » Pour trouv er ce nombre entier ,nous allons utiliser le logiciel R . Nous tapons donc la ligne de commande suiv ante : pbinom(0:11,11,0.5) 0.0004882812 0.0058593750 0.0327148438 0.1132812500 0.2744140625 0.5000000000 0.7255859375 0.8867187500 0.9672851562 0.9941406250 0.9995117188 1.0000000000 Nous trouv ons que ce nombre entier k α est égal à 1.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés : Première méthode à la main » P ar conséquent, comme S + 12 , obs / ∈ ] 1 ; 11 [ ,le test est significatif au seuil de α = 5 % .Nous rejetons donc l’h ypothèse nulle ( H 0 ) et nous décidons que l’h ypothèse alter nativ e ( H 1 ) est vr aie .Il est donc possib le de conclure ,a vec un risque d’erreur de première espèce de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de poids des nourr issons .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés : Seconde méthode avec R » Nous tapons les deux lignes de commande suiv ante : >poids<-c(0.55, 0.62, 0.54, 0.58, 0.63, 0.64, 0.60, 0.62, 0.59, 0.67, 0.62, 0.61) >SIGN.test(poids,md=0.65) One-sample Sign-Test data: poids s = 1, p-value = 0.006348 alternative hypothesis: true median is not equal to 0.65 95 percent confidence interval: 0.5810636 0.6289364 sample estimates: median of x 0.615

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(7)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des rangs signés de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : F X est symétr ique par rappor tà l’or igine contre H 1 : F X n’est pas symétr ique par rappor tà l’or igine . Ici l’or igine c’est 0.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarques

1

Nous pouv ons remplacer la valeur 0 dans les hypothèses ci-dessus par une valeur fixée à l’a vance ,comme 1, 2 ou π .

2

Si nous sa vons que F X est symétr ique ,(pour le sa voir ,par ex emple ,tr acer un histog ramme) alors le test des rangs signés de Wilco xon per met de tester : H 0 : µ = 0 contre H 1 : µ 6 = 0. Ce qui per met de s’intéresser à la mo yenne µ de la loi. Nous rappelons ,que dans le cas d’une loi symétr ique ,la mo yenne et la médiane sont conf ondues .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarques

3

Nous souhaitons tester l’h ypothèse nulle H 0 : µ = µ 0 contre H 1 : µ 6 = µ 0 . Alors nous introduisons l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − µ 0 .

4

La for m ulation de ce test est la for m ulation d’un test bilatér al. Nous pourr ions en visager d’étudier les deux tests unilatér aux correspondants .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Soit ( x 1 ,. .. , x n ) une réalisation de l’échantillon précédent. À chaque x i nous attr ib uons le rang r a i qui correspond au rang de | x i | lorsque que les n réalisations sont classées par ordre croissant de leurs valeurs absolues .Le rang r a i est la réalisation d’une var iab le aléatoire R a i . Remarque La lettre a est là pour rappeler que nous tra vaillons sur les valeurs absolues des x i .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(8)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Statistique du test Nous déter minons alors la somme W + n , obs des rangs r a i des seules obser vations str ictement positiv es .La statistique W + n des rangs signés de Wilco xon est la var iab le aléatoire qui prend pour valeur la somme W + n , obs .P ar conséquent, la statistique W + n des rangs signés de Wilco xon de l’échantillon se définit par : W + n = X 1 6 i 6 n X i > 0

R a i .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarque La loi de la statistique W + n ne dépend pas de la loi contin ue F X des var iab les aléatoires X i .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi de Wilco xon, le plus gr and nombre entier w α tel que P ( H

0

) W + n 6 w α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] w α ; n ( n + 1 ) / 2w α [ ( H 1 ) est vraie , si W + n , obs ∈ ] w α ; n ( n + 1 ) / 2w α [ ( H 0 ) est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test (suite) Deuxième cas : La taille n est supér ieure ou égale à 15. La statistique W + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 W + n + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6

·

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(9)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H

0

) [ − c < Z n < c ] 6 1 − α .Alors nous décidons : si Z n , obs 6∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n peuv ent présenter des ex æquo et a for tior i leurs valeurs absolues . Statistique du test En associant à la var iab le X i son rang mo yen R a ? i dans le classement des valeurs absolues et en sommant tous les rangs pour lesquels X i > 0 nous obtenons la statistique : W + ? n = X 1 6 i 6 n X i > 0

R a ? i .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarque Le symbole ? est là pour rappeler que nous sommes dans le cas où il y a des ex æquo .Les valeurs absolues obser vées | x 1 | ,. .. , | x n | sont ordonnées puis reg roupées en classes d’e x æquo , C 0 pour la première classe qui est constituée des nombres | x i | nuls ,s’il en existe ,et C j ,1 6 j 6 h pour les autres nombres .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .Notons d j le nombre d’e x æquo de la classe C j .Nous av ons d 0 + h X j = 1 d j = n .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour ces valeurs ,les calculs « à la main » sont fastidieux. Mais il est à noter qu’il existe des logiciels qui traitent parf aitement ce cas . Deuxième cas : Même règle et même conclusion que dans le cas où il n’y a pas d’e x æquo en remplaçant W + n par W + ? n .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(10)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarques

1

Lorsque nous utilisons cette méthode des rangs mo yens , nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la statist ique W + n .

2

P ar extension nous pourrons utiliser la procédure ci-dessus lorsque la loi F des var iab les aléatoires X i est discrète .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Nous considérons deux var iab les aléatoires X et Y de lois contin ues ,obser vées toutes les deux sur les mêmes unités d’un n -échantillon. Les obser vations se présentent alors sous la for me d’une suite de couples ( x 1 , y 1 ) ,. .. , ( x n , y n ) . Hypothèses testées Le test de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Remarque Ce test suppose que la loi de la différence entre les deux var iab les étudiées X et Y est symétr ique par rappor tà 0.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Statistique du test Pour obtenir la statistique du test notée W + n en génér al, nous de vons procéder à des calculs successifs :

1

Après av oir calculé les différences d i ,nous classons par ordre croissant les | d i | non nulles ,c’est-à-dire les d i sans tenir compte des signes .

2

Nous attr ib uons à chaque | d i | le rang correspondant.

3

Nous restituons ensuite à chaque rang le signe de la différence correspondante .

4

Enfin, nous calculons la somme W + n des rangs positifs ( P ) et la somme W − n des rangs négatifs ( M ). La somme W + n des rangs positifs ( P )per met de tester l’h ypothèse nulle ( H 0 ) .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(11)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure str ictement à 15. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), nous cherchons le plus gr and nombre entier k α tel que P ( H

0

) W + n 6 k α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] k α ; n ( n + 1 ) / 2k α [ ( H 1 ) est vraie , si W + n , obs ∈ ] k α ; n ( n + 1 ) / 2k α [ ( H 0 ) est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test (suite et fin) Second cas : La taille n est supér ieure ou égale à 15. Nous utilisons l’appro ximation nor male av ec correction de contin uité : P ( H

0

) W + n 6 k = Φ    

2 k + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6

   

où Φ est la fonction de répar tition de la loi nor male centrée réduite et k un nombre entier compr is entre 0 et n .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(12)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école Un psychologue de l’enf ance veut tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants .Il estime cette compréhension à par tir des réponses que les enf ants donnent à une sér ie de questions por tant sur des images représentant div erses situations sociales .Chaque enf ant obtient ainsi un score compr is entre 0 et 100. Le psychologue ne peut pas affir mer que les différences obser vées entre scores sont numér iquement exactes (il ne peut pas dire qu’un score de 60 est le doub le d’un score de 30, ni que la différence entre 60 et 40 est exactement le doub le de la différence entre 40 et 30). Cependant, il pense que les scores sont suffisamment précis pour qu’il puisse les ranger selon les valeurs absolues de leurs différences deux à deux.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école :suite Pour tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants ,il utilise 8 paires de jumeaux. L’un des jumeaux est en vo yé à l’école ,alors que l’autre reste à la maison pendant un tr imestre .L ’aff ectation se fait au hasard. À la fin du tr imestre ,il estime la compréhension sociale de chacun des enf ants .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école :suite P aires Scores enf ants Scores enf ants scolar isés non-scolar isés a 82 63 b 69 42 c 73 74 d 43 37 e 58 51 f 56 43 g 76 80 h 65 62

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école :suite Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre la compréhension sociale des enf ants restés à la maison et celle des enf ants scolar isés ? Compte ten u du faib le eff ectif de l’échantillon appar ié, nous décidons de tester l’h ypothèse nulle H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(13)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Calcul de la statistique du test

1

Calculons les différences | d i | : 19 ; 27 ; − 1 ; 6 ; 7 ; 13 ; − 4 ; 3 .

2

Attr ib uons le rang correspondant à chaque | d i | et rendons le signe : 7 ; 8 ; − 1 ; 4 ; 5 ; 6 ; − 3 ; 2 .

3

Calculons la statistique du test W + n : W + n = 7 + 8 + 4 + 5 + 6 + 2 = 32 .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Conclusion du test

4

Dans la tab le associée au test de Wilco xon, nous lisons k α = 4.

5

Nous calculons l’inter valle correspondant : ] 4 ; 32 [ .

6

W + n , obs = 32 6∈ ] 4 ; 32 [ .

7

Comme la valeur de la statistique du test calculée sur l’échantillon n’appar tient pas à l’inter valle ,le test est significatif au seuil α = 5 % .Nous décidons de rejeter H 0 et nous décidons que H 1 est vr aie av ec un risque de première espèce α = 5 % .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Le test de Mann-Whitne y a été introduit en 1947 indépendamment du test de Wilco xon de la somme des rangs qui a été élaboré en 1945. Ces deux tests ,d’une for m ulation différente ,sont en fait équiv alents .En fonction de l’outil inf or matique que vous utiliserez, la dénomination du test pourr a être l’une des suiv antes :T est de Mann-Whitne y, Test de Wilco xon de la somme des rangs ou encore Test de Mann-Whitne y-Wilco xon. L’approche de Mann et Whitne y par aît souv ent plus facile à mettre en pr atique .Si nous de vons utiliser une tab le ,il nous faudr a déter miner quelle a été l’approche utilisée par le logiciel statistique et nous ser vir de l’une des tab les appropr iées .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Nous obser vons ,de manière indépendante ,une var iab le aléatoire X de loi contin ue ,sur deux populations ,ou sur une population divisée en deux sous-populations .Nous obtenons ainsi deux sér ies d’obser vations notées ( x 1 ,. .. , x n

1

) pour la première et ( y 1 ,. .. , y n

2

) pour la seconde .Nous notons L i la loi de la var iab le aléatoire X sur la (sous-)population d’ordre i . Hypothèses testées Le test de Mann-Whitne y per met de tester l’h ypothèse suiv ante : H 0 : L 1 ( X ) = L 2 ( X ) contre H 1 : L 1 ( X ) 6 = L 2 ( X ) .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(14)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test Pour obtenir la statistique U n

1

, n

2

du test de Mann-Whitne y, en génér al, nous de vons procéder à des calculs successifs : Nous classons par ordre croissant l’ensemb le des obser vations des deux échantillons ( x 1 ,. .. , x n

1

) et ( y 1 ,. .. , y n

2

) de taille respectiv e n 1 et n 2 . Nous aff ectons le rang correspondant. Nous eff ectuons les sommes des rangs ( rank sums )pour chacun des deux échantillons ,notées R n

1

et R n

2

.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test (suite et fin) Nous en déduisons les quantités U n

1

et U n

2

qui se calculent ainsi : U n

1

= n 1 n 2 + n 1 ( n 1 + 1 ) 2 − R n

1

et U n

2

= n 1 n 2 + n 2 ( n 2 + 1 ) 2 − R n

2

= n 1 n 2 − U n

1

. P ar conséquent, la statistique U n

1

, n

2

du test de Mann-Whitne y de l’échantillon se définit comme étant la plus petite des deux valeurs U n

1

et U n

2

.C’est cette statistique qu’il faut considérer car les tab les sont constr uites autour de cette statistique .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Règle de décision et conclusion du test Premier cas : Les tailles n 1 ou n 2 sont infér ieures ou égales à 20. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), les tab les de Mann-Whitne y nous four nissent une valeur cr itique c .Alors nous décidons : si U n

1

, n

2

, obs 6 c ( H 1 ) est vraie , si U n

1

, n

2

, obs > c ( H 0 ) est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Règle de décision et conclusion du test (suite) Second cas : Les tailles n 1 et n 2 sont supér ieures str ictement à 20. La statistique U n

1

, n

2

suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n

1

, n

2

= 2 U n

1

, n

2

+ 1 − n 1 n 2 r ( n 1 n 2 )( n 1 + n 2 + 1 ) 3

·

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(15)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H

0

) ( − c < Z n

1

, n

2

< c ) = 1 − α .Alors nous décidons : si Z n

1

, n

2

, obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n

1

, n

2

, obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Méthode Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n

1

, y 1 ,. .. , y n

2

peuv ent présenter des ex æquo .Les valeurs absolues obser vées x 1 ,. .. , x n

1

, y 1 ,. .. , y n

2

sont ordonnées puis reg roupées en h classes d’e x æquo C j ,1 6 j 6 h .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Méthode (suite et fin) Notons d j le nombre d’e x æquo de la classe C j .Nous av ons h X j = 1 d j = n 1 + n 2 . En associant à la var iab le X i son rang mo yen R ? i dans ce classement et en sommant les rangs de tous les X i ,nous obtenons la statistique : U ? n

1

, n

2

= n

1

X i = 1 R ? i .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Remarques

1

Pour n 1 6 15 et n 2 6 15, les calculs « à la main » sont fastidieux. Mais vous de vez sa voir qu’il existe des logiciels qui traitent parf aitement ce cas .

2

Lorsque nous utilisons cette méthode des rangs mo yens nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la var iab le aléatoire U n

1

, n

2

.

3

P ar extension nous pourrons utiliser cette procédure lorsque les lois L 1 et L 2 des var iab les aléatoires X i sont discrètes .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

(16)

uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Les arbres Dans deux types de forêts distincts ,nous av ons mesuré les hauteurs respectiv ement de 13 et 14 arbres choisis au hasard et indépendamment, dans le but de vér ifier si les deux distr ib utions des hauteurs des deux types de forêts sont ou ne sont pas égales . Forêt 1 Forêt 1 Forêt 2 Forêt 2 23 , 4 24 , 4 22 , 5 22 , 9 24 , 6 24 , 9 23 , 7 24 , 0 25 , 0 26 , 2 24 , 3 24 , 5 26 , 3 26 , 5 25 , 3 26 , 0 26 , 6 26 , 8 26 , 1 26 , 4 27 , 0 27 , 6 26 , 7 26 , 9 27 , 7 27 , 4 28 , 5

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test

1

Forêt 1 Forêt 1 Forêt 2 Forêt 2 3 7 1 2 9 10 4 5 11 15 6 8 16 18 12 13 19 21 14 17 23 25 20 22 26 24 27

2

Calculons R n

1

et R n

2

: R n

1

= 203 et R n

2

= 175. Nous vér ifions que R n

1

+ R n

2

= ( 27 ∗ 28 ) / 2 = 378.

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques uds

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test

3

Calculons U n

1

= 13 ∗ 14 + ( 13 ∗ 14 ) / 2 − 203 = 70 et U n

2

= 13 ∗ 14 − 70 = 112 .

4

Calculons la statistique du test : U n

1

, n

2

= min ( U n

1

, U n

2

) = 70 .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Conclusion du test

5

Dans la tab le associée au test de Mann-Whitne y, nous lisons c = 50.

6

U n

1

, n

2

, obs = 70 > 50 = c .

7

Comme la valeur de la statistique du test calculée sur l’échantillon est str ictement supér ieure à la valeur cr itique , le test n’est pas sign ificatif au seuil α = 5 % .Nous décidons de ne pas rejeter H 0 .Le risque d’erreur associé à cette décision est un risq ue d’erreur de seconde espèce β .Nous ne pouv ons pas l’év aluer dans ce cas .

MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques

Références

Documents relatifs

Reprendre l’exemple précédent avec une somme initiale donnée par la grand-mère que vous choisirez vous même entre 51 et 99 e (mais qui ne doit pas être un multiple de 10) et

On peut considérer une population de sangliers sur la commune de Munex, qui était de 1000 têtes en 2000, puis chaque année du fait des phénomène de reproduction, cette

Programmation en nombres entiers = Programmation linéaire avec certaines variables contraintes à prendre des valeurs entières?. Programmation non linéaire en nombres entiers =

Pour cela, nous comparons deux échantillons de personnes du niveau de connaissance requis pour accéder à la formation.. Le premier échantillon (1) est constitué de 220

Première S2 Chapitre 18 : feuilles annexes... Première S2 Chapitre 18 :

Elles sont assez intuitives, mais il faut faire attention aux formes indéterminées, c’est à dire celles où l’on ne peut pas conclure sans modifier l’expression.. De manière

Pour cela on dispose : d’une fiole jaugée d’un litre (avec bouchon), d’une spatule, d’un entonnoir, d’une coupelle plastique, d’une balance électronique et d’une

Excel Solver permet deux types de contraintes particulières pour modéliser les variables entières :. bin : pour représenter les