uds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests non-par amétr iques Myr iam Maum y-Ber trand 1 & Mar ie Chion 1 1IRMA, Univ ersité de Str asbourg Str asbourg, Fr ance Master 1
reAnnée 2019-2020
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques
uds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
1 ère par tie Tests non par amétr iques pour un ou deux échantillons
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests non libres de distr ib ution Cer tains tests statistiques ne sont valab les que sous cer taines conditions concer nant la distr ib ution de la ou les var iab le(s). Ex emples Le test de Student impose que les deux var iab les sont issues d’une distr ib ution nor male ,l’analyse de la var iance également.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests libres de distr ib ution D’autres tests au contr aire sont valab les indépendamment de toute distr ib ution. Nous les appelons les tests « libres de distr ib ution » (distr ib ution-free tests). Ex emples C’est le cas du test du Khi-deux, du test des signes ,ou du test du coefficient de Spear man.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests par amétr iques Cer tains tests ont pour but de montrer une égalité sur cer tains par amètres :ce sont les tests par amétr iques . Ex emples de par amètres
1La mo yenne (test de compar aison de deux mo yennes ou plus),
2la var iance (test de compar aison de deux var iances ou plus),
3etc.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests non par amétr iques D’autres tests testent des hypothèses plus génér ales :ce sont les tests non par amétr iques . Ex emples
1Une égalité de lois ,
2l’indépendance entre deux var iab les qualitativ es ,
3etc.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Une question naturelle :quel test choisir ? Habituellement, les tests par amétr iques sont plus puissants . P ar conséquent, ils seront choisis plutôt que les tests non par amétr iques . De même les tests non libres sont génér alement plus efficaces que les tests libres .Cependant, ils sont aussi plus contr aignants ,car il faut vér ifier les conditions d’application qui sont plus nombreuses dans ce cas . On choisir a génér alement un test libre ou non par amétr ique lorsque
1les conditions d’application du test ne sont pas vér ifiées
2ou il est impossib le de vér ifier ces conditions .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des signes per met de tester l’h ypothèse suiv ante : H 0 : m e = 0 ou de façon équiv alente P ( X i > 0 ) = 1 / 2 contre H 1 : m e 6 = 0 ou de façon équiv alente P ( X i > 0 ) 6 = 1 / 2.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Remarques
1La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al. Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) < 1 / 2. Ou H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) > 1 / 2.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Remarques
2Lorsque m 0 est un nombre réel, ce test per met de tester plus génér alement l’h ypothèse nulle H 0 : m e = m 0 contre H 1 : m e 6 = m 0 . La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : m e = m 0 contre H 1 : m e < m 0 . ou H 0 : m e = m 0 contre H 1 : m e > m 0 .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Pour cela il suffit de considérer l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − m 0 et nous sommes ramenés au test précédent.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Statistique du test La statistique S + n du test des signes de l’échantillon se définit par le nombre de var iab les aléatoires X i ,1 6 i 6 n ,qui prennent une valeur positiv e ou encore S + n = n X i = 1 1 { X
i> 0 } . Remarque La loi de la statistique S + n ne dépend pas de la loi contin ue F X .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 40. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi binomiale ,le plus gr and nombre entier k α tel que P ( H
0) S + n 6 k α 6 α / 2. Alors nous décidons : ( si S + n , obs / ∈ ] k α ; n − k α [ H 1 est vraie , si S + n , obs ∈ ] k α ; n − k α [ H 0 est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test (suite) Second cas : La taille n est supér ieure ou égale à 40. La statistique S + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 S + n + 1 − n √ n ·
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test (suite) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H
0) ( − c < Z n < c ) = 1 − α .Alors nous décidons : si Z n , obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Remarques
1Le niv eau de signification réel du test est alors égal à 2 P S + n 6 k α qui est génér alement différent de α .
2Dans le cas où il y a des ex æquo dans les données ,le protocole ne change pas .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Méthode Pour traiter ce prob lème la méthode recommandée est la suiv ante :les éliminer et se ramener à un jeu de données de taille n 0 ,où n 0 est le nombre d’obser vations non nulles ,puis le traiter comme ci-dessus .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés Il est admis que des prématurés nés av ec une masse de 2,15 kg arr iv ent à une masse de 2,80 kg en un mois s’ils sont nourr is av ec du lait mater nel. 12 nourr issons pesant appro ximativ ement 2,15 kg à la naissance ont été nourr is av ec un lait sensé remplacer le lait mater nel. Les gains de masse en kilog rammes ,notés x i ,ont été de 0 , 55 ; 0 , 62 ; 0 , 54 ; 0 , 58 ; 0 , 63 ; 0 , 64 ; 0 , 60 ; 0 , 62 ; 0 , 59 ; 0 , 67 ; 0 , 62 ; 0 , 61 . Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de masse des nourr issons ?
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés Compte ten u du faib le eff ectif de l’échantillon, nous décidons de tester l’h ypothèse nulle : H 0 : m e = m 0 = 2 , 80 kg contre H 1 : m e 6 = m 0 = 2 , 80 kg .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés : Première méthode :« à la main » Nous allons d’abord transf or mer les données obser vées x 1 ,. .. , x 12 en un échantillon y 1 ,. .. , y 12 .P our cela, nous calculons les y i av ec la for m ule suiv ante : y i = 2 , 15 + x i − 2 , 80. Nous av ons donc la suite de données suiv antes : − 0 , 10 ; − 0 , 03 ; − 0 , 11 ; − 0 , 07 ; − 0 , 02 ; − 0 , 01 − 0 , 05 ; − 0 , 03 ; − 0 , 06 ; + 0 , 02 ; − 0 , 03 ; − 0 , 04 . Nous en déduisons que S + 12 , obs = 1. Il ne reste plus qu’à déter miner le plus gr and nombre entier k α tel que P ( H
0) S + 12 6 k α 6 0 , 025 .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés : Première méthode :« à la main » Pour trouv er ce nombre entier ,nous allons utiliser le logiciel R . Nous tapons donc la ligne de commande suiv ante : pbinom(0:11,11,0.5) 0.0004882812 0.0058593750 0.0327148438 0.1132812500 0.2744140625 0.5000000000 0.7255859375 0.8867187500 0.9672851562 0.9941406250 0.9995117188 1.0000000000 Nous trouv ons que ce nombre entier k α est égal à 1.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés : Première méthode :« à la main » P ar conséquent, comme S + 12 , obs / ∈ ] 1 ; 11 [ ,le test est significatif au seuil de α = 5 % .Nous rejetons donc l’h ypothèse nulle ( H 0 ) et nous décidons que l’h ypothèse alter nativ e ( H 1 ) est vr aie .Il est donc possib le de conclure ,a vec un risque d’erreur de première espèce de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de poids des nourr issons .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés : Seconde méthode :« avec R » Nous tapons les deux lignes de commande suiv ante : >poids<-c(0.55, 0.62, 0.54, 0.58, 0.63, 0.64, 0.60, 0.62, 0.59, 0.67, 0.62, 0.61) >SIGN.test(poids,md=0.65) One-sample Sign-Test data: poids s = 1, p-value = 0.006348 alternative hypothesis: true median is not equal to 0.65 95 percent confidence interval: 0.5810636 0.6289364 sample estimates: median of x 0.615
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des rangs signés de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : F X est symétr ique par rappor tà l’or igine contre H 1 : F X n’est pas symétr ique par rappor tà l’or igine . Ici l’or igine c’est 0.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarques
1Nous pouv ons remplacer la valeur 0 dans les hypothèses ci-dessus par une valeur fixée à l’a vance ,comme 1, 2 ou π .
2Si nous sa vons que F X est symétr ique ,(pour le sa voir ,par ex emple ,tr acer un histog ramme) alors le test des rangs signés de Wilco xon per met de tester : H 0 : µ = 0 contre H 1 : µ 6 = 0. Ce qui per met de s’intéresser à la mo yenne µ de la loi. Nous rappelons ,que dans le cas d’une loi symétr ique ,la mo yenne et la médiane sont conf ondues .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarques
3Nous souhaitons tester l’h ypothèse nulle H 0 : µ = µ 0 contre H 1 : µ 6 = µ 0 . Alors nous introduisons l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − µ 0 .
4La for m ulation de ce test est la for m ulation d’un test bilatér al. Nous pourr ions en visager d’étudier les deux tests unilatér aux correspondants .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Soit ( x 1 ,. .. , x n ) une réalisation de l’échantillon précédent. À chaque x i nous attr ib uons le rang r a i qui correspond au rang de | x i | lorsque que les n réalisations sont classées par ordre croissant de leurs valeurs absolues .Le rang r a i est la réalisation d’une var iab le aléatoire R a i . Remarque La lettre a est là pour rappeler que nous tra vaillons sur les valeurs absolues des x i .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Statistique du test Nous déter minons alors la somme W + n , obs des rangs r a i des seules obser vations str ictement positiv es .La statistique W + n des rangs signés de Wilco xon est la var iab le aléatoire qui prend pour valeur la somme W + n , obs .P ar conséquent, la statistique W + n des rangs signés de Wilco xon de l’échantillon se définit par : W + n = X 1 6 i 6 n X i > 0
R a i .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarque La loi de la statistique W + n ne dépend pas de la loi contin ue F X des var iab les aléatoires X i .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi de Wilco xon, le plus gr and nombre entier w α tel que P ( H
0) W + n 6 w α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] w α ; n ( n + 1 ) / 2 − w α [ ( H 1 ) est vraie , si W + n , obs ∈ ] w α ; n ( n + 1 ) / 2 − w α [ ( H 0 ) est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test (suite) Deuxième cas : La taille n est supér ieure ou égale à 15. La statistique W + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 W + n + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6
·
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H
0) [ − c < Z n < c ] 6 1 − α .Alors nous décidons : si Z n , obs 6∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n peuv ent présenter des ex æquo et a for tior i leurs valeurs absolues . Statistique du test En associant à la var iab le X i son rang mo yen R a ? i dans le classement des valeurs absolues et en sommant tous les rangs pour lesquels X i > 0 nous obtenons la statistique : W + ? n = X 1 6 i 6 n X i > 0
R a ? i .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarque Le symbole ? est là pour rappeler que nous sommes dans le cas où il y a des ex æquo .Les valeurs absolues obser vées | x 1 | ,. .. , | x n | sont ordonnées puis reg roupées en classes d’e x æquo , C 0 pour la première classe qui est constituée des nombres | x i | nuls ,s’il en existe ,et C j ,1 6 j 6 h pour les autres nombres .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .Notons d j le nombre d’e x æquo de la classe C j .Nous av ons d 0 + h X j = 1 d j = n .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour ces valeurs ,les calculs « à la main » sont fastidieux. Mais il est à noter qu’il existe des logiciels qui traitent parf aitement ce cas . Deuxième cas : Même règle et même conclusion que dans le cas où il n’y a pas d’e x æquo en remplaçant W + n par W + ? n .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarques
1Lorsque nous utilisons cette méthode des rangs mo yens , nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la statist ique W + n .
2P ar extension nous pourrons utiliser la procédure ci-dessus lorsque la loi F des var iab les aléatoires X i est discrète .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Nous considérons deux var iab les aléatoires X et Y de lois contin ues ,obser vées toutes les deux sur les mêmes unités d’un n -échantillon. Les obser vations se présentent alors sous la for me d’une suite de couples ( x 1 , y 1 ) ,. .. , ( x n , y n ) . Hypothèses testées Le test de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Remarque Ce test suppose que la loi de la différence entre les deux var iab les étudiées X et Y est symétr ique par rappor tà 0.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Statistique du test Pour obtenir la statistique du test notée W + n en génér al, nous de vons procéder à des calculs successifs :
1Après av oir calculé les différences d i ,nous classons par ordre croissant les | d i | non nulles ,c’est-à-dire les d i sans tenir compte des signes .
2Nous attr ib uons à chaque | d i | le rang correspondant.
3Nous restituons ensuite à chaque rang le signe de la différence correspondante .
4Enfin, nous calculons la somme W + n des rangs positifs ( P ) et la somme W − n des rangs négatifs ( M ). La somme W + n des rangs positifs ( P )per met de tester l’h ypothèse nulle ( H 0 ) .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure str ictement à 15. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), nous cherchons le plus gr and nombre entier k α tel que P ( H
0) W + n 6 k α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] k α ; n ( n + 1 ) / 2 − k α [ ( H 1 ) est vraie , si W + n , obs ∈ ] k α ; n ( n + 1 ) / 2 − k α [ ( H 0 ) est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test (suite et fin) Second cas : La taille n est supér ieure ou égale à 15. Nous utilisons l’appro ximation nor male av ec correction de contin uité : P ( H
0) W + n 6 k = Φ
2 k + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6
où Φ est la fonction de répar tition de la loi nor male centrée réduite et k un nombre entier compr is entre 0 et n .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école Un psychologue de l’enf ance veut tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants .Il estime cette compréhension à par tir des réponses que les enf ants donnent à une sér ie de questions por tant sur des images représentant div erses situations sociales .Chaque enf ant obtient ainsi un score compr is entre 0 et 100. Le psychologue ne peut pas affir mer que les différences obser vées entre scores sont numér iquement exactes (il ne peut pas dire qu’un score de 60 est le doub le d’un score de 30, ni que la différence entre 60 et 40 est exactement le doub le de la différence entre 40 et 30). Cependant, il pense que les scores sont suffisamment précis pour qu’il puisse les ranger selon les valeurs absolues de leurs différences deux à deux.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école :suite Pour tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants ,il utilise 8 paires de jumeaux. L’un des jumeaux est en vo yé à l’école ,alors que l’autre reste à la maison pendant un tr imestre .L ’aff ectation se fait au hasard. À la fin du tr imestre ,il estime la compréhension sociale de chacun des enf ants .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école :suite P aires Scores enf ants Scores enf ants scolar isés non-scolar isés a 82 63 b 69 42 c 73 74 d 43 37 e 58 51 f 56 43 g 76 80 h 65 62
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école :suite Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre la compréhension sociale des enf ants restés à la maison et celle des enf ants scolar isés ? Compte ten u du faib le eff ectif de l’échantillon appar ié, nous décidons de tester l’h ypothèse nulle H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Calcul de la statistique du test
1Calculons les différences | d i | : 19 ; 27 ; − 1 ; 6 ; 7 ; 13 ; − 4 ; 3 .
2Attr ib uons le rang correspondant à chaque | d i | et rendons le signe : 7 ; 8 ; − 1 ; 4 ; 5 ; 6 ; − 3 ; 2 .
3Calculons la statistique du test W + n : W + n = 7 + 8 + 4 + 5 + 6 + 2 = 32 .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Conclusion du test
4Dans la tab le associée au test de Wilco xon, nous lisons k α = 4.
5Nous calculons l’inter valle correspondant : ] 4 ; 32 [ .
6W + n , obs = 32 6∈ ] 4 ; 32 [ .
7Comme la valeur de la statistique du test calculée sur l’échantillon n’appar tient pas à l’inter valle ,le test est significatif au seuil α = 5 % .Nous décidons de rejeter H 0 et nous décidons que H 1 est vr aie av ec un risque de première espèce α = 5 % .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Le test de Mann-Whitne y a été introduit en 1947 indépendamment du test de Wilco xon de la somme des rangs qui a été élaboré en 1945. Ces deux tests ,d’une for m ulation différente ,sont en fait équiv alents .En fonction de l’outil inf or matique que vous utiliserez, la dénomination du test pourr a être l’une des suiv antes :T est de Mann-Whitne y, Test de Wilco xon de la somme des rangs ou encore Test de Mann-Whitne y-Wilco xon. L’approche de Mann et Whitne y par aît souv ent plus facile à mettre en pr atique .Si nous de vons utiliser une tab le ,il nous faudr a déter miner quelle a été l’approche utilisée par le logiciel statistique et nous ser vir de l’une des tab les appropr iées .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Nous obser vons ,de manière indépendante ,une var iab le aléatoire X de loi contin ue ,sur deux populations ,ou sur une population divisée en deux sous-populations .Nous obtenons ainsi deux sér ies d’obser vations notées ( x 1 ,. .. , x n
1) pour la première et ( y 1 ,. .. , y n
2) pour la seconde .Nous notons L i la loi de la var iab le aléatoire X sur la (sous-)population d’ordre i . Hypothèses testées Le test de Mann-Whitne y per met de tester l’h ypothèse suiv ante : H 0 : L 1 ( X ) = L 2 ( X ) contre H 1 : L 1 ( X ) 6 = L 2 ( X ) .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test Pour obtenir la statistique U n
1, n
2du test de Mann-Whitne y, en génér al, nous de vons procéder à des calculs successifs : Nous classons par ordre croissant l’ensemb le des obser vations des deux échantillons ( x 1 ,. .. , x n
1) et ( y 1 ,. .. , y n
2) de taille respectiv e n 1 et n 2 . Nous aff ectons le rang correspondant. Nous eff ectuons les sommes des rangs ( rank sums )pour chacun des deux échantillons ,notées R n
1et R n
2.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test (suite et fin) Nous en déduisons les quantités U n
1et U n
2qui se calculent ainsi : U n
1= n 1 n 2 + n 1 ( n 1 + 1 ) 2 − R n
1et U n
2= n 1 n 2 + n 2 ( n 2 + 1 ) 2 − R n
2= n 1 n 2 − U n
1. P ar conséquent, la statistique U n
1, n
2du test de Mann-Whitne y de l’échantillon se définit comme étant la plus petite des deux valeurs U n
1et U n
2.C’est cette statistique qu’il faut considérer car les tab les sont constr uites autour de cette statistique .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Règle de décision et conclusion du test Premier cas : Les tailles n 1 ou n 2 sont infér ieures ou égales à 20. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), les tab les de Mann-Whitne y nous four nissent une valeur cr itique c .Alors nous décidons : si U n
1, n
2, obs 6 c ( H 1 ) est vraie , si U n
1, n
2, obs > c ( H 0 ) est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Règle de décision et conclusion du test (suite) Second cas : Les tailles n 1 et n 2 sont supér ieures str ictement à 20. La statistique U n
1, n
2suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n
1, n
2= 2 U n
1, n
2+ 1 − n 1 n 2 r ( n 1 n 2 )( n 1 + n 2 + 1 ) 3
·
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H
0) ( − c < Z n
1, n
2< c ) = 1 − α .Alors nous décidons : si Z n
1, n
2, obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n
1, n
2, obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Méthode Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n
1, y 1 ,. .. , y n
2peuv ent présenter des ex æquo .Les valeurs absolues obser vées x 1 ,. .. , x n
1, y 1 ,. .. , y n
2sont ordonnées puis reg roupées en h classes d’e x æquo C j ,1 6 j 6 h .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Méthode (suite et fin) Notons d j le nombre d’e x æquo de la classe C j .Nous av ons h X j = 1 d j = n 1 + n 2 . En associant à la var iab le X i son rang mo yen R ? i dans ce classement et en sommant les rangs de tous les X i ,nous obtenons la statistique : U ? n
1, n
2= n
1X i = 1 R ? i .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Remarques
1Pour n 1 6 15 et n 2 6 15, les calculs « à la main » sont fastidieux. Mais vous de vez sa voir qu’il existe des logiciels qui traitent parf aitement ce cas .
2Lorsque nous utilisons cette méthode des rangs mo yens nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la var iab le aléatoire U n
1, n
2.
3P ar extension nous pourrons utiliser cette procédure lorsque les lois L 1 et L 2 des var iab les aléatoires X i sont discrètes .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesuds
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Les arbres Dans deux types de forêts distincts ,nous av ons mesuré les hauteurs respectiv ement de 13 et 14 arbres choisis au hasard et indépendamment, dans le but de vér ifier si les deux distr ib utions des hauteurs des deux types de forêts sont ou ne sont pas égales . Forêt 1 Forêt 1 Forêt 2 Forêt 2 23 , 4 24 , 4 22 , 5 22 , 9 24 , 6 24 , 9 23 , 7 24 , 0 25 , 0 26 , 2 24 , 3 24 , 5 26 , 3 26 , 5 25 , 3 26 , 0 26 , 6 26 , 8 26 , 1 26 , 4 27 , 0 27 , 6 26 , 7 26 , 9 27 , 7 27 , 4 28 , 5
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test
1Forêt 1 Forêt 1 Forêt 2 Forêt 2 3 7 1 2 9 10 4 5 11 15 6 8 16 18 12 13 19 21 14 17 23 25 20 22 26 24 27
2Calculons R n
1et R n
2: R n
1= 203 et R n
2= 175. Nous vér ifions que R n
1+ R n
2= ( 27 ∗ 28 ) / 2 = 378.
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriques udsGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test
3Calculons U n
1= 13 ∗ 14 + ( 13 ∗ 14 ) / 2 − 203 = 70 et U n
2= 13 ∗ 14 − 70 = 112 .
4Calculons la statistique du test : U n
1, n
2= min ( U n
1, U n
2) = 70 .
MyriamMaumy-Bertrand&MarieChionTestsnon-paramétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple