Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests non par amétr iques Frédér ic Ber trand 1 & Myr iam Maum y 1 1IRMA, Univ ersité de Str asbourg Fr ance DUS2 20-06-2011
FrédéricBertrand&MyriamMaumyTestsnonparamétriques
Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests non libres de distr ib ution Cer tains tests statistiques ne sont valab les que sous cer taines conditions concer nant la distr ib ution de la ou les var iab le(s). Ex emples Le test de Student impose que les deux var iab les sont issues d’une distr ib ution nor male ,l’analyse de la var iance également.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyTests libres de distr ib ution D’autres tests au contr aire sont valab les indépendamment de toute distr ib ution. Nous les appelons les tests « libres de distr ib ution » (distr ib ution-free tests). Ex emples C’est le cas du test du Khi-deux, du test des signes ,ou du test du coefficient de Spear man.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyTests par amétr iques Cer tains tests ont pour but de montrer une égalité sur cer tains par amètres :ce sont les tests par amétr iques . Ex emples de par amètres
1La mo yenne (test de compar aison de deux mo yennes ou plus),
2la var iance (test de compar aison de deux var iances ou plus),
3etc.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Tests non par amétr iques D’autres tests testent des hypothèses plus génér ales :ce sont les tests non par amétr iques . Ex emples
1Une égalité de lois ,
2l’indépendance entre deux var iab les qualitativ es ,
3etc.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Une question naturelle :quel test choisir ? Habituellement, les tests par amétr iques sont plus puissants . P ar conséquent, ils seront choisis plutôt que les tests non par amétr iques . De même les tests non libres sont génér alement plus efficaces que les tests libres .Cependant, ils sont aussi plus contr aignants ,car il faut vér ifier les conditions d’application qui sont plus nombreuses dans ce cas . On choisir a génér alement un test libre ou non par amétr ique lorsque
1les conditions d’application du test ne sont pas vér ifiées
2ou il est impossib le de vér ifier ces conditions .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des signes per met de tester l’h ypothèse suiv ante : H 0 : m e = 0 ou de façon équiv alente P ( X i > 0 ) = 1 / 2 contre H 1 : m e 6 = 0 ou de façon équiv alente P ( X i > 0 ) 6 = 1 / 2.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Remarques
1La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al. Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) < 1 / 2. Ou H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) > 1 / 2.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Remarques
2Lorsque m 0 est un nombre réel, ce test per met de tester plus génér alement l’h ypothèse nulle H 0 : m e = m 0 contre H 1 : m e 6 = m 0 . La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : m e = m 0 contre H 1 : m e < m 0 . Ou H 0 : m e = m 0 contre H 1 : m e > m 0 .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Pour cela il suffit de considérer l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − m 0 et nous sommes ramenés au test précédent.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Statistique du test La statistique S + n du test des signes de l’échantillon se définit par le nombre de var iab les aléatoires X i ,1 6 i 6 n ,qui prennent une valeur positiv e ou encore S + n = n X i = 1 1 { X
i> 0 } . Remarque La loi de la statistique S + n ne dépend pas de la loi contin ue F X .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 40. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi binomiale ,le plus gr and nombre entier k α tel que P H
0S + n 6 k α 6 α / 2. Alors nous décidons : ( si S + n , obs / ∈ ] k α ; n − k α [ H 1 est vraie , si S + n , obs ∈ ] k α ; n − k α [ H 0 est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test (suite) Second cas : La taille n est supér ieure ou égale à 40. La statistique S + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 S + n + 1 − n √ n ·
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test (suite) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H
0) ( − c < Z n < c ) = 1 − α .Alors nous décidons : si Z n , obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Remarque
1Le niv eau de signification réel du test est alors égal à 2 P S + n 6 k α qui est génér alement différent de α .
2Dans le cas où il y a des ex æquo dans les données ,le protocole ne change pas .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Méthode Pour traiter ce prob lème la méthode recommandée est la suiv ante :les éliminer et se ramener à un jeu de données de taille n 0 ,où n 0 est le nombre d’obser vations non nulles ,puis le traiter comme ci-dessus .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés Il est admis que des prématurés nés av ec un poids de 2,15 kg arr iv ent à un poids de 2,80 kg en un mois s’ils sont nourr is av ec du lait mater nel. 12 nourr issons pesant appro ximativ ement 2,15 kg à la naissance ont été nourr is av ec un lait sensé remplacer le lait mater nel. Les gains de poids en kilog rammes , notés x i ,ont été de 0 , 55 ; 0 , 62 ; 0 , 54 ; 0 , 58 ; 0 , 63 ; 0 , 64 ; 0 , 60 ; 0 , 62 ; 0 , 59 ; 0 , 67 ; 0 , 62 ; 0 , 61 . Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de poids des nourr issons ?
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés :suite Compte ten u du faib le eff ectif de l’échantillon, nous décidons de tester l’h ypothèse nulle : H 0 : m e = m 0 = 2 , 80 kg contre H 1 : m e 6 = m 0 = 2 , 80 kg .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés :suite Nous allons d’abord transf or mer les données obser vées x 1 ,. .. , x 12 en un échantillon y 1 ,. .. , y 12 .P our cela, nous calculons les y i av ec la for m ule suiv ante : y i = 2 , 15 + x i − 2 , 80. Nous av ons donc la suite de données suiv antes : − 0 , 10 ; − 0 , 03 ; − 0 , 11 ; − 0 , 07 ; − 0 , 02 ; − 0 , 01 − 0 , 05 ; − 0 , 03 ; − 0 , 06 ; + 0 , 02 ; − 0 , 03 ; − 0 , 04 . Nous en déduisons que S + 12 , obs = 1. Il ne reste plus qu’à déter miner le plus gr and nombre entier k α tel que P ( H
0) S + 12 6 k α 6 0 , 025 .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés :suite Pour trouv er ce nombre entier ,nous allons utiliser le logiciel MINIT AB et en par ticulier ,dans le men u Calc , les lois de pr obabilité .Ensuite ,nous sélectionnons le sous men u Binomiale et nous remplissons la fenêtre en cochant Pr obabilité cum ulée ,en remplissant Nombre d’essais par 12 et Pr obabilité de succès par 0 , 5. Il ne reste plus qu’à remplir la case de la Colonne d’entrée qui n’est rien d’autre qu’une colonne que nous av ons préalab lement remplie par les entiers de 0 à 12 (les valeurs pr ises par la loi binomiale). Nous trouv ons que ce nombre entier k α est égal à 2.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple
Les prématurés :fin P ar conséquent, comme S + 12 , obs / ∈ ] 2 ; 10 [ ,le test est significatif au seuil de α = 5 % .Nous rejetons donc l’h ypothèse nulle ( H 0 ) et nous décidons que l’h ypothèse alter nativ e ( H 1 ) est vr aie .Il est donc possib le de conclure ,a vec un risque d’erreur de première espèce de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de poids des nourr issons .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des rangs signés de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : F X est symétr ique par rappor tà l’or igine contre H 1 : F X n’est pas symétr ique par rappor tà l’or igine . Ici l’or igine c’est 0.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarques
1Nous pouv ons remplacer la valeur 0 dans les hypothèses ci-dessus par une valeur fixée à l’a vance ,comme 1, 2 ou π .
2Si nous sa vons que F X est symétr ique ,(pour le sa voir ,par ex emple ,tr acer un histog ramme) alors le test des rangs signés de Wilco xon per met de tester : H 0 : µ = 0 contre H 1 : µ 6 = 0. Ce qui per met de s’intéresser à la mo yenne µ de la loi. Nous rappelons ,que dans le cas d’une loi symétr ique ,la mo yenne et la médiane sont conf ondues .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarques
1Nous souhaitons tester l’h ypothèse nulle H 0 : µ = µ 0 contre H 1 : µ 6 = µ 0 . Alors nous introduisons l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − µ 0 .
2La for m ulation de ce test est la for m ulation d’un test bilatér al. Nous pourr ions en visager d’étudier les deux tests unilatér aux correspondants .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Soit ( x 1 ,. .. , x n ) une réalisation de l’échantillon précédent. À chaque x i nous attr ib uons le rang r a i qui correspond au rang de | x i | lorsque que les n réalisations sont classées par ordre croissant de leurs valeurs absolues .Le rang r a i est la réalisation d’une var iab le aléatoire R a i . Remarque La lettre a est là pour rappeler que nous tra vaillons sur les valeurs absolues des x i .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Statistique du test Nous déter minons alors la somme W + n , obs des rangs r a i des seules obser vations str ictement positiv es .La statistique W + n des rangs signés de Wilco xon est la var iab le aléatoire qui prend pour valeur la somme W + n , obs .P ar conséquent, la statistique W + n des rangs signés de Wilco xon de l’échantillon se définit par : W + n = X 1 6 i 6 n X i > 0
R a i .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarque La loi de la statistique W + n ne dépend pas de la loi contin ue F X des var iab les aléatoires X i .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi de Wilco xon, le plus gr and nombre entier w α tel que P ( H
0) W + n 6 w α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] w α ; n ( n + 1 ) / 2 − w α [ ( H 1 ) est vraie , si W + n , obs ∈ ] w α ; n ( n + 1 ) / 2 − w α [ ( H 0 ) est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test (suite) Deuxième cas : La taille n est supér ieure ou égale à 15. La statistique W + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 W + n + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6
·
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H
0) [ − c < Z n < c ] 6 1 − α .Alors nous décidons : si Z n , obs 6∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n peuv ent présenter des ex æquo et a for tior i leurs valeurs absolues . Statistique du test En associant à la var iab le X i son rang mo yen R a ? i dans le classement des valeurs absolues et en sommant tous les rangs pour lesquels X i > 0 nous obtenons la statistique : W + ? n = X 1 6 i 6 n X i > 0
R a ? i .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarque Le symbole ? est là pour rappeler que nous sommes dans le cas où il y a des ex æquo .Les valeurs absolues obser vées | x 1 | ,. .. , | x n | sont ordonnées puis reg roupées en classes d’e x æquo , C 0 pour la première classe qui est constituée des nombres | x i | nuls ,s’il en existe ,et C j ,1 6 j 6 h pour les autres nombres .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .Notons d j le nombre d’e x æquo de la classe C j .Nous av ons d 0 + h X j = 1 d j = n .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour ces valeurs ,les calculs « à la main » sont fastidieux. Mais il est à noter qu’il existe des logiciels qui traitent parf aitement ce cas . Premier cas : Même règle et même conclusion que dans le cas où il n’y a pas d’e x æquo en remplaçant W + n par W + ? n .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues
Remarques
1Lorsque nous utilisons cette méthode des rangs mo yens , nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la statist ique W + n .
2P ar extension nous pourrons utiliser la procédure ci-dessus lorsque la loi F des var iab les aléatoires X i est discrète .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Nous considérons deux var iab les aléatoires X et Y de lois contin ues ,obser vées toutes les deux sur les mêmes unités d’un n -échantillon. Les obser vations se présentent alors sous la for me d’une suite de couples ( x 1 , y 1 ) ,. .. , ( x n , y n ) . Hypothèses testées Le test de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Remarque Ce test suppose que la loi de la différence entre les deux var iab les étudiées X et Y est symétr ique par rappor tà 0.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Statistique du test Pour obtenir la statistique du test notée W + n en génér al, nous de vons procéder à des calculs successifs :
1Après av oir calculé les différences d i ,nous classons par ordre croissant les | d i | non nulles ,c’est-à-dire les d i sans tenir compte des signes .
2Nous attr ib uons à chaque | d i | le rang correspondant.
3Nous restituons ensuite à chaque rang le signe de la différence correspondante .
4Enfin, nous calculons la somme W + n des rangs positifs ( P ) et la somme W − n des rangs négatifs ( M ). La somme W + n des rangs positifs ( P )per met de tester l’h ypothèse nulle ( H 0 ) .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test Premier cas : La taille n est infér ieure str ictement à 15. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), nous cherchons le plus gr and nombre entier k α tel que P ( H
0) W + n 6 k α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] k α ; n ( n + 1 ) / 2 − k α [ ( H 1 ) est vraie , si W + n , obs ∈ ] k α ; n ( n + 1 ) / 2 − k α [ ( H 0 ) est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Règle de décision et conclusion du test (suite et fin) Second cas : La taille n est supér ieure ou égale à 15. Nous utilisons l’appro ximation nor male av ec correction de contin uité : P ( H
0) W + n 6 k = Φ
2 k + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6
où Φ est la fonction de répar tition de la loi nor male centrée réduite et k un nombre entier compr is entre 0 et n .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école Un psychologue de l’enf ance veut tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants .Il estime cette compréhension à par tir des réponses que les enf ants donnent à une sér ie de questions por tant sur des images représentant div erses situations sociales .Chaque enf ant obtient ainsi un score compr is entre 0 et 100. Le psychologue ne peut pas affir mer que les différences obser vées entre scores sont numér iquement exactes (il ne peut pas dire qu’un score de 60 est le doub le d’un score de 30, ni que la différence entre 60 et 40 est exactement le doub le de la différence entre 40 et 30). Cependant, il pense que les scores sont suffisamment précis pour qu’il puisse les ranger selon les valeurs absolues de leurs différences deux à deux.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école :suite Pour tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants ,il utilise 8 paires de jumeaux. L’un des jumeaux est en vo yé à l’école ,alors que l’autre reste à la maison pendant un tr imestre .L ’aff ectation se fait au hasard. À la fin du tr imestre ,il estime la compréhension sociale de chacun des enf ants .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école :suite P aires Scores enf ants Scores enf ants scolar isés non-scolar isés a 82 63 b 69 42 c 73 74 d 43 37 e 58 51 f 56 43 g 76 80 h 65 62
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Cas d’école :suite Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre la compréhension sociale des enf ants restés à la maison et celle des enf ants scolar isés ? Compte ten u du faib le eff ectif de l’échantillon appar ié, nous décidons de tester l’h ypothèse nulle H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Calcul de la statistique du test
1Calculons les différences | d i | : 19 ; 27 ; − 1 ; 6 ; 7 ; 13 ; − 4 ; 3 .
2Attr ib uons le rang correspondant à chaque | d i | et rendons le signe : 7 ; 8 ; − 1 ; 4 ; 5 ; 6 ; − 3 ; 2 .
3Calculons la statistique du test W + n : W + n = 7 + 8 + 4 + 5 + 6 + 2 = 32 .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple
Conclusion du test
4Dans la tab le associée au test de Wilco xon, nous lisons k α = 4.
5Nous calculons l’inter valle correspondant : ] 4 ; 32 [ .
6W + n , obs = 32 6∈ ] 4 ; 32 [ .
7Comme la valeur de la statistique du test calculée sur l’échantillon n’appar tient pas à l’inter valle ,le test est significatif au seuil α = 5 % .Nous décidons de rejeter H 0 et nous décidons que H 1 est vr aie av ec un risque de première espèce α = 5 % .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Le test de Mann-Whitne y a été introduit en 1947 indépendamment du test de Wilco xon de la somme des rangs qui a été élaboré en 1945. Ces deux tests ,d’une for m ulation différente ,sont en fait équiv alents .En fonction de l’outil inf or matique que vous utiliserez, la dénomination du test pourr a être l’une des suiv antes :T est de Mann-Whitne y, Test de Wilco xon de la somme des rangs ou encore Test de Mann-Whitne y-Wilco xon. L’approche de Mann et Whitne y par aît souv ent plus facile à mettre en pr atique .Si nous de vons utiliser une tab le ,il nous faudr a déter miner quelle a été l’approche utilisée par le logiciel statistique et nous ser vir de l’une des tab les appropr iées .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Nous obser vons ,de manière indépendante ,une var iab le aléatoire X de loi contin ue ,sur deux populations ,ou sur une population divisée en deux sous-populations .Nous obtenons ainsi deux sér ies d’obser vations notées ( x 1 ,. .. , x n
1) pour la première et ( y 1 ,. .. , y n
2) pour la seconde .Nous notons L i la loi de la var iab le aléatoire X sur la (sous-)population d’ordre i . Hypothèses testées Le test de Mann-Whitne y per met de tester l’h ypothèse suiv ante : H 0 : L 1 ( X ) = L 2 ( X ) contre H 1 : L 1 ( X ) 6 = L 2 ( X ) .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test Pour obtenir la statistique U n
1, n
2du test de Mann-Whitne y, en génér al, nous de vons procéder à des calculs successifs : Nous classons par ordre croissant l’ensemb le des obser vations des deux échantillons ( x 1 ,. .. , x n
1) et ( y 1 ,. .. , y n
2) de taille respectiv e n 1 et n 2 . Nous aff ectons le rang correspondant. Nous eff ectuons les sommes des rangs ( rank sums )pour chacun des deux échantillons ,notées R n
1et R n
2.
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test (suite et fin) Nous en déduisons les quantités U n
1et U n
2qui se calculent ainsi : U n
1= n 1 n 2 + n 1 ( n 1 + 1 ) 2 − R n
1et U n
2= n 1 n 2 + n 2 ( n 2 + 1 ) 2 − R n
2= n 1 n 2 − U n
1. P ar conséquent, la statistique U n
1, n
2du test de Mann-Whitne y de l’échantillon se définit comme étant la plus petite des deux valeurs U n
1et U n
2.C’est cette statistique qu’il faut considérer car les tab les sont constr uites autour de cette statistique .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Règle de décision et conclusion du test Premier cas : Les tailles n 1 ou n 2 sont infér ieures ou égales à 20. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), les tab les de Mann-Whitne y nous four nissent une valeur cr itique c .Alors nous décidons : si U n
1, n
2, obs 6 c ( H 1 ) est vraie , si U n
1, n
2, obs > c ( H 0 ) est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Règle de décision et conclusion du test (suite) Second cas : Les tailles n 1 et n 2 sont supér ieures str ictement à 20. La statistique U n
1, n
2suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n
1, n
2= 2 U n
1, n
2+ 1 − n 1 n 2 r ( n 1 n 2 )( n 1 + n 2 + 1 ) 3
·
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H
0) ( − c < Z n
1, n
2< c ) = 1 − α .Alors nous décidons : si Z n
1, n
2, obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n
1, n
2, obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Méthode Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n
1, y 1 ,. .. , y n
2peuv ent présenter des ex æquo .Les valeurs absolues obser vées x 1 ,. .. , x n
1, y 1 ,. .. , y n
2sont ordonnées puis reg roupées en h classes d’e x æquo C j ,1 6 j 6 h .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Méthode (suite et fin) Notons d j le nombre d’e x æquo de la classe C j .Nous av ons h X j = 1 d j = n 1 + n 2 . En associant à la var iab le X i son rang mo yen R ? i dans ce classement et en sommant les rangs de tous les X i ,nous obtenons la statistique : U ? n
1, n
2= n
1X i = 1 R ? i .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Remarques
1Pour n 1 6 15 et n 2 6 15, les calculs « à la main » sont fastidieux. Mais vous de vez sa voir qu’il existe des logiciels qui traitent parf aitement ce cas .
2Lorsque nous utilisons cette méthode des rangs mo yens nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la var iab le aléatoire U n
1, n
2.
3P ar extension nous pourrons utiliser cette procédure lorsque les lois L 1 et L 2 des var iab les aléatoires X i sont discrètes .
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Les arbres Dans deux types de forêts distincts ,nous av ons mesuré les hauteurs respectiv ement de 13 et 14 arbres choisis au hasard et indépendamment, dans le but de vér ifier si les deux distr ib utions des hauteurs des deux types de forêts sont ou ne sont pas égales . Forêt 1 Forêt 1 Forêt 2 Forêt 2 23 , 4 24 , 4 22 , 5 22 , 9 24 , 6 24 , 9 23 , 7 24 , 0 25 , 0 26 , 2 24 , 3 24 , 5 26 , 3 26 , 5 25 , 3 26 , 0 26 , 6 26 , 8 26 , 1 26 , 4 27 , 0 27 , 6 26 , 7 26 , 9 27 , 7 27 , 4 28 , 5
FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-WhitneyAbsenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test
1Forêt 1 Forêt 1 Forêt 2 Forêt 2 3 7 1 2 9 10 4 5 11 15 6 8 16 18 12 13 19 21 14 17 23 25 20 22 26 24 27
2Calculons R n
1et R n
2: R n
1= 203 et R n
2= 175. Nous vér ifions que R n
1+ R n
2= ( 27 ∗ 28 ) / 2 = 378.
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple
Statistique du test
3Calculons U n
1= 13 ∗ 14 + ( 13 ∗ 14 ) / 2 − 203 = 70 et U n
2= 13 ∗ 14 − 70 = 112 .
4Calculons la statistique du test : U n
1, n
2= min ( U n
1, U n
2) = 70 .
FrédéricBertrand&MyriamMaumyTestsnonparamétriquesGénéralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney
Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple