• Aucun résultat trouvé

Tests non par amétr iques Frédér ic Ber trand 1 & Myr iam Maum y 1 1IRMA, Univ ersité de Str asbourg Fr ance DUS2 20-06-2011 FrédéricBertrand&MyriamMaumyTestsnonparamétriques

N/A
N/A
Protected

Academic year: 2022

Partager "Tests non par amétr iques Frédér ic Ber trand 1 & Myr iam Maum y 1 1IRMA, Univ ersité de Str asbourg Fr ance DUS2 20-06-2011 FrédéricBertrand&MyriamMaumyTestsnonparamétriques "

Copied!
16
0
0

Texte intégral

(1)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests non par amétr iques Frédér ic Ber trand 1 & Myr iam Maum y 1

1

IRMA, Univ ersité de Str asbourg Fr ance DUS2 20-06-2011

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests non libres de distr ib ution Cer tains tests statistiques ne sont valab les que sous cer taines conditions concer nant la distr ib ution de la ou les var iab le(s). Ex emples Le test de Student impose que les deux var iab les sont issues d’une distr ib ution nor male ,l’analyse de la var iance également.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests libres de distr ib ution D’autres tests au contr aire sont valab les indépendamment de toute distr ib ution. Nous les appelons les tests « libres de distr ib ution » (distr ib ution-free tests). Ex emples C’est le cas du test du Khi-deux, du test des signes ,ou du test du coefficient de Spear man.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests par amétr iques Cer tains tests ont pour but de montrer une égalité sur cer tains par amètres :ce sont les tests par amétr iques . Ex emples de par amètres

1

La mo yenne (test de compar aison de deux mo yennes ou plus),

2

la var iance (test de compar aison de deux var iances ou plus),

3

etc.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(2)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Tests non par amétr iques D’autres tests testent des hypothèses plus génér ales :ce sont les tests non par amétr iques . Ex emples

1

Une égalité de lois ,

2

l’indépendance entre deux var iab les qualitativ es ,

3

etc.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Une question naturelle :quel test choisir ? Habituellement, les tests par amétr iques sont plus puissants . P ar conséquent, ils seront choisis plutôt que les tests non par amétr iques . De même les tests non libres sont génér alement plus efficaces que les tests libres .Cependant, ils sont aussi plus contr aignants ,car il faut vér ifier les conditions d’application qui sont plus nombreuses dans ce cas . On choisir a génér alement un test libre ou non par amétr ique lorsque

1

les conditions d’application du test ne sont pas vér ifiées

2

ou il est impossib le de vér ifier ces conditions .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des signes per met de tester l’h ypothèse suiv ante : H 0 : m e = 0 ou de façon équiv alente P ( X i > 0 ) = 1 / 2 contre H 1 : m e 6 = 0 ou de façon équiv alente P ( X i > 0 ) 6 = 1 / 2.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Remarques

1

La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al. Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) < 1 / 2. Ou H 0 : P ( X i > 0 ) = 1 / 2 contre H 1 : P ( X i > 0 ) > 1 / 2.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(3)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Remarques

2

Lorsque m 0 est un nombre réel, ce test per met de tester plus génér alement l’h ypothèse nulle H 0 : m e = m 0 contre H 1 : m e 6 = m 0 . La for m ulation de ce test est bien sûr la for m ulation d’un test bilatér al.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Nous pouv ons en visager les deux tests unilatér aux correspondants qui s’écr iv ent : H 0 : m e = m 0 contre H 1 : m e < m 0 . Ou H 0 : m e = m 0 contre H 1 : m e > m 0 .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Pour cela il suffit de considérer l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − m 0 et nous sommes ramenés au test précédent.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Statistique du test La statistique S + n du test des signes de l’échantillon se définit par le nombre de var iab les aléatoires X i ,1 6 i 6 n ,qui prennent une valeur positiv e ou encore S + n = n X i = 1 1 { X

i

> 0 } . Remarque La loi de la statistique S + n ne dépend pas de la loi contin ue F X .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(4)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 40. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi binomiale ,le plus gr and nombre entier k α tel que P H

0

S + n 6 k α 6 α / 2. Alors nous décidons : ( si S + n , obs / ∈ ] k α ; nk α [ H 1 est vraie , si S + n , obs ∈ ] k α ; nk α [ H 0 est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test (suite) Second cas : La taille n est supér ieure ou égale à 40. La statistique S + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 S + n + 1 − n √ n ·

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test (suite) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H

0

) ( − c < Z n < c ) = 1 − α .Alors nous décidons : si Z n , obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Remarque

1

Le niv eau de signification réel du test est alors égal à 2 P S + n 6 k α qui est génér alement différent de α .

2

Dans le cas où il y a des ex æquo dans les données ,le protocole ne change pas .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(5)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Méthode Pour traiter ce prob lème la méthode recommandée est la suiv ante :les éliminer et se ramener à un jeu de données de taille n 0 ,où n 0 est le nombre d’obser vations non nulles ,puis le traiter comme ci-dessus .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés Il est admis que des prématurés nés av ec un poids de 2,15 kg arr iv ent à un poids de 2,80 kg en un mois s’ils sont nourr is av ec du lait mater nel. 12 nourr issons pesant appro ximativ ement 2,15 kg à la naissance ont été nourr is av ec un lait sensé remplacer le lait mater nel. Les gains de poids en kilog rammes , notés x i ,ont été de 0 , 55 ; 0 , 62 ; 0 , 54 ; 0 , 58 ; 0 , 63 ; 0 , 64 ; 0 , 60 ; 0 , 62 ; 0 , 59 ; 0 , 67 ; 0 , 62 ; 0 , 61 . Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de poids des nourr issons ?

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés :suite Compte ten u du faib le eff ectif de l’échantillon, nous décidons de tester l’h ypothèse nulle : H 0 : m e = m 0 = 2 , 80 kg contre H 1 : m e 6 = m 0 = 2 , 80 kg .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés :suite Nous allons d’abord transf or mer les données obser vées x 1 ,. .. , x 12 en un échantillon y 1 ,. .. , y 12 .P our cela, nous calculons les y i av ec la for m ule suiv ante : y i = 2 , 15 + x i − 2 , 80. Nous av ons donc la suite de données suiv antes : − 0 , 10 ; − 0 , 03 ; − 0 , 11 ; − 0 , 07 ; − 0 , 02 ; − 0 , 01 − 0 , 05 ; − 0 , 03 ; − 0 , 06 ; + 0 , 02 ; − 0 , 03 ; − 0 , 04 . Nous en déduisons que S + 12 , obs = 1. Il ne reste plus qu’à déter miner le plus gr and nombre entier k α tel que P ( H

0

) S + 12 6 k α 6 0 , 025 .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(6)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés :suite Pour trouv er ce nombre entier ,nous allons utiliser le logiciel MINIT AB et en par ticulier ,dans le men u Calc , les lois de pr obabilité .Ensuite ,nous sélectionnons le sous men u Binomiale et nous remplissons la fenêtre en cochant Pr obabilité cum ulée ,en remplissant Nombre d’essais par 12 et Pr obabilité de succès par 0 , 5. Il ne reste plus qu’à remplir la case de la Colonne d’entrée qui n’est rien d’autre qu’une colonne que nous av ons préalab lement remplie par les entiers de 0 à 12 (les valeurs pr ises par la loi binomiale). Nous trouv ons que ce nombre entier k α est égal à 2.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’observationsnullesparmilesdonnées Présenced’observationsnullesdanslesdonnées Exemple

Les prématurés :fin P ar conséquent, comme S + 12 , obs / ∈ ] 2 ; 10 [ ,le test est significatif au seuil de α = 5 % .Nous rejetons donc l’h ypothèse nulle ( H 0 ) et nous décidons que l’h ypothèse alter nativ e ( H 1 ) est vr aie .Il est donc possib le de conclure ,a vec un risque d’erreur de première espèce de α = 5 % ,à une différence significativ e entre les eff ets du lait mater nel et ceux du lait de remplacement relativ ement à la pr ise de poids des nourr issons .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Soit un échantillon aléatoire ( X 1 , X 2 ,. .. , X n ) de loi parente une loi contin ue de fonction de répar tition F X dont la médiane est notée m e et la mo yenne µ . Hypothèses testées Le test des rangs signés de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : F X est symétr ique par rappor tà l’or igine contre H 1 : F X n’est pas symétr ique par rappor tà l’or igine . Ici l’or igine c’est 0.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarques

1

Nous pouv ons remplacer la valeur 0 dans les hypothèses ci-dessus par une valeur fixée à l’a vance ,comme 1, 2 ou π .

2

Si nous sa vons que F X est symétr ique ,(pour le sa voir ,par ex emple ,tr acer un histog ramme) alors le test des rangs signés de Wilco xon per met de tester : H 0 : µ = 0 contre H 1 : µ 6 = 0. Ce qui per met de s’intéresser à la mo yenne µ de la loi. Nous rappelons ,que dans le cas d’une loi symétr ique ,la mo yenne et la médiane sont conf ondues .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(7)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarques

1

Nous souhaitons tester l’h ypothèse nulle H 0 : µ = µ 0 contre H 1 : µ 6 = µ 0 . Alors nous introduisons l’échantillon Y 1 ,. .. , Y n av ec Y i = X i − µ 0 .

2

La for m ulation de ce test est la for m ulation d’un test bilatér al. Nous pourr ions en visager d’étudier les deux tests unilatér aux correspondants .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Soit ( x 1 ,. .. , x n ) une réalisation de l’échantillon précédent. À chaque x i nous attr ib uons le rang r a i qui correspond au rang de | x i | lorsque que les n réalisations sont classées par ordre croissant de leurs valeurs absolues .Le rang r a i est la réalisation d’une var iab le aléatoire R a i . Remarque La lettre a est là pour rappeler que nous tra vaillons sur les valeurs absolues des x i .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Statistique du test Nous déter minons alors la somme W + n , obs des rangs r a i des seules obser vations str ictement positiv es .La statistique W + n des rangs signés de Wilco xon est la var iab le aléatoire qui prend pour valeur la somme W + n , obs .P ar conséquent, la statistique W + n des rangs signés de Wilco xon de l’échantillon se définit par : W + n = X 1 6 i 6 n X i > 0

R a i .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarque La loi de la statistique W + n ne dépend pas de la loi contin ue F X des var iab les aléatoires X i .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(8)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour un seuil donné α ,nous cherchons ,dans les tab les de la loi de Wilco xon, le plus gr and nombre entier w α tel que P ( H

0

) W + n 6 w α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] w α ; n ( n + 1 ) / 2w α [ ( H 1 ) est vraie , si W + n , obs ∈ ] w α ; n ( n + 1 ) / 2w α [ ( H 0 ) est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test (suite) Deuxième cas : La taille n est supér ieure ou égale à 15. La statistique W + n suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n = 2 W + n + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6

·

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H

0

) [ − c < Z n < c ] 6 1 − α .Alors nous décidons : si Z n , obs 6∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n , obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n peuv ent présenter des ex æquo et a for tior i leurs valeurs absolues . Statistique du test En associant à la var iab le X i son rang mo yen R a ? i dans le classement des valeurs absolues et en sommant tous les rangs pour lesquels X i > 0 nous obtenons la statistique : W + ? n = X 1 6 i 6 n X i > 0

R a ? i .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(9)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarque Le symbole ? est là pour rappeler que nous sommes dans le cas où il y a des ex æquo .Les valeurs absolues obser vées | x 1 | ,. .. , | x n | sont ordonnées puis reg roupées en classes d’e x æquo , C 0 pour la première classe qui est constituée des nombres | x i | nuls ,s’il en existe ,et C j ,1 6 j 6 h pour les autres nombres .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .Notons d j le nombre d’e x æquo de la classe C j .Nous av ons d 0 + h X j = 1 d j = n .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure à 15. Pour ces valeurs ,les calculs « à la main » sont fastidieux. Mais il est à noter qu’il existe des logiciels qui traitent parf aitement ce cas . Premier cas : Même règle et même conclusion que dans le cas où il n’y a pas d’e x æquo en remplaçant W + n par W + ? n .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquoparmilesvaleursabsolues Présenced’exæquoparmilesvaleursabsolues

Remarques

1

Lorsque nous utilisons cette méthode des rangs mo yens , nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la statist ique W + n .

2

P ar extension nous pourrons utiliser la procédure ci-dessus lorsque la loi F des var iab les aléatoires X i est discrète .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Nous considérons deux var iab les aléatoires X et Y de lois contin ues ,obser vées toutes les deux sur les mêmes unités d’un n -échantillon. Les obser vations se présentent alors sous la for me d’une suite de couples ( x 1 , y 1 ) ,. .. , ( x n , y n ) . Hypothèses testées Le test de Wilco xon per met de tester l’h ypothèse suiv ante : H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(10)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Remarque Ce test suppose que la loi de la différence entre les deux var iab les étudiées X et Y est symétr ique par rappor tà 0.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Statistique du test Pour obtenir la statistique du test notée W + n en génér al, nous de vons procéder à des calculs successifs :

1

Après av oir calculé les différences d i ,nous classons par ordre croissant les | d i | non nulles ,c’est-à-dire les d i sans tenir compte des signes .

2

Nous attr ib uons à chaque | d i | le rang correspondant.

3

Nous restituons ensuite à chaque rang le signe de la différence correspondante .

4

Enfin, nous calculons la somme W + n des rangs positifs ( P ) et la somme W − n des rangs négatifs ( M ). La somme W + n des rangs positifs ( P )per met de tester l’h ypothèse nulle ( H 0 ) .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test Premier cas : La taille n est infér ieure str ictement à 15. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), nous cherchons le plus gr and nombre entier k α tel que P ( H

0

) W + n 6 k α 6 α / 2. Alors nous décidons : ( si W + n , obs / ∈ ] k α ; n ( n + 1 ) / 2k α [ ( H 1 ) est vraie , si W + n , obs ∈ ] k α ; n ( n + 1 ) / 2k α [ ( H 0 ) est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Règle de décision et conclusion du test (suite et fin) Second cas : La taille n est supér ieure ou égale à 15. Nous utilisons l’appro ximation nor male av ec correction de contin uité : P ( H

0

) W + n 6 k = Φ    

2 k + 1 − n ( n + 1 ) 2 r n ( n + 1 )( 2 n + 1 ) 6

   

où Φ est la fonction de répar tition de la loi nor male centrée réduite et k un nombre entier compr is entre 0 et n .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(11)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Méthode Il se traite de la même manière que pour la statistique du test des rangs signés de Wilco xon.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école Un psychologue de l’enf ance veut tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants .Il estime cette compréhension à par tir des réponses que les enf ants donnent à une sér ie de questions por tant sur des images représentant div erses situations sociales .Chaque enf ant obtient ainsi un score compr is entre 0 et 100. Le psychologue ne peut pas affir mer que les différences obser vées entre scores sont numér iquement exactes (il ne peut pas dire qu’un score de 60 est le doub le d’un score de 30, ni que la différence entre 60 et 40 est exactement le doub le de la différence entre 40 et 30). Cependant, il pense que les scores sont suffisamment précis pour qu’il puisse les ranger selon les valeurs absolues de leurs différences deux à deux.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école :suite Pour tester l’eff et de l’assistance à l’école mater nelle sur la compréhension sociale des enf ants ,il utilise 8 paires de jumeaux. L’un des jumeaux est en vo yé à l’école ,alors que l’autre reste à la maison pendant un tr imestre .L ’aff ectation se fait au hasard. À la fin du tr imestre ,il estime la compréhension sociale de chacun des enf ants .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(12)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école :suite P aires Scores enf ants Scores enf ants scolar isés non-scolar isés a 82 63 b 69 42 c 73 74 d 43 37 e 58 51 f 56 43 g 76 80 h 65 62

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Cas d’école :suite Est-il possib le de conclure ,au seuil de α = 5 % ,à une différence significativ e entre la compréhension sociale des enf ants restés à la maison et celle des enf ants scolar isés ? Compte ten u du faib le eff ectif de l’échantillon appar ié, nous décidons de tester l’h ypothèse nulle H 0 : L ( X ) = L ( Y ) contre H 1 : L ( X ) 6 = L ( Y ) .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Calcul de la statistique du test

1

Calculons les différences | d i | : 19 ; 27 ; − 1 ; 6 ; 7 ; 13 ; − 4 ; 3 .

2

Attr ib uons le rang correspondant à chaque | d i | et rendons le signe : 7 ; 8 ; − 1 ; 4 ; 5 ; 6 ; − 3 ; 2 .

3

Calculons la statistique du test W + n : W + n = 7 + 8 + 4 + 5 + 6 + 2 = 32 .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exæquo Présencedesexæquo Présenced’observationsnullesdanslesdonnées Exemple

Conclusion du test

4

Dans la tab le associée au test de Wilco xon, nous lisons k α = 4.

5

Nous calculons l’inter valle correspondant : ] 4 ; 32 [ .

6

W + n , obs = 32 6∈ ] 4 ; 32 [ .

7

Comme la valeur de la statistique du test calculée sur l’échantillon n’appar tient pas à l’inter valle ,le test est significatif au seuil α = 5 % .Nous décidons de rejeter H 0 et nous décidons que H 1 est vr aie av ec un risque de première espèce α = 5 % .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(13)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Le test de Mann-Whitne y a été introduit en 1947 indépendamment du test de Wilco xon de la somme des rangs qui a été élaboré en 1945. Ces deux tests ,d’une for m ulation différente ,sont en fait équiv alents .En fonction de l’outil inf or matique que vous utiliserez, la dénomination du test pourr a être l’une des suiv antes :T est de Mann-Whitne y, Test de Wilco xon de la somme des rangs ou encore Test de Mann-Whitne y-Wilco xon. L’approche de Mann et Whitne y par aît souv ent plus facile à mettre en pr atique .Si nous de vons utiliser une tab le ,il nous faudr a déter miner quelle a été l’approche utilisée par le logiciel statistique et nous ser vir de l’une des tab les appropr iées .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Nous obser vons ,de manière indépendante ,une var iab le aléatoire X de loi contin ue ,sur deux populations ,ou sur une population divisée en deux sous-populations .Nous obtenons ainsi deux sér ies d’obser vations notées ( x 1 ,. .. , x n

1

) pour la première et ( y 1 ,. .. , y n

2

) pour la seconde .Nous notons L i la loi de la var iab le aléatoire X sur la (sous-)population d’ordre i . Hypothèses testées Le test de Mann-Whitne y per met de tester l’h ypothèse suiv ante : H 0 : L 1 ( X ) = L 2 ( X ) contre H 1 : L 1 ( X ) 6 = L 2 ( X ) .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test Pour obtenir la statistique U n

1

, n

2

du test de Mann-Whitne y, en génér al, nous de vons procéder à des calculs successifs : Nous classons par ordre croissant l’ensemb le des obser vations des deux échantillons ( x 1 ,. .. , x n

1

) et ( y 1 ,. .. , y n

2

) de taille respectiv e n 1 et n 2 . Nous aff ectons le rang correspondant. Nous eff ectuons les sommes des rangs ( rank sums )pour chacun des deux échantillons ,notées R n

1

et R n

2

.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test (suite et fin) Nous en déduisons les quantités U n

1

et U n

2

qui se calculent ainsi : U n

1

= n 1 n 2 + n 1 ( n 1 + 1 ) 2 − R n

1

et U n

2

= n 1 n 2 + n 2 ( n 2 + 1 ) 2 − R n

2

= n 1 n 2 − U n

1

. P ar conséquent, la statistique U n

1

, n

2

du test de Mann-Whitne y de l’échantillon se définit comme étant la plus petite des deux valeurs U n

1

et U n

2

.C’est cette statistique qu’il faut considérer car les tab les sont constr uites autour de cette statistique .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(14)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Règle de décision et conclusion du test Premier cas : Les tailles n 1 ou n 2 sont infér ieures ou égales à 20. Pour un seuil donné α ( = 5 % = 0 , 05 en génér al), les tab les de Mann-Whitne y nous four nissent une valeur cr itique c .Alors nous décidons : si U n

1

, n

2

, obs 6 c ( H 1 ) est vraie , si U n

1

, n

2

, obs > c ( H 0 ) est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Règle de décision et conclusion du test (suite) Second cas : Les tailles n 1 et n 2 sont supér ieures str ictement à 20. La statistique U n

1

, n

2

suit appro ximativ ement une loi nor male et nous utilisons alors la statistique suiv ante ,en tenant compte de la correction de contin uité : Z n

1

, n

2

= 2 U n

1

, n

2

+ 1 − n 1 n 2 r ( n 1 n 2 )( n 1 + n 2 + 1 ) 3

·

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Règle de décision et conclusion du test (fin) Pour un seuil donné α ,la tab le de la loi d’une var iab le aléatoire Z nor male centrée réduite nous four nit une valeur cr itique c telle que P ( H

0

) ( − c < Z n

1

, n

2

< c ) = 1 − α .Alors nous décidons : si Z n

1

, n

2

, obs / ∈ ] − c ;+ c [ ( H 1 ) est vraie , si Z n

1

, n

2

, obs ∈ ] − c ;+ c [ ( H 0 ) est vraie .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Méthode Cette méthode est la plus utilisée ,en par ticulier dans la plupar t des logiciels statistiques . Les obser vations x 1 ,. .. , x n

1

, y 1 ,. .. , y n

2

peuv ent présenter des ex æquo .Les valeurs absolues obser vées x 1 ,. .. , x n

1

, y 1 ,. .. , y n

2

sont ordonnées puis reg roupées en h classes d’e x æquo C j ,1 6 j 6 h .Cer taines classes C j peuv ent compor ter un seul élément, si cet élément n’a pas d’e x æquo .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(15)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Méthode (suite et fin) Notons d j le nombre d’e x æquo de la classe C j .Nous av ons h X j = 1 d j = n 1 + n 2 . En associant à la var iab le X i son rang mo yen R ? i dans ce classement et en sommant les rangs de tous les X i ,nous obtenons la statistique : U ? n

1

, n

2

= n

1

X i = 1 R ? i .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Remarques

1

Pour n 1 6 15 et n 2 6 15, les calculs « à la main » sont fastidieux. Mais vous de vez sa voir qu’il existe des logiciels qui traitent parf aitement ce cas .

2

Lorsque nous utilisons cette méthode des rangs mo yens nous ne pouv ons pas utiliser les tab les statistiques usuelles qui concer nent la distr ib ution de la var iab le aléatoire U n

1

, n

2

.

3

P ar extension nous pourrons utiliser cette procédure lorsque les lois L 1 et L 2 des var iab les aléatoires X i sont discrètes .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Les arbres Dans deux types de forêts distincts ,nous av ons mesuré les hauteurs respectiv ement de 13 et 14 arbres choisis au hasard et indépendamment, dans le but de vér ifier si les deux distr ib utions des hauteurs des deux types de forêts sont ou ne sont pas égales . Forêt 1 Forêt 1 Forêt 2 Forêt 2 23 , 4 24 , 4 22 , 5 22 , 9 24 , 6 24 , 9 23 , 7 24 , 0 25 , 0 26 , 2 24 , 3 24 , 5 26 , 3 26 , 5 25 , 3 26 , 0 26 , 6 26 , 8 26 , 1 26 , 4 27 , 0 27 , 6 26 , 7 26 , 9 27 , 7 27 , 4 28 , 5

FrédéricBertrand&MyriamMaumyTestsnonparamétriques Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test

1

Forêt 1 Forêt 1 Forêt 2 Forêt 2 3 7 1 2 9 10 4 5 11 15 6 8 16 18 12 13 19 21 14 17 23 25 20 22 26 24 27

2

Calculons R n

1

et R n

2

: R n

1

= 203 et R n

2

= 175. Nous vér ifions que R n

1

+ R n

2

= ( 27 ∗ 28 ) / 2 = 378.

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

(16)

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Statistique du test

3

Calculons U n

1

= 13 ∗ 14 + ( 13 ∗ 14 ) / 2 − 203 = 70 et U n

2

= 13 ∗ 14 − 70 = 112 .

4

Calculons la statistique du test : U n

1

, n

2

= min ( U n

1

, U n

2

) = 70 .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Généralités Testdessignes TestdesrangssignésdeWilcoxon TestdeWilcoxon TestdeMann-Whitney

Absenced’exaequo Casoùilyadesexæquo:Méthodedesrangsmoyens Exemple

Conclusion du test

5

Dans la tab le associée au test de Mann-Whitne y, nous lisons c = 50.

6

U n

1

, n

2

, obs = 70 > 50 = c .

7

Comme la valeur de la statistique du test calculée sur l’échantillon est str ictement supér ieure à la valeur cr itique , le test n’est pas sign ificatif au seuil α = 5 % .Nous décidons de ne pas rejeter H 0 .Le risque d’erreur associé à cette décision est un risq ue d’erreur de seconde espèce β .Nous ne pouv ons pas l’év aluer dans ce cas .

FrédéricBertrand&MyriamMaumyTestsnonparamétriques

Références

Documents relatifs

Généralités Règlesdeconstructiondumodèle Sommesdescarrésetdegrésdeliberté Sommaire 1 Généralitéssurlesmodèles,expressiondessommesdes

IntroductionPlanification,modèlelinéaireetsymétriesThéorèmesdecaractérisation Sommaire Introduction Planspourpesée Définitiongénéraleduproblème

FrédéricBertrand&amp;MyriamMaumy Introduction Mesuresrépétéessuivantlefacteurdel’ANOVA

Introduction Modèleàeffetsaléatoires Modèleàeffetsmixtes Sommaire 1 Introduction Quatrenouveauxmodèles 2 Modèleàeffetsaléatoires Avecrépétitions Sansrépétition

IntroductionPlanification,modèlelinéaireetsymétriesCaractérisationdifférentielledel’optimalité Sommaire Introduction Planspourpesée Définitiongénéraleduproblème

Frédér ic Ber trand &amp; Myr iam Maum y Compléments sur l’analyse de la var iance à un facteur Violationdesconditionsd’application

FrédéricBertrand&amp;MyriamMaumy Introduction Répétitionssuivantlefacteurdel’ANOVA Répétitionssuivantundesdeuxfacteursdel’ANOVA

FrédéricBertrand&amp;MyriamMaumy Introduction Répétitionssuivantlefacteurdel’ANOVA Répétitionssuivantundesdeuxfacteursdel’ANOVA