Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Test de Kr uskal-W allis
FrédéricBertrand1 &MyriamMaumy1 1IRMA,UniversitédeStrasbourg France DUS2 20-06-2011 FrédéricBertrand&MyriamMaumyTestdeKruskal-WallisGénéralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Sommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples ApplicationSommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testsnonlibresdedistribution Certainstestsstatistiquesnesontvalablesquesouscertaines conditionsconcernantladistributiondelaoulesvariable(s). Exemples LetestdeStudentimposequelesdeuxvariablessontissues d’unedistributionnormale,l’analysedelavarianceégalement. FrédéricBertrand&MyriamMaumyTestdeKruskal-WallisGénéralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testslibresdedistribution D’autrestestsaucontrairesontvalablesindépendammentde toutedistribution.Nouslesappelonslestests«libresde distribution»(distribution-freetests). Exemples C’estlecasdutestduKhi-deux,dutestdessignes,oudutest ducoefficientdeSpearman. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testsparamétriques Certainstestsontpourbutdemontreruneégalitésurcertains paramètres:cesontlestestsparamétriques. Exemplesdeparamètres 1Lamoyenne(testdecomparaisondedeuxmoyennesou plus), 2lavariance(testdecomparaisondedeuxvariancesou plus), 3etc. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Testsnonparamétriques D’autresteststestentdeshypothèsesplusgénérales:cesont lestestsnonparamétriques. Exemples 1Uneégalitédelois, 2l’indépendanceentredeuxvariablesqualitatives, 3etc. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Unequestionnaturelle:queltestchoisir? Habituellement,lestestsparamétriquessontpluspuissants. Parconséquent,ilsserontchoisisplutôtquelestestsnon paramétriques. Demêmelestestsnonlibressontgénéralementplusefficaces quelestestslibres.Cependant,ilssontaussiplus contraignants,carilfautvérifierlesconditionsd’applicationqui sontplusnombreusesdanscecas. Onchoisiragénéralementuntestlibreounonparamétrique lorsque 1lesconditionsd’applicationdutestnesontpasvérifiées 2ouilestimpossibledevérifiercesconditions. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Conditionsd’application
Sommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples ApplicationConditionsd’application Introduction Nousobservons,demanièreindépendante,unevariable aléatoireXdeloicontinue,surk>3populations,ousurune populationdiviséeenk>3sous-populations. Noussupposonsainsiquenousdisposonsdekéchantillons aléatoiresindépendants(X1,1,...,X1,n1),...,(Xk,1,...,Xk,nk) etdek>3sériesd’observations(x1,1,...,x1,n1)pourla première,...,(xk,1,...,xk,nk)pourladernière.Nousnotons Li(X)laloidelavariablealéatoireXsurla(sous-)population d’ordreiavec16i6k. Sansfaired’hypothèsesspécifiques,letestde Kruskal-Wallisnepermetpasdetesterl’égalitédes moyennesnicelledesmédianes. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Conditionsd’application Hypothèsesdutest LetestdeKruskal-Wallisestutilisépourtesterleshypothèses suivantes: H0:L1(X)=···=Li(X)=···=Lk(X) contre H1:LesloisL1(X),...,Lk(X)nesontpastoutesidentiques. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest
Sommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-WallisGénéralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest Statistiquedetest Calculons: 1lerangRi,jdeXi,jparmilesn•valeurs; 2puislasommedesrangsassociéeàchaqueéchantillon: Ri,•=niX j=1Ri,j; 3lamoyennedesrangsdechaqueéchantillon: Ri,•=Ri,•/ni. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest Statistiquedetest(suite) LastatistiquedeKruskal-WallisKWn•prendencomptel’écart entrelamoyennedesrangsdechaqueéchantillonetla moyennedetouslesrangs,quivaut(n•+1)/2: KWn•=12 n•(n•+1)
kX i=1ni Ri,•−n•+1 2
2 =12 n•(n•+1)
kX i=1Ri,•2 ni−3(n•+1). FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest Propriétés Lorsquel’hypothèsenulleH0estvraie,lavariablealéatoire KWn•alestroispropriétéssuivantes. 1Pouri=1,...,k,Wi=niRi,•estlastatistiquedeWilcoxon quicomparelei−èmetraitementauxk−1autres traitements. Sousl’hypothèsenulleH0,nousendéduisonsque E(Wi)=ni(n•+1)/2etVar(Wi)=ni(n•−ni)(n•+1)/12. Ainsiparconséquent,nousavons: KWn•=1 n•
kX i=1(n•−ni)(Wi−E(Wi))2 Var(Wi)· FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest Propriétés(suite) 2(Suite)Nouscalculonsalorsl’espéranceetlavariancede KWn•sousl’hypothèsenulleH0: E(KWn•)=k−1, Var(KWn•)=2(k−1)−2 3k2 −6k+n•(2k2 −6k+1) 5n•(n•+1) −6 5
k X i=11 ni· 3IlestpossiblededéterminerladistributiondeKWn•bien quelecalculsoitcomplexe.Elleestdonctabuléepourles faiblesvaleursdesni. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest Règlededécisionetconclusiondutest Premiercas:L’undeseffectifsni,16i6k,estinférieur ouégalà4,.Pourunseuildonnéα,destablesdelaloide Kuskal-Wallisnousfournissentunevaleurcritiquecα.Alors nousdécidons: siKWn•(obs)>cαH1estvraie, siKWn•(obs)<cαH0estvraie. Leniveaudesignificationréeldutestestgénéralement strictementinférieuràα. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Statistiquedetest Règlededécisionetconclusiondutest Règlededécisionetconclusiondutest(suite) Secondcas:Sini>5,pourtout16i6k,nousutilisons l’approximationKWn•≈χ2 (k−1).Pourunseuildonnéα, destablesdelaloiduχ2 nousfournissentunevaleur critiquecαtellequePH0(−cα<Zn1,n2<cα)=1−α.Alors nousdécidons: siKWn•(obs)>cαH1estvraie, siKWn•(obs)<cαH0estvraie. LorsquenousrejetonsH0,nousdécidonsqueH1estvraie avecunrisqued’erreurdepremièreespèceα. LorsquenousconservonsH0,c’estavecunrisqued’erreur dedeuxièmeespèceβ. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Sommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-WallisGénéralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Présenced’exæquodanslesobservations:laméthodedes rangsmoyens Àchaquenombreappartenantàungrouped’exæquonous attribuonslerangmoyendugroupeauquelilappartientpuis nousdéterminonslasommeT=P
h l3 (t−t)oùtdésignelell=1l nombred’élémentsdul−èmegrouped’exæquo.Ilestd’usage ? desubstitueràKWlavariableKWdéfiniepar:n•n• KWn•? KW=.n•T 1− 3n−n•• FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Sommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-WallisGénéralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application TestdeSteel-Dwass-Critchlow-Fligner Wni,ni0estlastatistiquedeWilcoxonquicomparelei−ème traitementaui0 −èmetraitement. Lesobservationsdesdeuxgroupesieti0 sontordonnéespuis regroupéesenhclassesd’exæquoCj,16j6h. Notonsdjlenombred’exæquodelaclasseCjet mi,i0=ni+ni0. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application TestdeSteel-Dwass-Critchlow-Fligner(suite) Nousdécidonsqu’auseuilglobalαdeuxloisLi(X)etLi0(X), parmilesk(k−1)comparaisonsquenousallonsfaire,sont significativementdifférentessi:
n(m0+1)ii,i W−n,n0ii2
>q0 (k;+∞;1−α)r nini0(mi,i0+1) 24 ×v u u u t 1−P h j3 d−dj=1j 3 m−m00i,ii,i
oùq0 (k;+∞;1−α)estlequantiled’ordre1−αpourlaloidu maximumdumodulestudentisépourkmoyenneset+∞ degrésdeliberté. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application TestdeSteel-Dwass-Critchlow-Fligner(suite) Contrairementauxtroisautresapprochesprésentéesci-après, letestSteel-Dwass-Critchlow-Flignern’estpasqu’une procéduredecomparaisonsmultiples:c’estunealternative complèteautestdeKruskal-Wallis. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Autrestestsdecomparaisonsmultiples Sinousrejetonsl’hypothèsenulleH0,nousnousdemandons quellessontlesloisLi(X)quidiffèrent. Lesformulesci-aprèssontvalablesenabsenceouen présenced’exæquo.Enabsenced’exæquo,leterme 1−T/(n3 •−n•)estégalà1. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application ApplicationdelaméthodedeSheffé Nousdécidonsqu’auseuilαdeuxloisLi(X)etLi0(X)sont significativementdifférentessi: Ri,•−Ri0,•>q χ2 (k−1;1−α)s n•(n•+1) 12
1−T n3 •−n•
×s 1 ni+1 ni0, oùχ2 (k−1;1−α)estlequantiled’ordre1−αpourlaloiduχ2 àk−1degrésdeliberté. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Applicationdel’inégalitédeBonferroni Nousdécidonsqu’auseuilglobalαdeuxloisLi(X)etLi0(X), parmilesk(k−1)comparaisonsquenousallonsfaire,sont significativementdifférentessi: Ri,•−Ri0,•>u 1−α k(k−1)s n•(n•+1) 12
1−T n3 •−n•
×s 1 ni+1 ni0, oùu(1−α/(k(k−1)))estlequantiled’ordre1−α/(k(k−1)) pourlaloinormalecentrée-réduite. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Remarque Ils’agitd’uneapplicationdesinégalitésdeBonferroni.Cette procédureestpluspuissantequelaprécédente. Ilestégalementpossibled’utiliseruneapprocheséquentielle commelaprocéduredeHolm-Bonferroni(testdeDunn)oude Holm-Sidak. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application AnaloguedelaméthodedeTukey-Kramer Nousdécidonsqu’auseuilglobalαdeuxloisLi(X)etLi0(X), parmilesk(k−1)comparaisonsquenousallonsfaire,sont significativementdifférentessi: Ri,•−Ri0,•>q(k;+∞;1−α)s n•(n•+1) 12 1−T n3 •−n•
×s 1 2 1 ni+1 ni0 , oùq(k;+∞;1−α)estlequantiled’ordre1−αpourlaloide l’étenduestudentiséepourkmoyenneset+∞degrésde liberté. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Remarque Ils’agitd’uneprocédureanalogueàcelledeTukey-Kramer danslecasparamétriqueetvalideasymptotiquement.Elleest généralementpluspuissantequelesdeuxapproches précédentes. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application
Sommaire
1Généralités 2Contextedutest Conditionsd’application 3Absenced’exæquodanslesobservations Statistiquedetest Règlededécisionetconclusiondutest 4Présenced’exæquodanslesobservations:laméthode desrangsmoyens 5Comparaisonsmultiples 6Application FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Application Desforestiersontréalisédesplantationsd’arbresentrois endroits. Plusieursannéesplustard,ilssouhaitentsavoirsilahauteur moyennedesarbresestidentiquedanslestroisforêts. Chacunedesforêtsconstitueunepopulationetdanschacune d’entreelles,unéchantillond’arbresesttiréausort.Puisla hauteurdechaquearbreestmesuréeenmètres.Letableau ci-aprèsdonnelesvaleursdesmesuresdehauteurainsique lesmoyennesetlesvariancescorrigéesestiméesdanschacun desgroupes. FrédéricBertrand&MyriamMaumyTestdeKruskal-WallisGénéralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Données Forêt1Forêt2Forêt3 23,418,922,5 Données24,421,122,9 expérimentales24,621,123,7 (enmètres)24,922,124,0 25,022,524,0 26,223,524,5 Moyennes24,75021,53323,600 Variancescorrigées0,8312,4870,568 LaFigure1correspondauxboîtesàmoustachesdelahauteur enfonctiondestroisforêts. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Représentationgraphique 123
20 22 24 26
@ @
@ FIGURE:Boîtesàmoustaches(àgauche)–Comparaisonsmultiples (àdroite) FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Statistiquedutest Noussommesenprésenced’exæquo,nousdevonsdonc utiliserlastatistiquedetestKW? n•àlaplacedelastatistiquede testKWn•. NouscalculonslavaleurdeKW? n•surl’échantillon: KW? n•(obs)=11,51. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations Présenced’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Règlededécisionàl’aided’unevaleurcritique Pourunseuilα=5%lavaleurcritiqued’unKhi-deuxà2 degrésdeliberté,estc0,05=5,99.CommeKW? n•(obs)6c0,05, nousdécidonsderejeterl’hypothèsenulleH0,etque l’hypothèsealternativeH1estvraie.Ilyauneinfluence significative,auseuilα=5%,delaforêtsurlahauteurdes arbres.Lerisqueassociéàcettedécisionestunrisquede premièreespècequivautα=5%. Remarque LavaleurdeKWn•(obs)estégaleà11,48.Nousremarquons ladifférenceapportéeparlacorrectionpourprendreencompte lesexæquo. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis
Généralités Contextedutest Absenced’exæquodanslesobservations d’exæquodanslesobservations:laméthodedesrangsmoyens Comparaisonsmultiples Application Règlededécisionàl’aided’unep-valeur Enutilisantunlogicieldestatistiquenouscalculonslap-valeur dutestdeKruskal-Wallis.Ilfautbienvérifierqu’elletient comptedesexæquo.Ellevautdanscas0,003. Commelap-valeurest60,05,nousdécidons,auseuil α=5%,derejeterl’hypothèsenulleH0,etquel’hypothèse alternativeH1estvraie.Ilyauneinfluencesignificative,au seuilα=5%,delaforêtsurlahauteurdesarbres.Lerisque associéàcettedécisionestunrisquedepremièreespècequi vautα=5%. FrédéricBertrand&MyriamMaumyTestdeKruskal-Wallis